一个不容忽略的问题是,趁着大模型这波狂热浪潮,软件市场催生了大量的向量数据库,软件质量和性能参差不齐,其中更是不乏套壳的向量数据库。那么,如何区分一个向量数据库是否真正具备自己所需的能力,如何迅速了解并对比不同向量数据库的性能和容量成本差距呢?
不久前,Zilliz 发布了全新的 开源向量数据库性能测试工具——Vector DB Bench。该性能测试工具内置了众多数据集以及各种向量数据库的连接器,支持用户使用标准数据集或自己的数据集测试向量数据库性能。
值得关注的是,在开发 Vector DB Bench 的过程中,Zilliz 遵循了四点设计原则:
其一,测试工具必须灵活、可扩展。它应支持多个向量数据库系统,使用户能够轻松地进行性能测试和比较不同选项。此外,该工具应具有模块化架构,以支持添加更多向量数据库、指标和自定义测试场景,用户能够根据具体要求自定义评估。
其二,真实负载模拟。基准测试工具应该将用户自己的工作负载作为真实负载模拟,以确保准确的性能评估。模拟使用者的实际用例和查询模式可以提供有关各种情况下数据库行为的见解。这种模拟有助于衡量向量数据库在实际情况下的表现,确定其适用性。