向量数据库不可小觑
事实上,向量数据库并不是一个新的数据库技术,只是一直以来并没有什么亮眼的技术突破,因此显得有点“籍籍无名”。然而,当向量检索找到典型应用场景,成为普遍需求后,向量数据库的真正价值才日益凸显。
云和恩墨创始人,中国数据库联盟(ACDU) 主席盖国强表示,向量技术和相似度搜索可以回溯到Facebook在2017年开源的Faiss(基于向量的聚类和相似性搜索库),Milvus数据库就是基于Faiss发展而来。目前全球已有的向量数据库产品主要包括 Pinecone、Milvus、Weaviate、Vespa 、Tencent Cloud VectorDB等。
“为什么Facebook早在2017年就能够开源出Faiss?毫无疑问是真实需求推动的关键创新。腾讯推出向量数据库Tencent Cloud VectorDB,也是基于自身场景和业务需求,目的是实现对文本、图片、音视频等海量非结构化数据的高效存储和管理,从而为大模型的训练、学习等提供数据支撑。”盖国强如此说道。
中国人民大学信息学院副教授张延松表示,向量数据库可以看作是一种专用数据库,主要用在AI和机器学习领域。在这些领域,数据通