目录
常用的相似性度量
浮点向量相似性度量
二进制向量相似性度量
总结
常用的相似性度量
如果没有相似性度量——计算两个向量之间距离的方法,再好的向量数据库也没有用。因为存在许多度量,我们在这里只讨论最常用的子集。
浮点向量相似性度量
最常见的浮点向量相似性度量,不分先后,有 L1 距离、L2 距离和余弦相似度。前两个值是距离度量,较低的值意味着更多的相似性,而较高的值则意味着较低的相似性;余弦相似度是一种相似性度量,较高的值意味着更多的相似性。
L1 距离通常也被称为曼哈顿距离&#x