1. 什么是 Embedding?
Embedding(嵌入)是一种将高维数据映射到低维连续空间的技术,用于表达数据的语义关系。简单来说,它是一种向量化表示,将文本、图像、用户行为等信息转换为数值向量,使得相似的数据在向量空间中距离更近。
2. 如何理解 Embedding?
2.1 浅显易懂的比喻
想象一下,我们要描述城市之间的距离。如果我们仅用文字描述:“北京和上海比较近,而北京和纽约比较远”,这是一种离散表达。
但如果我们用地图上的坐标表示城市,比如:
- 北京 (39.9, 116.4)
- 上海 (31.2, 121.5)
- 纽约 (40.7, -74.0)
那么我们可以直接计算它们之间的欧式距离,精确地