向量嵌入概述
向量嵌入是机器学习中最有趣和最有用的概念之一。它们是许多 NLP、推荐和搜索算法的核心。如果您曾经使用过推荐引擎、语音助手、语言翻译器等工具,您就会遇到过依赖嵌入的系统。
与大多数软件算法一样,机器学习算法也需要使用数字。有时,我们的数据集包含数值列或可以转换为数值的值(序数、分类等)。其他时候我们会遇到更抽象的东西,比如整个文本文档。我们为这样的数据创建向量嵌入,它们只是数字列表,以便用它们执行各种操作。整段文本或任何其他对象都可以简化为向量。即使是数值数据也可以转换为向量以便于操作。
但向量有一些特殊之处ÿ