你以为的直线,在多维空间里是复杂的曲线
AI回答: 这句话是说,在多维空间中,我们的直觉和经验可能会误导我们,认为一条直线应该是简单直接的。然而,在高维空间中,直线可能会有很多突变和弯曲,从而看起来非常复杂,远非我们所想象的那么简单。这也说明了多维空间的复杂性和我们对其有限的理解。
感悟
最近看了不少关于机器学习的资料,突然有了上面这句感悟。如果在纸上去绘制一条直线,那么这是二维空间中的一条直线。用公式表达:y = ax + b
。
三维空间
然而,三维空间中,只要是处于同一平面的且取值范围无限的,投影到二维,也就是一条直线,例如 y = cz + ax + b
,更加抽象的话,f(x,y,z)
转换成 f(x,y)
。三维中的非线性曲线,投影到二维平面也可能是直线。三维中的平面,投影到二维平面也是直线。
四维空间
再推广到四维空间,四维空间的曲线投影到三维空间,是一条共面的曲线。这样的曲线,在四维空间中,它有三个维度是可以发生变化的。四维空间的面投影到三维空间,是一个平面。这样的平面,在四维空间,它有两个维度是可以发生变化的。
N维空间
推广到N维空间。可以投影到二维平面成为直线的几何,在N维空间中,如果是曲线,它有N-1维是可以发生变化的;如果是曲面,它有N-2维是可以发生变化的。
现实世界
平面上一条简单的直线,如果是从高维空间中投射下来的,它可能是及其复杂的。为什么会非常复杂?
下图是从网上找的表示线性可分的图片。为何他可以分类成功,你可以理解为它是多维空间中投射下来的直线。
线性可分和线性不可分,是否本质上相同?在前面的联想中,N维空间中的曲线和曲面,不一定是线性的。它投影到二维平面上可能是一条曲线。那么这就是线性不可分了,如下图,图片来自网络。
自然语言处理中的Word2Vec
AI回答: Word to Vector,简称为Word2Vec,是一种将单词转化为向量的方法。它是一种自然语言处理技术,可以将文本数据中的单词转化为数学向量,从而将文本数据转化为计算机能够识别和处理的数字形式。Word2Vec算法是一种基于浅层神经网络的无监督学习方法,将每个单词映射到向量空间,并且将具有相似语义的单词映射到相似的位置。Word2Vec常用于文本分类、情感分析以及文本推荐等方面。
对于一个词向量,假设词向量为 M 维向量。转换过程本质上已经是维度变换了。假设要绝对准确表达一个词需要 L 维,L 被转换到 M。而NLP的各种算法,包括这些大语言模型,本质上都是找出高维空间中的一个表达式,这个表达式可以是分段或者嵌套的。
推测
一个现象背后的本质,简单如直线,复杂如NLP,亦或是其它,从更高的维度是否可以做一个统一的解释。三维空间中距离很远的两个点,在四维空间可能重叠。人类认为不可以解决问题,如果维度提升了,是否就会存在一个极其简单的解决方案。
作为人类,我们认知的维度是有限的,当我们向更高维去搜索的时候,即使效率很高,但由于搜索空间的无限性,我们无法穷举。下图为蒙特卡罗搜索的示例,也许科技进步,搜索的范围会扩大。然后我们会不会找到更复杂的问题呢?
更复杂的问题
哥德尔不完备定理 是数理逻辑中的一个重要定理,它由奥地利数学家哥德尔于1931年提出。该定理表明,任何足够强的公理系统,都存在一些无法被该系统内的公理和证明所证明的命题。这表明了数学的局限性,即数学不能用数学自身来证明所有的数学命题。
简单来说,哥德尔不完备定理证明了一个重要的结论:在任何形式化的数学系统中,都必然存在一些命题,它们既不能由该系统内部的公理和规则来证明,也不能被证明为假。这意味着,数学体系必然存在某些真命题是无法被证明的,也不存在一种单一的数学体系,能够证明所有真命题。
哥德尔不完备定理对人类理解数学的一系列观念和方法产生了巨大影响,也对计算机科学发展和人工智能等领域产生了深远的影响。
将哥德尔不完备定理做一些推断,有更复杂的问题。而且,可能是类似俄罗斯套娃,或者程序中的递归。即,能被解决的问题复杂了,会出现更复杂的问题。