本篇的思维导图:
支持向量机分类的算法原理
支持向量机分类算法的基本思路
1.最大间隔
支持向量机说到底就是一种“线性分类器”,它以“间隔”作为损失的度量,目标通过不断调整多维的“直线”——超平面,使得间隔最大化。所谓“支持向量”,就是所有数据点中直接参与计算使得间隔最大化的几个数据点,这是支持向量机的得名由来,也是支持向量机的全部核心算法。
单就核心来看,实际上就是一种换了损失函数的线性方法。这种简化方法选择突出支持向量机的基本运行逻辑,而且最大间隔说到底也就是一个计算问题,并不涉及太拗口的数学名词和太抽象的概念,在便于理解方面确实有优势。而且光靠间隔最大化,支持向量机也确实能运转起来。但这种简化方法存在一个重大问题:如果支持向量机只有间隔,那真的就成了又一种线性分类器,初学者可能很难察觉其中存在的问题,反而容易以偏概全,产生误导。
2.高维映