Google Classroom
GeoGebraGeoGebra Classroom

引言

支持向量机(Support Vector Machine,SVM)是一种用来解决二分类问题的机器学习算法,它通过在样本空间中找到一个划分超平面,将不同类别的样本分开,同时使得两个点集到此平面的最小距离最大,两个点集中的边缘点到此平面的距离最大。如图 2-8-1 所示,图中有方形和圆形两类样本,支持向量机的目标就是找到一条直线,将圆形和方形分开,同时所有圆形和方形到这条直线的距离加起来的值最大。
[size=100][center]图 2-8-1 支持向量机示意[/center][/size]

图 2-8-1 支持向量机示意

上面讨论的情况是一种理想中的状况,两个类别的样本之间存在着清晰的划分超平面,但在实际工作中处理的任务并不一定都是这种清晰线性可分的,对于这种清晰线性可分的任务,我们构造一个线性分类器,称之为硬间隔支持向量机(见图 2-8-2);当训练数据近似线性可分时,也可以构造一个线性的分类器,即软间隔支持向量机(见图 2-8-3);当训练数据线性不可分时,可以通过使用核函数及软间隔最大化构造分类器,称之为非线性支持向量机(见图 2-8-4)。
[size=100][center]图2-8-2 硬间隔 SVM[/center][/size]

图2-8-2 硬间隔 SVM

[size=100][center]图 2-8-3 软间隔 SVM [/center][/size]

图 2-8-3 软间隔 SVM

[size=100][center]图 2-8-4 非线性 SVM[/center][/size]

图 2-8-4 非线性 SVM

【知识准备】向量的内积及几何意义。 对于向量 a 和 b :, 则 a 和 b 的内积公式 要求一维向量 a 和向量 b 的行列数相同。可以证明:,所以,内积的几何意义是可以用来表征或计算两个向量之间的夹角,以及在 b 向量、a 向量方向上的投影(见图 2-8-5)。读者也可查看动态图形。
[size=100][center] 图 2-8-5 向量内积示意[/center][/size]

 图 2-8-5 向量内积示意