Python金融数据挖掘与分析实战
上QQ阅读APP看书,第一时间看更新

4.1.2 支持向量机

支持向量机算法(SVM)是建立在统计学理论基础上的机器学习方法,为十大数据挖掘算法之一。SVM的核心思想是尽最大努力使得两个类别有最大间隔,这样才能使分隔具有更高的可信度,并且对于未知的新样本也具有很好的分类预测能力,即泛化能力。具体原理在第11章中详细阐述。

支持向量机算法实现的一般步骤如下:导入数据,数据归一化,执行SVM寻找最优的超平面,绘制分类超平面核支持向量,利用多项式特征在高维空间中执行线性SVM,选择合适的核函数,执行非线性SVM。

支持向量机算法的优点:

·使用核函数可以向高维空间进行映射;

·使用核函数可以解决非线性的分类;

·分类思想很简单,就是将样本与决策面的间隔最大化;

·分类效果较好。

支持向量机算法的缺点:

·SVM算法不适用于大规模训练样本;

·用SVM解决多分类问题存在困难;

·对缺失数据敏感,对参数和核函数的选择敏感。