Python金融数据挖掘与分析实战
上QQ阅读APP看书,第一时间看更新

4.3 回归分析

回归分析是指利用数据统计原理,对大量统计数据进行数学处理,并确定因变量与某些自变量的关系,建立一个相关性较好的回归方程(函数表达式),加以外推,用于预测今后因变量的变化的分析方法。最简单的回归模型是一元线性回归(只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示),可以表示为y=β01x+ε,其中y为因变量,x为自变量,β1为影响系数,β0为截距,ε为随机误差。

回归分析是广泛应用的统计分析方法,可用于分析自变量和因变量的影响关系(通过自变量求因变量),也可以分析自变量对因变量的影响方向(正向影响还是负向影响)。

回归分析的主要应用场景是预测和控制,例如计划制定、KPI制定、目标制定等方面;也可以基于预测的数据与实际数据进行比对和分析,确定事件发展程度并给未来行动提供方向性指导。

常用的回归算法包括线性回归、二项式回归、指数回归、对数回归、岭回归、核SVM等。