Python金融数据挖掘与分析实战
上QQ阅读APP看书,第一时间看更新

前言

为何会写本书

数据挖掘是指从大量的数据中,通过统计、人工智能、机器学习等方法,挖掘人们未知的、有价值的信息和知识的过程。它带来的颠覆性在于将隐藏在大量杂乱数据中的有用信息提炼出来,通过算法自动寻找变量间的关系。

随着时代的发展,数据挖掘逐渐成为大数据技术的核心,如何挖掘并分析数据成为大数据技术发展面临的重要议题。特别是在金融应用领域,数据挖掘技术扮演着举足轻重的角色。即使如此,纵观目前国内技术图书市场,真正结合理论与实践讲解金融领域数据挖掘与分析技术的图书很少,可以系统呈现知识点并将代码落地的专业书更是凤毛麟角。

基于此,本书以应用为导向,从数据挖掘出发,借助Python语言,将数据挖掘理论知识与金融领域的实际应用相结合,循序渐进地介绍了Python金融数据的挖掘与分析。此外,本书每一章均配有视频讲解,详解代码每一步的运行过程及原理,并提供完整代码和数据资源,以帮助读者更好地理解与应用相关知识。

本书特色

一、内容精炼,普适性强

本书从数据分析的工具入手,详解Python的基础规则和语法,由浅入深地讲解深度学习相关算法和理论知识,并与金融数据挖掘实战充分结合,可以帮助读者在理解理论知识的基础上体验数据分析实战,真正做到学以致用。

二、提供大量实战经验和学习实例

“授之以鱼,不如授之以渔。”本书在讲解知识点时,更注重方法与经验的分享,包括“含金量”很高的成功经验分享以及易错事项的总结分析。同时,每章均提供一定的实例,将原理讲解最终落实到代码实现上,帮助读者在学习路上披荆斩棘,快速将理论与实践融会贯通。

三、配备教学视频和完整的源代码

为了方便读者学习,作者针对每章内容的核心知识点录制了讲解视频,且提供PPT、完整代码和数据资源。读者关注公众号“云创大数据”(cStor_cn),在公众号回复本书书名,即可领取相关配套资源,使学习更为高效。每一章的习题答案也可从公众号获取。

四、针对初学者讲解Python基础知识

本书使用Python语言编写代码,通过深入浅出的语言与丰富的样例展示,帮助初学者快速上手Python语言。

内容简介

本书共分为14章,采用双主线的写作方式:一条主线是理论,涵盖基础理论相关概念的介绍以及各种算法原理的讲解;另外一条主线是实战,既包括如何上手Python,又包括相关主题实例分析。

第1~3章为Python数据分析基础,内容涵盖了选取Python语言做数据分析的原因、Jupyter Notebook的使用、Python基础知识和语法入门以及数据预处理流程和技巧,可帮助初学者快速上手Python,为之后的数据分析实战夯实基础。

第4章讲解经典的数据挖掘方法,包括聚类分析、回归分析、分类分析、异常检测、关联分析、时间序列分析等。

本书从第5章开始介绍深度学习相关的理论知识与实践。其中,第5章主要介绍网络舆情的采集和热点分析,并通过爬取微博热门评论对热点话题进行聚类分析,使读者初步了解网络舆情分析,为以后深入研究网络舆情发展和变化打下坚实的基础。第6章详细介绍舆情分析的重中之重:情感分类。从评论文本分析出用户的情感倾向,精确掌握用户对于某一产品的整体使用感受,便于向商户提供产品决策支持信息。

第7章和第8章讲解利用传统的机器学习算法以及深度学习中的循环神经网络对股价趋势进行预测,重点阐述了SVM算法和ARIMA算法,同时证明了市场情感对股票市场的发展趋势有着不容忽视的影响。

第9~11章介绍了个人信用评分和企业信用评分的技术与方法,先后阐述了相关算法及理论基础,并结合具体实例,让读者更加清晰地了解并掌握个人及企业信用评估的整个流程。

人物画像有利于精准定位用户群体并获取用户需求和反馈信息。第12章主要讲解用户画像,包括用户画像的定义、标签体系、用户画像的意义以及用户画像的构建等,还通过两个用户画像的实战案例,帮助读者在实际应用中进一步理解和构建用户画像。

第13章主要讲述搭建目标客户运营体系流程、目标客户的挖掘与分类等,通过可视化展示、聚类算法以及LRFMC分类模型的建立精确区分目标客户,从而实现对客户的精准分群管理,达到稳固企业运营体系的目的。第14章通过对销售数据的进一步分析挖掘,同时借助关联规则——Apriori算法——实现商品智能推荐、关联商品的组合销售以及客户的精准营销,最终达到让企业获取更多利润的目的。

读者对象

本书适合以下几类读者:

·金融行业数据相关岗位技术人员;

·企业运营人员;

·数据分析师;

·数据挖掘工程师;

·高等院校相关专业学生。

致谢

在此,特别感谢我的硕士导师谢希仁教授和博士导师李三立院士。谢希仁教授出版的《计算机网络》已经更新到了第8版,堪称与时俱进且日臻完美的典范,这时时提醒着我们要以这样的标准来写书。李三立院士是留苏博士,为我国计算机事业做出了杰出贡献,曾任国家攀登计划计算项目首席科学家。他治学严谨,带出了一大批杰出的学生。

本书是集体智慧的结晶,在此谨向付出辛勤劳动的各位同行者致敬!书中难免会有不当之处,请读者不吝赐教。我的邮箱为gloud@126.com,微信公众号为“刘鹏看未来”(lpoutlook)。

刘鹏

2021年9月