上QQ阅读APP看书,第一时间看更新
第2章 数据挖掘入门——银行账户数据分析
通过第1章的介绍,读者应该弄清楚了值得在R语言上投入时间的原因:它是一门强大的语言,具有插件就绪以及数据可视化友好等诸多特性。尝试利用如此强大的语言,是不是会让人觉得很棒呢?
由此我们引出本章的内容:尝试利用R语言来解读读者的数据、挖掘信息。
本章将对读者的个人数据(特别是银行账户数据)进行处理;利用R语言,对读者的财务习惯进行挖掘并建模。通过对本章的学习,读者将学会执行以下几项任务,与此同时,会更加期待后续内容的学习。
● 通过dplyr程序包所提供的函数来汇总读者的银行账户数据(下文简称银行数据)。
● 通过汇总数据,解答有关读者财务习惯的问题。
● 针对银行数据,使用ggplot2程序包来生成基础可视化图表和高级可视化图表。
但在实际动手操作之前,需要先跟读者讨论一下将要处理的数据。