Clementine数据挖掘方法及应用
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.2 什么是数据挖掘

海量数据的分析需求,理论研究的拓展和相互渗透,利用数据库、数据仓库技术存储管理数据,利用机器学习和统计方法分析数据,这种多学科交叉融合发展和实践的思想,形成了备受各领域人们关注的新兴领域——数据挖掘。

1995年,加拿大蒙特利尔召开了第一届“知识发现(Knowledge Discovery in Database,KDD)和数据挖掘(Data Mining,DM)”国际学术会议。数据挖掘一词很快流传开来。人们将存储在数据库中的数据比喻为“矿石”,数据挖掘则是一个从数据“矿石”中开采知识“黄金”的过程。

于是,国内外众多学者和机构纷纷投入数据挖掘的理论和应用研究大潮中,涌现出了大批学术论文、著作以及商业应用成功案例。这些成果涉及的领域极为广泛且各有不同的侧重。有的从计算机数据库和数据仓库角度阐述数据挖掘过程中的数据管理理论和技术,有的从人工智能和机器学习角度重点探讨各种算法改进策略,有的则从应用角度探讨如何实施数据挖掘以解决诸如客户关系管理、购物篮分析、信用评分、产品制造、Web点击流分析等众多现实问题,形成了前所未有的蓬勃局面。