自己动手做大数据系统(第2版)
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第3章 使用Python爬虫获取数据

大数据处理的第一步当然是数据获取。放在数据库中的数据是结构化数据,而大数据的优势是处理非结构化数据。使用网络爬虫获取的是非结构化数据。本章介绍几种常用的爬虫模块。