Python网络爬虫入门到实战
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

CHAPTER 1
第1章 HTML与CSS基础

1.1 概述引导

本章介绍HTML和CSS,但不对有关JS的内容进行讲解,因为本书中并不学习关于JS相关的爬虫技术。对于有网页基础的读者可以跳过本章,本书主要讲解网页爬虫,因此考虑到大多数初学者并没有掌握基本的网页知识,因此本章专为没有网页基础的读者打下厚实的基础。

什么是HTML呢?以某搜索为例。某搜索的链接为https://cn.bing.com/,使用鼠标右键单击所在网页,在弹出的快捷键中选择“检查”命令,如图1-1所示。

•图1-1 检查网页

将会看到右侧出现的代码串,这些就是基本的HTML,如图1-2所示。

•图1-2 HTML代码串

当然,这里内部还嵌入了一些CSS和JS,暂时先不做介绍。右上方还有一个常用的功能。单击“网络”标签页,这里可以看到具体素材的构建,如图1-3所示。

•图1-3 具体素材的构建