1.2 HTML5
HTML(Hyper Text Markup Language,超文本标记语言)是一种专门用于定义网页结构与内容的编程语言。“超文本”是指页面内容除了普通文本以外,还包括链接、图片、音频、视频、应用程序等非文字元素。其包含HTML语言内容、扩展名为.html或htm的文件即为一个网页(Webpage),因而网页的本质就是HTML。
第一个正式的HTML语言标准于1993年发布,经过二十多年的发展,目前最新的标准是HTML5,且已经获得主流浏览器的支持。
1.2.1 HTML语言的语法规则
HTML的语法规则较为简单,它采用“标签”方式描述网页的结构与内容,因此又被称为标签语言。整体上,HTML标签分为两大类:一是成对出现的容器标签;二是单个出现的单标签(有时又被称为空标签)。标签中还可通过设置标签属性来进一步刻画标签的内容或外观。它们的语法规则如下:
容器标签:
<标签名属性名="属性值"属性名="属性值"… >内容…</标签名>
单标签:
<标签名属性名="属性值"属性名="属性值"… / >
通常,HTML的标签名和属性名是固定的英文字母,但是也允许开发人员根据实际需要自定义标签名和属性名。标签名和属性名不区分大小写。
1.2.2 网页的基本结构
任何一个网页,其完整的HTML结构如下:
<html> <head> </head> <body> </body> </html>
其中<html>标签的作用是告知浏览器其自身是一个HTML文档,浏览器会根据HTML的规范来解析文档内容并呈现到页面中。<html>标签有<head>和<body>两个子标签,<head>标签用于定义文档的头部,它是所有头部元素的容器,还可以引用脚本文件(通常指JavaScript)和样式表(CSS)、提供元信息等;<body>标签用于定义文档的主体内容,用户在浏览器中看到的网页内容绝大部分都来自<body>标签。
网页的上述基本结构并非必需,在缺失某些标签的情况下,用户仍可能正常看到网页内容,但是这样存在诸多风险,最常见的是非英文文本的乱码。因此,开发人员应严格按照上述结构创建网页。
我们用浏览器通过“查看源代码”(或“查看源”)可以查看任意网页的HTML结构,见图1.1。
图1.1 兴义民族师范学院网站首页源代码(局部)
1.2.3 常用的HTML5标签
标准的HTML5语言共有120个标签,但是常用的标签只有30多个。为了便于读者理解并熟记这些标签的名称,我们根据标签名的来源方式的不同,将常用的HTML标签分为以下三类。
(1)标签名本身就是一个完整的英文单词,见表1.1。
表1.1 HTML5标签
(2)标签名为一个英文单词中的部分字母,见表1.2。
表1.2 HTML5标签
(3)标签名由多个英文单词中的字母组成,见表1.3。
表1.3 HTML5标签
完整的HTML5标签介绍请参考:HTML参考手册http://www.w3school.com.cn/tags/index.asp。需要注意的是,IE8及更早版本的浏览器不支持HTML5。
1.2.4 常用的HTML5属性
如前所述,HTML属性的作用是进一步刻画标签的内容或外观。HTML属性较多,整体上HTML属性可分为公有属性和私有属性两大类:公有属性是指任何HTML标签均可设置的属性;私有属性是指仅某个(些)HTML标签才可设置的属性。下面分别列出HTML常用的公有属性(见表1.4)和常用的私有属性(见表1.5)。
表1.4 常用的公有属性
表1.5 常用的私有属性