1.4 HTML文档结构及语法规则
每个网页都有其基本的结构,包括HTML文档的结构、标签的格式等。
1.4.1 标签及其属性
1.标签
HTML文档由标签和被标签的内容组成。标签能产生所需要的各种效果。其功能类似于一个排版软件,将网页的内容排成理想的效果。这些标签名称大都为相应的英文单词首字母或缩写,例如,p表示paragraph(段落)、img表示image(图像),很好记忆。各种标签的效果差别很大,但总的表示形式却大同小异,大多数都成对出现。其格式为:
例如,一级标题标签<h1>表示为:
需要注意以下2点。
①每个标签都要用“<”(小于号)和“>”(大于号)括起来,如<p>,<table>,以表示这是HTML代码而非普通文本。注意,“<”“>”与标签名之间不能留有空格或其他字符。
②在标签名前加上符号“/”便是其结束标签,表示该标签内容的结束,如</h1>。标签也有不用</标签>结尾的,称之为单标签。
2.标签的属性
标签仅仅规定这是什么信息,这些信息可以是文本,也可以是图像,但是要想显示或控制这些信息,就需要在标签后面加上相关的属性。每个标签都有一系列的属性。标签通过属性来制作出各种效果,格式为:
例如,一级标题标签<h1>有属性align,align表示文字的对齐方式,表示为:
1.4.2 HTML代码规范
页面的HTML代码书写必须符合HTML规范,这是用户编写拥有良好结构文档的基础,这些文档可以很好地工作于所有的浏览器,并且可以向后兼容。
1.标签和属性的规范
需要注意以下几点。
● 并不是所有的标签都有属性,如换行标签就没有。
● 根据需要可以使用该标签的所有属性,也可以只用其中的几个属性。在使用时,属性之间没有顺序。
● 属性和标签一样,都必须用小写字母表示。
● 属性值都要用双引号括起来。
2.元素的嵌套
元素必须被正确地嵌套,最有可能发生错误的是在与<table>标签结合的情况。<table>的直接子元素只能为<thead>、<tbody>、<tfoot>和<tr>,而<thead>、<tbody>和<tfoot>的直接子元素只能为<tr>,而<tr>的直接子元素只能为<td>和<th>才可以放其他标签。此外,类似的标签还有<dl>、<ul>、<select>等。
3.不推荐使用的标签
在HTML中,某些标签不推荐使用,如<b>、<strong>、<i>、<em>、<dfn>、<code>、<samp>、<kbd>、<var>、<cite>等标签。因为这些标签有些是可以用CSS去统一控制的,还有一些是不常使用的。
4.代码的缩进
在编写HTML代码时要注意使用代码缩进来提高程序的结构性和层次性,不要使用制表符或制表符加空格的混合方式缩进。
1.4.3 HTML文档结构
HTML文档是一种纯文本格式的文件,文档的基本结构格式为:
1.HTML文档标签<html>…</html>
HTML文档标签的格式为:
<html>处于文档的最前面,表示HTML文档的开始,即浏览器从<html>开始解释,直到遇到</html>为止。每个HTML文档均以<html>开始,以</html>结束。
2.HTML文档头标签<head>…</head>
HTML文档包括头部(head)和主体(body)。HTML文档头标签的格式为:
文档头部内容在开始标签<html>和结束标签</html>之间定义,其内容可以是标题名或文本文件地址、创作信息等网页信息说明。
3.文档编码
HTML文档使用meta元素的charset属性指定文档编码,格式为:
为了被浏览器正确解释和通过W3C代码校验,所有的HTML文档都必须声明它们所使用的编码语言。文档声明的编码应该与实际的编码一致,否则就会呈现为乱码。对于中文网页的设计者来说,用户一般使用gb2312(简体中文)。
4.HTML文档主体标签<body>…</body>
HTML文档主体标签的格式为:
主体位于头部之后,以<body>为开始标签,</body>为结束标签。它定义网页上显示的主要内容与显示格式,是整个网页的核心,网页中要真正显示的内容都包含在主体中。