要了解 XML,因为它有助于理解标记数据这个概念。人们创建文档的历史已经很久了,而人们对文档进行标记的历史也一样悠久。例如,学校老师总是要对学生的作业进行标记。告诉学生改变段落顺序、对语句进行润色、纠正拼写错误等等。对文档进行标记是我们定义文档中的信息的结构、含义和外观的一种方式。如果您使用过 Microsoft Office Word 中的“修订”功能,则一定使用过计算机形式的标记。
在计算机术语中,“mark up”已经逐渐演变为“markup”。标记 (markup) 是使用称为标记(tag,有时为 token)的代码来定义任何数据的结构、外观以及含义(在 XML 语言中)的过程。
本文中的 HTML 代码就是计算机标记的一个很好的应用示例。如果浏览代码(在 Microsoft Internet Explorer 中,右键单击页面,然后单击“查看源文件”),您就会发现其中混有可读文本和超文本标记语言 (HTML) 标记(如 <p> 和 <h2>)。HTML 和 XML 文档中的标记很容易识别,因为这些标记都用尖括号括起。在本文的源代码中,可用 HTML 标记执行许多操作,例如,定义每个段落的开头和结尾 (<p> ... </p>) 以及标记每幅图像的位置。