经过近期对网站的标准化调整,使我能够更清晰的认识到网页标记语言的历史沿革,其中,尤其认识到XHTML替代HTML是必然的,而使用XHTML标准能够让网页设计者们从容而平滑的过度到以数据利用为本的文档形式XML。
HTML提供了类似字段分隔符的元素标记,但这些标记并没有非常准确的告诉阅读者,被其分割并包围的各个数据块所属的内容类型,即到底某个数据块包含的是时间还是日期?是价格还是日记内容?无法告知数据块内容的标记和文本数据库中的字段分隔符“|”又有什么区别呢?仅仅起到分割数据的作用而已,不便对数据进行提取和反复使用。
HTML文档确实还是使用了一些可以表示数据块类型的标记如<div>,但是这个标记<div>仅仅告诉我们这是个数据块,但还是不清除这个块的内容类型是什么。所以在HTML数据标签中,既包括表现标签又包括类型标签,使得对数据的单独引用和区分比较困难。没有数据属于<h1>这个内容,也没有数据拥有<b>这个内容,因为这两个标记是用来控制数据表现的。
但是,可以利用CSS的方式区分数据块的内容类型。DIV+CSS可以说是向XML过度的重要一步。例如,要标明某个数据块中的内容是大段的日记,在XHTML中可以表示为“<div class="diary"></div>”,这无疑类似于XML中的“<diary></diary>”标记。因为通过字符串“diary”,我们可以很好的定位这些数据并对其进行不同的处理,包括表现形式上的处理和数据利用层面上的处理。