数字出版实用教程(第二版)
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.1.2 XML成为跨媒体出版的重要标准

20世纪80年代后期,全文数据库出版解决了电子版格式与打印版格式的统一问题,即检索结果显示格式与排版印刷格式的一致性。解决的方法是,每篇文档每一页同时有两种版本:扫描图像版本和用SGML标记语言的文字版本SGML(Standard Generalized Markup Language),即标准通用标记语言,于1986年出版发布的信息管理方面的国际标准(ISO 8879)。该标准独立于平台和应用的文本文档的格式、索引和链接信息,为用户提供一种类似于语法的机制,用来定义文档的结构和指示文档结构的标签。其中,Markup的含义是指插入到文档中的标记。制定SGML的基本思想是把文档的内容与样式分开。SGML是一种在Web发明之前就已存在的用标记来描述文档资料的通用语言,但SGML十分庞大且难以学习和使用。。标记是隐形的,最终在网页浏览或者阅读器上浏览,看不到标记本身,而只有标记的结果。扫描图像使用与印刷版相同的图案和布局,能够保证每页的打印和显示与印刷版一致。由于扫描图像没有电子版所需要的属性标识,文档中的各种排版符号依然保留,因而不能直接在计算机上浏览。采用SGML标记语言将文档的内容与样式分开,正文则用于建立全文索引,以便信息检索和在屏幕上的快速显示。

在美国,早期的SGML使用者是科技期刊出版商,由于科技期刊内容含有大量复杂的公式、表格和图片,版面复杂,无论是印刷版还是电子版,都是最难制作的出版物。学术期刊比其他出版领域更多地使用SGML,芝加哥大学出版社的《天体物理学期刊》从1994年开始采用基于SGML工作流程,1995年开展网络出版时,所有的SGML文件转换成HTML文件HTML(Hypertext Markup Language),即超文本标记语言,是用于描述网页文档的一种标记语言。互联网是建立在超文本基础之上的,文本中包含了“超级链接”点。所谓超级链接,就是一种URL指针,通过激活(点击)它,可使浏览器方便地获取新的网页。这也是HTML获得广泛应用的最重要原因之一。,在很短时间里几乎没有增加额外成本就在互联网上出版这本大型复杂的期刊,实现了双轨出版。现在,学术期刊及其他出版则采用SGML的后续技术XML(Extensible Markup Language),即可扩展标记语言。

出版信息的XML结构化,为实现自动的跨媒体出版打下良好的数据基础。XML数据配上用于显示XSLT的样式数据XSLT(Extensible style Sheet Language Transformation),在计算机科学中是扩展样式表转换语言的简称,这是一种对XML文档进行转化的语言,XSLT中的T代表英语中的“转换”(transformation),它是可扩展样式表语言XSL规范的一部分。,解决了出版信息在互联网上的发布。但是,XML数据解决出版信息到印刷和光盘的发布还存在障碍,特别是在RIPRIP(Raster Image Processor)即光栅图像处理器,对于计算机直接制版系统来说,RIP的主要作用是将计算机制作版面中的各种图像、图形和文字,解释成打印机或照排机能够记录的点阵信息,然后控制打印机或照排机将图像点阵信息记录在纸上或胶片上。不支持XML输出的情况下,出版信息到印刷和光盘的跨媒体还难以实现。解决这个瓶颈的一种方法是,通过软插件技术将XML数据直接嵌入到排版软件的版面上,由排版软件实现XML数据到PSPS(Photoshop,像素制图软件)是Adobe公司旗下最出名的图像处理软件之一。它不仅是一个很好的图像编辑软件,同时它的应用领域很广泛,在图像、图形、文字、视频、出版各方面都有涉及。数据的转移。纸介质的出版信息发布问题解决后,将PS数据转换为PDF格式PDF(Portable Document Format)是Adobe公司开发的电子文件格式。该格式与操作系统平台无关,这一特点使它成为在Internet上进行电子文档发行和数字化信息传播的理想文档格式。PDF文件格式可以将文字、字型、格式、颜色及独立于设备和分辨率的图形图像等封装在一个文件中。该格式文件还可以包含超文本链接、声音和动态影像等电子信息,支持特长文件,集成度和安全可靠性都较高。经中国国家标准化管理委员会批准,PDF文件格式已成为正式的中国国家标准,并已于2009年9月1日起正式实施。,光盘发布的问题也迎刃而解肖建国. XML和DAM技术与跨媒体出版[J].中国印刷,2001(4):6-7.

21世纪伊始,在出版领域,为一种出版物同时制作电子版与印刷版的文档处理软件使跨媒体出版开始流行。运用XML标记语言规定的元数据结构,实现了新闻信息的内容描述、交换和再利用,电子文件能按照不同的方式呈现内容,既可在屏幕上显示,也可用于印刷。在报业,出版纸质报纸、网页新闻及2005年以后广泛流行的手机报,形成“纸网互动、滚动报道”的立体报群传播态势,技术上都要归功于XML成为中文新闻信息置标语言新闻领域的中文信息处理率先实现了XML标引,并已经颁发了国家标准:GB/T 20092-2006中文新闻信息置标语言(Chinese Nnews Markup Language,CNML)。在报业的应用。

目前,一些中文处理软件能够直接利用排版软件产生电子文本,加工成计算机可读的电子书,其加工过程不是在排版文本产生之后而是融合在排版过程之中。也有出版社开发出利用数字化加工的PDF文件,自动生成图书的XML元数据信息的转换软件,在跨媒体出版方面有了自主开发的信息处理技术。