我的账户
链视界

关注数字经济、区块链

亲爱的游客,欢迎!

已有账号,请

如尚未注册?

链视界 门户 互联网

什么是XML?XML书写格式和规范

什么是XML?

出版社的编辑们是否工作中会遇到以下情况:向国外平台提交数据时,对方要求提供XML格式的数据。

到底什么是XML格式的数据?

简介

XML(读作[?eks em ?el]),可扩展标记语言(Extensible Markup Language)的简称,是一种对结构进行描述的语言,XML标记方式简单,非常容易在程序中读写,所以很快便成为数据交换的公共语言。

XML并不是历史上第一门标记语言,它有两个先驱:SGML和HTML。1986年,国际标准化组织发布了信息管理方面的国际标准SGML,SGML功能强大,但复杂庞大且造价昂贵。HTML相比而言更加简单,但无法描述数据、可读性差、搜索时间长等。

为了更便捷的存储和传输数据,1998年W3C(万维网联盟)公布了XML 1.0标准,XML诞生了!

XML特点

XML是纯文本,用于处理纯文本的软件都可以处理XML。不过,专用软件可以更有针对性地处理XML的标签。

XML标签没有被预定义,允许创作者自定义标签和文档结构。

XML具有自我描述性。即在描述数据内容的同时能突出对结构的描述,从而体现出数据与数据间的关系。

下面用互联网上最常见的一个例子进行说明,这是一条用xml语言描述的便签,它拥有标题以及备忘内容,同时也包含了发送者和接受者的信息。

什么是XML?XML书写格式和规范


XML书写格式和规范

一、 一个XML元素的基本结构

XML文件格式是纯文本格式,XML由XML元素组成。在计算机中,标记指计算机所能理解的信息符号,每个XML元素包括一个开始标记,一个结束标记以及两个标记之间的内容。标记是对文档存储格式和逻辑结构的描述,标记可以通过属性来区分不同的类型。

什么是XML?XML书写格式和规范


例如:<issn pub-type="ppub">0578-1426</issn>,其中,<issn>是开始标记,pub-type="ppub"是属性与属性值,</issn>是结束标记,0578-1426是两个标记之间的内容。这是一个完整的XML元素。

二、一篇XML文件的完整结构

在形式上,标记中可能包括注释、引用、字符数据段、起始标记、结束标记、空元素、文档类型声明DTD或Schema等。

具体规则如下:

1、必须有声明语句

XML声明是XML文档的第一句,其格式如下:

<?xml version="1.0" encoding="UTF-8"?>

2、注意大小写

在XML文档中,大小写是有区别的。“A”和“a”是不同的标记。注意在写元素时,前后标记的大小写要保持一致。最好养成一种习惯,或者全部大写,或者全部小写,或者大写第一个字母,这样可以减少因为大小写不匹配而产生的文档错误。

3、XML文档有且只有一个根元素

良好格式的XML文档必须有一个根元素,就是紧接着声明后面建立的第一个元素,其他元素都是这个根元素的子元素,根元素完全包括文档中其他所有的元素。根元素的起始标记要放在所有其他元素的起始标记之前;根元素的结束标记要放在所有其他元素的结束标记之后。

上述便签的例子中的<note>元素为该XML文档的根元素,其他元素均在该根元素。

4、属性值使用引号

在HTML代码里面,属性值可以加引号,也可以不加。但是XML规定,所有属性值必须加引号(可以是单引号,也可以是双引号,建议使用双引号),否则将被视为错误。

如下例中的name-style与xml:lang为属性,western与en为属性值,必须加引号。

什么是XML?XML书写格式和规范


5、所有的标记必须有相应的结束标记

良好格式的XML文档必须有一个根元素,就是紧接着声明后面建立的第一个元素,其他元素都是这个根元素的子元素,根元素完全包括文档中其他所有的元素。根元素的起始标记要放在所有其他元素的起始标记之前;根元素的结束标记要放在所有其他元素的结束标记之后。

正例:

什么是XML?XML书写格式和规范


反例:

什么是XML?XML书写格式和规范


6、所有的空标记也必须被关闭

空标记是指标记对之间没有内容的标记。在XML中,规定所有的标记必须有结束标记。如下例所示:标记对之间没有内容,仅包含一个属性,但是也要有结束标记。

什么是XML?XML书写格式和规范


7、XML中元素可以嵌套

一个元素可以包含一个或多个子元素。特别的,有些元素本身可以作为自己的子元素,这种情况被称为递归。

如下例所示:标签<subj-group>用来描述文章的学科、栏目和中图分类等,例子中的<subject>标签为<subj-group>的子元素,并且<subj-group>本身也可作为自己的子元素,实现多级分类。

什么是XML?XML书写格式和规范

注:上图中“<!-- 论文的中文栏目名称-->”为注释的写法。

XML标准体系

XML使用虽然简单,但与XML相关的标准却种类繁多,W3C制定的相关标准就有二十多个,可分为元语言标准、基础标准、应用标准三个层次。

元数据标准描述的是用来描述标准的元语言。在XML标准体系中就是XML标准,是整个体系的核心,其他XML相关标准都是用它制定的或为其服务的。

基础标准是为XML的进一步实用化制定的标准,规定了采用XML制定标准时的一些公用特征、方法或规则。如 XML Schema描述了更加严格地定义XML文档的方法,以便可以更自动化处理XML文档;XMLNamespace用于保证 XML DTD中名字的一致性。

应用标准是在各行业的应用时,行业内各方所统一采用的规范标准。大家所熟知的JATS便是XML在期刊数字出版行业的标准之一,JATS标准目前已经成为全球公认的期刊文章内容标记标准,另外大型出版集团如Elsevier、Springer等,也曾经制定在自己企业内部使用的XML标准。
电商资讯
亚马逊
Shopee
Lazada
拼多多
抖音
上一篇:
Gmail邮箱怎么注册(国内手机注册Gmail方法)发布时间:2022-11-28
下一篇:
网站一级域名和二级域名区别(详细举例说明)发布时间:2022-11-28
推荐阅读
微信扫码
行业动态资讯早知道

Copyright © 2022 链视界 粤ICP备2021100744号   Designed by 链视界