介紹XML語法及應用
- 1.XML基礎知識
- 1.1什么是XML語言
- 1.2 XML 和 HTML 之間的差異
- 1.3 XML 用途
- 2.XML語法
- 2.1基礎語法
- 2.2XML元素
- 2.3 XML屬性
- 2.4XML命名空間
- 3.XML驗證
- 3.1xml語法驗證
- 3.2自定義驗證
- 3.2.1 XML DTD
- 3.2.2 XML Schema
- 3.2.3PCDATA和CDATA區別
- 3.2.4 參考
1.XML基礎知識
1.1什么是XML語言
XML 被設計用來傳輸和存儲數據。
HTML 被設計用來顯示數據。
XML 指可擴展標記語言(eXtensible Markup Language)。
可擴展標記語言(英語:Extensible Markup Language,簡稱:XML)是一種標記語言,是從標準通用標記語言(SGML)中簡化修改出來的。它主要用到的有可擴展標記語言、可擴展樣式語言(XSL)、XBRL和XPath等。
1.2 XML 和 HTML 之間的差異
XML 不是 HTML 的替代。
XML 和 HTML 為不同的目的而設計:
XML 被設計用來傳輸和存儲數據,其焦點是數據的內容。
HTML 被設計用來顯示數據,其焦點是數據的外觀。
HTML 旨在顯示信息,而 XML 旨在傳輸信息。
1.3 XML 用途
XML 應用于 Web 開發的許多方面,常用于簡化數據的存儲和共享。
- XML 把數據從 HTML 分離
如果您需要在 HTML 文檔中顯示動態數據,那么每當數據改變時將花費大量的時間來編輯 HTML。
通過 XML,數據能夠存儲在獨立的 XML 文件中。這樣您就可以專注于使用 HTML/CSS 進行顯示和布局,并確保修改底層數據不再需要對 HTML 進行任何的改變。通過使用幾行 JavaScript 代碼,您就可以讀取一個外部 XML 文件,并更新您的網頁的數據內容。 - XML 簡化數據共享
在真實的世界中,計算機系統和數據使用不兼容的格式來存儲數據。
XML 數據以純文本格式進行存儲,因此提供了一種獨立于軟件和硬件的數據存儲方法。
這讓創建不同應用程序可以共享的數據變得更加容易。 - XML 簡化數據傳輸
對開發人員來說,其中一項最費時的挑戰一直是在互聯網上的不兼容系統之間交換數據。
由于可以通過各種不兼容的應用程序來讀取數據,以 XML 交換數據降低了這種復雜性。
2.XML語法
2.1基礎語法
1.XML 聲明文件的可選部分,如果存在需要放在文檔的第一行,備注版本和語言【可選】
<?xml version="1.0" encoding="utf-8"?>
2.XML必須有個并且只有一個根元素,把所有都包圍起來
<person>
..........
</person>
3.XML是一個樹狀結構,支持層層嵌套
<?xml version="1.0" encoding="utf-8"?>
<bookstore><book category="COOKING"><title lang="en">Everyday Italian</title><author>Giada De Laurentiis</author><year>2005</year><price>30.00</price></book><book category="CHILDREN"><title lang="en">Harry Potter</title><author>J K. Rowling</author><year>2005</year><price>29.99</price></book><book category="WEB"><title lang="en">Learning XML</title><author>Erik T. Ray</author><year>2003</year><price>39.95</price></book>
</bookstore>
4.XML的一個標簽必須有對應的關閉開關
5.XML的元素屬性必須加引號
錯誤:<tang>ddddd 正確:<tang>ddd</tang>
錯誤:<tag date=200-12-01>fff</tag> 正確:<tag date="2002-12-01">fff</tag>
6.特殊字符轉義
在 XML 中,只有字符 “<” 和 “&” 確實是非法的。大于號是合法的,但是用實體引用來代替它是一個好習慣。
轉義符號:
< < 小于
> > 大于
& & &符號
' ' 單引號
" " 雙引號
<!-- 錯誤:-->
<sql> select * from test where id<2</sql>
正確
<sql> select * from test where id < 2</sql>
如果不想使用轉義,則可以加如下格式忽略:< ! [ CDATA [忽略檢查的文本]]>
<sql> select * from test where id <![ CDATA [ <2 ]]></sql>
7.XML注釋
<!-- This is a comment -->
2.2XML元素
XML 元素指的是從(且包括)開始標簽直到(且包括)結束標簽的部分。
一個元素可以包含:
- 其他元素
- 文本
- 屬性
- 或混合以上所有…
<bookstore><book category="CHILDREN"><title>Harry Potter</title><author>J K. Rowling</author><year>2005</year><price>29.99</price></book><book category="WEB"><title>Learning XML</title><author>Erik T. Ray</author><year>2003</year><price>39.95</price></book>
</bookstore>
在上面的實例中,<bookstore> 和 <book> 都有 元素內容,
因為他們包含其他元素。<book> 元素也有屬性(category="CHILDREN")。
<title>、<author>、<year> 和 <price> 有文本內容
,因為他們包含文本。
XML 元素必須遵循以下命名規則:
名稱可以包含字母、數字以及其他的字符
名稱不能以數字或者標點符號開始
名稱不能以字母 xml(或者 XML、Xml 等等)開始
名稱不能包含空格
可使用任何名稱,沒有保留的字詞。
2.3 XML屬性
屬性通常提供不屬于數據組成部分的信息。在下面的實例中,文件類型與數據無關,但是對需要處理這個元素的軟件來說卻很重要:
<file type="gif">computer.gif</file>
因使用屬性而引起的一些問題:
- 屬性不能包含多個值(元素可以)
- 屬性不能包含樹結構(元素可以)
- 屬性不容易擴展(為未來的變化)
2.4XML命名空間
XML 命名空間提供避免元素命名沖突的方法,我們看一個例子
a.xml
<table>
<tr>
<td>Apples</td>
<td>Bananas</td>
</tr>
</table>
b.xml
<table>
<name>African Coffee Table</name>
<width>80</width>
<length>120</length>
</table>
假如這兩個 XML 文檔被一起使用,由于兩個文檔都包含帶有不同內容和定義的
元素,就會發生命名沖突。XML 解析器無法確定如何處理這類沖突。XML解決方案:
在 XML 中的命名沖突可以通過使用名稱前綴從而容易地避免。
該 XML 攜帶某個 HTML 表格和某件家具的信息:
<h:table>
<h:tr>
<h:td>Apples</h:td>
<h:td>Bananas</h:td>
</h:tr>
</h:table><f:table>
<f:name>African Coffee Table</f:name>
<f:width>80</f:width>
<f:length>120</f:length>
</f:table>
這個前綴,就用命名空間來展示
當命名空間被定義在元素的開始標簽中時,所有帶有相同前綴的子元素都會與同一個命名空間相關聯。命名空間,可以在他們被使用的元素中或者在 XML 根元素中聲明:
語法:
xmlns:前綴名=“…”
<root xmlns:h="http://www.w3.org/TR/html4/"
xmlns:f="http://www.w3cschool.cc/furniture"><h:table>
<h:tr>
<h:td>Apples</h:td>
<h:td>Bananas</h:td>
</h:tr>
</h:table><f:table>
<f:name>African Coffee Table</f:name>
<f:width>80</f:width>
<f:length>120</f:length>
</f:table></root>
默認命名空間
我們取消掉 :前綴,就變成默認的命名空間,默認命名空間,在xml里面就不用使用 前綴: 來標注元素了
語法:xmlns=“namespaceURI”
<root xmlns="http://www.w3.org/TR/html4/"
xmlns:f="http://www.w3cschool.cc/furniture"><table>
<tr>
<td>Apples</h:td>
<td>Bananas</h:td>
</tr>
</table><f:table>
<f:name>African Coffee Table</f:name>
<f:width>80</f:width>
<f:length>120</f:length>
</f:table></root>
在實戰中,如果一個xml里有多個命名空間,我們一半把使用得最多得那個,作為默認命名空間
3.XML驗證
3.1xml語法驗證
如果XML語法錯誤,解析器會自動驗證
- XML 文檔必須有一個根元素
- XML元素都必須有一個關閉標簽
- XML 標簽對大小寫敏感
- XML 元素必須被正確的嵌套
- XML 屬性值必須加引號
3.2自定義驗證
就是希望寫一個xml需要遵循哪些要求,如有多少元素,元素的結構怎么樣,元素屬性和數據類型是哪些,這里要用到XML自定義驗證,XML提供 DTD和Schema兩種語法機制
3.2.1 XML DTD
<?xml version="1.0" encoding="ISO-8859-1"?>
<!DOCTYPE note SYSTEM "Note.dtd">
<note>
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
Note.dtd
<!DOCTYPE note
[
<!ELEMENT note (to,from,heading,body)> <!--有哪些元素-->
<!ELEMENT to (#PCDATA)> <!--to 元素內容是可解析的內容-->
<!ELEMENT from (#PCDATA)>
<!ELEMENT heading (#PCDATA)>
<!ELEMENT body (#PCDATA)>
]>
3.2.2 XML Schema
W3C 支持一種基于 XML 的 DTD 代替者,它名為 XML Schema,Schema比DTD更有擴展性
note.xsd文件:
<?xml version="1.0"?>
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema"
targetNamespace="http://www.w3schools.com"
xmlns="http://www.w3schools.com"
elementFormDefault="qualified"><xs:element name="note"><xs:complexType><!--note是一個復合類型,還有子元素--><xs:sequence> <!--元素必須按照順序出現--><xs:element name="to" type="xs:string"/> <!--子元素名,和數據類型--><xs:element name="from" type="xs:string"/><xs:element name="heading" type="xs:string"/><xs:element name="body" type="xs:string"/></xs:sequence></xs:complexType>
</xs:element></xs:schema>
xml里面引用
<?xml version="1.0"?><note
xmlns="http://www.w3schools.com"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.w3schools.com note.xsd"><to>Tove</to><from>Jani</from><heading>Reminder</heading><body>Don't forget me this weekend!</body>
</note>
上述只簡單介紹了dtd和schema,了解其基本意思,更多語法可查看schema相關的學習資源,在schema的基礎擴展出WSDL語言,描述XML接口,是SOA技術的基礎
3.2.3PCDATA和CDATA區別
XML 文檔中的所有文本均會被解析器解析。只有 CDATA 區段中的文本會被解析器忽略。
默認情況被解析器解析的文本就是PCDATA
術語 CDATA 是不應該由 XML 解析器解析的文本數據。像 “<” 和 “&” 字符在 XML 元素中都是非法的。
“<” 會產生錯誤,因為解析器會把該字符解釋為新元素的開始。
“&” 會產生錯誤,因為解析器會把該字符解釋為字符實體的開始。
某些文本,比如 JavaScript sql代碼,包含大量 “<” 或 “&” 字符。為了避免錯誤,可以將腳本代碼定義為 CDATA。CDATA 部分中的所有內容都會被解析器忽略。
CDATA 部分由 “<![CDATA[" 開始,由 "]]>” 結束:
eg:
<name><first>Bill</first><last>Gates</last></name>
里面內容是要被解析的,最終效果如下:
<name>
<first>Bill</first>
<last>Gates</last>
</name>
eg:
< script>里面的<我們不希望被解析,則可使用 “<![CDATA[" 開始,由 "]]>” 包圍起來
<script>
<![CDATA[
function matchwo(a,b)
{
if (a < b && a < 0) then
{
return 1;
}
else
{
return 0;
}
}
]]>
</script>
3.2.4 參考
spring的配置
<?xml version="1.0" encoding="UTF-8"?><beans <!-- 默認命名空間 -->xmlns="http://www.springframework.org/schema/beans" <!--帶后綴的空間-->xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"xmlns:jee="http://www.springframework.org/schema/jee" xmlns:tx="http://www.springframework.org/schema/tx"xmlns:context="http://www.springframework.org/schema/context"<!--schema引用-->xsi:schemaLocation="http://www.springframework.org/schema/beans http://www.springframework.org/schema/beans/spring-beans-3.2.xsdhttp://www.springframework.org/schema/tx http://www.springframework.org/schema/tx/spring-tx-3.2.xsdhttp://www.springframework.org/schema/jee http://www.springframework.org/schema/jee/spring-jee-3.2.xsdhttp://www.springframework.org/schema/context http://www.springframework.org/schema/context/spring-context-3.2.xsd"default-lazy-init="true">