能以不變應萬變是聰明人做事的準則。萬事從小事做起,積累小成功,問鼎大成功,是成功者的秘訣。
XML輕松學習手冊(1)XML快速入門
文章類別:XML教程 發(fā)表日期:2003-6-3 星期二 -------------------------------------------------------------------------------- 轉自:動態(tài)網制作指南 www.knowsky.com 前言
XML越來越熱,關于XML的基礎教程網絡上也隨處可見??墒且淮蠖训母拍詈托g語往往讓人望而生畏,很多朋友問我:XML到底有什么用,我們是否需要學習它?我想就我個人學習過程的心得和經驗,寫一篇比較全面的介紹文章。首先有兩點是需要肯定的:
第一:XML肯定是未來的發(fā)展趨勢,不論是網頁設計師還是網絡程序員,都應該及時學習和了解,等待只會讓你失去機會;
第二:新知識肯定會有很多新概念,嘗試理解和接受,您才可能提高。不要害怕和逃避,畢竟我們還年輕。
提綱
本文共分五大部分。分別是XML快速入門,XML的概念,XML的術語,XML的實現(xiàn),XML的實例分析。最后附錄介紹了XML的相關資源。作者站在普通網頁設計人員的角度,用平實生動的語言,向您講述XML的方方面面,幫助你撥開XML的神秘面紗,快速步入XML的新領域。
第一章:XML快速入門
一. 什么是XML?
二. XML是新概念嗎?
三. 使用XML有什么好處?
四. XML很難學嗎?
五. XML和HTML的區(qū)別
六. XML的嚴格格式
七. 關于XML的更多
這往往是第一個問題,也往往在第一個問題上你就會搞不明白,因為大多的教材上這樣回答:
XML是Extensible Markup Language的簡寫,一種擴展性標識語言。 這是標準的定義。那么什么是標志語言,為什么叫擴展性?已經讓人有些糊涂。我想我們這樣來理解會好一些:
對 4.0里規(guī)范和定義,而XML里允許你自己創(chuàng)建這樣的標簽,所以叫做可擴展性。
這里有幾個容易混淆的概念要提醒大家:
1.XML并不是標記語言。它只是用來創(chuàng)造標記語言(比如HTML)的元語言。天,又糊涂了!不要緊,你只要知道這一點:XML和HTML是不一樣的,它的用處途比HTML廣泛得多,我們將在后面仔細介紹。
2.XML并不是HTML的替代產品。XML不是HTML的升級,它只是HTML的補充,為HTML擴展更多功能。我們仍將在較長的一段時間里繼續(xù)使用HTML。(但值得注意的是HTML的升級版本XHTML的確正在向適應XML靠攏。)
3.不能用XML來直接寫網頁。即便是包含了XML數(shù)據,依然要轉換成HTML格式才能在瀏覽器上顯示。
下面就是一段XML示例文檔(例1),用來表示本文的信息:
<myfile>
<title>XML Quick Start</title>
<author>ajie</author>
<email>ajie@aolhoo.com</email>
<date>20010115</date>
</myfile>
注意:
1.這段代碼僅僅是代碼,讓你初步感性認識一下XML,并不能實現(xiàn)什么具體應用;
2.其中類似< title>,< author>的語句就是自己創(chuàng)建的標記(tags),它們和HTML標記不一樣,例如這里的< title>是文章標題的意思,HTML里的< title>是頁面標題。
不是。XML來源于SGML,一種比HTML更早的標志語言標準。
關于SGML,我們來簡單了解一下,你只需要有個大致概念就可以。
SGML全稱是"Standard Generalized Markup Language"(通用標識語言標準)??疵Q就知道:它是標志語言的標準,也就是說所有標志語言都是依照SGML制定的,當然包括 而XML就是SGML的簡化版,只不過省略了其中復雜和不常用的部分。(哦,明白了!是 到這里,你應該有點明白了:XML是用來創(chuàng)建定義類似HTML的標記語言,然后再用這個標記語言來顯示信息。 三. 使用XML有什么好處? 有了HTML,為什么還需要用XML? 因為現(xiàn)在網絡應用越來越廣泛,僅僅靠XML作為下一代web運用的數(shù)據傳輸和交互的工具。 使用XML有什么好處?來看w3c組織(XML標準制定者)的說明: 1.XML可以廣泛的運用于web的任何地方; 2.XML可以滿足網絡應用的需求; 3.使用XML將使編程更加簡單; 4.XML便于學習和創(chuàng)建; 5.XML代碼將清晰和便于閱讀理解; 還是抽象了些。讓我們在后面的實例教程中慢滿體會XML的強大優(yōu)勢吧! 四. XML很難學嗎? 如果你有興趣學習XML,不禁會問:XML難嗎?學習XML需要什么樣的基礎? XML非常簡單,學習容易。如果你熟悉HTML,你會發(fā)現(xiàn)它的文檔和HTML非常相似,看同樣的示例文檔(例1): ? <myfile> <title>XML Quick Start</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> </myfile> 第一行是一個XML聲明,表示文檔遵循的是XML的1.0 版的規(guī)范。 第二行定義了文檔里面的第一個元素(element),也稱為根元素: < myfile>。這個就類似HTML里的< HTML>開頭標記。注意,這個名稱是自己隨便定義的。 再下面定義了四個子元素:title,author,email,和date。分別說明文章的標題,作者,郵箱和日期。當然,你可以用中文來定義這些標簽,看上去更便于理解: <? <文章> <標題>XML輕松學習手冊</標題> <作者>ajie</作者> <信箱>ajie@aolhoo.com</信箱> <日期>20010115</日期> </文章> 這就是XML的文檔,任何掌握HTML的網友都可以直接寫出這樣簡單的XML文檔。 另外,學習XML還必須掌握一種頁面腳本語言,常見的就是JavaScript和VB script。因為XML數(shù)據是使用script實現(xiàn)HTML中調用和交互的。我們看一個最簡單的例子(例2): 1.將下面代碼存為myfile.htm <HTML> <head> <script language=" var nodes = XMLDoc.documentElement.childNodes; title.innerText = nodesitem(0).text; author.innerText = nodes.item(1).text; email.innerText = nodes.item(2).text; date.innerText = nodes.item(3).text; </script> <title>在HTML中調用XML數(shù)據</title> </head> <body bgcolor="#FFFFFF"> <b>標題: </b> <span id="title"> </span> <b>作者: </b>> <span id="author"></span> <b>信箱: </b> <span id="email"></span> <b>日期:</b> <span id="date"></span> </body> </HTML> 2.將下面代碼存為myfile.XML <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> </myfile> 3.將它們放在同一個目錄下,用IE5以上版本瀏覽器打開,可以看到效果。 學習并掌握一種script,你將真正了解到XML無比的強大的功能。 五. XML和HTML的區(qū)別 XML和HTML都來自于SGML,它們都含有標記,有著相似的語法,HTML和XML的最大區(qū)別在于:HTML是一個定型的標記語言,它用固有的標記來描述,顯示網頁內容。比如< H1>表示首行標題,有固定的尺寸。相對的,XML則沒有固定的標記,XML不能描述網頁具體的外觀,內容,它只是描述內容的數(shù)據形式和結構。 這是一個質的區(qū)別:網頁將數(shù)據和顯示混在一起,而XML則將數(shù)據和顯示分開來。 我們看上面的例子,在myfile.htm中,我們只關心頁面的顯示方式,我們可以設計不同的界面,用不同的方式來排版頁面,但數(shù)據是儲存在myfile.XML中,不需要任何改變。 (如果你是程序員,你會驚訝的發(fā)現(xiàn),這與模塊化面向對象編程的思想極其相似!其實網頁何嘗不是一種程序呢?) 正是這種區(qū)別使得XML在網絡應用和信息共享上方便,高效,可擴展。所以我們相信,XML做為一種先進的數(shù)據處理方法,將使網絡跨越到一個新的境界。 六. XML的嚴格格式 吸取HTML松散格式帶來的經驗教訓, 我們先看HTML的一些語句,這些語句在HTML中隨處可見: 1. sample 2.< b>< i>sample< /b>< /i> 3.< td>sample< /TD> 4.< font color=red>samplar< /font> 在XML文檔中,上述幾種語句的語法都是錯誤的。因為: 1.所有的標記都必須要有一個相應的結束標記; 2.所有的XML標記都必須合理嵌套; 3.所有XML標記都區(qū)分大小寫; 4.所有標記的屬性必須用""括起來; 所以上列語句在XML中正確的寫法是 1. sample 2.< b>< i>sample< /i>< /b> 3.< td>sample< /td> 4.< font color="red">samplar< /font> 另外,XML標記必須遵循下面的命名規(guī)則: 1.名字中可以包含字母、數(shù)字以及其它字母; 2.名字不能以數(shù)字或"_" (下劃線) 開頭; 3.名字不能以字母 XML (或 XML 或 Xml ..) 開頭; 4.名字中不能包含空格。 在XML文檔中任何的差錯,都會得到同一個結果:網頁不能被顯示。各瀏覽器開發(fā)商已經達成協(xié)議,對XML實行嚴格而挑剔的解析,任何細小的錯誤都會被報告。你可以將上面的myfile.xml修改一下,比如將< email>改為< Email>,然后用IE5直接打開myfile.xml,會得到一個出錯信息頁面: <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> <Email>ajie@aolhoo.com</email> <date>20010115</date> </myfile> 七. 關于XML的更多 好了,到現(xiàn)在你已經知道: 1.什么是XML; 2.XML,HTML,SGML之間的關系和區(qū)別; 3.XML的簡單應用。 恭喜你!你已經不再對XML一無所知,并且已經走在了網絡技術的前沿。整個學習過程好象并不很難哦:) 如果你對XML有更多的興趣,希望進一步了解XML的詳細資料和其它的實際運用技術,歡迎繼續(xù)瀏覽我們的下一章:XML的概念。 XML輕松學習手冊(2)XML概念 第二章 XML概念 導言 經過第一章的快速入門學習,你已經知道了 一. 擴展性 二. 標識 三. 語言 四. 結構化 五. Meta數(shù)據 六. 顯示 七. DOM 一.擴展性---使用XML,你可以為你的文檔建立自己的標記(tags)。 在HTML里,有許多固定的標記,我們必須記住然后使用它們,你不能使用HTML規(guī)范里沒有的標記。而在XML中,你能建立任何你需要的標記。你可以充分發(fā)揮你的想象力,給你的文檔起一些好記的標記名稱。比如,你的文檔里包含一些游戲的攻略,你可以建立一個名為<game>的標記,然后在<game>下再根據游戲類別建立<RPG>,<SLG>等標記。只要清晰,易于理解你可以建立任何數(shù)量的標記。 一開始你也許會不適應,因為我們在學習HTML時,有固定的標記可以直接學習和使用;(很多人包括我自己都是邊分析別人的代碼和標識,邊建立自己的網頁),而XML卻沒有任何標記可以學,也很少有文檔的標記是一模一樣的。我們怎么辦?呵呵,沒有就自己創(chuàng)建呀。一旦你真正開始寫XML文檔,你會發(fā)現(xiàn)隨心所欲的創(chuàng)造新標記也是一份很有趣的事。你可以建立有自己特色的標記,甚至建立你自己的HTML語言。 擴展性使你有更多的選擇和強大的能力,但同時也產生一個問題就是你必須學會規(guī)劃。你自己要理解自己的文檔,知道它由哪幾部分組成,相互之間的關系和如何識別它們。 關于建立標識還需要說明一點,標識是描述數(shù)據的類型或特性,比如<width>,年齡<age>,姓名<name>等,而不是數(shù)據的內容,比如:<10pxl>,<18>,<張三>,這些都是無用的標記。如果你學過數(shù)據庫,你可以這樣理解,標識就是一種字段名。 二.標識---使用XML你可以識別文檔中的元素。 不論你是HTML,還是XML,標識的本質在于便于理解,如果沒有標識,你的文檔在計算機看來只是一個很長的字符串,每個字看起來都一樣,沒有重點之分。 通過標識,你的文檔才便于閱讀和理解,你可以劃分段落,列明標題。XML中,你更可以利用其擴展性 來為文檔建立更合適的標識。 不過,有一點要提醒大家注意:標識僅僅是用來識別信息,它本身并不傳達信息。例如這樣的HTML代碼: <b>frist step<b> 這里<b>表示粗體,只用來說明是用粗體來顯示"frist step"字符,<b>本身并不包含任何實際的信息,在頁面上你看不到<b>,真正傳達信息的是"frist step "。 三.語言---使用XML你要遵循特定的語法來標識你的文檔。 在計算機領域,語言常常表示一?quot;程序語言",用來編程實現(xiàn)一些功能和應用,但不是所有的"語言"都是用來編程的,XML就只是一種用來定義標識和描述信息的語言。 下面我們來深入了解一下XML應用的其本原理,可能會很枯燥,但是對于整體的理解很重要,你可以先快速過一遍,心里有一個模糊的概念,具體精髓則需要在實踐中慢慢領會。 四.結構化---XML促使文檔結構化,所有的信息按某種關系排列。 "結構化"聽起來太抽象了,我們這樣理解,結構化就是為你的文檔建立一個框架,就象寫文章先寫一個提綱。結構化使你的文檔看起來不會雜亂無章,每一部分都緊密聯(lián)系,形成一個整體。 結構化有兩個原則: 1.每一部分(每一個元素)都和其他元素有關聯(lián)。關聯(lián)的級數(shù)就形成了結構。 2.標識本身的含義與它描述的信息相分離。 我們來看一個簡單的例子幫助理解: <? <myfile> <title>XML輕松學習手冊</title> <chapter>XML快速入門 <para>什么是XML</para> <para>使用XML的好處</para> </chapter> <chapter>XML的概念 <para>擴展性</para> <para>標識</para> </chapter> </myfile> 這是本文的XML描述文檔,可以看到標識分三級關聯(lián),非常清晰: <myfile> <chapter> <para> ... </para> </chapter> </myfile> 上面這樣的文檔結構,我們又稱之為"文檔樹",主干是父元素,如<myfile>,分支和頁是子元素,如<chapter>和<para>。 五.Meta數(shù)據(Metadata)---專業(yè)的XML使用者會使用meta數(shù)據來工作。 在HTML中我們知道可以使用meta標識來定義網頁的關鍵字,簡介等,這些標識不會顯示在網頁中,但可以被搜索引擎搜索到,并影響搜索結果的排列順序。 XML對這一原理進行了深化和擴展,用XML,你可以描述你的信息在哪里,你可以通過meta來驗證信息,執(zhí)行搜索,強制顯示,或者處理其他的數(shù)據。 下面是一些XML metadata在實際應用中的用途: 1.可以驗證數(shù)字簽名,使在線商務的提交動作(submission)有效。 2.可以被方便的建立索引和進行更有效搜索。 3.可以在不同語言之間傳輸數(shù)據。 W3C組織正在研究一種名為RDF(Resource Description Framework)的metadata處理方法,可以自動交換信息,W3C宣稱,使用RDF配合數(shù)字簽名,將使網絡中存在"真實可信"的電子商務。 六.顯示 單獨用XML不能顯示頁面,我們使用格式化技術,比如CSS或者XSL,才能顯示XML標記創(chuàng)建的文檔。 我們在前面第一章講到XML是將數(shù)據和格式分離的。XML文檔本身不知道如何來顯示,必須有輔助文件來幫助實現(xiàn)。(XML取消了所有標識,包括font,color,p等風格樣式定義標識,因此XML全部是采用類似DHTML中CSS的方法來定義文檔風格樣式。),XML中用來設定顯示風格樣式的文件類型有: 1.XSL XSL全稱是Extensible Stylesheet Language(可擴展樣式語言), 是將來設計XML文檔顯示樣式的主要文件類型。它本身也是基于XML語言的。使用XSL,你可以靈活的設置文檔顯示樣式,文檔將自動適應任何瀏覽器和PDA(掌上電腦)。 XSL也可以將XML轉化為HTML,那樣,老的瀏覽器也可以瀏覽XML文檔了。 2.CSS CSS大家很熟悉了,全稱是Cascading Style Sheets(層疊樣式表),是目前用來在瀏覽器上顯示XML文檔的主要方法。 3.Behaviors Behaviors現(xiàn)在還沒有成為標準。它是微軟的IE瀏覽器特有的功能,用它可以對XML標識設定一些有趣動作。 七.DOM DOM全稱是document object model(文檔對象模型),DOM是用來干什么的呢?假設把你的文檔看成一個單獨的對象,DOM就是如何用HTML或者XML對這個對象進行操作和控制的標準。 面向對象的思想方法已經非常流行了,在編程語言(例如java,js)中,都運用面向對象的編程思想。在XML中,就是要將網頁也作為一個對象來操作和控制,我們可以建立自己的對象和模板。與對象進行交流,如何命令對象,就要用到API。API全稱Application Programming Interface,它是訪問和操作對象的規(guī)則。而DOM就是一種詳細描述HTML/XML文檔對象規(guī)則的API。它規(guī)定了HTML/XML文檔對象的命名協(xié)定,程序模型,溝通規(guī)則等。在XML文檔中,我們可以將每一個標識元素看作一個對象---它有自己的名稱和屬性。 XML創(chuàng)建了標識,而DOM的作用就是告訴script如何在瀏覽器窗口中操作和顯示這些標識 上面我們已經簡要的講述了一些XML的基本原理,我們來看看它們之間的關聯(lián)以及它們是如何工作的,先看這里一張圖: 此主題相關圖片如下: 1. 2.CSS儲存并控制元素的顯示樣式。例如:標題將被以18pt字體顯示 3.script腳本控制元素如何動作。例如:當一個title元素"out of stock",將被用紅色顯示。 4.DOM則為腳本和對象的交流提供一個公共平臺,并將結果顯示在瀏覽器窗口。 如果任何一個部分發(fā)生錯誤,都不會得到正確結果。 好了,看到這里,我們已經對XML是如何工作的有一個整體的大致的概念。通過這一章的學習,我們可能感覺到XML似乎更偏向數(shù)據處理,更方便程序員學習。實際情況也是這樣的,XML設計的目的就是用來方便的共享和交互數(shù)據的。下一章,我們將系統(tǒng)的了解關于XML的各種術語。歡迎您繼續(xù)瀏覽。 XML輕松學習手冊(3)XML的術語 第三章 XML的術語 提綱: 導言 一.XML文檔的有關術語 二.DTD的有關術語 導言 初學XML最令人頭疼的就是有一大堆新的術語概念要理解。由于XML本身也是一個嶄新的技術,正在不斷發(fā)展和變化,各組織和各大網絡公司(微軟,IBM,SUN等)都在不斷推出自己的見解和標準,因此新概念漫天飛就不足為奇了。而國內又缺乏權威的機構或組織來對這些術語正式定名,你所看見的有關XML的中文教材大部分是靠作者本身的理解翻譯過來的,有些是正確的,有些是錯誤的,更加妨礙了我們對這些概念的理解和學習。 你下面將要看到的關于XML術語的解釋,也是作者本身的理解和翻譯。阿捷是以W3C組織發(fā)布的XML1.0標準規(guī)范和相關的正式說明文檔為根據來講述。可以確保這些理解是基本正確的,至少不是錯誤的。你如果想進一步閱讀和了解,我在本文的最后部分列明了相關資源的出處和鏈接,你可以直接訪問。好,我們轉入正題: 一.XML文檔的有關術語 什么是XML文檔?知道 <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> </myfile> XML文檔包含三個部分: 1. 一個XML文檔聲明; 2. 一個關于文檔類型的定義; 3. 用XML標識創(chuàng)建的內容。 舉例說明: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> <filelist> <myfile> <title>QUICK START OF XML</title> <author>ajie</author> </myfile> ...... </filelist> 其中第一行<? 我們來了解XML文檔中有關的術語: 1.Element(元素): 元素在HTML我們已經有所了解,它是組成HTML文檔的最小單位,在XML中也一樣。一個元素由一個標識來定義,包括開始和結束標識以及其中的內容,就象這樣:<author>ajie</author> 唯一不同的就是:在HTML中,標識是固定的,而在XML中,標識需要你自己創(chuàng)建。 2.Tag(標識) 標識是用來定義元素的。在XML中,標識必須成對出現(xiàn),將數(shù)據包圍在中間。標識的名稱和元素的名稱是一樣的。例如這樣一個元素: <author>ajie</author> 其中<author>就是標識。 3.Attribute(屬性): 什么是屬性?看這段word</font>。其中color就是font的屬性之一。 屬性是對標識進一步的描述和說明,一個標識可以有多個屬性,例如font的屬性還有size。XML中的屬性與HTML中的屬性是一樣的,每個屬性都有它自己的名字和數(shù)值,屬性是標識的一部分。舉例: <author sex="female">ajie</author> XML中屬性也是自己定義的,我們建議你盡量不使用屬性,而將屬性改成子元素,例如上面的代碼可以改成這樣: <author>ajie <sex>female</sex> </author> 原因是屬性不易擴充和被程序操作。 4.Declaration(聲明) 在所有XML文檔的第一行都有一個XML聲明。這個聲明表示這個文檔是一個XML文檔,它遵循的是哪個XML版本的規(guī)范。一個XML的聲明語句就象這樣: <? 5.DTD(文件類型定義) DTD是用來定義XML文檔中元素,屬性以及元素之間關系的。 通過DTD文件可以檢測XML文檔的結構是否正確。但建立XML文檔并不一定需要DTD文件。關于DTD文件的詳細說明我們將在下面單獨列項。 6.Well-formed XML(良好格式的XML) 一個遵守 良好格式的文檔必須以一個XML聲明開始,例如: <? 其中你必須說明文檔遵守的 良好格式的XML文檔必須有一個根元素,就是緊接著聲明后面建立的第一個元素,其它元素都是這個根元素的子元素,屬于根元素一組。 良好格式的XML文檔的內容書寫時必須遵守XML語法。(有關XML語法我們將在下一章仔細講解) 7.Valid XML(有效的XML) 一個遵守 將XML文檔和它的DTD文件進行比較分析,看是否符合DTD規(guī)則的過程叫validation(確認)。這樣的過程通常我們是通過一個名為parser的軟件來處理的。 有效的XML文檔也必須以一個XML聲明開始,例如: <? 和上面例子不同的,在standalone(獨立)屬性中,這里設置的是"no",因為它必須和相應的DTD一起使用,DTD文件的定義方法如下: <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 二.DTD的有關術語 什么是DTD,我們上面已經簡略提到。DTD是一種保證XML文檔格式正確的有效方法,可以比較XML文檔和DTD文件來看文檔是否符合規(guī)范,元素和標簽使用是否正確。一個DTD文檔包含:元素的定義規(guī)則,元素間關系的定義規(guī)則,元素可使用的屬性,可使用的實體或符號規(guī)則。 DTD文件也是一個ASCII的文本文件,后綴名為.dtd。例如:myfile.dtd。 為什么要用DTD文件呢?我的理解是它滿足了網絡共享和數(shù)據交互,使用DTD最大的好處在于DTD文件的共享。(就是上文DTD說明語句中的PUBLIC屬性)。比如,兩個相同行業(yè)不同地區(qū)的人使用同一個DTD文件來作為文檔創(chuàng)建規(guī)范,那么他們的數(shù)據就很容易交換和共享。網上有其他人想補充數(shù)據,也只需要根據公用的DTD規(guī)范來建立文檔,就立刻可以加入。 目前,已經有數(shù)量眾多的寫好的DTD文件可以利用。針對不同的行業(yè)和應用,這些DTD文件已經建立了通用的元素和標簽規(guī)則。你不需要自己重新創(chuàng)建,只要在他們的基礎上加入你需要的新標識。 當然,如果愿意,你可以創(chuàng)建自己的DTD,它可能和你的文檔配合的更加完美。建立自己的DTD也是很簡單的一件事,一般只需要定義4-5個元素就可以了。 調用DTD文件的方法有兩種: 1.直接包含在XML文檔內的DTD 你只要在DOCTYPE聲明中插入一些特別的說明就可以了,象這樣: 我們有一個XML文檔: <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 我們在第一行后面插入下面代碼就可以: <!DOCTYPE myfile [ <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> <!ENTITY copyright "Copyright 2001, Ajie."> ]> 2.調用獨立的DTD文件 將DTD文檔存為.dtd的文件,然后在DOCTYPE聲明行中調用,例如,將下面的代碼存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 然后在XML文檔中調用,在第一行后插入: <!DOCTYPE myfile SYSTEM "myfile.dtd"> 我們可以看到DTD文檔和HTML中js的調用是差不多的,關于DTD文檔具體如何寫,我們將在下一章和XML文檔的語法一起介紹。 下面我們來了解DTD有關的術語: 1.Schema(規(guī)劃) schema是數(shù)據規(guī)則的描述。schema做兩件事: a.它定義元素數(shù)據類型和元素之間的關系; b.它定義元素所能包含的內容類型。 DTD就是關于XML文檔的一個schema。 2.Document Tree(文檔樹) "文檔樹"在前面第二章我們已經提到過,它是文檔元素分級結構的形象表示。一個文檔結構樹包含根元素,根元素是最頂級的元素,(就是緊接著XML聲明語句后的第一個元素)。看例子: <? <filelist> <myfile> <title>...</title> <author>...</author> </myfile> </filelist> 上面的例子分三級結構排列成"樹"狀,其中的<filelist>就是根元素。在XML和DTD文件中,第一個定義的都是根元素。 3.Parent Element(父元素)/Child Element(子元素) 父元素是指包含有其它元素的元素,被包含的元素稱為它的子元素??瓷厦娴?結構樹",其中<myfile>是父元素,<title>,<author>是它的子元素,而<myfile>又是<filelist>的子元素。象<title>這樣沒有包含任何子元素的最后一級元素我們也稱之為"頁元素"。 4.Parser(解析軟件) Parser是一種檢查XML文檔是否遵循DTD規(guī)范的工具軟件。 Parser能獨立使用,也可以成為編輯軟件或瀏覽器的一部分。在后面的相關資源列表里,我列出了當前比較流行的一些parsers。 好了,通過第三章的學習,我們已經了解了一些XML和DTD的基本術語,但是我們還不知道怎樣來寫這些文件,需要遵循什么樣的語法,在下一章,將重點介紹有關撰寫XML和DTD文檔的語法。請繼續(xù)瀏覽,謝謝! XML輕松學習手冊(4)XML語法 第四章 XML語法 提綱: 一.XML語法規(guī)則 二.元素的語法 三.注釋的語法 四.CDATA的語法 五.Namespaces的語法 六.entity的語法 七.DTD的語法 通過前面三章的學習,我們已經對什么是XML,它的實現(xiàn)原理以及相關的術語有所了解。接下來我們就開始學習XML的語法規(guī)范,動手寫自己的XML文檔。 一.XML語法規(guī)則 XML的文檔和HTML的原代碼類似,也是用標識來標識內容。創(chuàng)建XML文檔必須遵守下列重要規(guī)則: 規(guī)則1:必須有XML聲明語句 這一點我們在上一章學習時已經提到過。聲明是XML文檔的第一句,其格式如下: <? 聲明的作用是告訴瀏覽器或者其它處理程序:這個文檔是XML文檔。聲明語句中的version表示文檔遵守的XML規(guī)范的版本;standalone表示文檔是否附帶DTD文件,如果有,參數(shù)為no;encoding表示文檔所用的語言編碼,默認是UTF-8。 規(guī)則2:是否有DTD文件 如果文檔是一個"有效的 <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 規(guī)則3:注意你的大小寫 在XML文檔中,大小寫是有區(qū)別的。<P>和<p>是不同的標識。注意在寫元素時,前后標識大小寫要保持一樣。例如:<Author>ajie</Author>,寫成<Author>ajie</author>是錯誤的。 你最好養(yǎng)成一種習慣,或者全部大寫,或者全部小寫,或者大寫第一個字母。這樣可以減少因為大小寫不匹配產生的文檔錯誤。 規(guī)則4:給屬性值加引號 在HTML代碼里面,屬性值可以加引號,也可以不加。例如:<font color=red> 但是在XML中則規(guī)定,所有屬性值必須加引號(可以是單引號,也可以是雙引號),否則將被視為錯誤。 規(guī)則5:所有的標識必須有相應的結束標識 在HTML中,標識可能不是成對出現(xiàn)的,比?lt;br>。而在XML中規(guī)定,所有標識必須成對出現(xiàn),有一個開始標識,就必須有一個結束標識。否則將被視為錯誤。 規(guī)則6:所有的空標識也必須被關閉 空標識就是標識對之間沒有內容的標識。比如 ,<img>等標識。在XML中,規(guī)定所有的標識必須有結束標識,針對這樣的空標識,XML中處理的方法是在原標識最后加/,就可以了。例如: 應寫為<br />; <META name="keyXML, SGML, <IMG src= "cool.gif">應寫為<IMG src= "cool.gif" /> 第四章 XML語法 二.元素的語法 元素由一對標識以及其中的內容組成。就象這樣:ajie。元素的名稱和標識的名稱是一樣的。標識可以用屬性來進一步描述。 在XML中,沒有任何保留字,所以你可以隨心所欲的用任何詞語來作為元素名稱。但是也必須遵守下列規(guī)范: 1.名稱中可以包含字母、數(shù)字以及其它字母; 2.名稱不能以數(shù)字或"_" (下劃線)開頭; 3.名稱不能以字母 XML(或 XML 或 Xml ..)開頭 4.名稱中不能包含空格 5.名稱中間不能包含":"(冒號) 為了使元素更容易閱讀理解和操作,我們還有一些建議: 1.名稱中不要使用"."。因為在很多程序語言中,"."是作為對象的屬性,例如:font.color。同樣的原因"-"也最好不要用,必須使用的,以"_"代替; 2.名稱盡量簡短。 3.名稱的大小寫盡量采用同一標準。 4.名稱可以使用非英文字符,比如用中文。但是有些軟件可能不支持。(IE5目前是支持中文元素的。) 另外,補充一點關于屬性的說明。在word</font>將把word顯示為紅色。而在CSS或者XSL,我們在下面詳細講述。) 三.注釋的語法 注釋是為了便于閱讀和理解,在XML文檔添加的附加信息,將不會被程序解釋或則瀏覽器顯示。 注釋的語法如下: <!-- 這里是注釋信息 --> 可以看到,它和HTML中的注釋語法是一樣的,非常容易。養(yǎng)成良好的注釋習慣將使你的文檔更加便于維護,共享,看起來也更專業(yè)。 四.CDATA的語法 CDATA全稱character data,翻譯為字符數(shù)據。我們在寫 <![CDATA[這里放置需要顯示的字符]]> 例如: <![CDATA[<AUTHOR sex="female">ajie</AUTHOR>]]> 在頁面上顯示的內容將是"<AUTHOR sex="female">ajie</AUTHOR>" 第四章 XML語法 五.Namespaces的語法 Namespaces翻譯為名字空間。名字空間有什么作用呢?當我們在一個XML文檔中使用他人的或者多個DTD文件,就會出現(xiàn)這樣的矛盾:因為XML中標識都是自己創(chuàng)建的,在不同的DTD文件中,標識名可能相同但表示的含義不同,這就可能引起數(shù)據混亂。 比如在一個文檔<table>wood table</table>中<table>表示桌子, 而在另一個文檔<table>namelist</table>中<table>表示表格。如果我需要同時處理這兩個文檔,就會發(fā)生名字沖突。 了解決這個問題,我們引進了namespaces這個概念。namespaces通過給標識名稱加一個網址(URL)定位的方法來區(qū)別這些名稱相同的標識。 Namespaces同樣需要在XML文檔的開頭部分聲明,聲明的語法如下: <document 其中yourname是由你定義的namespaces的名稱,URL就是名字空間的網址。 假設上面的"桌子<table>"文檔來自http://www.zhuozi.com,我們就可以聲明為 <document http://www.zhuozi.com'> 然后在后面的標識中使用定義好的名字空間: <zhuozi:table>wood table</table> 這樣就將這兩個<table>區(qū)分開來。注意的是:設置URL并不是說這個標識真的要到那個網址去讀取,僅僅作為一種區(qū)別的標志而已。 六.entity的語法 entity翻譯為"實體"。它的作用類似 entity可以包含字符,文字等等,使用entity的好處在于:1.它可以減少差錯,文檔中多個相同的部分只需要輸入一遍就可以了。2.它提高維護效率。比如你有40個文檔都包含copyright的entity,如果需要修改這個copyright,不需要所有的文件都修改,只要改最初定義的entity語句就可以了。 XML定義了兩種類型的entity。一種是我們這里說的普通entity,在XML文檔中使用;另一種是參數(shù)entity,在DTD文件中使用。 entity的定義語法為: <!DOCTYPE filename [ <!ENTITY entity-name "entity-content" ] > 例如我要定義一段版權信息: <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved" ] > 如果我的版權信息內容和他人共享一個XML文件,也可以使用外部調用的方法,語法象這樣: <!DOCTYPE copyright [ <!ENTITY copyright SYSTEM "http://www.sample.com/copyright. ] > 定義好的entity在文檔中的引用語法為:&entity-name; 例如,上面定義的版權信息,調用時寫作?copyright; 完整的例子如下,你可以copy下來存為copyright.XML觀看實例: <? <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved"> ]> <myfile> <title>XML</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> ©right; </myfile> 第四章 XML語法 七.DTD的語法 DTD是"有效 1.設置元素 元素是XML文檔的基本組成部分。你要在DTD中定義一個元素,然后在XML文檔中使用。元素的定義語法為:<!ELEMENT DESCRIPTION (#PCDATA, DEFINITION)*> 說明: "<!ELEMENT" 是元素的聲明,說明你要定義的是一個元素; 聲明后面的"DESCRIPTION",是元素的名稱; "(#PCDATA, DEFINITION)*>"則是該元素的使用規(guī)則。規(guī)則定義了元素可以包含的內容以及相互的關系。下面的表格概要列出了元素的規(guī)則: 2.元素規(guī)則表: 此主題相關圖片如下: 另外,我們還可以為元素定義屬性,因為我們不推薦使用屬性,在這里就不詳細展開了。 最后,我們來總結一些前四章學習的內容,寫一個包含DTD,XML,以及Script的簡單實例,便于讀者理解: 1.將下面文件存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 2.然后建立XML文檔myfile.xml: <? <!DOCTYPE myfile SYSTEM "myfile.dtd"> <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 3.建立HTML文檔myfile.html <HTML> <head> <script language=" var nodes = XMLDoc.documentElement.childNodes; title.innerText = nodes.item(0).text; author.innerText = nodes.item(1).text; </script> <title>在HTML中調用XML數(shù)據</title> </head> <body bgcolor="#FFFFFF"> <b>標題: </b> <span id="title"></span><br> <b>作者: </b> <span id="author"></span><br> </body> </HTML> 4.用IE5.0以上瀏覽器打開myfile.HTML就可以看到效果了。 XML輕松學習手冊(5)XML實例解析 第五章:XML實例解析 提綱: 一:實例效果 二:實例解析 1.定義新標識。 2.建立XML文檔。 3.建立相應的HTML文件。 XML在不同領域有著廣泛的應用,比如在科技領域的MathML,無線通信應用的WML,在網絡圖象方面的SVG等等,我們這里側重討論XML在web上的應用。XML在web上應用主要是利用其強大的數(shù)據操作能力。一般用XML配合JavaScript和ASP等服務器端程序,可以實現(xiàn)網絡上幾乎所有的應用需求。 考慮講解方便,我們在下面介紹一個簡單的實例,不包含服務器端程序。目的在于讓您對XML的數(shù)據操作能力有一個感性的認識。 好,我們首先[ 點擊這里 ]來看實例的效果。(請用IE5.0以上版本瀏覽器打開) 這是一個簡單的CD唱片數(shù)據檢索功能。你通過點擊"上一張","下一張"可以看到單張CD的有關信息。這樣的效果我們原來用兩種方法可以實現(xiàn): 1.利用DHTML,將數(shù)據隱藏在不同的層中,通過鼠標事件依次顯示; 2.利用后臺程序(如ASP,CGI,PHP,JSP等),調用服務器端的數(shù)據。 但是在這個實例中,我們打開頁面原代碼可以看到,其中沒有用DHTML的DIV,也沒有表單的action,它完全是用XML來實現(xiàn)的。下面我們來分析它的制作過程: 第一步:定義新標識。 根據實際的CD數(shù)據,首先新建一個名為<CD>的標識;其次建立它相關的數(shù)據標識,分別是:CD名稱<Title>,演唱者<Artist>,出版年代<Year>,國家<Country>,發(fā)行公司<Company>和價格<Price>;最后還要建立一個名為目錄<CATALOG>的標識。為什么要再建立一個<CATALOG>標識呢?因為在XML文檔中規(guī)定,必須且只能有一個根元素(標識),我們有多個CD數(shù)據,這些數(shù)據是并列的關系,所以需要為這些并列的元素建立一個根元素。 以上元素的定義和關系都完全符合XML標準,不需要特別的DTD文件來定義,所以可以省略DTD定義。如果我們想使用DTD來定義,以上過程可以表示為: <!ELEMENT CATALOG (CD)*> <!ELEMENT CD (Title,Artist,Year,Country,Company,Price)> <!ELEMENT Title (#PCDATA)> <!ELEMENT Artist (#PCDATA)> <!ELEMENT Year (#PCDATA)> <!ELEMENT Country (#PCDATA)> <!ELEMENT Company (#PCDATA)> <!ELEMENT Price (#PCDATA)> 這段代碼表示:元素CATALOG包含多個CD子元素,而子元素CD又依次包含Title, Artist, Year, Country, Company, Price 六個子元素,它們的內容都定義為文本(字符,數(shù)字,文本)。(注:具體的語法說明可以看上一章關于DTD的介紹) 第二步:建立XML文檔。 <? <CATALOG> <CD> <TITLE>Empire Burlesque</TITLE> <ARTIST>Bob Dylan</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>Columbia</COMPANY> <PRICE>10.90</PRICE> <YEAR>1985</YEAR> </CD> <CD> <TITLE>Hide your heart</TITLE> <ARTIST>Bonnie Tylor</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>CBS Records</COMPANY> <PRICE>9.90</PRICE> <YEAR>1988</YEAR> </CD> <CD> <TITLE>Greatest Hits</TITLE> <ARTIST>Dolly Parton</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>RCA</COMPANY> <PRICE>9.90</PRICE> <YEAR>1982</YEAR> </CD> <CD> <TITLE>Still got the blues</TITLE> <ARTIST>Gary More</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>Virgin redords</COMPANY> <PRICE>10.20</PRICE> <YEAR>1990</YEAR> </CD> <CD> <TITLE>Eros</TITLE> <ARTIST>Eros Ramazzotti</ARTIST> <COUNTRY>EU</COUNTRY> <COMPANY>BMG</COMPANY> <PRICE>9.90</PRICE> <YEAR>1997</YEAR> </CD> </CATALOG> 上面代碼首先用<? <CATALOG> <CD> ...... </CD> <CD> ...... </CD> </CATALOG> 一共定義了5組數(shù)據。我們將上面的代碼存為cd.XML文件,以備調用。 第三步:建立相應的HTML文件。 1.導入XML數(shù)據。 我們知道,目前流行的瀏覽器中,暫時只有微軟的IE5.0以上版本瀏覽器支持XML。IE是通過在 CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> 定義一個object,ID名為XMLdso。然后在head區(qū)用js引入xml數(shù)據: <script for="window" event="onload"> </script> 2.捆綁數(shù)據。 然后將用<SPAN>標識來將XML數(shù)據綁定在表格中。其中ID,DATASRC,DTATFLD都是<SPAN>的屬性。代碼如下: <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> 3.動作操作。 最后,為數(shù)據提供瀏覽按鈕: <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> 并利用js來完成兩個鼠標點擊功能:movenext()和moveprevious()。在head區(qū)加入如下代碼: <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> 好,我們先看HTML文件的全部原代碼: <HTML> <head> <script for="window" event="onload"> </script> <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> <TITLE>CD Navigate</TITLE> </head> <body> <p> <object WIDTH="0" HEIGHT="0" CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> <p> <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> </p> </body> </HTML> 將以上代碼存為cd.htm文件,于第二步的cd.XML文件放在一起。打開cd.htm文件,你就看見和上面實例一樣的效果了。 好,到今天為止,我們已經學習了關于XML的不少知識,我們來總結一下前面五個章節(jié),分別是XML快速入門,XML的概念原理,XML的術語,XML的語法和本章的實例解析。到這里,教程部分就結束了。在寫作過程中,阿捷盡最大努力將有關XML概念講得通俗易懂,盡量把自己的理解告訴給大家,但因為本人學習XML時間也不長,對整個XML的技術把握還不夠系統(tǒng)和深入,所以難免有疏漏的地方,請大家指正和諒解,謝謝! posted on 2009-02-15 15:45 YXY 閱讀(187) 評論(0) 編輯 收藏
而XML就是SGML的簡化版,只不過省略了其中復雜和不常用的部分。(哦,明白了!是 到這里,你應該有點明白了:XML是用來創(chuàng)建定義類似HTML的標記語言,然后再用這個標記語言來顯示信息。 三. 使用XML有什么好處? 有了HTML,為什么還需要用XML? 因為現(xiàn)在網絡應用越來越廣泛,僅僅靠XML作為下一代web運用的數(shù)據傳輸和交互的工具。 使用XML有什么好處?來看w3c組織(XML標準制定者)的說明: 1.XML可以廣泛的運用于web的任何地方; 2.XML可以滿足網絡應用的需求; 3.使用XML將使編程更加簡單; 4.XML便于學習和創(chuàng)建; 5.XML代碼將清晰和便于閱讀理解; 還是抽象了些。讓我們在后面的實例教程中慢滿體會XML的強大優(yōu)勢吧! 四. XML很難學嗎? 如果你有興趣學習XML,不禁會問:XML難嗎?學習XML需要什么樣的基礎? XML非常簡單,學習容易。如果你熟悉HTML,你會發(fā)現(xiàn)它的文檔和HTML非常相似,看同樣的示例文檔(例1): ? <myfile> <title>XML Quick Start</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> </myfile> 第一行是一個XML聲明,表示文檔遵循的是XML的1.0 版的規(guī)范。 第二行定義了文檔里面的第一個元素(element),也稱為根元素: < myfile>。這個就類似HTML里的< HTML>開頭標記。注意,這個名稱是自己隨便定義的。 再下面定義了四個子元素:title,author,email,和date。分別說明文章的標題,作者,郵箱和日期。當然,你可以用中文來定義這些標簽,看上去更便于理解: <? <文章> <標題>XML輕松學習手冊</標題> <作者>ajie</作者> <信箱>ajie@aolhoo.com</信箱> <日期>20010115</日期> </文章> 這就是XML的文檔,任何掌握HTML的網友都可以直接寫出這樣簡單的XML文檔。 另外,學習XML還必須掌握一種頁面腳本語言,常見的就是JavaScript和VB script。因為XML數(shù)據是使用script實現(xiàn)HTML中調用和交互的。我們看一個最簡單的例子(例2): 1.將下面代碼存為myfile.htm <HTML> <head> <script language=" var nodes = XMLDoc.documentElement.childNodes; title.innerText = nodesitem(0).text; author.innerText = nodes.item(1).text; email.innerText = nodes.item(2).text; date.innerText = nodes.item(3).text; </script> <title>在HTML中調用XML數(shù)據</title> </head> <body bgcolor="#FFFFFF"> <b>標題: </b> <span id="title"> </span> <b>作者: </b>> <span id="author"></span> <b>信箱: </b> <span id="email"></span> <b>日期:</b> <span id="date"></span> </body> </HTML> 2.將下面代碼存為myfile.XML <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> </myfile> 3.將它們放在同一個目錄下,用IE5以上版本瀏覽器打開,可以看到效果。 學習并掌握一種script,你將真正了解到XML無比的強大的功能。 五. XML和HTML的區(qū)別 XML和HTML都來自于SGML,它們都含有標記,有著相似的語法,HTML和XML的最大區(qū)別在于:HTML是一個定型的標記語言,它用固有的標記來描述,顯示網頁內容。比如< H1>表示首行標題,有固定的尺寸。相對的,XML則沒有固定的標記,XML不能描述網頁具體的外觀,內容,它只是描述內容的數(shù)據形式和結構。 這是一個質的區(qū)別:網頁將數(shù)據和顯示混在一起,而XML則將數(shù)據和顯示分開來。 我們看上面的例子,在myfile.htm中,我們只關心頁面的顯示方式,我們可以設計不同的界面,用不同的方式來排版頁面,但數(shù)據是儲存在myfile.XML中,不需要任何改變。 (如果你是程序員,你會驚訝的發(fā)現(xiàn),這與模塊化面向對象編程的思想極其相似!其實網頁何嘗不是一種程序呢?) 正是這種區(qū)別使得XML在網絡應用和信息共享上方便,高效,可擴展。所以我們相信,XML做為一種先進的數(shù)據處理方法,將使網絡跨越到一個新的境界。 六. XML的嚴格格式 吸取HTML松散格式帶來的經驗教訓, 我們先看HTML的一些語句,這些語句在HTML中隨處可見: 1. sample 2.< b>< i>sample< /b>< /i> 3.< td>sample< /TD> 4.< font color=red>samplar< /font> 在XML文檔中,上述幾種語句的語法都是錯誤的。因為: 1.所有的標記都必須要有一個相應的結束標記; 2.所有的XML標記都必須合理嵌套; 3.所有XML標記都區(qū)分大小寫; 4.所有標記的屬性必須用""括起來; 所以上列語句在XML中正確的寫法是 1. sample 2.< b>< i>sample< /i>< /b> 3.< td>sample< /td> 4.< font color="red">samplar< /font> 另外,XML標記必須遵循下面的命名規(guī)則: 1.名字中可以包含字母、數(shù)字以及其它字母; 2.名字不能以數(shù)字或"_" (下劃線) 開頭; 3.名字不能以字母 XML (或 XML 或 Xml ..) 開頭; 4.名字中不能包含空格。 在XML文檔中任何的差錯,都會得到同一個結果:網頁不能被顯示。各瀏覽器開發(fā)商已經達成協(xié)議,對XML實行嚴格而挑剔的解析,任何細小的錯誤都會被報告。你可以將上面的myfile.xml修改一下,比如將< email>改為< Email>,然后用IE5直接打開myfile.xml,會得到一個出錯信息頁面: <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> <Email>ajie@aolhoo.com</email> <date>20010115</date> </myfile> 七. 關于XML的更多 好了,到現(xiàn)在你已經知道: 1.什么是XML; 2.XML,HTML,SGML之間的關系和區(qū)別; 3.XML的簡單應用。 恭喜你!你已經不再對XML一無所知,并且已經走在了網絡技術的前沿。整個學習過程好象并不很難哦:) 如果你對XML有更多的興趣,希望進一步了解XML的詳細資料和其它的實際運用技術,歡迎繼續(xù)瀏覽我們的下一章:XML的概念。 XML輕松學習手冊(2)XML概念 第二章 XML概念 導言 經過第一章的快速入門學習,你已經知道了 一. 擴展性 二. 標識 三. 語言 四. 結構化 五. Meta數(shù)據 六. 顯示 七. DOM 一.擴展性---使用XML,你可以為你的文檔建立自己的標記(tags)。 在HTML里,有許多固定的標記,我們必須記住然后使用它們,你不能使用HTML規(guī)范里沒有的標記。而在XML中,你能建立任何你需要的標記。你可以充分發(fā)揮你的想象力,給你的文檔起一些好記的標記名稱。比如,你的文檔里包含一些游戲的攻略,你可以建立一個名為<game>的標記,然后在<game>下再根據游戲類別建立<RPG>,<SLG>等標記。只要清晰,易于理解你可以建立任何數(shù)量的標記。 一開始你也許會不適應,因為我們在學習HTML時,有固定的標記可以直接學習和使用;(很多人包括我自己都是邊分析別人的代碼和標識,邊建立自己的網頁),而XML卻沒有任何標記可以學,也很少有文檔的標記是一模一樣的。我們怎么辦?呵呵,沒有就自己創(chuàng)建呀。一旦你真正開始寫XML文檔,你會發(fā)現(xiàn)隨心所欲的創(chuàng)造新標記也是一份很有趣的事。你可以建立有自己特色的標記,甚至建立你自己的HTML語言。 擴展性使你有更多的選擇和強大的能力,但同時也產生一個問題就是你必須學會規(guī)劃。你自己要理解自己的文檔,知道它由哪幾部分組成,相互之間的關系和如何識別它們。 關于建立標識還需要說明一點,標識是描述數(shù)據的類型或特性,比如<width>,年齡<age>,姓名<name>等,而不是數(shù)據的內容,比如:<10pxl>,<18>,<張三>,這些都是無用的標記。如果你學過數(shù)據庫,你可以這樣理解,標識就是一種字段名。 二.標識---使用XML你可以識別文檔中的元素。 不論你是HTML,還是XML,標識的本質在于便于理解,如果沒有標識,你的文檔在計算機看來只是一個很長的字符串,每個字看起來都一樣,沒有重點之分。 通過標識,你的文檔才便于閱讀和理解,你可以劃分段落,列明標題。XML中,你更可以利用其擴展性 來為文檔建立更合適的標識。 不過,有一點要提醒大家注意:標識僅僅是用來識別信息,它本身并不傳達信息。例如這樣的HTML代碼: <b>frist step<b> 這里<b>表示粗體,只用來說明是用粗體來顯示"frist step"字符,<b>本身并不包含任何實際的信息,在頁面上你看不到<b>,真正傳達信息的是"frist step "。 三.語言---使用XML你要遵循特定的語法來標識你的文檔。 在計算機領域,語言常常表示一?quot;程序語言",用來編程實現(xiàn)一些功能和應用,但不是所有的"語言"都是用來編程的,XML就只是一種用來定義標識和描述信息的語言。 下面我們來深入了解一下XML應用的其本原理,可能會很枯燥,但是對于整體的理解很重要,你可以先快速過一遍,心里有一個模糊的概念,具體精髓則需要在實踐中慢慢領會。 四.結構化---XML促使文檔結構化,所有的信息按某種關系排列。 "結構化"聽起來太抽象了,我們這樣理解,結構化就是為你的文檔建立一個框架,就象寫文章先寫一個提綱。結構化使你的文檔看起來不會雜亂無章,每一部分都緊密聯(lián)系,形成一個整體。 結構化有兩個原則: 1.每一部分(每一個元素)都和其他元素有關聯(lián)。關聯(lián)的級數(shù)就形成了結構。 2.標識本身的含義與它描述的信息相分離。 我們來看一個簡單的例子幫助理解: <? <myfile> <title>XML輕松學習手冊</title> <chapter>XML快速入門 <para>什么是XML</para> <para>使用XML的好處</para> </chapter> <chapter>XML的概念 <para>擴展性</para> <para>標識</para> </chapter> </myfile> 這是本文的XML描述文檔,可以看到標識分三級關聯(lián),非常清晰: <myfile> <chapter> <para> ... </para> </chapter> </myfile> 上面這樣的文檔結構,我們又稱之為"文檔樹",主干是父元素,如<myfile>,分支和頁是子元素,如<chapter>和<para>。 五.Meta數(shù)據(Metadata)---專業(yè)的XML使用者會使用meta數(shù)據來工作。 在HTML中我們知道可以使用meta標識來定義網頁的關鍵字,簡介等,這些標識不會顯示在網頁中,但可以被搜索引擎搜索到,并影響搜索結果的排列順序。 XML對這一原理進行了深化和擴展,用XML,你可以描述你的信息在哪里,你可以通過meta來驗證信息,執(zhí)行搜索,強制顯示,或者處理其他的數(shù)據。 下面是一些XML metadata在實際應用中的用途: 1.可以驗證數(shù)字簽名,使在線商務的提交動作(submission)有效。 2.可以被方便的建立索引和進行更有效搜索。 3.可以在不同語言之間傳輸數(shù)據。 W3C組織正在研究一種名為RDF(Resource Description Framework)的metadata處理方法,可以自動交換信息,W3C宣稱,使用RDF配合數(shù)字簽名,將使網絡中存在"真實可信"的電子商務。 六.顯示 單獨用XML不能顯示頁面,我們使用格式化技術,比如CSS或者XSL,才能顯示XML標記創(chuàng)建的文檔。 我們在前面第一章講到XML是將數(shù)據和格式分離的。XML文檔本身不知道如何來顯示,必須有輔助文件來幫助實現(xiàn)。(XML取消了所有標識,包括font,color,p等風格樣式定義標識,因此XML全部是采用類似DHTML中CSS的方法來定義文檔風格樣式。),XML中用來設定顯示風格樣式的文件類型有: 1.XSL XSL全稱是Extensible Stylesheet Language(可擴展樣式語言), 是將來設計XML文檔顯示樣式的主要文件類型。它本身也是基于XML語言的。使用XSL,你可以靈活的設置文檔顯示樣式,文檔將自動適應任何瀏覽器和PDA(掌上電腦)。 XSL也可以將XML轉化為HTML,那樣,老的瀏覽器也可以瀏覽XML文檔了。 2.CSS CSS大家很熟悉了,全稱是Cascading Style Sheets(層疊樣式表),是目前用來在瀏覽器上顯示XML文檔的主要方法。 3.Behaviors Behaviors現(xiàn)在還沒有成為標準。它是微軟的IE瀏覽器特有的功能,用它可以對XML標識設定一些有趣動作。 七.DOM DOM全稱是document object model(文檔對象模型),DOM是用來干什么的呢?假設把你的文檔看成一個單獨的對象,DOM就是如何用HTML或者XML對這個對象進行操作和控制的標準。 面向對象的思想方法已經非常流行了,在編程語言(例如java,js)中,都運用面向對象的編程思想。在XML中,就是要將網頁也作為一個對象來操作和控制,我們可以建立自己的對象和模板。與對象進行交流,如何命令對象,就要用到API。API全稱Application Programming Interface,它是訪問和操作對象的規(guī)則。而DOM就是一種詳細描述HTML/XML文檔對象規(guī)則的API。它規(guī)定了HTML/XML文檔對象的命名協(xié)定,程序模型,溝通規(guī)則等。在XML文檔中,我們可以將每一個標識元素看作一個對象---它有自己的名稱和屬性。 XML創(chuàng)建了標識,而DOM的作用就是告訴script如何在瀏覽器窗口中操作和顯示這些標識 上面我們已經簡要的講述了一些XML的基本原理,我們來看看它們之間的關聯(lián)以及它們是如何工作的,先看這里一張圖: 此主題相關圖片如下: 1. 2.CSS儲存并控制元素的顯示樣式。例如:標題將被以18pt字體顯示 3.script腳本控制元素如何動作。例如:當一個title元素"out of stock",將被用紅色顯示。 4.DOM則為腳本和對象的交流提供一個公共平臺,并將結果顯示在瀏覽器窗口。 如果任何一個部分發(fā)生錯誤,都不會得到正確結果。 好了,看到這里,我們已經對XML是如何工作的有一個整體的大致的概念。通過這一章的學習,我們可能感覺到XML似乎更偏向數(shù)據處理,更方便程序員學習。實際情況也是這樣的,XML設計的目的就是用來方便的共享和交互數(shù)據的。下一章,我們將系統(tǒng)的了解關于XML的各種術語。歡迎您繼續(xù)瀏覽。 XML輕松學習手冊(3)XML的術語 第三章 XML的術語 提綱: 導言 一.XML文檔的有關術語 二.DTD的有關術語 導言 初學XML最令人頭疼的就是有一大堆新的術語概念要理解。由于XML本身也是一個嶄新的技術,正在不斷發(fā)展和變化,各組織和各大網絡公司(微軟,IBM,SUN等)都在不斷推出自己的見解和標準,因此新概念漫天飛就不足為奇了。而國內又缺乏權威的機構或組織來對這些術語正式定名,你所看見的有關XML的中文教材大部分是靠作者本身的理解翻譯過來的,有些是正確的,有些是錯誤的,更加妨礙了我們對這些概念的理解和學習。 你下面將要看到的關于XML術語的解釋,也是作者本身的理解和翻譯。阿捷是以W3C組織發(fā)布的XML1.0標準規(guī)范和相關的正式說明文檔為根據來講述。可以確保這些理解是基本正確的,至少不是錯誤的。你如果想進一步閱讀和了解,我在本文的最后部分列明了相關資源的出處和鏈接,你可以直接訪問。好,我們轉入正題: 一.XML文檔的有關術語 什么是XML文檔?知道 <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> </myfile> XML文檔包含三個部分: 1. 一個XML文檔聲明; 2. 一個關于文檔類型的定義; 3. 用XML標識創(chuàng)建的內容。 舉例說明: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> <filelist> <myfile> <title>QUICK START OF XML</title> <author>ajie</author> </myfile> ...... </filelist> 其中第一行<? 我們來了解XML文檔中有關的術語: 1.Element(元素): 元素在HTML我們已經有所了解,它是組成HTML文檔的最小單位,在XML中也一樣。一個元素由一個標識來定義,包括開始和結束標識以及其中的內容,就象這樣:<author>ajie</author> 唯一不同的就是:在HTML中,標識是固定的,而在XML中,標識需要你自己創(chuàng)建。 2.Tag(標識) 標識是用來定義元素的。在XML中,標識必須成對出現(xiàn),將數(shù)據包圍在中間。標識的名稱和元素的名稱是一樣的。例如這樣一個元素: <author>ajie</author> 其中<author>就是標識。 3.Attribute(屬性): 什么是屬性?看這段word</font>。其中color就是font的屬性之一。 屬性是對標識進一步的描述和說明,一個標識可以有多個屬性,例如font的屬性還有size。XML中的屬性與HTML中的屬性是一樣的,每個屬性都有它自己的名字和數(shù)值,屬性是標識的一部分。舉例: <author sex="female">ajie</author> XML中屬性也是自己定義的,我們建議你盡量不使用屬性,而將屬性改成子元素,例如上面的代碼可以改成這樣: <author>ajie <sex>female</sex> </author> 原因是屬性不易擴充和被程序操作。 4.Declaration(聲明) 在所有XML文檔的第一行都有一個XML聲明。這個聲明表示這個文檔是一個XML文檔,它遵循的是哪個XML版本的規(guī)范。一個XML的聲明語句就象這樣: <? 5.DTD(文件類型定義) DTD是用來定義XML文檔中元素,屬性以及元素之間關系的。 通過DTD文件可以檢測XML文檔的結構是否正確。但建立XML文檔并不一定需要DTD文件。關于DTD文件的詳細說明我們將在下面單獨列項。 6.Well-formed XML(良好格式的XML) 一個遵守 良好格式的文檔必須以一個XML聲明開始,例如: <? 其中你必須說明文檔遵守的 良好格式的XML文檔必須有一個根元素,就是緊接著聲明后面建立的第一個元素,其它元素都是這個根元素的子元素,屬于根元素一組。 良好格式的XML文檔的內容書寫時必須遵守XML語法。(有關XML語法我們將在下一章仔細講解) 7.Valid XML(有效的XML) 一個遵守 將XML文檔和它的DTD文件進行比較分析,看是否符合DTD規(guī)則的過程叫validation(確認)。這樣的過程通常我們是通過一個名為parser的軟件來處理的。 有效的XML文檔也必須以一個XML聲明開始,例如: <? 和上面例子不同的,在standalone(獨立)屬性中,這里設置的是"no",因為它必須和相應的DTD一起使用,DTD文件的定義方法如下: <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 二.DTD的有關術語 什么是DTD,我們上面已經簡略提到。DTD是一種保證XML文檔格式正確的有效方法,可以比較XML文檔和DTD文件來看文檔是否符合規(guī)范,元素和標簽使用是否正確。一個DTD文檔包含:元素的定義規(guī)則,元素間關系的定義規(guī)則,元素可使用的屬性,可使用的實體或符號規(guī)則。 DTD文件也是一個ASCII的文本文件,后綴名為.dtd。例如:myfile.dtd。 為什么要用DTD文件呢?我的理解是它滿足了網絡共享和數(shù)據交互,使用DTD最大的好處在于DTD文件的共享。(就是上文DTD說明語句中的PUBLIC屬性)。比如,兩個相同行業(yè)不同地區(qū)的人使用同一個DTD文件來作為文檔創(chuàng)建規(guī)范,那么他們的數(shù)據就很容易交換和共享。網上有其他人想補充數(shù)據,也只需要根據公用的DTD規(guī)范來建立文檔,就立刻可以加入。 目前,已經有數(shù)量眾多的寫好的DTD文件可以利用。針對不同的行業(yè)和應用,這些DTD文件已經建立了通用的元素和標簽規(guī)則。你不需要自己重新創(chuàng)建,只要在他們的基礎上加入你需要的新標識。 當然,如果愿意,你可以創(chuàng)建自己的DTD,它可能和你的文檔配合的更加完美。建立自己的DTD也是很簡單的一件事,一般只需要定義4-5個元素就可以了。 調用DTD文件的方法有兩種: 1.直接包含在XML文檔內的DTD 你只要在DOCTYPE聲明中插入一些特別的說明就可以了,象這樣: 我們有一個XML文檔: <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 我們在第一行后面插入下面代碼就可以: <!DOCTYPE myfile [ <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> <!ENTITY copyright "Copyright 2001, Ajie."> ]> 2.調用獨立的DTD文件 將DTD文檔存為.dtd的文件,然后在DOCTYPE聲明行中調用,例如,將下面的代碼存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 然后在XML文檔中調用,在第一行后插入: <!DOCTYPE myfile SYSTEM "myfile.dtd"> 我們可以看到DTD文檔和HTML中js的調用是差不多的,關于DTD文檔具體如何寫,我們將在下一章和XML文檔的語法一起介紹。 下面我們來了解DTD有關的術語: 1.Schema(規(guī)劃) schema是數(shù)據規(guī)則的描述。schema做兩件事: a.它定義元素數(shù)據類型和元素之間的關系; b.它定義元素所能包含的內容類型。 DTD就是關于XML文檔的一個schema。 2.Document Tree(文檔樹) "文檔樹"在前面第二章我們已經提到過,它是文檔元素分級結構的形象表示。一個文檔結構樹包含根元素,根元素是最頂級的元素,(就是緊接著XML聲明語句后的第一個元素)。看例子: <? <filelist> <myfile> <title>...</title> <author>...</author> </myfile> </filelist> 上面的例子分三級結構排列成"樹"狀,其中的<filelist>就是根元素。在XML和DTD文件中,第一個定義的都是根元素。 3.Parent Element(父元素)/Child Element(子元素) 父元素是指包含有其它元素的元素,被包含的元素稱為它的子元素??瓷厦娴?結構樹",其中<myfile>是父元素,<title>,<author>是它的子元素,而<myfile>又是<filelist>的子元素。象<title>這樣沒有包含任何子元素的最后一級元素我們也稱之為"頁元素"。 4.Parser(解析軟件) Parser是一種檢查XML文檔是否遵循DTD規(guī)范的工具軟件。 Parser能獨立使用,也可以成為編輯軟件或瀏覽器的一部分。在后面的相關資源列表里,我列出了當前比較流行的一些parsers。 好了,通過第三章的學習,我們已經了解了一些XML和DTD的基本術語,但是我們還不知道怎樣來寫這些文件,需要遵循什么樣的語法,在下一章,將重點介紹有關撰寫XML和DTD文檔的語法。請繼續(xù)瀏覽,謝謝! XML輕松學習手冊(4)XML語法 第四章 XML語法 提綱: 一.XML語法規(guī)則 二.元素的語法 三.注釋的語法 四.CDATA的語法 五.Namespaces的語法 六.entity的語法 七.DTD的語法 通過前面三章的學習,我們已經對什么是XML,它的實現(xiàn)原理以及相關的術語有所了解。接下來我們就開始學習XML的語法規(guī)范,動手寫自己的XML文檔。 一.XML語法規(guī)則 XML的文檔和HTML的原代碼類似,也是用標識來標識內容。創(chuàng)建XML文檔必須遵守下列重要規(guī)則: 規(guī)則1:必須有XML聲明語句 這一點我們在上一章學習時已經提到過。聲明是XML文檔的第一句,其格式如下: <? 聲明的作用是告訴瀏覽器或者其它處理程序:這個文檔是XML文檔。聲明語句中的version表示文檔遵守的XML規(guī)范的版本;standalone表示文檔是否附帶DTD文件,如果有,參數(shù)為no;encoding表示文檔所用的語言編碼,默認是UTF-8。 規(guī)則2:是否有DTD文件 如果文檔是一個"有效的 <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 規(guī)則3:注意你的大小寫 在XML文檔中,大小寫是有區(qū)別的。<P>和<p>是不同的標識。注意在寫元素時,前后標識大小寫要保持一樣。例如:<Author>ajie</Author>,寫成<Author>ajie</author>是錯誤的。 你最好養(yǎng)成一種習慣,或者全部大寫,或者全部小寫,或者大寫第一個字母。這樣可以減少因為大小寫不匹配產生的文檔錯誤。 規(guī)則4:給屬性值加引號 在HTML代碼里面,屬性值可以加引號,也可以不加。例如:<font color=red> 但是在XML中則規(guī)定,所有屬性值必須加引號(可以是單引號,也可以是雙引號),否則將被視為錯誤。 規(guī)則5:所有的標識必須有相應的結束標識 在HTML中,標識可能不是成對出現(xiàn)的,比?lt;br>。而在XML中規(guī)定,所有標識必須成對出現(xiàn),有一個開始標識,就必須有一個結束標識。否則將被視為錯誤。 規(guī)則6:所有的空標識也必須被關閉 空標識就是標識對之間沒有內容的標識。比如 ,<img>等標識。在XML中,規(guī)定所有的標識必須有結束標識,針對這樣的空標識,XML中處理的方法是在原標識最后加/,就可以了。例如: 應寫為<br />; <META name="keyXML, SGML, <IMG src= "cool.gif">應寫為<IMG src= "cool.gif" /> 第四章 XML語法 二.元素的語法 元素由一對標識以及其中的內容組成。就象這樣:ajie。元素的名稱和標識的名稱是一樣的。標識可以用屬性來進一步描述。 在XML中,沒有任何保留字,所以你可以隨心所欲的用任何詞語來作為元素名稱。但是也必須遵守下列規(guī)范: 1.名稱中可以包含字母、數(shù)字以及其它字母; 2.名稱不能以數(shù)字或"_" (下劃線)開頭; 3.名稱不能以字母 XML(或 XML 或 Xml ..)開頭 4.名稱中不能包含空格 5.名稱中間不能包含":"(冒號) 為了使元素更容易閱讀理解和操作,我們還有一些建議: 1.名稱中不要使用"."。因為在很多程序語言中,"."是作為對象的屬性,例如:font.color。同樣的原因"-"也最好不要用,必須使用的,以"_"代替; 2.名稱盡量簡短。 3.名稱的大小寫盡量采用同一標準。 4.名稱可以使用非英文字符,比如用中文。但是有些軟件可能不支持。(IE5目前是支持中文元素的。) 另外,補充一點關于屬性的說明。在word</font>將把word顯示為紅色。而在CSS或者XSL,我們在下面詳細講述。) 三.注釋的語法 注釋是為了便于閱讀和理解,在XML文檔添加的附加信息,將不會被程序解釋或則瀏覽器顯示。 注釋的語法如下: <!-- 這里是注釋信息 --> 可以看到,它和HTML中的注釋語法是一樣的,非常容易。養(yǎng)成良好的注釋習慣將使你的文檔更加便于維護,共享,看起來也更專業(yè)。 四.CDATA的語法 CDATA全稱character data,翻譯為字符數(shù)據。我們在寫 <![CDATA[這里放置需要顯示的字符]]> 例如: <![CDATA[<AUTHOR sex="female">ajie</AUTHOR>]]> 在頁面上顯示的內容將是"<AUTHOR sex="female">ajie</AUTHOR>" 第四章 XML語法 五.Namespaces的語法 Namespaces翻譯為名字空間。名字空間有什么作用呢?當我們在一個XML文檔中使用他人的或者多個DTD文件,就會出現(xiàn)這樣的矛盾:因為XML中標識都是自己創(chuàng)建的,在不同的DTD文件中,標識名可能相同但表示的含義不同,這就可能引起數(shù)據混亂。 比如在一個文檔<table>wood table</table>中<table>表示桌子, 而在另一個文檔<table>namelist</table>中<table>表示表格。如果我需要同時處理這兩個文檔,就會發(fā)生名字沖突。 了解決這個問題,我們引進了namespaces這個概念。namespaces通過給標識名稱加一個網址(URL)定位的方法來區(qū)別這些名稱相同的標識。 Namespaces同樣需要在XML文檔的開頭部分聲明,聲明的語法如下: <document 其中yourname是由你定義的namespaces的名稱,URL就是名字空間的網址。 假設上面的"桌子<table>"文檔來自http://www.zhuozi.com,我們就可以聲明為 <document http://www.zhuozi.com'> 然后在后面的標識中使用定義好的名字空間: <zhuozi:table>wood table</table> 這樣就將這兩個<table>區(qū)分開來。注意的是:設置URL并不是說這個標識真的要到那個網址去讀取,僅僅作為一種區(qū)別的標志而已。 六.entity的語法 entity翻譯為"實體"。它的作用類似 entity可以包含字符,文字等等,使用entity的好處在于:1.它可以減少差錯,文檔中多個相同的部分只需要輸入一遍就可以了。2.它提高維護效率。比如你有40個文檔都包含copyright的entity,如果需要修改這個copyright,不需要所有的文件都修改,只要改最初定義的entity語句就可以了。 XML定義了兩種類型的entity。一種是我們這里說的普通entity,在XML文檔中使用;另一種是參數(shù)entity,在DTD文件中使用。 entity的定義語法為: <!DOCTYPE filename [ <!ENTITY entity-name "entity-content" ] > 例如我要定義一段版權信息: <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved" ] > 如果我的版權信息內容和他人共享一個XML文件,也可以使用外部調用的方法,語法象這樣: <!DOCTYPE copyright [ <!ENTITY copyright SYSTEM "http://www.sample.com/copyright. ] > 定義好的entity在文檔中的引用語法為:&entity-name; 例如,上面定義的版權信息,調用時寫作?copyright; 完整的例子如下,你可以copy下來存為copyright.XML觀看實例: <? <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved"> ]> <myfile> <title>XML</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> ©right; </myfile> 第四章 XML語法 七.DTD的語法 DTD是"有效 1.設置元素 元素是XML文檔的基本組成部分。你要在DTD中定義一個元素,然后在XML文檔中使用。元素的定義語法為:<!ELEMENT DESCRIPTION (#PCDATA, DEFINITION)*> 說明: "<!ELEMENT" 是元素的聲明,說明你要定義的是一個元素; 聲明后面的"DESCRIPTION",是元素的名稱; "(#PCDATA, DEFINITION)*>"則是該元素的使用規(guī)則。規(guī)則定義了元素可以包含的內容以及相互的關系。下面的表格概要列出了元素的規(guī)則: 2.元素規(guī)則表: 此主題相關圖片如下: 另外,我們還可以為元素定義屬性,因為我們不推薦使用屬性,在這里就不詳細展開了。 最后,我們來總結一些前四章學習的內容,寫一個包含DTD,XML,以及Script的簡單實例,便于讀者理解: 1.將下面文件存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 2.然后建立XML文檔myfile.xml: <? <!DOCTYPE myfile SYSTEM "myfile.dtd"> <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 3.建立HTML文檔myfile.html <HTML> <head> <script language=" var nodes = XMLDoc.documentElement.childNodes; title.innerText = nodes.item(0).text; author.innerText = nodes.item(1).text; </script> <title>在HTML中調用XML數(shù)據</title> </head> <body bgcolor="#FFFFFF"> <b>標題: </b> <span id="title"></span><br> <b>作者: </b> <span id="author"></span><br> </body> </HTML> 4.用IE5.0以上瀏覽器打開myfile.HTML就可以看到效果了。 XML輕松學習手冊(5)XML實例解析 第五章:XML實例解析 提綱: 一:實例效果 二:實例解析 1.定義新標識。 2.建立XML文檔。 3.建立相應的HTML文件。 XML在不同領域有著廣泛的應用,比如在科技領域的MathML,無線通信應用的WML,在網絡圖象方面的SVG等等,我們這里側重討論XML在web上的應用。XML在web上應用主要是利用其強大的數(shù)據操作能力。一般用XML配合JavaScript和ASP等服務器端程序,可以實現(xiàn)網絡上幾乎所有的應用需求。 考慮講解方便,我們在下面介紹一個簡單的實例,不包含服務器端程序。目的在于讓您對XML的數(shù)據操作能力有一個感性的認識。 好,我們首先[ 點擊這里 ]來看實例的效果。(請用IE5.0以上版本瀏覽器打開) 這是一個簡單的CD唱片數(shù)據檢索功能。你通過點擊"上一張","下一張"可以看到單張CD的有關信息。這樣的效果我們原來用兩種方法可以實現(xiàn): 1.利用DHTML,將數(shù)據隱藏在不同的層中,通過鼠標事件依次顯示; 2.利用后臺程序(如ASP,CGI,PHP,JSP等),調用服務器端的數(shù)據。 但是在這個實例中,我們打開頁面原代碼可以看到,其中沒有用DHTML的DIV,也沒有表單的action,它完全是用XML來實現(xiàn)的。下面我們來分析它的制作過程: 第一步:定義新標識。 根據實際的CD數(shù)據,首先新建一個名為<CD>的標識;其次建立它相關的數(shù)據標識,分別是:CD名稱<Title>,演唱者<Artist>,出版年代<Year>,國家<Country>,發(fā)行公司<Company>和價格<Price>;最后還要建立一個名為目錄<CATALOG>的標識。為什么要再建立一個<CATALOG>標識呢?因為在XML文檔中規(guī)定,必須且只能有一個根元素(標識),我們有多個CD數(shù)據,這些數(shù)據是并列的關系,所以需要為這些并列的元素建立一個根元素。 以上元素的定義和關系都完全符合XML標準,不需要特別的DTD文件來定義,所以可以省略DTD定義。如果我們想使用DTD來定義,以上過程可以表示為: <!ELEMENT CATALOG (CD)*> <!ELEMENT CD (Title,Artist,Year,Country,Company,Price)> <!ELEMENT Title (#PCDATA)> <!ELEMENT Artist (#PCDATA)> <!ELEMENT Year (#PCDATA)> <!ELEMENT Country (#PCDATA)> <!ELEMENT Company (#PCDATA)> <!ELEMENT Price (#PCDATA)> 這段代碼表示:元素CATALOG包含多個CD子元素,而子元素CD又依次包含Title, Artist, Year, Country, Company, Price 六個子元素,它們的內容都定義為文本(字符,數(shù)字,文本)。(注:具體的語法說明可以看上一章關于DTD的介紹) 第二步:建立XML文檔。 <? <CATALOG> <CD> <TITLE>Empire Burlesque</TITLE> <ARTIST>Bob Dylan</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>Columbia</COMPANY> <PRICE>10.90</PRICE> <YEAR>1985</YEAR> </CD> <CD> <TITLE>Hide your heart</TITLE> <ARTIST>Bonnie Tylor</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>CBS Records</COMPANY> <PRICE>9.90</PRICE> <YEAR>1988</YEAR> </CD> <CD> <TITLE>Greatest Hits</TITLE> <ARTIST>Dolly Parton</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>RCA</COMPANY> <PRICE>9.90</PRICE> <YEAR>1982</YEAR> </CD> <CD> <TITLE>Still got the blues</TITLE> <ARTIST>Gary More</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>Virgin redords</COMPANY> <PRICE>10.20</PRICE> <YEAR>1990</YEAR> </CD> <CD> <TITLE>Eros</TITLE> <ARTIST>Eros Ramazzotti</ARTIST> <COUNTRY>EU</COUNTRY> <COMPANY>BMG</COMPANY> <PRICE>9.90</PRICE> <YEAR>1997</YEAR> </CD> </CATALOG> 上面代碼首先用<? <CATALOG> <CD> ...... </CD> <CD> ...... </CD> </CATALOG> 一共定義了5組數(shù)據。我們將上面的代碼存為cd.XML文件,以備調用。 第三步:建立相應的HTML文件。 1.導入XML數(shù)據。 我們知道,目前流行的瀏覽器中,暫時只有微軟的IE5.0以上版本瀏覽器支持XML。IE是通過在 CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> 定義一個object,ID名為XMLdso。然后在head區(qū)用js引入xml數(shù)據: <script for="window" event="onload"> </script> 2.捆綁數(shù)據。 然后將用<SPAN>標識來將XML數(shù)據綁定在表格中。其中ID,DATASRC,DTATFLD都是<SPAN>的屬性。代碼如下: <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> 3.動作操作。 最后,為數(shù)據提供瀏覽按鈕: <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> 并利用js來完成兩個鼠標點擊功能:movenext()和moveprevious()。在head區(qū)加入如下代碼: <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> 好,我們先看HTML文件的全部原代碼: <HTML> <head> <script for="window" event="onload"> </script> <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> <TITLE>CD Navigate</TITLE> </head> <body> <p> <object WIDTH="0" HEIGHT="0" CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> <p> <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> </p> </body> </HTML> 將以上代碼存為cd.htm文件,于第二步的cd.XML文件放在一起。打開cd.htm文件,你就看見和上面實例一樣的效果了。 好,到今天為止,我們已經學習了關于XML的不少知識,我們來總結一下前面五個章節(jié),分別是XML快速入門,XML的概念原理,XML的術語,XML的語法和本章的實例解析。到這里,教程部分就結束了。在寫作過程中,阿捷盡最大努力將有關XML概念講得通俗易懂,盡量把自己的理解告訴給大家,但因為本人學習XML時間也不長,對整個XML的技術把握還不夠系統(tǒng)和深入,所以難免有疏漏的地方,請大家指正和諒解,謝謝! posted on 2009-02-15 15:45 YXY 閱讀(187) 評論(0) 編輯 收藏
到這里,你應該有點明白了:XML是用來創(chuàng)建定義類似HTML的標記語言,然后再用這個標記語言來顯示信息。 三. 使用XML有什么好處?
有了HTML,為什么還需要用XML?
因為現(xiàn)在網絡應用越來越廣泛,僅僅靠XML作為下一代web運用的數(shù)據傳輸和交互的工具。
使用XML有什么好處?來看w3c組織(XML標準制定者)的說明:
1.XML可以廣泛的運用于web的任何地方; 2.XML可以滿足網絡應用的需求; 3.使用XML將使編程更加簡單; 4.XML便于學習和創(chuàng)建; 5.XML代碼將清晰和便于閱讀理解; 還是抽象了些。讓我們在后面的實例教程中慢滿體會XML的強大優(yōu)勢吧! 四. XML很難學嗎? 如果你有興趣學習XML,不禁會問:XML難嗎?學習XML需要什么樣的基礎? XML非常簡單,學習容易。如果你熟悉HTML,你會發(fā)現(xiàn)它的文檔和HTML非常相似,看同樣的示例文檔(例1): ? <myfile> <title>XML Quick Start</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> </myfile> 第一行是一個XML聲明,表示文檔遵循的是XML的1.0 版的規(guī)范。 第二行定義了文檔里面的第一個元素(element),也稱為根元素: < myfile>。這個就類似HTML里的< HTML>開頭標記。注意,這個名稱是自己隨便定義的。 再下面定義了四個子元素:title,author,email,和date。分別說明文章的標題,作者,郵箱和日期。當然,你可以用中文來定義這些標簽,看上去更便于理解: <? <文章> <標題>XML輕松學習手冊</標題> <作者>ajie</作者> <信箱>ajie@aolhoo.com</信箱> <日期>20010115</日期> </文章> 這就是XML的文檔,任何掌握HTML的網友都可以直接寫出這樣簡單的XML文檔。 另外,學習XML還必須掌握一種頁面腳本語言,常見的就是JavaScript和VB script。因為XML數(shù)據是使用script實現(xiàn)HTML中調用和交互的。我們看一個最簡單的例子(例2): 1.將下面代碼存為myfile.htm <HTML> <head> <script language=" var nodes = XMLDoc.documentElement.childNodes; title.innerText = nodesitem(0).text; author.innerText = nodes.item(1).text; email.innerText = nodes.item(2).text; date.innerText = nodes.item(3).text; </script> <title>在HTML中調用XML數(shù)據</title> </head> <body bgcolor="#FFFFFF"> <b>標題: </b> <span id="title"> </span> <b>作者: </b>> <span id="author"></span> <b>信箱: </b> <span id="email"></span> <b>日期:</b> <span id="date"></span> </body> </HTML> 2.將下面代碼存為myfile.XML <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> </myfile> 3.將它們放在同一個目錄下,用IE5以上版本瀏覽器打開,可以看到效果。 學習并掌握一種script,你將真正了解到XML無比的強大的功能。 五. XML和HTML的區(qū)別 XML和HTML都來自于SGML,它們都含有標記,有著相似的語法,HTML和XML的最大區(qū)別在于:HTML是一個定型的標記語言,它用固有的標記來描述,顯示網頁內容。比如< H1>表示首行標題,有固定的尺寸。相對的,XML則沒有固定的標記,XML不能描述網頁具體的外觀,內容,它只是描述內容的數(shù)據形式和結構。 這是一個質的區(qū)別:網頁將數(shù)據和顯示混在一起,而XML則將數(shù)據和顯示分開來。 我們看上面的例子,在myfile.htm中,我們只關心頁面的顯示方式,我們可以設計不同的界面,用不同的方式來排版頁面,但數(shù)據是儲存在myfile.XML中,不需要任何改變。 (如果你是程序員,你會驚訝的發(fā)現(xiàn),這與模塊化面向對象編程的思想極其相似!其實網頁何嘗不是一種程序呢?) 正是這種區(qū)別使得XML在網絡應用和信息共享上方便,高效,可擴展。所以我們相信,XML做為一種先進的數(shù)據處理方法,將使網絡跨越到一個新的境界。 六. XML的嚴格格式 吸取HTML松散格式帶來的經驗教訓, 我們先看HTML的一些語句,這些語句在HTML中隨處可見: 1. sample 2.< b>< i>sample< /b>< /i> 3.< td>sample< /TD> 4.< font color=red>samplar< /font> 在XML文檔中,上述幾種語句的語法都是錯誤的。因為: 1.所有的標記都必須要有一個相應的結束標記; 2.所有的XML標記都必須合理嵌套; 3.所有XML標記都區(qū)分大小寫; 4.所有標記的屬性必須用""括起來; 所以上列語句在XML中正確的寫法是 1. sample 2.< b>< i>sample< /i>< /b> 3.< td>sample< /td> 4.< font color="red">samplar< /font> 另外,XML標記必須遵循下面的命名規(guī)則: 1.名字中可以包含字母、數(shù)字以及其它字母; 2.名字不能以數(shù)字或"_" (下劃線) 開頭; 3.名字不能以字母 XML (或 XML 或 Xml ..) 開頭; 4.名字中不能包含空格。 在XML文檔中任何的差錯,都會得到同一個結果:網頁不能被顯示。各瀏覽器開發(fā)商已經達成協(xié)議,對XML實行嚴格而挑剔的解析,任何細小的錯誤都會被報告。你可以將上面的myfile.xml修改一下,比如將< email>改為< Email>,然后用IE5直接打開myfile.xml,會得到一個出錯信息頁面: <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> <Email>ajie@aolhoo.com</email> <date>20010115</date> </myfile> 七. 關于XML的更多 好了,到現(xiàn)在你已經知道: 1.什么是XML; 2.XML,HTML,SGML之間的關系和區(qū)別; 3.XML的簡單應用。 恭喜你!你已經不再對XML一無所知,并且已經走在了網絡技術的前沿。整個學習過程好象并不很難哦:) 如果你對XML有更多的興趣,希望進一步了解XML的詳細資料和其它的實際運用技術,歡迎繼續(xù)瀏覽我們的下一章:XML的概念。 XML輕松學習手冊(2)XML概念 第二章 XML概念 導言 經過第一章的快速入門學習,你已經知道了 一. 擴展性 二. 標識 三. 語言 四. 結構化 五. Meta數(shù)據 六. 顯示 七. DOM 一.擴展性---使用XML,你可以為你的文檔建立自己的標記(tags)。 在HTML里,有許多固定的標記,我們必須記住然后使用它們,你不能使用HTML規(guī)范里沒有的標記。而在XML中,你能建立任何你需要的標記。你可以充分發(fā)揮你的想象力,給你的文檔起一些好記的標記名稱。比如,你的文檔里包含一些游戲的攻略,你可以建立一個名為<game>的標記,然后在<game>下再根據游戲類別建立<RPG>,<SLG>等標記。只要清晰,易于理解你可以建立任何數(shù)量的標記。 一開始你也許會不適應,因為我們在學習HTML時,有固定的標記可以直接學習和使用;(很多人包括我自己都是邊分析別人的代碼和標識,邊建立自己的網頁),而XML卻沒有任何標記可以學,也很少有文檔的標記是一模一樣的。我們怎么辦?呵呵,沒有就自己創(chuàng)建呀。一旦你真正開始寫XML文檔,你會發(fā)現(xiàn)隨心所欲的創(chuàng)造新標記也是一份很有趣的事。你可以建立有自己特色的標記,甚至建立你自己的HTML語言。 擴展性使你有更多的選擇和強大的能力,但同時也產生一個問題就是你必須學會規(guī)劃。你自己要理解自己的文檔,知道它由哪幾部分組成,相互之間的關系和如何識別它們。 關于建立標識還需要說明一點,標識是描述數(shù)據的類型或特性,比如<width>,年齡<age>,姓名<name>等,而不是數(shù)據的內容,比如:<10pxl>,<18>,<張三>,這些都是無用的標記。如果你學過數(shù)據庫,你可以這樣理解,標識就是一種字段名。 二.標識---使用XML你可以識別文檔中的元素。 不論你是HTML,還是XML,標識的本質在于便于理解,如果沒有標識,你的文檔在計算機看來只是一個很長的字符串,每個字看起來都一樣,沒有重點之分。 通過標識,你的文檔才便于閱讀和理解,你可以劃分段落,列明標題。XML中,你更可以利用其擴展性 來為文檔建立更合適的標識。 不過,有一點要提醒大家注意:標識僅僅是用來識別信息,它本身并不傳達信息。例如這樣的HTML代碼: <b>frist step<b> 這里<b>表示粗體,只用來說明是用粗體來顯示"frist step"字符,<b>本身并不包含任何實際的信息,在頁面上你看不到<b>,真正傳達信息的是"frist step "。 三.語言---使用XML你要遵循特定的語法來標識你的文檔。 在計算機領域,語言常常表示一?quot;程序語言",用來編程實現(xiàn)一些功能和應用,但不是所有的"語言"都是用來編程的,XML就只是一種用來定義標識和描述信息的語言。 下面我們來深入了解一下XML應用的其本原理,可能會很枯燥,但是對于整體的理解很重要,你可以先快速過一遍,心里有一個模糊的概念,具體精髓則需要在實踐中慢慢領會。 四.結構化---XML促使文檔結構化,所有的信息按某種關系排列。 "結構化"聽起來太抽象了,我們這樣理解,結構化就是為你的文檔建立一個框架,就象寫文章先寫一個提綱。結構化使你的文檔看起來不會雜亂無章,每一部分都緊密聯(lián)系,形成一個整體。 結構化有兩個原則: 1.每一部分(每一個元素)都和其他元素有關聯(lián)。關聯(lián)的級數(shù)就形成了結構。 2.標識本身的含義與它描述的信息相分離。 我們來看一個簡單的例子幫助理解: <? <myfile> <title>XML輕松學習手冊</title> <chapter>XML快速入門 <para>什么是XML</para> <para>使用XML的好處</para> </chapter> <chapter>XML的概念 <para>擴展性</para> <para>標識</para> </chapter> </myfile> 這是本文的XML描述文檔,可以看到標識分三級關聯(lián),非常清晰: <myfile> <chapter> <para> ... </para> </chapter> </myfile> 上面這樣的文檔結構,我們又稱之為"文檔樹",主干是父元素,如<myfile>,分支和頁是子元素,如<chapter>和<para>。 五.Meta數(shù)據(Metadata)---專業(yè)的XML使用者會使用meta數(shù)據來工作。 在HTML中我們知道可以使用meta標識來定義網頁的關鍵字,簡介等,這些標識不會顯示在網頁中,但可以被搜索引擎搜索到,并影響搜索結果的排列順序。 XML對這一原理進行了深化和擴展,用XML,你可以描述你的信息在哪里,你可以通過meta來驗證信息,執(zhí)行搜索,強制顯示,或者處理其他的數(shù)據。 下面是一些XML metadata在實際應用中的用途: 1.可以驗證數(shù)字簽名,使在線商務的提交動作(submission)有效。 2.可以被方便的建立索引和進行更有效搜索。 3.可以在不同語言之間傳輸數(shù)據。 W3C組織正在研究一種名為RDF(Resource Description Framework)的metadata處理方法,可以自動交換信息,W3C宣稱,使用RDF配合數(shù)字簽名,將使網絡中存在"真實可信"的電子商務。 六.顯示 單獨用XML不能顯示頁面,我們使用格式化技術,比如CSS或者XSL,才能顯示XML標記創(chuàng)建的文檔。 我們在前面第一章講到XML是將數(shù)據和格式分離的。XML文檔本身不知道如何來顯示,必須有輔助文件來幫助實現(xiàn)。(XML取消了所有標識,包括font,color,p等風格樣式定義標識,因此XML全部是采用類似DHTML中CSS的方法來定義文檔風格樣式。),XML中用來設定顯示風格樣式的文件類型有: 1.XSL XSL全稱是Extensible Stylesheet Language(可擴展樣式語言), 是將來設計XML文檔顯示樣式的主要文件類型。它本身也是基于XML語言的。使用XSL,你可以靈活的設置文檔顯示樣式,文檔將自動適應任何瀏覽器和PDA(掌上電腦)。 XSL也可以將XML轉化為HTML,那樣,老的瀏覽器也可以瀏覽XML文檔了。 2.CSS CSS大家很熟悉了,全稱是Cascading Style Sheets(層疊樣式表),是目前用來在瀏覽器上顯示XML文檔的主要方法。 3.Behaviors Behaviors現(xiàn)在還沒有成為標準。它是微軟的IE瀏覽器特有的功能,用它可以對XML標識設定一些有趣動作。 七.DOM DOM全稱是document object model(文檔對象模型),DOM是用來干什么的呢?假設把你的文檔看成一個單獨的對象,DOM就是如何用HTML或者XML對這個對象進行操作和控制的標準。 面向對象的思想方法已經非常流行了,在編程語言(例如java,js)中,都運用面向對象的編程思想。在XML中,就是要將網頁也作為一個對象來操作和控制,我們可以建立自己的對象和模板。與對象進行交流,如何命令對象,就要用到API。API全稱Application Programming Interface,它是訪問和操作對象的規(guī)則。而DOM就是一種詳細描述HTML/XML文檔對象規(guī)則的API。它規(guī)定了HTML/XML文檔對象的命名協(xié)定,程序模型,溝通規(guī)則等。在XML文檔中,我們可以將每一個標識元素看作一個對象---它有自己的名稱和屬性。 XML創(chuàng)建了標識,而DOM的作用就是告訴script如何在瀏覽器窗口中操作和顯示這些標識 上面我們已經簡要的講述了一些XML的基本原理,我們來看看它們之間的關聯(lián)以及它們是如何工作的,先看這里一張圖: 此主題相關圖片如下: 1. 2.CSS儲存并控制元素的顯示樣式。例如:標題將被以18pt字體顯示 3.script腳本控制元素如何動作。例如:當一個title元素"out of stock",將被用紅色顯示。 4.DOM則為腳本和對象的交流提供一個公共平臺,并將結果顯示在瀏覽器窗口。 如果任何一個部分發(fā)生錯誤,都不會得到正確結果。 好了,看到這里,我們已經對XML是如何工作的有一個整體的大致的概念。通過這一章的學習,我們可能感覺到XML似乎更偏向數(shù)據處理,更方便程序員學習。實際情況也是這樣的,XML設計的目的就是用來方便的共享和交互數(shù)據的。下一章,我們將系統(tǒng)的了解關于XML的各種術語。歡迎您繼續(xù)瀏覽。 XML輕松學習手冊(3)XML的術語 第三章 XML的術語 提綱: 導言 一.XML文檔的有關術語 二.DTD的有關術語 導言 初學XML最令人頭疼的就是有一大堆新的術語概念要理解。由于XML本身也是一個嶄新的技術,正在不斷發(fā)展和變化,各組織和各大網絡公司(微軟,IBM,SUN等)都在不斷推出自己的見解和標準,因此新概念漫天飛就不足為奇了。而國內又缺乏權威的機構或組織來對這些術語正式定名,你所看見的有關XML的中文教材大部分是靠作者本身的理解翻譯過來的,有些是正確的,有些是錯誤的,更加妨礙了我們對這些概念的理解和學習。 你下面將要看到的關于XML術語的解釋,也是作者本身的理解和翻譯。阿捷是以W3C組織發(fā)布的XML1.0標準規(guī)范和相關的正式說明文檔為根據來講述。可以確保這些理解是基本正確的,至少不是錯誤的。你如果想進一步閱讀和了解,我在本文的最后部分列明了相關資源的出處和鏈接,你可以直接訪問。好,我們轉入正題: 一.XML文檔的有關術語 什么是XML文檔?知道 <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> </myfile> XML文檔包含三個部分: 1. 一個XML文檔聲明; 2. 一個關于文檔類型的定義; 3. 用XML標識創(chuàng)建的內容。 舉例說明: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> <filelist> <myfile> <title>QUICK START OF XML</title> <author>ajie</author> </myfile> ...... </filelist> 其中第一行<? 我們來了解XML文檔中有關的術語: 1.Element(元素): 元素在HTML我們已經有所了解,它是組成HTML文檔的最小單位,在XML中也一樣。一個元素由一個標識來定義,包括開始和結束標識以及其中的內容,就象這樣:<author>ajie</author> 唯一不同的就是:在HTML中,標識是固定的,而在XML中,標識需要你自己創(chuàng)建。 2.Tag(標識) 標識是用來定義元素的。在XML中,標識必須成對出現(xiàn),將數(shù)據包圍在中間。標識的名稱和元素的名稱是一樣的。例如這樣一個元素: <author>ajie</author> 其中<author>就是標識。 3.Attribute(屬性): 什么是屬性?看這段word</font>。其中color就是font的屬性之一。 屬性是對標識進一步的描述和說明,一個標識可以有多個屬性,例如font的屬性還有size。XML中的屬性與HTML中的屬性是一樣的,每個屬性都有它自己的名字和數(shù)值,屬性是標識的一部分。舉例: <author sex="female">ajie</author> XML中屬性也是自己定義的,我們建議你盡量不使用屬性,而將屬性改成子元素,例如上面的代碼可以改成這樣: <author>ajie <sex>female</sex> </author> 原因是屬性不易擴充和被程序操作。 4.Declaration(聲明) 在所有XML文檔的第一行都有一個XML聲明。這個聲明表示這個文檔是一個XML文檔,它遵循的是哪個XML版本的規(guī)范。一個XML的聲明語句就象這樣: <? 5.DTD(文件類型定義) DTD是用來定義XML文檔中元素,屬性以及元素之間關系的。 通過DTD文件可以檢測XML文檔的結構是否正確。但建立XML文檔并不一定需要DTD文件。關于DTD文件的詳細說明我們將在下面單獨列項。 6.Well-formed XML(良好格式的XML) 一個遵守 良好格式的文檔必須以一個XML聲明開始,例如: <? 其中你必須說明文檔遵守的 良好格式的XML文檔必須有一個根元素,就是緊接著聲明后面建立的第一個元素,其它元素都是這個根元素的子元素,屬于根元素一組。 良好格式的XML文檔的內容書寫時必須遵守XML語法。(有關XML語法我們將在下一章仔細講解) 7.Valid XML(有效的XML) 一個遵守 將XML文檔和它的DTD文件進行比較分析,看是否符合DTD規(guī)則的過程叫validation(確認)。這樣的過程通常我們是通過一個名為parser的軟件來處理的。 有效的XML文檔也必須以一個XML聲明開始,例如: <? 和上面例子不同的,在standalone(獨立)屬性中,這里設置的是"no",因為它必須和相應的DTD一起使用,DTD文件的定義方法如下: <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 二.DTD的有關術語 什么是DTD,我們上面已經簡略提到。DTD是一種保證XML文檔格式正確的有效方法,可以比較XML文檔和DTD文件來看文檔是否符合規(guī)范,元素和標簽使用是否正確。一個DTD文檔包含:元素的定義規(guī)則,元素間關系的定義規(guī)則,元素可使用的屬性,可使用的實體或符號規(guī)則。 DTD文件也是一個ASCII的文本文件,后綴名為.dtd。例如:myfile.dtd。 為什么要用DTD文件呢?我的理解是它滿足了網絡共享和數(shù)據交互,使用DTD最大的好處在于DTD文件的共享。(就是上文DTD說明語句中的PUBLIC屬性)。比如,兩個相同行業(yè)不同地區(qū)的人使用同一個DTD文件來作為文檔創(chuàng)建規(guī)范,那么他們的數(shù)據就很容易交換和共享。網上有其他人想補充數(shù)據,也只需要根據公用的DTD規(guī)范來建立文檔,就立刻可以加入。 目前,已經有數(shù)量眾多的寫好的DTD文件可以利用。針對不同的行業(yè)和應用,這些DTD文件已經建立了通用的元素和標簽規(guī)則。你不需要自己重新創(chuàng)建,只要在他們的基礎上加入你需要的新標識。 當然,如果愿意,你可以創(chuàng)建自己的DTD,它可能和你的文檔配合的更加完美。建立自己的DTD也是很簡單的一件事,一般只需要定義4-5個元素就可以了。 調用DTD文件的方法有兩種: 1.直接包含在XML文檔內的DTD 你只要在DOCTYPE聲明中插入一些特別的說明就可以了,象這樣: 我們有一個XML文檔: <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 我們在第一行后面插入下面代碼就可以: <!DOCTYPE myfile [ <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> <!ENTITY copyright "Copyright 2001, Ajie."> ]> 2.調用獨立的DTD文件 將DTD文檔存為.dtd的文件,然后在DOCTYPE聲明行中調用,例如,將下面的代碼存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 然后在XML文檔中調用,在第一行后插入: <!DOCTYPE myfile SYSTEM "myfile.dtd"> 我們可以看到DTD文檔和HTML中js的調用是差不多的,關于DTD文檔具體如何寫,我們將在下一章和XML文檔的語法一起介紹。 下面我們來了解DTD有關的術語: 1.Schema(規(guī)劃) schema是數(shù)據規(guī)則的描述。schema做兩件事: a.它定義元素數(shù)據類型和元素之間的關系; b.它定義元素所能包含的內容類型。 DTD就是關于XML文檔的一個schema。 2.Document Tree(文檔樹) "文檔樹"在前面第二章我們已經提到過,它是文檔元素分級結構的形象表示。一個文檔結構樹包含根元素,根元素是最頂級的元素,(就是緊接著XML聲明語句后的第一個元素)。看例子: <? <filelist> <myfile> <title>...</title> <author>...</author> </myfile> </filelist> 上面的例子分三級結構排列成"樹"狀,其中的<filelist>就是根元素。在XML和DTD文件中,第一個定義的都是根元素。 3.Parent Element(父元素)/Child Element(子元素) 父元素是指包含有其它元素的元素,被包含的元素稱為它的子元素??瓷厦娴?結構樹",其中<myfile>是父元素,<title>,<author>是它的子元素,而<myfile>又是<filelist>的子元素。象<title>這樣沒有包含任何子元素的最后一級元素我們也稱之為"頁元素"。 4.Parser(解析軟件) Parser是一種檢查XML文檔是否遵循DTD規(guī)范的工具軟件。 Parser能獨立使用,也可以成為編輯軟件或瀏覽器的一部分。在后面的相關資源列表里,我列出了當前比較流行的一些parsers。 好了,通過第三章的學習,我們已經了解了一些XML和DTD的基本術語,但是我們還不知道怎樣來寫這些文件,需要遵循什么樣的語法,在下一章,將重點介紹有關撰寫XML和DTD文檔的語法。請繼續(xù)瀏覽,謝謝! XML輕松學習手冊(4)XML語法 第四章 XML語法 提綱: 一.XML語法規(guī)則 二.元素的語法 三.注釋的語法 四.CDATA的語法 五.Namespaces的語法 六.entity的語法 七.DTD的語法 通過前面三章的學習,我們已經對什么是XML,它的實現(xiàn)原理以及相關的術語有所了解。接下來我們就開始學習XML的語法規(guī)范,動手寫自己的XML文檔。 一.XML語法規(guī)則 XML的文檔和HTML的原代碼類似,也是用標識來標識內容。創(chuàng)建XML文檔必須遵守下列重要規(guī)則: 規(guī)則1:必須有XML聲明語句 這一點我們在上一章學習時已經提到過。聲明是XML文檔的第一句,其格式如下: <? 聲明的作用是告訴瀏覽器或者其它處理程序:這個文檔是XML文檔。聲明語句中的version表示文檔遵守的XML規(guī)范的版本;standalone表示文檔是否附帶DTD文件,如果有,參數(shù)為no;encoding表示文檔所用的語言編碼,默認是UTF-8。 規(guī)則2:是否有DTD文件 如果文檔是一個"有效的 <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 規(guī)則3:注意你的大小寫 在XML文檔中,大小寫是有區(qū)別的。<P>和<p>是不同的標識。注意在寫元素時,前后標識大小寫要保持一樣。例如:<Author>ajie</Author>,寫成<Author>ajie</author>是錯誤的。 你最好養(yǎng)成一種習慣,或者全部大寫,或者全部小寫,或者大寫第一個字母。這樣可以減少因為大小寫不匹配產生的文檔錯誤。 規(guī)則4:給屬性值加引號 在HTML代碼里面,屬性值可以加引號,也可以不加。例如:<font color=red> 但是在XML中則規(guī)定,所有屬性值必須加引號(可以是單引號,也可以是雙引號),否則將被視為錯誤。 規(guī)則5:所有的標識必須有相應的結束標識 在HTML中,標識可能不是成對出現(xiàn)的,比?lt;br>。而在XML中規(guī)定,所有標識必須成對出現(xiàn),有一個開始標識,就必須有一個結束標識。否則將被視為錯誤。 規(guī)則6:所有的空標識也必須被關閉 空標識就是標識對之間沒有內容的標識。比如 ,<img>等標識。在XML中,規(guī)定所有的標識必須有結束標識,針對這樣的空標識,XML中處理的方法是在原標識最后加/,就可以了。例如: 應寫為<br />; <META name="keyXML, SGML, <IMG src= "cool.gif">應寫為<IMG src= "cool.gif" /> 第四章 XML語法 二.元素的語法 元素由一對標識以及其中的內容組成。就象這樣:ajie。元素的名稱和標識的名稱是一樣的。標識可以用屬性來進一步描述。 在XML中,沒有任何保留字,所以你可以隨心所欲的用任何詞語來作為元素名稱。但是也必須遵守下列規(guī)范: 1.名稱中可以包含字母、數(shù)字以及其它字母; 2.名稱不能以數(shù)字或"_" (下劃線)開頭; 3.名稱不能以字母 XML(或 XML 或 Xml ..)開頭 4.名稱中不能包含空格 5.名稱中間不能包含":"(冒號) 為了使元素更容易閱讀理解和操作,我們還有一些建議: 1.名稱中不要使用"."。因為在很多程序語言中,"."是作為對象的屬性,例如:font.color。同樣的原因"-"也最好不要用,必須使用的,以"_"代替; 2.名稱盡量簡短。 3.名稱的大小寫盡量采用同一標準。 4.名稱可以使用非英文字符,比如用中文。但是有些軟件可能不支持。(IE5目前是支持中文元素的。) 另外,補充一點關于屬性的說明。在word</font>將把word顯示為紅色。而在CSS或者XSL,我們在下面詳細講述。) 三.注釋的語法 注釋是為了便于閱讀和理解,在XML文檔添加的附加信息,將不會被程序解釋或則瀏覽器顯示。 注釋的語法如下: <!-- 這里是注釋信息 --> 可以看到,它和HTML中的注釋語法是一樣的,非常容易。養(yǎng)成良好的注釋習慣將使你的文檔更加便于維護,共享,看起來也更專業(yè)。 四.CDATA的語法 CDATA全稱character data,翻譯為字符數(shù)據。我們在寫 <![CDATA[這里放置需要顯示的字符]]> 例如: <![CDATA[<AUTHOR sex="female">ajie</AUTHOR>]]> 在頁面上顯示的內容將是"<AUTHOR sex="female">ajie</AUTHOR>" 第四章 XML語法 五.Namespaces的語法 Namespaces翻譯為名字空間。名字空間有什么作用呢?當我們在一個XML文檔中使用他人的或者多個DTD文件,就會出現(xiàn)這樣的矛盾:因為XML中標識都是自己創(chuàng)建的,在不同的DTD文件中,標識名可能相同但表示的含義不同,這就可能引起數(shù)據混亂。 比如在一個文檔<table>wood table</table>中<table>表示桌子, 而在另一個文檔<table>namelist</table>中<table>表示表格。如果我需要同時處理這兩個文檔,就會發(fā)生名字沖突。 了解決這個問題,我們引進了namespaces這個概念。namespaces通過給標識名稱加一個網址(URL)定位的方法來區(qū)別這些名稱相同的標識。 Namespaces同樣需要在XML文檔的開頭部分聲明,聲明的語法如下: <document 其中yourname是由你定義的namespaces的名稱,URL就是名字空間的網址。 假設上面的"桌子<table>"文檔來自http://www.zhuozi.com,我們就可以聲明為 <document http://www.zhuozi.com'> 然后在后面的標識中使用定義好的名字空間: <zhuozi:table>wood table</table> 這樣就將這兩個<table>區(qū)分開來。注意的是:設置URL并不是說這個標識真的要到那個網址去讀取,僅僅作為一種區(qū)別的標志而已。 六.entity的語法 entity翻譯為"實體"。它的作用類似 entity可以包含字符,文字等等,使用entity的好處在于:1.它可以減少差錯,文檔中多個相同的部分只需要輸入一遍就可以了。2.它提高維護效率。比如你有40個文檔都包含copyright的entity,如果需要修改這個copyright,不需要所有的文件都修改,只要改最初定義的entity語句就可以了。 XML定義了兩種類型的entity。一種是我們這里說的普通entity,在XML文檔中使用;另一種是參數(shù)entity,在DTD文件中使用。 entity的定義語法為: <!DOCTYPE filename [ <!ENTITY entity-name "entity-content" ] > 例如我要定義一段版權信息: <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved" ] > 如果我的版權信息內容和他人共享一個XML文件,也可以使用外部調用的方法,語法象這樣: <!DOCTYPE copyright [ <!ENTITY copyright SYSTEM "http://www.sample.com/copyright. ] > 定義好的entity在文檔中的引用語法為:&entity-name; 例如,上面定義的版權信息,調用時寫作?copyright; 完整的例子如下,你可以copy下來存為copyright.XML觀看實例: <? <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved"> ]> <myfile> <title>XML</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> ©right; </myfile> 第四章 XML語法 七.DTD的語法 DTD是"有效 1.設置元素 元素是XML文檔的基本組成部分。你要在DTD中定義一個元素,然后在XML文檔中使用。元素的定義語法為:<!ELEMENT DESCRIPTION (#PCDATA, DEFINITION)*> 說明: "<!ELEMENT" 是元素的聲明,說明你要定義的是一個元素; 聲明后面的"DESCRIPTION",是元素的名稱; "(#PCDATA, DEFINITION)*>"則是該元素的使用規(guī)則。規(guī)則定義了元素可以包含的內容以及相互的關系。下面的表格概要列出了元素的規(guī)則: 2.元素規(guī)則表: 此主題相關圖片如下: 另外,我們還可以為元素定義屬性,因為我們不推薦使用屬性,在這里就不詳細展開了。 最后,我們來總結一些前四章學習的內容,寫一個包含DTD,XML,以及Script的簡單實例,便于讀者理解: 1.將下面文件存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 2.然后建立XML文檔myfile.xml: <? <!DOCTYPE myfile SYSTEM "myfile.dtd"> <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 3.建立HTML文檔myfile.html <HTML> <head> <script language=" var nodes = XMLDoc.documentElement.childNodes; title.innerText = nodes.item(0).text; author.innerText = nodes.item(1).text; </script> <title>在HTML中調用XML數(shù)據</title> </head> <body bgcolor="#FFFFFF"> <b>標題: </b> <span id="title"></span><br> <b>作者: </b> <span id="author"></span><br> </body> </HTML> 4.用IE5.0以上瀏覽器打開myfile.HTML就可以看到效果了。 XML輕松學習手冊(5)XML實例解析 第五章:XML實例解析 提綱: 一:實例效果 二:實例解析 1.定義新標識。 2.建立XML文檔。 3.建立相應的HTML文件。 XML在不同領域有著廣泛的應用,比如在科技領域的MathML,無線通信應用的WML,在網絡圖象方面的SVG等等,我們這里側重討論XML在web上的應用。XML在web上應用主要是利用其強大的數(shù)據操作能力。一般用XML配合JavaScript和ASP等服務器端程序,可以實現(xiàn)網絡上幾乎所有的應用需求。 考慮講解方便,我們在下面介紹一個簡單的實例,不包含服務器端程序。目的在于讓您對XML的數(shù)據操作能力有一個感性的認識。 好,我們首先[ 點擊這里 ]來看實例的效果。(請用IE5.0以上版本瀏覽器打開) 這是一個簡單的CD唱片數(shù)據檢索功能。你通過點擊"上一張","下一張"可以看到單張CD的有關信息。這樣的效果我們原來用兩種方法可以實現(xiàn): 1.利用DHTML,將數(shù)據隱藏在不同的層中,通過鼠標事件依次顯示; 2.利用后臺程序(如ASP,CGI,PHP,JSP等),調用服務器端的數(shù)據。 但是在這個實例中,我們打開頁面原代碼可以看到,其中沒有用DHTML的DIV,也沒有表單的action,它完全是用XML來實現(xiàn)的。下面我們來分析它的制作過程: 第一步:定義新標識。 根據實際的CD數(shù)據,首先新建一個名為<CD>的標識;其次建立它相關的數(shù)據標識,分別是:CD名稱<Title>,演唱者<Artist>,出版年代<Year>,國家<Country>,發(fā)行公司<Company>和價格<Price>;最后還要建立一個名為目錄<CATALOG>的標識。為什么要再建立一個<CATALOG>標識呢?因為在XML文檔中規(guī)定,必須且只能有一個根元素(標識),我們有多個CD數(shù)據,這些數(shù)據是并列的關系,所以需要為這些并列的元素建立一個根元素。 以上元素的定義和關系都完全符合XML標準,不需要特別的DTD文件來定義,所以可以省略DTD定義。如果我們想使用DTD來定義,以上過程可以表示為: <!ELEMENT CATALOG (CD)*> <!ELEMENT CD (Title,Artist,Year,Country,Company,Price)> <!ELEMENT Title (#PCDATA)> <!ELEMENT Artist (#PCDATA)> <!ELEMENT Year (#PCDATA)> <!ELEMENT Country (#PCDATA)> <!ELEMENT Company (#PCDATA)> <!ELEMENT Price (#PCDATA)> 這段代碼表示:元素CATALOG包含多個CD子元素,而子元素CD又依次包含Title, Artist, Year, Country, Company, Price 六個子元素,它們的內容都定義為文本(字符,數(shù)字,文本)。(注:具體的語法說明可以看上一章關于DTD的介紹) 第二步:建立XML文檔。 <? <CATALOG> <CD> <TITLE>Empire Burlesque</TITLE> <ARTIST>Bob Dylan</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>Columbia</COMPANY> <PRICE>10.90</PRICE> <YEAR>1985</YEAR> </CD> <CD> <TITLE>Hide your heart</TITLE> <ARTIST>Bonnie Tylor</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>CBS Records</COMPANY> <PRICE>9.90</PRICE> <YEAR>1988</YEAR> </CD> <CD> <TITLE>Greatest Hits</TITLE> <ARTIST>Dolly Parton</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>RCA</COMPANY> <PRICE>9.90</PRICE> <YEAR>1982</YEAR> </CD> <CD> <TITLE>Still got the blues</TITLE> <ARTIST>Gary More</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>Virgin redords</COMPANY> <PRICE>10.20</PRICE> <YEAR>1990</YEAR> </CD> <CD> <TITLE>Eros</TITLE> <ARTIST>Eros Ramazzotti</ARTIST> <COUNTRY>EU</COUNTRY> <COMPANY>BMG</COMPANY> <PRICE>9.90</PRICE> <YEAR>1997</YEAR> </CD> </CATALOG> 上面代碼首先用<? <CATALOG> <CD> ...... </CD> <CD> ...... </CD> </CATALOG> 一共定義了5組數(shù)據。我們將上面的代碼存為cd.XML文件,以備調用。 第三步:建立相應的HTML文件。 1.導入XML數(shù)據。 我們知道,目前流行的瀏覽器中,暫時只有微軟的IE5.0以上版本瀏覽器支持XML。IE是通過在 CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> 定義一個object,ID名為XMLdso。然后在head區(qū)用js引入xml數(shù)據: <script for="window" event="onload"> </script> 2.捆綁數(shù)據。 然后將用<SPAN>標識來將XML數(shù)據綁定在表格中。其中ID,DATASRC,DTATFLD都是<SPAN>的屬性。代碼如下: <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> 3.動作操作。 最后,為數(shù)據提供瀏覽按鈕: <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> 并利用js來完成兩個鼠標點擊功能:movenext()和moveprevious()。在head區(qū)加入如下代碼: <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> 好,我們先看HTML文件的全部原代碼: <HTML> <head> <script for="window" event="onload"> </script> <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> <TITLE>CD Navigate</TITLE> </head> <body> <p> <object WIDTH="0" HEIGHT="0" CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> <p> <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> </p> </body> </HTML> 將以上代碼存為cd.htm文件,于第二步的cd.XML文件放在一起。打開cd.htm文件,你就看見和上面實例一樣的效果了。 好,到今天為止,我們已經學習了關于XML的不少知識,我們來總結一下前面五個章節(jié),分別是XML快速入門,XML的概念原理,XML的術語,XML的語法和本章的實例解析。到這里,教程部分就結束了。在寫作過程中,阿捷盡最大努力將有關XML概念講得通俗易懂,盡量把自己的理解告訴給大家,但因為本人學習XML時間也不長,對整個XML的技術把握還不夠系統(tǒng)和深入,所以難免有疏漏的地方,請大家指正和諒解,謝謝! posted on 2009-02-15 15:45 YXY 閱讀(187) 評論(0) 編輯 收藏
1.XML可以廣泛的運用于web的任何地方;
2.XML可以滿足網絡應用的需求;
3.使用XML將使編程更加簡單;
4.XML便于學習和創(chuàng)建;
5.XML代碼將清晰和便于閱讀理解;
還是抽象了些。讓我們在后面的實例教程中慢滿體會XML的強大優(yōu)勢吧!
如果你有興趣學習XML,不禁會問:XML難嗎?學習XML需要什么樣的基礎?
XML非常簡單,學習容易。如果你熟悉HTML,你會發(fā)現(xiàn)它的文檔和HTML非常相似,看同樣的示例文檔(例1):
? <myfile> <title>XML Quick Start</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> </myfile> 第一行是一個XML聲明,表示文檔遵循的是XML的1.0 版的規(guī)范。 第二行定義了文檔里面的第一個元素(element),也稱為根元素: < myfile>。這個就類似HTML里的< HTML>開頭標記。注意,這個名稱是自己隨便定義的。 再下面定義了四個子元素:title,author,email,和date。分別說明文章的標題,作者,郵箱和日期。當然,你可以用中文來定義這些標簽,看上去更便于理解: <? <文章> <標題>XML輕松學習手冊</標題> <作者>ajie</作者> <信箱>ajie@aolhoo.com</信箱> <日期>20010115</日期> </文章> 這就是XML的文檔,任何掌握HTML的網友都可以直接寫出這樣簡單的XML文檔。 另外,學習XML還必須掌握一種頁面腳本語言,常見的就是JavaScript和VB script。因為XML數(shù)據是使用script實現(xiàn)HTML中調用和交互的。我們看一個最簡單的例子(例2): 1.將下面代碼存為myfile.htm <HTML> <head> <script language=" var nodes = XMLDoc.documentElement.childNodes; title.innerText = nodesitem(0).text; author.innerText = nodes.item(1).text; email.innerText = nodes.item(2).text; date.innerText = nodes.item(3).text; </script> <title>在HTML中調用XML數(shù)據</title> </head> <body bgcolor="#FFFFFF"> <b>標題: </b> <span id="title"> </span> <b>作者: </b>> <span id="author"></span> <b>信箱: </b> <span id="email"></span> <b>日期:</b> <span id="date"></span> </body> </HTML> 2.將下面代碼存為myfile.XML <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> </myfile> 3.將它們放在同一個目錄下,用IE5以上版本瀏覽器打開,可以看到效果。 學習并掌握一種script,你將真正了解到XML無比的強大的功能。 五. XML和HTML的區(qū)別 XML和HTML都來自于SGML,它們都含有標記,有著相似的語法,HTML和XML的最大區(qū)別在于:HTML是一個定型的標記語言,它用固有的標記來描述,顯示網頁內容。比如< H1>表示首行標題,有固定的尺寸。相對的,XML則沒有固定的標記,XML不能描述網頁具體的外觀,內容,它只是描述內容的數(shù)據形式和結構。 這是一個質的區(qū)別:網頁將數(shù)據和顯示混在一起,而XML則將數(shù)據和顯示分開來。 我們看上面的例子,在myfile.htm中,我們只關心頁面的顯示方式,我們可以設計不同的界面,用不同的方式來排版頁面,但數(shù)據是儲存在myfile.XML中,不需要任何改變。 (如果你是程序員,你會驚訝的發(fā)現(xiàn),這與模塊化面向對象編程的思想極其相似!其實網頁何嘗不是一種程序呢?) 正是這種區(qū)別使得XML在網絡應用和信息共享上方便,高效,可擴展。所以我們相信,XML做為一種先進的數(shù)據處理方法,將使網絡跨越到一個新的境界。 六. XML的嚴格格式 吸取HTML松散格式帶來的經驗教訓, 我們先看HTML的一些語句,這些語句在HTML中隨處可見: 1. sample 2.< b>< i>sample< /b>< /i> 3.< td>sample< /TD> 4.< font color=red>samplar< /font> 在XML文檔中,上述幾種語句的語法都是錯誤的。因為: 1.所有的標記都必須要有一個相應的結束標記; 2.所有的XML標記都必須合理嵌套; 3.所有XML標記都區(qū)分大小寫; 4.所有標記的屬性必須用""括起來; 所以上列語句在XML中正確的寫法是 1. sample 2.< b>< i>sample< /i>< /b> 3.< td>sample< /td> 4.< font color="red">samplar< /font> 另外,XML標記必須遵循下面的命名規(guī)則: 1.名字中可以包含字母、數(shù)字以及其它字母; 2.名字不能以數(shù)字或"_" (下劃線) 開頭; 3.名字不能以字母 XML (或 XML 或 Xml ..) 開頭; 4.名字中不能包含空格。 在XML文檔中任何的差錯,都會得到同一個結果:網頁不能被顯示。各瀏覽器開發(fā)商已經達成協(xié)議,對XML實行嚴格而挑剔的解析,任何細小的錯誤都會被報告。你可以將上面的myfile.xml修改一下,比如將< email>改為< Email>,然后用IE5直接打開myfile.xml,會得到一個出錯信息頁面: <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> <Email>ajie@aolhoo.com</email> <date>20010115</date> </myfile> 七. 關于XML的更多 好了,到現(xiàn)在你已經知道: 1.什么是XML; 2.XML,HTML,SGML之間的關系和區(qū)別; 3.XML的簡單應用。 恭喜你!你已經不再對XML一無所知,并且已經走在了網絡技術的前沿。整個學習過程好象并不很難哦:) 如果你對XML有更多的興趣,希望進一步了解XML的詳細資料和其它的實際運用技術,歡迎繼續(xù)瀏覽我們的下一章:XML的概念。 XML輕松學習手冊(2)XML概念 第二章 XML概念 導言 經過第一章的快速入門學習,你已經知道了 一. 擴展性 二. 標識 三. 語言 四. 結構化 五. Meta數(shù)據 六. 顯示 七. DOM 一.擴展性---使用XML,你可以為你的文檔建立自己的標記(tags)。 在HTML里,有許多固定的標記,我們必須記住然后使用它們,你不能使用HTML規(guī)范里沒有的標記。而在XML中,你能建立任何你需要的標記。你可以充分發(fā)揮你的想象力,給你的文檔起一些好記的標記名稱。比如,你的文檔里包含一些游戲的攻略,你可以建立一個名為<game>的標記,然后在<game>下再根據游戲類別建立<RPG>,<SLG>等標記。只要清晰,易于理解你可以建立任何數(shù)量的標記。 一開始你也許會不適應,因為我們在學習HTML時,有固定的標記可以直接學習和使用;(很多人包括我自己都是邊分析別人的代碼和標識,邊建立自己的網頁),而XML卻沒有任何標記可以學,也很少有文檔的標記是一模一樣的。我們怎么辦?呵呵,沒有就自己創(chuàng)建呀。一旦你真正開始寫XML文檔,你會發(fā)現(xiàn)隨心所欲的創(chuàng)造新標記也是一份很有趣的事。你可以建立有自己特色的標記,甚至建立你自己的HTML語言。 擴展性使你有更多的選擇和強大的能力,但同時也產生一個問題就是你必須學會規(guī)劃。你自己要理解自己的文檔,知道它由哪幾部分組成,相互之間的關系和如何識別它們。 關于建立標識還需要說明一點,標識是描述數(shù)據的類型或特性,比如<width>,年齡<age>,姓名<name>等,而不是數(shù)據的內容,比如:<10pxl>,<18>,<張三>,這些都是無用的標記。如果你學過數(shù)據庫,你可以這樣理解,標識就是一種字段名。 二.標識---使用XML你可以識別文檔中的元素。 不論你是HTML,還是XML,標識的本質在于便于理解,如果沒有標識,你的文檔在計算機看來只是一個很長的字符串,每個字看起來都一樣,沒有重點之分。 通過標識,你的文檔才便于閱讀和理解,你可以劃分段落,列明標題。XML中,你更可以利用其擴展性 來為文檔建立更合適的標識。 不過,有一點要提醒大家注意:標識僅僅是用來識別信息,它本身并不傳達信息。例如這樣的HTML代碼: <b>frist step<b> 這里<b>表示粗體,只用來說明是用粗體來顯示"frist step"字符,<b>本身并不包含任何實際的信息,在頁面上你看不到<b>,真正傳達信息的是"frist step "。 三.語言---使用XML你要遵循特定的語法來標識你的文檔。 在計算機領域,語言常常表示一?quot;程序語言",用來編程實現(xiàn)一些功能和應用,但不是所有的"語言"都是用來編程的,XML就只是一種用來定義標識和描述信息的語言。 下面我們來深入了解一下XML應用的其本原理,可能會很枯燥,但是對于整體的理解很重要,你可以先快速過一遍,心里有一個模糊的概念,具體精髓則需要在實踐中慢慢領會。 四.結構化---XML促使文檔結構化,所有的信息按某種關系排列。 "結構化"聽起來太抽象了,我們這樣理解,結構化就是為你的文檔建立一個框架,就象寫文章先寫一個提綱。結構化使你的文檔看起來不會雜亂無章,每一部分都緊密聯(lián)系,形成一個整體。 結構化有兩個原則: 1.每一部分(每一個元素)都和其他元素有關聯(lián)。關聯(lián)的級數(shù)就形成了結構。 2.標識本身的含義與它描述的信息相分離。 我們來看一個簡單的例子幫助理解: <? <myfile> <title>XML輕松學習手冊</title> <chapter>XML快速入門 <para>什么是XML</para> <para>使用XML的好處</para> </chapter> <chapter>XML的概念 <para>擴展性</para> <para>標識</para> </chapter> </myfile> 這是本文的XML描述文檔,可以看到標識分三級關聯(lián),非常清晰: <myfile> <chapter> <para> ... </para> </chapter> </myfile> 上面這樣的文檔結構,我們又稱之為"文檔樹",主干是父元素,如<myfile>,分支和頁是子元素,如<chapter>和<para>。 五.Meta數(shù)據(Metadata)---專業(yè)的XML使用者會使用meta數(shù)據來工作。 在HTML中我們知道可以使用meta標識來定義網頁的關鍵字,簡介等,這些標識不會顯示在網頁中,但可以被搜索引擎搜索到,并影響搜索結果的排列順序。 XML對這一原理進行了深化和擴展,用XML,你可以描述你的信息在哪里,你可以通過meta來驗證信息,執(zhí)行搜索,強制顯示,或者處理其他的數(shù)據。 下面是一些XML metadata在實際應用中的用途: 1.可以驗證數(shù)字簽名,使在線商務的提交動作(submission)有效。 2.可以被方便的建立索引和進行更有效搜索。 3.可以在不同語言之間傳輸數(shù)據。 W3C組織正在研究一種名為RDF(Resource Description Framework)的metadata處理方法,可以自動交換信息,W3C宣稱,使用RDF配合數(shù)字簽名,將使網絡中存在"真實可信"的電子商務。 六.顯示 單獨用XML不能顯示頁面,我們使用格式化技術,比如CSS或者XSL,才能顯示XML標記創(chuàng)建的文檔。 我們在前面第一章講到XML是將數(shù)據和格式分離的。XML文檔本身不知道如何來顯示,必須有輔助文件來幫助實現(xiàn)。(XML取消了所有標識,包括font,color,p等風格樣式定義標識,因此XML全部是采用類似DHTML中CSS的方法來定義文檔風格樣式。),XML中用來設定顯示風格樣式的文件類型有: 1.XSL XSL全稱是Extensible Stylesheet Language(可擴展樣式語言), 是將來設計XML文檔顯示樣式的主要文件類型。它本身也是基于XML語言的。使用XSL,你可以靈活的設置文檔顯示樣式,文檔將自動適應任何瀏覽器和PDA(掌上電腦)。 XSL也可以將XML轉化為HTML,那樣,老的瀏覽器也可以瀏覽XML文檔了。 2.CSS CSS大家很熟悉了,全稱是Cascading Style Sheets(層疊樣式表),是目前用來在瀏覽器上顯示XML文檔的主要方法。 3.Behaviors Behaviors現(xiàn)在還沒有成為標準。它是微軟的IE瀏覽器特有的功能,用它可以對XML標識設定一些有趣動作。 七.DOM DOM全稱是document object model(文檔對象模型),DOM是用來干什么的呢?假設把你的文檔看成一個單獨的對象,DOM就是如何用HTML或者XML對這個對象進行操作和控制的標準。 面向對象的思想方法已經非常流行了,在編程語言(例如java,js)中,都運用面向對象的編程思想。在XML中,就是要將網頁也作為一個對象來操作和控制,我們可以建立自己的對象和模板。與對象進行交流,如何命令對象,就要用到API。API全稱Application Programming Interface,它是訪問和操作對象的規(guī)則。而DOM就是一種詳細描述HTML/XML文檔對象規(guī)則的API。它規(guī)定了HTML/XML文檔對象的命名協(xié)定,程序模型,溝通規(guī)則等。在XML文檔中,我們可以將每一個標識元素看作一個對象---它有自己的名稱和屬性。 XML創(chuàng)建了標識,而DOM的作用就是告訴script如何在瀏覽器窗口中操作和顯示這些標識 上面我們已經簡要的講述了一些XML的基本原理,我們來看看它們之間的關聯(lián)以及它們是如何工作的,先看這里一張圖: 此主題相關圖片如下: 1. 2.CSS儲存并控制元素的顯示樣式。例如:標題將被以18pt字體顯示 3.script腳本控制元素如何動作。例如:當一個title元素"out of stock",將被用紅色顯示。 4.DOM則為腳本和對象的交流提供一個公共平臺,并將結果顯示在瀏覽器窗口。 如果任何一個部分發(fā)生錯誤,都不會得到正確結果。 好了,看到這里,我們已經對XML是如何工作的有一個整體的大致的概念。通過這一章的學習,我們可能感覺到XML似乎更偏向數(shù)據處理,更方便程序員學習。實際情況也是這樣的,XML設計的目的就是用來方便的共享和交互數(shù)據的。下一章,我們將系統(tǒng)的了解關于XML的各種術語。歡迎您繼續(xù)瀏覽。 XML輕松學習手冊(3)XML的術語 第三章 XML的術語 提綱: 導言 一.XML文檔的有關術語 二.DTD的有關術語 導言 初學XML最令人頭疼的就是有一大堆新的術語概念要理解。由于XML本身也是一個嶄新的技術,正在不斷發(fā)展和變化,各組織和各大網絡公司(微軟,IBM,SUN等)都在不斷推出自己的見解和標準,因此新概念漫天飛就不足為奇了。而國內又缺乏權威的機構或組織來對這些術語正式定名,你所看見的有關XML的中文教材大部分是靠作者本身的理解翻譯過來的,有些是正確的,有些是錯誤的,更加妨礙了我們對這些概念的理解和學習。 你下面將要看到的關于XML術語的解釋,也是作者本身的理解和翻譯。阿捷是以W3C組織發(fā)布的XML1.0標準規(guī)范和相關的正式說明文檔為根據來講述。可以確保這些理解是基本正確的,至少不是錯誤的。你如果想進一步閱讀和了解,我在本文的最后部分列明了相關資源的出處和鏈接,你可以直接訪問。好,我們轉入正題: 一.XML文檔的有關術語 什么是XML文檔?知道 <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> </myfile> XML文檔包含三個部分: 1. 一個XML文檔聲明; 2. 一個關于文檔類型的定義; 3. 用XML標識創(chuàng)建的內容。 舉例說明: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> <filelist> <myfile> <title>QUICK START OF XML</title> <author>ajie</author> </myfile> ...... </filelist> 其中第一行<? 我們來了解XML文檔中有關的術語: 1.Element(元素): 元素在HTML我們已經有所了解,它是組成HTML文檔的最小單位,在XML中也一樣。一個元素由一個標識來定義,包括開始和結束標識以及其中的內容,就象這樣:<author>ajie</author> 唯一不同的就是:在HTML中,標識是固定的,而在XML中,標識需要你自己創(chuàng)建。 2.Tag(標識) 標識是用來定義元素的。在XML中,標識必須成對出現(xiàn),將數(shù)據包圍在中間。標識的名稱和元素的名稱是一樣的。例如這樣一個元素: <author>ajie</author> 其中<author>就是標識。 3.Attribute(屬性): 什么是屬性?看這段word</font>。其中color就是font的屬性之一。 屬性是對標識進一步的描述和說明,一個標識可以有多個屬性,例如font的屬性還有size。XML中的屬性與HTML中的屬性是一樣的,每個屬性都有它自己的名字和數(shù)值,屬性是標識的一部分。舉例: <author sex="female">ajie</author> XML中屬性也是自己定義的,我們建議你盡量不使用屬性,而將屬性改成子元素,例如上面的代碼可以改成這樣: <author>ajie <sex>female</sex> </author> 原因是屬性不易擴充和被程序操作。 4.Declaration(聲明) 在所有XML文檔的第一行都有一個XML聲明。這個聲明表示這個文檔是一個XML文檔,它遵循的是哪個XML版本的規(guī)范。一個XML的聲明語句就象這樣: <? 5.DTD(文件類型定義) DTD是用來定義XML文檔中元素,屬性以及元素之間關系的。 通過DTD文件可以檢測XML文檔的結構是否正確。但建立XML文檔并不一定需要DTD文件。關于DTD文件的詳細說明我們將在下面單獨列項。 6.Well-formed XML(良好格式的XML) 一個遵守 良好格式的文檔必須以一個XML聲明開始,例如: <? 其中你必須說明文檔遵守的 良好格式的XML文檔必須有一個根元素,就是緊接著聲明后面建立的第一個元素,其它元素都是這個根元素的子元素,屬于根元素一組。 良好格式的XML文檔的內容書寫時必須遵守XML語法。(有關XML語法我們將在下一章仔細講解) 7.Valid XML(有效的XML) 一個遵守 將XML文檔和它的DTD文件進行比較分析,看是否符合DTD規(guī)則的過程叫validation(確認)。這樣的過程通常我們是通過一個名為parser的軟件來處理的。 有效的XML文檔也必須以一個XML聲明開始,例如: <? 和上面例子不同的,在standalone(獨立)屬性中,這里設置的是"no",因為它必須和相應的DTD一起使用,DTD文件的定義方法如下: <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 二.DTD的有關術語 什么是DTD,我們上面已經簡略提到。DTD是一種保證XML文檔格式正確的有效方法,可以比較XML文檔和DTD文件來看文檔是否符合規(guī)范,元素和標簽使用是否正確。一個DTD文檔包含:元素的定義規(guī)則,元素間關系的定義規(guī)則,元素可使用的屬性,可使用的實體或符號規(guī)則。 DTD文件也是一個ASCII的文本文件,后綴名為.dtd。例如:myfile.dtd。 為什么要用DTD文件呢?我的理解是它滿足了網絡共享和數(shù)據交互,使用DTD最大的好處在于DTD文件的共享。(就是上文DTD說明語句中的PUBLIC屬性)。比如,兩個相同行業(yè)不同地區(qū)的人使用同一個DTD文件來作為文檔創(chuàng)建規(guī)范,那么他們的數(shù)據就很容易交換和共享。網上有其他人想補充數(shù)據,也只需要根據公用的DTD規(guī)范來建立文檔,就立刻可以加入。 目前,已經有數(shù)量眾多的寫好的DTD文件可以利用。針對不同的行業(yè)和應用,這些DTD文件已經建立了通用的元素和標簽規(guī)則。你不需要自己重新創(chuàng)建,只要在他們的基礎上加入你需要的新標識。 當然,如果愿意,你可以創(chuàng)建自己的DTD,它可能和你的文檔配合的更加完美。建立自己的DTD也是很簡單的一件事,一般只需要定義4-5個元素就可以了。 調用DTD文件的方法有兩種: 1.直接包含在XML文檔內的DTD 你只要在DOCTYPE聲明中插入一些特別的說明就可以了,象這樣: 我們有一個XML文檔: <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 我們在第一行后面插入下面代碼就可以: <!DOCTYPE myfile [ <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> <!ENTITY copyright "Copyright 2001, Ajie."> ]> 2.調用獨立的DTD文件 將DTD文檔存為.dtd的文件,然后在DOCTYPE聲明行中調用,例如,將下面的代碼存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 然后在XML文檔中調用,在第一行后插入: <!DOCTYPE myfile SYSTEM "myfile.dtd"> 我們可以看到DTD文檔和HTML中js的調用是差不多的,關于DTD文檔具體如何寫,我們將在下一章和XML文檔的語法一起介紹。 下面我們來了解DTD有關的術語: 1.Schema(規(guī)劃) schema是數(shù)據規(guī)則的描述。schema做兩件事: a.它定義元素數(shù)據類型和元素之間的關系; b.它定義元素所能包含的內容類型。 DTD就是關于XML文檔的一個schema。 2.Document Tree(文檔樹) "文檔樹"在前面第二章我們已經提到過,它是文檔元素分級結構的形象表示。一個文檔結構樹包含根元素,根元素是最頂級的元素,(就是緊接著XML聲明語句后的第一個元素)。看例子: <? <filelist> <myfile> <title>...</title> <author>...</author> </myfile> </filelist> 上面的例子分三級結構排列成"樹"狀,其中的<filelist>就是根元素。在XML和DTD文件中,第一個定義的都是根元素。 3.Parent Element(父元素)/Child Element(子元素) 父元素是指包含有其它元素的元素,被包含的元素稱為它的子元素??瓷厦娴?結構樹",其中<myfile>是父元素,<title>,<author>是它的子元素,而<myfile>又是<filelist>的子元素。象<title>這樣沒有包含任何子元素的最后一級元素我們也稱之為"頁元素"。 4.Parser(解析軟件) Parser是一種檢查XML文檔是否遵循DTD規(guī)范的工具軟件。 Parser能獨立使用,也可以成為編輯軟件或瀏覽器的一部分。在后面的相關資源列表里,我列出了當前比較流行的一些parsers。 好了,通過第三章的學習,我們已經了解了一些XML和DTD的基本術語,但是我們還不知道怎樣來寫這些文件,需要遵循什么樣的語法,在下一章,將重點介紹有關撰寫XML和DTD文檔的語法。請繼續(xù)瀏覽,謝謝! XML輕松學習手冊(4)XML語法 第四章 XML語法 提綱: 一.XML語法規(guī)則 二.元素的語法 三.注釋的語法 四.CDATA的語法 五.Namespaces的語法 六.entity的語法 七.DTD的語法 通過前面三章的學習,我們已經對什么是XML,它的實現(xiàn)原理以及相關的術語有所了解。接下來我們就開始學習XML的語法規(guī)范,動手寫自己的XML文檔。 一.XML語法規(guī)則 XML的文檔和HTML的原代碼類似,也是用標識來標識內容。創(chuàng)建XML文檔必須遵守下列重要規(guī)則: 規(guī)則1:必須有XML聲明語句 這一點我們在上一章學習時已經提到過。聲明是XML文檔的第一句,其格式如下: <? 聲明的作用是告訴瀏覽器或者其它處理程序:這個文檔是XML文檔。聲明語句中的version表示文檔遵守的XML規(guī)范的版本;standalone表示文檔是否附帶DTD文件,如果有,參數(shù)為no;encoding表示文檔所用的語言編碼,默認是UTF-8。 規(guī)則2:是否有DTD文件 如果文檔是一個"有效的 <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 規(guī)則3:注意你的大小寫 在XML文檔中,大小寫是有區(qū)別的。<P>和<p>是不同的標識。注意在寫元素時,前后標識大小寫要保持一樣。例如:<Author>ajie</Author>,寫成<Author>ajie</author>是錯誤的。 你最好養(yǎng)成一種習慣,或者全部大寫,或者全部小寫,或者大寫第一個字母。這樣可以減少因為大小寫不匹配產生的文檔錯誤。 規(guī)則4:給屬性值加引號 在HTML代碼里面,屬性值可以加引號,也可以不加。例如:<font color=red> 但是在XML中則規(guī)定,所有屬性值必須加引號(可以是單引號,也可以是雙引號),否則將被視為錯誤。 規(guī)則5:所有的標識必須有相應的結束標識 在HTML中,標識可能不是成對出現(xiàn)的,比?lt;br>。而在XML中規(guī)定,所有標識必須成對出現(xiàn),有一個開始標識,就必須有一個結束標識。否則將被視為錯誤。 規(guī)則6:所有的空標識也必須被關閉 空標識就是標識對之間沒有內容的標識。比如 ,<img>等標識。在XML中,規(guī)定所有的標識必須有結束標識,針對這樣的空標識,XML中處理的方法是在原標識最后加/,就可以了。例如: 應寫為<br />; <META name="keyXML, SGML, <IMG src= "cool.gif">應寫為<IMG src= "cool.gif" /> 第四章 XML語法 二.元素的語法 元素由一對標識以及其中的內容組成。就象這樣:ajie。元素的名稱和標識的名稱是一樣的。標識可以用屬性來進一步描述。 在XML中,沒有任何保留字,所以你可以隨心所欲的用任何詞語來作為元素名稱。但是也必須遵守下列規(guī)范: 1.名稱中可以包含字母、數(shù)字以及其它字母; 2.名稱不能以數(shù)字或"_" (下劃線)開頭; 3.名稱不能以字母 XML(或 XML 或 Xml ..)開頭 4.名稱中不能包含空格 5.名稱中間不能包含":"(冒號) 為了使元素更容易閱讀理解和操作,我們還有一些建議: 1.名稱中不要使用"."。因為在很多程序語言中,"."是作為對象的屬性,例如:font.color。同樣的原因"-"也最好不要用,必須使用的,以"_"代替; 2.名稱盡量簡短。 3.名稱的大小寫盡量采用同一標準。 4.名稱可以使用非英文字符,比如用中文。但是有些軟件可能不支持。(IE5目前是支持中文元素的。) 另外,補充一點關于屬性的說明。在word</font>將把word顯示為紅色。而在CSS或者XSL,我們在下面詳細講述。) 三.注釋的語法 注釋是為了便于閱讀和理解,在XML文檔添加的附加信息,將不會被程序解釋或則瀏覽器顯示。 注釋的語法如下: <!-- 這里是注釋信息 --> 可以看到,它和HTML中的注釋語法是一樣的,非常容易。養(yǎng)成良好的注釋習慣將使你的文檔更加便于維護,共享,看起來也更專業(yè)。 四.CDATA的語法 CDATA全稱character data,翻譯為字符數(shù)據。我們在寫 <![CDATA[這里放置需要顯示的字符]]> 例如: <![CDATA[<AUTHOR sex="female">ajie</AUTHOR>]]> 在頁面上顯示的內容將是"<AUTHOR sex="female">ajie</AUTHOR>" 第四章 XML語法 五.Namespaces的語法 Namespaces翻譯為名字空間。名字空間有什么作用呢?當我們在一個XML文檔中使用他人的或者多個DTD文件,就會出現(xiàn)這樣的矛盾:因為XML中標識都是自己創(chuàng)建的,在不同的DTD文件中,標識名可能相同但表示的含義不同,這就可能引起數(shù)據混亂。 比如在一個文檔<table>wood table</table>中<table>表示桌子, 而在另一個文檔<table>namelist</table>中<table>表示表格。如果我需要同時處理這兩個文檔,就會發(fā)生名字沖突。 了解決這個問題,我們引進了namespaces這個概念。namespaces通過給標識名稱加一個網址(URL)定位的方法來區(qū)別這些名稱相同的標識。 Namespaces同樣需要在XML文檔的開頭部分聲明,聲明的語法如下: <document 其中yourname是由你定義的namespaces的名稱,URL就是名字空間的網址。 假設上面的"桌子<table>"文檔來自http://www.zhuozi.com,我們就可以聲明為 <document http://www.zhuozi.com'> 然后在后面的標識中使用定義好的名字空間: <zhuozi:table>wood table</table> 這樣就將這兩個<table>區(qū)分開來。注意的是:設置URL并不是說這個標識真的要到那個網址去讀取,僅僅作為一種區(qū)別的標志而已。 六.entity的語法 entity翻譯為"實體"。它的作用類似 entity可以包含字符,文字等等,使用entity的好處在于:1.它可以減少差錯,文檔中多個相同的部分只需要輸入一遍就可以了。2.它提高維護效率。比如你有40個文檔都包含copyright的entity,如果需要修改這個copyright,不需要所有的文件都修改,只要改最初定義的entity語句就可以了。 XML定義了兩種類型的entity。一種是我們這里說的普通entity,在XML文檔中使用;另一種是參數(shù)entity,在DTD文件中使用。 entity的定義語法為: <!DOCTYPE filename [ <!ENTITY entity-name "entity-content" ] > 例如我要定義一段版權信息: <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved" ] > 如果我的版權信息內容和他人共享一個XML文件,也可以使用外部調用的方法,語法象這樣: <!DOCTYPE copyright [ <!ENTITY copyright SYSTEM "http://www.sample.com/copyright. ] > 定義好的entity在文檔中的引用語法為:&entity-name; 例如,上面定義的版權信息,調用時寫作?copyright; 完整的例子如下,你可以copy下來存為copyright.XML觀看實例: <? <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved"> ]> <myfile> <title>XML</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> ©right; </myfile> 第四章 XML語法 七.DTD的語法 DTD是"有效 1.設置元素 元素是XML文檔的基本組成部分。你要在DTD中定義一個元素,然后在XML文檔中使用。元素的定義語法為:<!ELEMENT DESCRIPTION (#PCDATA, DEFINITION)*> 說明: "<!ELEMENT" 是元素的聲明,說明你要定義的是一個元素; 聲明后面的"DESCRIPTION",是元素的名稱; "(#PCDATA, DEFINITION)*>"則是該元素的使用規(guī)則。規(guī)則定義了元素可以包含的內容以及相互的關系。下面的表格概要列出了元素的規(guī)則: 2.元素規(guī)則表: 此主題相關圖片如下: 另外,我們還可以為元素定義屬性,因為我們不推薦使用屬性,在這里就不詳細展開了。 最后,我們來總結一些前四章學習的內容,寫一個包含DTD,XML,以及Script的簡單實例,便于讀者理解: 1.將下面文件存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 2.然后建立XML文檔myfile.xml: <? <!DOCTYPE myfile SYSTEM "myfile.dtd"> <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 3.建立HTML文檔myfile.html <HTML> <head> <script language=" var nodes = XMLDoc.documentElement.childNodes; title.innerText = nodes.item(0).text; author.innerText = nodes.item(1).text; </script> <title>在HTML中調用XML數(shù)據</title> </head> <body bgcolor="#FFFFFF"> <b>標題: </b> <span id="title"></span><br> <b>作者: </b> <span id="author"></span><br> </body> </HTML> 4.用IE5.0以上瀏覽器打開myfile.HTML就可以看到效果了。 XML輕松學習手冊(5)XML實例解析 第五章:XML實例解析 提綱: 一:實例效果 二:實例解析 1.定義新標識。 2.建立XML文檔。 3.建立相應的HTML文件。 XML在不同領域有著廣泛的應用,比如在科技領域的MathML,無線通信應用的WML,在網絡圖象方面的SVG等等,我們這里側重討論XML在web上的應用。XML在web上應用主要是利用其強大的數(shù)據操作能力。一般用XML配合JavaScript和ASP等服務器端程序,可以實現(xiàn)網絡上幾乎所有的應用需求。 考慮講解方便,我們在下面介紹一個簡單的實例,不包含服務器端程序。目的在于讓您對XML的數(shù)據操作能力有一個感性的認識。 好,我們首先[ 點擊這里 ]來看實例的效果。(請用IE5.0以上版本瀏覽器打開) 這是一個簡單的CD唱片數(shù)據檢索功能。你通過點擊"上一張","下一張"可以看到單張CD的有關信息。這樣的效果我們原來用兩種方法可以實現(xiàn): 1.利用DHTML,將數(shù)據隱藏在不同的層中,通過鼠標事件依次顯示; 2.利用后臺程序(如ASP,CGI,PHP,JSP等),調用服務器端的數(shù)據。 但是在這個實例中,我們打開頁面原代碼可以看到,其中沒有用DHTML的DIV,也沒有表單的action,它完全是用XML來實現(xiàn)的。下面我們來分析它的制作過程: 第一步:定義新標識。 根據實際的CD數(shù)據,首先新建一個名為<CD>的標識;其次建立它相關的數(shù)據標識,分別是:CD名稱<Title>,演唱者<Artist>,出版年代<Year>,國家<Country>,發(fā)行公司<Company>和價格<Price>;最后還要建立一個名為目錄<CATALOG>的標識。為什么要再建立一個<CATALOG>標識呢?因為在XML文檔中規(guī)定,必須且只能有一個根元素(標識),我們有多個CD數(shù)據,這些數(shù)據是并列的關系,所以需要為這些并列的元素建立一個根元素。 以上元素的定義和關系都完全符合XML標準,不需要特別的DTD文件來定義,所以可以省略DTD定義。如果我們想使用DTD來定義,以上過程可以表示為: <!ELEMENT CATALOG (CD)*> <!ELEMENT CD (Title,Artist,Year,Country,Company,Price)> <!ELEMENT Title (#PCDATA)> <!ELEMENT Artist (#PCDATA)> <!ELEMENT Year (#PCDATA)> <!ELEMENT Country (#PCDATA)> <!ELEMENT Company (#PCDATA)> <!ELEMENT Price (#PCDATA)> 這段代碼表示:元素CATALOG包含多個CD子元素,而子元素CD又依次包含Title, Artist, Year, Country, Company, Price 六個子元素,它們的內容都定義為文本(字符,數(shù)字,文本)。(注:具體的語法說明可以看上一章關于DTD的介紹) 第二步:建立XML文檔。 <? <CATALOG> <CD> <TITLE>Empire Burlesque</TITLE> <ARTIST>Bob Dylan</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>Columbia</COMPANY> <PRICE>10.90</PRICE> <YEAR>1985</YEAR> </CD> <CD> <TITLE>Hide your heart</TITLE> <ARTIST>Bonnie Tylor</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>CBS Records</COMPANY> <PRICE>9.90</PRICE> <YEAR>1988</YEAR> </CD> <CD> <TITLE>Greatest Hits</TITLE> <ARTIST>Dolly Parton</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>RCA</COMPANY> <PRICE>9.90</PRICE> <YEAR>1982</YEAR> </CD> <CD> <TITLE>Still got the blues</TITLE> <ARTIST>Gary More</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>Virgin redords</COMPANY> <PRICE>10.20</PRICE> <YEAR>1990</YEAR> </CD> <CD> <TITLE>Eros</TITLE> <ARTIST>Eros Ramazzotti</ARTIST> <COUNTRY>EU</COUNTRY> <COMPANY>BMG</COMPANY> <PRICE>9.90</PRICE> <YEAR>1997</YEAR> </CD> </CATALOG> 上面代碼首先用<? <CATALOG> <CD> ...... </CD> <CD> ...... </CD> </CATALOG> 一共定義了5組數(shù)據。我們將上面的代碼存為cd.XML文件,以備調用。 第三步:建立相應的HTML文件。 1.導入XML數(shù)據。 我們知道,目前流行的瀏覽器中,暫時只有微軟的IE5.0以上版本瀏覽器支持XML。IE是通過在 CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> 定義一個object,ID名為XMLdso。然后在head區(qū)用js引入xml數(shù)據: <script for="window" event="onload"> </script> 2.捆綁數(shù)據。 然后將用<SPAN>標識來將XML數(shù)據綁定在表格中。其中ID,DATASRC,DTATFLD都是<SPAN>的屬性。代碼如下: <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> 3.動作操作。 最后,為數(shù)據提供瀏覽按鈕: <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> 并利用js來完成兩個鼠標點擊功能:movenext()和moveprevious()。在head區(qū)加入如下代碼: <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> 好,我們先看HTML文件的全部原代碼: <HTML> <head> <script for="window" event="onload"> </script> <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> <TITLE>CD Navigate</TITLE> </head> <body> <p> <object WIDTH="0" HEIGHT="0" CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> <p> <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> </p> </body> </HTML> 將以上代碼存為cd.htm文件,于第二步的cd.XML文件放在一起。打開cd.htm文件,你就看見和上面實例一樣的效果了。 好,到今天為止,我們已經學習了關于XML的不少知識,我們來總結一下前面五個章節(jié),分別是XML快速入門,XML的概念原理,XML的術語,XML的語法和本章的實例解析。到這里,教程部分就結束了。在寫作過程中,阿捷盡最大努力將有關XML概念講得通俗易懂,盡量把自己的理解告訴給大家,但因為本人學習XML時間也不長,對整個XML的技術把握還不夠系統(tǒng)和深入,所以難免有疏漏的地方,請大家指正和諒解,謝謝! posted on 2009-02-15 15:45 YXY 閱讀(187) 評論(0) 編輯 收藏
第一行是一個XML聲明,表示文檔遵循的是XML的1.0 版的規(guī)范。
第二行定義了文檔里面的第一個元素(element),也稱為根元素: < myfile>。這個就類似HTML里的< HTML>開頭標記。注意,這個名稱是自己隨便定義的。
再下面定義了四個子元素:title,author,email,和date。分別說明文章的標題,作者,郵箱和日期。當然,你可以用中文來定義這些標簽,看上去更便于理解: <? <文章> <標題>XML輕松學習手冊</標題> <作者>ajie</作者> <信箱>ajie@aolhoo.com</信箱> <日期>20010115</日期> </文章> 這就是XML的文檔,任何掌握HTML的網友都可以直接寫出這樣簡單的XML文檔。 另外,學習XML還必須掌握一種頁面腳本語言,常見的就是JavaScript和VB script。因為XML數(shù)據是使用script實現(xiàn)HTML中調用和交互的。我們看一個最簡單的例子(例2): 1.將下面代碼存為myfile.htm <HTML> <head> <script language=" var nodes = XMLDoc.documentElement.childNodes; title.innerText = nodesitem(0).text; author.innerText = nodes.item(1).text; email.innerText = nodes.item(2).text; date.innerText = nodes.item(3).text; </script> <title>在HTML中調用XML數(shù)據</title> </head> <body bgcolor="#FFFFFF"> <b>標題: </b> <span id="title"> </span> <b>作者: </b>> <span id="author"></span> <b>信箱: </b> <span id="email"></span> <b>日期:</b> <span id="date"></span> </body> </HTML> 2.將下面代碼存為myfile.XML <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> </myfile> 3.將它們放在同一個目錄下,用IE5以上版本瀏覽器打開,可以看到效果。 學習并掌握一種script,你將真正了解到XML無比的強大的功能。 五. XML和HTML的區(qū)別 XML和HTML都來自于SGML,它們都含有標記,有著相似的語法,HTML和XML的最大區(qū)別在于:HTML是一個定型的標記語言,它用固有的標記來描述,顯示網頁內容。比如< H1>表示首行標題,有固定的尺寸。相對的,XML則沒有固定的標記,XML不能描述網頁具體的外觀,內容,它只是描述內容的數(shù)據形式和結構。 這是一個質的區(qū)別:網頁將數(shù)據和顯示混在一起,而XML則將數(shù)據和顯示分開來。 我們看上面的例子,在myfile.htm中,我們只關心頁面的顯示方式,我們可以設計不同的界面,用不同的方式來排版頁面,但數(shù)據是儲存在myfile.XML中,不需要任何改變。 (如果你是程序員,你會驚訝的發(fā)現(xiàn),這與模塊化面向對象編程的思想極其相似!其實網頁何嘗不是一種程序呢?) 正是這種區(qū)別使得XML在網絡應用和信息共享上方便,高效,可擴展。所以我們相信,XML做為一種先進的數(shù)據處理方法,將使網絡跨越到一個新的境界。 六. XML的嚴格格式 吸取HTML松散格式帶來的經驗教訓, 我們先看HTML的一些語句,這些語句在HTML中隨處可見: 1. sample 2.< b>< i>sample< /b>< /i> 3.< td>sample< /TD> 4.< font color=red>samplar< /font> 在XML文檔中,上述幾種語句的語法都是錯誤的。因為: 1.所有的標記都必須要有一個相應的結束標記; 2.所有的XML標記都必須合理嵌套; 3.所有XML標記都區(qū)分大小寫; 4.所有標記的屬性必須用""括起來; 所以上列語句在XML中正確的寫法是 1. sample 2.< b>< i>sample< /i>< /b> 3.< td>sample< /td> 4.< font color="red">samplar< /font> 另外,XML標記必須遵循下面的命名規(guī)則: 1.名字中可以包含字母、數(shù)字以及其它字母; 2.名字不能以數(shù)字或"_" (下劃線) 開頭; 3.名字不能以字母 XML (或 XML 或 Xml ..) 開頭; 4.名字中不能包含空格。 在XML文檔中任何的差錯,都會得到同一個結果:網頁不能被顯示。各瀏覽器開發(fā)商已經達成協(xié)議,對XML實行嚴格而挑剔的解析,任何細小的錯誤都會被報告。你可以將上面的myfile.xml修改一下,比如將< email>改為< Email>,然后用IE5直接打開myfile.xml,會得到一個出錯信息頁面: <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> <Email>ajie@aolhoo.com</email> <date>20010115</date> </myfile> 七. 關于XML的更多 好了,到現(xiàn)在你已經知道: 1.什么是XML; 2.XML,HTML,SGML之間的關系和區(qū)別; 3.XML的簡單應用。 恭喜你!你已經不再對XML一無所知,并且已經走在了網絡技術的前沿。整個學習過程好象并不很難哦:) 如果你對XML有更多的興趣,希望進一步了解XML的詳細資料和其它的實際運用技術,歡迎繼續(xù)瀏覽我們的下一章:XML的概念。 XML輕松學習手冊(2)XML概念 第二章 XML概念 導言 經過第一章的快速入門學習,你已經知道了 一. 擴展性 二. 標識 三. 語言 四. 結構化 五. Meta數(shù)據 六. 顯示 七. DOM 一.擴展性---使用XML,你可以為你的文檔建立自己的標記(tags)。 在HTML里,有許多固定的標記,我們必須記住然后使用它們,你不能使用HTML規(guī)范里沒有的標記。而在XML中,你能建立任何你需要的標記。你可以充分發(fā)揮你的想象力,給你的文檔起一些好記的標記名稱。比如,你的文檔里包含一些游戲的攻略,你可以建立一個名為<game>的標記,然后在<game>下再根據游戲類別建立<RPG>,<SLG>等標記。只要清晰,易于理解你可以建立任何數(shù)量的標記。 一開始你也許會不適應,因為我們在學習HTML時,有固定的標記可以直接學習和使用;(很多人包括我自己都是邊分析別人的代碼和標識,邊建立自己的網頁),而XML卻沒有任何標記可以學,也很少有文檔的標記是一模一樣的。我們怎么辦?呵呵,沒有就自己創(chuàng)建呀。一旦你真正開始寫XML文檔,你會發(fā)現(xiàn)隨心所欲的創(chuàng)造新標記也是一份很有趣的事。你可以建立有自己特色的標記,甚至建立你自己的HTML語言。 擴展性使你有更多的選擇和強大的能力,但同時也產生一個問題就是你必須學會規(guī)劃。你自己要理解自己的文檔,知道它由哪幾部分組成,相互之間的關系和如何識別它們。 關于建立標識還需要說明一點,標識是描述數(shù)據的類型或特性,比如<width>,年齡<age>,姓名<name>等,而不是數(shù)據的內容,比如:<10pxl>,<18>,<張三>,這些都是無用的標記。如果你學過數(shù)據庫,你可以這樣理解,標識就是一種字段名。 二.標識---使用XML你可以識別文檔中的元素。 不論你是HTML,還是XML,標識的本質在于便于理解,如果沒有標識,你的文檔在計算機看來只是一個很長的字符串,每個字看起來都一樣,沒有重點之分。 通過標識,你的文檔才便于閱讀和理解,你可以劃分段落,列明標題。XML中,你更可以利用其擴展性 來為文檔建立更合適的標識。 不過,有一點要提醒大家注意:標識僅僅是用來識別信息,它本身并不傳達信息。例如這樣的HTML代碼: <b>frist step<b> 這里<b>表示粗體,只用來說明是用粗體來顯示"frist step"字符,<b>本身并不包含任何實際的信息,在頁面上你看不到<b>,真正傳達信息的是"frist step "。 三.語言---使用XML你要遵循特定的語法來標識你的文檔。 在計算機領域,語言常常表示一?quot;程序語言",用來編程實現(xiàn)一些功能和應用,但不是所有的"語言"都是用來編程的,XML就只是一種用來定義標識和描述信息的語言。 下面我們來深入了解一下XML應用的其本原理,可能會很枯燥,但是對于整體的理解很重要,你可以先快速過一遍,心里有一個模糊的概念,具體精髓則需要在實踐中慢慢領會。 四.結構化---XML促使文檔結構化,所有的信息按某種關系排列。 "結構化"聽起來太抽象了,我們這樣理解,結構化就是為你的文檔建立一個框架,就象寫文章先寫一個提綱。結構化使你的文檔看起來不會雜亂無章,每一部分都緊密聯(lián)系,形成一個整體。 結構化有兩個原則: 1.每一部分(每一個元素)都和其他元素有關聯(lián)。關聯(lián)的級數(shù)就形成了結構。 2.標識本身的含義與它描述的信息相分離。 我們來看一個簡單的例子幫助理解: <? <myfile> <title>XML輕松學習手冊</title> <chapter>XML快速入門 <para>什么是XML</para> <para>使用XML的好處</para> </chapter> <chapter>XML的概念 <para>擴展性</para> <para>標識</para> </chapter> </myfile> 這是本文的XML描述文檔,可以看到標識分三級關聯(lián),非常清晰: <myfile> <chapter> <para> ... </para> </chapter> </myfile> 上面這樣的文檔結構,我們又稱之為"文檔樹",主干是父元素,如<myfile>,分支和頁是子元素,如<chapter>和<para>。 五.Meta數(shù)據(Metadata)---專業(yè)的XML使用者會使用meta數(shù)據來工作。 在HTML中我們知道可以使用meta標識來定義網頁的關鍵字,簡介等,這些標識不會顯示在網頁中,但可以被搜索引擎搜索到,并影響搜索結果的排列順序。 XML對這一原理進行了深化和擴展,用XML,你可以描述你的信息在哪里,你可以通過meta來驗證信息,執(zhí)行搜索,強制顯示,或者處理其他的數(shù)據。 下面是一些XML metadata在實際應用中的用途: 1.可以驗證數(shù)字簽名,使在線商務的提交動作(submission)有效。 2.可以被方便的建立索引和進行更有效搜索。 3.可以在不同語言之間傳輸數(shù)據。 W3C組織正在研究一種名為RDF(Resource Description Framework)的metadata處理方法,可以自動交換信息,W3C宣稱,使用RDF配合數(shù)字簽名,將使網絡中存在"真實可信"的電子商務。 六.顯示 單獨用XML不能顯示頁面,我們使用格式化技術,比如CSS或者XSL,才能顯示XML標記創(chuàng)建的文檔。 我們在前面第一章講到XML是將數(shù)據和格式分離的。XML文檔本身不知道如何來顯示,必須有輔助文件來幫助實現(xiàn)。(XML取消了所有標識,包括font,color,p等風格樣式定義標識,因此XML全部是采用類似DHTML中CSS的方法來定義文檔風格樣式。),XML中用來設定顯示風格樣式的文件類型有: 1.XSL XSL全稱是Extensible Stylesheet Language(可擴展樣式語言), 是將來設計XML文檔顯示樣式的主要文件類型。它本身也是基于XML語言的。使用XSL,你可以靈活的設置文檔顯示樣式,文檔將自動適應任何瀏覽器和PDA(掌上電腦)。 XSL也可以將XML轉化為HTML,那樣,老的瀏覽器也可以瀏覽XML文檔了。 2.CSS CSS大家很熟悉了,全稱是Cascading Style Sheets(層疊樣式表),是目前用來在瀏覽器上顯示XML文檔的主要方法。 3.Behaviors Behaviors現(xiàn)在還沒有成為標準。它是微軟的IE瀏覽器特有的功能,用它可以對XML標識設定一些有趣動作。 七.DOM DOM全稱是document object model(文檔對象模型),DOM是用來干什么的呢?假設把你的文檔看成一個單獨的對象,DOM就是如何用HTML或者XML對這個對象進行操作和控制的標準。 面向對象的思想方法已經非常流行了,在編程語言(例如java,js)中,都運用面向對象的編程思想。在XML中,就是要將網頁也作為一個對象來操作和控制,我們可以建立自己的對象和模板。與對象進行交流,如何命令對象,就要用到API。API全稱Application Programming Interface,它是訪問和操作對象的規(guī)則。而DOM就是一種詳細描述HTML/XML文檔對象規(guī)則的API。它規(guī)定了HTML/XML文檔對象的命名協(xié)定,程序模型,溝通規(guī)則等。在XML文檔中,我們可以將每一個標識元素看作一個對象---它有自己的名稱和屬性。 XML創(chuàng)建了標識,而DOM的作用就是告訴script如何在瀏覽器窗口中操作和顯示這些標識 上面我們已經簡要的講述了一些XML的基本原理,我們來看看它們之間的關聯(lián)以及它們是如何工作的,先看這里一張圖: 此主題相關圖片如下: 1. 2.CSS儲存并控制元素的顯示樣式。例如:標題將被以18pt字體顯示 3.script腳本控制元素如何動作。例如:當一個title元素"out of stock",將被用紅色顯示。 4.DOM則為腳本和對象的交流提供一個公共平臺,并將結果顯示在瀏覽器窗口。 如果任何一個部分發(fā)生錯誤,都不會得到正確結果。 好了,看到這里,我們已經對XML是如何工作的有一個整體的大致的概念。通過這一章的學習,我們可能感覺到XML似乎更偏向數(shù)據處理,更方便程序員學習。實際情況也是這樣的,XML設計的目的就是用來方便的共享和交互數(shù)據的。下一章,我們將系統(tǒng)的了解關于XML的各種術語。歡迎您繼續(xù)瀏覽。 XML輕松學習手冊(3)XML的術語 第三章 XML的術語 提綱: 導言 一.XML文檔的有關術語 二.DTD的有關術語 導言 初學XML最令人頭疼的就是有一大堆新的術語概念要理解。由于XML本身也是一個嶄新的技術,正在不斷發(fā)展和變化,各組織和各大網絡公司(微軟,IBM,SUN等)都在不斷推出自己的見解和標準,因此新概念漫天飛就不足為奇了。而國內又缺乏權威的機構或組織來對這些術語正式定名,你所看見的有關XML的中文教材大部分是靠作者本身的理解翻譯過來的,有些是正確的,有些是錯誤的,更加妨礙了我們對這些概念的理解和學習。 你下面將要看到的關于XML術語的解釋,也是作者本身的理解和翻譯。阿捷是以W3C組織發(fā)布的XML1.0標準規(guī)范和相關的正式說明文檔為根據來講述。可以確保這些理解是基本正確的,至少不是錯誤的。你如果想進一步閱讀和了解,我在本文的最后部分列明了相關資源的出處和鏈接,你可以直接訪問。好,我們轉入正題: 一.XML文檔的有關術語 什么是XML文檔?知道 <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> </myfile> XML文檔包含三個部分: 1. 一個XML文檔聲明; 2. 一個關于文檔類型的定義; 3. 用XML標識創(chuàng)建的內容。 舉例說明: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> <filelist> <myfile> <title>QUICK START OF XML</title> <author>ajie</author> </myfile> ...... </filelist> 其中第一行<? 我們來了解XML文檔中有關的術語: 1.Element(元素): 元素在HTML我們已經有所了解,它是組成HTML文檔的最小單位,在XML中也一樣。一個元素由一個標識來定義,包括開始和結束標識以及其中的內容,就象這樣:<author>ajie</author> 唯一不同的就是:在HTML中,標識是固定的,而在XML中,標識需要你自己創(chuàng)建。 2.Tag(標識) 標識是用來定義元素的。在XML中,標識必須成對出現(xiàn),將數(shù)據包圍在中間。標識的名稱和元素的名稱是一樣的。例如這樣一個元素: <author>ajie</author> 其中<author>就是標識。 3.Attribute(屬性): 什么是屬性?看這段word</font>。其中color就是font的屬性之一。 屬性是對標識進一步的描述和說明,一個標識可以有多個屬性,例如font的屬性還有size。XML中的屬性與HTML中的屬性是一樣的,每個屬性都有它自己的名字和數(shù)值,屬性是標識的一部分。舉例: <author sex="female">ajie</author> XML中屬性也是自己定義的,我們建議你盡量不使用屬性,而將屬性改成子元素,例如上面的代碼可以改成這樣: <author>ajie <sex>female</sex> </author> 原因是屬性不易擴充和被程序操作。 4.Declaration(聲明) 在所有XML文檔的第一行都有一個XML聲明。這個聲明表示這個文檔是一個XML文檔,它遵循的是哪個XML版本的規(guī)范。一個XML的聲明語句就象這樣: <? 5.DTD(文件類型定義) DTD是用來定義XML文檔中元素,屬性以及元素之間關系的。 通過DTD文件可以檢測XML文檔的結構是否正確。但建立XML文檔并不一定需要DTD文件。關于DTD文件的詳細說明我們將在下面單獨列項。 6.Well-formed XML(良好格式的XML) 一個遵守 良好格式的文檔必須以一個XML聲明開始,例如: <? 其中你必須說明文檔遵守的 良好格式的XML文檔必須有一個根元素,就是緊接著聲明后面建立的第一個元素,其它元素都是這個根元素的子元素,屬于根元素一組。 良好格式的XML文檔的內容書寫時必須遵守XML語法。(有關XML語法我們將在下一章仔細講解) 7.Valid XML(有效的XML) 一個遵守 將XML文檔和它的DTD文件進行比較分析,看是否符合DTD規(guī)則的過程叫validation(確認)。這樣的過程通常我們是通過一個名為parser的軟件來處理的。 有效的XML文檔也必須以一個XML聲明開始,例如: <? 和上面例子不同的,在standalone(獨立)屬性中,這里設置的是"no",因為它必須和相應的DTD一起使用,DTD文件的定義方法如下: <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 二.DTD的有關術語 什么是DTD,我們上面已經簡略提到。DTD是一種保證XML文檔格式正確的有效方法,可以比較XML文檔和DTD文件來看文檔是否符合規(guī)范,元素和標簽使用是否正確。一個DTD文檔包含:元素的定義規(guī)則,元素間關系的定義規(guī)則,元素可使用的屬性,可使用的實體或符號規(guī)則。 DTD文件也是一個ASCII的文本文件,后綴名為.dtd。例如:myfile.dtd。 為什么要用DTD文件呢?我的理解是它滿足了網絡共享和數(shù)據交互,使用DTD最大的好處在于DTD文件的共享。(就是上文DTD說明語句中的PUBLIC屬性)。比如,兩個相同行業(yè)不同地區(qū)的人使用同一個DTD文件來作為文檔創(chuàng)建規(guī)范,那么他們的數(shù)據就很容易交換和共享。網上有其他人想補充數(shù)據,也只需要根據公用的DTD規(guī)范來建立文檔,就立刻可以加入。 目前,已經有數(shù)量眾多的寫好的DTD文件可以利用。針對不同的行業(yè)和應用,這些DTD文件已經建立了通用的元素和標簽規(guī)則。你不需要自己重新創(chuàng)建,只要在他們的基礎上加入你需要的新標識。 當然,如果愿意,你可以創(chuàng)建自己的DTD,它可能和你的文檔配合的更加完美。建立自己的DTD也是很簡單的一件事,一般只需要定義4-5個元素就可以了。 調用DTD文件的方法有兩種: 1.直接包含在XML文檔內的DTD 你只要在DOCTYPE聲明中插入一些特別的說明就可以了,象這樣: 我們有一個XML文檔: <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 我們在第一行后面插入下面代碼就可以: <!DOCTYPE myfile [ <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> <!ENTITY copyright "Copyright 2001, Ajie."> ]> 2.調用獨立的DTD文件 將DTD文檔存為.dtd的文件,然后在DOCTYPE聲明行中調用,例如,將下面的代碼存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 然后在XML文檔中調用,在第一行后插入: <!DOCTYPE myfile SYSTEM "myfile.dtd"> 我們可以看到DTD文檔和HTML中js的調用是差不多的,關于DTD文檔具體如何寫,我們將在下一章和XML文檔的語法一起介紹。 下面我們來了解DTD有關的術語: 1.Schema(規(guī)劃) schema是數(shù)據規(guī)則的描述。schema做兩件事: a.它定義元素數(shù)據類型和元素之間的關系; b.它定義元素所能包含的內容類型。 DTD就是關于XML文檔的一個schema。 2.Document Tree(文檔樹) "文檔樹"在前面第二章我們已經提到過,它是文檔元素分級結構的形象表示。一個文檔結構樹包含根元素,根元素是最頂級的元素,(就是緊接著XML聲明語句后的第一個元素)。看例子: <? <filelist> <myfile> <title>...</title> <author>...</author> </myfile> </filelist> 上面的例子分三級結構排列成"樹"狀,其中的<filelist>就是根元素。在XML和DTD文件中,第一個定義的都是根元素。 3.Parent Element(父元素)/Child Element(子元素) 父元素是指包含有其它元素的元素,被包含的元素稱為它的子元素??瓷厦娴?結構樹",其中<myfile>是父元素,<title>,<author>是它的子元素,而<myfile>又是<filelist>的子元素。象<title>這樣沒有包含任何子元素的最后一級元素我們也稱之為"頁元素"。 4.Parser(解析軟件) Parser是一種檢查XML文檔是否遵循DTD規(guī)范的工具軟件。 Parser能獨立使用,也可以成為編輯軟件或瀏覽器的一部分。在后面的相關資源列表里,我列出了當前比較流行的一些parsers。 好了,通過第三章的學習,我們已經了解了一些XML和DTD的基本術語,但是我們還不知道怎樣來寫這些文件,需要遵循什么樣的語法,在下一章,將重點介紹有關撰寫XML和DTD文檔的語法。請繼續(xù)瀏覽,謝謝! XML輕松學習手冊(4)XML語法 第四章 XML語法 提綱: 一.XML語法規(guī)則 二.元素的語法 三.注釋的語法 四.CDATA的語法 五.Namespaces的語法 六.entity的語法 七.DTD的語法 通過前面三章的學習,我們已經對什么是XML,它的實現(xiàn)原理以及相關的術語有所了解。接下來我們就開始學習XML的語法規(guī)范,動手寫自己的XML文檔。 一.XML語法規(guī)則 XML的文檔和HTML的原代碼類似,也是用標識來標識內容。創(chuàng)建XML文檔必須遵守下列重要規(guī)則: 規(guī)則1:必須有XML聲明語句 這一點我們在上一章學習時已經提到過。聲明是XML文檔的第一句,其格式如下: <? 聲明的作用是告訴瀏覽器或者其它處理程序:這個文檔是XML文檔。聲明語句中的version表示文檔遵守的XML規(guī)范的版本;standalone表示文檔是否附帶DTD文件,如果有,參數(shù)為no;encoding表示文檔所用的語言編碼,默認是UTF-8。 規(guī)則2:是否有DTD文件 如果文檔是一個"有效的 <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 規(guī)則3:注意你的大小寫 在XML文檔中,大小寫是有區(qū)別的。<P>和<p>是不同的標識。注意在寫元素時,前后標識大小寫要保持一樣。例如:<Author>ajie</Author>,寫成<Author>ajie</author>是錯誤的。 你最好養(yǎng)成一種習慣,或者全部大寫,或者全部小寫,或者大寫第一個字母。這樣可以減少因為大小寫不匹配產生的文檔錯誤。 規(guī)則4:給屬性值加引號 在HTML代碼里面,屬性值可以加引號,也可以不加。例如:<font color=red> 但是在XML中則規(guī)定,所有屬性值必須加引號(可以是單引號,也可以是雙引號),否則將被視為錯誤。 規(guī)則5:所有的標識必須有相應的結束標識 在HTML中,標識可能不是成對出現(xiàn)的,比?lt;br>。而在XML中規(guī)定,所有標識必須成對出現(xiàn),有一個開始標識,就必須有一個結束標識。否則將被視為錯誤。 規(guī)則6:所有的空標識也必須被關閉 空標識就是標識對之間沒有內容的標識。比如 ,<img>等標識。在XML中,規(guī)定所有的標識必須有結束標識,針對這樣的空標識,XML中處理的方法是在原標識最后加/,就可以了。例如: 應寫為<br />; <META name="keyXML, SGML, <IMG src= "cool.gif">應寫為<IMG src= "cool.gif" /> 第四章 XML語法 二.元素的語法 元素由一對標識以及其中的內容組成。就象這樣:ajie。元素的名稱和標識的名稱是一樣的。標識可以用屬性來進一步描述。 在XML中,沒有任何保留字,所以你可以隨心所欲的用任何詞語來作為元素名稱。但是也必須遵守下列規(guī)范: 1.名稱中可以包含字母、數(shù)字以及其它字母; 2.名稱不能以數(shù)字或"_" (下劃線)開頭; 3.名稱不能以字母 XML(或 XML 或 Xml ..)開頭 4.名稱中不能包含空格 5.名稱中間不能包含":"(冒號) 為了使元素更容易閱讀理解和操作,我們還有一些建議: 1.名稱中不要使用"."。因為在很多程序語言中,"."是作為對象的屬性,例如:font.color。同樣的原因"-"也最好不要用,必須使用的,以"_"代替; 2.名稱盡量簡短。 3.名稱的大小寫盡量采用同一標準。 4.名稱可以使用非英文字符,比如用中文。但是有些軟件可能不支持。(IE5目前是支持中文元素的。) 另外,補充一點關于屬性的說明。在word</font>將把word顯示為紅色。而在CSS或者XSL,我們在下面詳細講述。) 三.注釋的語法 注釋是為了便于閱讀和理解,在XML文檔添加的附加信息,將不會被程序解釋或則瀏覽器顯示。 注釋的語法如下: <!-- 這里是注釋信息 --> 可以看到,它和HTML中的注釋語法是一樣的,非常容易。養(yǎng)成良好的注釋習慣將使你的文檔更加便于維護,共享,看起來也更專業(yè)。 四.CDATA的語法 CDATA全稱character data,翻譯為字符數(shù)據。我們在寫 <![CDATA[這里放置需要顯示的字符]]> 例如: <![CDATA[<AUTHOR sex="female">ajie</AUTHOR>]]> 在頁面上顯示的內容將是"<AUTHOR sex="female">ajie</AUTHOR>" 第四章 XML語法 五.Namespaces的語法 Namespaces翻譯為名字空間。名字空間有什么作用呢?當我們在一個XML文檔中使用他人的或者多個DTD文件,就會出現(xiàn)這樣的矛盾:因為XML中標識都是自己創(chuàng)建的,在不同的DTD文件中,標識名可能相同但表示的含義不同,這就可能引起數(shù)據混亂。 比如在一個文檔<table>wood table</table>中<table>表示桌子, 而在另一個文檔<table>namelist</table>中<table>表示表格。如果我需要同時處理這兩個文檔,就會發(fā)生名字沖突。 了解決這個問題,我們引進了namespaces這個概念。namespaces通過給標識名稱加一個網址(URL)定位的方法來區(qū)別這些名稱相同的標識。 Namespaces同樣需要在XML文檔的開頭部分聲明,聲明的語法如下: <document 其中yourname是由你定義的namespaces的名稱,URL就是名字空間的網址。 假設上面的"桌子<table>"文檔來自http://www.zhuozi.com,我們就可以聲明為 <document http://www.zhuozi.com'> 然后在后面的標識中使用定義好的名字空間: <zhuozi:table>wood table</table> 這樣就將這兩個<table>區(qū)分開來。注意的是:設置URL并不是說這個標識真的要到那個網址去讀取,僅僅作為一種區(qū)別的標志而已。 六.entity的語法 entity翻譯為"實體"。它的作用類似 entity可以包含字符,文字等等,使用entity的好處在于:1.它可以減少差錯,文檔中多個相同的部分只需要輸入一遍就可以了。2.它提高維護效率。比如你有40個文檔都包含copyright的entity,如果需要修改這個copyright,不需要所有的文件都修改,只要改最初定義的entity語句就可以了。 XML定義了兩種類型的entity。一種是我們這里說的普通entity,在XML文檔中使用;另一種是參數(shù)entity,在DTD文件中使用。 entity的定義語法為: <!DOCTYPE filename [ <!ENTITY entity-name "entity-content" ] > 例如我要定義一段版權信息: <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved" ] > 如果我的版權信息內容和他人共享一個XML文件,也可以使用外部調用的方法,語法象這樣: <!DOCTYPE copyright [ <!ENTITY copyright SYSTEM "http://www.sample.com/copyright. ] > 定義好的entity在文檔中的引用語法為:&entity-name; 例如,上面定義的版權信息,調用時寫作?copyright; 完整的例子如下,你可以copy下來存為copyright.XML觀看實例: <? <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved"> ]> <myfile> <title>XML</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> ©right; </myfile> 第四章 XML語法 七.DTD的語法 DTD是"有效 1.設置元素 元素是XML文檔的基本組成部分。你要在DTD中定義一個元素,然后在XML文檔中使用。元素的定義語法為:<!ELEMENT DESCRIPTION (#PCDATA, DEFINITION)*> 說明: "<!ELEMENT" 是元素的聲明,說明你要定義的是一個元素; 聲明后面的"DESCRIPTION",是元素的名稱; "(#PCDATA, DEFINITION)*>"則是該元素的使用規(guī)則。規(guī)則定義了元素可以包含的內容以及相互的關系。下面的表格概要列出了元素的規(guī)則: 2.元素規(guī)則表: 此主題相關圖片如下: 另外,我們還可以為元素定義屬性,因為我們不推薦使用屬性,在這里就不詳細展開了。 最后,我們來總結一些前四章學習的內容,寫一個包含DTD,XML,以及Script的簡單實例,便于讀者理解: 1.將下面文件存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 2.然后建立XML文檔myfile.xml: <? <!DOCTYPE myfile SYSTEM "myfile.dtd"> <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 3.建立HTML文檔myfile.html <HTML> <head> <script language=" var nodes = XMLDoc.documentElement.childNodes; title.innerText = nodes.item(0).text; author.innerText = nodes.item(1).text; </script> <title>在HTML中調用XML數(shù)據</title> </head> <body bgcolor="#FFFFFF"> <b>標題: </b> <span id="title"></span><br> <b>作者: </b> <span id="author"></span><br> </body> </HTML> 4.用IE5.0以上瀏覽器打開myfile.HTML就可以看到效果了。 XML輕松學習手冊(5)XML實例解析 第五章:XML實例解析 提綱: 一:實例效果 二:實例解析 1.定義新標識。 2.建立XML文檔。 3.建立相應的HTML文件。 XML在不同領域有著廣泛的應用,比如在科技領域的MathML,無線通信應用的WML,在網絡圖象方面的SVG等等,我們這里側重討論XML在web上的應用。XML在web上應用主要是利用其強大的數(shù)據操作能力。一般用XML配合JavaScript和ASP等服務器端程序,可以實現(xiàn)網絡上幾乎所有的應用需求。 考慮講解方便,我們在下面介紹一個簡單的實例,不包含服務器端程序。目的在于讓您對XML的數(shù)據操作能力有一個感性的認識。 好,我們首先[ 點擊這里 ]來看實例的效果。(請用IE5.0以上版本瀏覽器打開) 這是一個簡單的CD唱片數(shù)據檢索功能。你通過點擊"上一張","下一張"可以看到單張CD的有關信息。這樣的效果我們原來用兩種方法可以實現(xiàn): 1.利用DHTML,將數(shù)據隱藏在不同的層中,通過鼠標事件依次顯示; 2.利用后臺程序(如ASP,CGI,PHP,JSP等),調用服務器端的數(shù)據。 但是在這個實例中,我們打開頁面原代碼可以看到,其中沒有用DHTML的DIV,也沒有表單的action,它完全是用XML來實現(xiàn)的。下面我們來分析它的制作過程: 第一步:定義新標識。 根據實際的CD數(shù)據,首先新建一個名為<CD>的標識;其次建立它相關的數(shù)據標識,分別是:CD名稱<Title>,演唱者<Artist>,出版年代<Year>,國家<Country>,發(fā)行公司<Company>和價格<Price>;最后還要建立一個名為目錄<CATALOG>的標識。為什么要再建立一個<CATALOG>標識呢?因為在XML文檔中規(guī)定,必須且只能有一個根元素(標識),我們有多個CD數(shù)據,這些數(shù)據是并列的關系,所以需要為這些并列的元素建立一個根元素。 以上元素的定義和關系都完全符合XML標準,不需要特別的DTD文件來定義,所以可以省略DTD定義。如果我們想使用DTD來定義,以上過程可以表示為: <!ELEMENT CATALOG (CD)*> <!ELEMENT CD (Title,Artist,Year,Country,Company,Price)> <!ELEMENT Title (#PCDATA)> <!ELEMENT Artist (#PCDATA)> <!ELEMENT Year (#PCDATA)> <!ELEMENT Country (#PCDATA)> <!ELEMENT Company (#PCDATA)> <!ELEMENT Price (#PCDATA)> 這段代碼表示:元素CATALOG包含多個CD子元素,而子元素CD又依次包含Title, Artist, Year, Country, Company, Price 六個子元素,它們的內容都定義為文本(字符,數(shù)字,文本)。(注:具體的語法說明可以看上一章關于DTD的介紹) 第二步:建立XML文檔。 <? <CATALOG> <CD> <TITLE>Empire Burlesque</TITLE> <ARTIST>Bob Dylan</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>Columbia</COMPANY> <PRICE>10.90</PRICE> <YEAR>1985</YEAR> </CD> <CD> <TITLE>Hide your heart</TITLE> <ARTIST>Bonnie Tylor</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>CBS Records</COMPANY> <PRICE>9.90</PRICE> <YEAR>1988</YEAR> </CD> <CD> <TITLE>Greatest Hits</TITLE> <ARTIST>Dolly Parton</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>RCA</COMPANY> <PRICE>9.90</PRICE> <YEAR>1982</YEAR> </CD> <CD> <TITLE>Still got the blues</TITLE> <ARTIST>Gary More</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>Virgin redords</COMPANY> <PRICE>10.20</PRICE> <YEAR>1990</YEAR> </CD> <CD> <TITLE>Eros</TITLE> <ARTIST>Eros Ramazzotti</ARTIST> <COUNTRY>EU</COUNTRY> <COMPANY>BMG</COMPANY> <PRICE>9.90</PRICE> <YEAR>1997</YEAR> </CD> </CATALOG> 上面代碼首先用<? <CATALOG> <CD> ...... </CD> <CD> ...... </CD> </CATALOG> 一共定義了5組數(shù)據。我們將上面的代碼存為cd.XML文件,以備調用。 第三步:建立相應的HTML文件。 1.導入XML數(shù)據。 我們知道,目前流行的瀏覽器中,暫時只有微軟的IE5.0以上版本瀏覽器支持XML。IE是通過在 CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> 定義一個object,ID名為XMLdso。然后在head區(qū)用js引入xml數(shù)據: <script for="window" event="onload"> </script> 2.捆綁數(shù)據。 然后將用<SPAN>標識來將XML數(shù)據綁定在表格中。其中ID,DATASRC,DTATFLD都是<SPAN>的屬性。代碼如下: <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> 3.動作操作。 最后,為數(shù)據提供瀏覽按鈕: <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> 并利用js來完成兩個鼠標點擊功能:movenext()和moveprevious()。在head區(qū)加入如下代碼: <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> 好,我們先看HTML文件的全部原代碼: <HTML> <head> <script for="window" event="onload"> </script> <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> <TITLE>CD Navigate</TITLE> </head> <body> <p> <object WIDTH="0" HEIGHT="0" CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> <p> <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> </p> </body> </HTML> 將以上代碼存為cd.htm文件,于第二步的cd.XML文件放在一起。打開cd.htm文件,你就看見和上面實例一樣的效果了。 好,到今天為止,我們已經學習了關于XML的不少知識,我們來總結一下前面五個章節(jié),分別是XML快速入門,XML的概念原理,XML的術語,XML的語法和本章的實例解析。到這里,教程部分就結束了。在寫作過程中,阿捷盡最大努力將有關XML概念講得通俗易懂,盡量把自己的理解告訴給大家,但因為本人學習XML時間也不長,對整個XML的技術把握還不夠系統(tǒng)和深入,所以難免有疏漏的地方,請大家指正和諒解,謝謝! posted on 2009-02-15 15:45 YXY 閱讀(187) 評論(0) 編輯 收藏
<文章>
<標題>XML輕松學習手冊</標題>
<作者>ajie</作者>
<信箱>ajie@aolhoo.com</信箱>
<日期>20010115</日期>
</文章>
這就是XML的文檔,任何掌握HTML的網友都可以直接寫出這樣簡單的XML文檔。
另外,學習XML還必須掌握一種頁面腳本語言,常見的就是JavaScript和VB script。因為XML數(shù)據是使用script實現(xiàn)HTML中調用和交互的。我們看一個最簡單的例子(例2):
1.將下面代碼存為myfile.htm
<HTML>
<head>
<script language=" var nodes = XMLDoc.documentElement.childNodes; title.innerText = nodesitem(0).text; author.innerText = nodes.item(1).text; email.innerText = nodes.item(2).text; date.innerText = nodes.item(3).text; </script> <title>在HTML中調用XML數(shù)據</title> </head> <body bgcolor="#FFFFFF"> <b>標題: </b> <span id="title"> </span> <b>作者: </b>> <span id="author"></span> <b>信箱: </b> <span id="email"></span> <b>日期:</b> <span id="date"></span> </body> </HTML> 2.將下面代碼存為myfile.XML <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> </myfile> 3.將它們放在同一個目錄下,用IE5以上版本瀏覽器打開,可以看到效果。 學習并掌握一種script,你將真正了解到XML無比的強大的功能。 五. XML和HTML的區(qū)別 XML和HTML都來自于SGML,它們都含有標記,有著相似的語法,HTML和XML的最大區(qū)別在于:HTML是一個定型的標記語言,它用固有的標記來描述,顯示網頁內容。比如< H1>表示首行標題,有固定的尺寸。相對的,XML則沒有固定的標記,XML不能描述網頁具體的外觀,內容,它只是描述內容的數(shù)據形式和結構。 這是一個質的區(qū)別:網頁將數(shù)據和顯示混在一起,而XML則將數(shù)據和顯示分開來。 我們看上面的例子,在myfile.htm中,我們只關心頁面的顯示方式,我們可以設計不同的界面,用不同的方式來排版頁面,但數(shù)據是儲存在myfile.XML中,不需要任何改變。 (如果你是程序員,你會驚訝的發(fā)現(xiàn),這與模塊化面向對象編程的思想極其相似!其實網頁何嘗不是一種程序呢?) 正是這種區(qū)別使得XML在網絡應用和信息共享上方便,高效,可擴展。所以我們相信,XML做為一種先進的數(shù)據處理方法,將使網絡跨越到一個新的境界。 六. XML的嚴格格式 吸取HTML松散格式帶來的經驗教訓, 我們先看HTML的一些語句,這些語句在HTML中隨處可見: 1. sample 2.< b>< i>sample< /b>< /i> 3.< td>sample< /TD> 4.< font color=red>samplar< /font> 在XML文檔中,上述幾種語句的語法都是錯誤的。因為: 1.所有的標記都必須要有一個相應的結束標記; 2.所有的XML標記都必須合理嵌套; 3.所有XML標記都區(qū)分大小寫; 4.所有標記的屬性必須用""括起來; 所以上列語句在XML中正確的寫法是 1. sample 2.< b>< i>sample< /i>< /b> 3.< td>sample< /td> 4.< font color="red">samplar< /font> 另外,XML標記必須遵循下面的命名規(guī)則: 1.名字中可以包含字母、數(shù)字以及其它字母; 2.名字不能以數(shù)字或"_" (下劃線) 開頭; 3.名字不能以字母 XML (或 XML 或 Xml ..) 開頭; 4.名字中不能包含空格。 在XML文檔中任何的差錯,都會得到同一個結果:網頁不能被顯示。各瀏覽器開發(fā)商已經達成協(xié)議,對XML實行嚴格而挑剔的解析,任何細小的錯誤都會被報告。你可以將上面的myfile.xml修改一下,比如將< email>改為< Email>,然后用IE5直接打開myfile.xml,會得到一個出錯信息頁面: <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> <Email>ajie@aolhoo.com</email> <date>20010115</date> </myfile> 七. 關于XML的更多 好了,到現(xiàn)在你已經知道: 1.什么是XML; 2.XML,HTML,SGML之間的關系和區(qū)別; 3.XML的簡單應用。 恭喜你!你已經不再對XML一無所知,并且已經走在了網絡技術的前沿。整個學習過程好象并不很難哦:) 如果你對XML有更多的興趣,希望進一步了解XML的詳細資料和其它的實際運用技術,歡迎繼續(xù)瀏覽我們的下一章:XML的概念。 XML輕松學習手冊(2)XML概念 第二章 XML概念 導言 經過第一章的快速入門學習,你已經知道了 一. 擴展性 二. 標識 三. 語言 四. 結構化 五. Meta數(shù)據 六. 顯示 七. DOM 一.擴展性---使用XML,你可以為你的文檔建立自己的標記(tags)。 在HTML里,有許多固定的標記,我們必須記住然后使用它們,你不能使用HTML規(guī)范里沒有的標記。而在XML中,你能建立任何你需要的標記。你可以充分發(fā)揮你的想象力,給你的文檔起一些好記的標記名稱。比如,你的文檔里包含一些游戲的攻略,你可以建立一個名為<game>的標記,然后在<game>下再根據游戲類別建立<RPG>,<SLG>等標記。只要清晰,易于理解你可以建立任何數(shù)量的標記。 一開始你也許會不適應,因為我們在學習HTML時,有固定的標記可以直接學習和使用;(很多人包括我自己都是邊分析別人的代碼和標識,邊建立自己的網頁),而XML卻沒有任何標記可以學,也很少有文檔的標記是一模一樣的。我們怎么辦?呵呵,沒有就自己創(chuàng)建呀。一旦你真正開始寫XML文檔,你會發(fā)現(xiàn)隨心所欲的創(chuàng)造新標記也是一份很有趣的事。你可以建立有自己特色的標記,甚至建立你自己的HTML語言。 擴展性使你有更多的選擇和強大的能力,但同時也產生一個問題就是你必須學會規(guī)劃。你自己要理解自己的文檔,知道它由哪幾部分組成,相互之間的關系和如何識別它們。 關于建立標識還需要說明一點,標識是描述數(shù)據的類型或特性,比如<width>,年齡<age>,姓名<name>等,而不是數(shù)據的內容,比如:<10pxl>,<18>,<張三>,這些都是無用的標記。如果你學過數(shù)據庫,你可以這樣理解,標識就是一種字段名。 二.標識---使用XML你可以識別文檔中的元素。 不論你是HTML,還是XML,標識的本質在于便于理解,如果沒有標識,你的文檔在計算機看來只是一個很長的字符串,每個字看起來都一樣,沒有重點之分。 通過標識,你的文檔才便于閱讀和理解,你可以劃分段落,列明標題。XML中,你更可以利用其擴展性 來為文檔建立更合適的標識。 不過,有一點要提醒大家注意:標識僅僅是用來識別信息,它本身并不傳達信息。例如這樣的HTML代碼: <b>frist step<b> 這里<b>表示粗體,只用來說明是用粗體來顯示"frist step"字符,<b>本身并不包含任何實際的信息,在頁面上你看不到<b>,真正傳達信息的是"frist step "。 三.語言---使用XML你要遵循特定的語法來標識你的文檔。 在計算機領域,語言常常表示一?quot;程序語言",用來編程實現(xiàn)一些功能和應用,但不是所有的"語言"都是用來編程的,XML就只是一種用來定義標識和描述信息的語言。 下面我們來深入了解一下XML應用的其本原理,可能會很枯燥,但是對于整體的理解很重要,你可以先快速過一遍,心里有一個模糊的概念,具體精髓則需要在實踐中慢慢領會。 四.結構化---XML促使文檔結構化,所有的信息按某種關系排列。 "結構化"聽起來太抽象了,我們這樣理解,結構化就是為你的文檔建立一個框架,就象寫文章先寫一個提綱。結構化使你的文檔看起來不會雜亂無章,每一部分都緊密聯(lián)系,形成一個整體。 結構化有兩個原則: 1.每一部分(每一個元素)都和其他元素有關聯(lián)。關聯(lián)的級數(shù)就形成了結構。 2.標識本身的含義與它描述的信息相分離。 我們來看一個簡單的例子幫助理解: <? <myfile> <title>XML輕松學習手冊</title> <chapter>XML快速入門 <para>什么是XML</para> <para>使用XML的好處</para> </chapter> <chapter>XML的概念 <para>擴展性</para> <para>標識</para> </chapter> </myfile> 這是本文的XML描述文檔,可以看到標識分三級關聯(lián),非常清晰: <myfile> <chapter> <para> ... </para> </chapter> </myfile> 上面這樣的文檔結構,我們又稱之為"文檔樹",主干是父元素,如<myfile>,分支和頁是子元素,如<chapter>和<para>。 五.Meta數(shù)據(Metadata)---專業(yè)的XML使用者會使用meta數(shù)據來工作。 在HTML中我們知道可以使用meta標識來定義網頁的關鍵字,簡介等,這些標識不會顯示在網頁中,但可以被搜索引擎搜索到,并影響搜索結果的排列順序。 XML對這一原理進行了深化和擴展,用XML,你可以描述你的信息在哪里,你可以通過meta來驗證信息,執(zhí)行搜索,強制顯示,或者處理其他的數(shù)據。 下面是一些XML metadata在實際應用中的用途: 1.可以驗證數(shù)字簽名,使在線商務的提交動作(submission)有效。 2.可以被方便的建立索引和進行更有效搜索。 3.可以在不同語言之間傳輸數(shù)據。 W3C組織正在研究一種名為RDF(Resource Description Framework)的metadata處理方法,可以自動交換信息,W3C宣稱,使用RDF配合數(shù)字簽名,將使網絡中存在"真實可信"的電子商務。 六.顯示 單獨用XML不能顯示頁面,我們使用格式化技術,比如CSS或者XSL,才能顯示XML標記創(chuàng)建的文檔。 我們在前面第一章講到XML是將數(shù)據和格式分離的。XML文檔本身不知道如何來顯示,必須有輔助文件來幫助實現(xiàn)。(XML取消了所有標識,包括font,color,p等風格樣式定義標識,因此XML全部是采用類似DHTML中CSS的方法來定義文檔風格樣式。),XML中用來設定顯示風格樣式的文件類型有: 1.XSL XSL全稱是Extensible Stylesheet Language(可擴展樣式語言), 是將來設計XML文檔顯示樣式的主要文件類型。它本身也是基于XML語言的。使用XSL,你可以靈活的設置文檔顯示樣式,文檔將自動適應任何瀏覽器和PDA(掌上電腦)。 XSL也可以將XML轉化為HTML,那樣,老的瀏覽器也可以瀏覽XML文檔了。 2.CSS CSS大家很熟悉了,全稱是Cascading Style Sheets(層疊樣式表),是目前用來在瀏覽器上顯示XML文檔的主要方法。 3.Behaviors Behaviors現(xiàn)在還沒有成為標準。它是微軟的IE瀏覽器特有的功能,用它可以對XML標識設定一些有趣動作。 七.DOM DOM全稱是document object model(文檔對象模型),DOM是用來干什么的呢?假設把你的文檔看成一個單獨的對象,DOM就是如何用HTML或者XML對這個對象進行操作和控制的標準。 面向對象的思想方法已經非常流行了,在編程語言(例如java,js)中,都運用面向對象的編程思想。在XML中,就是要將網頁也作為一個對象來操作和控制,我們可以建立自己的對象和模板。與對象進行交流,如何命令對象,就要用到API。API全稱Application Programming Interface,它是訪問和操作對象的規(guī)則。而DOM就是一種詳細描述HTML/XML文檔對象規(guī)則的API。它規(guī)定了HTML/XML文檔對象的命名協(xié)定,程序模型,溝通規(guī)則等。在XML文檔中,我們可以將每一個標識元素看作一個對象---它有自己的名稱和屬性。 XML創(chuàng)建了標識,而DOM的作用就是告訴script如何在瀏覽器窗口中操作和顯示這些標識 上面我們已經簡要的講述了一些XML的基本原理,我們來看看它們之間的關聯(lián)以及它們是如何工作的,先看這里一張圖: 此主題相關圖片如下: 1. 2.CSS儲存并控制元素的顯示樣式。例如:標題將被以18pt字體顯示 3.script腳本控制元素如何動作。例如:當一個title元素"out of stock",將被用紅色顯示。 4.DOM則為腳本和對象的交流提供一個公共平臺,并將結果顯示在瀏覽器窗口。 如果任何一個部分發(fā)生錯誤,都不會得到正確結果。 好了,看到這里,我們已經對XML是如何工作的有一個整體的大致的概念。通過這一章的學習,我們可能感覺到XML似乎更偏向數(shù)據處理,更方便程序員學習。實際情況也是這樣的,XML設計的目的就是用來方便的共享和交互數(shù)據的。下一章,我們將系統(tǒng)的了解關于XML的各種術語。歡迎您繼續(xù)瀏覽。 XML輕松學習手冊(3)XML的術語 第三章 XML的術語 提綱: 導言 一.XML文檔的有關術語 二.DTD的有關術語 導言 初學XML最令人頭疼的就是有一大堆新的術語概念要理解。由于XML本身也是一個嶄新的技術,正在不斷發(fā)展和變化,各組織和各大網絡公司(微軟,IBM,SUN等)都在不斷推出自己的見解和標準,因此新概念漫天飛就不足為奇了。而國內又缺乏權威的機構或組織來對這些術語正式定名,你所看見的有關XML的中文教材大部分是靠作者本身的理解翻譯過來的,有些是正確的,有些是錯誤的,更加妨礙了我們對這些概念的理解和學習。 你下面將要看到的關于XML術語的解釋,也是作者本身的理解和翻譯。阿捷是以W3C組織發(fā)布的XML1.0標準規(guī)范和相關的正式說明文檔為根據來講述。可以確保這些理解是基本正確的,至少不是錯誤的。你如果想進一步閱讀和了解,我在本文的最后部分列明了相關資源的出處和鏈接,你可以直接訪問。好,我們轉入正題: 一.XML文檔的有關術語 什么是XML文檔?知道 <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> </myfile> XML文檔包含三個部分: 1. 一個XML文檔聲明; 2. 一個關于文檔類型的定義; 3. 用XML標識創(chuàng)建的內容。 舉例說明: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> <filelist> <myfile> <title>QUICK START OF XML</title> <author>ajie</author> </myfile> ...... </filelist> 其中第一行<? 我們來了解XML文檔中有關的術語: 1.Element(元素): 元素在HTML我們已經有所了解,它是組成HTML文檔的最小單位,在XML中也一樣。一個元素由一個標識來定義,包括開始和結束標識以及其中的內容,就象這樣:<author>ajie</author> 唯一不同的就是:在HTML中,標識是固定的,而在XML中,標識需要你自己創(chuàng)建。 2.Tag(標識) 標識是用來定義元素的。在XML中,標識必須成對出現(xiàn),將數(shù)據包圍在中間。標識的名稱和元素的名稱是一樣的。例如這樣一個元素: <author>ajie</author> 其中<author>就是標識。 3.Attribute(屬性): 什么是屬性?看這段word</font>。其中color就是font的屬性之一。 屬性是對標識進一步的描述和說明,一個標識可以有多個屬性,例如font的屬性還有size。XML中的屬性與HTML中的屬性是一樣的,每個屬性都有它自己的名字和數(shù)值,屬性是標識的一部分。舉例: <author sex="female">ajie</author> XML中屬性也是自己定義的,我們建議你盡量不使用屬性,而將屬性改成子元素,例如上面的代碼可以改成這樣: <author>ajie <sex>female</sex> </author> 原因是屬性不易擴充和被程序操作。 4.Declaration(聲明) 在所有XML文檔的第一行都有一個XML聲明。這個聲明表示這個文檔是一個XML文檔,它遵循的是哪個XML版本的規(guī)范。一個XML的聲明語句就象這樣: <? 5.DTD(文件類型定義) DTD是用來定義XML文檔中元素,屬性以及元素之間關系的。 通過DTD文件可以檢測XML文檔的結構是否正確。但建立XML文檔并不一定需要DTD文件。關于DTD文件的詳細說明我們將在下面單獨列項。 6.Well-formed XML(良好格式的XML) 一個遵守 良好格式的文檔必須以一個XML聲明開始,例如: <? 其中你必須說明文檔遵守的 良好格式的XML文檔必須有一個根元素,就是緊接著聲明后面建立的第一個元素,其它元素都是這個根元素的子元素,屬于根元素一組。 良好格式的XML文檔的內容書寫時必須遵守XML語法。(有關XML語法我們將在下一章仔細講解) 7.Valid XML(有效的XML) 一個遵守 將XML文檔和它的DTD文件進行比較分析,看是否符合DTD規(guī)則的過程叫validation(確認)。這樣的過程通常我們是通過一個名為parser的軟件來處理的。 有效的XML文檔也必須以一個XML聲明開始,例如: <? 和上面例子不同的,在standalone(獨立)屬性中,這里設置的是"no",因為它必須和相應的DTD一起使用,DTD文件的定義方法如下: <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 二.DTD的有關術語 什么是DTD,我們上面已經簡略提到。DTD是一種保證XML文檔格式正確的有效方法,可以比較XML文檔和DTD文件來看文檔是否符合規(guī)范,元素和標簽使用是否正確。一個DTD文檔包含:元素的定義規(guī)則,元素間關系的定義規(guī)則,元素可使用的屬性,可使用的實體或符號規(guī)則。 DTD文件也是一個ASCII的文本文件,后綴名為.dtd。例如:myfile.dtd。 為什么要用DTD文件呢?我的理解是它滿足了網絡共享和數(shù)據交互,使用DTD最大的好處在于DTD文件的共享。(就是上文DTD說明語句中的PUBLIC屬性)。比如,兩個相同行業(yè)不同地區(qū)的人使用同一個DTD文件來作為文檔創(chuàng)建規(guī)范,那么他們的數(shù)據就很容易交換和共享。網上有其他人想補充數(shù)據,也只需要根據公用的DTD規(guī)范來建立文檔,就立刻可以加入。 目前,已經有數(shù)量眾多的寫好的DTD文件可以利用。針對不同的行業(yè)和應用,這些DTD文件已經建立了通用的元素和標簽規(guī)則。你不需要自己重新創(chuàng)建,只要在他們的基礎上加入你需要的新標識。 當然,如果愿意,你可以創(chuàng)建自己的DTD,它可能和你的文檔配合的更加完美。建立自己的DTD也是很簡單的一件事,一般只需要定義4-5個元素就可以了。 調用DTD文件的方法有兩種: 1.直接包含在XML文檔內的DTD 你只要在DOCTYPE聲明中插入一些特別的說明就可以了,象這樣: 我們有一個XML文檔: <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 我們在第一行后面插入下面代碼就可以: <!DOCTYPE myfile [ <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> <!ENTITY copyright "Copyright 2001, Ajie."> ]> 2.調用獨立的DTD文件 將DTD文檔存為.dtd的文件,然后在DOCTYPE聲明行中調用,例如,將下面的代碼存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 然后在XML文檔中調用,在第一行后插入: <!DOCTYPE myfile SYSTEM "myfile.dtd"> 我們可以看到DTD文檔和HTML中js的調用是差不多的,關于DTD文檔具體如何寫,我們將在下一章和XML文檔的語法一起介紹。 下面我們來了解DTD有關的術語: 1.Schema(規(guī)劃) schema是數(shù)據規(guī)則的描述。schema做兩件事: a.它定義元素數(shù)據類型和元素之間的關系; b.它定義元素所能包含的內容類型。 DTD就是關于XML文檔的一個schema。 2.Document Tree(文檔樹) "文檔樹"在前面第二章我們已經提到過,它是文檔元素分級結構的形象表示。一個文檔結構樹包含根元素,根元素是最頂級的元素,(就是緊接著XML聲明語句后的第一個元素)。看例子: <? <filelist> <myfile> <title>...</title> <author>...</author> </myfile> </filelist> 上面的例子分三級結構排列成"樹"狀,其中的<filelist>就是根元素。在XML和DTD文件中,第一個定義的都是根元素。 3.Parent Element(父元素)/Child Element(子元素) 父元素是指包含有其它元素的元素,被包含的元素稱為它的子元素??瓷厦娴?結構樹",其中<myfile>是父元素,<title>,<author>是它的子元素,而<myfile>又是<filelist>的子元素。象<title>這樣沒有包含任何子元素的最后一級元素我們也稱之為"頁元素"。 4.Parser(解析軟件) Parser是一種檢查XML文檔是否遵循DTD規(guī)范的工具軟件。 Parser能獨立使用,也可以成為編輯軟件或瀏覽器的一部分。在后面的相關資源列表里,我列出了當前比較流行的一些parsers。 好了,通過第三章的學習,我們已經了解了一些XML和DTD的基本術語,但是我們還不知道怎樣來寫這些文件,需要遵循什么樣的語法,在下一章,將重點介紹有關撰寫XML和DTD文檔的語法。請繼續(xù)瀏覽,謝謝! XML輕松學習手冊(4)XML語法 第四章 XML語法 提綱: 一.XML語法規(guī)則 二.元素的語法 三.注釋的語法 四.CDATA的語法 五.Namespaces的語法 六.entity的語法 七.DTD的語法 通過前面三章的學習,我們已經對什么是XML,它的實現(xiàn)原理以及相關的術語有所了解。接下來我們就開始學習XML的語法規(guī)范,動手寫自己的XML文檔。 一.XML語法規(guī)則 XML的文檔和HTML的原代碼類似,也是用標識來標識內容。創(chuàng)建XML文檔必須遵守下列重要規(guī)則: 規(guī)則1:必須有XML聲明語句 這一點我們在上一章學習時已經提到過。聲明是XML文檔的第一句,其格式如下: <? 聲明的作用是告訴瀏覽器或者其它處理程序:這個文檔是XML文檔。聲明語句中的version表示文檔遵守的XML規(guī)范的版本;standalone表示文檔是否附帶DTD文件,如果有,參數(shù)為no;encoding表示文檔所用的語言編碼,默認是UTF-8。 規(guī)則2:是否有DTD文件 如果文檔是一個"有效的 <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 規(guī)則3:注意你的大小寫 在XML文檔中,大小寫是有區(qū)別的。<P>和<p>是不同的標識。注意在寫元素時,前后標識大小寫要保持一樣。例如:<Author>ajie</Author>,寫成<Author>ajie</author>是錯誤的。 你最好養(yǎng)成一種習慣,或者全部大寫,或者全部小寫,或者大寫第一個字母。這樣可以減少因為大小寫不匹配產生的文檔錯誤。 規(guī)則4:給屬性值加引號 在HTML代碼里面,屬性值可以加引號,也可以不加。例如:<font color=red> 但是在XML中則規(guī)定,所有屬性值必須加引號(可以是單引號,也可以是雙引號),否則將被視為錯誤。 規(guī)則5:所有的標識必須有相應的結束標識 在HTML中,標識可能不是成對出現(xiàn)的,比?lt;br>。而在XML中規(guī)定,所有標識必須成對出現(xiàn),有一個開始標識,就必須有一個結束標識。否則將被視為錯誤。 規(guī)則6:所有的空標識也必須被關閉 空標識就是標識對之間沒有內容的標識。比如 ,<img>等標識。在XML中,規(guī)定所有的標識必須有結束標識,針對這樣的空標識,XML中處理的方法是在原標識最后加/,就可以了。例如: 應寫為<br />; <META name="keyXML, SGML, <IMG src= "cool.gif">應寫為<IMG src= "cool.gif" /> 第四章 XML語法 二.元素的語法 元素由一對標識以及其中的內容組成。就象這樣:ajie。元素的名稱和標識的名稱是一樣的。標識可以用屬性來進一步描述。 在XML中,沒有任何保留字,所以你可以隨心所欲的用任何詞語來作為元素名稱。但是也必須遵守下列規(guī)范: 1.名稱中可以包含字母、數(shù)字以及其它字母; 2.名稱不能以數(shù)字或"_" (下劃線)開頭; 3.名稱不能以字母 XML(或 XML 或 Xml ..)開頭 4.名稱中不能包含空格 5.名稱中間不能包含":"(冒號) 為了使元素更容易閱讀理解和操作,我們還有一些建議: 1.名稱中不要使用"."。因為在很多程序語言中,"."是作為對象的屬性,例如:font.color。同樣的原因"-"也最好不要用,必須使用的,以"_"代替; 2.名稱盡量簡短。 3.名稱的大小寫盡量采用同一標準。 4.名稱可以使用非英文字符,比如用中文。但是有些軟件可能不支持。(IE5目前是支持中文元素的。) 另外,補充一點關于屬性的說明。在word</font>將把word顯示為紅色。而在CSS或者XSL,我們在下面詳細講述。) 三.注釋的語法 注釋是為了便于閱讀和理解,在XML文檔添加的附加信息,將不會被程序解釋或則瀏覽器顯示。 注釋的語法如下: <!-- 這里是注釋信息 --> 可以看到,它和HTML中的注釋語法是一樣的,非常容易。養(yǎng)成良好的注釋習慣將使你的文檔更加便于維護,共享,看起來也更專業(yè)。 四.CDATA的語法 CDATA全稱character data,翻譯為字符數(shù)據。我們在寫 <![CDATA[這里放置需要顯示的字符]]> 例如: <![CDATA[<AUTHOR sex="female">ajie</AUTHOR>]]> 在頁面上顯示的內容將是"<AUTHOR sex="female">ajie</AUTHOR>" 第四章 XML語法 五.Namespaces的語法 Namespaces翻譯為名字空間。名字空間有什么作用呢?當我們在一個XML文檔中使用他人的或者多個DTD文件,就會出現(xiàn)這樣的矛盾:因為XML中標識都是自己創(chuàng)建的,在不同的DTD文件中,標識名可能相同但表示的含義不同,這就可能引起數(shù)據混亂。 比如在一個文檔<table>wood table</table>中<table>表示桌子, 而在另一個文檔<table>namelist</table>中<table>表示表格。如果我需要同時處理這兩個文檔,就會發(fā)生名字沖突。 了解決這個問題,我們引進了namespaces這個概念。namespaces通過給標識名稱加一個網址(URL)定位的方法來區(qū)別這些名稱相同的標識。 Namespaces同樣需要在XML文檔的開頭部分聲明,聲明的語法如下: <document 其中yourname是由你定義的namespaces的名稱,URL就是名字空間的網址。 假設上面的"桌子<table>"文檔來自http://www.zhuozi.com,我們就可以聲明為 <document http://www.zhuozi.com'> 然后在后面的標識中使用定義好的名字空間: <zhuozi:table>wood table</table> 這樣就將這兩個<table>區(qū)分開來。注意的是:設置URL并不是說這個標識真的要到那個網址去讀取,僅僅作為一種區(qū)別的標志而已。 六.entity的語法 entity翻譯為"實體"。它的作用類似 entity可以包含字符,文字等等,使用entity的好處在于:1.它可以減少差錯,文檔中多個相同的部分只需要輸入一遍就可以了。2.它提高維護效率。比如你有40個文檔都包含copyright的entity,如果需要修改這個copyright,不需要所有的文件都修改,只要改最初定義的entity語句就可以了。 XML定義了兩種類型的entity。一種是我們這里說的普通entity,在XML文檔中使用;另一種是參數(shù)entity,在DTD文件中使用。 entity的定義語法為: <!DOCTYPE filename [ <!ENTITY entity-name "entity-content" ] > 例如我要定義一段版權信息: <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved" ] > 如果我的版權信息內容和他人共享一個XML文件,也可以使用外部調用的方法,語法象這樣: <!DOCTYPE copyright [ <!ENTITY copyright SYSTEM "http://www.sample.com/copyright. ] > 定義好的entity在文檔中的引用語法為:&entity-name; 例如,上面定義的版權信息,調用時寫作?copyright; 完整的例子如下,你可以copy下來存為copyright.XML觀看實例: <? <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved"> ]> <myfile> <title>XML</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> ©right; </myfile> 第四章 XML語法 七.DTD的語法 DTD是"有效 1.設置元素 元素是XML文檔的基本組成部分。你要在DTD中定義一個元素,然后在XML文檔中使用。元素的定義語法為:<!ELEMENT DESCRIPTION (#PCDATA, DEFINITION)*> 說明: "<!ELEMENT" 是元素的聲明,說明你要定義的是一個元素; 聲明后面的"DESCRIPTION",是元素的名稱; "(#PCDATA, DEFINITION)*>"則是該元素的使用規(guī)則。規(guī)則定義了元素可以包含的內容以及相互的關系。下面的表格概要列出了元素的規(guī)則: 2.元素規(guī)則表: 此主題相關圖片如下: 另外,我們還可以為元素定義屬性,因為我們不推薦使用屬性,在這里就不詳細展開了。 最后,我們來總結一些前四章學習的內容,寫一個包含DTD,XML,以及Script的簡單實例,便于讀者理解: 1.將下面文件存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 2.然后建立XML文檔myfile.xml: <? <!DOCTYPE myfile SYSTEM "myfile.dtd"> <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 3.建立HTML文檔myfile.html <HTML> <head> <script language=" var nodes = XMLDoc.documentElement.childNodes; title.innerText = nodes.item(0).text; author.innerText = nodes.item(1).text; </script> <title>在HTML中調用XML數(shù)據</title> </head> <body bgcolor="#FFFFFF"> <b>標題: </b> <span id="title"></span><br> <b>作者: </b> <span id="author"></span><br> </body> </HTML> 4.用IE5.0以上瀏覽器打開myfile.HTML就可以看到效果了。 XML輕松學習手冊(5)XML實例解析 第五章:XML實例解析 提綱: 一:實例效果 二:實例解析 1.定義新標識。 2.建立XML文檔。 3.建立相應的HTML文件。 XML在不同領域有著廣泛的應用,比如在科技領域的MathML,無線通信應用的WML,在網絡圖象方面的SVG等等,我們這里側重討論XML在web上的應用。XML在web上應用主要是利用其強大的數(shù)據操作能力。一般用XML配合JavaScript和ASP等服務器端程序,可以實現(xiàn)網絡上幾乎所有的應用需求。 考慮講解方便,我們在下面介紹一個簡單的實例,不包含服務器端程序。目的在于讓您對XML的數(shù)據操作能力有一個感性的認識。 好,我們首先[ 點擊這里 ]來看實例的效果。(請用IE5.0以上版本瀏覽器打開) 這是一個簡單的CD唱片數(shù)據檢索功能。你通過點擊"上一張","下一張"可以看到單張CD的有關信息。這樣的效果我們原來用兩種方法可以實現(xiàn): 1.利用DHTML,將數(shù)據隱藏在不同的層中,通過鼠標事件依次顯示; 2.利用后臺程序(如ASP,CGI,PHP,JSP等),調用服務器端的數(shù)據。 但是在這個實例中,我們打開頁面原代碼可以看到,其中沒有用DHTML的DIV,也沒有表單的action,它完全是用XML來實現(xiàn)的。下面我們來分析它的制作過程: 第一步:定義新標識。 根據實際的CD數(shù)據,首先新建一個名為<CD>的標識;其次建立它相關的數(shù)據標識,分別是:CD名稱<Title>,演唱者<Artist>,出版年代<Year>,國家<Country>,發(fā)行公司<Company>和價格<Price>;最后還要建立一個名為目錄<CATALOG>的標識。為什么要再建立一個<CATALOG>標識呢?因為在XML文檔中規(guī)定,必須且只能有一個根元素(標識),我們有多個CD數(shù)據,這些數(shù)據是并列的關系,所以需要為這些并列的元素建立一個根元素。 以上元素的定義和關系都完全符合XML標準,不需要特別的DTD文件來定義,所以可以省略DTD定義。如果我們想使用DTD來定義,以上過程可以表示為: <!ELEMENT CATALOG (CD)*> <!ELEMENT CD (Title,Artist,Year,Country,Company,Price)> <!ELEMENT Title (#PCDATA)> <!ELEMENT Artist (#PCDATA)> <!ELEMENT Year (#PCDATA)> <!ELEMENT Country (#PCDATA)> <!ELEMENT Company (#PCDATA)> <!ELEMENT Price (#PCDATA)> 這段代碼表示:元素CATALOG包含多個CD子元素,而子元素CD又依次包含Title, Artist, Year, Country, Company, Price 六個子元素,它們的內容都定義為文本(字符,數(shù)字,文本)。(注:具體的語法說明可以看上一章關于DTD的介紹) 第二步:建立XML文檔。 <? <CATALOG> <CD> <TITLE>Empire Burlesque</TITLE> <ARTIST>Bob Dylan</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>Columbia</COMPANY> <PRICE>10.90</PRICE> <YEAR>1985</YEAR> </CD> <CD> <TITLE>Hide your heart</TITLE> <ARTIST>Bonnie Tylor</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>CBS Records</COMPANY> <PRICE>9.90</PRICE> <YEAR>1988</YEAR> </CD> <CD> <TITLE>Greatest Hits</TITLE> <ARTIST>Dolly Parton</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>RCA</COMPANY> <PRICE>9.90</PRICE> <YEAR>1982</YEAR> </CD> <CD> <TITLE>Still got the blues</TITLE> <ARTIST>Gary More</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>Virgin redords</COMPANY> <PRICE>10.20</PRICE> <YEAR>1990</YEAR> </CD> <CD> <TITLE>Eros</TITLE> <ARTIST>Eros Ramazzotti</ARTIST> <COUNTRY>EU</COUNTRY> <COMPANY>BMG</COMPANY> <PRICE>9.90</PRICE> <YEAR>1997</YEAR> </CD> </CATALOG> 上面代碼首先用<? <CATALOG> <CD> ...... </CD> <CD> ...... </CD> </CATALOG> 一共定義了5組數(shù)據。我們將上面的代碼存為cd.XML文件,以備調用。 第三步:建立相應的HTML文件。 1.導入XML數(shù)據。 我們知道,目前流行的瀏覽器中,暫時只有微軟的IE5.0以上版本瀏覽器支持XML。IE是通過在 CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> 定義一個object,ID名為XMLdso。然后在head區(qū)用js引入xml數(shù)據: <script for="window" event="onload"> </script> 2.捆綁數(shù)據。 然后將用<SPAN>標識來將XML數(shù)據綁定在表格中。其中ID,DATASRC,DTATFLD都是<SPAN>的屬性。代碼如下: <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> 3.動作操作。 最后,為數(shù)據提供瀏覽按鈕: <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> 并利用js來完成兩個鼠標點擊功能:movenext()和moveprevious()。在head區(qū)加入如下代碼: <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> 好,我們先看HTML文件的全部原代碼: <HTML> <head> <script for="window" event="onload"> </script> <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> <TITLE>CD Navigate</TITLE> </head> <body> <p> <object WIDTH="0" HEIGHT="0" CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> <p> <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> </p> </body> </HTML> 將以上代碼存為cd.htm文件,于第二步的cd.XML文件放在一起。打開cd.htm文件,你就看見和上面實例一樣的效果了。 好,到今天為止,我們已經學習了關于XML的不少知識,我們來總結一下前面五個章節(jié),分別是XML快速入門,XML的概念原理,XML的術語,XML的語法和本章的實例解析。到這里,教程部分就結束了。在寫作過程中,阿捷盡最大努力將有關XML概念講得通俗易懂,盡量把自己的理解告訴給大家,但因為本人學習XML時間也不長,對整個XML的技術把握還不夠系統(tǒng)和深入,所以難免有疏漏的地方,請大家指正和諒解,謝謝! posted on 2009-02-15 15:45 YXY 閱讀(187) 評論(0) 編輯 收藏
var nodes = XMLDoc.documentElement.childNodes; title.innerText = nodesitem(0).text; author.innerText = nodes.item(1).text; email.innerText = nodes.item(2).text; date.innerText = nodes.item(3).text; </script> <title>在HTML中調用XML數(shù)據</title> </head> <body bgcolor="#FFFFFF"> <b>標題: </b> <span id="title"> </span> <b>作者: </b>> <span id="author"></span> <b>信箱: </b> <span id="email"></span> <b>日期:</b> <span id="date"></span> </body> </HTML> 2.將下面代碼存為myfile.XML <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> </myfile> 3.將它們放在同一個目錄下,用IE5以上版本瀏覽器打開,可以看到效果。 學習并掌握一種script,你將真正了解到XML無比的強大的功能。 五. XML和HTML的區(qū)別 XML和HTML都來自于SGML,它們都含有標記,有著相似的語法,HTML和XML的最大區(qū)別在于:HTML是一個定型的標記語言,它用固有的標記來描述,顯示網頁內容。比如< H1>表示首行標題,有固定的尺寸。相對的,XML則沒有固定的標記,XML不能描述網頁具體的外觀,內容,它只是描述內容的數(shù)據形式和結構。 這是一個質的區(qū)別:網頁將數(shù)據和顯示混在一起,而XML則將數(shù)據和顯示分開來。 我們看上面的例子,在myfile.htm中,我們只關心頁面的顯示方式,我們可以設計不同的界面,用不同的方式來排版頁面,但數(shù)據是儲存在myfile.XML中,不需要任何改變。 (如果你是程序員,你會驚訝的發(fā)現(xiàn),這與模塊化面向對象編程的思想極其相似!其實網頁何嘗不是一種程序呢?) 正是這種區(qū)別使得XML在網絡應用和信息共享上方便,高效,可擴展。所以我們相信,XML做為一種先進的數(shù)據處理方法,將使網絡跨越到一個新的境界。 六. XML的嚴格格式 吸取HTML松散格式帶來的經驗教訓, 我們先看HTML的一些語句,這些語句在HTML中隨處可見: 1. sample 2.< b>< i>sample< /b>< /i> 3.< td>sample< /TD> 4.< font color=red>samplar< /font> 在XML文檔中,上述幾種語句的語法都是錯誤的。因為: 1.所有的標記都必須要有一個相應的結束標記; 2.所有的XML標記都必須合理嵌套; 3.所有XML標記都區(qū)分大小寫; 4.所有標記的屬性必須用""括起來; 所以上列語句在XML中正確的寫法是 1. sample 2.< b>< i>sample< /i>< /b> 3.< td>sample< /td> 4.< font color="red">samplar< /font> 另外,XML標記必須遵循下面的命名規(guī)則: 1.名字中可以包含字母、數(shù)字以及其它字母; 2.名字不能以數(shù)字或"_" (下劃線) 開頭; 3.名字不能以字母 XML (或 XML 或 Xml ..) 開頭; 4.名字中不能包含空格。 在XML文檔中任何的差錯,都會得到同一個結果:網頁不能被顯示。各瀏覽器開發(fā)商已經達成協(xié)議,對XML實行嚴格而挑剔的解析,任何細小的錯誤都會被報告。你可以將上面的myfile.xml修改一下,比如將< email>改為< Email>,然后用IE5直接打開myfile.xml,會得到一個出錯信息頁面: <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> <Email>ajie@aolhoo.com</email> <date>20010115</date> </myfile> 七. 關于XML的更多 好了,到現(xiàn)在你已經知道: 1.什么是XML; 2.XML,HTML,SGML之間的關系和區(qū)別; 3.XML的簡單應用。 恭喜你!你已經不再對XML一無所知,并且已經走在了網絡技術的前沿。整個學習過程好象并不很難哦:) 如果你對XML有更多的興趣,希望進一步了解XML的詳細資料和其它的實際運用技術,歡迎繼續(xù)瀏覽我們的下一章:XML的概念。 XML輕松學習手冊(2)XML概念 第二章 XML概念 導言 經過第一章的快速入門學習,你已經知道了 一. 擴展性 二. 標識 三. 語言 四. 結構化 五. Meta數(shù)據 六. 顯示 七. DOM 一.擴展性---使用XML,你可以為你的文檔建立自己的標記(tags)。 在HTML里,有許多固定的標記,我們必須記住然后使用它們,你不能使用HTML規(guī)范里沒有的標記。而在XML中,你能建立任何你需要的標記。你可以充分發(fā)揮你的想象力,給你的文檔起一些好記的標記名稱。比如,你的文檔里包含一些游戲的攻略,你可以建立一個名為<game>的標記,然后在<game>下再根據游戲類別建立<RPG>,<SLG>等標記。只要清晰,易于理解你可以建立任何數(shù)量的標記。 一開始你也許會不適應,因為我們在學習HTML時,有固定的標記可以直接學習和使用;(很多人包括我自己都是邊分析別人的代碼和標識,邊建立自己的網頁),而XML卻沒有任何標記可以學,也很少有文檔的標記是一模一樣的。我們怎么辦?呵呵,沒有就自己創(chuàng)建呀。一旦你真正開始寫XML文檔,你會發(fā)現(xiàn)隨心所欲的創(chuàng)造新標記也是一份很有趣的事。你可以建立有自己特色的標記,甚至建立你自己的HTML語言。 擴展性使你有更多的選擇和強大的能力,但同時也產生一個問題就是你必須學會規(guī)劃。你自己要理解自己的文檔,知道它由哪幾部分組成,相互之間的關系和如何識別它們。 關于建立標識還需要說明一點,標識是描述數(shù)據的類型或特性,比如<width>,年齡<age>,姓名<name>等,而不是數(shù)據的內容,比如:<10pxl>,<18>,<張三>,這些都是無用的標記。如果你學過數(shù)據庫,你可以這樣理解,標識就是一種字段名。 二.標識---使用XML你可以識別文檔中的元素。 不論你是HTML,還是XML,標識的本質在于便于理解,如果沒有標識,你的文檔在計算機看來只是一個很長的字符串,每個字看起來都一樣,沒有重點之分。 通過標識,你的文檔才便于閱讀和理解,你可以劃分段落,列明標題。XML中,你更可以利用其擴展性 來為文檔建立更合適的標識。 不過,有一點要提醒大家注意:標識僅僅是用來識別信息,它本身并不傳達信息。例如這樣的HTML代碼: <b>frist step<b> 這里<b>表示粗體,只用來說明是用粗體來顯示"frist step"字符,<b>本身并不包含任何實際的信息,在頁面上你看不到<b>,真正傳達信息的是"frist step "。 三.語言---使用XML你要遵循特定的語法來標識你的文檔。 在計算機領域,語言常常表示一?quot;程序語言",用來編程實現(xiàn)一些功能和應用,但不是所有的"語言"都是用來編程的,XML就只是一種用來定義標識和描述信息的語言。 下面我們來深入了解一下XML應用的其本原理,可能會很枯燥,但是對于整體的理解很重要,你可以先快速過一遍,心里有一個模糊的概念,具體精髓則需要在實踐中慢慢領會。 四.結構化---XML促使文檔結構化,所有的信息按某種關系排列。 "結構化"聽起來太抽象了,我們這樣理解,結構化就是為你的文檔建立一個框架,就象寫文章先寫一個提綱。結構化使你的文檔看起來不會雜亂無章,每一部分都緊密聯(lián)系,形成一個整體。 結構化有兩個原則: 1.每一部分(每一個元素)都和其他元素有關聯(lián)。關聯(lián)的級數(shù)就形成了結構。 2.標識本身的含義與它描述的信息相分離。 我們來看一個簡單的例子幫助理解: <? <myfile> <title>XML輕松學習手冊</title> <chapter>XML快速入門 <para>什么是XML</para> <para>使用XML的好處</para> </chapter> <chapter>XML的概念 <para>擴展性</para> <para>標識</para> </chapter> </myfile> 這是本文的XML描述文檔,可以看到標識分三級關聯(lián),非常清晰: <myfile> <chapter> <para> ... </para> </chapter> </myfile> 上面這樣的文檔結構,我們又稱之為"文檔樹",主干是父元素,如<myfile>,分支和頁是子元素,如<chapter>和<para>。 五.Meta數(shù)據(Metadata)---專業(yè)的XML使用者會使用meta數(shù)據來工作。 在HTML中我們知道可以使用meta標識來定義網頁的關鍵字,簡介等,這些標識不會顯示在網頁中,但可以被搜索引擎搜索到,并影響搜索結果的排列順序。 XML對這一原理進行了深化和擴展,用XML,你可以描述你的信息在哪里,你可以通過meta來驗證信息,執(zhí)行搜索,強制顯示,或者處理其他的數(shù)據。 下面是一些XML metadata在實際應用中的用途: 1.可以驗證數(shù)字簽名,使在線商務的提交動作(submission)有效。 2.可以被方便的建立索引和進行更有效搜索。 3.可以在不同語言之間傳輸數(shù)據。 W3C組織正在研究一種名為RDF(Resource Description Framework)的metadata處理方法,可以自動交換信息,W3C宣稱,使用RDF配合數(shù)字簽名,將使網絡中存在"真實可信"的電子商務。 六.顯示 單獨用XML不能顯示頁面,我們使用格式化技術,比如CSS或者XSL,才能顯示XML標記創(chuàng)建的文檔。 我們在前面第一章講到XML是將數(shù)據和格式分離的。XML文檔本身不知道如何來顯示,必須有輔助文件來幫助實現(xiàn)。(XML取消了所有標識,包括font,color,p等風格樣式定義標識,因此XML全部是采用類似DHTML中CSS的方法來定義文檔風格樣式。),XML中用來設定顯示風格樣式的文件類型有: 1.XSL XSL全稱是Extensible Stylesheet Language(可擴展樣式語言), 是將來設計XML文檔顯示樣式的主要文件類型。它本身也是基于XML語言的。使用XSL,你可以靈活的設置文檔顯示樣式,文檔將自動適應任何瀏覽器和PDA(掌上電腦)。 XSL也可以將XML轉化為HTML,那樣,老的瀏覽器也可以瀏覽XML文檔了。 2.CSS CSS大家很熟悉了,全稱是Cascading Style Sheets(層疊樣式表),是目前用來在瀏覽器上顯示XML文檔的主要方法。 3.Behaviors Behaviors現(xiàn)在還沒有成為標準。它是微軟的IE瀏覽器特有的功能,用它可以對XML標識設定一些有趣動作。 七.DOM DOM全稱是document object model(文檔對象模型),DOM是用來干什么的呢?假設把你的文檔看成一個單獨的對象,DOM就是如何用HTML或者XML對這個對象進行操作和控制的標準。 面向對象的思想方法已經非常流行了,在編程語言(例如java,js)中,都運用面向對象的編程思想。在XML中,就是要將網頁也作為一個對象來操作和控制,我們可以建立自己的對象和模板。與對象進行交流,如何命令對象,就要用到API。API全稱Application Programming Interface,它是訪問和操作對象的規(guī)則。而DOM就是一種詳細描述HTML/XML文檔對象規(guī)則的API。它規(guī)定了HTML/XML文檔對象的命名協(xié)定,程序模型,溝通規(guī)則等。在XML文檔中,我們可以將每一個標識元素看作一個對象---它有自己的名稱和屬性。 XML創(chuàng)建了標識,而DOM的作用就是告訴script如何在瀏覽器窗口中操作和顯示這些標識 上面我們已經簡要的講述了一些XML的基本原理,我們來看看它們之間的關聯(lián)以及它們是如何工作的,先看這里一張圖: 此主題相關圖片如下: 1. 2.CSS儲存并控制元素的顯示樣式。例如:標題將被以18pt字體顯示 3.script腳本控制元素如何動作。例如:當一個title元素"out of stock",將被用紅色顯示。 4.DOM則為腳本和對象的交流提供一個公共平臺,并將結果顯示在瀏覽器窗口。 如果任何一個部分發(fā)生錯誤,都不會得到正確結果。 好了,看到這里,我們已經對XML是如何工作的有一個整體的大致的概念。通過這一章的學習,我們可能感覺到XML似乎更偏向數(shù)據處理,更方便程序員學習。實際情況也是這樣的,XML設計的目的就是用來方便的共享和交互數(shù)據的。下一章,我們將系統(tǒng)的了解關于XML的各種術語。歡迎您繼續(xù)瀏覽。 XML輕松學習手冊(3)XML的術語 第三章 XML的術語 提綱: 導言 一.XML文檔的有關術語 二.DTD的有關術語 導言 初學XML最令人頭疼的就是有一大堆新的術語概念要理解。由于XML本身也是一個嶄新的技術,正在不斷發(fā)展和變化,各組織和各大網絡公司(微軟,IBM,SUN等)都在不斷推出自己的見解和標準,因此新概念漫天飛就不足為奇了。而國內又缺乏權威的機構或組織來對這些術語正式定名,你所看見的有關XML的中文教材大部分是靠作者本身的理解翻譯過來的,有些是正確的,有些是錯誤的,更加妨礙了我們對這些概念的理解和學習。 你下面將要看到的關于XML術語的解釋,也是作者本身的理解和翻譯。阿捷是以W3C組織發(fā)布的XML1.0標準規(guī)范和相關的正式說明文檔為根據來講述。可以確保這些理解是基本正確的,至少不是錯誤的。你如果想進一步閱讀和了解,我在本文的最后部分列明了相關資源的出處和鏈接,你可以直接訪問。好,我們轉入正題: 一.XML文檔的有關術語 什么是XML文檔?知道 <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> </myfile> XML文檔包含三個部分: 1. 一個XML文檔聲明; 2. 一個關于文檔類型的定義; 3. 用XML標識創(chuàng)建的內容。 舉例說明: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> <filelist> <myfile> <title>QUICK START OF XML</title> <author>ajie</author> </myfile> ...... </filelist> 其中第一行<? 我們來了解XML文檔中有關的術語: 1.Element(元素): 元素在HTML我們已經有所了解,它是組成HTML文檔的最小單位,在XML中也一樣。一個元素由一個標識來定義,包括開始和結束標識以及其中的內容,就象這樣:<author>ajie</author> 唯一不同的就是:在HTML中,標識是固定的,而在XML中,標識需要你自己創(chuàng)建。 2.Tag(標識) 標識是用來定義元素的。在XML中,標識必須成對出現(xiàn),將數(shù)據包圍在中間。標識的名稱和元素的名稱是一樣的。例如這樣一個元素: <author>ajie</author> 其中<author>就是標識。 3.Attribute(屬性): 什么是屬性?看這段word</font>。其中color就是font的屬性之一。 屬性是對標識進一步的描述和說明,一個標識可以有多個屬性,例如font的屬性還有size。XML中的屬性與HTML中的屬性是一樣的,每個屬性都有它自己的名字和數(shù)值,屬性是標識的一部分。舉例: <author sex="female">ajie</author> XML中屬性也是自己定義的,我們建議你盡量不使用屬性,而將屬性改成子元素,例如上面的代碼可以改成這樣: <author>ajie <sex>female</sex> </author> 原因是屬性不易擴充和被程序操作。 4.Declaration(聲明) 在所有XML文檔的第一行都有一個XML聲明。這個聲明表示這個文檔是一個XML文檔,它遵循的是哪個XML版本的規(guī)范。一個XML的聲明語句就象這樣: <? 5.DTD(文件類型定義) DTD是用來定義XML文檔中元素,屬性以及元素之間關系的。 通過DTD文件可以檢測XML文檔的結構是否正確。但建立XML文檔并不一定需要DTD文件。關于DTD文件的詳細說明我們將在下面單獨列項。 6.Well-formed XML(良好格式的XML) 一個遵守 良好格式的文檔必須以一個XML聲明開始,例如: <? 其中你必須說明文檔遵守的 良好格式的XML文檔必須有一個根元素,就是緊接著聲明后面建立的第一個元素,其它元素都是這個根元素的子元素,屬于根元素一組。 良好格式的XML文檔的內容書寫時必須遵守XML語法。(有關XML語法我們將在下一章仔細講解) 7.Valid XML(有效的XML) 一個遵守 將XML文檔和它的DTD文件進行比較分析,看是否符合DTD規(guī)則的過程叫validation(確認)。這樣的過程通常我們是通過一個名為parser的軟件來處理的。 有效的XML文檔也必須以一個XML聲明開始,例如: <? 和上面例子不同的,在standalone(獨立)屬性中,這里設置的是"no",因為它必須和相應的DTD一起使用,DTD文件的定義方法如下: <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 二.DTD的有關術語 什么是DTD,我們上面已經簡略提到。DTD是一種保證XML文檔格式正確的有效方法,可以比較XML文檔和DTD文件來看文檔是否符合規(guī)范,元素和標簽使用是否正確。一個DTD文檔包含:元素的定義規(guī)則,元素間關系的定義規(guī)則,元素可使用的屬性,可使用的實體或符號規(guī)則。 DTD文件也是一個ASCII的文本文件,后綴名為.dtd。例如:myfile.dtd。 為什么要用DTD文件呢?我的理解是它滿足了網絡共享和數(shù)據交互,使用DTD最大的好處在于DTD文件的共享。(就是上文DTD說明語句中的PUBLIC屬性)。比如,兩個相同行業(yè)不同地區(qū)的人使用同一個DTD文件來作為文檔創(chuàng)建規(guī)范,那么他們的數(shù)據就很容易交換和共享。網上有其他人想補充數(shù)據,也只需要根據公用的DTD規(guī)范來建立文檔,就立刻可以加入。 目前,已經有數(shù)量眾多的寫好的DTD文件可以利用。針對不同的行業(yè)和應用,這些DTD文件已經建立了通用的元素和標簽規(guī)則。你不需要自己重新創(chuàng)建,只要在他們的基礎上加入你需要的新標識。 當然,如果愿意,你可以創(chuàng)建自己的DTD,它可能和你的文檔配合的更加完美。建立自己的DTD也是很簡單的一件事,一般只需要定義4-5個元素就可以了。 調用DTD文件的方法有兩種: 1.直接包含在XML文檔內的DTD 你只要在DOCTYPE聲明中插入一些特別的說明就可以了,象這樣: 我們有一個XML文檔: <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 我們在第一行后面插入下面代碼就可以: <!DOCTYPE myfile [ <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> <!ENTITY copyright "Copyright 2001, Ajie."> ]> 2.調用獨立的DTD文件 將DTD文檔存為.dtd的文件,然后在DOCTYPE聲明行中調用,例如,將下面的代碼存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 然后在XML文檔中調用,在第一行后插入: <!DOCTYPE myfile SYSTEM "myfile.dtd"> 我們可以看到DTD文檔和HTML中js的調用是差不多的,關于DTD文檔具體如何寫,我們將在下一章和XML文檔的語法一起介紹。 下面我們來了解DTD有關的術語: 1.Schema(規(guī)劃) schema是數(shù)據規(guī)則的描述。schema做兩件事: a.它定義元素數(shù)據類型和元素之間的關系; b.它定義元素所能包含的內容類型。 DTD就是關于XML文檔的一個schema。 2.Document Tree(文檔樹) "文檔樹"在前面第二章我們已經提到過,它是文檔元素分級結構的形象表示。一個文檔結構樹包含根元素,根元素是最頂級的元素,(就是緊接著XML聲明語句后的第一個元素)。看例子: <? <filelist> <myfile> <title>...</title> <author>...</author> </myfile> </filelist> 上面的例子分三級結構排列成"樹"狀,其中的<filelist>就是根元素。在XML和DTD文件中,第一個定義的都是根元素。 3.Parent Element(父元素)/Child Element(子元素) 父元素是指包含有其它元素的元素,被包含的元素稱為它的子元素??瓷厦娴?結構樹",其中<myfile>是父元素,<title>,<author>是它的子元素,而<myfile>又是<filelist>的子元素。象<title>這樣沒有包含任何子元素的最后一級元素我們也稱之為"頁元素"。 4.Parser(解析軟件) Parser是一種檢查XML文檔是否遵循DTD規(guī)范的工具軟件。 Parser能獨立使用,也可以成為編輯軟件或瀏覽器的一部分。在后面的相關資源列表里,我列出了當前比較流行的一些parsers。 好了,通過第三章的學習,我們已經了解了一些XML和DTD的基本術語,但是我們還不知道怎樣來寫這些文件,需要遵循什么樣的語法,在下一章,將重點介紹有關撰寫XML和DTD文檔的語法。請繼續(xù)瀏覽,謝謝! XML輕松學習手冊(4)XML語法 第四章 XML語法 提綱: 一.XML語法規(guī)則 二.元素的語法 三.注釋的語法 四.CDATA的語法 五.Namespaces的語法 六.entity的語法 七.DTD的語法 通過前面三章的學習,我們已經對什么是XML,它的實現(xiàn)原理以及相關的術語有所了解。接下來我們就開始學習XML的語法規(guī)范,動手寫自己的XML文檔。 一.XML語法規(guī)則 XML的文檔和HTML的原代碼類似,也是用標識來標識內容。創(chuàng)建XML文檔必須遵守下列重要規(guī)則: 規(guī)則1:必須有XML聲明語句 這一點我們在上一章學習時已經提到過。聲明是XML文檔的第一句,其格式如下: <? 聲明的作用是告訴瀏覽器或者其它處理程序:這個文檔是XML文檔。聲明語句中的version表示文檔遵守的XML規(guī)范的版本;standalone表示文檔是否附帶DTD文件,如果有,參數(shù)為no;encoding表示文檔所用的語言編碼,默認是UTF-8。 規(guī)則2:是否有DTD文件 如果文檔是一個"有效的 <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 規(guī)則3:注意你的大小寫 在XML文檔中,大小寫是有區(qū)別的。<P>和<p>是不同的標識。注意在寫元素時,前后標識大小寫要保持一樣。例如:<Author>ajie</Author>,寫成<Author>ajie</author>是錯誤的。 你最好養(yǎng)成一種習慣,或者全部大寫,或者全部小寫,或者大寫第一個字母。這樣可以減少因為大小寫不匹配產生的文檔錯誤。 規(guī)則4:給屬性值加引號 在HTML代碼里面,屬性值可以加引號,也可以不加。例如:<font color=red> 但是在XML中則規(guī)定,所有屬性值必須加引號(可以是單引號,也可以是雙引號),否則將被視為錯誤。 規(guī)則5:所有的標識必須有相應的結束標識 在HTML中,標識可能不是成對出現(xiàn)的,比?lt;br>。而在XML中規(guī)定,所有標識必須成對出現(xiàn),有一個開始標識,就必須有一個結束標識。否則將被視為錯誤。 規(guī)則6:所有的空標識也必須被關閉 空標識就是標識對之間沒有內容的標識。比如 ,<img>等標識。在XML中,規(guī)定所有的標識必須有結束標識,針對這樣的空標識,XML中處理的方法是在原標識最后加/,就可以了。例如: 應寫為<br />; <META name="keyXML, SGML, <IMG src= "cool.gif">應寫為<IMG src= "cool.gif" /> 第四章 XML語法 二.元素的語法 元素由一對標識以及其中的內容組成。就象這樣:ajie。元素的名稱和標識的名稱是一樣的。標識可以用屬性來進一步描述。 在XML中,沒有任何保留字,所以你可以隨心所欲的用任何詞語來作為元素名稱。但是也必須遵守下列規(guī)范: 1.名稱中可以包含字母、數(shù)字以及其它字母; 2.名稱不能以數(shù)字或"_" (下劃線)開頭; 3.名稱不能以字母 XML(或 XML 或 Xml ..)開頭 4.名稱中不能包含空格 5.名稱中間不能包含":"(冒號) 為了使元素更容易閱讀理解和操作,我們還有一些建議: 1.名稱中不要使用"."。因為在很多程序語言中,"."是作為對象的屬性,例如:font.color。同樣的原因"-"也最好不要用,必須使用的,以"_"代替; 2.名稱盡量簡短。 3.名稱的大小寫盡量采用同一標準。 4.名稱可以使用非英文字符,比如用中文。但是有些軟件可能不支持。(IE5目前是支持中文元素的。) 另外,補充一點關于屬性的說明。在word</font>將把word顯示為紅色。而在CSS或者XSL,我們在下面詳細講述。) 三.注釋的語法 注釋是為了便于閱讀和理解,在XML文檔添加的附加信息,將不會被程序解釋或則瀏覽器顯示。 注釋的語法如下: <!-- 這里是注釋信息 --> 可以看到,它和HTML中的注釋語法是一樣的,非常容易。養(yǎng)成良好的注釋習慣將使你的文檔更加便于維護,共享,看起來也更專業(yè)。 四.CDATA的語法 CDATA全稱character data,翻譯為字符數(shù)據。我們在寫 <![CDATA[這里放置需要顯示的字符]]> 例如: <![CDATA[<AUTHOR sex="female">ajie</AUTHOR>]]> 在頁面上顯示的內容將是"<AUTHOR sex="female">ajie</AUTHOR>" 第四章 XML語法 五.Namespaces的語法 Namespaces翻譯為名字空間。名字空間有什么作用呢?當我們在一個XML文檔中使用他人的或者多個DTD文件,就會出現(xiàn)這樣的矛盾:因為XML中標識都是自己創(chuàng)建的,在不同的DTD文件中,標識名可能相同但表示的含義不同,這就可能引起數(shù)據混亂。 比如在一個文檔<table>wood table</table>中<table>表示桌子, 而在另一個文檔<table>namelist</table>中<table>表示表格。如果我需要同時處理這兩個文檔,就會發(fā)生名字沖突。 了解決這個問題,我們引進了namespaces這個概念。namespaces通過給標識名稱加一個網址(URL)定位的方法來區(qū)別這些名稱相同的標識。 Namespaces同樣需要在XML文檔的開頭部分聲明,聲明的語法如下: <document 其中yourname是由你定義的namespaces的名稱,URL就是名字空間的網址。 假設上面的"桌子<table>"文檔來自http://www.zhuozi.com,我們就可以聲明為 <document http://www.zhuozi.com'> 然后在后面的標識中使用定義好的名字空間: <zhuozi:table>wood table</table> 這樣就將這兩個<table>區(qū)分開來。注意的是:設置URL并不是說這個標識真的要到那個網址去讀取,僅僅作為一種區(qū)別的標志而已。 六.entity的語法 entity翻譯為"實體"。它的作用類似 entity可以包含字符,文字等等,使用entity的好處在于:1.它可以減少差錯,文檔中多個相同的部分只需要輸入一遍就可以了。2.它提高維護效率。比如你有40個文檔都包含copyright的entity,如果需要修改這個copyright,不需要所有的文件都修改,只要改最初定義的entity語句就可以了。 XML定義了兩種類型的entity。一種是我們這里說的普通entity,在XML文檔中使用;另一種是參數(shù)entity,在DTD文件中使用。 entity的定義語法為: <!DOCTYPE filename [ <!ENTITY entity-name "entity-content" ] > 例如我要定義一段版權信息: <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved" ] > 如果我的版權信息內容和他人共享一個XML文件,也可以使用外部調用的方法,語法象這樣: <!DOCTYPE copyright [ <!ENTITY copyright SYSTEM "http://www.sample.com/copyright. ] > 定義好的entity在文檔中的引用語法為:&entity-name; 例如,上面定義的版權信息,調用時寫作?copyright; 完整的例子如下,你可以copy下來存為copyright.XML觀看實例: <? <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved"> ]> <myfile> <title>XML</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> ©right; </myfile> 第四章 XML語法 七.DTD的語法 DTD是"有效 1.設置元素 元素是XML文檔的基本組成部分。你要在DTD中定義一個元素,然后在XML文檔中使用。元素的定義語法為:<!ELEMENT DESCRIPTION (#PCDATA, DEFINITION)*> 說明: "<!ELEMENT" 是元素的聲明,說明你要定義的是一個元素; 聲明后面的"DESCRIPTION",是元素的名稱; "(#PCDATA, DEFINITION)*>"則是該元素的使用規(guī)則。規(guī)則定義了元素可以包含的內容以及相互的關系。下面的表格概要列出了元素的規(guī)則: 2.元素規(guī)則表: 此主題相關圖片如下: 另外,我們還可以為元素定義屬性,因為我們不推薦使用屬性,在這里就不詳細展開了。 最后,我們來總結一些前四章學習的內容,寫一個包含DTD,XML,以及Script的簡單實例,便于讀者理解: 1.將下面文件存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 2.然后建立XML文檔myfile.xml: <? <!DOCTYPE myfile SYSTEM "myfile.dtd"> <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 3.建立HTML文檔myfile.html <HTML> <head> <script language=" var nodes = XMLDoc.documentElement.childNodes; title.innerText = nodes.item(0).text; author.innerText = nodes.item(1).text; </script> <title>在HTML中調用XML數(shù)據</title> </head> <body bgcolor="#FFFFFF"> <b>標題: </b> <span id="title"></span><br> <b>作者: </b> <span id="author"></span><br> </body> </HTML> 4.用IE5.0以上瀏覽器打開myfile.HTML就可以看到效果了。 XML輕松學習手冊(5)XML實例解析 第五章:XML實例解析 提綱: 一:實例效果 二:實例解析 1.定義新標識。 2.建立XML文檔。 3.建立相應的HTML文件。 XML在不同領域有著廣泛的應用,比如在科技領域的MathML,無線通信應用的WML,在網絡圖象方面的SVG等等,我們這里側重討論XML在web上的應用。XML在web上應用主要是利用其強大的數(shù)據操作能力。一般用XML配合JavaScript和ASP等服務器端程序,可以實現(xiàn)網絡上幾乎所有的應用需求。 考慮講解方便,我們在下面介紹一個簡單的實例,不包含服務器端程序。目的在于讓您對XML的數(shù)據操作能力有一個感性的認識。 好,我們首先[ 點擊這里 ]來看實例的效果。(請用IE5.0以上版本瀏覽器打開) 這是一個簡單的CD唱片數(shù)據檢索功能。你通過點擊"上一張","下一張"可以看到單張CD的有關信息。這樣的效果我們原來用兩種方法可以實現(xiàn): 1.利用DHTML,將數(shù)據隱藏在不同的層中,通過鼠標事件依次顯示; 2.利用后臺程序(如ASP,CGI,PHP,JSP等),調用服務器端的數(shù)據。 但是在這個實例中,我們打開頁面原代碼可以看到,其中沒有用DHTML的DIV,也沒有表單的action,它完全是用XML來實現(xiàn)的。下面我們來分析它的制作過程: 第一步:定義新標識。 根據實際的CD數(shù)據,首先新建一個名為<CD>的標識;其次建立它相關的數(shù)據標識,分別是:CD名稱<Title>,演唱者<Artist>,出版年代<Year>,國家<Country>,發(fā)行公司<Company>和價格<Price>;最后還要建立一個名為目錄<CATALOG>的標識。為什么要再建立一個<CATALOG>標識呢?因為在XML文檔中規(guī)定,必須且只能有一個根元素(標識),我們有多個CD數(shù)據,這些數(shù)據是并列的關系,所以需要為這些并列的元素建立一個根元素。 以上元素的定義和關系都完全符合XML標準,不需要特別的DTD文件來定義,所以可以省略DTD定義。如果我們想使用DTD來定義,以上過程可以表示為: <!ELEMENT CATALOG (CD)*> <!ELEMENT CD (Title,Artist,Year,Country,Company,Price)> <!ELEMENT Title (#PCDATA)> <!ELEMENT Artist (#PCDATA)> <!ELEMENT Year (#PCDATA)> <!ELEMENT Country (#PCDATA)> <!ELEMENT Company (#PCDATA)> <!ELEMENT Price (#PCDATA)> 這段代碼表示:元素CATALOG包含多個CD子元素,而子元素CD又依次包含Title, Artist, Year, Country, Company, Price 六個子元素,它們的內容都定義為文本(字符,數(shù)字,文本)。(注:具體的語法說明可以看上一章關于DTD的介紹) 第二步:建立XML文檔。 <? <CATALOG> <CD> <TITLE>Empire Burlesque</TITLE> <ARTIST>Bob Dylan</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>Columbia</COMPANY> <PRICE>10.90</PRICE> <YEAR>1985</YEAR> </CD> <CD> <TITLE>Hide your heart</TITLE> <ARTIST>Bonnie Tylor</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>CBS Records</COMPANY> <PRICE>9.90</PRICE> <YEAR>1988</YEAR> </CD> <CD> <TITLE>Greatest Hits</TITLE> <ARTIST>Dolly Parton</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>RCA</COMPANY> <PRICE>9.90</PRICE> <YEAR>1982</YEAR> </CD> <CD> <TITLE>Still got the blues</TITLE> <ARTIST>Gary More</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>Virgin redords</COMPANY> <PRICE>10.20</PRICE> <YEAR>1990</YEAR> </CD> <CD> <TITLE>Eros</TITLE> <ARTIST>Eros Ramazzotti</ARTIST> <COUNTRY>EU</COUNTRY> <COMPANY>BMG</COMPANY> <PRICE>9.90</PRICE> <YEAR>1997</YEAR> </CD> </CATALOG> 上面代碼首先用<? <CATALOG> <CD> ...... </CD> <CD> ...... </CD> </CATALOG> 一共定義了5組數(shù)據。我們將上面的代碼存為cd.XML文件,以備調用。 第三步:建立相應的HTML文件。 1.導入XML數(shù)據。 我們知道,目前流行的瀏覽器中,暫時只有微軟的IE5.0以上版本瀏覽器支持XML。IE是通過在 CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> 定義一個object,ID名為XMLdso。然后在head區(qū)用js引入xml數(shù)據: <script for="window" event="onload"> </script> 2.捆綁數(shù)據。 然后將用<SPAN>標識來將XML數(shù)據綁定在表格中。其中ID,DATASRC,DTATFLD都是<SPAN>的屬性。代碼如下: <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> 3.動作操作。 最后,為數(shù)據提供瀏覽按鈕: <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> 并利用js來完成兩個鼠標點擊功能:movenext()和moveprevious()。在head區(qū)加入如下代碼: <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> 好,我們先看HTML文件的全部原代碼: <HTML> <head> <script for="window" event="onload"> </script> <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> <TITLE>CD Navigate</TITLE> </head> <body> <p> <object WIDTH="0" HEIGHT="0" CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> <p> <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> </p> </body> </HTML> 將以上代碼存為cd.htm文件,于第二步的cd.XML文件放在一起。打開cd.htm文件,你就看見和上面實例一樣的效果了。 好,到今天為止,我們已經學習了關于XML的不少知識,我們來總結一下前面五個章節(jié),分別是XML快速入門,XML的概念原理,XML的術語,XML的語法和本章的實例解析。到這里,教程部分就結束了。在寫作過程中,阿捷盡最大努力將有關XML概念講得通俗易懂,盡量把自己的理解告訴給大家,但因為本人學習XML時間也不長,對整個XML的技術把握還不夠系統(tǒng)和深入,所以難免有疏漏的地方,請大家指正和諒解,謝謝! posted on 2009-02-15 15:45 YXY 閱讀(187) 評論(0) 編輯 收藏
nodes = XMLDoc.documentElement.childNodes; title.innerText = nodesitem(0).text; author.innerText = nodes.item(1).text; email.innerText = nodes.item(2).text; date.innerText = nodes.item(3).text; </script> <title>在HTML中調用XML數(shù)據</title> </head> <body bgcolor="#FFFFFF"> <b>標題: </b> <span id="title"> </span> <b>作者: </b>> <span id="author"></span> <b>信箱: </b> <span id="email"></span> <b>日期:</b> <span id="date"></span> </body> </HTML> 2.將下面代碼存為myfile.XML <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> </myfile> 3.將它們放在同一個目錄下,用IE5以上版本瀏覽器打開,可以看到效果。 學習并掌握一種script,你將真正了解到XML無比的強大的功能。 五. XML和HTML的區(qū)別 XML和HTML都來自于SGML,它們都含有標記,有著相似的語法,HTML和XML的最大區(qū)別在于:HTML是一個定型的標記語言,它用固有的標記來描述,顯示網頁內容。比如< H1>表示首行標題,有固定的尺寸。相對的,XML則沒有固定的標記,XML不能描述網頁具體的外觀,內容,它只是描述內容的數(shù)據形式和結構。 這是一個質的區(qū)別:網頁將數(shù)據和顯示混在一起,而XML則將數(shù)據和顯示分開來。 我們看上面的例子,在myfile.htm中,我們只關心頁面的顯示方式,我們可以設計不同的界面,用不同的方式來排版頁面,但數(shù)據是儲存在myfile.XML中,不需要任何改變。 (如果你是程序員,你會驚訝的發(fā)現(xiàn),這與模塊化面向對象編程的思想極其相似!其實網頁何嘗不是一種程序呢?) 正是這種區(qū)別使得XML在網絡應用和信息共享上方便,高效,可擴展。所以我們相信,XML做為一種先進的數(shù)據處理方法,將使網絡跨越到一個新的境界。 六. XML的嚴格格式 吸取HTML松散格式帶來的經驗教訓, 我們先看HTML的一些語句,這些語句在HTML中隨處可見: 1. sample 2.< b>< i>sample< /b>< /i> 3.< td>sample< /TD> 4.< font color=red>samplar< /font> 在XML文檔中,上述幾種語句的語法都是錯誤的。因為: 1.所有的標記都必須要有一個相應的結束標記; 2.所有的XML標記都必須合理嵌套; 3.所有XML標記都區(qū)分大小寫; 4.所有標記的屬性必須用""括起來; 所以上列語句在XML中正確的寫法是 1. sample 2.< b>< i>sample< /i>< /b> 3.< td>sample< /td> 4.< font color="red">samplar< /font> 另外,XML標記必須遵循下面的命名規(guī)則: 1.名字中可以包含字母、數(shù)字以及其它字母; 2.名字不能以數(shù)字或"_" (下劃線) 開頭; 3.名字不能以字母 XML (或 XML 或 Xml ..) 開頭; 4.名字中不能包含空格。 在XML文檔中任何的差錯,都會得到同一個結果:網頁不能被顯示。各瀏覽器開發(fā)商已經達成協(xié)議,對XML實行嚴格而挑剔的解析,任何細小的錯誤都會被報告。你可以將上面的myfile.xml修改一下,比如將< email>改為< Email>,然后用IE5直接打開myfile.xml,會得到一個出錯信息頁面: <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> <Email>ajie@aolhoo.com</email> <date>20010115</date> </myfile> 七. 關于XML的更多 好了,到現(xiàn)在你已經知道: 1.什么是XML; 2.XML,HTML,SGML之間的關系和區(qū)別; 3.XML的簡單應用。 恭喜你!你已經不再對XML一無所知,并且已經走在了網絡技術的前沿。整個學習過程好象并不很難哦:) 如果你對XML有更多的興趣,希望進一步了解XML的詳細資料和其它的實際運用技術,歡迎繼續(xù)瀏覽我們的下一章:XML的概念。 XML輕松學習手冊(2)XML概念 第二章 XML概念 導言 經過第一章的快速入門學習,你已經知道了 一. 擴展性 二. 標識 三. 語言 四. 結構化 五. Meta數(shù)據 六. 顯示 七. DOM 一.擴展性---使用XML,你可以為你的文檔建立自己的標記(tags)。 在HTML里,有許多固定的標記,我們必須記住然后使用它們,你不能使用HTML規(guī)范里沒有的標記。而在XML中,你能建立任何你需要的標記。你可以充分發(fā)揮你的想象力,給你的文檔起一些好記的標記名稱。比如,你的文檔里包含一些游戲的攻略,你可以建立一個名為<game>的標記,然后在<game>下再根據游戲類別建立<RPG>,<SLG>等標記。只要清晰,易于理解你可以建立任何數(shù)量的標記。 一開始你也許會不適應,因為我們在學習HTML時,有固定的標記可以直接學習和使用;(很多人包括我自己都是邊分析別人的代碼和標識,邊建立自己的網頁),而XML卻沒有任何標記可以學,也很少有文檔的標記是一模一樣的。我們怎么辦?呵呵,沒有就自己創(chuàng)建呀。一旦你真正開始寫XML文檔,你會發(fā)現(xiàn)隨心所欲的創(chuàng)造新標記也是一份很有趣的事。你可以建立有自己特色的標記,甚至建立你自己的HTML語言。 擴展性使你有更多的選擇和強大的能力,但同時也產生一個問題就是你必須學會規(guī)劃。你自己要理解自己的文檔,知道它由哪幾部分組成,相互之間的關系和如何識別它們。 關于建立標識還需要說明一點,標識是描述數(shù)據的類型或特性,比如<width>,年齡<age>,姓名<name>等,而不是數(shù)據的內容,比如:<10pxl>,<18>,<張三>,這些都是無用的標記。如果你學過數(shù)據庫,你可以這樣理解,標識就是一種字段名。 二.標識---使用XML你可以識別文檔中的元素。 不論你是HTML,還是XML,標識的本質在于便于理解,如果沒有標識,你的文檔在計算機看來只是一個很長的字符串,每個字看起來都一樣,沒有重點之分。 通過標識,你的文檔才便于閱讀和理解,你可以劃分段落,列明標題。XML中,你更可以利用其擴展性 來為文檔建立更合適的標識。 不過,有一點要提醒大家注意:標識僅僅是用來識別信息,它本身并不傳達信息。例如這樣的HTML代碼: <b>frist step<b> 這里<b>表示粗體,只用來說明是用粗體來顯示"frist step"字符,<b>本身并不包含任何實際的信息,在頁面上你看不到<b>,真正傳達信息的是"frist step "。 三.語言---使用XML你要遵循特定的語法來標識你的文檔。 在計算機領域,語言常常表示一?quot;程序語言",用來編程實現(xiàn)一些功能和應用,但不是所有的"語言"都是用來編程的,XML就只是一種用來定義標識和描述信息的語言。 下面我們來深入了解一下XML應用的其本原理,可能會很枯燥,但是對于整體的理解很重要,你可以先快速過一遍,心里有一個模糊的概念,具體精髓則需要在實踐中慢慢領會。 四.結構化---XML促使文檔結構化,所有的信息按某種關系排列。 "結構化"聽起來太抽象了,我們這樣理解,結構化就是為你的文檔建立一個框架,就象寫文章先寫一個提綱。結構化使你的文檔看起來不會雜亂無章,每一部分都緊密聯(lián)系,形成一個整體。 結構化有兩個原則: 1.每一部分(每一個元素)都和其他元素有關聯(lián)。關聯(lián)的級數(shù)就形成了結構。 2.標識本身的含義與它描述的信息相分離。 我們來看一個簡單的例子幫助理解: <? <myfile> <title>XML輕松學習手冊</title> <chapter>XML快速入門 <para>什么是XML</para> <para>使用XML的好處</para> </chapter> <chapter>XML的概念 <para>擴展性</para> <para>標識</para> </chapter> </myfile> 這是本文的XML描述文檔,可以看到標識分三級關聯(lián),非常清晰: <myfile> <chapter> <para> ... </para> </chapter> </myfile> 上面這樣的文檔結構,我們又稱之為"文檔樹",主干是父元素,如<myfile>,分支和頁是子元素,如<chapter>和<para>。 五.Meta數(shù)據(Metadata)---專業(yè)的XML使用者會使用meta數(shù)據來工作。 在HTML中我們知道可以使用meta標識來定義網頁的關鍵字,簡介等,這些標識不會顯示在網頁中,但可以被搜索引擎搜索到,并影響搜索結果的排列順序。 XML對這一原理進行了深化和擴展,用XML,你可以描述你的信息在哪里,你可以通過meta來驗證信息,執(zhí)行搜索,強制顯示,或者處理其他的數(shù)據。 下面是一些XML metadata在實際應用中的用途: 1.可以驗證數(shù)字簽名,使在線商務的提交動作(submission)有效。 2.可以被方便的建立索引和進行更有效搜索。 3.可以在不同語言之間傳輸數(shù)據。 W3C組織正在研究一種名為RDF(Resource Description Framework)的metadata處理方法,可以自動交換信息,W3C宣稱,使用RDF配合數(shù)字簽名,將使網絡中存在"真實可信"的電子商務。 六.顯示 單獨用XML不能顯示頁面,我們使用格式化技術,比如CSS或者XSL,才能顯示XML標記創(chuàng)建的文檔。 我們在前面第一章講到XML是將數(shù)據和格式分離的。XML文檔本身不知道如何來顯示,必須有輔助文件來幫助實現(xiàn)。(XML取消了所有標識,包括font,color,p等風格樣式定義標識,因此XML全部是采用類似DHTML中CSS的方法來定義文檔風格樣式。),XML中用來設定顯示風格樣式的文件類型有: 1.XSL XSL全稱是Extensible Stylesheet Language(可擴展樣式語言), 是將來設計XML文檔顯示樣式的主要文件類型。它本身也是基于XML語言的。使用XSL,你可以靈活的設置文檔顯示樣式,文檔將自動適應任何瀏覽器和PDA(掌上電腦)。 XSL也可以將XML轉化為HTML,那樣,老的瀏覽器也可以瀏覽XML文檔了。 2.CSS CSS大家很熟悉了,全稱是Cascading Style Sheets(層疊樣式表),是目前用來在瀏覽器上顯示XML文檔的主要方法。 3.Behaviors Behaviors現(xiàn)在還沒有成為標準。它是微軟的IE瀏覽器特有的功能,用它可以對XML標識設定一些有趣動作。 七.DOM DOM全稱是document object model(文檔對象模型),DOM是用來干什么的呢?假設把你的文檔看成一個單獨的對象,DOM就是如何用HTML或者XML對這個對象進行操作和控制的標準。 面向對象的思想方法已經非常流行了,在編程語言(例如java,js)中,都運用面向對象的編程思想。在XML中,就是要將網頁也作為一個對象來操作和控制,我們可以建立自己的對象和模板。與對象進行交流,如何命令對象,就要用到API。API全稱Application Programming Interface,它是訪問和操作對象的規(guī)則。而DOM就是一種詳細描述HTML/XML文檔對象規(guī)則的API。它規(guī)定了HTML/XML文檔對象的命名協(xié)定,程序模型,溝通規(guī)則等。在XML文檔中,我們可以將每一個標識元素看作一個對象---它有自己的名稱和屬性。 XML創(chuàng)建了標識,而DOM的作用就是告訴script如何在瀏覽器窗口中操作和顯示這些標識 上面我們已經簡要的講述了一些XML的基本原理,我們來看看它們之間的關聯(lián)以及它們是如何工作的,先看這里一張圖: 此主題相關圖片如下: 1. 2.CSS儲存并控制元素的顯示樣式。例如:標題將被以18pt字體顯示 3.script腳本控制元素如何動作。例如:當一個title元素"out of stock",將被用紅色顯示。 4.DOM則為腳本和對象的交流提供一個公共平臺,并將結果顯示在瀏覽器窗口。 如果任何一個部分發(fā)生錯誤,都不會得到正確結果。 好了,看到這里,我們已經對XML是如何工作的有一個整體的大致的概念。通過這一章的學習,我們可能感覺到XML似乎更偏向數(shù)據處理,更方便程序員學習。實際情況也是這樣的,XML設計的目的就是用來方便的共享和交互數(shù)據的。下一章,我們將系統(tǒng)的了解關于XML的各種術語。歡迎您繼續(xù)瀏覽。 XML輕松學習手冊(3)XML的術語 第三章 XML的術語 提綱: 導言 一.XML文檔的有關術語 二.DTD的有關術語 導言 初學XML最令人頭疼的就是有一大堆新的術語概念要理解。由于XML本身也是一個嶄新的技術,正在不斷發(fā)展和變化,各組織和各大網絡公司(微軟,IBM,SUN等)都在不斷推出自己的見解和標準,因此新概念漫天飛就不足為奇了。而國內又缺乏權威的機構或組織來對這些術語正式定名,你所看見的有關XML的中文教材大部分是靠作者本身的理解翻譯過來的,有些是正確的,有些是錯誤的,更加妨礙了我們對這些概念的理解和學習。 你下面將要看到的關于XML術語的解釋,也是作者本身的理解和翻譯。阿捷是以W3C組織發(fā)布的XML1.0標準規(guī)范和相關的正式說明文檔為根據來講述。可以確保這些理解是基本正確的,至少不是錯誤的。你如果想進一步閱讀和了解,我在本文的最后部分列明了相關資源的出處和鏈接,你可以直接訪問。好,我們轉入正題: 一.XML文檔的有關術語 什么是XML文檔?知道 <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> </myfile> XML文檔包含三個部分: 1. 一個XML文檔聲明; 2. 一個關于文檔類型的定義; 3. 用XML標識創(chuàng)建的內容。 舉例說明: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> <filelist> <myfile> <title>QUICK START OF XML</title> <author>ajie</author> </myfile> ...... </filelist> 其中第一行<? 我們來了解XML文檔中有關的術語: 1.Element(元素): 元素在HTML我們已經有所了解,它是組成HTML文檔的最小單位,在XML中也一樣。一個元素由一個標識來定義,包括開始和結束標識以及其中的內容,就象這樣:<author>ajie</author> 唯一不同的就是:在HTML中,標識是固定的,而在XML中,標識需要你自己創(chuàng)建。 2.Tag(標識) 標識是用來定義元素的。在XML中,標識必須成對出現(xiàn),將數(shù)據包圍在中間。標識的名稱和元素的名稱是一樣的。例如這樣一個元素: <author>ajie</author> 其中<author>就是標識。 3.Attribute(屬性): 什么是屬性?看這段word</font>。其中color就是font的屬性之一。 屬性是對標識進一步的描述和說明,一個標識可以有多個屬性,例如font的屬性還有size。XML中的屬性與HTML中的屬性是一樣的,每個屬性都有它自己的名字和數(shù)值,屬性是標識的一部分。舉例: <author sex="female">ajie</author> XML中屬性也是自己定義的,我們建議你盡量不使用屬性,而將屬性改成子元素,例如上面的代碼可以改成這樣: <author>ajie <sex>female</sex> </author> 原因是屬性不易擴充和被程序操作。 4.Declaration(聲明) 在所有XML文檔的第一行都有一個XML聲明。這個聲明表示這個文檔是一個XML文檔,它遵循的是哪個XML版本的規(guī)范。一個XML的聲明語句就象這樣: <? 5.DTD(文件類型定義) DTD是用來定義XML文檔中元素,屬性以及元素之間關系的。 通過DTD文件可以檢測XML文檔的結構是否正確。但建立XML文檔并不一定需要DTD文件。關于DTD文件的詳細說明我們將在下面單獨列項。 6.Well-formed XML(良好格式的XML) 一個遵守 良好格式的文檔必須以一個XML聲明開始,例如: <? 其中你必須說明文檔遵守的 良好格式的XML文檔必須有一個根元素,就是緊接著聲明后面建立的第一個元素,其它元素都是這個根元素的子元素,屬于根元素一組。 良好格式的XML文檔的內容書寫時必須遵守XML語法。(有關XML語法我們將在下一章仔細講解) 7.Valid XML(有效的XML) 一個遵守 將XML文檔和它的DTD文件進行比較分析,看是否符合DTD規(guī)則的過程叫validation(確認)。這樣的過程通常我們是通過一個名為parser的軟件來處理的。 有效的XML文檔也必須以一個XML聲明開始,例如: <? 和上面例子不同的,在standalone(獨立)屬性中,這里設置的是"no",因為它必須和相應的DTD一起使用,DTD文件的定義方法如下: <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 二.DTD的有關術語 什么是DTD,我們上面已經簡略提到。DTD是一種保證XML文檔格式正確的有效方法,可以比較XML文檔和DTD文件來看文檔是否符合規(guī)范,元素和標簽使用是否正確。一個DTD文檔包含:元素的定義規(guī)則,元素間關系的定義規(guī)則,元素可使用的屬性,可使用的實體或符號規(guī)則。 DTD文件也是一個ASCII的文本文件,后綴名為.dtd。例如:myfile.dtd。 為什么要用DTD文件呢?我的理解是它滿足了網絡共享和數(shù)據交互,使用DTD最大的好處在于DTD文件的共享。(就是上文DTD說明語句中的PUBLIC屬性)。比如,兩個相同行業(yè)不同地區(qū)的人使用同一個DTD文件來作為文檔創(chuàng)建規(guī)范,那么他們的數(shù)據就很容易交換和共享。網上有其他人想補充數(shù)據,也只需要根據公用的DTD規(guī)范來建立文檔,就立刻可以加入。 目前,已經有數(shù)量眾多的寫好的DTD文件可以利用。針對不同的行業(yè)和應用,這些DTD文件已經建立了通用的元素和標簽規(guī)則。你不需要自己重新創(chuàng)建,只要在他們的基礎上加入你需要的新標識。 當然,如果愿意,你可以創(chuàng)建自己的DTD,它可能和你的文檔配合的更加完美。建立自己的DTD也是很簡單的一件事,一般只需要定義4-5個元素就可以了。 調用DTD文件的方法有兩種: 1.直接包含在XML文檔內的DTD 你只要在DOCTYPE聲明中插入一些特別的說明就可以了,象這樣: 我們有一個XML文檔: <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 我們在第一行后面插入下面代碼就可以: <!DOCTYPE myfile [ <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> <!ENTITY copyright "Copyright 2001, Ajie."> ]> 2.調用獨立的DTD文件 將DTD文檔存為.dtd的文件,然后在DOCTYPE聲明行中調用,例如,將下面的代碼存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 然后在XML文檔中調用,在第一行后插入: <!DOCTYPE myfile SYSTEM "myfile.dtd"> 我們可以看到DTD文檔和HTML中js的調用是差不多的,關于DTD文檔具體如何寫,我們將在下一章和XML文檔的語法一起介紹。 下面我們來了解DTD有關的術語: 1.Schema(規(guī)劃) schema是數(shù)據規(guī)則的描述。schema做兩件事: a.它定義元素數(shù)據類型和元素之間的關系; b.它定義元素所能包含的內容類型。 DTD就是關于XML文檔的一個schema。 2.Document Tree(文檔樹) "文檔樹"在前面第二章我們已經提到過,它是文檔元素分級結構的形象表示。一個文檔結構樹包含根元素,根元素是最頂級的元素,(就是緊接著XML聲明語句后的第一個元素)。看例子: <? <filelist> <myfile> <title>...</title> <author>...</author> </myfile> </filelist> 上面的例子分三級結構排列成"樹"狀,其中的<filelist>就是根元素。在XML和DTD文件中,第一個定義的都是根元素。 3.Parent Element(父元素)/Child Element(子元素) 父元素是指包含有其它元素的元素,被包含的元素稱為它的子元素??瓷厦娴?結構樹",其中<myfile>是父元素,<title>,<author>是它的子元素,而<myfile>又是<filelist>的子元素。象<title>這樣沒有包含任何子元素的最后一級元素我們也稱之為"頁元素"。 4.Parser(解析軟件) Parser是一種檢查XML文檔是否遵循DTD規(guī)范的工具軟件。 Parser能獨立使用,也可以成為編輯軟件或瀏覽器的一部分。在后面的相關資源列表里,我列出了當前比較流行的一些parsers。 好了,通過第三章的學習,我們已經了解了一些XML和DTD的基本術語,但是我們還不知道怎樣來寫這些文件,需要遵循什么樣的語法,在下一章,將重點介紹有關撰寫XML和DTD文檔的語法。請繼續(xù)瀏覽,謝謝! XML輕松學習手冊(4)XML語法 第四章 XML語法 提綱: 一.XML語法規(guī)則 二.元素的語法 三.注釋的語法 四.CDATA的語法 五.Namespaces的語法 六.entity的語法 七.DTD的語法 通過前面三章的學習,我們已經對什么是XML,它的實現(xiàn)原理以及相關的術語有所了解。接下來我們就開始學習XML的語法規(guī)范,動手寫自己的XML文檔。 一.XML語法規(guī)則 XML的文檔和HTML的原代碼類似,也是用標識來標識內容。創(chuàng)建XML文檔必須遵守下列重要規(guī)則: 規(guī)則1:必須有XML聲明語句 這一點我們在上一章學習時已經提到過。聲明是XML文檔的第一句,其格式如下: <? 聲明的作用是告訴瀏覽器或者其它處理程序:這個文檔是XML文檔。聲明語句中的version表示文檔遵守的XML規(guī)范的版本;standalone表示文檔是否附帶DTD文件,如果有,參數(shù)為no;encoding表示文檔所用的語言編碼,默認是UTF-8。 規(guī)則2:是否有DTD文件 如果文檔是一個"有效的 <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 規(guī)則3:注意你的大小寫 在XML文檔中,大小寫是有區(qū)別的。<P>和<p>是不同的標識。注意在寫元素時,前后標識大小寫要保持一樣。例如:<Author>ajie</Author>,寫成<Author>ajie</author>是錯誤的。 你最好養(yǎng)成一種習慣,或者全部大寫,或者全部小寫,或者大寫第一個字母。這樣可以減少因為大小寫不匹配產生的文檔錯誤。 規(guī)則4:給屬性值加引號 在HTML代碼里面,屬性值可以加引號,也可以不加。例如:<font color=red> 但是在XML中則規(guī)定,所有屬性值必須加引號(可以是單引號,也可以是雙引號),否則將被視為錯誤。 規(guī)則5:所有的標識必須有相應的結束標識 在HTML中,標識可能不是成對出現(xiàn)的,比?lt;br>。而在XML中規(guī)定,所有標識必須成對出現(xiàn),有一個開始標識,就必須有一個結束標識。否則將被視為錯誤。 規(guī)則6:所有的空標識也必須被關閉 空標識就是標識對之間沒有內容的標識。比如 ,<img>等標識。在XML中,規(guī)定所有的標識必須有結束標識,針對這樣的空標識,XML中處理的方法是在原標識最后加/,就可以了。例如: 應寫為<br />; <META name="keyXML, SGML, <IMG src= "cool.gif">應寫為<IMG src= "cool.gif" /> 第四章 XML語法 二.元素的語法 元素由一對標識以及其中的內容組成。就象這樣:ajie。元素的名稱和標識的名稱是一樣的。標識可以用屬性來進一步描述。 在XML中,沒有任何保留字,所以你可以隨心所欲的用任何詞語來作為元素名稱。但是也必須遵守下列規(guī)范: 1.名稱中可以包含字母、數(shù)字以及其它字母; 2.名稱不能以數(shù)字或"_" (下劃線)開頭; 3.名稱不能以字母 XML(或 XML 或 Xml ..)開頭 4.名稱中不能包含空格 5.名稱中間不能包含":"(冒號) 為了使元素更容易閱讀理解和操作,我們還有一些建議: 1.名稱中不要使用"."。因為在很多程序語言中,"."是作為對象的屬性,例如:font.color。同樣的原因"-"也最好不要用,必須使用的,以"_"代替; 2.名稱盡量簡短。 3.名稱的大小寫盡量采用同一標準。 4.名稱可以使用非英文字符,比如用中文。但是有些軟件可能不支持。(IE5目前是支持中文元素的。) 另外,補充一點關于屬性的說明。在word</font>將把word顯示為紅色。而在CSS或者XSL,我們在下面詳細講述。) 三.注釋的語法 注釋是為了便于閱讀和理解,在XML文檔添加的附加信息,將不會被程序解釋或則瀏覽器顯示。 注釋的語法如下: <!-- 這里是注釋信息 --> 可以看到,它和HTML中的注釋語法是一樣的,非常容易。養(yǎng)成良好的注釋習慣將使你的文檔更加便于維護,共享,看起來也更專業(yè)。 四.CDATA的語法 CDATA全稱character data,翻譯為字符數(shù)據。我們在寫 <![CDATA[這里放置需要顯示的字符]]> 例如: <![CDATA[<AUTHOR sex="female">ajie</AUTHOR>]]> 在頁面上顯示的內容將是"<AUTHOR sex="female">ajie</AUTHOR>" 第四章 XML語法 五.Namespaces的語法 Namespaces翻譯為名字空間。名字空間有什么作用呢?當我們在一個XML文檔中使用他人的或者多個DTD文件,就會出現(xiàn)這樣的矛盾:因為XML中標識都是自己創(chuàng)建的,在不同的DTD文件中,標識名可能相同但表示的含義不同,這就可能引起數(shù)據混亂。 比如在一個文檔<table>wood table</table>中<table>表示桌子, 而在另一個文檔<table>namelist</table>中<table>表示表格。如果我需要同時處理這兩個文檔,就會發(fā)生名字沖突。 了解決這個問題,我們引進了namespaces這個概念。namespaces通過給標識名稱加一個網址(URL)定位的方法來區(qū)別這些名稱相同的標識。 Namespaces同樣需要在XML文檔的開頭部分聲明,聲明的語法如下: <document 其中yourname是由你定義的namespaces的名稱,URL就是名字空間的網址。 假設上面的"桌子<table>"文檔來自http://www.zhuozi.com,我們就可以聲明為 <document http://www.zhuozi.com'> 然后在后面的標識中使用定義好的名字空間: <zhuozi:table>wood table</table> 這樣就將這兩個<table>區(qū)分開來。注意的是:設置URL并不是說這個標識真的要到那個網址去讀取,僅僅作為一種區(qū)別的標志而已。 六.entity的語法 entity翻譯為"實體"。它的作用類似 entity可以包含字符,文字等等,使用entity的好處在于:1.它可以減少差錯,文檔中多個相同的部分只需要輸入一遍就可以了。2.它提高維護效率。比如你有40個文檔都包含copyright的entity,如果需要修改這個copyright,不需要所有的文件都修改,只要改最初定義的entity語句就可以了。 XML定義了兩種類型的entity。一種是我們這里說的普通entity,在XML文檔中使用;另一種是參數(shù)entity,在DTD文件中使用。 entity的定義語法為: <!DOCTYPE filename [ <!ENTITY entity-name "entity-content" ] > 例如我要定義一段版權信息: <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved" ] > 如果我的版權信息內容和他人共享一個XML文件,也可以使用外部調用的方法,語法象這樣: <!DOCTYPE copyright [ <!ENTITY copyright SYSTEM "http://www.sample.com/copyright. ] > 定義好的entity在文檔中的引用語法為:&entity-name; 例如,上面定義的版權信息,調用時寫作?copyright; 完整的例子如下,你可以copy下來存為copyright.XML觀看實例: <? <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved"> ]> <myfile> <title>XML</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> ©right; </myfile> 第四章 XML語法 七.DTD的語法 DTD是"有效 1.設置元素 元素是XML文檔的基本組成部分。你要在DTD中定義一個元素,然后在XML文檔中使用。元素的定義語法為:<!ELEMENT DESCRIPTION (#PCDATA, DEFINITION)*> 說明: "<!ELEMENT" 是元素的聲明,說明你要定義的是一個元素; 聲明后面的"DESCRIPTION",是元素的名稱; "(#PCDATA, DEFINITION)*>"則是該元素的使用規(guī)則。規(guī)則定義了元素可以包含的內容以及相互的關系。下面的表格概要列出了元素的規(guī)則: 2.元素規(guī)則表: 此主題相關圖片如下: 另外,我們還可以為元素定義屬性,因為我們不推薦使用屬性,在這里就不詳細展開了。 最后,我們來總結一些前四章學習的內容,寫一個包含DTD,XML,以及Script的簡單實例,便于讀者理解: 1.將下面文件存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 2.然后建立XML文檔myfile.xml: <? <!DOCTYPE myfile SYSTEM "myfile.dtd"> <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 3.建立HTML文檔myfile.html <HTML> <head> <script language=" var nodes = XMLDoc.documentElement.childNodes; title.innerText = nodes.item(0).text; author.innerText = nodes.item(1).text; </script> <title>在HTML中調用XML數(shù)據</title> </head> <body bgcolor="#FFFFFF"> <b>標題: </b> <span id="title"></span><br> <b>作者: </b> <span id="author"></span><br> </body> </HTML> 4.用IE5.0以上瀏覽器打開myfile.HTML就可以看到效果了。 XML輕松學習手冊(5)XML實例解析 第五章:XML實例解析 提綱: 一:實例效果 二:實例解析 1.定義新標識。 2.建立XML文檔。 3.建立相應的HTML文件。 XML在不同領域有著廣泛的應用,比如在科技領域的MathML,無線通信應用的WML,在網絡圖象方面的SVG等等,我們這里側重討論XML在web上的應用。XML在web上應用主要是利用其強大的數(shù)據操作能力。一般用XML配合JavaScript和ASP等服務器端程序,可以實現(xiàn)網絡上幾乎所有的應用需求。 考慮講解方便,我們在下面介紹一個簡單的實例,不包含服務器端程序。目的在于讓您對XML的數(shù)據操作能力有一個感性的認識。 好,我們首先[ 點擊這里 ]來看實例的效果。(請用IE5.0以上版本瀏覽器打開) 這是一個簡單的CD唱片數(shù)據檢索功能。你通過點擊"上一張","下一張"可以看到單張CD的有關信息。這樣的效果我們原來用兩種方法可以實現(xiàn): 1.利用DHTML,將數(shù)據隱藏在不同的層中,通過鼠標事件依次顯示; 2.利用后臺程序(如ASP,CGI,PHP,JSP等),調用服務器端的數(shù)據。 但是在這個實例中,我們打開頁面原代碼可以看到,其中沒有用DHTML的DIV,也沒有表單的action,它完全是用XML來實現(xiàn)的。下面我們來分析它的制作過程: 第一步:定義新標識。 根據實際的CD數(shù)據,首先新建一個名為<CD>的標識;其次建立它相關的數(shù)據標識,分別是:CD名稱<Title>,演唱者<Artist>,出版年代<Year>,國家<Country>,發(fā)行公司<Company>和價格<Price>;最后還要建立一個名為目錄<CATALOG>的標識。為什么要再建立一個<CATALOG>標識呢?因為在XML文檔中規(guī)定,必須且只能有一個根元素(標識),我們有多個CD數(shù)據,這些數(shù)據是并列的關系,所以需要為這些并列的元素建立一個根元素。 以上元素的定義和關系都完全符合XML標準,不需要特別的DTD文件來定義,所以可以省略DTD定義。如果我們想使用DTD來定義,以上過程可以表示為: <!ELEMENT CATALOG (CD)*> <!ELEMENT CD (Title,Artist,Year,Country,Company,Price)> <!ELEMENT Title (#PCDATA)> <!ELEMENT Artist (#PCDATA)> <!ELEMENT Year (#PCDATA)> <!ELEMENT Country (#PCDATA)> <!ELEMENT Company (#PCDATA)> <!ELEMENT Price (#PCDATA)> 這段代碼表示:元素CATALOG包含多個CD子元素,而子元素CD又依次包含Title, Artist, Year, Country, Company, Price 六個子元素,它們的內容都定義為文本(字符,數(shù)字,文本)。(注:具體的語法說明可以看上一章關于DTD的介紹) 第二步:建立XML文檔。 <? <CATALOG> <CD> <TITLE>Empire Burlesque</TITLE> <ARTIST>Bob Dylan</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>Columbia</COMPANY> <PRICE>10.90</PRICE> <YEAR>1985</YEAR> </CD> <CD> <TITLE>Hide your heart</TITLE> <ARTIST>Bonnie Tylor</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>CBS Records</COMPANY> <PRICE>9.90</PRICE> <YEAR>1988</YEAR> </CD> <CD> <TITLE>Greatest Hits</TITLE> <ARTIST>Dolly Parton</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>RCA</COMPANY> <PRICE>9.90</PRICE> <YEAR>1982</YEAR> </CD> <CD> <TITLE>Still got the blues</TITLE> <ARTIST>Gary More</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>Virgin redords</COMPANY> <PRICE>10.20</PRICE> <YEAR>1990</YEAR> </CD> <CD> <TITLE>Eros</TITLE> <ARTIST>Eros Ramazzotti</ARTIST> <COUNTRY>EU</COUNTRY> <COMPANY>BMG</COMPANY> <PRICE>9.90</PRICE> <YEAR>1997</YEAR> </CD> </CATALOG> 上面代碼首先用<? <CATALOG> <CD> ...... </CD> <CD> ...... </CD> </CATALOG> 一共定義了5組數(shù)據。我們將上面的代碼存為cd.XML文件,以備調用。 第三步:建立相應的HTML文件。 1.導入XML數(shù)據。 我們知道,目前流行的瀏覽器中,暫時只有微軟的IE5.0以上版本瀏覽器支持XML。IE是通過在 CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> 定義一個object,ID名為XMLdso。然后在head區(qū)用js引入xml數(shù)據: <script for="window" event="onload"> </script> 2.捆綁數(shù)據。 然后將用<SPAN>標識來將XML數(shù)據綁定在表格中。其中ID,DATASRC,DTATFLD都是<SPAN>的屬性。代碼如下: <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> 3.動作操作。 最后,為數(shù)據提供瀏覽按鈕: <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> 并利用js來完成兩個鼠標點擊功能:movenext()和moveprevious()。在head區(qū)加入如下代碼: <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> 好,我們先看HTML文件的全部原代碼: <HTML> <head> <script for="window" event="onload"> </script> <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> <TITLE>CD Navigate</TITLE> </head> <body> <p> <object WIDTH="0" HEIGHT="0" CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> <p> <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> </p> </body> </HTML> 將以上代碼存為cd.htm文件,于第二步的cd.XML文件放在一起。打開cd.htm文件,你就看見和上面實例一樣的效果了。 好,到今天為止,我們已經學習了關于XML的不少知識,我們來總結一下前面五個章節(jié),分別是XML快速入門,XML的概念原理,XML的術語,XML的語法和本章的實例解析。到這里,教程部分就結束了。在寫作過程中,阿捷盡最大努力將有關XML概念講得通俗易懂,盡量把自己的理解告訴給大家,但因為本人學習XML時間也不長,對整個XML的技術把握還不夠系統(tǒng)和深入,所以難免有疏漏的地方,請大家指正和諒解,謝謝! posted on 2009-02-15 15:45 YXY 閱讀(187) 評論(0) 編輯 收藏
nodes = XMLDoc.documentElement.childNodes;
title.innerText = nodesitem(0).text;
author.innerText = nodes.item(1).text;
email.innerText = nodes.item(2).text;
date.innerText = nodes.item(3).text;
</script>
<title>在HTML中調用XML數(shù)據</title>
</head>
<body bgcolor="#FFFFFF">
<b>標題: </b>
<span id="title"> </span>
<b>作者: </b>>
<span id="author"></span>
<b>信箱: </b>
<span id="email"></span>
<b>日期:</b>
<span id="date"></span>
</body>
</HTML>
2.將下面代碼存為myfile.XML
<? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> </myfile> 3.將它們放在同一個目錄下,用IE5以上版本瀏覽器打開,可以看到效果。 學習并掌握一種script,你將真正了解到XML無比的強大的功能。 五. XML和HTML的區(qū)別 XML和HTML都來自于SGML,它們都含有標記,有著相似的語法,HTML和XML的最大區(qū)別在于:HTML是一個定型的標記語言,它用固有的標記來描述,顯示網頁內容。比如< H1>表示首行標題,有固定的尺寸。相對的,XML則沒有固定的標記,XML不能描述網頁具體的外觀,內容,它只是描述內容的數(shù)據形式和結構。 這是一個質的區(qū)別:網頁將數(shù)據和顯示混在一起,而XML則將數(shù)據和顯示分開來。 我們看上面的例子,在myfile.htm中,我們只關心頁面的顯示方式,我們可以設計不同的界面,用不同的方式來排版頁面,但數(shù)據是儲存在myfile.XML中,不需要任何改變。 (如果你是程序員,你會驚訝的發(fā)現(xiàn),這與模塊化面向對象編程的思想極其相似!其實網頁何嘗不是一種程序呢?) 正是這種區(qū)別使得XML在網絡應用和信息共享上方便,高效,可擴展。所以我們相信,XML做為一種先進的數(shù)據處理方法,將使網絡跨越到一個新的境界。 六. XML的嚴格格式 吸取HTML松散格式帶來的經驗教訓, 我們先看HTML的一些語句,這些語句在HTML中隨處可見: 1. sample 2.< b>< i>sample< /b>< /i> 3.< td>sample< /TD> 4.< font color=red>samplar< /font> 在XML文檔中,上述幾種語句的語法都是錯誤的。因為: 1.所有的標記都必須要有一個相應的結束標記; 2.所有的XML標記都必須合理嵌套; 3.所有XML標記都區(qū)分大小寫; 4.所有標記的屬性必須用""括起來; 所以上列語句在XML中正確的寫法是 1. sample 2.< b>< i>sample< /i>< /b> 3.< td>sample< /td> 4.< font color="red">samplar< /font> 另外,XML標記必須遵循下面的命名規(guī)則: 1.名字中可以包含字母、數(shù)字以及其它字母; 2.名字不能以數(shù)字或"_" (下劃線) 開頭; 3.名字不能以字母 XML (或 XML 或 Xml ..) 開頭; 4.名字中不能包含空格。 在XML文檔中任何的差錯,都會得到同一個結果:網頁不能被顯示。各瀏覽器開發(fā)商已經達成協(xié)議,對XML實行嚴格而挑剔的解析,任何細小的錯誤都會被報告。你可以將上面的myfile.xml修改一下,比如將< email>改為< Email>,然后用IE5直接打開myfile.xml,會得到一個出錯信息頁面: <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> <Email>ajie@aolhoo.com</email> <date>20010115</date> </myfile> 七. 關于XML的更多 好了,到現(xiàn)在你已經知道: 1.什么是XML; 2.XML,HTML,SGML之間的關系和區(qū)別; 3.XML的簡單應用。 恭喜你!你已經不再對XML一無所知,并且已經走在了網絡技術的前沿。整個學習過程好象并不很難哦:) 如果你對XML有更多的興趣,希望進一步了解XML的詳細資料和其它的實際運用技術,歡迎繼續(xù)瀏覽我們的下一章:XML的概念。 XML輕松學習手冊(2)XML概念 第二章 XML概念 導言 經過第一章的快速入門學習,你已經知道了 一. 擴展性 二. 標識 三. 語言 四. 結構化 五. Meta數(shù)據 六. 顯示 七. DOM 一.擴展性---使用XML,你可以為你的文檔建立自己的標記(tags)。 在HTML里,有許多固定的標記,我們必須記住然后使用它們,你不能使用HTML規(guī)范里沒有的標記。而在XML中,你能建立任何你需要的標記。你可以充分發(fā)揮你的想象力,給你的文檔起一些好記的標記名稱。比如,你的文檔里包含一些游戲的攻略,你可以建立一個名為<game>的標記,然后在<game>下再根據游戲類別建立<RPG>,<SLG>等標記。只要清晰,易于理解你可以建立任何數(shù)量的標記。 一開始你也許會不適應,因為我們在學習HTML時,有固定的標記可以直接學習和使用;(很多人包括我自己都是邊分析別人的代碼和標識,邊建立自己的網頁),而XML卻沒有任何標記可以學,也很少有文檔的標記是一模一樣的。我們怎么辦?呵呵,沒有就自己創(chuàng)建呀。一旦你真正開始寫XML文檔,你會發(fā)現(xiàn)隨心所欲的創(chuàng)造新標記也是一份很有趣的事。你可以建立有自己特色的標記,甚至建立你自己的HTML語言。 擴展性使你有更多的選擇和強大的能力,但同時也產生一個問題就是你必須學會規(guī)劃。你自己要理解自己的文檔,知道它由哪幾部分組成,相互之間的關系和如何識別它們。 關于建立標識還需要說明一點,標識是描述數(shù)據的類型或特性,比如<width>,年齡<age>,姓名<name>等,而不是數(shù)據的內容,比如:<10pxl>,<18>,<張三>,這些都是無用的標記。如果你學過數(shù)據庫,你可以這樣理解,標識就是一種字段名。 二.標識---使用XML你可以識別文檔中的元素。 不論你是HTML,還是XML,標識的本質在于便于理解,如果沒有標識,你的文檔在計算機看來只是一個很長的字符串,每個字看起來都一樣,沒有重點之分。 通過標識,你的文檔才便于閱讀和理解,你可以劃分段落,列明標題。XML中,你更可以利用其擴展性 來為文檔建立更合適的標識。 不過,有一點要提醒大家注意:標識僅僅是用來識別信息,它本身并不傳達信息。例如這樣的HTML代碼: <b>frist step<b> 這里<b>表示粗體,只用來說明是用粗體來顯示"frist step"字符,<b>本身并不包含任何實際的信息,在頁面上你看不到<b>,真正傳達信息的是"frist step "。 三.語言---使用XML你要遵循特定的語法來標識你的文檔。 在計算機領域,語言常常表示一?quot;程序語言",用來編程實現(xiàn)一些功能和應用,但不是所有的"語言"都是用來編程的,XML就只是一種用來定義標識和描述信息的語言。 下面我們來深入了解一下XML應用的其本原理,可能會很枯燥,但是對于整體的理解很重要,你可以先快速過一遍,心里有一個模糊的概念,具體精髓則需要在實踐中慢慢領會。 四.結構化---XML促使文檔結構化,所有的信息按某種關系排列。 "結構化"聽起來太抽象了,我們這樣理解,結構化就是為你的文檔建立一個框架,就象寫文章先寫一個提綱。結構化使你的文檔看起來不會雜亂無章,每一部分都緊密聯(lián)系,形成一個整體。 結構化有兩個原則: 1.每一部分(每一個元素)都和其他元素有關聯(lián)。關聯(lián)的級數(shù)就形成了結構。 2.標識本身的含義與它描述的信息相分離。 我們來看一個簡單的例子幫助理解: <? <myfile> <title>XML輕松學習手冊</title> <chapter>XML快速入門 <para>什么是XML</para> <para>使用XML的好處</para> </chapter> <chapter>XML的概念 <para>擴展性</para> <para>標識</para> </chapter> </myfile> 這是本文的XML描述文檔,可以看到標識分三級關聯(lián),非常清晰: <myfile> <chapter> <para> ... </para> </chapter> </myfile> 上面這樣的文檔結構,我們又稱之為"文檔樹",主干是父元素,如<myfile>,分支和頁是子元素,如<chapter>和<para>。 五.Meta數(shù)據(Metadata)---專業(yè)的XML使用者會使用meta數(shù)據來工作。 在HTML中我們知道可以使用meta標識來定義網頁的關鍵字,簡介等,這些標識不會顯示在網頁中,但可以被搜索引擎搜索到,并影響搜索結果的排列順序。 XML對這一原理進行了深化和擴展,用XML,你可以描述你的信息在哪里,你可以通過meta來驗證信息,執(zhí)行搜索,強制顯示,或者處理其他的數(shù)據。 下面是一些XML metadata在實際應用中的用途: 1.可以驗證數(shù)字簽名,使在線商務的提交動作(submission)有效。 2.可以被方便的建立索引和進行更有效搜索。 3.可以在不同語言之間傳輸數(shù)據。 W3C組織正在研究一種名為RDF(Resource Description Framework)的metadata處理方法,可以自動交換信息,W3C宣稱,使用RDF配合數(shù)字簽名,將使網絡中存在"真實可信"的電子商務。 六.顯示 單獨用XML不能顯示頁面,我們使用格式化技術,比如CSS或者XSL,才能顯示XML標記創(chuàng)建的文檔。 我們在前面第一章講到XML是將數(shù)據和格式分離的。XML文檔本身不知道如何來顯示,必須有輔助文件來幫助實現(xiàn)。(XML取消了所有標識,包括font,color,p等風格樣式定義標識,因此XML全部是采用類似DHTML中CSS的方法來定義文檔風格樣式。),XML中用來設定顯示風格樣式的文件類型有: 1.XSL XSL全稱是Extensible Stylesheet Language(可擴展樣式語言), 是將來設計XML文檔顯示樣式的主要文件類型。它本身也是基于XML語言的。使用XSL,你可以靈活的設置文檔顯示樣式,文檔將自動適應任何瀏覽器和PDA(掌上電腦)。 XSL也可以將XML轉化為HTML,那樣,老的瀏覽器也可以瀏覽XML文檔了。 2.CSS CSS大家很熟悉了,全稱是Cascading Style Sheets(層疊樣式表),是目前用來在瀏覽器上顯示XML文檔的主要方法。 3.Behaviors Behaviors現(xiàn)在還沒有成為標準。它是微軟的IE瀏覽器特有的功能,用它可以對XML標識設定一些有趣動作。 七.DOM DOM全稱是document object model(文檔對象模型),DOM是用來干什么的呢?假設把你的文檔看成一個單獨的對象,DOM就是如何用HTML或者XML對這個對象進行操作和控制的標準。 面向對象的思想方法已經非常流行了,在編程語言(例如java,js)中,都運用面向對象的編程思想。在XML中,就是要將網頁也作為一個對象來操作和控制,我們可以建立自己的對象和模板。與對象進行交流,如何命令對象,就要用到API。API全稱Application Programming Interface,它是訪問和操作對象的規(guī)則。而DOM就是一種詳細描述HTML/XML文檔對象規(guī)則的API。它規(guī)定了HTML/XML文檔對象的命名協(xié)定,程序模型,溝通規(guī)則等。在XML文檔中,我們可以將每一個標識元素看作一個對象---它有自己的名稱和屬性。 XML創(chuàng)建了標識,而DOM的作用就是告訴script如何在瀏覽器窗口中操作和顯示這些標識 上面我們已經簡要的講述了一些XML的基本原理,我們來看看它們之間的關聯(lián)以及它們是如何工作的,先看這里一張圖: 此主題相關圖片如下: 1. 2.CSS儲存并控制元素的顯示樣式。例如:標題將被以18pt字體顯示 3.script腳本控制元素如何動作。例如:當一個title元素"out of stock",將被用紅色顯示。 4.DOM則為腳本和對象的交流提供一個公共平臺,并將結果顯示在瀏覽器窗口。 如果任何一個部分發(fā)生錯誤,都不會得到正確結果。 好了,看到這里,我們已經對XML是如何工作的有一個整體的大致的概念。通過這一章的學習,我們可能感覺到XML似乎更偏向數(shù)據處理,更方便程序員學習。實際情況也是這樣的,XML設計的目的就是用來方便的共享和交互數(shù)據的。下一章,我們將系統(tǒng)的了解關于XML的各種術語。歡迎您繼續(xù)瀏覽。 XML輕松學習手冊(3)XML的術語 第三章 XML的術語 提綱: 導言 一.XML文檔的有關術語 二.DTD的有關術語 導言 初學XML最令人頭疼的就是有一大堆新的術語概念要理解。由于XML本身也是一個嶄新的技術,正在不斷發(fā)展和變化,各組織和各大網絡公司(微軟,IBM,SUN等)都在不斷推出自己的見解和標準,因此新概念漫天飛就不足為奇了。而國內又缺乏權威的機構或組織來對這些術語正式定名,你所看見的有關XML的中文教材大部分是靠作者本身的理解翻譯過來的,有些是正確的,有些是錯誤的,更加妨礙了我們對這些概念的理解和學習。 你下面將要看到的關于XML術語的解釋,也是作者本身的理解和翻譯。阿捷是以W3C組織發(fā)布的XML1.0標準規(guī)范和相關的正式說明文檔為根據來講述。可以確保這些理解是基本正確的,至少不是錯誤的。你如果想進一步閱讀和了解,我在本文的最后部分列明了相關資源的出處和鏈接,你可以直接訪問。好,我們轉入正題: 一.XML文檔的有關術語 什么是XML文檔?知道 <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> </myfile> XML文檔包含三個部分: 1. 一個XML文檔聲明; 2. 一個關于文檔類型的定義; 3. 用XML標識創(chuàng)建的內容。 舉例說明: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> <filelist> <myfile> <title>QUICK START OF XML</title> <author>ajie</author> </myfile> ...... </filelist> 其中第一行<? 我們來了解XML文檔中有關的術語: 1.Element(元素): 元素在HTML我們已經有所了解,它是組成HTML文檔的最小單位,在XML中也一樣。一個元素由一個標識來定義,包括開始和結束標識以及其中的內容,就象這樣:<author>ajie</author> 唯一不同的就是:在HTML中,標識是固定的,而在XML中,標識需要你自己創(chuàng)建。 2.Tag(標識) 標識是用來定義元素的。在XML中,標識必須成對出現(xiàn),將數(shù)據包圍在中間。標識的名稱和元素的名稱是一樣的。例如這樣一個元素: <author>ajie</author> 其中<author>就是標識。 3.Attribute(屬性): 什么是屬性?看這段word</font>。其中color就是font的屬性之一。 屬性是對標識進一步的描述和說明,一個標識可以有多個屬性,例如font的屬性還有size。XML中的屬性與HTML中的屬性是一樣的,每個屬性都有它自己的名字和數(shù)值,屬性是標識的一部分。舉例: <author sex="female">ajie</author> XML中屬性也是自己定義的,我們建議你盡量不使用屬性,而將屬性改成子元素,例如上面的代碼可以改成這樣: <author>ajie <sex>female</sex> </author> 原因是屬性不易擴充和被程序操作。 4.Declaration(聲明) 在所有XML文檔的第一行都有一個XML聲明。這個聲明表示這個文檔是一個XML文檔,它遵循的是哪個XML版本的規(guī)范。一個XML的聲明語句就象這樣: <? 5.DTD(文件類型定義) DTD是用來定義XML文檔中元素,屬性以及元素之間關系的。 通過DTD文件可以檢測XML文檔的結構是否正確。但建立XML文檔并不一定需要DTD文件。關于DTD文件的詳細說明我們將在下面單獨列項。 6.Well-formed XML(良好格式的XML) 一個遵守 良好格式的文檔必須以一個XML聲明開始,例如: <? 其中你必須說明文檔遵守的 良好格式的XML文檔必須有一個根元素,就是緊接著聲明后面建立的第一個元素,其它元素都是這個根元素的子元素,屬于根元素一組。 良好格式的XML文檔的內容書寫時必須遵守XML語法。(有關XML語法我們將在下一章仔細講解) 7.Valid XML(有效的XML) 一個遵守 將XML文檔和它的DTD文件進行比較分析,看是否符合DTD規(guī)則的過程叫validation(確認)。這樣的過程通常我們是通過一個名為parser的軟件來處理的。 有效的XML文檔也必須以一個XML聲明開始,例如: <? 和上面例子不同的,在standalone(獨立)屬性中,這里設置的是"no",因為它必須和相應的DTD一起使用,DTD文件的定義方法如下: <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 二.DTD的有關術語 什么是DTD,我們上面已經簡略提到。DTD是一種保證XML文檔格式正確的有效方法,可以比較XML文檔和DTD文件來看文檔是否符合規(guī)范,元素和標簽使用是否正確。一個DTD文檔包含:元素的定義規(guī)則,元素間關系的定義規(guī)則,元素可使用的屬性,可使用的實體或符號規(guī)則。 DTD文件也是一個ASCII的文本文件,后綴名為.dtd。例如:myfile.dtd。 為什么要用DTD文件呢?我的理解是它滿足了網絡共享和數(shù)據交互,使用DTD最大的好處在于DTD文件的共享。(就是上文DTD說明語句中的PUBLIC屬性)。比如,兩個相同行業(yè)不同地區(qū)的人使用同一個DTD文件來作為文檔創(chuàng)建規(guī)范,那么他們的數(shù)據就很容易交換和共享。網上有其他人想補充數(shù)據,也只需要根據公用的DTD規(guī)范來建立文檔,就立刻可以加入。 目前,已經有數(shù)量眾多的寫好的DTD文件可以利用。針對不同的行業(yè)和應用,這些DTD文件已經建立了通用的元素和標簽規(guī)則。你不需要自己重新創(chuàng)建,只要在他們的基礎上加入你需要的新標識。 當然,如果愿意,你可以創(chuàng)建自己的DTD,它可能和你的文檔配合的更加完美。建立自己的DTD也是很簡單的一件事,一般只需要定義4-5個元素就可以了。 調用DTD文件的方法有兩種: 1.直接包含在XML文檔內的DTD 你只要在DOCTYPE聲明中插入一些特別的說明就可以了,象這樣: 我們有一個XML文檔: <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 我們在第一行后面插入下面代碼就可以: <!DOCTYPE myfile [ <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> <!ENTITY copyright "Copyright 2001, Ajie."> ]> 2.調用獨立的DTD文件 將DTD文檔存為.dtd的文件,然后在DOCTYPE聲明行中調用,例如,將下面的代碼存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 然后在XML文檔中調用,在第一行后插入: <!DOCTYPE myfile SYSTEM "myfile.dtd"> 我們可以看到DTD文檔和HTML中js的調用是差不多的,關于DTD文檔具體如何寫,我們將在下一章和XML文檔的語法一起介紹。 下面我們來了解DTD有關的術語: 1.Schema(規(guī)劃) schema是數(shù)據規(guī)則的描述。schema做兩件事: a.它定義元素數(shù)據類型和元素之間的關系; b.它定義元素所能包含的內容類型。 DTD就是關于XML文檔的一個schema。 2.Document Tree(文檔樹) "文檔樹"在前面第二章我們已經提到過,它是文檔元素分級結構的形象表示。一個文檔結構樹包含根元素,根元素是最頂級的元素,(就是緊接著XML聲明語句后的第一個元素)。看例子: <? <filelist> <myfile> <title>...</title> <author>...</author> </myfile> </filelist> 上面的例子分三級結構排列成"樹"狀,其中的<filelist>就是根元素。在XML和DTD文件中,第一個定義的都是根元素。 3.Parent Element(父元素)/Child Element(子元素) 父元素是指包含有其它元素的元素,被包含的元素稱為它的子元素??瓷厦娴?結構樹",其中<myfile>是父元素,<title>,<author>是它的子元素,而<myfile>又是<filelist>的子元素。象<title>這樣沒有包含任何子元素的最后一級元素我們也稱之為"頁元素"。 4.Parser(解析軟件) Parser是一種檢查XML文檔是否遵循DTD規(guī)范的工具軟件。 Parser能獨立使用,也可以成為編輯軟件或瀏覽器的一部分。在后面的相關資源列表里,我列出了當前比較流行的一些parsers。 好了,通過第三章的學習,我們已經了解了一些XML和DTD的基本術語,但是我們還不知道怎樣來寫這些文件,需要遵循什么樣的語法,在下一章,將重點介紹有關撰寫XML和DTD文檔的語法。請繼續(xù)瀏覽,謝謝! XML輕松學習手冊(4)XML語法 第四章 XML語法 提綱: 一.XML語法規(guī)則 二.元素的語法 三.注釋的語法 四.CDATA的語法 五.Namespaces的語法 六.entity的語法 七.DTD的語法 通過前面三章的學習,我們已經對什么是XML,它的實現(xiàn)原理以及相關的術語有所了解。接下來我們就開始學習XML的語法規(guī)范,動手寫自己的XML文檔。 一.XML語法規(guī)則 XML的文檔和HTML的原代碼類似,也是用標識來標識內容。創(chuàng)建XML文檔必須遵守下列重要規(guī)則: 規(guī)則1:必須有XML聲明語句 這一點我們在上一章學習時已經提到過。聲明是XML文檔的第一句,其格式如下: <? 聲明的作用是告訴瀏覽器或者其它處理程序:這個文檔是XML文檔。聲明語句中的version表示文檔遵守的XML規(guī)范的版本;standalone表示文檔是否附帶DTD文件,如果有,參數(shù)為no;encoding表示文檔所用的語言編碼,默認是UTF-8。 規(guī)則2:是否有DTD文件 如果文檔是一個"有效的 <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 規(guī)則3:注意你的大小寫 在XML文檔中,大小寫是有區(qū)別的。<P>和<p>是不同的標識。注意在寫元素時,前后標識大小寫要保持一樣。例如:<Author>ajie</Author>,寫成<Author>ajie</author>是錯誤的。 你最好養(yǎng)成一種習慣,或者全部大寫,或者全部小寫,或者大寫第一個字母。這樣可以減少因為大小寫不匹配產生的文檔錯誤。 規(guī)則4:給屬性值加引號 在HTML代碼里面,屬性值可以加引號,也可以不加。例如:<font color=red> 但是在XML中則規(guī)定,所有屬性值必須加引號(可以是單引號,也可以是雙引號),否則將被視為錯誤。 規(guī)則5:所有的標識必須有相應的結束標識 在HTML中,標識可能不是成對出現(xiàn)的,比?lt;br>。而在XML中規(guī)定,所有標識必須成對出現(xiàn),有一個開始標識,就必須有一個結束標識。否則將被視為錯誤。 規(guī)則6:所有的空標識也必須被關閉 空標識就是標識對之間沒有內容的標識。比如 ,<img>等標識。在XML中,規(guī)定所有的標識必須有結束標識,針對這樣的空標識,XML中處理的方法是在原標識最后加/,就可以了。例如: 應寫為<br />; <META name="keyXML, SGML, <IMG src= "cool.gif">應寫為<IMG src= "cool.gif" /> 第四章 XML語法 二.元素的語法 元素由一對標識以及其中的內容組成。就象這樣:ajie。元素的名稱和標識的名稱是一樣的。標識可以用屬性來進一步描述。 在XML中,沒有任何保留字,所以你可以隨心所欲的用任何詞語來作為元素名稱。但是也必須遵守下列規(guī)范: 1.名稱中可以包含字母、數(shù)字以及其它字母; 2.名稱不能以數(shù)字或"_" (下劃線)開頭; 3.名稱不能以字母 XML(或 XML 或 Xml ..)開頭 4.名稱中不能包含空格 5.名稱中間不能包含":"(冒號) 為了使元素更容易閱讀理解和操作,我們還有一些建議: 1.名稱中不要使用"."。因為在很多程序語言中,"."是作為對象的屬性,例如:font.color。同樣的原因"-"也最好不要用,必須使用的,以"_"代替; 2.名稱盡量簡短。 3.名稱的大小寫盡量采用同一標準。 4.名稱可以使用非英文字符,比如用中文。但是有些軟件可能不支持。(IE5目前是支持中文元素的。) 另外,補充一點關于屬性的說明。在word</font>將把word顯示為紅色。而在CSS或者XSL,我們在下面詳細講述。) 三.注釋的語法 注釋是為了便于閱讀和理解,在XML文檔添加的附加信息,將不會被程序解釋或則瀏覽器顯示。 注釋的語法如下: <!-- 這里是注釋信息 --> 可以看到,它和HTML中的注釋語法是一樣的,非常容易。養(yǎng)成良好的注釋習慣將使你的文檔更加便于維護,共享,看起來也更專業(yè)。 四.CDATA的語法 CDATA全稱character data,翻譯為字符數(shù)據。我們在寫 <![CDATA[這里放置需要顯示的字符]]> 例如: <![CDATA[<AUTHOR sex="female">ajie</AUTHOR>]]> 在頁面上顯示的內容將是"<AUTHOR sex="female">ajie</AUTHOR>" 第四章 XML語法 五.Namespaces的語法 Namespaces翻譯為名字空間。名字空間有什么作用呢?當我們在一個XML文檔中使用他人的或者多個DTD文件,就會出現(xiàn)這樣的矛盾:因為XML中標識都是自己創(chuàng)建的,在不同的DTD文件中,標識名可能相同但表示的含義不同,這就可能引起數(shù)據混亂。 比如在一個文檔<table>wood table</table>中<table>表示桌子, 而在另一個文檔<table>namelist</table>中<table>表示表格。如果我需要同時處理這兩個文檔,就會發(fā)生名字沖突。 了解決這個問題,我們引進了namespaces這個概念。namespaces通過給標識名稱加一個網址(URL)定位的方法來區(qū)別這些名稱相同的標識。 Namespaces同樣需要在XML文檔的開頭部分聲明,聲明的語法如下: <document 其中yourname是由你定義的namespaces的名稱,URL就是名字空間的網址。 假設上面的"桌子<table>"文檔來自http://www.zhuozi.com,我們就可以聲明為 <document http://www.zhuozi.com'> 然后在后面的標識中使用定義好的名字空間: <zhuozi:table>wood table</table> 這樣就將這兩個<table>區(qū)分開來。注意的是:設置URL并不是說這個標識真的要到那個網址去讀取,僅僅作為一種區(qū)別的標志而已。 六.entity的語法 entity翻譯為"實體"。它的作用類似 entity可以包含字符,文字等等,使用entity的好處在于:1.它可以減少差錯,文檔中多個相同的部分只需要輸入一遍就可以了。2.它提高維護效率。比如你有40個文檔都包含copyright的entity,如果需要修改這個copyright,不需要所有的文件都修改,只要改最初定義的entity語句就可以了。 XML定義了兩種類型的entity。一種是我們這里說的普通entity,在XML文檔中使用;另一種是參數(shù)entity,在DTD文件中使用。 entity的定義語法為: <!DOCTYPE filename [ <!ENTITY entity-name "entity-content" ] > 例如我要定義一段版權信息: <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved" ] > 如果我的版權信息內容和他人共享一個XML文件,也可以使用外部調用的方法,語法象這樣: <!DOCTYPE copyright [ <!ENTITY copyright SYSTEM "http://www.sample.com/copyright. ] > 定義好的entity在文檔中的引用語法為:&entity-name; 例如,上面定義的版權信息,調用時寫作?copyright; 完整的例子如下,你可以copy下來存為copyright.XML觀看實例: <? <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved"> ]> <myfile> <title>XML</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> ©right; </myfile> 第四章 XML語法 七.DTD的語法 DTD是"有效 1.設置元素 元素是XML文檔的基本組成部分。你要在DTD中定義一個元素,然后在XML文檔中使用。元素的定義語法為:<!ELEMENT DESCRIPTION (#PCDATA, DEFINITION)*> 說明: "<!ELEMENT" 是元素的聲明,說明你要定義的是一個元素; 聲明后面的"DESCRIPTION",是元素的名稱; "(#PCDATA, DEFINITION)*>"則是該元素的使用規(guī)則。規(guī)則定義了元素可以包含的內容以及相互的關系。下面的表格概要列出了元素的規(guī)則: 2.元素規(guī)則表: 此主題相關圖片如下: 另外,我們還可以為元素定義屬性,因為我們不推薦使用屬性,在這里就不詳細展開了。 最后,我們來總結一些前四章學習的內容,寫一個包含DTD,XML,以及Script的簡單實例,便于讀者理解: 1.將下面文件存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 2.然后建立XML文檔myfile.xml: <? <!DOCTYPE myfile SYSTEM "myfile.dtd"> <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 3.建立HTML文檔myfile.html <HTML> <head> <script language=" var nodes = XMLDoc.documentElement.childNodes; title.innerText = nodes.item(0).text; author.innerText = nodes.item(1).text; </script> <title>在HTML中調用XML數(shù)據</title> </head> <body bgcolor="#FFFFFF"> <b>標題: </b> <span id="title"></span><br> <b>作者: </b> <span id="author"></span><br> </body> </HTML> 4.用IE5.0以上瀏覽器打開myfile.HTML就可以看到效果了。 XML輕松學習手冊(5)XML實例解析 第五章:XML實例解析 提綱: 一:實例效果 二:實例解析 1.定義新標識。 2.建立XML文檔。 3.建立相應的HTML文件。 XML在不同領域有著廣泛的應用,比如在科技領域的MathML,無線通信應用的WML,在網絡圖象方面的SVG等等,我們這里側重討論XML在web上的應用。XML在web上應用主要是利用其強大的數(shù)據操作能力。一般用XML配合JavaScript和ASP等服務器端程序,可以實現(xiàn)網絡上幾乎所有的應用需求。 考慮講解方便,我們在下面介紹一個簡單的實例,不包含服務器端程序。目的在于讓您對XML的數(shù)據操作能力有一個感性的認識。 好,我們首先[ 點擊這里 ]來看實例的效果。(請用IE5.0以上版本瀏覽器打開) 這是一個簡單的CD唱片數(shù)據檢索功能。你通過點擊"上一張","下一張"可以看到單張CD的有關信息。這樣的效果我們原來用兩種方法可以實現(xiàn): 1.利用DHTML,將數(shù)據隱藏在不同的層中,通過鼠標事件依次顯示; 2.利用后臺程序(如ASP,CGI,PHP,JSP等),調用服務器端的數(shù)據。 但是在這個實例中,我們打開頁面原代碼可以看到,其中沒有用DHTML的DIV,也沒有表單的action,它完全是用XML來實現(xiàn)的。下面我們來分析它的制作過程: 第一步:定義新標識。 根據實際的CD數(shù)據,首先新建一個名為<CD>的標識;其次建立它相關的數(shù)據標識,分別是:CD名稱<Title>,演唱者<Artist>,出版年代<Year>,國家<Country>,發(fā)行公司<Company>和價格<Price>;最后還要建立一個名為目錄<CATALOG>的標識。為什么要再建立一個<CATALOG>標識呢?因為在XML文檔中規(guī)定,必須且只能有一個根元素(標識),我們有多個CD數(shù)據,這些數(shù)據是并列的關系,所以需要為這些并列的元素建立一個根元素。 以上元素的定義和關系都完全符合XML標準,不需要特別的DTD文件來定義,所以可以省略DTD定義。如果我們想使用DTD來定義,以上過程可以表示為: <!ELEMENT CATALOG (CD)*> <!ELEMENT CD (Title,Artist,Year,Country,Company,Price)> <!ELEMENT Title (#PCDATA)> <!ELEMENT Artist (#PCDATA)> <!ELEMENT Year (#PCDATA)> <!ELEMENT Country (#PCDATA)> <!ELEMENT Company (#PCDATA)> <!ELEMENT Price (#PCDATA)> 這段代碼表示:元素CATALOG包含多個CD子元素,而子元素CD又依次包含Title, Artist, Year, Country, Company, Price 六個子元素,它們的內容都定義為文本(字符,數(shù)字,文本)。(注:具體的語法說明可以看上一章關于DTD的介紹) 第二步:建立XML文檔。 <? <CATALOG> <CD> <TITLE>Empire Burlesque</TITLE> <ARTIST>Bob Dylan</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>Columbia</COMPANY> <PRICE>10.90</PRICE> <YEAR>1985</YEAR> </CD> <CD> <TITLE>Hide your heart</TITLE> <ARTIST>Bonnie Tylor</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>CBS Records</COMPANY> <PRICE>9.90</PRICE> <YEAR>1988</YEAR> </CD> <CD> <TITLE>Greatest Hits</TITLE> <ARTIST>Dolly Parton</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>RCA</COMPANY> <PRICE>9.90</PRICE> <YEAR>1982</YEAR> </CD> <CD> <TITLE>Still got the blues</TITLE> <ARTIST>Gary More</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>Virgin redords</COMPANY> <PRICE>10.20</PRICE> <YEAR>1990</YEAR> </CD> <CD> <TITLE>Eros</TITLE> <ARTIST>Eros Ramazzotti</ARTIST> <COUNTRY>EU</COUNTRY> <COMPANY>BMG</COMPANY> <PRICE>9.90</PRICE> <YEAR>1997</YEAR> </CD> </CATALOG> 上面代碼首先用<? <CATALOG> <CD> ...... </CD> <CD> ...... </CD> </CATALOG> 一共定義了5組數(shù)據。我們將上面的代碼存為cd.XML文件,以備調用。 第三步:建立相應的HTML文件。 1.導入XML數(shù)據。 我們知道,目前流行的瀏覽器中,暫時只有微軟的IE5.0以上版本瀏覽器支持XML。IE是通過在 CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> 定義一個object,ID名為XMLdso。然后在head區(qū)用js引入xml數(shù)據: <script for="window" event="onload"> </script> 2.捆綁數(shù)據。 然后將用<SPAN>標識來將XML數(shù)據綁定在表格中。其中ID,DATASRC,DTATFLD都是<SPAN>的屬性。代碼如下: <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> 3.動作操作。 最后,為數(shù)據提供瀏覽按鈕: <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> 并利用js來完成兩個鼠標點擊功能:movenext()和moveprevious()。在head區(qū)加入如下代碼: <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> 好,我們先看HTML文件的全部原代碼: <HTML> <head> <script for="window" event="onload"> </script> <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> <TITLE>CD Navigate</TITLE> </head> <body> <p> <object WIDTH="0" HEIGHT="0" CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> <p> <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> </p> </body> </HTML> 將以上代碼存為cd.htm文件,于第二步的cd.XML文件放在一起。打開cd.htm文件,你就看見和上面實例一樣的效果了。 好,到今天為止,我們已經學習了關于XML的不少知識,我們來總結一下前面五個章節(jié),分別是XML快速入門,XML的概念原理,XML的術語,XML的語法和本章的實例解析。到這里,教程部分就結束了。在寫作過程中,阿捷盡最大努力將有關XML概念講得通俗易懂,盡量把自己的理解告訴給大家,但因為本人學習XML時間也不長,對整個XML的技術把握還不夠系統(tǒng)和深入,所以難免有疏漏的地方,請大家指正和諒解,謝謝! posted on 2009-02-15 15:45 YXY 閱讀(187) 評論(0) 編輯 收藏
<title>XML輕松學習手冊</title>
3.將它們放在同一個目錄下,用IE5以上版本瀏覽器打開,可以看到效果。 學習并掌握一種script,你將真正了解到XML無比的強大的功能。
XML和HTML都來自于SGML,它們都含有標記,有著相似的語法,HTML和XML的最大區(qū)別在于:HTML是一個定型的標記語言,它用固有的標記來描述,顯示網頁內容。比如< H1>表示首行標題,有固定的尺寸。相對的,XML則沒有固定的標記,XML不能描述網頁具體的外觀,內容,它只是描述內容的數(shù)據形式和結構。
這是一個質的區(qū)別:網頁將數(shù)據和顯示混在一起,而XML則將數(shù)據和顯示分開來。
我們看上面的例子,在myfile.htm中,我們只關心頁面的顯示方式,我們可以設計不同的界面,用不同的方式來排版頁面,但數(shù)據是儲存在myfile.XML中,不需要任何改變。
(如果你是程序員,你會驚訝的發(fā)現(xiàn),這與模塊化面向對象編程的思想極其相似!其實網頁何嘗不是一種程序呢?)
正是這種區(qū)別使得XML在網絡應用和信息共享上方便,高效,可擴展。所以我們相信,XML做為一種先進的數(shù)據處理方法,將使網絡跨越到一個新的境界。
吸取HTML松散格式帶來的經驗教訓, 我們先看HTML的一些語句,這些語句在HTML中隨處可見: 1. sample 2.< b>< i>sample< /b>< /i> 3.< td>sample< /TD> 4.< font color=red>samplar< /font> 在XML文檔中,上述幾種語句的語法都是錯誤的。因為: 1.所有的標記都必須要有一個相應的結束標記; 2.所有的XML標記都必須合理嵌套; 3.所有XML標記都區(qū)分大小寫; 4.所有標記的屬性必須用""括起來; 所以上列語句在XML中正確的寫法是 1. sample 2.< b>< i>sample< /i>< /b> 3.< td>sample< /td> 4.< font color="red">samplar< /font> 另外,XML標記必須遵循下面的命名規(guī)則: 1.名字中可以包含字母、數(shù)字以及其它字母; 2.名字不能以數(shù)字或"_" (下劃線) 開頭; 3.名字不能以字母 XML (或 XML 或 Xml ..) 開頭; 4.名字中不能包含空格。 在XML文檔中任何的差錯,都會得到同一個結果:網頁不能被顯示。各瀏覽器開發(fā)商已經達成協(xié)議,對XML實行嚴格而挑剔的解析,任何細小的錯誤都會被報告。你可以將上面的myfile.xml修改一下,比如將< email>改為< Email>,然后用IE5直接打開myfile.xml,會得到一個出錯信息頁面: <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> <Email>ajie@aolhoo.com</email> <date>20010115</date> </myfile> 七. 關于XML的更多 好了,到現(xiàn)在你已經知道: 1.什么是XML; 2.XML,HTML,SGML之間的關系和區(qū)別; 3.XML的簡單應用。 恭喜你!你已經不再對XML一無所知,并且已經走在了網絡技術的前沿。整個學習過程好象并不很難哦:) 如果你對XML有更多的興趣,希望進一步了解XML的詳細資料和其它的實際運用技術,歡迎繼續(xù)瀏覽我們的下一章:XML的概念。 XML輕松學習手冊(2)XML概念 第二章 XML概念 導言 經過第一章的快速入門學習,你已經知道了 一. 擴展性 二. 標識 三. 語言 四. 結構化 五. Meta數(shù)據 六. 顯示 七. DOM 一.擴展性---使用XML,你可以為你的文檔建立自己的標記(tags)。 在HTML里,有許多固定的標記,我們必須記住然后使用它們,你不能使用HTML規(guī)范里沒有的標記。而在XML中,你能建立任何你需要的標記。你可以充分發(fā)揮你的想象力,給你的文檔起一些好記的標記名稱。比如,你的文檔里包含一些游戲的攻略,你可以建立一個名為<game>的標記,然后在<game>下再根據游戲類別建立<RPG>,<SLG>等標記。只要清晰,易于理解你可以建立任何數(shù)量的標記。 一開始你也許會不適應,因為我們在學習HTML時,有固定的標記可以直接學習和使用;(很多人包括我自己都是邊分析別人的代碼和標識,邊建立自己的網頁),而XML卻沒有任何標記可以學,也很少有文檔的標記是一模一樣的。我們怎么辦?呵呵,沒有就自己創(chuàng)建呀。一旦你真正開始寫XML文檔,你會發(fā)現(xiàn)隨心所欲的創(chuàng)造新標記也是一份很有趣的事。你可以建立有自己特色的標記,甚至建立你自己的HTML語言。 擴展性使你有更多的選擇和強大的能力,但同時也產生一個問題就是你必須學會規(guī)劃。你自己要理解自己的文檔,知道它由哪幾部分組成,相互之間的關系和如何識別它們。 關于建立標識還需要說明一點,標識是描述數(shù)據的類型或特性,比如<width>,年齡<age>,姓名<name>等,而不是數(shù)據的內容,比如:<10pxl>,<18>,<張三>,這些都是無用的標記。如果你學過數(shù)據庫,你可以這樣理解,標識就是一種字段名。 二.標識---使用XML你可以識別文檔中的元素。 不論你是HTML,還是XML,標識的本質在于便于理解,如果沒有標識,你的文檔在計算機看來只是一個很長的字符串,每個字看起來都一樣,沒有重點之分。 通過標識,你的文檔才便于閱讀和理解,你可以劃分段落,列明標題。XML中,你更可以利用其擴展性 來為文檔建立更合適的標識。 不過,有一點要提醒大家注意:標識僅僅是用來識別信息,它本身并不傳達信息。例如這樣的HTML代碼: <b>frist step<b> 這里<b>表示粗體,只用來說明是用粗體來顯示"frist step"字符,<b>本身并不包含任何實際的信息,在頁面上你看不到<b>,真正傳達信息的是"frist step "。 三.語言---使用XML你要遵循特定的語法來標識你的文檔。 在計算機領域,語言常常表示一?quot;程序語言",用來編程實現(xiàn)一些功能和應用,但不是所有的"語言"都是用來編程的,XML就只是一種用來定義標識和描述信息的語言。 下面我們來深入了解一下XML應用的其本原理,可能會很枯燥,但是對于整體的理解很重要,你可以先快速過一遍,心里有一個模糊的概念,具體精髓則需要在實踐中慢慢領會。 四.結構化---XML促使文檔結構化,所有的信息按某種關系排列。 "結構化"聽起來太抽象了,我們這樣理解,結構化就是為你的文檔建立一個框架,就象寫文章先寫一個提綱。結構化使你的文檔看起來不會雜亂無章,每一部分都緊密聯(lián)系,形成一個整體。 結構化有兩個原則: 1.每一部分(每一個元素)都和其他元素有關聯(lián)。關聯(lián)的級數(shù)就形成了結構。 2.標識本身的含義與它描述的信息相分離。 我們來看一個簡單的例子幫助理解: <? <myfile> <title>XML輕松學習手冊</title> <chapter>XML快速入門 <para>什么是XML</para> <para>使用XML的好處</para> </chapter> <chapter>XML的概念 <para>擴展性</para> <para>標識</para> </chapter> </myfile> 這是本文的XML描述文檔,可以看到標識分三級關聯(lián),非常清晰: <myfile> <chapter> <para> ... </para> </chapter> </myfile> 上面這樣的文檔結構,我們又稱之為"文檔樹",主干是父元素,如<myfile>,分支和頁是子元素,如<chapter>和<para>。 五.Meta數(shù)據(Metadata)---專業(yè)的XML使用者會使用meta數(shù)據來工作。 在HTML中我們知道可以使用meta標識來定義網頁的關鍵字,簡介等,這些標識不會顯示在網頁中,但可以被搜索引擎搜索到,并影響搜索結果的排列順序。 XML對這一原理進行了深化和擴展,用XML,你可以描述你的信息在哪里,你可以通過meta來驗證信息,執(zhí)行搜索,強制顯示,或者處理其他的數(shù)據。 下面是一些XML metadata在實際應用中的用途: 1.可以驗證數(shù)字簽名,使在線商務的提交動作(submission)有效。 2.可以被方便的建立索引和進行更有效搜索。 3.可以在不同語言之間傳輸數(shù)據。 W3C組織正在研究一種名為RDF(Resource Description Framework)的metadata處理方法,可以自動交換信息,W3C宣稱,使用RDF配合數(shù)字簽名,將使網絡中存在"真實可信"的電子商務。 六.顯示 單獨用XML不能顯示頁面,我們使用格式化技術,比如CSS或者XSL,才能顯示XML標記創(chuàng)建的文檔。 我們在前面第一章講到XML是將數(shù)據和格式分離的。XML文檔本身不知道如何來顯示,必須有輔助文件來幫助實現(xiàn)。(XML取消了所有標識,包括font,color,p等風格樣式定義標識,因此XML全部是采用類似DHTML中CSS的方法來定義文檔風格樣式。),XML中用來設定顯示風格樣式的文件類型有: 1.XSL XSL全稱是Extensible Stylesheet Language(可擴展樣式語言), 是將來設計XML文檔顯示樣式的主要文件類型。它本身也是基于XML語言的。使用XSL,你可以靈活的設置文檔顯示樣式,文檔將自動適應任何瀏覽器和PDA(掌上電腦)。 XSL也可以將XML轉化為HTML,那樣,老的瀏覽器也可以瀏覽XML文檔了。 2.CSS CSS大家很熟悉了,全稱是Cascading Style Sheets(層疊樣式表),是目前用來在瀏覽器上顯示XML文檔的主要方法。 3.Behaviors Behaviors現(xiàn)在還沒有成為標準。它是微軟的IE瀏覽器特有的功能,用它可以對XML標識設定一些有趣動作。 七.DOM DOM全稱是document object model(文檔對象模型),DOM是用來干什么的呢?假設把你的文檔看成一個單獨的對象,DOM就是如何用HTML或者XML對這個對象進行操作和控制的標準。 面向對象的思想方法已經非常流行了,在編程語言(例如java,js)中,都運用面向對象的編程思想。在XML中,就是要將網頁也作為一個對象來操作和控制,我們可以建立自己的對象和模板。與對象進行交流,如何命令對象,就要用到API。API全稱Application Programming Interface,它是訪問和操作對象的規(guī)則。而DOM就是一種詳細描述HTML/XML文檔對象規(guī)則的API。它規(guī)定了HTML/XML文檔對象的命名協(xié)定,程序模型,溝通規(guī)則等。在XML文檔中,我們可以將每一個標識元素看作一個對象---它有自己的名稱和屬性。 XML創(chuàng)建了標識,而DOM的作用就是告訴script如何在瀏覽器窗口中操作和顯示這些標識 上面我們已經簡要的講述了一些XML的基本原理,我們來看看它們之間的關聯(lián)以及它們是如何工作的,先看這里一張圖: 此主題相關圖片如下: 1. 2.CSS儲存并控制元素的顯示樣式。例如:標題將被以18pt字體顯示 3.script腳本控制元素如何動作。例如:當一個title元素"out of stock",將被用紅色顯示。 4.DOM則為腳本和對象的交流提供一個公共平臺,并將結果顯示在瀏覽器窗口。 如果任何一個部分發(fā)生錯誤,都不會得到正確結果。 好了,看到這里,我們已經對XML是如何工作的有一個整體的大致的概念。通過這一章的學習,我們可能感覺到XML似乎更偏向數(shù)據處理,更方便程序員學習。實際情況也是這樣的,XML設計的目的就是用來方便的共享和交互數(shù)據的。下一章,我們將系統(tǒng)的了解關于XML的各種術語。歡迎您繼續(xù)瀏覽。 XML輕松學習手冊(3)XML的術語 第三章 XML的術語 提綱: 導言 一.XML文檔的有關術語 二.DTD的有關術語 導言 初學XML最令人頭疼的就是有一大堆新的術語概念要理解。由于XML本身也是一個嶄新的技術,正在不斷發(fā)展和變化,各組織和各大網絡公司(微軟,IBM,SUN等)都在不斷推出自己的見解和標準,因此新概念漫天飛就不足為奇了。而國內又缺乏權威的機構或組織來對這些術語正式定名,你所看見的有關XML的中文教材大部分是靠作者本身的理解翻譯過來的,有些是正確的,有些是錯誤的,更加妨礙了我們對這些概念的理解和學習。 你下面將要看到的關于XML術語的解釋,也是作者本身的理解和翻譯。阿捷是以W3C組織發(fā)布的XML1.0標準規(guī)范和相關的正式說明文檔為根據來講述。可以確保這些理解是基本正確的,至少不是錯誤的。你如果想進一步閱讀和了解,我在本文的最后部分列明了相關資源的出處和鏈接,你可以直接訪問。好,我們轉入正題: 一.XML文檔的有關術語 什么是XML文檔?知道 <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> </myfile> XML文檔包含三個部分: 1. 一個XML文檔聲明; 2. 一個關于文檔類型的定義; 3. 用XML標識創(chuàng)建的內容。 舉例說明: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> <filelist> <myfile> <title>QUICK START OF XML</title> <author>ajie</author> </myfile> ...... </filelist> 其中第一行<? 我們來了解XML文檔中有關的術語: 1.Element(元素): 元素在HTML我們已經有所了解,它是組成HTML文檔的最小單位,在XML中也一樣。一個元素由一個標識來定義,包括開始和結束標識以及其中的內容,就象這樣:<author>ajie</author> 唯一不同的就是:在HTML中,標識是固定的,而在XML中,標識需要你自己創(chuàng)建。 2.Tag(標識) 標識是用來定義元素的。在XML中,標識必須成對出現(xiàn),將數(shù)據包圍在中間。標識的名稱和元素的名稱是一樣的。例如這樣一個元素: <author>ajie</author> 其中<author>就是標識。 3.Attribute(屬性): 什么是屬性?看這段word</font>。其中color就是font的屬性之一。 屬性是對標識進一步的描述和說明,一個標識可以有多個屬性,例如font的屬性還有size。XML中的屬性與HTML中的屬性是一樣的,每個屬性都有它自己的名字和數(shù)值,屬性是標識的一部分。舉例: <author sex="female">ajie</author> XML中屬性也是自己定義的,我們建議你盡量不使用屬性,而將屬性改成子元素,例如上面的代碼可以改成這樣: <author>ajie <sex>female</sex> </author> 原因是屬性不易擴充和被程序操作。 4.Declaration(聲明) 在所有XML文檔的第一行都有一個XML聲明。這個聲明表示這個文檔是一個XML文檔,它遵循的是哪個XML版本的規(guī)范。一個XML的聲明語句就象這樣: <? 5.DTD(文件類型定義) DTD是用來定義XML文檔中元素,屬性以及元素之間關系的。 通過DTD文件可以檢測XML文檔的結構是否正確。但建立XML文檔并不一定需要DTD文件。關于DTD文件的詳細說明我們將在下面單獨列項。 6.Well-formed XML(良好格式的XML) 一個遵守 良好格式的文檔必須以一個XML聲明開始,例如: <? 其中你必須說明文檔遵守的 良好格式的XML文檔必須有一個根元素,就是緊接著聲明后面建立的第一個元素,其它元素都是這個根元素的子元素,屬于根元素一組。 良好格式的XML文檔的內容書寫時必須遵守XML語法。(有關XML語法我們將在下一章仔細講解) 7.Valid XML(有效的XML) 一個遵守 將XML文檔和它的DTD文件進行比較分析,看是否符合DTD規(guī)則的過程叫validation(確認)。這樣的過程通常我們是通過一個名為parser的軟件來處理的。 有效的XML文檔也必須以一個XML聲明開始,例如: <? 和上面例子不同的,在standalone(獨立)屬性中,這里設置的是"no",因為它必須和相應的DTD一起使用,DTD文件的定義方法如下: <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 二.DTD的有關術語 什么是DTD,我們上面已經簡略提到。DTD是一種保證XML文檔格式正確的有效方法,可以比較XML文檔和DTD文件來看文檔是否符合規(guī)范,元素和標簽使用是否正確。一個DTD文檔包含:元素的定義規(guī)則,元素間關系的定義規(guī)則,元素可使用的屬性,可使用的實體或符號規(guī)則。 DTD文件也是一個ASCII的文本文件,后綴名為.dtd。例如:myfile.dtd。 為什么要用DTD文件呢?我的理解是它滿足了網絡共享和數(shù)據交互,使用DTD最大的好處在于DTD文件的共享。(就是上文DTD說明語句中的PUBLIC屬性)。比如,兩個相同行業(yè)不同地區(qū)的人使用同一個DTD文件來作為文檔創(chuàng)建規(guī)范,那么他們的數(shù)據就很容易交換和共享。網上有其他人想補充數(shù)據,也只需要根據公用的DTD規(guī)范來建立文檔,就立刻可以加入。 目前,已經有數(shù)量眾多的寫好的DTD文件可以利用。針對不同的行業(yè)和應用,這些DTD文件已經建立了通用的元素和標簽規(guī)則。你不需要自己重新創(chuàng)建,只要在他們的基礎上加入你需要的新標識。 當然,如果愿意,你可以創(chuàng)建自己的DTD,它可能和你的文檔配合的更加完美。建立自己的DTD也是很簡單的一件事,一般只需要定義4-5個元素就可以了。 調用DTD文件的方法有兩種: 1.直接包含在XML文檔內的DTD 你只要在DOCTYPE聲明中插入一些特別的說明就可以了,象這樣: 我們有一個XML文檔: <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 我們在第一行后面插入下面代碼就可以: <!DOCTYPE myfile [ <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> <!ENTITY copyright "Copyright 2001, Ajie."> ]> 2.調用獨立的DTD文件 將DTD文檔存為.dtd的文件,然后在DOCTYPE聲明行中調用,例如,將下面的代碼存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 然后在XML文檔中調用,在第一行后插入: <!DOCTYPE myfile SYSTEM "myfile.dtd"> 我們可以看到DTD文檔和HTML中js的調用是差不多的,關于DTD文檔具體如何寫,我們將在下一章和XML文檔的語法一起介紹。 下面我們來了解DTD有關的術語: 1.Schema(規(guī)劃) schema是數(shù)據規(guī)則的描述。schema做兩件事: a.它定義元素數(shù)據類型和元素之間的關系; b.它定義元素所能包含的內容類型。 DTD就是關于XML文檔的一個schema。 2.Document Tree(文檔樹) "文檔樹"在前面第二章我們已經提到過,它是文檔元素分級結構的形象表示。一個文檔結構樹包含根元素,根元素是最頂級的元素,(就是緊接著XML聲明語句后的第一個元素)。看例子: <? <filelist> <myfile> <title>...</title> <author>...</author> </myfile> </filelist> 上面的例子分三級結構排列成"樹"狀,其中的<filelist>就是根元素。在XML和DTD文件中,第一個定義的都是根元素。 3.Parent Element(父元素)/Child Element(子元素) 父元素是指包含有其它元素的元素,被包含的元素稱為它的子元素??瓷厦娴?結構樹",其中<myfile>是父元素,<title>,<author>是它的子元素,而<myfile>又是<filelist>的子元素。象<title>這樣沒有包含任何子元素的最后一級元素我們也稱之為"頁元素"。 4.Parser(解析軟件) Parser是一種檢查XML文檔是否遵循DTD規(guī)范的工具軟件。 Parser能獨立使用,也可以成為編輯軟件或瀏覽器的一部分。在后面的相關資源列表里,我列出了當前比較流行的一些parsers。 好了,通過第三章的學習,我們已經了解了一些XML和DTD的基本術語,但是我們還不知道怎樣來寫這些文件,需要遵循什么樣的語法,在下一章,將重點介紹有關撰寫XML和DTD文檔的語法。請繼續(xù)瀏覽,謝謝! XML輕松學習手冊(4)XML語法 第四章 XML語法 提綱: 一.XML語法規(guī)則 二.元素的語法 三.注釋的語法 四.CDATA的語法 五.Namespaces的語法 六.entity的語法 七.DTD的語法 通過前面三章的學習,我們已經對什么是XML,它的實現(xiàn)原理以及相關的術語有所了解。接下來我們就開始學習XML的語法規(guī)范,動手寫自己的XML文檔。 一.XML語法規(guī)則 XML的文檔和HTML的原代碼類似,也是用標識來標識內容。創(chuàng)建XML文檔必須遵守下列重要規(guī)則: 規(guī)則1:必須有XML聲明語句 這一點我們在上一章學習時已經提到過。聲明是XML文檔的第一句,其格式如下: <? 聲明的作用是告訴瀏覽器或者其它處理程序:這個文檔是XML文檔。聲明語句中的version表示文檔遵守的XML規(guī)范的版本;standalone表示文檔是否附帶DTD文件,如果有,參數(shù)為no;encoding表示文檔所用的語言編碼,默認是UTF-8。 規(guī)則2:是否有DTD文件 如果文檔是一個"有效的 <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 規(guī)則3:注意你的大小寫 在XML文檔中,大小寫是有區(qū)別的。<P>和<p>是不同的標識。注意在寫元素時,前后標識大小寫要保持一樣。例如:<Author>ajie</Author>,寫成<Author>ajie</author>是錯誤的。 你最好養(yǎng)成一種習慣,或者全部大寫,或者全部小寫,或者大寫第一個字母。這樣可以減少因為大小寫不匹配產生的文檔錯誤。 規(guī)則4:給屬性值加引號 在HTML代碼里面,屬性值可以加引號,也可以不加。例如:<font color=red> 但是在XML中則規(guī)定,所有屬性值必須加引號(可以是單引號,也可以是雙引號),否則將被視為錯誤。 規(guī)則5:所有的標識必須有相應的結束標識 在HTML中,標識可能不是成對出現(xiàn)的,比?lt;br>。而在XML中規(guī)定,所有標識必須成對出現(xiàn),有一個開始標識,就必須有一個結束標識。否則將被視為錯誤。 規(guī)則6:所有的空標識也必須被關閉 空標識就是標識對之間沒有內容的標識。比如 ,<img>等標識。在XML中,規(guī)定所有的標識必須有結束標識,針對這樣的空標識,XML中處理的方法是在原標識最后加/,就可以了。例如: 應寫為<br />; <META name="keyXML, SGML, <IMG src= "cool.gif">應寫為<IMG src= "cool.gif" /> 第四章 XML語法 二.元素的語法 元素由一對標識以及其中的內容組成。就象這樣:ajie。元素的名稱和標識的名稱是一樣的。標識可以用屬性來進一步描述。 在XML中,沒有任何保留字,所以你可以隨心所欲的用任何詞語來作為元素名稱。但是也必須遵守下列規(guī)范: 1.名稱中可以包含字母、數(shù)字以及其它字母; 2.名稱不能以數(shù)字或"_" (下劃線)開頭; 3.名稱不能以字母 XML(或 XML 或 Xml ..)開頭 4.名稱中不能包含空格 5.名稱中間不能包含":"(冒號) 為了使元素更容易閱讀理解和操作,我們還有一些建議: 1.名稱中不要使用"."。因為在很多程序語言中,"."是作為對象的屬性,例如:font.color。同樣的原因"-"也最好不要用,必須使用的,以"_"代替; 2.名稱盡量簡短。 3.名稱的大小寫盡量采用同一標準。 4.名稱可以使用非英文字符,比如用中文。但是有些軟件可能不支持。(IE5目前是支持中文元素的。) 另外,補充一點關于屬性的說明。在word</font>將把word顯示為紅色。而在CSS或者XSL,我們在下面詳細講述。) 三.注釋的語法 注釋是為了便于閱讀和理解,在XML文檔添加的附加信息,將不會被程序解釋或則瀏覽器顯示。 注釋的語法如下: <!-- 這里是注釋信息 --> 可以看到,它和HTML中的注釋語法是一樣的,非常容易。養(yǎng)成良好的注釋習慣將使你的文檔更加便于維護,共享,看起來也更專業(yè)。 四.CDATA的語法 CDATA全稱character data,翻譯為字符數(shù)據。我們在寫 <![CDATA[這里放置需要顯示的字符]]> 例如: <![CDATA[<AUTHOR sex="female">ajie</AUTHOR>]]> 在頁面上顯示的內容將是"<AUTHOR sex="female">ajie</AUTHOR>" 第四章 XML語法 五.Namespaces的語法 Namespaces翻譯為名字空間。名字空間有什么作用呢?當我們在一個XML文檔中使用他人的或者多個DTD文件,就會出現(xiàn)這樣的矛盾:因為XML中標識都是自己創(chuàng)建的,在不同的DTD文件中,標識名可能相同但表示的含義不同,這就可能引起數(shù)據混亂。 比如在一個文檔<table>wood table</table>中<table>表示桌子, 而在另一個文檔<table>namelist</table>中<table>表示表格。如果我需要同時處理這兩個文檔,就會發(fā)生名字沖突。 了解決這個問題,我們引進了namespaces這個概念。namespaces通過給標識名稱加一個網址(URL)定位的方法來區(qū)別這些名稱相同的標識。 Namespaces同樣需要在XML文檔的開頭部分聲明,聲明的語法如下: <document 其中yourname是由你定義的namespaces的名稱,URL就是名字空間的網址。 假設上面的"桌子<table>"文檔來自http://www.zhuozi.com,我們就可以聲明為 <document http://www.zhuozi.com'> 然后在后面的標識中使用定義好的名字空間: <zhuozi:table>wood table</table> 這樣就將這兩個<table>區(qū)分開來。注意的是:設置URL并不是說這個標識真的要到那個網址去讀取,僅僅作為一種區(qū)別的標志而已。 六.entity的語法 entity翻譯為"實體"。它的作用類似 entity可以包含字符,文字等等,使用entity的好處在于:1.它可以減少差錯,文檔中多個相同的部分只需要輸入一遍就可以了。2.它提高維護效率。比如你有40個文檔都包含copyright的entity,如果需要修改這個copyright,不需要所有的文件都修改,只要改最初定義的entity語句就可以了。 XML定義了兩種類型的entity。一種是我們這里說的普通entity,在XML文檔中使用;另一種是參數(shù)entity,在DTD文件中使用。 entity的定義語法為: <!DOCTYPE filename [ <!ENTITY entity-name "entity-content" ] > 例如我要定義一段版權信息: <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved" ] > 如果我的版權信息內容和他人共享一個XML文件,也可以使用外部調用的方法,語法象這樣: <!DOCTYPE copyright [ <!ENTITY copyright SYSTEM "http://www.sample.com/copyright. ] > 定義好的entity在文檔中的引用語法為:&entity-name; 例如,上面定義的版權信息,調用時寫作?copyright; 完整的例子如下,你可以copy下來存為copyright.XML觀看實例: <? <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved"> ]> <myfile> <title>XML</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> ©right; </myfile> 第四章 XML語法 七.DTD的語法 DTD是"有效 1.設置元素 元素是XML文檔的基本組成部分。你要在DTD中定義一個元素,然后在XML文檔中使用。元素的定義語法為:<!ELEMENT DESCRIPTION (#PCDATA, DEFINITION)*> 說明: "<!ELEMENT" 是元素的聲明,說明你要定義的是一個元素; 聲明后面的"DESCRIPTION",是元素的名稱; "(#PCDATA, DEFINITION)*>"則是該元素的使用規(guī)則。規(guī)則定義了元素可以包含的內容以及相互的關系。下面的表格概要列出了元素的規(guī)則: 2.元素規(guī)則表: 此主題相關圖片如下: 另外,我們還可以為元素定義屬性,因為我們不推薦使用屬性,在這里就不詳細展開了。 最后,我們來總結一些前四章學習的內容,寫一個包含DTD,XML,以及Script的簡單實例,便于讀者理解: 1.將下面文件存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 2.然后建立XML文檔myfile.xml: <? <!DOCTYPE myfile SYSTEM "myfile.dtd"> <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 3.建立HTML文檔myfile.html <HTML> <head> <script language=" var nodes = XMLDoc.documentElement.childNodes; title.innerText = nodes.item(0).text; author.innerText = nodes.item(1).text; </script> <title>在HTML中調用XML數(shù)據</title> </head> <body bgcolor="#FFFFFF"> <b>標題: </b> <span id="title"></span><br> <b>作者: </b> <span id="author"></span><br> </body> </HTML> 4.用IE5.0以上瀏覽器打開myfile.HTML就可以看到效果了。 XML輕松學習手冊(5)XML實例解析 第五章:XML實例解析 提綱: 一:實例效果 二:實例解析 1.定義新標識。 2.建立XML文檔。 3.建立相應的HTML文件。 XML在不同領域有著廣泛的應用,比如在科技領域的MathML,無線通信應用的WML,在網絡圖象方面的SVG等等,我們這里側重討論XML在web上的應用。XML在web上應用主要是利用其強大的數(shù)據操作能力。一般用XML配合JavaScript和ASP等服務器端程序,可以實現(xiàn)網絡上幾乎所有的應用需求。 考慮講解方便,我們在下面介紹一個簡單的實例,不包含服務器端程序。目的在于讓您對XML的數(shù)據操作能力有一個感性的認識。 好,我們首先[ 點擊這里 ]來看實例的效果。(請用IE5.0以上版本瀏覽器打開) 這是一個簡單的CD唱片數(shù)據檢索功能。你通過點擊"上一張","下一張"可以看到單張CD的有關信息。這樣的效果我們原來用兩種方法可以實現(xiàn): 1.利用DHTML,將數(shù)據隱藏在不同的層中,通過鼠標事件依次顯示; 2.利用后臺程序(如ASP,CGI,PHP,JSP等),調用服務器端的數(shù)據。 但是在這個實例中,我們打開頁面原代碼可以看到,其中沒有用DHTML的DIV,也沒有表單的action,它完全是用XML來實現(xiàn)的。下面我們來分析它的制作過程: 第一步:定義新標識。 根據實際的CD數(shù)據,首先新建一個名為<CD>的標識;其次建立它相關的數(shù)據標識,分別是:CD名稱<Title>,演唱者<Artist>,出版年代<Year>,國家<Country>,發(fā)行公司<Company>和價格<Price>;最后還要建立一個名為目錄<CATALOG>的標識。為什么要再建立一個<CATALOG>標識呢?因為在XML文檔中規(guī)定,必須且只能有一個根元素(標識),我們有多個CD數(shù)據,這些數(shù)據是并列的關系,所以需要為這些并列的元素建立一個根元素。 以上元素的定義和關系都完全符合XML標準,不需要特別的DTD文件來定義,所以可以省略DTD定義。如果我們想使用DTD來定義,以上過程可以表示為: <!ELEMENT CATALOG (CD)*> <!ELEMENT CD (Title,Artist,Year,Country,Company,Price)> <!ELEMENT Title (#PCDATA)> <!ELEMENT Artist (#PCDATA)> <!ELEMENT Year (#PCDATA)> <!ELEMENT Country (#PCDATA)> <!ELEMENT Company (#PCDATA)> <!ELEMENT Price (#PCDATA)> 這段代碼表示:元素CATALOG包含多個CD子元素,而子元素CD又依次包含Title, Artist, Year, Country, Company, Price 六個子元素,它們的內容都定義為文本(字符,數(shù)字,文本)。(注:具體的語法說明可以看上一章關于DTD的介紹) 第二步:建立XML文檔。 <? <CATALOG> <CD> <TITLE>Empire Burlesque</TITLE> <ARTIST>Bob Dylan</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>Columbia</COMPANY> <PRICE>10.90</PRICE> <YEAR>1985</YEAR> </CD> <CD> <TITLE>Hide your heart</TITLE> <ARTIST>Bonnie Tylor</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>CBS Records</COMPANY> <PRICE>9.90</PRICE> <YEAR>1988</YEAR> </CD> <CD> <TITLE>Greatest Hits</TITLE> <ARTIST>Dolly Parton</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>RCA</COMPANY> <PRICE>9.90</PRICE> <YEAR>1982</YEAR> </CD> <CD> <TITLE>Still got the blues</TITLE> <ARTIST>Gary More</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>Virgin redords</COMPANY> <PRICE>10.20</PRICE> <YEAR>1990</YEAR> </CD> <CD> <TITLE>Eros</TITLE> <ARTIST>Eros Ramazzotti</ARTIST> <COUNTRY>EU</COUNTRY> <COMPANY>BMG</COMPANY> <PRICE>9.90</PRICE> <YEAR>1997</YEAR> </CD> </CATALOG> 上面代碼首先用<? <CATALOG> <CD> ...... </CD> <CD> ...... </CD> </CATALOG> 一共定義了5組數(shù)據。我們將上面的代碼存為cd.XML文件,以備調用。 第三步:建立相應的HTML文件。 1.導入XML數(shù)據。 我們知道,目前流行的瀏覽器中,暫時只有微軟的IE5.0以上版本瀏覽器支持XML。IE是通過在 CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> 定義一個object,ID名為XMLdso。然后在head區(qū)用js引入xml數(shù)據: <script for="window" event="onload"> </script> 2.捆綁數(shù)據。 然后將用<SPAN>標識來將XML數(shù)據綁定在表格中。其中ID,DATASRC,DTATFLD都是<SPAN>的屬性。代碼如下: <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> 3.動作操作。 最后,為數(shù)據提供瀏覽按鈕: <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> 并利用js來完成兩個鼠標點擊功能:movenext()和moveprevious()。在head區(qū)加入如下代碼: <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> 好,我們先看HTML文件的全部原代碼: <HTML> <head> <script for="window" event="onload"> </script> <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> <TITLE>CD Navigate</TITLE> </head> <body> <p> <object WIDTH="0" HEIGHT="0" CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> <p> <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> </p> </body> </HTML> 將以上代碼存為cd.htm文件,于第二步的cd.XML文件放在一起。打開cd.htm文件,你就看見和上面實例一樣的效果了。 好,到今天為止,我們已經學習了關于XML的不少知識,我們來總結一下前面五個章節(jié),分別是XML快速入門,XML的概念原理,XML的術語,XML的語法和本章的實例解析。到這里,教程部分就結束了。在寫作過程中,阿捷盡最大努力將有關XML概念講得通俗易懂,盡量把自己的理解告訴給大家,但因為本人學習XML時間也不長,對整個XML的技術把握還不夠系統(tǒng)和深入,所以難免有疏漏的地方,請大家指正和諒解,謝謝! posted on 2009-02-15 15:45 YXY 閱讀(187) 評論(0) 編輯 收藏
我們先看HTML的一些語句,這些語句在HTML中隨處可見:
1.
sample
2.< b>< i>sample< /b>< /i>
3.< td>sample< /TD>
4.< font color=red>samplar< /font>
在XML文檔中,上述幾種語句的語法都是錯誤的。因為:
1.所有的標記都必須要有一個相應的結束標記;
2.所有的XML標記都必須合理嵌套;
3.所有XML標記都區(qū)分大小寫;
4.所有標記的屬性必須用""括起來;
所以上列語句在XML中正確的寫法是
1. sample
2.< b>< i>sample< /i>< /b> 3.< td>sample< /td> 4.< font color="red">samplar< /font>
另外,XML標記必須遵循下面的命名規(guī)則:
1.名字中可以包含字母、數(shù)字以及其它字母;
2.名字不能以數(shù)字或"_" (下劃線) 開頭;
3.名字不能以字母 XML (或 XML 或 Xml ..) 開頭;
4.名字中不能包含空格。
在XML文檔中任何的差錯,都會得到同一個結果:網頁不能被顯示。各瀏覽器開發(fā)商已經達成協(xié)議,對XML實行嚴格而挑剔的解析,任何細小的錯誤都會被報告。你可以將上面的myfile.xml修改一下,比如將< email>改為< Email>,然后用IE5直接打開myfile.xml,會得到一個出錯信息頁面:
<? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> <Email>ajie@aolhoo.com</email> <date>20010115</date> </myfile> 七. 關于XML的更多 好了,到現(xiàn)在你已經知道: 1.什么是XML; 2.XML,HTML,SGML之間的關系和區(qū)別; 3.XML的簡單應用。 恭喜你!你已經不再對XML一無所知,并且已經走在了網絡技術的前沿。整個學習過程好象并不很難哦:) 如果你對XML有更多的興趣,希望進一步了解XML的詳細資料和其它的實際運用技術,歡迎繼續(xù)瀏覽我們的下一章:XML的概念。 XML輕松學習手冊(2)XML概念 第二章 XML概念 導言 經過第一章的快速入門學習,你已經知道了 一. 擴展性 二. 標識 三. 語言 四. 結構化 五. Meta數(shù)據 六. 顯示 七. DOM 一.擴展性---使用XML,你可以為你的文檔建立自己的標記(tags)。 在HTML里,有許多固定的標記,我們必須記住然后使用它們,你不能使用HTML規(guī)范里沒有的標記。而在XML中,你能建立任何你需要的標記。你可以充分發(fā)揮你的想象力,給你的文檔起一些好記的標記名稱。比如,你的文檔里包含一些游戲的攻略,你可以建立一個名為<game>的標記,然后在<game>下再根據游戲類別建立<RPG>,<SLG>等標記。只要清晰,易于理解你可以建立任何數(shù)量的標記。 一開始你也許會不適應,因為我們在學習HTML時,有固定的標記可以直接學習和使用;(很多人包括我自己都是邊分析別人的代碼和標識,邊建立自己的網頁),而XML卻沒有任何標記可以學,也很少有文檔的標記是一模一樣的。我們怎么辦?呵呵,沒有就自己創(chuàng)建呀。一旦你真正開始寫XML文檔,你會發(fā)現(xiàn)隨心所欲的創(chuàng)造新標記也是一份很有趣的事。你可以建立有自己特色的標記,甚至建立你自己的HTML語言。 擴展性使你有更多的選擇和強大的能力,但同時也產生一個問題就是你必須學會規(guī)劃。你自己要理解自己的文檔,知道它由哪幾部分組成,相互之間的關系和如何識別它們。 關于建立標識還需要說明一點,標識是描述數(shù)據的類型或特性,比如<width>,年齡<age>,姓名<name>等,而不是數(shù)據的內容,比如:<10pxl>,<18>,<張三>,這些都是無用的標記。如果你學過數(shù)據庫,你可以這樣理解,標識就是一種字段名。 二.標識---使用XML你可以識別文檔中的元素。 不論你是HTML,還是XML,標識的本質在于便于理解,如果沒有標識,你的文檔在計算機看來只是一個很長的字符串,每個字看起來都一樣,沒有重點之分。 通過標識,你的文檔才便于閱讀和理解,你可以劃分段落,列明標題。XML中,你更可以利用其擴展性 來為文檔建立更合適的標識。 不過,有一點要提醒大家注意:標識僅僅是用來識別信息,它本身并不傳達信息。例如這樣的HTML代碼: <b>frist step<b> 這里<b>表示粗體,只用來說明是用粗體來顯示"frist step"字符,<b>本身并不包含任何實際的信息,在頁面上你看不到<b>,真正傳達信息的是"frist step "。 三.語言---使用XML你要遵循特定的語法來標識你的文檔。 在計算機領域,語言常常表示一?quot;程序語言",用來編程實現(xiàn)一些功能和應用,但不是所有的"語言"都是用來編程的,XML就只是一種用來定義標識和描述信息的語言。 下面我們來深入了解一下XML應用的其本原理,可能會很枯燥,但是對于整體的理解很重要,你可以先快速過一遍,心里有一個模糊的概念,具體精髓則需要在實踐中慢慢領會。 四.結構化---XML促使文檔結構化,所有的信息按某種關系排列。 "結構化"聽起來太抽象了,我們這樣理解,結構化就是為你的文檔建立一個框架,就象寫文章先寫一個提綱。結構化使你的文檔看起來不會雜亂無章,每一部分都緊密聯(lián)系,形成一個整體。 結構化有兩個原則: 1.每一部分(每一個元素)都和其他元素有關聯(lián)。關聯(lián)的級數(shù)就形成了結構。 2.標識本身的含義與它描述的信息相分離。 我們來看一個簡單的例子幫助理解: <? <myfile> <title>XML輕松學習手冊</title> <chapter>XML快速入門 <para>什么是XML</para> <para>使用XML的好處</para> </chapter> <chapter>XML的概念 <para>擴展性</para> <para>標識</para> </chapter> </myfile> 這是本文的XML描述文檔,可以看到標識分三級關聯(lián),非常清晰: <myfile> <chapter> <para> ... </para> </chapter> </myfile> 上面這樣的文檔結構,我們又稱之為"文檔樹",主干是父元素,如<myfile>,分支和頁是子元素,如<chapter>和<para>。 五.Meta數(shù)據(Metadata)---專業(yè)的XML使用者會使用meta數(shù)據來工作。 在HTML中我們知道可以使用meta標識來定義網頁的關鍵字,簡介等,這些標識不會顯示在網頁中,但可以被搜索引擎搜索到,并影響搜索結果的排列順序。 XML對這一原理進行了深化和擴展,用XML,你可以描述你的信息在哪里,你可以通過meta來驗證信息,執(zhí)行搜索,強制顯示,或者處理其他的數(shù)據。 下面是一些XML metadata在實際應用中的用途: 1.可以驗證數(shù)字簽名,使在線商務的提交動作(submission)有效。 2.可以被方便的建立索引和進行更有效搜索。 3.可以在不同語言之間傳輸數(shù)據。 W3C組織正在研究一種名為RDF(Resource Description Framework)的metadata處理方法,可以自動交換信息,W3C宣稱,使用RDF配合數(shù)字簽名,將使網絡中存在"真實可信"的電子商務。 六.顯示 單獨用XML不能顯示頁面,我們使用格式化技術,比如CSS或者XSL,才能顯示XML標記創(chuàng)建的文檔。 我們在前面第一章講到XML是將數(shù)據和格式分離的。XML文檔本身不知道如何來顯示,必須有輔助文件來幫助實現(xiàn)。(XML取消了所有標識,包括font,color,p等風格樣式定義標識,因此XML全部是采用類似DHTML中CSS的方法來定義文檔風格樣式。),XML中用來設定顯示風格樣式的文件類型有: 1.XSL XSL全稱是Extensible Stylesheet Language(可擴展樣式語言), 是將來設計XML文檔顯示樣式的主要文件類型。它本身也是基于XML語言的。使用XSL,你可以靈活的設置文檔顯示樣式,文檔將自動適應任何瀏覽器和PDA(掌上電腦)。 XSL也可以將XML轉化為HTML,那樣,老的瀏覽器也可以瀏覽XML文檔了。 2.CSS CSS大家很熟悉了,全稱是Cascading Style Sheets(層疊樣式表),是目前用來在瀏覽器上顯示XML文檔的主要方法。 3.Behaviors Behaviors現(xiàn)在還沒有成為標準。它是微軟的IE瀏覽器特有的功能,用它可以對XML標識設定一些有趣動作。 七.DOM DOM全稱是document object model(文檔對象模型),DOM是用來干什么的呢?假設把你的文檔看成一個單獨的對象,DOM就是如何用HTML或者XML對這個對象進行操作和控制的標準。 面向對象的思想方法已經非常流行了,在編程語言(例如java,js)中,都運用面向對象的編程思想。在XML中,就是要將網頁也作為一個對象來操作和控制,我們可以建立自己的對象和模板。與對象進行交流,如何命令對象,就要用到API。API全稱Application Programming Interface,它是訪問和操作對象的規(guī)則。而DOM就是一種詳細描述HTML/XML文檔對象規(guī)則的API。它規(guī)定了HTML/XML文檔對象的命名協(xié)定,程序模型,溝通規(guī)則等。在XML文檔中,我們可以將每一個標識元素看作一個對象---它有自己的名稱和屬性。 XML創(chuàng)建了標識,而DOM的作用就是告訴script如何在瀏覽器窗口中操作和顯示這些標識 上面我們已經簡要的講述了一些XML的基本原理,我們來看看它們之間的關聯(lián)以及它們是如何工作的,先看這里一張圖: 此主題相關圖片如下: 1. 2.CSS儲存并控制元素的顯示樣式。例如:標題將被以18pt字體顯示 3.script腳本控制元素如何動作。例如:當一個title元素"out of stock",將被用紅色顯示。 4.DOM則為腳本和對象的交流提供一個公共平臺,并將結果顯示在瀏覽器窗口。 如果任何一個部分發(fā)生錯誤,都不會得到正確結果。 好了,看到這里,我們已經對XML是如何工作的有一個整體的大致的概念。通過這一章的學習,我們可能感覺到XML似乎更偏向數(shù)據處理,更方便程序員學習。實際情況也是這樣的,XML設計的目的就是用來方便的共享和交互數(shù)據的。下一章,我們將系統(tǒng)的了解關于XML的各種術語。歡迎您繼續(xù)瀏覽。 XML輕松學習手冊(3)XML的術語 第三章 XML的術語 提綱: 導言 一.XML文檔的有關術語 二.DTD的有關術語 導言 初學XML最令人頭疼的就是有一大堆新的術語概念要理解。由于XML本身也是一個嶄新的技術,正在不斷發(fā)展和變化,各組織和各大網絡公司(微軟,IBM,SUN等)都在不斷推出自己的見解和標準,因此新概念漫天飛就不足為奇了。而國內又缺乏權威的機構或組織來對這些術語正式定名,你所看見的有關XML的中文教材大部分是靠作者本身的理解翻譯過來的,有些是正確的,有些是錯誤的,更加妨礙了我們對這些概念的理解和學習。 你下面將要看到的關于XML術語的解釋,也是作者本身的理解和翻譯。阿捷是以W3C組織發(fā)布的XML1.0標準規(guī)范和相關的正式說明文檔為根據來講述。可以確保這些理解是基本正確的,至少不是錯誤的。你如果想進一步閱讀和了解,我在本文的最后部分列明了相關資源的出處和鏈接,你可以直接訪問。好,我們轉入正題: 一.XML文檔的有關術語 什么是XML文檔?知道 <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> </myfile> XML文檔包含三個部分: 1. 一個XML文檔聲明; 2. 一個關于文檔類型的定義; 3. 用XML標識創(chuàng)建的內容。 舉例說明: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> <filelist> <myfile> <title>QUICK START OF XML</title> <author>ajie</author> </myfile> ...... </filelist> 其中第一行<? 我們來了解XML文檔中有關的術語: 1.Element(元素): 元素在HTML我們已經有所了解,它是組成HTML文檔的最小單位,在XML中也一樣。一個元素由一個標識來定義,包括開始和結束標識以及其中的內容,就象這樣:<author>ajie</author> 唯一不同的就是:在HTML中,標識是固定的,而在XML中,標識需要你自己創(chuàng)建。 2.Tag(標識) 標識是用來定義元素的。在XML中,標識必須成對出現(xiàn),將數(shù)據包圍在中間。標識的名稱和元素的名稱是一樣的。例如這樣一個元素: <author>ajie</author> 其中<author>就是標識。 3.Attribute(屬性): 什么是屬性?看這段word</font>。其中color就是font的屬性之一。 屬性是對標識進一步的描述和說明,一個標識可以有多個屬性,例如font的屬性還有size。XML中的屬性與HTML中的屬性是一樣的,每個屬性都有它自己的名字和數(shù)值,屬性是標識的一部分。舉例: <author sex="female">ajie</author> XML中屬性也是自己定義的,我們建議你盡量不使用屬性,而將屬性改成子元素,例如上面的代碼可以改成這樣: <author>ajie <sex>female</sex> </author> 原因是屬性不易擴充和被程序操作。 4.Declaration(聲明) 在所有XML文檔的第一行都有一個XML聲明。這個聲明表示這個文檔是一個XML文檔,它遵循的是哪個XML版本的規(guī)范。一個XML的聲明語句就象這樣: <? 5.DTD(文件類型定義) DTD是用來定義XML文檔中元素,屬性以及元素之間關系的。 通過DTD文件可以檢測XML文檔的結構是否正確。但建立XML文檔并不一定需要DTD文件。關于DTD文件的詳細說明我們將在下面單獨列項。 6.Well-formed XML(良好格式的XML) 一個遵守 良好格式的文檔必須以一個XML聲明開始,例如: <? 其中你必須說明文檔遵守的 良好格式的XML文檔必須有一個根元素,就是緊接著聲明后面建立的第一個元素,其它元素都是這個根元素的子元素,屬于根元素一組。 良好格式的XML文檔的內容書寫時必須遵守XML語法。(有關XML語法我們將在下一章仔細講解) 7.Valid XML(有效的XML) 一個遵守 將XML文檔和它的DTD文件進行比較分析,看是否符合DTD規(guī)則的過程叫validation(確認)。這樣的過程通常我們是通過一個名為parser的軟件來處理的。 有效的XML文檔也必須以一個XML聲明開始,例如: <? 和上面例子不同的,在standalone(獨立)屬性中,這里設置的是"no",因為它必須和相應的DTD一起使用,DTD文件的定義方法如下: <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 二.DTD的有關術語 什么是DTD,我們上面已經簡略提到。DTD是一種保證XML文檔格式正確的有效方法,可以比較XML文檔和DTD文件來看文檔是否符合規(guī)范,元素和標簽使用是否正確。一個DTD文檔包含:元素的定義規(guī)則,元素間關系的定義規(guī)則,元素可使用的屬性,可使用的實體或符號規(guī)則。 DTD文件也是一個ASCII的文本文件,后綴名為.dtd。例如:myfile.dtd。 為什么要用DTD文件呢?我的理解是它滿足了網絡共享和數(shù)據交互,使用DTD最大的好處在于DTD文件的共享。(就是上文DTD說明語句中的PUBLIC屬性)。比如,兩個相同行業(yè)不同地區(qū)的人使用同一個DTD文件來作為文檔創(chuàng)建規(guī)范,那么他們的數(shù)據就很容易交換和共享。網上有其他人想補充數(shù)據,也只需要根據公用的DTD規(guī)范來建立文檔,就立刻可以加入。 目前,已經有數(shù)量眾多的寫好的DTD文件可以利用。針對不同的行業(yè)和應用,這些DTD文件已經建立了通用的元素和標簽規(guī)則。你不需要自己重新創(chuàng)建,只要在他們的基礎上加入你需要的新標識。 當然,如果愿意,你可以創(chuàng)建自己的DTD,它可能和你的文檔配合的更加完美。建立自己的DTD也是很簡單的一件事,一般只需要定義4-5個元素就可以了。 調用DTD文件的方法有兩種: 1.直接包含在XML文檔內的DTD 你只要在DOCTYPE聲明中插入一些特別的說明就可以了,象這樣: 我們有一個XML文檔: <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 我們在第一行后面插入下面代碼就可以: <!DOCTYPE myfile [ <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> <!ENTITY copyright "Copyright 2001, Ajie."> ]> 2.調用獨立的DTD文件 將DTD文檔存為.dtd的文件,然后在DOCTYPE聲明行中調用,例如,將下面的代碼存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 然后在XML文檔中調用,在第一行后插入: <!DOCTYPE myfile SYSTEM "myfile.dtd"> 我們可以看到DTD文檔和HTML中js的調用是差不多的,關于DTD文檔具體如何寫,我們將在下一章和XML文檔的語法一起介紹。 下面我們來了解DTD有關的術語: 1.Schema(規(guī)劃) schema是數(shù)據規(guī)則的描述。schema做兩件事: a.它定義元素數(shù)據類型和元素之間的關系; b.它定義元素所能包含的內容類型。 DTD就是關于XML文檔的一個schema。 2.Document Tree(文檔樹) "文檔樹"在前面第二章我們已經提到過,它是文檔元素分級結構的形象表示。一個文檔結構樹包含根元素,根元素是最頂級的元素,(就是緊接著XML聲明語句后的第一個元素)。看例子: <? <filelist> <myfile> <title>...</title> <author>...</author> </myfile> </filelist> 上面的例子分三級結構排列成"樹"狀,其中的<filelist>就是根元素。在XML和DTD文件中,第一個定義的都是根元素。 3.Parent Element(父元素)/Child Element(子元素) 父元素是指包含有其它元素的元素,被包含的元素稱為它的子元素??瓷厦娴?結構樹",其中<myfile>是父元素,<title>,<author>是它的子元素,而<myfile>又是<filelist>的子元素。象<title>這樣沒有包含任何子元素的最后一級元素我們也稱之為"頁元素"。 4.Parser(解析軟件) Parser是一種檢查XML文檔是否遵循DTD規(guī)范的工具軟件。 Parser能獨立使用,也可以成為編輯軟件或瀏覽器的一部分。在后面的相關資源列表里,我列出了當前比較流行的一些parsers。 好了,通過第三章的學習,我們已經了解了一些XML和DTD的基本術語,但是我們還不知道怎樣來寫這些文件,需要遵循什么樣的語法,在下一章,將重點介紹有關撰寫XML和DTD文檔的語法。請繼續(xù)瀏覽,謝謝! XML輕松學習手冊(4)XML語法 第四章 XML語法 提綱: 一.XML語法規(guī)則 二.元素的語法 三.注釋的語法 四.CDATA的語法 五.Namespaces的語法 六.entity的語法 七.DTD的語法 通過前面三章的學習,我們已經對什么是XML,它的實現(xiàn)原理以及相關的術語有所了解。接下來我們就開始學習XML的語法規(guī)范,動手寫自己的XML文檔。 一.XML語法規(guī)則 XML的文檔和HTML的原代碼類似,也是用標識來標識內容。創(chuàng)建XML文檔必須遵守下列重要規(guī)則: 規(guī)則1:必須有XML聲明語句 這一點我們在上一章學習時已經提到過。聲明是XML文檔的第一句,其格式如下: <? 聲明的作用是告訴瀏覽器或者其它處理程序:這個文檔是XML文檔。聲明語句中的version表示文檔遵守的XML規(guī)范的版本;standalone表示文檔是否附帶DTD文件,如果有,參數(shù)為no;encoding表示文檔所用的語言編碼,默認是UTF-8。 規(guī)則2:是否有DTD文件 如果文檔是一個"有效的 <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 規(guī)則3:注意你的大小寫 在XML文檔中,大小寫是有區(qū)別的。<P>和<p>是不同的標識。注意在寫元素時,前后標識大小寫要保持一樣。例如:<Author>ajie</Author>,寫成<Author>ajie</author>是錯誤的。 你最好養(yǎng)成一種習慣,或者全部大寫,或者全部小寫,或者大寫第一個字母。這樣可以減少因為大小寫不匹配產生的文檔錯誤。 規(guī)則4:給屬性值加引號 在HTML代碼里面,屬性值可以加引號,也可以不加。例如:<font color=red> 但是在XML中則規(guī)定,所有屬性值必須加引號(可以是單引號,也可以是雙引號),否則將被視為錯誤。 規(guī)則5:所有的標識必須有相應的結束標識 在HTML中,標識可能不是成對出現(xiàn)的,比?lt;br>。而在XML中規(guī)定,所有標識必須成對出現(xiàn),有一個開始標識,就必須有一個結束標識。否則將被視為錯誤。 規(guī)則6:所有的空標識也必須被關閉 空標識就是標識對之間沒有內容的標識。比如 ,<img>等標識。在XML中,規(guī)定所有的標識必須有結束標識,針對這樣的空標識,XML中處理的方法是在原標識最后加/,就可以了。例如: 應寫為<br />; <META name="keyXML, SGML, <IMG src= "cool.gif">應寫為<IMG src= "cool.gif" /> 第四章 XML語法 二.元素的語法 元素由一對標識以及其中的內容組成。就象這樣:ajie。元素的名稱和標識的名稱是一樣的。標識可以用屬性來進一步描述。 在XML中,沒有任何保留字,所以你可以隨心所欲的用任何詞語來作為元素名稱。但是也必須遵守下列規(guī)范: 1.名稱中可以包含字母、數(shù)字以及其它字母; 2.名稱不能以數(shù)字或"_" (下劃線)開頭; 3.名稱不能以字母 XML(或 XML 或 Xml ..)開頭 4.名稱中不能包含空格 5.名稱中間不能包含":"(冒號) 為了使元素更容易閱讀理解和操作,我們還有一些建議: 1.名稱中不要使用"."。因為在很多程序語言中,"."是作為對象的屬性,例如:font.color。同樣的原因"-"也最好不要用,必須使用的,以"_"代替; 2.名稱盡量簡短。 3.名稱的大小寫盡量采用同一標準。 4.名稱可以使用非英文字符,比如用中文。但是有些軟件可能不支持。(IE5目前是支持中文元素的。) 另外,補充一點關于屬性的說明。在word</font>將把word顯示為紅色。而在CSS或者XSL,我們在下面詳細講述。) 三.注釋的語法 注釋是為了便于閱讀和理解,在XML文檔添加的附加信息,將不會被程序解釋或則瀏覽器顯示。 注釋的語法如下: <!-- 這里是注釋信息 --> 可以看到,它和HTML中的注釋語法是一樣的,非常容易。養(yǎng)成良好的注釋習慣將使你的文檔更加便于維護,共享,看起來也更專業(yè)。 四.CDATA的語法 CDATA全稱character data,翻譯為字符數(shù)據。我們在寫 <![CDATA[這里放置需要顯示的字符]]> 例如: <![CDATA[<AUTHOR sex="female">ajie</AUTHOR>]]> 在頁面上顯示的內容將是"<AUTHOR sex="female">ajie</AUTHOR>" 第四章 XML語法 五.Namespaces的語法 Namespaces翻譯為名字空間。名字空間有什么作用呢?當我們在一個XML文檔中使用他人的或者多個DTD文件,就會出現(xiàn)這樣的矛盾:因為XML中標識都是自己創(chuàng)建的,在不同的DTD文件中,標識名可能相同但表示的含義不同,這就可能引起數(shù)據混亂。 比如在一個文檔<table>wood table</table>中<table>表示桌子, 而在另一個文檔<table>namelist</table>中<table>表示表格。如果我需要同時處理這兩個文檔,就會發(fā)生名字沖突。 了解決這個問題,我們引進了namespaces這個概念。namespaces通過給標識名稱加一個網址(URL)定位的方法來區(qū)別這些名稱相同的標識。 Namespaces同樣需要在XML文檔的開頭部分聲明,聲明的語法如下: <document 其中yourname是由你定義的namespaces的名稱,URL就是名字空間的網址。 假設上面的"桌子<table>"文檔來自http://www.zhuozi.com,我們就可以聲明為 <document http://www.zhuozi.com'> 然后在后面的標識中使用定義好的名字空間: <zhuozi:table>wood table</table> 這樣就將這兩個<table>區(qū)分開來。注意的是:設置URL并不是說這個標識真的要到那個網址去讀取,僅僅作為一種區(qū)別的標志而已。 六.entity的語法 entity翻譯為"實體"。它的作用類似 entity可以包含字符,文字等等,使用entity的好處在于:1.它可以減少差錯,文檔中多個相同的部分只需要輸入一遍就可以了。2.它提高維護效率。比如你有40個文檔都包含copyright的entity,如果需要修改這個copyright,不需要所有的文件都修改,只要改最初定義的entity語句就可以了。 XML定義了兩種類型的entity。一種是我們這里說的普通entity,在XML文檔中使用;另一種是參數(shù)entity,在DTD文件中使用。 entity的定義語法為: <!DOCTYPE filename [ <!ENTITY entity-name "entity-content" ] > 例如我要定義一段版權信息: <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved" ] > 如果我的版權信息內容和他人共享一個XML文件,也可以使用外部調用的方法,語法象這樣: <!DOCTYPE copyright [ <!ENTITY copyright SYSTEM "http://www.sample.com/copyright. ] > 定義好的entity在文檔中的引用語法為:&entity-name; 例如,上面定義的版權信息,調用時寫作?copyright; 完整的例子如下,你可以copy下來存為copyright.XML觀看實例: <? <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved"> ]> <myfile> <title>XML</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> ©right; </myfile> 第四章 XML語法 七.DTD的語法 DTD是"有效 1.設置元素 元素是XML文檔的基本組成部分。你要在DTD中定義一個元素,然后在XML文檔中使用。元素的定義語法為:<!ELEMENT DESCRIPTION (#PCDATA, DEFINITION)*> 說明: "<!ELEMENT" 是元素的聲明,說明你要定義的是一個元素; 聲明后面的"DESCRIPTION",是元素的名稱; "(#PCDATA, DEFINITION)*>"則是該元素的使用規(guī)則。規(guī)則定義了元素可以包含的內容以及相互的關系。下面的表格概要列出了元素的規(guī)則: 2.元素規(guī)則表: 此主題相關圖片如下: 另外,我們還可以為元素定義屬性,因為我們不推薦使用屬性,在這里就不詳細展開了。 最后,我們來總結一些前四章學習的內容,寫一個包含DTD,XML,以及Script的簡單實例,便于讀者理解: 1.將下面文件存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 2.然后建立XML文檔myfile.xml: <? <!DOCTYPE myfile SYSTEM "myfile.dtd"> <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 3.建立HTML文檔myfile.html <HTML> <head> <script language=" var nodes = XMLDoc.documentElement.childNodes; title.innerText = nodes.item(0).text; author.innerText = nodes.item(1).text; </script> <title>在HTML中調用XML數(shù)據</title> </head> <body bgcolor="#FFFFFF"> <b>標題: </b> <span id="title"></span><br> <b>作者: </b> <span id="author"></span><br> </body> </HTML> 4.用IE5.0以上瀏覽器打開myfile.HTML就可以看到效果了。 XML輕松學習手冊(5)XML實例解析 第五章:XML實例解析 提綱: 一:實例效果 二:實例解析 1.定義新標識。 2.建立XML文檔。 3.建立相應的HTML文件。 XML在不同領域有著廣泛的應用,比如在科技領域的MathML,無線通信應用的WML,在網絡圖象方面的SVG等等,我們這里側重討論XML在web上的應用。XML在web上應用主要是利用其強大的數(shù)據操作能力。一般用XML配合JavaScript和ASP等服務器端程序,可以實現(xiàn)網絡上幾乎所有的應用需求。 考慮講解方便,我們在下面介紹一個簡單的實例,不包含服務器端程序。目的在于讓您對XML的數(shù)據操作能力有一個感性的認識。 好,我們首先[ 點擊這里 ]來看實例的效果。(請用IE5.0以上版本瀏覽器打開) 這是一個簡單的CD唱片數(shù)據檢索功能。你通過點擊"上一張","下一張"可以看到單張CD的有關信息。這樣的效果我們原來用兩種方法可以實現(xiàn): 1.利用DHTML,將數(shù)據隱藏在不同的層中,通過鼠標事件依次顯示; 2.利用后臺程序(如ASP,CGI,PHP,JSP等),調用服務器端的數(shù)據。 但是在這個實例中,我們打開頁面原代碼可以看到,其中沒有用DHTML的DIV,也沒有表單的action,它完全是用XML來實現(xiàn)的。下面我們來分析它的制作過程: 第一步:定義新標識。 根據實際的CD數(shù)據,首先新建一個名為<CD>的標識;其次建立它相關的數(shù)據標識,分別是:CD名稱<Title>,演唱者<Artist>,出版年代<Year>,國家<Country>,發(fā)行公司<Company>和價格<Price>;最后還要建立一個名為目錄<CATALOG>的標識。為什么要再建立一個<CATALOG>標識呢?因為在XML文檔中規(guī)定,必須且只能有一個根元素(標識),我們有多個CD數(shù)據,這些數(shù)據是并列的關系,所以需要為這些并列的元素建立一個根元素。 以上元素的定義和關系都完全符合XML標準,不需要特別的DTD文件來定義,所以可以省略DTD定義。如果我們想使用DTD來定義,以上過程可以表示為: <!ELEMENT CATALOG (CD)*> <!ELEMENT CD (Title,Artist,Year,Country,Company,Price)> <!ELEMENT Title (#PCDATA)> <!ELEMENT Artist (#PCDATA)> <!ELEMENT Year (#PCDATA)> <!ELEMENT Country (#PCDATA)> <!ELEMENT Company (#PCDATA)> <!ELEMENT Price (#PCDATA)> 這段代碼表示:元素CATALOG包含多個CD子元素,而子元素CD又依次包含Title, Artist, Year, Country, Company, Price 六個子元素,它們的內容都定義為文本(字符,數(shù)字,文本)。(注:具體的語法說明可以看上一章關于DTD的介紹) 第二步:建立XML文檔。 <? <CATALOG> <CD> <TITLE>Empire Burlesque</TITLE> <ARTIST>Bob Dylan</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>Columbia</COMPANY> <PRICE>10.90</PRICE> <YEAR>1985</YEAR> </CD> <CD> <TITLE>Hide your heart</TITLE> <ARTIST>Bonnie Tylor</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>CBS Records</COMPANY> <PRICE>9.90</PRICE> <YEAR>1988</YEAR> </CD> <CD> <TITLE>Greatest Hits</TITLE> <ARTIST>Dolly Parton</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>RCA</COMPANY> <PRICE>9.90</PRICE> <YEAR>1982</YEAR> </CD> <CD> <TITLE>Still got the blues</TITLE> <ARTIST>Gary More</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>Virgin redords</COMPANY> <PRICE>10.20</PRICE> <YEAR>1990</YEAR> </CD> <CD> <TITLE>Eros</TITLE> <ARTIST>Eros Ramazzotti</ARTIST> <COUNTRY>EU</COUNTRY> <COMPANY>BMG</COMPANY> <PRICE>9.90</PRICE> <YEAR>1997</YEAR> </CD> </CATALOG> 上面代碼首先用<? <CATALOG> <CD> ...... </CD> <CD> ...... </CD> </CATALOG> 一共定義了5組數(shù)據。我們將上面的代碼存為cd.XML文件,以備調用。 第三步:建立相應的HTML文件。 1.導入XML數(shù)據。 我們知道,目前流行的瀏覽器中,暫時只有微軟的IE5.0以上版本瀏覽器支持XML。IE是通過在 CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> 定義一個object,ID名為XMLdso。然后在head區(qū)用js引入xml數(shù)據: <script for="window" event="onload"> </script> 2.捆綁數(shù)據。 然后將用<SPAN>標識來將XML數(shù)據綁定在表格中。其中ID,DATASRC,DTATFLD都是<SPAN>的屬性。代碼如下: <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> 3.動作操作。 最后,為數(shù)據提供瀏覽按鈕: <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> 并利用js來完成兩個鼠標點擊功能:movenext()和moveprevious()。在head區(qū)加入如下代碼: <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> 好,我們先看HTML文件的全部原代碼: <HTML> <head> <script for="window" event="onload"> </script> <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> <TITLE>CD Navigate</TITLE> </head> <body> <p> <object WIDTH="0" HEIGHT="0" CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> <p> <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> </p> </body> </HTML> 將以上代碼存為cd.htm文件,于第二步的cd.XML文件放在一起。打開cd.htm文件,你就看見和上面實例一樣的效果了。 好,到今天為止,我們已經學習了關于XML的不少知識,我們來總結一下前面五個章節(jié),分別是XML快速入門,XML的概念原理,XML的術語,XML的語法和本章的實例解析。到這里,教程部分就結束了。在寫作過程中,阿捷盡最大努力將有關XML概念講得通俗易懂,盡量把自己的理解告訴給大家,但因為本人學習XML時間也不長,對整個XML的技術把握還不夠系統(tǒng)和深入,所以難免有疏漏的地方,請大家指正和諒解,謝謝! posted on 2009-02-15 15:45 YXY 閱讀(187) 評論(0) 編輯 收藏
<Email>ajie@aolhoo.com</email>
好了,到現(xiàn)在你已經知道:
1.什么是XML; 2.XML,HTML,SGML之間的關系和區(qū)別; 3.XML的簡單應用。
恭喜你!你已經不再對XML一無所知,并且已經走在了網絡技術的前沿。整個學習過程好象并不很難哦:)
如果你對XML有更多的興趣,希望進一步了解XML的詳細資料和其它的實際運用技術,歡迎繼續(xù)瀏覽我們的下一章:XML的概念。 XML輕松學習手冊(2)XML概念
第二章 XML概念
導言
經過第一章的快速入門學習,你已經知道了 一. 擴展性 二. 標識 三. 語言 四. 結構化 五. Meta數(shù)據 六. 顯示 七. DOM 一.擴展性---使用XML,你可以為你的文檔建立自己的標記(tags)。 在HTML里,有許多固定的標記,我們必須記住然后使用它們,你不能使用HTML規(guī)范里沒有的標記。而在XML中,你能建立任何你需要的標記。你可以充分發(fā)揮你的想象力,給你的文檔起一些好記的標記名稱。比如,你的文檔里包含一些游戲的攻略,你可以建立一個名為<game>的標記,然后在<game>下再根據游戲類別建立<RPG>,<SLG>等標記。只要清晰,易于理解你可以建立任何數(shù)量的標記。 一開始你也許會不適應,因為我們在學習HTML時,有固定的標記可以直接學習和使用;(很多人包括我自己都是邊分析別人的代碼和標識,邊建立自己的網頁),而XML卻沒有任何標記可以學,也很少有文檔的標記是一模一樣的。我們怎么辦?呵呵,沒有就自己創(chuàng)建呀。一旦你真正開始寫XML文檔,你會發(fā)現(xiàn)隨心所欲的創(chuàng)造新標記也是一份很有趣的事。你可以建立有自己特色的標記,甚至建立你自己的HTML語言。 擴展性使你有更多的選擇和強大的能力,但同時也產生一個問題就是你必須學會規(guī)劃。你自己要理解自己的文檔,知道它由哪幾部分組成,相互之間的關系和如何識別它們。 關于建立標識還需要說明一點,標識是描述數(shù)據的類型或特性,比如<width>,年齡<age>,姓名<name>等,而不是數(shù)據的內容,比如:<10pxl>,<18>,<張三>,這些都是無用的標記。如果你學過數(shù)據庫,你可以這樣理解,標識就是一種字段名。 二.標識---使用XML你可以識別文檔中的元素。 不論你是HTML,還是XML,標識的本質在于便于理解,如果沒有標識,你的文檔在計算機看來只是一個很長的字符串,每個字看起來都一樣,沒有重點之分。 通過標識,你的文檔才便于閱讀和理解,你可以劃分段落,列明標題。XML中,你更可以利用其擴展性 來為文檔建立更合適的標識。 不過,有一點要提醒大家注意:標識僅僅是用來識別信息,它本身并不傳達信息。例如這樣的HTML代碼: <b>frist step<b> 這里<b>表示粗體,只用來說明是用粗體來顯示"frist step"字符,<b>本身并不包含任何實際的信息,在頁面上你看不到<b>,真正傳達信息的是"frist step "。 三.語言---使用XML你要遵循特定的語法來標識你的文檔。 在計算機領域,語言常常表示一?quot;程序語言",用來編程實現(xiàn)一些功能和應用,但不是所有的"語言"都是用來編程的,XML就只是一種用來定義標識和描述信息的語言。 下面我們來深入了解一下XML應用的其本原理,可能會很枯燥,但是對于整體的理解很重要,你可以先快速過一遍,心里有一個模糊的概念,具體精髓則需要在實踐中慢慢領會。 四.結構化---XML促使文檔結構化,所有的信息按某種關系排列。 "結構化"聽起來太抽象了,我們這樣理解,結構化就是為你的文檔建立一個框架,就象寫文章先寫一個提綱。結構化使你的文檔看起來不會雜亂無章,每一部分都緊密聯(lián)系,形成一個整體。 結構化有兩個原則: 1.每一部分(每一個元素)都和其他元素有關聯(lián)。關聯(lián)的級數(shù)就形成了結構。 2.標識本身的含義與它描述的信息相分離。 我們來看一個簡單的例子幫助理解: <? <myfile> <title>XML輕松學習手冊</title> <chapter>XML快速入門 <para>什么是XML</para> <para>使用XML的好處</para> </chapter> <chapter>XML的概念 <para>擴展性</para> <para>標識</para> </chapter> </myfile> 這是本文的XML描述文檔,可以看到標識分三級關聯(lián),非常清晰: <myfile> <chapter> <para> ... </para> </chapter> </myfile> 上面這樣的文檔結構,我們又稱之為"文檔樹",主干是父元素,如<myfile>,分支和頁是子元素,如<chapter>和<para>。 五.Meta數(shù)據(Metadata)---專業(yè)的XML使用者會使用meta數(shù)據來工作。 在HTML中我們知道可以使用meta標識來定義網頁的關鍵字,簡介等,這些標識不會顯示在網頁中,但可以被搜索引擎搜索到,并影響搜索結果的排列順序。 XML對這一原理進行了深化和擴展,用XML,你可以描述你的信息在哪里,你可以通過meta來驗證信息,執(zhí)行搜索,強制顯示,或者處理其他的數(shù)據。 下面是一些XML metadata在實際應用中的用途: 1.可以驗證數(shù)字簽名,使在線商務的提交動作(submission)有效。 2.可以被方便的建立索引和進行更有效搜索。 3.可以在不同語言之間傳輸數(shù)據。 W3C組織正在研究一種名為RDF(Resource Description Framework)的metadata處理方法,可以自動交換信息,W3C宣稱,使用RDF配合數(shù)字簽名,將使網絡中存在"真實可信"的電子商務。 六.顯示 單獨用XML不能顯示頁面,我們使用格式化技術,比如CSS或者XSL,才能顯示XML標記創(chuàng)建的文檔。 我們在前面第一章講到XML是將數(shù)據和格式分離的。XML文檔本身不知道如何來顯示,必須有輔助文件來幫助實現(xiàn)。(XML取消了所有標識,包括font,color,p等風格樣式定義標識,因此XML全部是采用類似DHTML中CSS的方法來定義文檔風格樣式。),XML中用來設定顯示風格樣式的文件類型有: 1.XSL XSL全稱是Extensible Stylesheet Language(可擴展樣式語言), 是將來設計XML文檔顯示樣式的主要文件類型。它本身也是基于XML語言的。使用XSL,你可以靈活的設置文檔顯示樣式,文檔將自動適應任何瀏覽器和PDA(掌上電腦)。 XSL也可以將XML轉化為HTML,那樣,老的瀏覽器也可以瀏覽XML文檔了。 2.CSS CSS大家很熟悉了,全稱是Cascading Style Sheets(層疊樣式表),是目前用來在瀏覽器上顯示XML文檔的主要方法。 3.Behaviors Behaviors現(xiàn)在還沒有成為標準。它是微軟的IE瀏覽器特有的功能,用它可以對XML標識設定一些有趣動作。 七.DOM DOM全稱是document object model(文檔對象模型),DOM是用來干什么的呢?假設把你的文檔看成一個單獨的對象,DOM就是如何用HTML或者XML對這個對象進行操作和控制的標準。 面向對象的思想方法已經非常流行了,在編程語言(例如java,js)中,都運用面向對象的編程思想。在XML中,就是要將網頁也作為一個對象來操作和控制,我們可以建立自己的對象和模板。與對象進行交流,如何命令對象,就要用到API。API全稱Application Programming Interface,它是訪問和操作對象的規(guī)則。而DOM就是一種詳細描述HTML/XML文檔對象規(guī)則的API。它規(guī)定了HTML/XML文檔對象的命名協(xié)定,程序模型,溝通規(guī)則等。在XML文檔中,我們可以將每一個標識元素看作一個對象---它有自己的名稱和屬性。 XML創(chuàng)建了標識,而DOM的作用就是告訴script如何在瀏覽器窗口中操作和顯示這些標識 上面我們已經簡要的講述了一些XML的基本原理,我們來看看它們之間的關聯(lián)以及它們是如何工作的,先看這里一張圖: 此主題相關圖片如下: 1. 2.CSS儲存并控制元素的顯示樣式。例如:標題將被以18pt字體顯示 3.script腳本控制元素如何動作。例如:當一個title元素"out of stock",將被用紅色顯示。 4.DOM則為腳本和對象的交流提供一個公共平臺,并將結果顯示在瀏覽器窗口。 如果任何一個部分發(fā)生錯誤,都不會得到正確結果。 好了,看到這里,我們已經對XML是如何工作的有一個整體的大致的概念。通過這一章的學習,我們可能感覺到XML似乎更偏向數(shù)據處理,更方便程序員學習。實際情況也是這樣的,XML設計的目的就是用來方便的共享和交互數(shù)據的。下一章,我們將系統(tǒng)的了解關于XML的各種術語。歡迎您繼續(xù)瀏覽。 XML輕松學習手冊(3)XML的術語 第三章 XML的術語 提綱: 導言 一.XML文檔的有關術語 二.DTD的有關術語 導言 初學XML最令人頭疼的就是有一大堆新的術語概念要理解。由于XML本身也是一個嶄新的技術,正在不斷發(fā)展和變化,各組織和各大網絡公司(微軟,IBM,SUN等)都在不斷推出自己的見解和標準,因此新概念漫天飛就不足為奇了。而國內又缺乏權威的機構或組織來對這些術語正式定名,你所看見的有關XML的中文教材大部分是靠作者本身的理解翻譯過來的,有些是正確的,有些是錯誤的,更加妨礙了我們對這些概念的理解和學習。 你下面將要看到的關于XML術語的解釋,也是作者本身的理解和翻譯。阿捷是以W3C組織發(fā)布的XML1.0標準規(guī)范和相關的正式說明文檔為根據來講述。可以確保這些理解是基本正確的,至少不是錯誤的。你如果想進一步閱讀和了解,我在本文的最后部分列明了相關資源的出處和鏈接,你可以直接訪問。好,我們轉入正題: 一.XML文檔的有關術語 什么是XML文檔?知道 <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> </myfile> XML文檔包含三個部分: 1. 一個XML文檔聲明; 2. 一個關于文檔類型的定義; 3. 用XML標識創(chuàng)建的內容。 舉例說明: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> <filelist> <myfile> <title>QUICK START OF XML</title> <author>ajie</author> </myfile> ...... </filelist> 其中第一行<? 我們來了解XML文檔中有關的術語: 1.Element(元素): 元素在HTML我們已經有所了解,它是組成HTML文檔的最小單位,在XML中也一樣。一個元素由一個標識來定義,包括開始和結束標識以及其中的內容,就象這樣:<author>ajie</author> 唯一不同的就是:在HTML中,標識是固定的,而在XML中,標識需要你自己創(chuàng)建。 2.Tag(標識) 標識是用來定義元素的。在XML中,標識必須成對出現(xiàn),將數(shù)據包圍在中間。標識的名稱和元素的名稱是一樣的。例如這樣一個元素: <author>ajie</author> 其中<author>就是標識。 3.Attribute(屬性): 什么是屬性?看這段word</font>。其中color就是font的屬性之一。 屬性是對標識進一步的描述和說明,一個標識可以有多個屬性,例如font的屬性還有size。XML中的屬性與HTML中的屬性是一樣的,每個屬性都有它自己的名字和數(shù)值,屬性是標識的一部分。舉例: <author sex="female">ajie</author> XML中屬性也是自己定義的,我們建議你盡量不使用屬性,而將屬性改成子元素,例如上面的代碼可以改成這樣: <author>ajie <sex>female</sex> </author> 原因是屬性不易擴充和被程序操作。 4.Declaration(聲明) 在所有XML文檔的第一行都有一個XML聲明。這個聲明表示這個文檔是一個XML文檔,它遵循的是哪個XML版本的規(guī)范。一個XML的聲明語句就象這樣: <? 5.DTD(文件類型定義) DTD是用來定義XML文檔中元素,屬性以及元素之間關系的。 通過DTD文件可以檢測XML文檔的結構是否正確。但建立XML文檔并不一定需要DTD文件。關于DTD文件的詳細說明我們將在下面單獨列項。 6.Well-formed XML(良好格式的XML) 一個遵守 良好格式的文檔必須以一個XML聲明開始,例如: <? 其中你必須說明文檔遵守的 良好格式的XML文檔必須有一個根元素,就是緊接著聲明后面建立的第一個元素,其它元素都是這個根元素的子元素,屬于根元素一組。 良好格式的XML文檔的內容書寫時必須遵守XML語法。(有關XML語法我們將在下一章仔細講解) 7.Valid XML(有效的XML) 一個遵守 將XML文檔和它的DTD文件進行比較分析,看是否符合DTD規(guī)則的過程叫validation(確認)。這樣的過程通常我們是通過一個名為parser的軟件來處理的。 有效的XML文檔也必須以一個XML聲明開始,例如: <? 和上面例子不同的,在standalone(獨立)屬性中,這里設置的是"no",因為它必須和相應的DTD一起使用,DTD文件的定義方法如下: <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 二.DTD的有關術語 什么是DTD,我們上面已經簡略提到。DTD是一種保證XML文檔格式正確的有效方法,可以比較XML文檔和DTD文件來看文檔是否符合規(guī)范,元素和標簽使用是否正確。一個DTD文檔包含:元素的定義規(guī)則,元素間關系的定義規(guī)則,元素可使用的屬性,可使用的實體或符號規(guī)則。 DTD文件也是一個ASCII的文本文件,后綴名為.dtd。例如:myfile.dtd。 為什么要用DTD文件呢?我的理解是它滿足了網絡共享和數(shù)據交互,使用DTD最大的好處在于DTD文件的共享。(就是上文DTD說明語句中的PUBLIC屬性)。比如,兩個相同行業(yè)不同地區(qū)的人使用同一個DTD文件來作為文檔創(chuàng)建規(guī)范,那么他們的數(shù)據就很容易交換和共享。網上有其他人想補充數(shù)據,也只需要根據公用的DTD規(guī)范來建立文檔,就立刻可以加入。 目前,已經有數(shù)量眾多的寫好的DTD文件可以利用。針對不同的行業(yè)和應用,這些DTD文件已經建立了通用的元素和標簽規(guī)則。你不需要自己重新創(chuàng)建,只要在他們的基礎上加入你需要的新標識。 當然,如果愿意,你可以創(chuàng)建自己的DTD,它可能和你的文檔配合的更加完美。建立自己的DTD也是很簡單的一件事,一般只需要定義4-5個元素就可以了。 調用DTD文件的方法有兩種: 1.直接包含在XML文檔內的DTD 你只要在DOCTYPE聲明中插入一些特別的說明就可以了,象這樣: 我們有一個XML文檔: <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 我們在第一行后面插入下面代碼就可以: <!DOCTYPE myfile [ <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> <!ENTITY copyright "Copyright 2001, Ajie."> ]> 2.調用獨立的DTD文件 將DTD文檔存為.dtd的文件,然后在DOCTYPE聲明行中調用,例如,將下面的代碼存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 然后在XML文檔中調用,在第一行后插入: <!DOCTYPE myfile SYSTEM "myfile.dtd"> 我們可以看到DTD文檔和HTML中js的調用是差不多的,關于DTD文檔具體如何寫,我們將在下一章和XML文檔的語法一起介紹。 下面我們來了解DTD有關的術語: 1.Schema(規(guī)劃) schema是數(shù)據規(guī)則的描述。schema做兩件事: a.它定義元素數(shù)據類型和元素之間的關系; b.它定義元素所能包含的內容類型。 DTD就是關于XML文檔的一個schema。 2.Document Tree(文檔樹) "文檔樹"在前面第二章我們已經提到過,它是文檔元素分級結構的形象表示。一個文檔結構樹包含根元素,根元素是最頂級的元素,(就是緊接著XML聲明語句后的第一個元素)。看例子: <? <filelist> <myfile> <title>...</title> <author>...</author> </myfile> </filelist> 上面的例子分三級結構排列成"樹"狀,其中的<filelist>就是根元素。在XML和DTD文件中,第一個定義的都是根元素。 3.Parent Element(父元素)/Child Element(子元素) 父元素是指包含有其它元素的元素,被包含的元素稱為它的子元素??瓷厦娴?結構樹",其中<myfile>是父元素,<title>,<author>是它的子元素,而<myfile>又是<filelist>的子元素。象<title>這樣沒有包含任何子元素的最后一級元素我們也稱之為"頁元素"。 4.Parser(解析軟件) Parser是一種檢查XML文檔是否遵循DTD規(guī)范的工具軟件。 Parser能獨立使用,也可以成為編輯軟件或瀏覽器的一部分。在后面的相關資源列表里,我列出了當前比較流行的一些parsers。 好了,通過第三章的學習,我們已經了解了一些XML和DTD的基本術語,但是我們還不知道怎樣來寫這些文件,需要遵循什么樣的語法,在下一章,將重點介紹有關撰寫XML和DTD文檔的語法。請繼續(xù)瀏覽,謝謝! XML輕松學習手冊(4)XML語法 第四章 XML語法 提綱: 一.XML語法規(guī)則 二.元素的語法 三.注釋的語法 四.CDATA的語法 五.Namespaces的語法 六.entity的語法 七.DTD的語法 通過前面三章的學習,我們已經對什么是XML,它的實現(xiàn)原理以及相關的術語有所了解。接下來我們就開始學習XML的語法規(guī)范,動手寫自己的XML文檔。 一.XML語法規(guī)則 XML的文檔和HTML的原代碼類似,也是用標識來標識內容。創(chuàng)建XML文檔必須遵守下列重要規(guī)則: 規(guī)則1:必須有XML聲明語句 這一點我們在上一章學習時已經提到過。聲明是XML文檔的第一句,其格式如下: <? 聲明的作用是告訴瀏覽器或者其它處理程序:這個文檔是XML文檔。聲明語句中的version表示文檔遵守的XML規(guī)范的版本;standalone表示文檔是否附帶DTD文件,如果有,參數(shù)為no;encoding表示文檔所用的語言編碼,默認是UTF-8。 規(guī)則2:是否有DTD文件 如果文檔是一個"有效的 <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 規(guī)則3:注意你的大小寫 在XML文檔中,大小寫是有區(qū)別的。<P>和<p>是不同的標識。注意在寫元素時,前后標識大小寫要保持一樣。例如:<Author>ajie</Author>,寫成<Author>ajie</author>是錯誤的。 你最好養(yǎng)成一種習慣,或者全部大寫,或者全部小寫,或者大寫第一個字母。這樣可以減少因為大小寫不匹配產生的文檔錯誤。 規(guī)則4:給屬性值加引號 在HTML代碼里面,屬性值可以加引號,也可以不加。例如:<font color=red> 但是在XML中則規(guī)定,所有屬性值必須加引號(可以是單引號,也可以是雙引號),否則將被視為錯誤。 規(guī)則5:所有的標識必須有相應的結束標識 在HTML中,標識可能不是成對出現(xiàn)的,比?lt;br>。而在XML中規(guī)定,所有標識必須成對出現(xiàn),有一個開始標識,就必須有一個結束標識。否則將被視為錯誤。 規(guī)則6:所有的空標識也必須被關閉 空標識就是標識對之間沒有內容的標識。比如 ,<img>等標識。在XML中,規(guī)定所有的標識必須有結束標識,針對這樣的空標識,XML中處理的方法是在原標識最后加/,就可以了。例如: 應寫為<br />; <META name="keyXML, SGML, <IMG src= "cool.gif">應寫為<IMG src= "cool.gif" /> 第四章 XML語法 二.元素的語法 元素由一對標識以及其中的內容組成。就象這樣:ajie。元素的名稱和標識的名稱是一樣的。標識可以用屬性來進一步描述。 在XML中,沒有任何保留字,所以你可以隨心所欲的用任何詞語來作為元素名稱。但是也必須遵守下列規(guī)范: 1.名稱中可以包含字母、數(shù)字以及其它字母; 2.名稱不能以數(shù)字或"_" (下劃線)開頭; 3.名稱不能以字母 XML(或 XML 或 Xml ..)開頭 4.名稱中不能包含空格 5.名稱中間不能包含":"(冒號) 為了使元素更容易閱讀理解和操作,我們還有一些建議: 1.名稱中不要使用"."。因為在很多程序語言中,"."是作為對象的屬性,例如:font.color。同樣的原因"-"也最好不要用,必須使用的,以"_"代替; 2.名稱盡量簡短。 3.名稱的大小寫盡量采用同一標準。 4.名稱可以使用非英文字符,比如用中文。但是有些軟件可能不支持。(IE5目前是支持中文元素的。) 另外,補充一點關于屬性的說明。在word</font>將把word顯示為紅色。而在CSS或者XSL,我們在下面詳細講述。) 三.注釋的語法 注釋是為了便于閱讀和理解,在XML文檔添加的附加信息,將不會被程序解釋或則瀏覽器顯示。 注釋的語法如下: <!-- 這里是注釋信息 --> 可以看到,它和HTML中的注釋語法是一樣的,非常容易。養(yǎng)成良好的注釋習慣將使你的文檔更加便于維護,共享,看起來也更專業(yè)。 四.CDATA的語法 CDATA全稱character data,翻譯為字符數(shù)據。我們在寫 <![CDATA[這里放置需要顯示的字符]]> 例如: <![CDATA[<AUTHOR sex="female">ajie</AUTHOR>]]> 在頁面上顯示的內容將是"<AUTHOR sex="female">ajie</AUTHOR>" 第四章 XML語法 五.Namespaces的語法 Namespaces翻譯為名字空間。名字空間有什么作用呢?當我們在一個XML文檔中使用他人的或者多個DTD文件,就會出現(xiàn)這樣的矛盾:因為XML中標識都是自己創(chuàng)建的,在不同的DTD文件中,標識名可能相同但表示的含義不同,這就可能引起數(shù)據混亂。 比如在一個文檔<table>wood table</table>中<table>表示桌子, 而在另一個文檔<table>namelist</table>中<table>表示表格。如果我需要同時處理這兩個文檔,就會發(fā)生名字沖突。 了解決這個問題,我們引進了namespaces這個概念。namespaces通過給標識名稱加一個網址(URL)定位的方法來區(qū)別這些名稱相同的標識。 Namespaces同樣需要在XML文檔的開頭部分聲明,聲明的語法如下: <document 其中yourname是由你定義的namespaces的名稱,URL就是名字空間的網址。 假設上面的"桌子<table>"文檔來自http://www.zhuozi.com,我們就可以聲明為 <document http://www.zhuozi.com'> 然后在后面的標識中使用定義好的名字空間: <zhuozi:table>wood table</table> 這樣就將這兩個<table>區(qū)分開來。注意的是:設置URL并不是說這個標識真的要到那個網址去讀取,僅僅作為一種區(qū)別的標志而已。 六.entity的語法 entity翻譯為"實體"。它的作用類似 entity可以包含字符,文字等等,使用entity的好處在于:1.它可以減少差錯,文檔中多個相同的部分只需要輸入一遍就可以了。2.它提高維護效率。比如你有40個文檔都包含copyright的entity,如果需要修改這個copyright,不需要所有的文件都修改,只要改最初定義的entity語句就可以了。 XML定義了兩種類型的entity。一種是我們這里說的普通entity,在XML文檔中使用;另一種是參數(shù)entity,在DTD文件中使用。 entity的定義語法為: <!DOCTYPE filename [ <!ENTITY entity-name "entity-content" ] > 例如我要定義一段版權信息: <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved" ] > 如果我的版權信息內容和他人共享一個XML文件,也可以使用外部調用的方法,語法象這樣: <!DOCTYPE copyright [ <!ENTITY copyright SYSTEM "http://www.sample.com/copyright. ] > 定義好的entity在文檔中的引用語法為:&entity-name; 例如,上面定義的版權信息,調用時寫作?copyright; 完整的例子如下,你可以copy下來存為copyright.XML觀看實例: <? <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved"> ]> <myfile> <title>XML</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> ©right; </myfile> 第四章 XML語法 七.DTD的語法 DTD是"有效 1.設置元素 元素是XML文檔的基本組成部分。你要在DTD中定義一個元素,然后在XML文檔中使用。元素的定義語法為:<!ELEMENT DESCRIPTION (#PCDATA, DEFINITION)*> 說明: "<!ELEMENT" 是元素的聲明,說明你要定義的是一個元素; 聲明后面的"DESCRIPTION",是元素的名稱; "(#PCDATA, DEFINITION)*>"則是該元素的使用規(guī)則。規(guī)則定義了元素可以包含的內容以及相互的關系。下面的表格概要列出了元素的規(guī)則: 2.元素規(guī)則表: 此主題相關圖片如下: 另外,我們還可以為元素定義屬性,因為我們不推薦使用屬性,在這里就不詳細展開了。 最后,我們來總結一些前四章學習的內容,寫一個包含DTD,XML,以及Script的簡單實例,便于讀者理解: 1.將下面文件存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 2.然后建立XML文檔myfile.xml: <? <!DOCTYPE myfile SYSTEM "myfile.dtd"> <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 3.建立HTML文檔myfile.html <HTML> <head> <script language=" var nodes = XMLDoc.documentElement.childNodes; title.innerText = nodes.item(0).text; author.innerText = nodes.item(1).text; </script> <title>在HTML中調用XML數(shù)據</title> </head> <body bgcolor="#FFFFFF"> <b>標題: </b> <span id="title"></span><br> <b>作者: </b> <span id="author"></span><br> </body> </HTML> 4.用IE5.0以上瀏覽器打開myfile.HTML就可以看到效果了。 XML輕松學習手冊(5)XML實例解析 第五章:XML實例解析 提綱: 一:實例效果 二:實例解析 1.定義新標識。 2.建立XML文檔。 3.建立相應的HTML文件。 XML在不同領域有著廣泛的應用,比如在科技領域的MathML,無線通信應用的WML,在網絡圖象方面的SVG等等,我們這里側重討論XML在web上的應用。XML在web上應用主要是利用其強大的數(shù)據操作能力。一般用XML配合JavaScript和ASP等服務器端程序,可以實現(xiàn)網絡上幾乎所有的應用需求。 考慮講解方便,我們在下面介紹一個簡單的實例,不包含服務器端程序。目的在于讓您對XML的數(shù)據操作能力有一個感性的認識。 好,我們首先[ 點擊這里 ]來看實例的效果。(請用IE5.0以上版本瀏覽器打開) 這是一個簡單的CD唱片數(shù)據檢索功能。你通過點擊"上一張","下一張"可以看到單張CD的有關信息。這樣的效果我們原來用兩種方法可以實現(xiàn): 1.利用DHTML,將數(shù)據隱藏在不同的層中,通過鼠標事件依次顯示; 2.利用后臺程序(如ASP,CGI,PHP,JSP等),調用服務器端的數(shù)據。 但是在這個實例中,我們打開頁面原代碼可以看到,其中沒有用DHTML的DIV,也沒有表單的action,它完全是用XML來實現(xiàn)的。下面我們來分析它的制作過程: 第一步:定義新標識。 根據實際的CD數(shù)據,首先新建一個名為<CD>的標識;其次建立它相關的數(shù)據標識,分別是:CD名稱<Title>,演唱者<Artist>,出版年代<Year>,國家<Country>,發(fā)行公司<Company>和價格<Price>;最后還要建立一個名為目錄<CATALOG>的標識。為什么要再建立一個<CATALOG>標識呢?因為在XML文檔中規(guī)定,必須且只能有一個根元素(標識),我們有多個CD數(shù)據,這些數(shù)據是并列的關系,所以需要為這些并列的元素建立一個根元素。 以上元素的定義和關系都完全符合XML標準,不需要特別的DTD文件來定義,所以可以省略DTD定義。如果我們想使用DTD來定義,以上過程可以表示為: <!ELEMENT CATALOG (CD)*> <!ELEMENT CD (Title,Artist,Year,Country,Company,Price)> <!ELEMENT Title (#PCDATA)> <!ELEMENT Artist (#PCDATA)> <!ELEMENT Year (#PCDATA)> <!ELEMENT Country (#PCDATA)> <!ELEMENT Company (#PCDATA)> <!ELEMENT Price (#PCDATA)> 這段代碼表示:元素CATALOG包含多個CD子元素,而子元素CD又依次包含Title, Artist, Year, Country, Company, Price 六個子元素,它們的內容都定義為文本(字符,數(shù)字,文本)。(注:具體的語法說明可以看上一章關于DTD的介紹) 第二步:建立XML文檔。 <? <CATALOG> <CD> <TITLE>Empire Burlesque</TITLE> <ARTIST>Bob Dylan</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>Columbia</COMPANY> <PRICE>10.90</PRICE> <YEAR>1985</YEAR> </CD> <CD> <TITLE>Hide your heart</TITLE> <ARTIST>Bonnie Tylor</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>CBS Records</COMPANY> <PRICE>9.90</PRICE> <YEAR>1988</YEAR> </CD> <CD> <TITLE>Greatest Hits</TITLE> <ARTIST>Dolly Parton</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>RCA</COMPANY> <PRICE>9.90</PRICE> <YEAR>1982</YEAR> </CD> <CD> <TITLE>Still got the blues</TITLE> <ARTIST>Gary More</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>Virgin redords</COMPANY> <PRICE>10.20</PRICE> <YEAR>1990</YEAR> </CD> <CD> <TITLE>Eros</TITLE> <ARTIST>Eros Ramazzotti</ARTIST> <COUNTRY>EU</COUNTRY> <COMPANY>BMG</COMPANY> <PRICE>9.90</PRICE> <YEAR>1997</YEAR> </CD> </CATALOG> 上面代碼首先用<? <CATALOG> <CD> ...... </CD> <CD> ...... </CD> </CATALOG> 一共定義了5組數(shù)據。我們將上面的代碼存為cd.XML文件,以備調用。 第三步:建立相應的HTML文件。 1.導入XML數(shù)據。 我們知道,目前流行的瀏覽器中,暫時只有微軟的IE5.0以上版本瀏覽器支持XML。IE是通過在 CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> 定義一個object,ID名為XMLdso。然后在head區(qū)用js引入xml數(shù)據: <script for="window" event="onload"> </script> 2.捆綁數(shù)據。 然后將用<SPAN>標識來將XML數(shù)據綁定在表格中。其中ID,DATASRC,DTATFLD都是<SPAN>的屬性。代碼如下: <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> 3.動作操作。 最后,為數(shù)據提供瀏覽按鈕: <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> 并利用js來完成兩個鼠標點擊功能:movenext()和moveprevious()。在head區(qū)加入如下代碼: <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> 好,我們先看HTML文件的全部原代碼: <HTML> <head> <script for="window" event="onload"> </script> <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> <TITLE>CD Navigate</TITLE> </head> <body> <p> <object WIDTH="0" HEIGHT="0" CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> <p> <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> </p> </body> </HTML> 將以上代碼存為cd.htm文件,于第二步的cd.XML文件放在一起。打開cd.htm文件,你就看見和上面實例一樣的效果了。 好,到今天為止,我們已經學習了關于XML的不少知識,我們來總結一下前面五個章節(jié),分別是XML快速入門,XML的概念原理,XML的術語,XML的語法和本章的實例解析。到這里,教程部分就結束了。在寫作過程中,阿捷盡最大努力將有關XML概念講得通俗易懂,盡量把自己的理解告訴給大家,但因為本人學習XML時間也不長,對整個XML的技術把握還不夠系統(tǒng)和深入,所以難免有疏漏的地方,請大家指正和諒解,謝謝! posted on 2009-02-15 15:45 YXY 閱讀(187) 評論(0) 編輯 收藏
一. 擴展性 二. 標識 三. 語言 四. 結構化 五. Meta數(shù)據 六. 顯示 七. DOM
一.擴展性---使用XML,你可以為你的文檔建立自己的標記(tags)。
在HTML里,有許多固定的標記,我們必須記住然后使用它們,你不能使用HTML規(guī)范里沒有的標記。而在XML中,你能建立任何你需要的標記。你可以充分發(fā)揮你的想象力,給你的文檔起一些好記的標記名稱。比如,你的文檔里包含一些游戲的攻略,你可以建立一個名為<game>的標記,然后在<game>下再根據游戲類別建立<RPG>,<SLG>等標記。只要清晰,易于理解你可以建立任何數(shù)量的標記。
一開始你也許會不適應,因為我們在學習HTML時,有固定的標記可以直接學習和使用;(很多人包括我自己都是邊分析別人的代碼和標識,邊建立自己的網頁),而XML卻沒有任何標記可以學,也很少有文檔的標記是一模一樣的。我們怎么辦?呵呵,沒有就自己創(chuàng)建呀。一旦你真正開始寫XML文檔,你會發(fā)現(xiàn)隨心所欲的創(chuàng)造新標記也是一份很有趣的事。你可以建立有自己特色的標記,甚至建立你自己的HTML語言。
擴展性使你有更多的選擇和強大的能力,但同時也產生一個問題就是你必須學會規(guī)劃。你自己要理解自己的文檔,知道它由哪幾部分組成,相互之間的關系和如何識別它們。
關于建立標識還需要說明一點,標識是描述數(shù)據的類型或特性,比如<width>,年齡<age>,姓名<name>等,而不是數(shù)據的內容,比如:<10pxl>,<18>,<張三>,這些都是無用的標記。如果你學過數(shù)據庫,你可以這樣理解,標識就是一種字段名。
二.標識---使用XML你可以識別文檔中的元素。
不論你是HTML,還是XML,標識的本質在于便于理解,如果沒有標識,你的文檔在計算機看來只是一個很長的字符串,每個字看起來都一樣,沒有重點之分。 通過標識,你的文檔才便于閱讀和理解,你可以劃分段落,列明標題。XML中,你更可以利用其擴展性 來為文檔建立更合適的標識。 不過,有一點要提醒大家注意:標識僅僅是用來識別信息,它本身并不傳達信息。例如這樣的HTML代碼: <b>frist step<b> 這里<b>表示粗體,只用來說明是用粗體來顯示"frist step"字符,<b>本身并不包含任何實際的信息,在頁面上你看不到<b>,真正傳達信息的是"frist step "。 三.語言---使用XML你要遵循特定的語法來標識你的文檔。 在計算機領域,語言常常表示一?quot;程序語言",用來編程實現(xiàn)一些功能和應用,但不是所有的"語言"都是用來編程的,XML就只是一種用來定義標識和描述信息的語言。 下面我們來深入了解一下XML應用的其本原理,可能會很枯燥,但是對于整體的理解很重要,你可以先快速過一遍,心里有一個模糊的概念,具體精髓則需要在實踐中慢慢領會。 四.結構化---XML促使文檔結構化,所有的信息按某種關系排列。 "結構化"聽起來太抽象了,我們這樣理解,結構化就是為你的文檔建立一個框架,就象寫文章先寫一個提綱。結構化使你的文檔看起來不會雜亂無章,每一部分都緊密聯(lián)系,形成一個整體。 結構化有兩個原則: 1.每一部分(每一個元素)都和其他元素有關聯(lián)。關聯(lián)的級數(shù)就形成了結構。 2.標識本身的含義與它描述的信息相分離。 我們來看一個簡單的例子幫助理解: <? <myfile> <title>XML輕松學習手冊</title> <chapter>XML快速入門 <para>什么是XML</para> <para>使用XML的好處</para> </chapter> <chapter>XML的概念 <para>擴展性</para> <para>標識</para> </chapter> </myfile> 這是本文的XML描述文檔,可以看到標識分三級關聯(lián),非常清晰: <myfile> <chapter> <para> ... </para> </chapter> </myfile> 上面這樣的文檔結構,我們又稱之為"文檔樹",主干是父元素,如<myfile>,分支和頁是子元素,如<chapter>和<para>。 五.Meta數(shù)據(Metadata)---專業(yè)的XML使用者會使用meta數(shù)據來工作。 在HTML中我們知道可以使用meta標識來定義網頁的關鍵字,簡介等,這些標識不會顯示在網頁中,但可以被搜索引擎搜索到,并影響搜索結果的排列順序。 XML對這一原理進行了深化和擴展,用XML,你可以描述你的信息在哪里,你可以通過meta來驗證信息,執(zhí)行搜索,強制顯示,或者處理其他的數(shù)據。 下面是一些XML metadata在實際應用中的用途: 1.可以驗證數(shù)字簽名,使在線商務的提交動作(submission)有效。 2.可以被方便的建立索引和進行更有效搜索。 3.可以在不同語言之間傳輸數(shù)據。 W3C組織正在研究一種名為RDF(Resource Description Framework)的metadata處理方法,可以自動交換信息,W3C宣稱,使用RDF配合數(shù)字簽名,將使網絡中存在"真實可信"的電子商務。 六.顯示 單獨用XML不能顯示頁面,我們使用格式化技術,比如CSS或者XSL,才能顯示XML標記創(chuàng)建的文檔。 我們在前面第一章講到XML是將數(shù)據和格式分離的。XML文檔本身不知道如何來顯示,必須有輔助文件來幫助實現(xiàn)。(XML取消了所有標識,包括font,color,p等風格樣式定義標識,因此XML全部是采用類似DHTML中CSS的方法來定義文檔風格樣式。),XML中用來設定顯示風格樣式的文件類型有: 1.XSL XSL全稱是Extensible Stylesheet Language(可擴展樣式語言), 是將來設計XML文檔顯示樣式的主要文件類型。它本身也是基于XML語言的。使用XSL,你可以靈活的設置文檔顯示樣式,文檔將自動適應任何瀏覽器和PDA(掌上電腦)。 XSL也可以將XML轉化為HTML,那樣,老的瀏覽器也可以瀏覽XML文檔了。 2.CSS CSS大家很熟悉了,全稱是Cascading Style Sheets(層疊樣式表),是目前用來在瀏覽器上顯示XML文檔的主要方法。 3.Behaviors Behaviors現(xiàn)在還沒有成為標準。它是微軟的IE瀏覽器特有的功能,用它可以對XML標識設定一些有趣動作。 七.DOM DOM全稱是document object model(文檔對象模型),DOM是用來干什么的呢?假設把你的文檔看成一個單獨的對象,DOM就是如何用HTML或者XML對這個對象進行操作和控制的標準。 面向對象的思想方法已經非常流行了,在編程語言(例如java,js)中,都運用面向對象的編程思想。在XML中,就是要將網頁也作為一個對象來操作和控制,我們可以建立自己的對象和模板。與對象進行交流,如何命令對象,就要用到API。API全稱Application Programming Interface,它是訪問和操作對象的規(guī)則。而DOM就是一種詳細描述HTML/XML文檔對象規(guī)則的API。它規(guī)定了HTML/XML文檔對象的命名協(xié)定,程序模型,溝通規(guī)則等。在XML文檔中,我們可以將每一個標識元素看作一個對象---它有自己的名稱和屬性。 XML創(chuàng)建了標識,而DOM的作用就是告訴script如何在瀏覽器窗口中操作和顯示這些標識 上面我們已經簡要的講述了一些XML的基本原理,我們來看看它們之間的關聯(lián)以及它們是如何工作的,先看這里一張圖: 此主題相關圖片如下: 1. 2.CSS儲存并控制元素的顯示樣式。例如:標題將被以18pt字體顯示 3.script腳本控制元素如何動作。例如:當一個title元素"out of stock",將被用紅色顯示。 4.DOM則為腳本和對象的交流提供一個公共平臺,并將結果顯示在瀏覽器窗口。 如果任何一個部分發(fā)生錯誤,都不會得到正確結果。 好了,看到這里,我們已經對XML是如何工作的有一個整體的大致的概念。通過這一章的學習,我們可能感覺到XML似乎更偏向數(shù)據處理,更方便程序員學習。實際情況也是這樣的,XML設計的目的就是用來方便的共享和交互數(shù)據的。下一章,我們將系統(tǒng)的了解關于XML的各種術語。歡迎您繼續(xù)瀏覽。 XML輕松學習手冊(3)XML的術語 第三章 XML的術語 提綱: 導言 一.XML文檔的有關術語 二.DTD的有關術語 導言 初學XML最令人頭疼的就是有一大堆新的術語概念要理解。由于XML本身也是一個嶄新的技術,正在不斷發(fā)展和變化,各組織和各大網絡公司(微軟,IBM,SUN等)都在不斷推出自己的見解和標準,因此新概念漫天飛就不足為奇了。而國內又缺乏權威的機構或組織來對這些術語正式定名,你所看見的有關XML的中文教材大部分是靠作者本身的理解翻譯過來的,有些是正確的,有些是錯誤的,更加妨礙了我們對這些概念的理解和學習。 你下面將要看到的關于XML術語的解釋,也是作者本身的理解和翻譯。阿捷是以W3C組織發(fā)布的XML1.0標準規(guī)范和相關的正式說明文檔為根據來講述。可以確保這些理解是基本正確的,至少不是錯誤的。你如果想進一步閱讀和了解,我在本文的最后部分列明了相關資源的出處和鏈接,你可以直接訪問。好,我們轉入正題: 一.XML文檔的有關術語 什么是XML文檔?知道 <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> </myfile> XML文檔包含三個部分: 1. 一個XML文檔聲明; 2. 一個關于文檔類型的定義; 3. 用XML標識創(chuàng)建的內容。 舉例說明: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> <filelist> <myfile> <title>QUICK START OF XML</title> <author>ajie</author> </myfile> ...... </filelist> 其中第一行<? 我們來了解XML文檔中有關的術語: 1.Element(元素): 元素在HTML我們已經有所了解,它是組成HTML文檔的最小單位,在XML中也一樣。一個元素由一個標識來定義,包括開始和結束標識以及其中的內容,就象這樣:<author>ajie</author> 唯一不同的就是:在HTML中,標識是固定的,而在XML中,標識需要你自己創(chuàng)建。 2.Tag(標識) 標識是用來定義元素的。在XML中,標識必須成對出現(xiàn),將數(shù)據包圍在中間。標識的名稱和元素的名稱是一樣的。例如這樣一個元素: <author>ajie</author> 其中<author>就是標識。 3.Attribute(屬性): 什么是屬性?看這段word</font>。其中color就是font的屬性之一。 屬性是對標識進一步的描述和說明,一個標識可以有多個屬性,例如font的屬性還有size。XML中的屬性與HTML中的屬性是一樣的,每個屬性都有它自己的名字和數(shù)值,屬性是標識的一部分。舉例: <author sex="female">ajie</author> XML中屬性也是自己定義的,我們建議你盡量不使用屬性,而將屬性改成子元素,例如上面的代碼可以改成這樣: <author>ajie <sex>female</sex> </author> 原因是屬性不易擴充和被程序操作。 4.Declaration(聲明) 在所有XML文檔的第一行都有一個XML聲明。這個聲明表示這個文檔是一個XML文檔,它遵循的是哪個XML版本的規(guī)范。一個XML的聲明語句就象這樣: <? 5.DTD(文件類型定義) DTD是用來定義XML文檔中元素,屬性以及元素之間關系的。 通過DTD文件可以檢測XML文檔的結構是否正確。但建立XML文檔并不一定需要DTD文件。關于DTD文件的詳細說明我們將在下面單獨列項。 6.Well-formed XML(良好格式的XML) 一個遵守 良好格式的文檔必須以一個XML聲明開始,例如: <? 其中你必須說明文檔遵守的 良好格式的XML文檔必須有一個根元素,就是緊接著聲明后面建立的第一個元素,其它元素都是這個根元素的子元素,屬于根元素一組。 良好格式的XML文檔的內容書寫時必須遵守XML語法。(有關XML語法我們將在下一章仔細講解) 7.Valid XML(有效的XML) 一個遵守 將XML文檔和它的DTD文件進行比較分析,看是否符合DTD規(guī)則的過程叫validation(確認)。這樣的過程通常我們是通過一個名為parser的軟件來處理的。 有效的XML文檔也必須以一個XML聲明開始,例如: <? 和上面例子不同的,在standalone(獨立)屬性中,這里設置的是"no",因為它必須和相應的DTD一起使用,DTD文件的定義方法如下: <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 二.DTD的有關術語 什么是DTD,我們上面已經簡略提到。DTD是一種保證XML文檔格式正確的有效方法,可以比較XML文檔和DTD文件來看文檔是否符合規(guī)范,元素和標簽使用是否正確。一個DTD文檔包含:元素的定義規(guī)則,元素間關系的定義規(guī)則,元素可使用的屬性,可使用的實體或符號規(guī)則。 DTD文件也是一個ASCII的文本文件,后綴名為.dtd。例如:myfile.dtd。 為什么要用DTD文件呢?我的理解是它滿足了網絡共享和數(shù)據交互,使用DTD最大的好處在于DTD文件的共享。(就是上文DTD說明語句中的PUBLIC屬性)。比如,兩個相同行業(yè)不同地區(qū)的人使用同一個DTD文件來作為文檔創(chuàng)建規(guī)范,那么他們的數(shù)據就很容易交換和共享。網上有其他人想補充數(shù)據,也只需要根據公用的DTD規(guī)范來建立文檔,就立刻可以加入。 目前,已經有數(shù)量眾多的寫好的DTD文件可以利用。針對不同的行業(yè)和應用,這些DTD文件已經建立了通用的元素和標簽規(guī)則。你不需要自己重新創(chuàng)建,只要在他們的基礎上加入你需要的新標識。 當然,如果愿意,你可以創(chuàng)建自己的DTD,它可能和你的文檔配合的更加完美。建立自己的DTD也是很簡單的一件事,一般只需要定義4-5個元素就可以了。 調用DTD文件的方法有兩種: 1.直接包含在XML文檔內的DTD 你只要在DOCTYPE聲明中插入一些特別的說明就可以了,象這樣: 我們有一個XML文檔: <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 我們在第一行后面插入下面代碼就可以: <!DOCTYPE myfile [ <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> <!ENTITY copyright "Copyright 2001, Ajie."> ]> 2.調用獨立的DTD文件 將DTD文檔存為.dtd的文件,然后在DOCTYPE聲明行中調用,例如,將下面的代碼存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 然后在XML文檔中調用,在第一行后插入: <!DOCTYPE myfile SYSTEM "myfile.dtd"> 我們可以看到DTD文檔和HTML中js的調用是差不多的,關于DTD文檔具體如何寫,我們將在下一章和XML文檔的語法一起介紹。 下面我們來了解DTD有關的術語: 1.Schema(規(guī)劃) schema是數(shù)據規(guī)則的描述。schema做兩件事: a.它定義元素數(shù)據類型和元素之間的關系; b.它定義元素所能包含的內容類型。 DTD就是關于XML文檔的一個schema。 2.Document Tree(文檔樹) "文檔樹"在前面第二章我們已經提到過,它是文檔元素分級結構的形象表示。一個文檔結構樹包含根元素,根元素是最頂級的元素,(就是緊接著XML聲明語句后的第一個元素)。看例子: <? <filelist> <myfile> <title>...</title> <author>...</author> </myfile> </filelist> 上面的例子分三級結構排列成"樹"狀,其中的<filelist>就是根元素。在XML和DTD文件中,第一個定義的都是根元素。 3.Parent Element(父元素)/Child Element(子元素) 父元素是指包含有其它元素的元素,被包含的元素稱為它的子元素??瓷厦娴?結構樹",其中<myfile>是父元素,<title>,<author>是它的子元素,而<myfile>又是<filelist>的子元素。象<title>這樣沒有包含任何子元素的最后一級元素我們也稱之為"頁元素"。 4.Parser(解析軟件) Parser是一種檢查XML文檔是否遵循DTD規(guī)范的工具軟件。 Parser能獨立使用,也可以成為編輯軟件或瀏覽器的一部分。在后面的相關資源列表里,我列出了當前比較流行的一些parsers。 好了,通過第三章的學習,我們已經了解了一些XML和DTD的基本術語,但是我們還不知道怎樣來寫這些文件,需要遵循什么樣的語法,在下一章,將重點介紹有關撰寫XML和DTD文檔的語法。請繼續(xù)瀏覽,謝謝! XML輕松學習手冊(4)XML語法 第四章 XML語法 提綱: 一.XML語法規(guī)則 二.元素的語法 三.注釋的語法 四.CDATA的語法 五.Namespaces的語法 六.entity的語法 七.DTD的語法 通過前面三章的學習,我們已經對什么是XML,它的實現(xiàn)原理以及相關的術語有所了解。接下來我們就開始學習XML的語法規(guī)范,動手寫自己的XML文檔。 一.XML語法規(guī)則 XML的文檔和HTML的原代碼類似,也是用標識來標識內容。創(chuàng)建XML文檔必須遵守下列重要規(guī)則: 規(guī)則1:必須有XML聲明語句 這一點我們在上一章學習時已經提到過。聲明是XML文檔的第一句,其格式如下: <? 聲明的作用是告訴瀏覽器或者其它處理程序:這個文檔是XML文檔。聲明語句中的version表示文檔遵守的XML規(guī)范的版本;standalone表示文檔是否附帶DTD文件,如果有,參數(shù)為no;encoding表示文檔所用的語言編碼,默認是UTF-8。 規(guī)則2:是否有DTD文件 如果文檔是一個"有效的 <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 規(guī)則3:注意你的大小寫 在XML文檔中,大小寫是有區(qū)別的。<P>和<p>是不同的標識。注意在寫元素時,前后標識大小寫要保持一樣。例如:<Author>ajie</Author>,寫成<Author>ajie</author>是錯誤的。 你最好養(yǎng)成一種習慣,或者全部大寫,或者全部小寫,或者大寫第一個字母。這樣可以減少因為大小寫不匹配產生的文檔錯誤。 規(guī)則4:給屬性值加引號 在HTML代碼里面,屬性值可以加引號,也可以不加。例如:<font color=red> 但是在XML中則規(guī)定,所有屬性值必須加引號(可以是單引號,也可以是雙引號),否則將被視為錯誤。 規(guī)則5:所有的標識必須有相應的結束標識 在HTML中,標識可能不是成對出現(xiàn)的,比?lt;br>。而在XML中規(guī)定,所有標識必須成對出現(xiàn),有一個開始標識,就必須有一個結束標識。否則將被視為錯誤。 規(guī)則6:所有的空標識也必須被關閉 空標識就是標識對之間沒有內容的標識。比如 ,<img>等標識。在XML中,規(guī)定所有的標識必須有結束標識,針對這樣的空標識,XML中處理的方法是在原標識最后加/,就可以了。例如: 應寫為<br />; <META name="keyXML, SGML, <IMG src= "cool.gif">應寫為<IMG src= "cool.gif" /> 第四章 XML語法 二.元素的語法 元素由一對標識以及其中的內容組成。就象這樣:ajie。元素的名稱和標識的名稱是一樣的。標識可以用屬性來進一步描述。 在XML中,沒有任何保留字,所以你可以隨心所欲的用任何詞語來作為元素名稱。但是也必須遵守下列規(guī)范: 1.名稱中可以包含字母、數(shù)字以及其它字母; 2.名稱不能以數(shù)字或"_" (下劃線)開頭; 3.名稱不能以字母 XML(或 XML 或 Xml ..)開頭 4.名稱中不能包含空格 5.名稱中間不能包含":"(冒號) 為了使元素更容易閱讀理解和操作,我們還有一些建議: 1.名稱中不要使用"."。因為在很多程序語言中,"."是作為對象的屬性,例如:font.color。同樣的原因"-"也最好不要用,必須使用的,以"_"代替; 2.名稱盡量簡短。 3.名稱的大小寫盡量采用同一標準。 4.名稱可以使用非英文字符,比如用中文。但是有些軟件可能不支持。(IE5目前是支持中文元素的。) 另外,補充一點關于屬性的說明。在word</font>將把word顯示為紅色。而在CSS或者XSL,我們在下面詳細講述。) 三.注釋的語法 注釋是為了便于閱讀和理解,在XML文檔添加的附加信息,將不會被程序解釋或則瀏覽器顯示。 注釋的語法如下: <!-- 這里是注釋信息 --> 可以看到,它和HTML中的注釋語法是一樣的,非常容易。養(yǎng)成良好的注釋習慣將使你的文檔更加便于維護,共享,看起來也更專業(yè)。 四.CDATA的語法 CDATA全稱character data,翻譯為字符數(shù)據。我們在寫 <![CDATA[這里放置需要顯示的字符]]> 例如: <![CDATA[<AUTHOR sex="female">ajie</AUTHOR>]]> 在頁面上顯示的內容將是"<AUTHOR sex="female">ajie</AUTHOR>" 第四章 XML語法 五.Namespaces的語法 Namespaces翻譯為名字空間。名字空間有什么作用呢?當我們在一個XML文檔中使用他人的或者多個DTD文件,就會出現(xiàn)這樣的矛盾:因為XML中標識都是自己創(chuàng)建的,在不同的DTD文件中,標識名可能相同但表示的含義不同,這就可能引起數(shù)據混亂。 比如在一個文檔<table>wood table</table>中<table>表示桌子, 而在另一個文檔<table>namelist</table>中<table>表示表格。如果我需要同時處理這兩個文檔,就會發(fā)生名字沖突。 了解決這個問題,我們引進了namespaces這個概念。namespaces通過給標識名稱加一個網址(URL)定位的方法來區(qū)別這些名稱相同的標識。 Namespaces同樣需要在XML文檔的開頭部分聲明,聲明的語法如下: <document 其中yourname是由你定義的namespaces的名稱,URL就是名字空間的網址。 假設上面的"桌子<table>"文檔來自http://www.zhuozi.com,我們就可以聲明為 <document http://www.zhuozi.com'> 然后在后面的標識中使用定義好的名字空間: <zhuozi:table>wood table</table> 這樣就將這兩個<table>區(qū)分開來。注意的是:設置URL并不是說這個標識真的要到那個網址去讀取,僅僅作為一種區(qū)別的標志而已。 六.entity的語法 entity翻譯為"實體"。它的作用類似 entity可以包含字符,文字等等,使用entity的好處在于:1.它可以減少差錯,文檔中多個相同的部分只需要輸入一遍就可以了。2.它提高維護效率。比如你有40個文檔都包含copyright的entity,如果需要修改這個copyright,不需要所有的文件都修改,只要改最初定義的entity語句就可以了。 XML定義了兩種類型的entity。一種是我們這里說的普通entity,在XML文檔中使用;另一種是參數(shù)entity,在DTD文件中使用。 entity的定義語法為: <!DOCTYPE filename [ <!ENTITY entity-name "entity-content" ] > 例如我要定義一段版權信息: <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved" ] > 如果我的版權信息內容和他人共享一個XML文件,也可以使用外部調用的方法,語法象這樣: <!DOCTYPE copyright [ <!ENTITY copyright SYSTEM "http://www.sample.com/copyright. ] > 定義好的entity在文檔中的引用語法為:&entity-name; 例如,上面定義的版權信息,調用時寫作?copyright; 完整的例子如下,你可以copy下來存為copyright.XML觀看實例: <? <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved"> ]> <myfile> <title>XML</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> ©right; </myfile> 第四章 XML語法 七.DTD的語法 DTD是"有效 1.設置元素 元素是XML文檔的基本組成部分。你要在DTD中定義一個元素,然后在XML文檔中使用。元素的定義語法為:<!ELEMENT DESCRIPTION (#PCDATA, DEFINITION)*> 說明: "<!ELEMENT" 是元素的聲明,說明你要定義的是一個元素; 聲明后面的"DESCRIPTION",是元素的名稱; "(#PCDATA, DEFINITION)*>"則是該元素的使用規(guī)則。規(guī)則定義了元素可以包含的內容以及相互的關系。下面的表格概要列出了元素的規(guī)則: 2.元素規(guī)則表: 此主題相關圖片如下: 另外,我們還可以為元素定義屬性,因為我們不推薦使用屬性,在這里就不詳細展開了。 最后,我們來總結一些前四章學習的內容,寫一個包含DTD,XML,以及Script的簡單實例,便于讀者理解: 1.將下面文件存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 2.然后建立XML文檔myfile.xml: <? <!DOCTYPE myfile SYSTEM "myfile.dtd"> <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 3.建立HTML文檔myfile.html <HTML> <head> <script language=" var nodes = XMLDoc.documentElement.childNodes; title.innerText = nodes.item(0).text; author.innerText = nodes.item(1).text; </script> <title>在HTML中調用XML數(shù)據</title> </head> <body bgcolor="#FFFFFF"> <b>標題: </b> <span id="title"></span><br> <b>作者: </b> <span id="author"></span><br> </body> </HTML> 4.用IE5.0以上瀏覽器打開myfile.HTML就可以看到效果了。 XML輕松學習手冊(5)XML實例解析 第五章:XML實例解析 提綱: 一:實例效果 二:實例解析 1.定義新標識。 2.建立XML文檔。 3.建立相應的HTML文件。 XML在不同領域有著廣泛的應用,比如在科技領域的MathML,無線通信應用的WML,在網絡圖象方面的SVG等等,我們這里側重討論XML在web上的應用。XML在web上應用主要是利用其強大的數(shù)據操作能力。一般用XML配合JavaScript和ASP等服務器端程序,可以實現(xiàn)網絡上幾乎所有的應用需求。 考慮講解方便,我們在下面介紹一個簡單的實例,不包含服務器端程序。目的在于讓您對XML的數(shù)據操作能力有一個感性的認識。 好,我們首先[ 點擊這里 ]來看實例的效果。(請用IE5.0以上版本瀏覽器打開) 這是一個簡單的CD唱片數(shù)據檢索功能。你通過點擊"上一張","下一張"可以看到單張CD的有關信息。這樣的效果我們原來用兩種方法可以實現(xiàn): 1.利用DHTML,將數(shù)據隱藏在不同的層中,通過鼠標事件依次顯示; 2.利用后臺程序(如ASP,CGI,PHP,JSP等),調用服務器端的數(shù)據。 但是在這個實例中,我們打開頁面原代碼可以看到,其中沒有用DHTML的DIV,也沒有表單的action,它完全是用XML來實現(xiàn)的。下面我們來分析它的制作過程: 第一步:定義新標識。 根據實際的CD數(shù)據,首先新建一個名為<CD>的標識;其次建立它相關的數(shù)據標識,分別是:CD名稱<Title>,演唱者<Artist>,出版年代<Year>,國家<Country>,發(fā)行公司<Company>和價格<Price>;最后還要建立一個名為目錄<CATALOG>的標識。為什么要再建立一個<CATALOG>標識呢?因為在XML文檔中規(guī)定,必須且只能有一個根元素(標識),我們有多個CD數(shù)據,這些數(shù)據是并列的關系,所以需要為這些并列的元素建立一個根元素。 以上元素的定義和關系都完全符合XML標準,不需要特別的DTD文件來定義,所以可以省略DTD定義。如果我們想使用DTD來定義,以上過程可以表示為: <!ELEMENT CATALOG (CD)*> <!ELEMENT CD (Title,Artist,Year,Country,Company,Price)> <!ELEMENT Title (#PCDATA)> <!ELEMENT Artist (#PCDATA)> <!ELEMENT Year (#PCDATA)> <!ELEMENT Country (#PCDATA)> <!ELEMENT Company (#PCDATA)> <!ELEMENT Price (#PCDATA)> 這段代碼表示:元素CATALOG包含多個CD子元素,而子元素CD又依次包含Title, Artist, Year, Country, Company, Price 六個子元素,它們的內容都定義為文本(字符,數(shù)字,文本)。(注:具體的語法說明可以看上一章關于DTD的介紹) 第二步:建立XML文檔。 <? <CATALOG> <CD> <TITLE>Empire Burlesque</TITLE> <ARTIST>Bob Dylan</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>Columbia</COMPANY> <PRICE>10.90</PRICE> <YEAR>1985</YEAR> </CD> <CD> <TITLE>Hide your heart</TITLE> <ARTIST>Bonnie Tylor</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>CBS Records</COMPANY> <PRICE>9.90</PRICE> <YEAR>1988</YEAR> </CD> <CD> <TITLE>Greatest Hits</TITLE> <ARTIST>Dolly Parton</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>RCA</COMPANY> <PRICE>9.90</PRICE> <YEAR>1982</YEAR> </CD> <CD> <TITLE>Still got the blues</TITLE> <ARTIST>Gary More</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>Virgin redords</COMPANY> <PRICE>10.20</PRICE> <YEAR>1990</YEAR> </CD> <CD> <TITLE>Eros</TITLE> <ARTIST>Eros Ramazzotti</ARTIST> <COUNTRY>EU</COUNTRY> <COMPANY>BMG</COMPANY> <PRICE>9.90</PRICE> <YEAR>1997</YEAR> </CD> </CATALOG> 上面代碼首先用<? <CATALOG> <CD> ...... </CD> <CD> ...... </CD> </CATALOG> 一共定義了5組數(shù)據。我們將上面的代碼存為cd.XML文件,以備調用。 第三步:建立相應的HTML文件。 1.導入XML數(shù)據。 我們知道,目前流行的瀏覽器中,暫時只有微軟的IE5.0以上版本瀏覽器支持XML。IE是通過在 CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> 定義一個object,ID名為XMLdso。然后在head區(qū)用js引入xml數(shù)據: <script for="window" event="onload"> </script> 2.捆綁數(shù)據。 然后將用<SPAN>標識來將XML數(shù)據綁定在表格中。其中ID,DATASRC,DTATFLD都是<SPAN>的屬性。代碼如下: <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> 3.動作操作。 最后,為數(shù)據提供瀏覽按鈕: <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> 并利用js來完成兩個鼠標點擊功能:movenext()和moveprevious()。在head區(qū)加入如下代碼: <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> 好,我們先看HTML文件的全部原代碼: <HTML> <head> <script for="window" event="onload"> </script> <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> <TITLE>CD Navigate</TITLE> </head> <body> <p> <object WIDTH="0" HEIGHT="0" CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> <p> <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> </p> </body> </HTML> 將以上代碼存為cd.htm文件,于第二步的cd.XML文件放在一起。打開cd.htm文件,你就看見和上面實例一樣的效果了。 好,到今天為止,我們已經學習了關于XML的不少知識,我們來總結一下前面五個章節(jié),分別是XML快速入門,XML的概念原理,XML的術語,XML的語法和本章的實例解析。到這里,教程部分就結束了。在寫作過程中,阿捷盡最大努力將有關XML概念講得通俗易懂,盡量把自己的理解告訴給大家,但因為本人學習XML時間也不長,對整個XML的技術把握還不夠系統(tǒng)和深入,所以難免有疏漏的地方,請大家指正和諒解,謝謝! posted on 2009-02-15 15:45 YXY 閱讀(187) 評論(0) 編輯 收藏
不論你是HTML,還是XML,標識的本質在于便于理解,如果沒有標識,你的文檔在計算機看來只是一個很長的字符串,每個字看起來都一樣,沒有重點之分。
通過標識,你的文檔才便于閱讀和理解,你可以劃分段落,列明標題。XML中,你更可以利用其擴展性 來為文檔建立更合適的標識。
不過,有一點要提醒大家注意:標識僅僅是用來識別信息,它本身并不傳達信息。例如這樣的HTML代碼:
<b>frist step<b> 這里<b>表示粗體,只用來說明是用粗體來顯示"frist step"字符,<b>本身并不包含任何實際的信息,在頁面上你看不到<b>,真正傳達信息的是"frist step "。
三.語言---使用XML你要遵循特定的語法來標識你的文檔。
在計算機領域,語言常常表示一?quot;程序語言",用來編程實現(xiàn)一些功能和應用,但不是所有的"語言"都是用來編程的,XML就只是一種用來定義標識和描述信息的語言。 下面我們來深入了解一下XML應用的其本原理,可能會很枯燥,但是對于整體的理解很重要,你可以先快速過一遍,心里有一個模糊的概念,具體精髓則需要在實踐中慢慢領會。 四.結構化---XML促使文檔結構化,所有的信息按某種關系排列。 "結構化"聽起來太抽象了,我們這樣理解,結構化就是為你的文檔建立一個框架,就象寫文章先寫一個提綱。結構化使你的文檔看起來不會雜亂無章,每一部分都緊密聯(lián)系,形成一個整體。 結構化有兩個原則: 1.每一部分(每一個元素)都和其他元素有關聯(lián)。關聯(lián)的級數(shù)就形成了結構。 2.標識本身的含義與它描述的信息相分離。 我們來看一個簡單的例子幫助理解: <? <myfile> <title>XML輕松學習手冊</title> <chapter>XML快速入門 <para>什么是XML</para> <para>使用XML的好處</para> </chapter> <chapter>XML的概念 <para>擴展性</para> <para>標識</para> </chapter> </myfile> 這是本文的XML描述文檔,可以看到標識分三級關聯(lián),非常清晰: <myfile> <chapter> <para> ... </para> </chapter> </myfile> 上面這樣的文檔結構,我們又稱之為"文檔樹",主干是父元素,如<myfile>,分支和頁是子元素,如<chapter>和<para>。 五.Meta數(shù)據(Metadata)---專業(yè)的XML使用者會使用meta數(shù)據來工作。 在HTML中我們知道可以使用meta標識來定義網頁的關鍵字,簡介等,這些標識不會顯示在網頁中,但可以被搜索引擎搜索到,并影響搜索結果的排列順序。 XML對這一原理進行了深化和擴展,用XML,你可以描述你的信息在哪里,你可以通過meta來驗證信息,執(zhí)行搜索,強制顯示,或者處理其他的數(shù)據。 下面是一些XML metadata在實際應用中的用途: 1.可以驗證數(shù)字簽名,使在線商務的提交動作(submission)有效。 2.可以被方便的建立索引和進行更有效搜索。 3.可以在不同語言之間傳輸數(shù)據。 W3C組織正在研究一種名為RDF(Resource Description Framework)的metadata處理方法,可以自動交換信息,W3C宣稱,使用RDF配合數(shù)字簽名,將使網絡中存在"真實可信"的電子商務。 六.顯示 單獨用XML不能顯示頁面,我們使用格式化技術,比如CSS或者XSL,才能顯示XML標記創(chuàng)建的文檔。 我們在前面第一章講到XML是將數(shù)據和格式分離的。XML文檔本身不知道如何來顯示,必須有輔助文件來幫助實現(xiàn)。(XML取消了所有標識,包括font,color,p等風格樣式定義標識,因此XML全部是采用類似DHTML中CSS的方法來定義文檔風格樣式。),XML中用來設定顯示風格樣式的文件類型有: 1.XSL XSL全稱是Extensible Stylesheet Language(可擴展樣式語言), 是將來設計XML文檔顯示樣式的主要文件類型。它本身也是基于XML語言的。使用XSL,你可以靈活的設置文檔顯示樣式,文檔將自動適應任何瀏覽器和PDA(掌上電腦)。 XSL也可以將XML轉化為HTML,那樣,老的瀏覽器也可以瀏覽XML文檔了。 2.CSS CSS大家很熟悉了,全稱是Cascading Style Sheets(層疊樣式表),是目前用來在瀏覽器上顯示XML文檔的主要方法。 3.Behaviors Behaviors現(xiàn)在還沒有成為標準。它是微軟的IE瀏覽器特有的功能,用它可以對XML標識設定一些有趣動作。 七.DOM DOM全稱是document object model(文檔對象模型),DOM是用來干什么的呢?假設把你的文檔看成一個單獨的對象,DOM就是如何用HTML或者XML對這個對象進行操作和控制的標準。 面向對象的思想方法已經非常流行了,在編程語言(例如java,js)中,都運用面向對象的編程思想。在XML中,就是要將網頁也作為一個對象來操作和控制,我們可以建立自己的對象和模板。與對象進行交流,如何命令對象,就要用到API。API全稱Application Programming Interface,它是訪問和操作對象的規(guī)則。而DOM就是一種詳細描述HTML/XML文檔對象規(guī)則的API。它規(guī)定了HTML/XML文檔對象的命名協(xié)定,程序模型,溝通規(guī)則等。在XML文檔中,我們可以將每一個標識元素看作一個對象---它有自己的名稱和屬性。 XML創(chuàng)建了標識,而DOM的作用就是告訴script如何在瀏覽器窗口中操作和顯示這些標識 上面我們已經簡要的講述了一些XML的基本原理,我們來看看它們之間的關聯(lián)以及它們是如何工作的,先看這里一張圖: 此主題相關圖片如下: 1. 2.CSS儲存并控制元素的顯示樣式。例如:標題將被以18pt字體顯示 3.script腳本控制元素如何動作。例如:當一個title元素"out of stock",將被用紅色顯示。 4.DOM則為腳本和對象的交流提供一個公共平臺,并將結果顯示在瀏覽器窗口。 如果任何一個部分發(fā)生錯誤,都不會得到正確結果。 好了,看到這里,我們已經對XML是如何工作的有一個整體的大致的概念。通過這一章的學習,我們可能感覺到XML似乎更偏向數(shù)據處理,更方便程序員學習。實際情況也是這樣的,XML設計的目的就是用來方便的共享和交互數(shù)據的。下一章,我們將系統(tǒng)的了解關于XML的各種術語。歡迎您繼續(xù)瀏覽。 XML輕松學習手冊(3)XML的術語 第三章 XML的術語 提綱: 導言 一.XML文檔的有關術語 二.DTD的有關術語 導言 初學XML最令人頭疼的就是有一大堆新的術語概念要理解。由于XML本身也是一個嶄新的技術,正在不斷發(fā)展和變化,各組織和各大網絡公司(微軟,IBM,SUN等)都在不斷推出自己的見解和標準,因此新概念漫天飛就不足為奇了。而國內又缺乏權威的機構或組織來對這些術語正式定名,你所看見的有關XML的中文教材大部分是靠作者本身的理解翻譯過來的,有些是正確的,有些是錯誤的,更加妨礙了我們對這些概念的理解和學習。 你下面將要看到的關于XML術語的解釋,也是作者本身的理解和翻譯。阿捷是以W3C組織發(fā)布的XML1.0標準規(guī)范和相關的正式說明文檔為根據來講述。可以確保這些理解是基本正確的,至少不是錯誤的。你如果想進一步閱讀和了解,我在本文的最后部分列明了相關資源的出處和鏈接,你可以直接訪問。好,我們轉入正題: 一.XML文檔的有關術語 什么是XML文檔?知道 <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> </myfile> XML文檔包含三個部分: 1. 一個XML文檔聲明; 2. 一個關于文檔類型的定義; 3. 用XML標識創(chuàng)建的內容。 舉例說明: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> <filelist> <myfile> <title>QUICK START OF XML</title> <author>ajie</author> </myfile> ...... </filelist> 其中第一行<? 我們來了解XML文檔中有關的術語: 1.Element(元素): 元素在HTML我們已經有所了解,它是組成HTML文檔的最小單位,在XML中也一樣。一個元素由一個標識來定義,包括開始和結束標識以及其中的內容,就象這樣:<author>ajie</author> 唯一不同的就是:在HTML中,標識是固定的,而在XML中,標識需要你自己創(chuàng)建。 2.Tag(標識) 標識是用來定義元素的。在XML中,標識必須成對出現(xiàn),將數(shù)據包圍在中間。標識的名稱和元素的名稱是一樣的。例如這樣一個元素: <author>ajie</author> 其中<author>就是標識。 3.Attribute(屬性): 什么是屬性?看這段word</font>。其中color就是font的屬性之一。 屬性是對標識進一步的描述和說明,一個標識可以有多個屬性,例如font的屬性還有size。XML中的屬性與HTML中的屬性是一樣的,每個屬性都有它自己的名字和數(shù)值,屬性是標識的一部分。舉例: <author sex="female">ajie</author> XML中屬性也是自己定義的,我們建議你盡量不使用屬性,而將屬性改成子元素,例如上面的代碼可以改成這樣: <author>ajie <sex>female</sex> </author> 原因是屬性不易擴充和被程序操作。 4.Declaration(聲明) 在所有XML文檔的第一行都有一個XML聲明。這個聲明表示這個文檔是一個XML文檔,它遵循的是哪個XML版本的規(guī)范。一個XML的聲明語句就象這樣: <? 5.DTD(文件類型定義) DTD是用來定義XML文檔中元素,屬性以及元素之間關系的。 通過DTD文件可以檢測XML文檔的結構是否正確。但建立XML文檔并不一定需要DTD文件。關于DTD文件的詳細說明我們將在下面單獨列項。 6.Well-formed XML(良好格式的XML) 一個遵守 良好格式的文檔必須以一個XML聲明開始,例如: <? 其中你必須說明文檔遵守的 良好格式的XML文檔必須有一個根元素,就是緊接著聲明后面建立的第一個元素,其它元素都是這個根元素的子元素,屬于根元素一組。 良好格式的XML文檔的內容書寫時必須遵守XML語法。(有關XML語法我們將在下一章仔細講解) 7.Valid XML(有效的XML) 一個遵守 將XML文檔和它的DTD文件進行比較分析,看是否符合DTD規(guī)則的過程叫validation(確認)。這樣的過程通常我們是通過一個名為parser的軟件來處理的。 有效的XML文檔也必須以一個XML聲明開始,例如: <? 和上面例子不同的,在standalone(獨立)屬性中,這里設置的是"no",因為它必須和相應的DTD一起使用,DTD文件的定義方法如下: <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 二.DTD的有關術語 什么是DTD,我們上面已經簡略提到。DTD是一種保證XML文檔格式正確的有效方法,可以比較XML文檔和DTD文件來看文檔是否符合規(guī)范,元素和標簽使用是否正確。一個DTD文檔包含:元素的定義規(guī)則,元素間關系的定義規(guī)則,元素可使用的屬性,可使用的實體或符號規(guī)則。 DTD文件也是一個ASCII的文本文件,后綴名為.dtd。例如:myfile.dtd。 為什么要用DTD文件呢?我的理解是它滿足了網絡共享和數(shù)據交互,使用DTD最大的好處在于DTD文件的共享。(就是上文DTD說明語句中的PUBLIC屬性)。比如,兩個相同行業(yè)不同地區(qū)的人使用同一個DTD文件來作為文檔創(chuàng)建規(guī)范,那么他們的數(shù)據就很容易交換和共享。網上有其他人想補充數(shù)據,也只需要根據公用的DTD規(guī)范來建立文檔,就立刻可以加入。 目前,已經有數(shù)量眾多的寫好的DTD文件可以利用。針對不同的行業(yè)和應用,這些DTD文件已經建立了通用的元素和標簽規(guī)則。你不需要自己重新創(chuàng)建,只要在他們的基礎上加入你需要的新標識。 當然,如果愿意,你可以創(chuàng)建自己的DTD,它可能和你的文檔配合的更加完美。建立自己的DTD也是很簡單的一件事,一般只需要定義4-5個元素就可以了。 調用DTD文件的方法有兩種: 1.直接包含在XML文檔內的DTD 你只要在DOCTYPE聲明中插入一些特別的說明就可以了,象這樣: 我們有一個XML文檔: <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 我們在第一行后面插入下面代碼就可以: <!DOCTYPE myfile [ <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> <!ENTITY copyright "Copyright 2001, Ajie."> ]> 2.調用獨立的DTD文件 將DTD文檔存為.dtd的文件,然后在DOCTYPE聲明行中調用,例如,將下面的代碼存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 然后在XML文檔中調用,在第一行后插入: <!DOCTYPE myfile SYSTEM "myfile.dtd"> 我們可以看到DTD文檔和HTML中js的調用是差不多的,關于DTD文檔具體如何寫,我們將在下一章和XML文檔的語法一起介紹。 下面我們來了解DTD有關的術語: 1.Schema(規(guī)劃) schema是數(shù)據規(guī)則的描述。schema做兩件事: a.它定義元素數(shù)據類型和元素之間的關系; b.它定義元素所能包含的內容類型。 DTD就是關于XML文檔的一個schema。 2.Document Tree(文檔樹) "文檔樹"在前面第二章我們已經提到過,它是文檔元素分級結構的形象表示。一個文檔結構樹包含根元素,根元素是最頂級的元素,(就是緊接著XML聲明語句后的第一個元素)。看例子: <? <filelist> <myfile> <title>...</title> <author>...</author> </myfile> </filelist> 上面的例子分三級結構排列成"樹"狀,其中的<filelist>就是根元素。在XML和DTD文件中,第一個定義的都是根元素。 3.Parent Element(父元素)/Child Element(子元素) 父元素是指包含有其它元素的元素,被包含的元素稱為它的子元素??瓷厦娴?結構樹",其中<myfile>是父元素,<title>,<author>是它的子元素,而<myfile>又是<filelist>的子元素。象<title>這樣沒有包含任何子元素的最后一級元素我們也稱之為"頁元素"。 4.Parser(解析軟件) Parser是一種檢查XML文檔是否遵循DTD規(guī)范的工具軟件。 Parser能獨立使用,也可以成為編輯軟件或瀏覽器的一部分。在后面的相關資源列表里,我列出了當前比較流行的一些parsers。 好了,通過第三章的學習,我們已經了解了一些XML和DTD的基本術語,但是我們還不知道怎樣來寫這些文件,需要遵循什么樣的語法,在下一章,將重點介紹有關撰寫XML和DTD文檔的語法。請繼續(xù)瀏覽,謝謝! XML輕松學習手冊(4)XML語法 第四章 XML語法 提綱: 一.XML語法規(guī)則 二.元素的語法 三.注釋的語法 四.CDATA的語法 五.Namespaces的語法 六.entity的語法 七.DTD的語法 通過前面三章的學習,我們已經對什么是XML,它的實現(xiàn)原理以及相關的術語有所了解。接下來我們就開始學習XML的語法規(guī)范,動手寫自己的XML文檔。 一.XML語法規(guī)則 XML的文檔和HTML的原代碼類似,也是用標識來標識內容。創(chuàng)建XML文檔必須遵守下列重要規(guī)則: 規(guī)則1:必須有XML聲明語句 這一點我們在上一章學習時已經提到過。聲明是XML文檔的第一句,其格式如下: <? 聲明的作用是告訴瀏覽器或者其它處理程序:這個文檔是XML文檔。聲明語句中的version表示文檔遵守的XML規(guī)范的版本;standalone表示文檔是否附帶DTD文件,如果有,參數(shù)為no;encoding表示文檔所用的語言編碼,默認是UTF-8。 規(guī)則2:是否有DTD文件 如果文檔是一個"有效的 <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 規(guī)則3:注意你的大小寫 在XML文檔中,大小寫是有區(qū)別的。<P>和<p>是不同的標識。注意在寫元素時,前后標識大小寫要保持一樣。例如:<Author>ajie</Author>,寫成<Author>ajie</author>是錯誤的。 你最好養(yǎng)成一種習慣,或者全部大寫,或者全部小寫,或者大寫第一個字母。這樣可以減少因為大小寫不匹配產生的文檔錯誤。 規(guī)則4:給屬性值加引號 在HTML代碼里面,屬性值可以加引號,也可以不加。例如:<font color=red> 但是在XML中則規(guī)定,所有屬性值必須加引號(可以是單引號,也可以是雙引號),否則將被視為錯誤。 規(guī)則5:所有的標識必須有相應的結束標識 在HTML中,標識可能不是成對出現(xiàn)的,比?lt;br>。而在XML中規(guī)定,所有標識必須成對出現(xiàn),有一個開始標識,就必須有一個結束標識。否則將被視為錯誤。 規(guī)則6:所有的空標識也必須被關閉 空標識就是標識對之間沒有內容的標識。比如 ,<img>等標識。在XML中,規(guī)定所有的標識必須有結束標識,針對這樣的空標識,XML中處理的方法是在原標識最后加/,就可以了。例如: 應寫為<br />; <META name="keyXML, SGML, <IMG src= "cool.gif">應寫為<IMG src= "cool.gif" /> 第四章 XML語法 二.元素的語法 元素由一對標識以及其中的內容組成。就象這樣:ajie。元素的名稱和標識的名稱是一樣的。標識可以用屬性來進一步描述。 在XML中,沒有任何保留字,所以你可以隨心所欲的用任何詞語來作為元素名稱。但是也必須遵守下列規(guī)范: 1.名稱中可以包含字母、數(shù)字以及其它字母; 2.名稱不能以數(shù)字或"_" (下劃線)開頭; 3.名稱不能以字母 XML(或 XML 或 Xml ..)開頭 4.名稱中不能包含空格 5.名稱中間不能包含":"(冒號) 為了使元素更容易閱讀理解和操作,我們還有一些建議: 1.名稱中不要使用"."。因為在很多程序語言中,"."是作為對象的屬性,例如:font.color。同樣的原因"-"也最好不要用,必須使用的,以"_"代替; 2.名稱盡量簡短。 3.名稱的大小寫盡量采用同一標準。 4.名稱可以使用非英文字符,比如用中文。但是有些軟件可能不支持。(IE5目前是支持中文元素的。) 另外,補充一點關于屬性的說明。在word</font>將把word顯示為紅色。而在CSS或者XSL,我們在下面詳細講述。) 三.注釋的語法 注釋是為了便于閱讀和理解,在XML文檔添加的附加信息,將不會被程序解釋或則瀏覽器顯示。 注釋的語法如下: <!-- 這里是注釋信息 --> 可以看到,它和HTML中的注釋語法是一樣的,非常容易。養(yǎng)成良好的注釋習慣將使你的文檔更加便于維護,共享,看起來也更專業(yè)。 四.CDATA的語法 CDATA全稱character data,翻譯為字符數(shù)據。我們在寫 <![CDATA[這里放置需要顯示的字符]]> 例如: <![CDATA[<AUTHOR sex="female">ajie</AUTHOR>]]> 在頁面上顯示的內容將是"<AUTHOR sex="female">ajie</AUTHOR>" 第四章 XML語法 五.Namespaces的語法 Namespaces翻譯為名字空間。名字空間有什么作用呢?當我們在一個XML文檔中使用他人的或者多個DTD文件,就會出現(xiàn)這樣的矛盾:因為XML中標識都是自己創(chuàng)建的,在不同的DTD文件中,標識名可能相同但表示的含義不同,這就可能引起數(shù)據混亂。 比如在一個文檔<table>wood table</table>中<table>表示桌子, 而在另一個文檔<table>namelist</table>中<table>表示表格。如果我需要同時處理這兩個文檔,就會發(fā)生名字沖突。 了解決這個問題,我們引進了namespaces這個概念。namespaces通過給標識名稱加一個網址(URL)定位的方法來區(qū)別這些名稱相同的標識。 Namespaces同樣需要在XML文檔的開頭部分聲明,聲明的語法如下: <document 其中yourname是由你定義的namespaces的名稱,URL就是名字空間的網址。 假設上面的"桌子<table>"文檔來自http://www.zhuozi.com,我們就可以聲明為 <document http://www.zhuozi.com'> 然后在后面的標識中使用定義好的名字空間: <zhuozi:table>wood table</table> 這樣就將這兩個<table>區(qū)分開來。注意的是:設置URL并不是說這個標識真的要到那個網址去讀取,僅僅作為一種區(qū)別的標志而已。 六.entity的語法 entity翻譯為"實體"。它的作用類似 entity可以包含字符,文字等等,使用entity的好處在于:1.它可以減少差錯,文檔中多個相同的部分只需要輸入一遍就可以了。2.它提高維護效率。比如你有40個文檔都包含copyright的entity,如果需要修改這個copyright,不需要所有的文件都修改,只要改最初定義的entity語句就可以了。 XML定義了兩種類型的entity。一種是我們這里說的普通entity,在XML文檔中使用;另一種是參數(shù)entity,在DTD文件中使用。 entity的定義語法為: <!DOCTYPE filename [ <!ENTITY entity-name "entity-content" ] > 例如我要定義一段版權信息: <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved" ] > 如果我的版權信息內容和他人共享一個XML文件,也可以使用外部調用的方法,語法象這樣: <!DOCTYPE copyright [ <!ENTITY copyright SYSTEM "http://www.sample.com/copyright. ] > 定義好的entity在文檔中的引用語法為:&entity-name; 例如,上面定義的版權信息,調用時寫作?copyright; 完整的例子如下,你可以copy下來存為copyright.XML觀看實例: <? <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved"> ]> <myfile> <title>XML</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> ©right; </myfile> 第四章 XML語法 七.DTD的語法 DTD是"有效 1.設置元素 元素是XML文檔的基本組成部分。你要在DTD中定義一個元素,然后在XML文檔中使用。元素的定義語法為:<!ELEMENT DESCRIPTION (#PCDATA, DEFINITION)*> 說明: "<!ELEMENT" 是元素的聲明,說明你要定義的是一個元素; 聲明后面的"DESCRIPTION",是元素的名稱; "(#PCDATA, DEFINITION)*>"則是該元素的使用規(guī)則。規(guī)則定義了元素可以包含的內容以及相互的關系。下面的表格概要列出了元素的規(guī)則: 2.元素規(guī)則表: 此主題相關圖片如下: 另外,我們還可以為元素定義屬性,因為我們不推薦使用屬性,在這里就不詳細展開了。 最后,我們來總結一些前四章學習的內容,寫一個包含DTD,XML,以及Script的簡單實例,便于讀者理解: 1.將下面文件存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 2.然后建立XML文檔myfile.xml: <? <!DOCTYPE myfile SYSTEM "myfile.dtd"> <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 3.建立HTML文檔myfile.html <HTML> <head> <script language=" var nodes = XMLDoc.documentElement.childNodes; title.innerText = nodes.item(0).text; author.innerText = nodes.item(1).text; </script> <title>在HTML中調用XML數(shù)據</title> </head> <body bgcolor="#FFFFFF"> <b>標題: </b> <span id="title"></span><br> <b>作者: </b> <span id="author"></span><br> </body> </HTML> 4.用IE5.0以上瀏覽器打開myfile.HTML就可以看到效果了。 XML輕松學習手冊(5)XML實例解析 第五章:XML實例解析 提綱: 一:實例效果 二:實例解析 1.定義新標識。 2.建立XML文檔。 3.建立相應的HTML文件。 XML在不同領域有著廣泛的應用,比如在科技領域的MathML,無線通信應用的WML,在網絡圖象方面的SVG等等,我們這里側重討論XML在web上的應用。XML在web上應用主要是利用其強大的數(shù)據操作能力。一般用XML配合JavaScript和ASP等服務器端程序,可以實現(xiàn)網絡上幾乎所有的應用需求。 考慮講解方便,我們在下面介紹一個簡單的實例,不包含服務器端程序。目的在于讓您對XML的數(shù)據操作能力有一個感性的認識。 好,我們首先[ 點擊這里 ]來看實例的效果。(請用IE5.0以上版本瀏覽器打開) 這是一個簡單的CD唱片數(shù)據檢索功能。你通過點擊"上一張","下一張"可以看到單張CD的有關信息。這樣的效果我們原來用兩種方法可以實現(xiàn): 1.利用DHTML,將數(shù)據隱藏在不同的層中,通過鼠標事件依次顯示; 2.利用后臺程序(如ASP,CGI,PHP,JSP等),調用服務器端的數(shù)據。 但是在這個實例中,我們打開頁面原代碼可以看到,其中沒有用DHTML的DIV,也沒有表單的action,它完全是用XML來實現(xiàn)的。下面我們來分析它的制作過程: 第一步:定義新標識。 根據實際的CD數(shù)據,首先新建一個名為<CD>的標識;其次建立它相關的數(shù)據標識,分別是:CD名稱<Title>,演唱者<Artist>,出版年代<Year>,國家<Country>,發(fā)行公司<Company>和價格<Price>;最后還要建立一個名為目錄<CATALOG>的標識。為什么要再建立一個<CATALOG>標識呢?因為在XML文檔中規(guī)定,必須且只能有一個根元素(標識),我們有多個CD數(shù)據,這些數(shù)據是并列的關系,所以需要為這些并列的元素建立一個根元素。 以上元素的定義和關系都完全符合XML標準,不需要特別的DTD文件來定義,所以可以省略DTD定義。如果我們想使用DTD來定義,以上過程可以表示為: <!ELEMENT CATALOG (CD)*> <!ELEMENT CD (Title,Artist,Year,Country,Company,Price)> <!ELEMENT Title (#PCDATA)> <!ELEMENT Artist (#PCDATA)> <!ELEMENT Year (#PCDATA)> <!ELEMENT Country (#PCDATA)> <!ELEMENT Company (#PCDATA)> <!ELEMENT Price (#PCDATA)> 這段代碼表示:元素CATALOG包含多個CD子元素,而子元素CD又依次包含Title, Artist, Year, Country, Company, Price 六個子元素,它們的內容都定義為文本(字符,數(shù)字,文本)。(注:具體的語法說明可以看上一章關于DTD的介紹) 第二步:建立XML文檔。 <? <CATALOG> <CD> <TITLE>Empire Burlesque</TITLE> <ARTIST>Bob Dylan</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>Columbia</COMPANY> <PRICE>10.90</PRICE> <YEAR>1985</YEAR> </CD> <CD> <TITLE>Hide your heart</TITLE> <ARTIST>Bonnie Tylor</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>CBS Records</COMPANY> <PRICE>9.90</PRICE> <YEAR>1988</YEAR> </CD> <CD> <TITLE>Greatest Hits</TITLE> <ARTIST>Dolly Parton</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>RCA</COMPANY> <PRICE>9.90</PRICE> <YEAR>1982</YEAR> </CD> <CD> <TITLE>Still got the blues</TITLE> <ARTIST>Gary More</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>Virgin redords</COMPANY> <PRICE>10.20</PRICE> <YEAR>1990</YEAR> </CD> <CD> <TITLE>Eros</TITLE> <ARTIST>Eros Ramazzotti</ARTIST> <COUNTRY>EU</COUNTRY> <COMPANY>BMG</COMPANY> <PRICE>9.90</PRICE> <YEAR>1997</YEAR> </CD> </CATALOG> 上面代碼首先用<? <CATALOG> <CD> ...... </CD> <CD> ...... </CD> </CATALOG> 一共定義了5組數(shù)據。我們將上面的代碼存為cd.XML文件,以備調用。 第三步:建立相應的HTML文件。 1.導入XML數(shù)據。 我們知道,目前流行的瀏覽器中,暫時只有微軟的IE5.0以上版本瀏覽器支持XML。IE是通過在 CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> 定義一個object,ID名為XMLdso。然后在head區(qū)用js引入xml數(shù)據: <script for="window" event="onload"> </script> 2.捆綁數(shù)據。 然后將用<SPAN>標識來將XML數(shù)據綁定在表格中。其中ID,DATASRC,DTATFLD都是<SPAN>的屬性。代碼如下: <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> 3.動作操作。 最后,為數(shù)據提供瀏覽按鈕: <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> 并利用js來完成兩個鼠標點擊功能:movenext()和moveprevious()。在head區(qū)加入如下代碼: <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> 好,我們先看HTML文件的全部原代碼: <HTML> <head> <script for="window" event="onload"> </script> <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> <TITLE>CD Navigate</TITLE> </head> <body> <p> <object WIDTH="0" HEIGHT="0" CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> <p> <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> </p> </body> </HTML> 將以上代碼存為cd.htm文件,于第二步的cd.XML文件放在一起。打開cd.htm文件,你就看見和上面實例一樣的效果了。 好,到今天為止,我們已經學習了關于XML的不少知識,我們來總結一下前面五個章節(jié),分別是XML快速入門,XML的概念原理,XML的術語,XML的語法和本章的實例解析。到這里,教程部分就結束了。在寫作過程中,阿捷盡最大努力將有關XML概念講得通俗易懂,盡量把自己的理解告訴給大家,但因為本人學習XML時間也不長,對整個XML的技術把握還不夠系統(tǒng)和深入,所以難免有疏漏的地方,請大家指正和諒解,謝謝! posted on 2009-02-15 15:45 YXY 閱讀(187) 評論(0) 編輯 收藏
在計算機領域,語言常常表示一?quot;程序語言",用來編程實現(xiàn)一些功能和應用,但不是所有的"語言"都是用來編程的,XML就只是一種用來定義標識和描述信息的語言。
下面我們來深入了解一下XML應用的其本原理,可能會很枯燥,但是對于整體的理解很重要,你可以先快速過一遍,心里有一個模糊的概念,具體精髓則需要在實踐中慢慢領會。
四.結構化---XML促使文檔結構化,所有的信息按某種關系排列。
"結構化"聽起來太抽象了,我們這樣理解,結構化就是為你的文檔建立一個框架,就象寫文章先寫一個提綱。結構化使你的文檔看起來不會雜亂無章,每一部分都緊密聯(lián)系,形成一個整體。
結構化有兩個原則: 1.每一部分(每一個元素)都和其他元素有關聯(lián)。關聯(lián)的級數(shù)就形成了結構。 2.標識本身的含義與它描述的信息相分離。
我們來看一個簡單的例子幫助理解: <? <myfile> <title>XML輕松學習手冊</title> <chapter>XML快速入門 <para>什么是XML</para> <para>使用XML的好處</para> </chapter> <chapter>XML的概念 <para>擴展性</para> <para>標識</para> </chapter> </myfile> 這是本文的XML描述文檔,可以看到標識分三級關聯(lián),非常清晰: <myfile> <chapter> <para> ... </para> </chapter> </myfile> 上面這樣的文檔結構,我們又稱之為"文檔樹",主干是父元素,如<myfile>,分支和頁是子元素,如<chapter>和<para>。
五.Meta數(shù)據(Metadata)---專業(yè)的XML使用者會使用meta數(shù)據來工作。
在HTML中我們知道可以使用meta標識來定義網頁的關鍵字,簡介等,這些標識不會顯示在網頁中,但可以被搜索引擎搜索到,并影響搜索結果的排列順序。
XML對這一原理進行了深化和擴展,用XML,你可以描述你的信息在哪里,你可以通過meta來驗證信息,執(zhí)行搜索,強制顯示,或者處理其他的數(shù)據。
下面是一些XML metadata在實際應用中的用途:
1.可以驗證數(shù)字簽名,使在線商務的提交動作(submission)有效。 2.可以被方便的建立索引和進行更有效搜索。 3.可以在不同語言之間傳輸數(shù)據。
W3C組織正在研究一種名為RDF(Resource Description Framework)的metadata處理方法,可以自動交換信息,W3C宣稱,使用RDF配合數(shù)字簽名,將使網絡中存在"真實可信"的電子商務。
六.顯示
單獨用XML不能顯示頁面,我們使用格式化技術,比如CSS或者XSL,才能顯示XML標記創(chuàng)建的文檔。
我們在前面第一章講到XML是將數(shù)據和格式分離的。XML文檔本身不知道如何來顯示,必須有輔助文件來幫助實現(xiàn)。(XML取消了所有標識,包括font,color,p等風格樣式定義標識,因此XML全部是采用類似DHTML中CSS的方法來定義文檔風格樣式。),XML中用來設定顯示風格樣式的文件類型有:
1.XSL
XSL全稱是Extensible Stylesheet Language(可擴展樣式語言), 是將來設計XML文檔顯示樣式的主要文件類型。它本身也是基于XML語言的。使用XSL,你可以靈活的設置文檔顯示樣式,文檔將自動適應任何瀏覽器和PDA(掌上電腦)。
XSL也可以將XML轉化為HTML,那樣,老的瀏覽器也可以瀏覽XML文檔了。
2.CSS
CSS大家很熟悉了,全稱是Cascading Style Sheets(層疊樣式表),是目前用來在瀏覽器上顯示XML文檔的主要方法。
3.Behaviors
Behaviors現(xiàn)在還沒有成為標準。它是微軟的IE瀏覽器特有的功能,用它可以對XML標識設定一些有趣動作。
七.DOM
DOM全稱是document object model(文檔對象模型),DOM是用來干什么的呢?假設把你的文檔看成一個單獨的對象,DOM就是如何用HTML或者XML對這個對象進行操作和控制的標準。
面向對象的思想方法已經非常流行了,在編程語言(例如java,js)中,都運用面向對象的編程思想。在XML中,就是要將網頁也作為一個對象來操作和控制,我們可以建立自己的對象和模板。與對象進行交流,如何命令對象,就要用到API。API全稱Application Programming Interface,它是訪問和操作對象的規(guī)則。而DOM就是一種詳細描述HTML/XML文檔對象規(guī)則的API。它規(guī)定了HTML/XML文檔對象的命名協(xié)定,程序模型,溝通規(guī)則等。在XML文檔中,我們可以將每一個標識元素看作一個對象---它有自己的名稱和屬性。
XML創(chuàng)建了標識,而DOM的作用就是告訴script如何在瀏覽器窗口中操作和顯示這些標識
上面我們已經簡要的講述了一些XML的基本原理,我們來看看它們之間的關聯(lián)以及它們是如何工作的,先看這里一張圖:
此主題相關圖片如下:
1. 2.CSS儲存并控制元素的顯示樣式。例如:標題將被以18pt字體顯示 3.script腳本控制元素如何動作。例如:當一個title元素"out of stock",將被用紅色顯示。 4.DOM則為腳本和對象的交流提供一個公共平臺,并將結果顯示在瀏覽器窗口。
如果任何一個部分發(fā)生錯誤,都不會得到正確結果。
好了,看到這里,我們已經對XML是如何工作的有一個整體的大致的概念。通過這一章的學習,我們可能感覺到XML似乎更偏向數(shù)據處理,更方便程序員學習。實際情況也是這樣的,XML設計的目的就是用來方便的共享和交互數(shù)據的。下一章,我們將系統(tǒng)的了解關于XML的各種術語。歡迎您繼續(xù)瀏覽。
XML輕松學習手冊(3)XML的術語
第三章 XML的術語
提綱:
一.XML文檔的有關術語
二.DTD的有關術語
初學XML最令人頭疼的就是有一大堆新的術語概念要理解。由于XML本身也是一個嶄新的技術,正在不斷發(fā)展和變化,各組織和各大網絡公司(微軟,IBM,SUN等)都在不斷推出自己的見解和標準,因此新概念漫天飛就不足為奇了。而國內又缺乏權威的機構或組織來對這些術語正式定名,你所看見的有關XML的中文教材大部分是靠作者本身的理解翻譯過來的,有些是正確的,有些是錯誤的,更加妨礙了我們對這些概念的理解和學習。
你下面將要看到的關于XML術語的解釋,也是作者本身的理解和翻譯。阿捷是以W3C組織發(fā)布的XML1.0標準規(guī)范和相關的正式說明文檔為根據來講述。可以確保這些理解是基本正確的,至少不是錯誤的。你如果想進一步閱讀和了解,我在本文的最后部分列明了相關資源的出處和鏈接,你可以直接訪問。好,我們轉入正題:
什么是XML文檔?知道 <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> </myfile> XML文檔包含三個部分: 1. 一個XML文檔聲明; 2. 一個關于文檔類型的定義; 3. 用XML標識創(chuàng)建的內容。 舉例說明: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> <filelist> <myfile> <title>QUICK START OF XML</title> <author>ajie</author> </myfile> ...... </filelist> 其中第一行<? 我們來了解XML文檔中有關的術語: 1.Element(元素): 元素在HTML我們已經有所了解,它是組成HTML文檔的最小單位,在XML中也一樣。一個元素由一個標識來定義,包括開始和結束標識以及其中的內容,就象這樣:<author>ajie</author> 唯一不同的就是:在HTML中,標識是固定的,而在XML中,標識需要你自己創(chuàng)建。 2.Tag(標識) 標識是用來定義元素的。在XML中,標識必須成對出現(xiàn),將數(shù)據包圍在中間。標識的名稱和元素的名稱是一樣的。例如這樣一個元素: <author>ajie</author> 其中<author>就是標識。 3.Attribute(屬性): 什么是屬性?看這段word</font>。其中color就是font的屬性之一。 屬性是對標識進一步的描述和說明,一個標識可以有多個屬性,例如font的屬性還有size。XML中的屬性與HTML中的屬性是一樣的,每個屬性都有它自己的名字和數(shù)值,屬性是標識的一部分。舉例: <author sex="female">ajie</author> XML中屬性也是自己定義的,我們建議你盡量不使用屬性,而將屬性改成子元素,例如上面的代碼可以改成這樣: <author>ajie <sex>female</sex> </author> 原因是屬性不易擴充和被程序操作。 4.Declaration(聲明) 在所有XML文檔的第一行都有一個XML聲明。這個聲明表示這個文檔是一個XML文檔,它遵循的是哪個XML版本的規(guī)范。一個XML的聲明語句就象這樣: <? 5.DTD(文件類型定義) DTD是用來定義XML文檔中元素,屬性以及元素之間關系的。 通過DTD文件可以檢測XML文檔的結構是否正確。但建立XML文檔并不一定需要DTD文件。關于DTD文件的詳細說明我們將在下面單獨列項。 6.Well-formed XML(良好格式的XML) 一個遵守 良好格式的文檔必須以一個XML聲明開始,例如: <? 其中你必須說明文檔遵守的 良好格式的XML文檔必須有一個根元素,就是緊接著聲明后面建立的第一個元素,其它元素都是這個根元素的子元素,屬于根元素一組。 良好格式的XML文檔的內容書寫時必須遵守XML語法。(有關XML語法我們將在下一章仔細講解) 7.Valid XML(有效的XML) 一個遵守 將XML文檔和它的DTD文件進行比較分析,看是否符合DTD規(guī)則的過程叫validation(確認)。這樣的過程通常我們是通過一個名為parser的軟件來處理的。 有效的XML文檔也必須以一個XML聲明開始,例如: <? 和上面例子不同的,在standalone(獨立)屬性中,這里設置的是"no",因為它必須和相應的DTD一起使用,DTD文件的定義方法如下: <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 二.DTD的有關術語 什么是DTD,我們上面已經簡略提到。DTD是一種保證XML文檔格式正確的有效方法,可以比較XML文檔和DTD文件來看文檔是否符合規(guī)范,元素和標簽使用是否正確。一個DTD文檔包含:元素的定義規(guī)則,元素間關系的定義規(guī)則,元素可使用的屬性,可使用的實體或符號規(guī)則。 DTD文件也是一個ASCII的文本文件,后綴名為.dtd。例如:myfile.dtd。 為什么要用DTD文件呢?我的理解是它滿足了網絡共享和數(shù)據交互,使用DTD最大的好處在于DTD文件的共享。(就是上文DTD說明語句中的PUBLIC屬性)。比如,兩個相同行業(yè)不同地區(qū)的人使用同一個DTD文件來作為文檔創(chuàng)建規(guī)范,那么他們的數(shù)據就很容易交換和共享。網上有其他人想補充數(shù)據,也只需要根據公用的DTD規(guī)范來建立文檔,就立刻可以加入。 目前,已經有數(shù)量眾多的寫好的DTD文件可以利用。針對不同的行業(yè)和應用,這些DTD文件已經建立了通用的元素和標簽規(guī)則。你不需要自己重新創(chuàng)建,只要在他們的基礎上加入你需要的新標識。 當然,如果愿意,你可以創(chuàng)建自己的DTD,它可能和你的文檔配合的更加完美。建立自己的DTD也是很簡單的一件事,一般只需要定義4-5個元素就可以了。 調用DTD文件的方法有兩種: 1.直接包含在XML文檔內的DTD 你只要在DOCTYPE聲明中插入一些特別的說明就可以了,象這樣: 我們有一個XML文檔: <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 我們在第一行后面插入下面代碼就可以: <!DOCTYPE myfile [ <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> <!ENTITY copyright "Copyright 2001, Ajie."> ]> 2.調用獨立的DTD文件 將DTD文檔存為.dtd的文件,然后在DOCTYPE聲明行中調用,例如,將下面的代碼存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 然后在XML文檔中調用,在第一行后插入: <!DOCTYPE myfile SYSTEM "myfile.dtd"> 我們可以看到DTD文檔和HTML中js的調用是差不多的,關于DTD文檔具體如何寫,我們將在下一章和XML文檔的語法一起介紹。 下面我們來了解DTD有關的術語: 1.Schema(規(guī)劃) schema是數(shù)據規(guī)則的描述。schema做兩件事: a.它定義元素數(shù)據類型和元素之間的關系; b.它定義元素所能包含的內容類型。 DTD就是關于XML文檔的一個schema。 2.Document Tree(文檔樹) "文檔樹"在前面第二章我們已經提到過,它是文檔元素分級結構的形象表示。一個文檔結構樹包含根元素,根元素是最頂級的元素,(就是緊接著XML聲明語句后的第一個元素)。看例子: <? <filelist> <myfile> <title>...</title> <author>...</author> </myfile> </filelist> 上面的例子分三級結構排列成"樹"狀,其中的<filelist>就是根元素。在XML和DTD文件中,第一個定義的都是根元素。 3.Parent Element(父元素)/Child Element(子元素) 父元素是指包含有其它元素的元素,被包含的元素稱為它的子元素??瓷厦娴?結構樹",其中<myfile>是父元素,<title>,<author>是它的子元素,而<myfile>又是<filelist>的子元素。象<title>這樣沒有包含任何子元素的最后一級元素我們也稱之為"頁元素"。 4.Parser(解析軟件) Parser是一種檢查XML文檔是否遵循DTD規(guī)范的工具軟件。 Parser能獨立使用,也可以成為編輯軟件或瀏覽器的一部分。在后面的相關資源列表里,我列出了當前比較流行的一些parsers。 好了,通過第三章的學習,我們已經了解了一些XML和DTD的基本術語,但是我們還不知道怎樣來寫這些文件,需要遵循什么樣的語法,在下一章,將重點介紹有關撰寫XML和DTD文檔的語法。請繼續(xù)瀏覽,謝謝! XML輕松學習手冊(4)XML語法 第四章 XML語法 提綱: 一.XML語法規(guī)則 二.元素的語法 三.注釋的語法 四.CDATA的語法 五.Namespaces的語法 六.entity的語法 七.DTD的語法 通過前面三章的學習,我們已經對什么是XML,它的實現(xiàn)原理以及相關的術語有所了解。接下來我們就開始學習XML的語法規(guī)范,動手寫自己的XML文檔。 一.XML語法規(guī)則 XML的文檔和HTML的原代碼類似,也是用標識來標識內容。創(chuàng)建XML文檔必須遵守下列重要規(guī)則: 規(guī)則1:必須有XML聲明語句 這一點我們在上一章學習時已經提到過。聲明是XML文檔的第一句,其格式如下: <? 聲明的作用是告訴瀏覽器或者其它處理程序:這個文檔是XML文檔。聲明語句中的version表示文檔遵守的XML規(guī)范的版本;standalone表示文檔是否附帶DTD文件,如果有,參數(shù)為no;encoding表示文檔所用的語言編碼,默認是UTF-8。 規(guī)則2:是否有DTD文件 如果文檔是一個"有效的 <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 規(guī)則3:注意你的大小寫 在XML文檔中,大小寫是有區(qū)別的。<P>和<p>是不同的標識。注意在寫元素時,前后標識大小寫要保持一樣。例如:<Author>ajie</Author>,寫成<Author>ajie</author>是錯誤的。 你最好養(yǎng)成一種習慣,或者全部大寫,或者全部小寫,或者大寫第一個字母。這樣可以減少因為大小寫不匹配產生的文檔錯誤。 規(guī)則4:給屬性值加引號 在HTML代碼里面,屬性值可以加引號,也可以不加。例如:<font color=red> 但是在XML中則規(guī)定,所有屬性值必須加引號(可以是單引號,也可以是雙引號),否則將被視為錯誤。 規(guī)則5:所有的標識必須有相應的結束標識 在HTML中,標識可能不是成對出現(xiàn)的,比?lt;br>。而在XML中規(guī)定,所有標識必須成對出現(xiàn),有一個開始標識,就必須有一個結束標識。否則將被視為錯誤。 規(guī)則6:所有的空標識也必須被關閉 空標識就是標識對之間沒有內容的標識。比如 ,<img>等標識。在XML中,規(guī)定所有的標識必須有結束標識,針對這樣的空標識,XML中處理的方法是在原標識最后加/,就可以了。例如: 應寫為<br />; <META name="keyXML, SGML, <IMG src= "cool.gif">應寫為<IMG src= "cool.gif" /> 第四章 XML語法 二.元素的語法 元素由一對標識以及其中的內容組成。就象這樣:ajie。元素的名稱和標識的名稱是一樣的。標識可以用屬性來進一步描述。 在XML中,沒有任何保留字,所以你可以隨心所欲的用任何詞語來作為元素名稱。但是也必須遵守下列規(guī)范: 1.名稱中可以包含字母、數(shù)字以及其它字母; 2.名稱不能以數(shù)字或"_" (下劃線)開頭; 3.名稱不能以字母 XML(或 XML 或 Xml ..)開頭 4.名稱中不能包含空格 5.名稱中間不能包含":"(冒號) 為了使元素更容易閱讀理解和操作,我們還有一些建議: 1.名稱中不要使用"."。因為在很多程序語言中,"."是作為對象的屬性,例如:font.color。同樣的原因"-"也最好不要用,必須使用的,以"_"代替; 2.名稱盡量簡短。 3.名稱的大小寫盡量采用同一標準。 4.名稱可以使用非英文字符,比如用中文。但是有些軟件可能不支持。(IE5目前是支持中文元素的。) 另外,補充一點關于屬性的說明。在word</font>將把word顯示為紅色。而在CSS或者XSL,我們在下面詳細講述。) 三.注釋的語法 注釋是為了便于閱讀和理解,在XML文檔添加的附加信息,將不會被程序解釋或則瀏覽器顯示。 注釋的語法如下: <!-- 這里是注釋信息 --> 可以看到,它和HTML中的注釋語法是一樣的,非常容易。養(yǎng)成良好的注釋習慣將使你的文檔更加便于維護,共享,看起來也更專業(yè)。 四.CDATA的語法 CDATA全稱character data,翻譯為字符數(shù)據。我們在寫 <![CDATA[這里放置需要顯示的字符]]> 例如: <![CDATA[<AUTHOR sex="female">ajie</AUTHOR>]]> 在頁面上顯示的內容將是"<AUTHOR sex="female">ajie</AUTHOR>" 第四章 XML語法 五.Namespaces的語法 Namespaces翻譯為名字空間。名字空間有什么作用呢?當我們在一個XML文檔中使用他人的或者多個DTD文件,就會出現(xiàn)這樣的矛盾:因為XML中標識都是自己創(chuàng)建的,在不同的DTD文件中,標識名可能相同但表示的含義不同,這就可能引起數(shù)據混亂。 比如在一個文檔<table>wood table</table>中<table>表示桌子, 而在另一個文檔<table>namelist</table>中<table>表示表格。如果我需要同時處理這兩個文檔,就會發(fā)生名字沖突。 了解決這個問題,我們引進了namespaces這個概念。namespaces通過給標識名稱加一個網址(URL)定位的方法來區(qū)別這些名稱相同的標識。 Namespaces同樣需要在XML文檔的開頭部分聲明,聲明的語法如下: <document 其中yourname是由你定義的namespaces的名稱,URL就是名字空間的網址。 假設上面的"桌子<table>"文檔來自http://www.zhuozi.com,我們就可以聲明為 <document http://www.zhuozi.com'> 然后在后面的標識中使用定義好的名字空間: <zhuozi:table>wood table</table> 這樣就將這兩個<table>區(qū)分開來。注意的是:設置URL并不是說這個標識真的要到那個網址去讀取,僅僅作為一種區(qū)別的標志而已。 六.entity的語法 entity翻譯為"實體"。它的作用類似 entity可以包含字符,文字等等,使用entity的好處在于:1.它可以減少差錯,文檔中多個相同的部分只需要輸入一遍就可以了。2.它提高維護效率。比如你有40個文檔都包含copyright的entity,如果需要修改這個copyright,不需要所有的文件都修改,只要改最初定義的entity語句就可以了。 XML定義了兩種類型的entity。一種是我們這里說的普通entity,在XML文檔中使用;另一種是參數(shù)entity,在DTD文件中使用。 entity的定義語法為: <!DOCTYPE filename [ <!ENTITY entity-name "entity-content" ] > 例如我要定義一段版權信息: <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved" ] > 如果我的版權信息內容和他人共享一個XML文件,也可以使用外部調用的方法,語法象這樣: <!DOCTYPE copyright [ <!ENTITY copyright SYSTEM "http://www.sample.com/copyright. ] > 定義好的entity在文檔中的引用語法為:&entity-name; 例如,上面定義的版權信息,調用時寫作?copyright; 完整的例子如下,你可以copy下來存為copyright.XML觀看實例: <? <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved"> ]> <myfile> <title>XML</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> ©right; </myfile> 第四章 XML語法 七.DTD的語法 DTD是"有效 1.設置元素 元素是XML文檔的基本組成部分。你要在DTD中定義一個元素,然后在XML文檔中使用。元素的定義語法為:<!ELEMENT DESCRIPTION (#PCDATA, DEFINITION)*> 說明: "<!ELEMENT" 是元素的聲明,說明你要定義的是一個元素; 聲明后面的"DESCRIPTION",是元素的名稱; "(#PCDATA, DEFINITION)*>"則是該元素的使用規(guī)則。規(guī)則定義了元素可以包含的內容以及相互的關系。下面的表格概要列出了元素的規(guī)則: 2.元素規(guī)則表: 此主題相關圖片如下: 另外,我們還可以為元素定義屬性,因為我們不推薦使用屬性,在這里就不詳細展開了。 最后,我們來總結一些前四章學習的內容,寫一個包含DTD,XML,以及Script的簡單實例,便于讀者理解: 1.將下面文件存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 2.然后建立XML文檔myfile.xml: <? <!DOCTYPE myfile SYSTEM "myfile.dtd"> <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 3.建立HTML文檔myfile.html <HTML> <head> <script language=" var nodes = XMLDoc.documentElement.childNodes; title.innerText = nodes.item(0).text; author.innerText = nodes.item(1).text; </script> <title>在HTML中調用XML數(shù)據</title> </head> <body bgcolor="#FFFFFF"> <b>標題: </b> <span id="title"></span><br> <b>作者: </b> <span id="author"></span><br> </body> </HTML> 4.用IE5.0以上瀏覽器打開myfile.HTML就可以看到效果了。 XML輕松學習手冊(5)XML實例解析 第五章:XML實例解析 提綱: 一:實例效果 二:實例解析 1.定義新標識。 2.建立XML文檔。 3.建立相應的HTML文件。 XML在不同領域有著廣泛的應用,比如在科技領域的MathML,無線通信應用的WML,在網絡圖象方面的SVG等等,我們這里側重討論XML在web上的應用。XML在web上應用主要是利用其強大的數(shù)據操作能力。一般用XML配合JavaScript和ASP等服務器端程序,可以實現(xiàn)網絡上幾乎所有的應用需求。 考慮講解方便,我們在下面介紹一個簡單的實例,不包含服務器端程序。目的在于讓您對XML的數(shù)據操作能力有一個感性的認識。 好,我們首先[ 點擊這里 ]來看實例的效果。(請用IE5.0以上版本瀏覽器打開) 這是一個簡單的CD唱片數(shù)據檢索功能。你通過點擊"上一張","下一張"可以看到單張CD的有關信息。這樣的效果我們原來用兩種方法可以實現(xiàn): 1.利用DHTML,將數(shù)據隱藏在不同的層中,通過鼠標事件依次顯示; 2.利用后臺程序(如ASP,CGI,PHP,JSP等),調用服務器端的數(shù)據。 但是在這個實例中,我們打開頁面原代碼可以看到,其中沒有用DHTML的DIV,也沒有表單的action,它完全是用XML來實現(xiàn)的。下面我們來分析它的制作過程: 第一步:定義新標識。 根據實際的CD數(shù)據,首先新建一個名為<CD>的標識;其次建立它相關的數(shù)據標識,分別是:CD名稱<Title>,演唱者<Artist>,出版年代<Year>,國家<Country>,發(fā)行公司<Company>和價格<Price>;最后還要建立一個名為目錄<CATALOG>的標識。為什么要再建立一個<CATALOG>標識呢?因為在XML文檔中規(guī)定,必須且只能有一個根元素(標識),我們有多個CD數(shù)據,這些數(shù)據是并列的關系,所以需要為這些并列的元素建立一個根元素。 以上元素的定義和關系都完全符合XML標準,不需要特別的DTD文件來定義,所以可以省略DTD定義。如果我們想使用DTD來定義,以上過程可以表示為: <!ELEMENT CATALOG (CD)*> <!ELEMENT CD (Title,Artist,Year,Country,Company,Price)> <!ELEMENT Title (#PCDATA)> <!ELEMENT Artist (#PCDATA)> <!ELEMENT Year (#PCDATA)> <!ELEMENT Country (#PCDATA)> <!ELEMENT Company (#PCDATA)> <!ELEMENT Price (#PCDATA)> 這段代碼表示:元素CATALOG包含多個CD子元素,而子元素CD又依次包含Title, Artist, Year, Country, Company, Price 六個子元素,它們的內容都定義為文本(字符,數(shù)字,文本)。(注:具體的語法說明可以看上一章關于DTD的介紹) 第二步:建立XML文檔。 <? <CATALOG> <CD> <TITLE>Empire Burlesque</TITLE> <ARTIST>Bob Dylan</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>Columbia</COMPANY> <PRICE>10.90</PRICE> <YEAR>1985</YEAR> </CD> <CD> <TITLE>Hide your heart</TITLE> <ARTIST>Bonnie Tylor</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>CBS Records</COMPANY> <PRICE>9.90</PRICE> <YEAR>1988</YEAR> </CD> <CD> <TITLE>Greatest Hits</TITLE> <ARTIST>Dolly Parton</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>RCA</COMPANY> <PRICE>9.90</PRICE> <YEAR>1982</YEAR> </CD> <CD> <TITLE>Still got the blues</TITLE> <ARTIST>Gary More</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>Virgin redords</COMPANY> <PRICE>10.20</PRICE> <YEAR>1990</YEAR> </CD> <CD> <TITLE>Eros</TITLE> <ARTIST>Eros Ramazzotti</ARTIST> <COUNTRY>EU</COUNTRY> <COMPANY>BMG</COMPANY> <PRICE>9.90</PRICE> <YEAR>1997</YEAR> </CD> </CATALOG> 上面代碼首先用<? <CATALOG> <CD> ...... </CD> <CD> ...... </CD> </CATALOG> 一共定義了5組數(shù)據。我們將上面的代碼存為cd.XML文件,以備調用。 第三步:建立相應的HTML文件。 1.導入XML數(shù)據。 我們知道,目前流行的瀏覽器中,暫時只有微軟的IE5.0以上版本瀏覽器支持XML。IE是通過在 CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> 定義一個object,ID名為XMLdso。然后在head區(qū)用js引入xml數(shù)據: <script for="window" event="onload"> </script> 2.捆綁數(shù)據。 然后將用<SPAN>標識來將XML數(shù)據綁定在表格中。其中ID,DATASRC,DTATFLD都是<SPAN>的屬性。代碼如下: <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> 3.動作操作。 最后,為數(shù)據提供瀏覽按鈕: <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> 并利用js來完成兩個鼠標點擊功能:movenext()和moveprevious()。在head區(qū)加入如下代碼: <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> 好,我們先看HTML文件的全部原代碼: <HTML> <head> <script for="window" event="onload"> </script> <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> <TITLE>CD Navigate</TITLE> </head> <body> <p> <object WIDTH="0" HEIGHT="0" CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> <p> <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> </p> </body> </HTML> 將以上代碼存為cd.htm文件,于第二步的cd.XML文件放在一起。打開cd.htm文件,你就看見和上面實例一樣的效果了。 好,到今天為止,我們已經學習了關于XML的不少知識,我們來總結一下前面五個章節(jié),分別是XML快速入門,XML的概念原理,XML的術語,XML的語法和本章的實例解析。到這里,教程部分就結束了。在寫作過程中,阿捷盡最大努力將有關XML概念講得通俗易懂,盡量把自己的理解告訴給大家,但因為本人學習XML時間也不長,對整個XML的技術把握還不夠系統(tǒng)和深入,所以難免有疏漏的地方,請大家指正和諒解,謝謝! posted on 2009-02-15 15:45 YXY 閱讀(187) 評論(0) 編輯 收藏
<? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> </myfile> XML文檔包含三個部分: 1. 一個XML文檔聲明; 2. 一個關于文檔類型的定義; 3. 用XML標識創(chuàng)建的內容。 舉例說明: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> <filelist> <myfile> <title>QUICK START OF XML</title> <author>ajie</author> </myfile> ...... </filelist> 其中第一行<? 我們來了解XML文檔中有關的術語: 1.Element(元素): 元素在HTML我們已經有所了解,它是組成HTML文檔的最小單位,在XML中也一樣。一個元素由一個標識來定義,包括開始和結束標識以及其中的內容,就象這樣:<author>ajie</author> 唯一不同的就是:在HTML中,標識是固定的,而在XML中,標識需要你自己創(chuàng)建。 2.Tag(標識) 標識是用來定義元素的。在XML中,標識必須成對出現(xiàn),將數(shù)據包圍在中間。標識的名稱和元素的名稱是一樣的。例如這樣一個元素: <author>ajie</author> 其中<author>就是標識。 3.Attribute(屬性): 什么是屬性?看這段word</font>。其中color就是font的屬性之一。 屬性是對標識進一步的描述和說明,一個標識可以有多個屬性,例如font的屬性還有size。XML中的屬性與HTML中的屬性是一樣的,每個屬性都有它自己的名字和數(shù)值,屬性是標識的一部分。舉例: <author sex="female">ajie</author> XML中屬性也是自己定義的,我們建議你盡量不使用屬性,而將屬性改成子元素,例如上面的代碼可以改成這樣: <author>ajie <sex>female</sex> </author> 原因是屬性不易擴充和被程序操作。 4.Declaration(聲明) 在所有XML文檔的第一行都有一個XML聲明。這個聲明表示這個文檔是一個XML文檔,它遵循的是哪個XML版本的規(guī)范。一個XML的聲明語句就象這樣: <? 5.DTD(文件類型定義) DTD是用來定義XML文檔中元素,屬性以及元素之間關系的。 通過DTD文件可以檢測XML文檔的結構是否正確。但建立XML文檔并不一定需要DTD文件。關于DTD文件的詳細說明我們將在下面單獨列項。 6.Well-formed XML(良好格式的XML) 一個遵守 良好格式的文檔必須以一個XML聲明開始,例如: <? 其中你必須說明文檔遵守的 良好格式的XML文檔必須有一個根元素,就是緊接著聲明后面建立的第一個元素,其它元素都是這個根元素的子元素,屬于根元素一組。 良好格式的XML文檔的內容書寫時必須遵守XML語法。(有關XML語法我們將在下一章仔細講解) 7.Valid XML(有效的XML) 一個遵守 將XML文檔和它的DTD文件進行比較分析,看是否符合DTD規(guī)則的過程叫validation(確認)。這樣的過程通常我們是通過一個名為parser的軟件來處理的。 有效的XML文檔也必須以一個XML聲明開始,例如: <? 和上面例子不同的,在standalone(獨立)屬性中,這里設置的是"no",因為它必須和相應的DTD一起使用,DTD文件的定義方法如下: <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 二.DTD的有關術語 什么是DTD,我們上面已經簡略提到。DTD是一種保證XML文檔格式正確的有效方法,可以比較XML文檔和DTD文件來看文檔是否符合規(guī)范,元素和標簽使用是否正確。一個DTD文檔包含:元素的定義規(guī)則,元素間關系的定義規(guī)則,元素可使用的屬性,可使用的實體或符號規(guī)則。 DTD文件也是一個ASCII的文本文件,后綴名為.dtd。例如:myfile.dtd。 為什么要用DTD文件呢?我的理解是它滿足了網絡共享和數(shù)據交互,使用DTD最大的好處在于DTD文件的共享。(就是上文DTD說明語句中的PUBLIC屬性)。比如,兩個相同行業(yè)不同地區(qū)的人使用同一個DTD文件來作為文檔創(chuàng)建規(guī)范,那么他們的數(shù)據就很容易交換和共享。網上有其他人想補充數(shù)據,也只需要根據公用的DTD規(guī)范來建立文檔,就立刻可以加入。 目前,已經有數(shù)量眾多的寫好的DTD文件可以利用。針對不同的行業(yè)和應用,這些DTD文件已經建立了通用的元素和標簽規(guī)則。你不需要自己重新創(chuàng)建,只要在他們的基礎上加入你需要的新標識。 當然,如果愿意,你可以創(chuàng)建自己的DTD,它可能和你的文檔配合的更加完美。建立自己的DTD也是很簡單的一件事,一般只需要定義4-5個元素就可以了。 調用DTD文件的方法有兩種: 1.直接包含在XML文檔內的DTD 你只要在DOCTYPE聲明中插入一些特別的說明就可以了,象這樣: 我們有一個XML文檔: <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 我們在第一行后面插入下面代碼就可以: <!DOCTYPE myfile [ <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> <!ENTITY copyright "Copyright 2001, Ajie."> ]> 2.調用獨立的DTD文件 將DTD文檔存為.dtd的文件,然后在DOCTYPE聲明行中調用,例如,將下面的代碼存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 然后在XML文檔中調用,在第一行后插入: <!DOCTYPE myfile SYSTEM "myfile.dtd"> 我們可以看到DTD文檔和HTML中js的調用是差不多的,關于DTD文檔具體如何寫,我們將在下一章和XML文檔的語法一起介紹。 下面我們來了解DTD有關的術語: 1.Schema(規(guī)劃) schema是數(shù)據規(guī)則的描述。schema做兩件事: a.它定義元素數(shù)據類型和元素之間的關系; b.它定義元素所能包含的內容類型。 DTD就是關于XML文檔的一個schema。 2.Document Tree(文檔樹) "文檔樹"在前面第二章我們已經提到過,它是文檔元素分級結構的形象表示。一個文檔結構樹包含根元素,根元素是最頂級的元素,(就是緊接著XML聲明語句后的第一個元素)。看例子: <? <filelist> <myfile> <title>...</title> <author>...</author> </myfile> </filelist> 上面的例子分三級結構排列成"樹"狀,其中的<filelist>就是根元素。在XML和DTD文件中,第一個定義的都是根元素。 3.Parent Element(父元素)/Child Element(子元素) 父元素是指包含有其它元素的元素,被包含的元素稱為它的子元素??瓷厦娴?結構樹",其中<myfile>是父元素,<title>,<author>是它的子元素,而<myfile>又是<filelist>的子元素。象<title>這樣沒有包含任何子元素的最后一級元素我們也稱之為"頁元素"。 4.Parser(解析軟件) Parser是一種檢查XML文檔是否遵循DTD規(guī)范的工具軟件。 Parser能獨立使用,也可以成為編輯軟件或瀏覽器的一部分。在后面的相關資源列表里,我列出了當前比較流行的一些parsers。 好了,通過第三章的學習,我們已經了解了一些XML和DTD的基本術語,但是我們還不知道怎樣來寫這些文件,需要遵循什么樣的語法,在下一章,將重點介紹有關撰寫XML和DTD文檔的語法。請繼續(xù)瀏覽,謝謝! XML輕松學習手冊(4)XML語法 第四章 XML語法 提綱: 一.XML語法規(guī)則 二.元素的語法 三.注釋的語法 四.CDATA的語法 五.Namespaces的語法 六.entity的語法 七.DTD的語法 通過前面三章的學習,我們已經對什么是XML,它的實現(xiàn)原理以及相關的術語有所了解。接下來我們就開始學習XML的語法規(guī)范,動手寫自己的XML文檔。 一.XML語法規(guī)則 XML的文檔和HTML的原代碼類似,也是用標識來標識內容。創(chuàng)建XML文檔必須遵守下列重要規(guī)則: 規(guī)則1:必須有XML聲明語句 這一點我們在上一章學習時已經提到過。聲明是XML文檔的第一句,其格式如下: <? 聲明的作用是告訴瀏覽器或者其它處理程序:這個文檔是XML文檔。聲明語句中的version表示文檔遵守的XML規(guī)范的版本;standalone表示文檔是否附帶DTD文件,如果有,參數(shù)為no;encoding表示文檔所用的語言編碼,默認是UTF-8。 規(guī)則2:是否有DTD文件 如果文檔是一個"有效的 <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 規(guī)則3:注意你的大小寫 在XML文檔中,大小寫是有區(qū)別的。<P>和<p>是不同的標識。注意在寫元素時,前后標識大小寫要保持一樣。例如:<Author>ajie</Author>,寫成<Author>ajie</author>是錯誤的。 你最好養(yǎng)成一種習慣,或者全部大寫,或者全部小寫,或者大寫第一個字母。這樣可以減少因為大小寫不匹配產生的文檔錯誤。 規(guī)則4:給屬性值加引號 在HTML代碼里面,屬性值可以加引號,也可以不加。例如:<font color=red> 但是在XML中則規(guī)定,所有屬性值必須加引號(可以是單引號,也可以是雙引號),否則將被視為錯誤。 規(guī)則5:所有的標識必須有相應的結束標識 在HTML中,標識可能不是成對出現(xiàn)的,比?lt;br>。而在XML中規(guī)定,所有標識必須成對出現(xiàn),有一個開始標識,就必須有一個結束標識。否則將被視為錯誤。 規(guī)則6:所有的空標識也必須被關閉 空標識就是標識對之間沒有內容的標識。比如 ,<img>等標識。在XML中,規(guī)定所有的標識必須有結束標識,針對這樣的空標識,XML中處理的方法是在原標識最后加/,就可以了。例如: 應寫為<br />; <META name="keyXML, SGML, <IMG src= "cool.gif">應寫為<IMG src= "cool.gif" /> 第四章 XML語法 二.元素的語法 元素由一對標識以及其中的內容組成。就象這樣:ajie。元素的名稱和標識的名稱是一樣的。標識可以用屬性來進一步描述。 在XML中,沒有任何保留字,所以你可以隨心所欲的用任何詞語來作為元素名稱。但是也必須遵守下列規(guī)范: 1.名稱中可以包含字母、數(shù)字以及其它字母; 2.名稱不能以數(shù)字或"_" (下劃線)開頭; 3.名稱不能以字母 XML(或 XML 或 Xml ..)開頭 4.名稱中不能包含空格 5.名稱中間不能包含":"(冒號) 為了使元素更容易閱讀理解和操作,我們還有一些建議: 1.名稱中不要使用"."。因為在很多程序語言中,"."是作為對象的屬性,例如:font.color。同樣的原因"-"也最好不要用,必須使用的,以"_"代替; 2.名稱盡量簡短。 3.名稱的大小寫盡量采用同一標準。 4.名稱可以使用非英文字符,比如用中文。但是有些軟件可能不支持。(IE5目前是支持中文元素的。) 另外,補充一點關于屬性的說明。在word</font>將把word顯示為紅色。而在CSS或者XSL,我們在下面詳細講述。) 三.注釋的語法 注釋是為了便于閱讀和理解,在XML文檔添加的附加信息,將不會被程序解釋或則瀏覽器顯示。 注釋的語法如下: <!-- 這里是注釋信息 --> 可以看到,它和HTML中的注釋語法是一樣的,非常容易。養(yǎng)成良好的注釋習慣將使你的文檔更加便于維護,共享,看起來也更專業(yè)。 四.CDATA的語法 CDATA全稱character data,翻譯為字符數(shù)據。我們在寫 <![CDATA[這里放置需要顯示的字符]]> 例如: <![CDATA[<AUTHOR sex="female">ajie</AUTHOR>]]> 在頁面上顯示的內容將是"<AUTHOR sex="female">ajie</AUTHOR>" 第四章 XML語法 五.Namespaces的語法 Namespaces翻譯為名字空間。名字空間有什么作用呢?當我們在一個XML文檔中使用他人的或者多個DTD文件,就會出現(xiàn)這樣的矛盾:因為XML中標識都是自己創(chuàng)建的,在不同的DTD文件中,標識名可能相同但表示的含義不同,這就可能引起數(shù)據混亂。 比如在一個文檔<table>wood table</table>中<table>表示桌子, 而在另一個文檔<table>namelist</table>中<table>表示表格。如果我需要同時處理這兩個文檔,就會發(fā)生名字沖突。 了解決這個問題,我們引進了namespaces這個概念。namespaces通過給標識名稱加一個網址(URL)定位的方法來區(qū)別這些名稱相同的標識。 Namespaces同樣需要在XML文檔的開頭部分聲明,聲明的語法如下: <document 其中yourname是由你定義的namespaces的名稱,URL就是名字空間的網址。 假設上面的"桌子<table>"文檔來自http://www.zhuozi.com,我們就可以聲明為 <document http://www.zhuozi.com'> 然后在后面的標識中使用定義好的名字空間: <zhuozi:table>wood table</table> 這樣就將這兩個<table>區(qū)分開來。注意的是:設置URL并不是說這個標識真的要到那個網址去讀取,僅僅作為一種區(qū)別的標志而已。 六.entity的語法 entity翻譯為"實體"。它的作用類似 entity可以包含字符,文字等等,使用entity的好處在于:1.它可以減少差錯,文檔中多個相同的部分只需要輸入一遍就可以了。2.它提高維護效率。比如你有40個文檔都包含copyright的entity,如果需要修改這個copyright,不需要所有的文件都修改,只要改最初定義的entity語句就可以了。 XML定義了兩種類型的entity。一種是我們這里說的普通entity,在XML文檔中使用;另一種是參數(shù)entity,在DTD文件中使用。 entity的定義語法為: <!DOCTYPE filename [ <!ENTITY entity-name "entity-content" ] > 例如我要定義一段版權信息: <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved" ] > 如果我的版權信息內容和他人共享一個XML文件,也可以使用外部調用的方法,語法象這樣: <!DOCTYPE copyright [ <!ENTITY copyright SYSTEM "http://www.sample.com/copyright. ] > 定義好的entity在文檔中的引用語法為:&entity-name; 例如,上面定義的版權信息,調用時寫作?copyright; 完整的例子如下,你可以copy下來存為copyright.XML觀看實例: <? <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved"> ]> <myfile> <title>XML</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> ©right; </myfile> 第四章 XML語法 七.DTD的語法 DTD是"有效 1.設置元素 元素是XML文檔的基本組成部分。你要在DTD中定義一個元素,然后在XML文檔中使用。元素的定義語法為:<!ELEMENT DESCRIPTION (#PCDATA, DEFINITION)*> 說明: "<!ELEMENT" 是元素的聲明,說明你要定義的是一個元素; 聲明后面的"DESCRIPTION",是元素的名稱; "(#PCDATA, DEFINITION)*>"則是該元素的使用規(guī)則。規(guī)則定義了元素可以包含的內容以及相互的關系。下面的表格概要列出了元素的規(guī)則: 2.元素規(guī)則表: 此主題相關圖片如下: 另外,我們還可以為元素定義屬性,因為我們不推薦使用屬性,在這里就不詳細展開了。 最后,我們來總結一些前四章學習的內容,寫一個包含DTD,XML,以及Script的簡單實例,便于讀者理解: 1.將下面文件存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 2.然后建立XML文檔myfile.xml: <? <!DOCTYPE myfile SYSTEM "myfile.dtd"> <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 3.建立HTML文檔myfile.html <HTML> <head> <script language=" var nodes = XMLDoc.documentElement.childNodes; title.innerText = nodes.item(0).text; author.innerText = nodes.item(1).text; </script> <title>在HTML中調用XML數(shù)據</title> </head> <body bgcolor="#FFFFFF"> <b>標題: </b> <span id="title"></span><br> <b>作者: </b> <span id="author"></span><br> </body> </HTML> 4.用IE5.0以上瀏覽器打開myfile.HTML就可以看到效果了。 XML輕松學習手冊(5)XML實例解析 第五章:XML實例解析 提綱: 一:實例效果 二:實例解析 1.定義新標識。 2.建立XML文檔。 3.建立相應的HTML文件。 XML在不同領域有著廣泛的應用,比如在科技領域的MathML,無線通信應用的WML,在網絡圖象方面的SVG等等,我們這里側重討論XML在web上的應用。XML在web上應用主要是利用其強大的數(shù)據操作能力。一般用XML配合JavaScript和ASP等服務器端程序,可以實現(xiàn)網絡上幾乎所有的應用需求。 考慮講解方便,我們在下面介紹一個簡單的實例,不包含服務器端程序。目的在于讓您對XML的數(shù)據操作能力有一個感性的認識。 好,我們首先[ 點擊這里 ]來看實例的效果。(請用IE5.0以上版本瀏覽器打開) 這是一個簡單的CD唱片數(shù)據檢索功能。你通過點擊"上一張","下一張"可以看到單張CD的有關信息。這樣的效果我們原來用兩種方法可以實現(xiàn): 1.利用DHTML,將數(shù)據隱藏在不同的層中,通過鼠標事件依次顯示; 2.利用后臺程序(如ASP,CGI,PHP,JSP等),調用服務器端的數(shù)據。 但是在這個實例中,我們打開頁面原代碼可以看到,其中沒有用DHTML的DIV,也沒有表單的action,它完全是用XML來實現(xiàn)的。下面我們來分析它的制作過程: 第一步:定義新標識。 根據實際的CD數(shù)據,首先新建一個名為<CD>的標識;其次建立它相關的數(shù)據標識,分別是:CD名稱<Title>,演唱者<Artist>,出版年代<Year>,國家<Country>,發(fā)行公司<Company>和價格<Price>;最后還要建立一個名為目錄<CATALOG>的標識。為什么要再建立一個<CATALOG>標識呢?因為在XML文檔中規(guī)定,必須且只能有一個根元素(標識),我們有多個CD數(shù)據,這些數(shù)據是并列的關系,所以需要為這些并列的元素建立一個根元素。 以上元素的定義和關系都完全符合XML標準,不需要特別的DTD文件來定義,所以可以省略DTD定義。如果我們想使用DTD來定義,以上過程可以表示為: <!ELEMENT CATALOG (CD)*> <!ELEMENT CD (Title,Artist,Year,Country,Company,Price)> <!ELEMENT Title (#PCDATA)> <!ELEMENT Artist (#PCDATA)> <!ELEMENT Year (#PCDATA)> <!ELEMENT Country (#PCDATA)> <!ELEMENT Company (#PCDATA)> <!ELEMENT Price (#PCDATA)> 這段代碼表示:元素CATALOG包含多個CD子元素,而子元素CD又依次包含Title, Artist, Year, Country, Company, Price 六個子元素,它們的內容都定義為文本(字符,數(shù)字,文本)。(注:具體的語法說明可以看上一章關于DTD的介紹) 第二步:建立XML文檔。 <? <CATALOG> <CD> <TITLE>Empire Burlesque</TITLE> <ARTIST>Bob Dylan</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>Columbia</COMPANY> <PRICE>10.90</PRICE> <YEAR>1985</YEAR> </CD> <CD> <TITLE>Hide your heart</TITLE> <ARTIST>Bonnie Tylor</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>CBS Records</COMPANY> <PRICE>9.90</PRICE> <YEAR>1988</YEAR> </CD> <CD> <TITLE>Greatest Hits</TITLE> <ARTIST>Dolly Parton</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>RCA</COMPANY> <PRICE>9.90</PRICE> <YEAR>1982</YEAR> </CD> <CD> <TITLE>Still got the blues</TITLE> <ARTIST>Gary More</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>Virgin redords</COMPANY> <PRICE>10.20</PRICE> <YEAR>1990</YEAR> </CD> <CD> <TITLE>Eros</TITLE> <ARTIST>Eros Ramazzotti</ARTIST> <COUNTRY>EU</COUNTRY> <COMPANY>BMG</COMPANY> <PRICE>9.90</PRICE> <YEAR>1997</YEAR> </CD> </CATALOG> 上面代碼首先用<? <CATALOG> <CD> ...... </CD> <CD> ...... </CD> </CATALOG> 一共定義了5組數(shù)據。我們將上面的代碼存為cd.XML文件,以備調用。 第三步:建立相應的HTML文件。 1.導入XML數(shù)據。 我們知道,目前流行的瀏覽器中,暫時只有微軟的IE5.0以上版本瀏覽器支持XML。IE是通過在 CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> 定義一個object,ID名為XMLdso。然后在head區(qū)用js引入xml數(shù)據: <script for="window" event="onload"> </script> 2.捆綁數(shù)據。 然后將用<SPAN>標識來將XML數(shù)據綁定在表格中。其中ID,DATASRC,DTATFLD都是<SPAN>的屬性。代碼如下: <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> 3.動作操作。 最后,為數(shù)據提供瀏覽按鈕: <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> 并利用js來完成兩個鼠標點擊功能:movenext()和moveprevious()。在head區(qū)加入如下代碼: <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> 好,我們先看HTML文件的全部原代碼: <HTML> <head> <script for="window" event="onload"> </script> <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> <TITLE>CD Navigate</TITLE> </head> <body> <p> <object WIDTH="0" HEIGHT="0" CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> <p> <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> </p> </body> </HTML> 將以上代碼存為cd.htm文件,于第二步的cd.XML文件放在一起。打開cd.htm文件,你就看見和上面實例一樣的效果了。 好,到今天為止,我們已經學習了關于XML的不少知識,我們來總結一下前面五個章節(jié),分別是XML快速入門,XML的概念原理,XML的術語,XML的語法和本章的實例解析。到這里,教程部分就結束了。在寫作過程中,阿捷盡最大努力將有關XML概念講得通俗易懂,盡量把自己的理解告訴給大家,但因為本人學習XML時間也不長,對整個XML的技術把握還不夠系統(tǒng)和深入,所以難免有疏漏的地方,請大家指正和諒解,謝謝! posted on 2009-02-15 15:45 YXY 閱讀(187) 評論(0) 編輯 收藏
XML文檔包含三個部分:
1. 一個XML文檔聲明;
2. 一個關于文檔類型的定義;
3. 用XML標識創(chuàng)建的內容。
舉例說明:
<? <!DOCTYPE filelist SYSTEM "filelist.dtd"> <filelist> <myfile> <title>QUICK START OF XML</title> <author>ajie</author> </myfile> ...... </filelist> 其中第一行<? 我們來了解XML文檔中有關的術語: 1.Element(元素): 元素在HTML我們已經有所了解,它是組成HTML文檔的最小單位,在XML中也一樣。一個元素由一個標識來定義,包括開始和結束標識以及其中的內容,就象這樣:<author>ajie</author> 唯一不同的就是:在HTML中,標識是固定的,而在XML中,標識需要你自己創(chuàng)建。 2.Tag(標識) 標識是用來定義元素的。在XML中,標識必須成對出現(xiàn),將數(shù)據包圍在中間。標識的名稱和元素的名稱是一樣的。例如這樣一個元素: <author>ajie</author> 其中<author>就是標識。 3.Attribute(屬性): 什么是屬性?看這段word</font>。其中color就是font的屬性之一。 屬性是對標識進一步的描述和說明,一個標識可以有多個屬性,例如font的屬性還有size。XML中的屬性與HTML中的屬性是一樣的,每個屬性都有它自己的名字和數(shù)值,屬性是標識的一部分。舉例: <author sex="female">ajie</author> XML中屬性也是自己定義的,我們建議你盡量不使用屬性,而將屬性改成子元素,例如上面的代碼可以改成這樣: <author>ajie <sex>female</sex> </author> 原因是屬性不易擴充和被程序操作。 4.Declaration(聲明) 在所有XML文檔的第一行都有一個XML聲明。這個聲明表示這個文檔是一個XML文檔,它遵循的是哪個XML版本的規(guī)范。一個XML的聲明語句就象這樣: <? 5.DTD(文件類型定義) DTD是用來定義XML文檔中元素,屬性以及元素之間關系的。 通過DTD文件可以檢測XML文檔的結構是否正確。但建立XML文檔并不一定需要DTD文件。關于DTD文件的詳細說明我們將在下面單獨列項。 6.Well-formed XML(良好格式的XML) 一個遵守 良好格式的文檔必須以一個XML聲明開始,例如: <? 其中你必須說明文檔遵守的 良好格式的XML文檔必須有一個根元素,就是緊接著聲明后面建立的第一個元素,其它元素都是這個根元素的子元素,屬于根元素一組。 良好格式的XML文檔的內容書寫時必須遵守XML語法。(有關XML語法我們將在下一章仔細講解) 7.Valid XML(有效的XML) 一個遵守 將XML文檔和它的DTD文件進行比較分析,看是否符合DTD規(guī)則的過程叫validation(確認)。這樣的過程通常我們是通過一個名為parser的軟件來處理的。 有效的XML文檔也必須以一個XML聲明開始,例如: <? 和上面例子不同的,在standalone(獨立)屬性中,這里設置的是"no",因為它必須和相應的DTD一起使用,DTD文件的定義方法如下: <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 二.DTD的有關術語 什么是DTD,我們上面已經簡略提到。DTD是一種保證XML文檔格式正確的有效方法,可以比較XML文檔和DTD文件來看文檔是否符合規(guī)范,元素和標簽使用是否正確。一個DTD文檔包含:元素的定義規(guī)則,元素間關系的定義規(guī)則,元素可使用的屬性,可使用的實體或符號規(guī)則。 DTD文件也是一個ASCII的文本文件,后綴名為.dtd。例如:myfile.dtd。 為什么要用DTD文件呢?我的理解是它滿足了網絡共享和數(shù)據交互,使用DTD最大的好處在于DTD文件的共享。(就是上文DTD說明語句中的PUBLIC屬性)。比如,兩個相同行業(yè)不同地區(qū)的人使用同一個DTD文件來作為文檔創(chuàng)建規(guī)范,那么他們的數(shù)據就很容易交換和共享。網上有其他人想補充數(shù)據,也只需要根據公用的DTD規(guī)范來建立文檔,就立刻可以加入。 目前,已經有數(shù)量眾多的寫好的DTD文件可以利用。針對不同的行業(yè)和應用,這些DTD文件已經建立了通用的元素和標簽規(guī)則。你不需要自己重新創(chuàng)建,只要在他們的基礎上加入你需要的新標識。 當然,如果愿意,你可以創(chuàng)建自己的DTD,它可能和你的文檔配合的更加完美。建立自己的DTD也是很簡單的一件事,一般只需要定義4-5個元素就可以了。 調用DTD文件的方法有兩種: 1.直接包含在XML文檔內的DTD 你只要在DOCTYPE聲明中插入一些特別的說明就可以了,象這樣: 我們有一個XML文檔: <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 我們在第一行后面插入下面代碼就可以: <!DOCTYPE myfile [ <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> <!ENTITY copyright "Copyright 2001, Ajie."> ]> 2.調用獨立的DTD文件 將DTD文檔存為.dtd的文件,然后在DOCTYPE聲明行中調用,例如,將下面的代碼存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 然后在XML文檔中調用,在第一行后插入: <!DOCTYPE myfile SYSTEM "myfile.dtd"> 我們可以看到DTD文檔和HTML中js的調用是差不多的,關于DTD文檔具體如何寫,我們將在下一章和XML文檔的語法一起介紹。 下面我們來了解DTD有關的術語: 1.Schema(規(guī)劃) schema是數(shù)據規(guī)則的描述。schema做兩件事: a.它定義元素數(shù)據類型和元素之間的關系; b.它定義元素所能包含的內容類型。 DTD就是關于XML文檔的一個schema。 2.Document Tree(文檔樹) "文檔樹"在前面第二章我們已經提到過,它是文檔元素分級結構的形象表示。一個文檔結構樹包含根元素,根元素是最頂級的元素,(就是緊接著XML聲明語句后的第一個元素)。看例子: <? <filelist> <myfile> <title>...</title> <author>...</author> </myfile> </filelist> 上面的例子分三級結構排列成"樹"狀,其中的<filelist>就是根元素。在XML和DTD文件中,第一個定義的都是根元素。 3.Parent Element(父元素)/Child Element(子元素) 父元素是指包含有其它元素的元素,被包含的元素稱為它的子元素??瓷厦娴?結構樹",其中<myfile>是父元素,<title>,<author>是它的子元素,而<myfile>又是<filelist>的子元素。象<title>這樣沒有包含任何子元素的最后一級元素我們也稱之為"頁元素"。 4.Parser(解析軟件) Parser是一種檢查XML文檔是否遵循DTD規(guī)范的工具軟件。 Parser能獨立使用,也可以成為編輯軟件或瀏覽器的一部分。在后面的相關資源列表里,我列出了當前比較流行的一些parsers。 好了,通過第三章的學習,我們已經了解了一些XML和DTD的基本術語,但是我們還不知道怎樣來寫這些文件,需要遵循什么樣的語法,在下一章,將重點介紹有關撰寫XML和DTD文檔的語法。請繼續(xù)瀏覽,謝謝! XML輕松學習手冊(4)XML語法 第四章 XML語法 提綱: 一.XML語法規(guī)則 二.元素的語法 三.注釋的語法 四.CDATA的語法 五.Namespaces的語法 六.entity的語法 七.DTD的語法 通過前面三章的學習,我們已經對什么是XML,它的實現(xiàn)原理以及相關的術語有所了解。接下來我們就開始學習XML的語法規(guī)范,動手寫自己的XML文檔。 一.XML語法規(guī)則 XML的文檔和HTML的原代碼類似,也是用標識來標識內容。創(chuàng)建XML文檔必須遵守下列重要規(guī)則: 規(guī)則1:必須有XML聲明語句 這一點我們在上一章學習時已經提到過。聲明是XML文檔的第一句,其格式如下: <? 聲明的作用是告訴瀏覽器或者其它處理程序:這個文檔是XML文檔。聲明語句中的version表示文檔遵守的XML規(guī)范的版本;standalone表示文檔是否附帶DTD文件,如果有,參數(shù)為no;encoding表示文檔所用的語言編碼,默認是UTF-8。 規(guī)則2:是否有DTD文件 如果文檔是一個"有效的 <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 規(guī)則3:注意你的大小寫 在XML文檔中,大小寫是有區(qū)別的。<P>和<p>是不同的標識。注意在寫元素時,前后標識大小寫要保持一樣。例如:<Author>ajie</Author>,寫成<Author>ajie</author>是錯誤的。 你最好養(yǎng)成一種習慣,或者全部大寫,或者全部小寫,或者大寫第一個字母。這樣可以減少因為大小寫不匹配產生的文檔錯誤。 規(guī)則4:給屬性值加引號 在HTML代碼里面,屬性值可以加引號,也可以不加。例如:<font color=red> 但是在XML中則規(guī)定,所有屬性值必須加引號(可以是單引號,也可以是雙引號),否則將被視為錯誤。 規(guī)則5:所有的標識必須有相應的結束標識 在HTML中,標識可能不是成對出現(xiàn)的,比?lt;br>。而在XML中規(guī)定,所有標識必須成對出現(xiàn),有一個開始標識,就必須有一個結束標識。否則將被視為錯誤。 規(guī)則6:所有的空標識也必須被關閉 空標識就是標識對之間沒有內容的標識。比如 ,<img>等標識。在XML中,規(guī)定所有的標識必須有結束標識,針對這樣的空標識,XML中處理的方法是在原標識最后加/,就可以了。例如: 應寫為<br />; <META name="keyXML, SGML, <IMG src= "cool.gif">應寫為<IMG src= "cool.gif" /> 第四章 XML語法 二.元素的語法 元素由一對標識以及其中的內容組成。就象這樣:ajie。元素的名稱和標識的名稱是一樣的。標識可以用屬性來進一步描述。 在XML中,沒有任何保留字,所以你可以隨心所欲的用任何詞語來作為元素名稱。但是也必須遵守下列規(guī)范: 1.名稱中可以包含字母、數(shù)字以及其它字母; 2.名稱不能以數(shù)字或"_" (下劃線)開頭; 3.名稱不能以字母 XML(或 XML 或 Xml ..)開頭 4.名稱中不能包含空格 5.名稱中間不能包含":"(冒號) 為了使元素更容易閱讀理解和操作,我們還有一些建議: 1.名稱中不要使用"."。因為在很多程序語言中,"."是作為對象的屬性,例如:font.color。同樣的原因"-"也最好不要用,必須使用的,以"_"代替; 2.名稱盡量簡短。 3.名稱的大小寫盡量采用同一標準。 4.名稱可以使用非英文字符,比如用中文。但是有些軟件可能不支持。(IE5目前是支持中文元素的。) 另外,補充一點關于屬性的說明。在word</font>將把word顯示為紅色。而在CSS或者XSL,我們在下面詳細講述。) 三.注釋的語法 注釋是為了便于閱讀和理解,在XML文檔添加的附加信息,將不會被程序解釋或則瀏覽器顯示。 注釋的語法如下: <!-- 這里是注釋信息 --> 可以看到,它和HTML中的注釋語法是一樣的,非常容易。養(yǎng)成良好的注釋習慣將使你的文檔更加便于維護,共享,看起來也更專業(yè)。 四.CDATA的語法 CDATA全稱character data,翻譯為字符數(shù)據。我們在寫 <![CDATA[這里放置需要顯示的字符]]> 例如: <![CDATA[<AUTHOR sex="female">ajie</AUTHOR>]]> 在頁面上顯示的內容將是"<AUTHOR sex="female">ajie</AUTHOR>" 第四章 XML語法 五.Namespaces的語法 Namespaces翻譯為名字空間。名字空間有什么作用呢?當我們在一個XML文檔中使用他人的或者多個DTD文件,就會出現(xiàn)這樣的矛盾:因為XML中標識都是自己創(chuàng)建的,在不同的DTD文件中,標識名可能相同但表示的含義不同,這就可能引起數(shù)據混亂。 比如在一個文檔<table>wood table</table>中<table>表示桌子, 而在另一個文檔<table>namelist</table>中<table>表示表格。如果我需要同時處理這兩個文檔,就會發(fā)生名字沖突。 了解決這個問題,我們引進了namespaces這個概念。namespaces通過給標識名稱加一個網址(URL)定位的方法來區(qū)別這些名稱相同的標識。 Namespaces同樣需要在XML文檔的開頭部分聲明,聲明的語法如下: <document 其中yourname是由你定義的namespaces的名稱,URL就是名字空間的網址。 假設上面的"桌子<table>"文檔來自http://www.zhuozi.com,我們就可以聲明為 <document http://www.zhuozi.com'> 然后在后面的標識中使用定義好的名字空間: <zhuozi:table>wood table</table> 這樣就將這兩個<table>區(qū)分開來。注意的是:設置URL并不是說這個標識真的要到那個網址去讀取,僅僅作為一種區(qū)別的標志而已。 六.entity的語法 entity翻譯為"實體"。它的作用類似 entity可以包含字符,文字等等,使用entity的好處在于:1.它可以減少差錯,文檔中多個相同的部分只需要輸入一遍就可以了。2.它提高維護效率。比如你有40個文檔都包含copyright的entity,如果需要修改這個copyright,不需要所有的文件都修改,只要改最初定義的entity語句就可以了。 XML定義了兩種類型的entity。一種是我們這里說的普通entity,在XML文檔中使用;另一種是參數(shù)entity,在DTD文件中使用。 entity的定義語法為: <!DOCTYPE filename [ <!ENTITY entity-name "entity-content" ] > 例如我要定義一段版權信息: <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved" ] > 如果我的版權信息內容和他人共享一個XML文件,也可以使用外部調用的方法,語法象這樣: <!DOCTYPE copyright [ <!ENTITY copyright SYSTEM "http://www.sample.com/copyright. ] > 定義好的entity在文檔中的引用語法為:&entity-name; 例如,上面定義的版權信息,調用時寫作?copyright; 完整的例子如下,你可以copy下來存為copyright.XML觀看實例: <? <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved"> ]> <myfile> <title>XML</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> ©right; </myfile> 第四章 XML語法 七.DTD的語法 DTD是"有效 1.設置元素 元素是XML文檔的基本組成部分。你要在DTD中定義一個元素,然后在XML文檔中使用。元素的定義語法為:<!ELEMENT DESCRIPTION (#PCDATA, DEFINITION)*> 說明: "<!ELEMENT" 是元素的聲明,說明你要定義的是一個元素; 聲明后面的"DESCRIPTION",是元素的名稱; "(#PCDATA, DEFINITION)*>"則是該元素的使用規(guī)則。規(guī)則定義了元素可以包含的內容以及相互的關系。下面的表格概要列出了元素的規(guī)則: 2.元素規(guī)則表: 此主題相關圖片如下: 另外,我們還可以為元素定義屬性,因為我們不推薦使用屬性,在這里就不詳細展開了。 最后,我們來總結一些前四章學習的內容,寫一個包含DTD,XML,以及Script的簡單實例,便于讀者理解: 1.將下面文件存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 2.然后建立XML文檔myfile.xml: <? <!DOCTYPE myfile SYSTEM "myfile.dtd"> <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 3.建立HTML文檔myfile.html <HTML> <head> <script language=" var nodes = XMLDoc.documentElement.childNodes; title.innerText = nodes.item(0).text; author.innerText = nodes.item(1).text; </script> <title>在HTML中調用XML數(shù)據</title> </head> <body bgcolor="#FFFFFF"> <b>標題: </b> <span id="title"></span><br> <b>作者: </b> <span id="author"></span><br> </body> </HTML> 4.用IE5.0以上瀏覽器打開myfile.HTML就可以看到效果了。 XML輕松學習手冊(5)XML實例解析 第五章:XML實例解析 提綱: 一:實例效果 二:實例解析 1.定義新標識。 2.建立XML文檔。 3.建立相應的HTML文件。 XML在不同領域有著廣泛的應用,比如在科技領域的MathML,無線通信應用的WML,在網絡圖象方面的SVG等等,我們這里側重討論XML在web上的應用。XML在web上應用主要是利用其強大的數(shù)據操作能力。一般用XML配合JavaScript和ASP等服務器端程序,可以實現(xiàn)網絡上幾乎所有的應用需求。 考慮講解方便,我們在下面介紹一個簡單的實例,不包含服務器端程序。目的在于讓您對XML的數(shù)據操作能力有一個感性的認識。 好,我們首先[ 點擊這里 ]來看實例的效果。(請用IE5.0以上版本瀏覽器打開) 這是一個簡單的CD唱片數(shù)據檢索功能。你通過點擊"上一張","下一張"可以看到單張CD的有關信息。這樣的效果我們原來用兩種方法可以實現(xiàn): 1.利用DHTML,將數(shù)據隱藏在不同的層中,通過鼠標事件依次顯示; 2.利用后臺程序(如ASP,CGI,PHP,JSP等),調用服務器端的數(shù)據。 但是在這個實例中,我們打開頁面原代碼可以看到,其中沒有用DHTML的DIV,也沒有表單的action,它完全是用XML來實現(xiàn)的。下面我們來分析它的制作過程: 第一步:定義新標識。 根據實際的CD數(shù)據,首先新建一個名為<CD>的標識;其次建立它相關的數(shù)據標識,分別是:CD名稱<Title>,演唱者<Artist>,出版年代<Year>,國家<Country>,發(fā)行公司<Company>和價格<Price>;最后還要建立一個名為目錄<CATALOG>的標識。為什么要再建立一個<CATALOG>標識呢?因為在XML文檔中規(guī)定,必須且只能有一個根元素(標識),我們有多個CD數(shù)據,這些數(shù)據是并列的關系,所以需要為這些并列的元素建立一個根元素。 以上元素的定義和關系都完全符合XML標準,不需要特別的DTD文件來定義,所以可以省略DTD定義。如果我們想使用DTD來定義,以上過程可以表示為: <!ELEMENT CATALOG (CD)*> <!ELEMENT CD (Title,Artist,Year,Country,Company,Price)> <!ELEMENT Title (#PCDATA)> <!ELEMENT Artist (#PCDATA)> <!ELEMENT Year (#PCDATA)> <!ELEMENT Country (#PCDATA)> <!ELEMENT Company (#PCDATA)> <!ELEMENT Price (#PCDATA)> 這段代碼表示:元素CATALOG包含多個CD子元素,而子元素CD又依次包含Title, Artist, Year, Country, Company, Price 六個子元素,它們的內容都定義為文本(字符,數(shù)字,文本)。(注:具體的語法說明可以看上一章關于DTD的介紹) 第二步:建立XML文檔。 <? <CATALOG> <CD> <TITLE>Empire Burlesque</TITLE> <ARTIST>Bob Dylan</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>Columbia</COMPANY> <PRICE>10.90</PRICE> <YEAR>1985</YEAR> </CD> <CD> <TITLE>Hide your heart</TITLE> <ARTIST>Bonnie Tylor</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>CBS Records</COMPANY> <PRICE>9.90</PRICE> <YEAR>1988</YEAR> </CD> <CD> <TITLE>Greatest Hits</TITLE> <ARTIST>Dolly Parton</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>RCA</COMPANY> <PRICE>9.90</PRICE> <YEAR>1982</YEAR> </CD> <CD> <TITLE>Still got the blues</TITLE> <ARTIST>Gary More</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>Virgin redords</COMPANY> <PRICE>10.20</PRICE> <YEAR>1990</YEAR> </CD> <CD> <TITLE>Eros</TITLE> <ARTIST>Eros Ramazzotti</ARTIST> <COUNTRY>EU</COUNTRY> <COMPANY>BMG</COMPANY> <PRICE>9.90</PRICE> <YEAR>1997</YEAR> </CD> </CATALOG> 上面代碼首先用<? <CATALOG> <CD> ...... </CD> <CD> ...... </CD> </CATALOG> 一共定義了5組數(shù)據。我們將上面的代碼存為cd.XML文件,以備調用。 第三步:建立相應的HTML文件。 1.導入XML數(shù)據。 我們知道,目前流行的瀏覽器中,暫時只有微軟的IE5.0以上版本瀏覽器支持XML。IE是通過在 CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> 定義一個object,ID名為XMLdso。然后在head區(qū)用js引入xml數(shù)據: <script for="window" event="onload"> </script> 2.捆綁數(shù)據。 然后將用<SPAN>標識來將XML數(shù)據綁定在表格中。其中ID,DATASRC,DTATFLD都是<SPAN>的屬性。代碼如下: <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> 3.動作操作。 最后,為數(shù)據提供瀏覽按鈕: <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> 并利用js來完成兩個鼠標點擊功能:movenext()和moveprevious()。在head區(qū)加入如下代碼: <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> 好,我們先看HTML文件的全部原代碼: <HTML> <head> <script for="window" event="onload"> </script> <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> <TITLE>CD Navigate</TITLE> </head> <body> <p> <object WIDTH="0" HEIGHT="0" CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> <p> <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> </p> </body> </HTML> 將以上代碼存為cd.htm文件,于第二步的cd.XML文件放在一起。打開cd.htm文件,你就看見和上面實例一樣的效果了。 好,到今天為止,我們已經學習了關于XML的不少知識,我們來總結一下前面五個章節(jié),分別是XML快速入門,XML的概念原理,XML的術語,XML的語法和本章的實例解析。到這里,教程部分就結束了。在寫作過程中,阿捷盡最大努力將有關XML概念講得通俗易懂,盡量把自己的理解告訴給大家,但因為本人學習XML時間也不長,對整個XML的技術把握還不夠系統(tǒng)和深入,所以難免有疏漏的地方,請大家指正和諒解,謝謝! posted on 2009-02-15 15:45 YXY 閱讀(187) 評論(0) 編輯 收藏
<!DOCTYPE filelist SYSTEM "filelist.dtd">
<filelist>
<title>QUICK START OF XML</title>
......
</filelist>
其中第一行<? 我們來了解XML文檔中有關的術語:
1.Element(元素):
元素在HTML我們已經有所了解,它是組成HTML文檔的最小單位,在XML中也一樣。一個元素由一個標識來定義,包括開始和結束標識以及其中的內容,就象這樣:<author>ajie</author>
唯一不同的就是:在HTML中,標識是固定的,而在XML中,標識需要你自己創(chuàng)建。
2.Tag(標識)
標識是用來定義元素的。在XML中,標識必須成對出現(xiàn),將數(shù)據包圍在中間。標識的名稱和元素的名稱是一樣的。例如這樣一個元素:
其中<author>就是標識。
3.Attribute(屬性):
什么是屬性?看這段word</font>。其中color就是font的屬性之一。
屬性是對標識進一步的描述和說明,一個標識可以有多個屬性,例如font的屬性還有size。XML中的屬性與HTML中的屬性是一樣的,每個屬性都有它自己的名字和數(shù)值,屬性是標識的一部分。舉例:
<author sex="female">ajie</author>
XML中屬性也是自己定義的,我們建議你盡量不使用屬性,而將屬性改成子元素,例如上面的代碼可以改成這樣:
<author>ajie
<sex>female</sex>
</author>
原因是屬性不易擴充和被程序操作。
4.Declaration(聲明)
在所有XML文檔的第一行都有一個XML聲明。這個聲明表示這個文檔是一個XML文檔,它遵循的是哪個XML版本的規(guī)范。一個XML的聲明語句就象這樣:
<? 5.DTD(文件類型定義) DTD是用來定義XML文檔中元素,屬性以及元素之間關系的。 通過DTD文件可以檢測XML文檔的結構是否正確。但建立XML文檔并不一定需要DTD文件。關于DTD文件的詳細說明我們將在下面單獨列項。 6.Well-formed XML(良好格式的XML) 一個遵守 良好格式的文檔必須以一個XML聲明開始,例如: <? 其中你必須說明文檔遵守的 良好格式的XML文檔必須有一個根元素,就是緊接著聲明后面建立的第一個元素,其它元素都是這個根元素的子元素,屬于根元素一組。 良好格式的XML文檔的內容書寫時必須遵守XML語法。(有關XML語法我們將在下一章仔細講解) 7.Valid XML(有效的XML) 一個遵守 將XML文檔和它的DTD文件進行比較分析,看是否符合DTD規(guī)則的過程叫validation(確認)。這樣的過程通常我們是通過一個名為parser的軟件來處理的。 有效的XML文檔也必須以一個XML聲明開始,例如: <? 和上面例子不同的,在standalone(獨立)屬性中,這里設置的是"no",因為它必須和相應的DTD一起使用,DTD文件的定義方法如下: <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 二.DTD的有關術語 什么是DTD,我們上面已經簡略提到。DTD是一種保證XML文檔格式正確的有效方法,可以比較XML文檔和DTD文件來看文檔是否符合規(guī)范,元素和標簽使用是否正確。一個DTD文檔包含:元素的定義規(guī)則,元素間關系的定義規(guī)則,元素可使用的屬性,可使用的實體或符號規(guī)則。 DTD文件也是一個ASCII的文本文件,后綴名為.dtd。例如:myfile.dtd。 為什么要用DTD文件呢?我的理解是它滿足了網絡共享和數(shù)據交互,使用DTD最大的好處在于DTD文件的共享。(就是上文DTD說明語句中的PUBLIC屬性)。比如,兩個相同行業(yè)不同地區(qū)的人使用同一個DTD文件來作為文檔創(chuàng)建規(guī)范,那么他們的數(shù)據就很容易交換和共享。網上有其他人想補充數(shù)據,也只需要根據公用的DTD規(guī)范來建立文檔,就立刻可以加入。 目前,已經有數(shù)量眾多的寫好的DTD文件可以利用。針對不同的行業(yè)和應用,這些DTD文件已經建立了通用的元素和標簽規(guī)則。你不需要自己重新創(chuàng)建,只要在他們的基礎上加入你需要的新標識。 當然,如果愿意,你可以創(chuàng)建自己的DTD,它可能和你的文檔配合的更加完美。建立自己的DTD也是很簡單的一件事,一般只需要定義4-5個元素就可以了。 調用DTD文件的方法有兩種: 1.直接包含在XML文檔內的DTD 你只要在DOCTYPE聲明中插入一些特別的說明就可以了,象這樣: 我們有一個XML文檔: <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 我們在第一行后面插入下面代碼就可以: <!DOCTYPE myfile [ <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> <!ENTITY copyright "Copyright 2001, Ajie."> ]> 2.調用獨立的DTD文件 將DTD文檔存為.dtd的文件,然后在DOCTYPE聲明行中調用,例如,將下面的代碼存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 然后在XML文檔中調用,在第一行后插入: <!DOCTYPE myfile SYSTEM "myfile.dtd"> 我們可以看到DTD文檔和HTML中js的調用是差不多的,關于DTD文檔具體如何寫,我們將在下一章和XML文檔的語法一起介紹。 下面我們來了解DTD有關的術語: 1.Schema(規(guī)劃) schema是數(shù)據規(guī)則的描述。schema做兩件事: a.它定義元素數(shù)據類型和元素之間的關系; b.它定義元素所能包含的內容類型。 DTD就是關于XML文檔的一個schema。 2.Document Tree(文檔樹) "文檔樹"在前面第二章我們已經提到過,它是文檔元素分級結構的形象表示。一個文檔結構樹包含根元素,根元素是最頂級的元素,(就是緊接著XML聲明語句后的第一個元素)。看例子: <? <filelist> <myfile> <title>...</title> <author>...</author> </myfile> </filelist> 上面的例子分三級結構排列成"樹"狀,其中的<filelist>就是根元素。在XML和DTD文件中,第一個定義的都是根元素。 3.Parent Element(父元素)/Child Element(子元素) 父元素是指包含有其它元素的元素,被包含的元素稱為它的子元素??瓷厦娴?結構樹",其中<myfile>是父元素,<title>,<author>是它的子元素,而<myfile>又是<filelist>的子元素。象<title>這樣沒有包含任何子元素的最后一級元素我們也稱之為"頁元素"。 4.Parser(解析軟件) Parser是一種檢查XML文檔是否遵循DTD規(guī)范的工具軟件。 Parser能獨立使用,也可以成為編輯軟件或瀏覽器的一部分。在后面的相關資源列表里,我列出了當前比較流行的一些parsers。 好了,通過第三章的學習,我們已經了解了一些XML和DTD的基本術語,但是我們還不知道怎樣來寫這些文件,需要遵循什么樣的語法,在下一章,將重點介紹有關撰寫XML和DTD文檔的語法。請繼續(xù)瀏覽,謝謝! XML輕松學習手冊(4)XML語法 第四章 XML語法 提綱: 一.XML語法規(guī)則 二.元素的語法 三.注釋的語法 四.CDATA的語法 五.Namespaces的語法 六.entity的語法 七.DTD的語法 通過前面三章的學習,我們已經對什么是XML,它的實現(xiàn)原理以及相關的術語有所了解。接下來我們就開始學習XML的語法規(guī)范,動手寫自己的XML文檔。 一.XML語法規(guī)則 XML的文檔和HTML的原代碼類似,也是用標識來標識內容。創(chuàng)建XML文檔必須遵守下列重要規(guī)則: 規(guī)則1:必須有XML聲明語句 這一點我們在上一章學習時已經提到過。聲明是XML文檔的第一句,其格式如下: <? 聲明的作用是告訴瀏覽器或者其它處理程序:這個文檔是XML文檔。聲明語句中的version表示文檔遵守的XML規(guī)范的版本;standalone表示文檔是否附帶DTD文件,如果有,參數(shù)為no;encoding表示文檔所用的語言編碼,默認是UTF-8。 規(guī)則2:是否有DTD文件 如果文檔是一個"有效的 <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 規(guī)則3:注意你的大小寫 在XML文檔中,大小寫是有區(qū)別的。<P>和<p>是不同的標識。注意在寫元素時,前后標識大小寫要保持一樣。例如:<Author>ajie</Author>,寫成<Author>ajie</author>是錯誤的。 你最好養(yǎng)成一種習慣,或者全部大寫,或者全部小寫,或者大寫第一個字母。這樣可以減少因為大小寫不匹配產生的文檔錯誤。 規(guī)則4:給屬性值加引號 在HTML代碼里面,屬性值可以加引號,也可以不加。例如:<font color=red> 但是在XML中則規(guī)定,所有屬性值必須加引號(可以是單引號,也可以是雙引號),否則將被視為錯誤。 規(guī)則5:所有的標識必須有相應的結束標識 在HTML中,標識可能不是成對出現(xiàn)的,比?lt;br>。而在XML中規(guī)定,所有標識必須成對出現(xiàn),有一個開始標識,就必須有一個結束標識。否則將被視為錯誤。 規(guī)則6:所有的空標識也必須被關閉 空標識就是標識對之間沒有內容的標識。比如 ,<img>等標識。在XML中,規(guī)定所有的標識必須有結束標識,針對這樣的空標識,XML中處理的方法是在原標識最后加/,就可以了。例如: 應寫為<br />; <META name="keyXML, SGML, <IMG src= "cool.gif">應寫為<IMG src= "cool.gif" /> 第四章 XML語法 二.元素的語法 元素由一對標識以及其中的內容組成。就象這樣:ajie。元素的名稱和標識的名稱是一樣的。標識可以用屬性來進一步描述。 在XML中,沒有任何保留字,所以你可以隨心所欲的用任何詞語來作為元素名稱。但是也必須遵守下列規(guī)范: 1.名稱中可以包含字母、數(shù)字以及其它字母; 2.名稱不能以數(shù)字或"_" (下劃線)開頭; 3.名稱不能以字母 XML(或 XML 或 Xml ..)開頭 4.名稱中不能包含空格 5.名稱中間不能包含":"(冒號) 為了使元素更容易閱讀理解和操作,我們還有一些建議: 1.名稱中不要使用"."。因為在很多程序語言中,"."是作為對象的屬性,例如:font.color。同樣的原因"-"也最好不要用,必須使用的,以"_"代替; 2.名稱盡量簡短。 3.名稱的大小寫盡量采用同一標準。 4.名稱可以使用非英文字符,比如用中文。但是有些軟件可能不支持。(IE5目前是支持中文元素的。) 另外,補充一點關于屬性的說明。在word</font>將把word顯示為紅色。而在CSS或者XSL,我們在下面詳細講述。) 三.注釋的語法 注釋是為了便于閱讀和理解,在XML文檔添加的附加信息,將不會被程序解釋或則瀏覽器顯示。 注釋的語法如下: <!-- 這里是注釋信息 --> 可以看到,它和HTML中的注釋語法是一樣的,非常容易。養(yǎng)成良好的注釋習慣將使你的文檔更加便于維護,共享,看起來也更專業(yè)。 四.CDATA的語法 CDATA全稱character data,翻譯為字符數(shù)據。我們在寫 <![CDATA[這里放置需要顯示的字符]]> 例如: <![CDATA[<AUTHOR sex="female">ajie</AUTHOR>]]> 在頁面上顯示的內容將是"<AUTHOR sex="female">ajie</AUTHOR>" 第四章 XML語法 五.Namespaces的語法 Namespaces翻譯為名字空間。名字空間有什么作用呢?當我們在一個XML文檔中使用他人的或者多個DTD文件,就會出現(xiàn)這樣的矛盾:因為XML中標識都是自己創(chuàng)建的,在不同的DTD文件中,標識名可能相同但表示的含義不同,這就可能引起數(shù)據混亂。 比如在一個文檔<table>wood table</table>中<table>表示桌子, 而在另一個文檔<table>namelist</table>中<table>表示表格。如果我需要同時處理這兩個文檔,就會發(fā)生名字沖突。 了解決這個問題,我們引進了namespaces這個概念。namespaces通過給標識名稱加一個網址(URL)定位的方法來區(qū)別這些名稱相同的標識。 Namespaces同樣需要在XML文檔的開頭部分聲明,聲明的語法如下: <document 其中yourname是由你定義的namespaces的名稱,URL就是名字空間的網址。 假設上面的"桌子<table>"文檔來自http://www.zhuozi.com,我們就可以聲明為 <document http://www.zhuozi.com'> 然后在后面的標識中使用定義好的名字空間: <zhuozi:table>wood table</table> 這樣就將這兩個<table>區(qū)分開來。注意的是:設置URL并不是說這個標識真的要到那個網址去讀取,僅僅作為一種區(qū)別的標志而已。 六.entity的語法 entity翻譯為"實體"。它的作用類似 entity可以包含字符,文字等等,使用entity的好處在于:1.它可以減少差錯,文檔中多個相同的部分只需要輸入一遍就可以了。2.它提高維護效率。比如你有40個文檔都包含copyright的entity,如果需要修改這個copyright,不需要所有的文件都修改,只要改最初定義的entity語句就可以了。 XML定義了兩種類型的entity。一種是我們這里說的普通entity,在XML文檔中使用;另一種是參數(shù)entity,在DTD文件中使用。 entity的定義語法為: <!DOCTYPE filename [ <!ENTITY entity-name "entity-content" ] > 例如我要定義一段版權信息: <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved" ] > 如果我的版權信息內容和他人共享一個XML文件,也可以使用外部調用的方法,語法象這樣: <!DOCTYPE copyright [ <!ENTITY copyright SYSTEM "http://www.sample.com/copyright. ] > 定義好的entity在文檔中的引用語法為:&entity-name; 例如,上面定義的版權信息,調用時寫作?copyright; 完整的例子如下,你可以copy下來存為copyright.XML觀看實例: <? <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved"> ]> <myfile> <title>XML</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> ©right; </myfile> 第四章 XML語法 七.DTD的語法 DTD是"有效 1.設置元素 元素是XML文檔的基本組成部分。你要在DTD中定義一個元素,然后在XML文檔中使用。元素的定義語法為:<!ELEMENT DESCRIPTION (#PCDATA, DEFINITION)*> 說明: "<!ELEMENT" 是元素的聲明,說明你要定義的是一個元素; 聲明后面的"DESCRIPTION",是元素的名稱; "(#PCDATA, DEFINITION)*>"則是該元素的使用規(guī)則。規(guī)則定義了元素可以包含的內容以及相互的關系。下面的表格概要列出了元素的規(guī)則: 2.元素規(guī)則表: 此主題相關圖片如下: 另外,我們還可以為元素定義屬性,因為我們不推薦使用屬性,在這里就不詳細展開了。 最后,我們來總結一些前四章學習的內容,寫一個包含DTD,XML,以及Script的簡單實例,便于讀者理解: 1.將下面文件存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 2.然后建立XML文檔myfile.xml: <? <!DOCTYPE myfile SYSTEM "myfile.dtd"> <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 3.建立HTML文檔myfile.html <HTML> <head> <script language=" var nodes = XMLDoc.documentElement.childNodes; title.innerText = nodes.item(0).text; author.innerText = nodes.item(1).text; </script> <title>在HTML中調用XML數(shù)據</title> </head> <body bgcolor="#FFFFFF"> <b>標題: </b> <span id="title"></span><br> <b>作者: </b> <span id="author"></span><br> </body> </HTML> 4.用IE5.0以上瀏覽器打開myfile.HTML就可以看到效果了。 XML輕松學習手冊(5)XML實例解析 第五章:XML實例解析 提綱: 一:實例效果 二:實例解析 1.定義新標識。 2.建立XML文檔。 3.建立相應的HTML文件。 XML在不同領域有著廣泛的應用,比如在科技領域的MathML,無線通信應用的WML,在網絡圖象方面的SVG等等,我們這里側重討論XML在web上的應用。XML在web上應用主要是利用其強大的數(shù)據操作能力。一般用XML配合JavaScript和ASP等服務器端程序,可以實現(xiàn)網絡上幾乎所有的應用需求。 考慮講解方便,我們在下面介紹一個簡單的實例,不包含服務器端程序。目的在于讓您對XML的數(shù)據操作能力有一個感性的認識。 好,我們首先[ 點擊這里 ]來看實例的效果。(請用IE5.0以上版本瀏覽器打開) 這是一個簡單的CD唱片數(shù)據檢索功能。你通過點擊"上一張","下一張"可以看到單張CD的有關信息。這樣的效果我們原來用兩種方法可以實現(xiàn): 1.利用DHTML,將數(shù)據隱藏在不同的層中,通過鼠標事件依次顯示; 2.利用后臺程序(如ASP,CGI,PHP,JSP等),調用服務器端的數(shù)據。 但是在這個實例中,我們打開頁面原代碼可以看到,其中沒有用DHTML的DIV,也沒有表單的action,它完全是用XML來實現(xiàn)的。下面我們來分析它的制作過程: 第一步:定義新標識。 根據實際的CD數(shù)據,首先新建一個名為<CD>的標識;其次建立它相關的數(shù)據標識,分別是:CD名稱<Title>,演唱者<Artist>,出版年代<Year>,國家<Country>,發(fā)行公司<Company>和價格<Price>;最后還要建立一個名為目錄<CATALOG>的標識。為什么要再建立一個<CATALOG>標識呢?因為在XML文檔中規(guī)定,必須且只能有一個根元素(標識),我們有多個CD數(shù)據,這些數(shù)據是并列的關系,所以需要為這些并列的元素建立一個根元素。 以上元素的定義和關系都完全符合XML標準,不需要特別的DTD文件來定義,所以可以省略DTD定義。如果我們想使用DTD來定義,以上過程可以表示為: <!ELEMENT CATALOG (CD)*> <!ELEMENT CD (Title,Artist,Year,Country,Company,Price)> <!ELEMENT Title (#PCDATA)> <!ELEMENT Artist (#PCDATA)> <!ELEMENT Year (#PCDATA)> <!ELEMENT Country (#PCDATA)> <!ELEMENT Company (#PCDATA)> <!ELEMENT Price (#PCDATA)> 這段代碼表示:元素CATALOG包含多個CD子元素,而子元素CD又依次包含Title, Artist, Year, Country, Company, Price 六個子元素,它們的內容都定義為文本(字符,數(shù)字,文本)。(注:具體的語法說明可以看上一章關于DTD的介紹) 第二步:建立XML文檔。 <? <CATALOG> <CD> <TITLE>Empire Burlesque</TITLE> <ARTIST>Bob Dylan</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>Columbia</COMPANY> <PRICE>10.90</PRICE> <YEAR>1985</YEAR> </CD> <CD> <TITLE>Hide your heart</TITLE> <ARTIST>Bonnie Tylor</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>CBS Records</COMPANY> <PRICE>9.90</PRICE> <YEAR>1988</YEAR> </CD> <CD> <TITLE>Greatest Hits</TITLE> <ARTIST>Dolly Parton</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>RCA</COMPANY> <PRICE>9.90</PRICE> <YEAR>1982</YEAR> </CD> <CD> <TITLE>Still got the blues</TITLE> <ARTIST>Gary More</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>Virgin redords</COMPANY> <PRICE>10.20</PRICE> <YEAR>1990</YEAR> </CD> <CD> <TITLE>Eros</TITLE> <ARTIST>Eros Ramazzotti</ARTIST> <COUNTRY>EU</COUNTRY> <COMPANY>BMG</COMPANY> <PRICE>9.90</PRICE> <YEAR>1997</YEAR> </CD> </CATALOG> 上面代碼首先用<? <CATALOG> <CD> ...... </CD> <CD> ...... </CD> </CATALOG> 一共定義了5組數(shù)據。我們將上面的代碼存為cd.XML文件,以備調用。 第三步:建立相應的HTML文件。 1.導入XML數(shù)據。 我們知道,目前流行的瀏覽器中,暫時只有微軟的IE5.0以上版本瀏覽器支持XML。IE是通過在 CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> 定義一個object,ID名為XMLdso。然后在head區(qū)用js引入xml數(shù)據: <script for="window" event="onload"> </script> 2.捆綁數(shù)據。 然后將用<SPAN>標識來將XML數(shù)據綁定在表格中。其中ID,DATASRC,DTATFLD都是<SPAN>的屬性。代碼如下: <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> 3.動作操作。 最后,為數(shù)據提供瀏覽按鈕: <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> 并利用js來完成兩個鼠標點擊功能:movenext()和moveprevious()。在head區(qū)加入如下代碼: <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> 好,我們先看HTML文件的全部原代碼: <HTML> <head> <script for="window" event="onload"> </script> <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> <TITLE>CD Navigate</TITLE> </head> <body> <p> <object WIDTH="0" HEIGHT="0" CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> <p> <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> </p> </body> </HTML> 將以上代碼存為cd.htm文件,于第二步的cd.XML文件放在一起。打開cd.htm文件,你就看見和上面實例一樣的效果了。 好,到今天為止,我們已經學習了關于XML的不少知識,我們來總結一下前面五個章節(jié),分別是XML快速入門,XML的概念原理,XML的術語,XML的語法和本章的實例解析。到這里,教程部分就結束了。在寫作過程中,阿捷盡最大努力將有關XML概念講得通俗易懂,盡量把自己的理解告訴給大家,但因為本人學習XML時間也不長,對整個XML的技術把握還不夠系統(tǒng)和深入,所以難免有疏漏的地方,請大家指正和諒解,謝謝! posted on 2009-02-15 15:45 YXY 閱讀(187) 評論(0) 編輯 收藏
5.DTD(文件類型定義)
DTD是用來定義XML文檔中元素,屬性以及元素之間關系的。
通過DTD文件可以檢測XML文檔的結構是否正確。但建立XML文檔并不一定需要DTD文件。關于DTD文件的詳細說明我們將在下面單獨列項。
6.Well-formed XML(良好格式的XML)
一個遵守 良好格式的文檔必須以一個XML聲明開始,例如: <? 其中你必須說明文檔遵守的 良好格式的XML文檔必須有一個根元素,就是緊接著聲明后面建立的第一個元素,其它元素都是這個根元素的子元素,屬于根元素一組。 良好格式的XML文檔的內容書寫時必須遵守XML語法。(有關XML語法我們將在下一章仔細講解) 7.Valid XML(有效的XML) 一個遵守 將XML文檔和它的DTD文件進行比較分析,看是否符合DTD規(guī)則的過程叫validation(確認)。這樣的過程通常我們是通過一個名為parser的軟件來處理的。 有效的XML文檔也必須以一個XML聲明開始,例如: <? 和上面例子不同的,在standalone(獨立)屬性中,這里設置的是"no",因為它必須和相應的DTD一起使用,DTD文件的定義方法如下: <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 二.DTD的有關術語 什么是DTD,我們上面已經簡略提到。DTD是一種保證XML文檔格式正確的有效方法,可以比較XML文檔和DTD文件來看文檔是否符合規(guī)范,元素和標簽使用是否正確。一個DTD文檔包含:元素的定義規(guī)則,元素間關系的定義規(guī)則,元素可使用的屬性,可使用的實體或符號規(guī)則。 DTD文件也是一個ASCII的文本文件,后綴名為.dtd。例如:myfile.dtd。 為什么要用DTD文件呢?我的理解是它滿足了網絡共享和數(shù)據交互,使用DTD最大的好處在于DTD文件的共享。(就是上文DTD說明語句中的PUBLIC屬性)。比如,兩個相同行業(yè)不同地區(qū)的人使用同一個DTD文件來作為文檔創(chuàng)建規(guī)范,那么他們的數(shù)據就很容易交換和共享。網上有其他人想補充數(shù)據,也只需要根據公用的DTD規(guī)范來建立文檔,就立刻可以加入。 目前,已經有數(shù)量眾多的寫好的DTD文件可以利用。針對不同的行業(yè)和應用,這些DTD文件已經建立了通用的元素和標簽規(guī)則。你不需要自己重新創(chuàng)建,只要在他們的基礎上加入你需要的新標識。 當然,如果愿意,你可以創(chuàng)建自己的DTD,它可能和你的文檔配合的更加完美。建立自己的DTD也是很簡單的一件事,一般只需要定義4-5個元素就可以了。 調用DTD文件的方法有兩種: 1.直接包含在XML文檔內的DTD 你只要在DOCTYPE聲明中插入一些特別的說明就可以了,象這樣: 我們有一個XML文檔: <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 我們在第一行后面插入下面代碼就可以: <!DOCTYPE myfile [ <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> <!ENTITY copyright "Copyright 2001, Ajie."> ]> 2.調用獨立的DTD文件 將DTD文檔存為.dtd的文件,然后在DOCTYPE聲明行中調用,例如,將下面的代碼存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 然后在XML文檔中調用,在第一行后插入: <!DOCTYPE myfile SYSTEM "myfile.dtd"> 我們可以看到DTD文檔和HTML中js的調用是差不多的,關于DTD文檔具體如何寫,我們將在下一章和XML文檔的語法一起介紹。 下面我們來了解DTD有關的術語: 1.Schema(規(guī)劃) schema是數(shù)據規(guī)則的描述。schema做兩件事: a.它定義元素數(shù)據類型和元素之間的關系; b.它定義元素所能包含的內容類型。 DTD就是關于XML文檔的一個schema。 2.Document Tree(文檔樹) "文檔樹"在前面第二章我們已經提到過,它是文檔元素分級結構的形象表示。一個文檔結構樹包含根元素,根元素是最頂級的元素,(就是緊接著XML聲明語句后的第一個元素)。看例子: <? <filelist> <myfile> <title>...</title> <author>...</author> </myfile> </filelist> 上面的例子分三級結構排列成"樹"狀,其中的<filelist>就是根元素。在XML和DTD文件中,第一個定義的都是根元素。 3.Parent Element(父元素)/Child Element(子元素) 父元素是指包含有其它元素的元素,被包含的元素稱為它的子元素??瓷厦娴?結構樹",其中<myfile>是父元素,<title>,<author>是它的子元素,而<myfile>又是<filelist>的子元素。象<title>這樣沒有包含任何子元素的最后一級元素我們也稱之為"頁元素"。 4.Parser(解析軟件) Parser是一種檢查XML文檔是否遵循DTD規(guī)范的工具軟件。 Parser能獨立使用,也可以成為編輯軟件或瀏覽器的一部分。在后面的相關資源列表里,我列出了當前比較流行的一些parsers。 好了,通過第三章的學習,我們已經了解了一些XML和DTD的基本術語,但是我們還不知道怎樣來寫這些文件,需要遵循什么樣的語法,在下一章,將重點介紹有關撰寫XML和DTD文檔的語法。請繼續(xù)瀏覽,謝謝! XML輕松學習手冊(4)XML語法 第四章 XML語法 提綱: 一.XML語法規(guī)則 二.元素的語法 三.注釋的語法 四.CDATA的語法 五.Namespaces的語法 六.entity的語法 七.DTD的語法 通過前面三章的學習,我們已經對什么是XML,它的實現(xiàn)原理以及相關的術語有所了解。接下來我們就開始學習XML的語法規(guī)范,動手寫自己的XML文檔。 一.XML語法規(guī)則 XML的文檔和HTML的原代碼類似,也是用標識來標識內容。創(chuàng)建XML文檔必須遵守下列重要規(guī)則: 規(guī)則1:必須有XML聲明語句 這一點我們在上一章學習時已經提到過。聲明是XML文檔的第一句,其格式如下: <? 聲明的作用是告訴瀏覽器或者其它處理程序:這個文檔是XML文檔。聲明語句中的version表示文檔遵守的XML規(guī)范的版本;standalone表示文檔是否附帶DTD文件,如果有,參數(shù)為no;encoding表示文檔所用的語言編碼,默認是UTF-8。 規(guī)則2:是否有DTD文件 如果文檔是一個"有效的 <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 規(guī)則3:注意你的大小寫 在XML文檔中,大小寫是有區(qū)別的。<P>和<p>是不同的標識。注意在寫元素時,前后標識大小寫要保持一樣。例如:<Author>ajie</Author>,寫成<Author>ajie</author>是錯誤的。 你最好養(yǎng)成一種習慣,或者全部大寫,或者全部小寫,或者大寫第一個字母。這樣可以減少因為大小寫不匹配產生的文檔錯誤。 規(guī)則4:給屬性值加引號 在HTML代碼里面,屬性值可以加引號,也可以不加。例如:<font color=red> 但是在XML中則規(guī)定,所有屬性值必須加引號(可以是單引號,也可以是雙引號),否則將被視為錯誤。 規(guī)則5:所有的標識必須有相應的結束標識 在HTML中,標識可能不是成對出現(xiàn)的,比?lt;br>。而在XML中規(guī)定,所有標識必須成對出現(xiàn),有一個開始標識,就必須有一個結束標識。否則將被視為錯誤。 規(guī)則6:所有的空標識也必須被關閉 空標識就是標識對之間沒有內容的標識。比如 ,<img>等標識。在XML中,規(guī)定所有的標識必須有結束標識,針對這樣的空標識,XML中處理的方法是在原標識最后加/,就可以了。例如: 應寫為<br />; <META name="keyXML, SGML, <IMG src= "cool.gif">應寫為<IMG src= "cool.gif" /> 第四章 XML語法 二.元素的語法 元素由一對標識以及其中的內容組成。就象這樣:ajie。元素的名稱和標識的名稱是一樣的。標識可以用屬性來進一步描述。 在XML中,沒有任何保留字,所以你可以隨心所欲的用任何詞語來作為元素名稱。但是也必須遵守下列規(guī)范: 1.名稱中可以包含字母、數(shù)字以及其它字母; 2.名稱不能以數(shù)字或"_" (下劃線)開頭; 3.名稱不能以字母 XML(或 XML 或 Xml ..)開頭 4.名稱中不能包含空格 5.名稱中間不能包含":"(冒號) 為了使元素更容易閱讀理解和操作,我們還有一些建議: 1.名稱中不要使用"."。因為在很多程序語言中,"."是作為對象的屬性,例如:font.color。同樣的原因"-"也最好不要用,必須使用的,以"_"代替; 2.名稱盡量簡短。 3.名稱的大小寫盡量采用同一標準。 4.名稱可以使用非英文字符,比如用中文。但是有些軟件可能不支持。(IE5目前是支持中文元素的。) 另外,補充一點關于屬性的說明。在word</font>將把word顯示為紅色。而在CSS或者XSL,我們在下面詳細講述。) 三.注釋的語法 注釋是為了便于閱讀和理解,在XML文檔添加的附加信息,將不會被程序解釋或則瀏覽器顯示。 注釋的語法如下: <!-- 這里是注釋信息 --> 可以看到,它和HTML中的注釋語法是一樣的,非常容易。養(yǎng)成良好的注釋習慣將使你的文檔更加便于維護,共享,看起來也更專業(yè)。 四.CDATA的語法 CDATA全稱character data,翻譯為字符數(shù)據。我們在寫 <![CDATA[這里放置需要顯示的字符]]> 例如: <![CDATA[<AUTHOR sex="female">ajie</AUTHOR>]]> 在頁面上顯示的內容將是"<AUTHOR sex="female">ajie</AUTHOR>" 第四章 XML語法 五.Namespaces的語法 Namespaces翻譯為名字空間。名字空間有什么作用呢?當我們在一個XML文檔中使用他人的或者多個DTD文件,就會出現(xiàn)這樣的矛盾:因為XML中標識都是自己創(chuàng)建的,在不同的DTD文件中,標識名可能相同但表示的含義不同,這就可能引起數(shù)據混亂。 比如在一個文檔<table>wood table</table>中<table>表示桌子, 而在另一個文檔<table>namelist</table>中<table>表示表格。如果我需要同時處理這兩個文檔,就會發(fā)生名字沖突。 了解決這個問題,我們引進了namespaces這個概念。namespaces通過給標識名稱加一個網址(URL)定位的方法來區(qū)別這些名稱相同的標識。 Namespaces同樣需要在XML文檔的開頭部分聲明,聲明的語法如下: <document 其中yourname是由你定義的namespaces的名稱,URL就是名字空間的網址。 假設上面的"桌子<table>"文檔來自http://www.zhuozi.com,我們就可以聲明為 <document http://www.zhuozi.com'> 然后在后面的標識中使用定義好的名字空間: <zhuozi:table>wood table</table> 這樣就將這兩個<table>區(qū)分開來。注意的是:設置URL并不是說這個標識真的要到那個網址去讀取,僅僅作為一種區(qū)別的標志而已。 六.entity的語法 entity翻譯為"實體"。它的作用類似 entity可以包含字符,文字等等,使用entity的好處在于:1.它可以減少差錯,文檔中多個相同的部分只需要輸入一遍就可以了。2.它提高維護效率。比如你有40個文檔都包含copyright的entity,如果需要修改這個copyright,不需要所有的文件都修改,只要改最初定義的entity語句就可以了。 XML定義了兩種類型的entity。一種是我們這里說的普通entity,在XML文檔中使用;另一種是參數(shù)entity,在DTD文件中使用。 entity的定義語法為: <!DOCTYPE filename [ <!ENTITY entity-name "entity-content" ] > 例如我要定義一段版權信息: <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved" ] > 如果我的版權信息內容和他人共享一個XML文件,也可以使用外部調用的方法,語法象這樣: <!DOCTYPE copyright [ <!ENTITY copyright SYSTEM "http://www.sample.com/copyright. ] > 定義好的entity在文檔中的引用語法為:&entity-name; 例如,上面定義的版權信息,調用時寫作?copyright; 完整的例子如下,你可以copy下來存為copyright.XML觀看實例: <? <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved"> ]> <myfile> <title>XML</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> ©right; </myfile> 第四章 XML語法 七.DTD的語法 DTD是"有效 1.設置元素 元素是XML文檔的基本組成部分。你要在DTD中定義一個元素,然后在XML文檔中使用。元素的定義語法為:<!ELEMENT DESCRIPTION (#PCDATA, DEFINITION)*> 說明: "<!ELEMENT" 是元素的聲明,說明你要定義的是一個元素; 聲明后面的"DESCRIPTION",是元素的名稱; "(#PCDATA, DEFINITION)*>"則是該元素的使用規(guī)則。規(guī)則定義了元素可以包含的內容以及相互的關系。下面的表格概要列出了元素的規(guī)則: 2.元素規(guī)則表: 此主題相關圖片如下: 另外,我們還可以為元素定義屬性,因為我們不推薦使用屬性,在這里就不詳細展開了。 最后,我們來總結一些前四章學習的內容,寫一個包含DTD,XML,以及Script的簡單實例,便于讀者理解: 1.將下面文件存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 2.然后建立XML文檔myfile.xml: <? <!DOCTYPE myfile SYSTEM "myfile.dtd"> <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 3.建立HTML文檔myfile.html <HTML> <head> <script language=" var nodes = XMLDoc.documentElement.childNodes; title.innerText = nodes.item(0).text; author.innerText = nodes.item(1).text; </script> <title>在HTML中調用XML數(shù)據</title> </head> <body bgcolor="#FFFFFF"> <b>標題: </b> <span id="title"></span><br> <b>作者: </b> <span id="author"></span><br> </body> </HTML> 4.用IE5.0以上瀏覽器打開myfile.HTML就可以看到效果了。 XML輕松學習手冊(5)XML實例解析 第五章:XML實例解析 提綱: 一:實例效果 二:實例解析 1.定義新標識。 2.建立XML文檔。 3.建立相應的HTML文件。 XML在不同領域有著廣泛的應用,比如在科技領域的MathML,無線通信應用的WML,在網絡圖象方面的SVG等等,我們這里側重討論XML在web上的應用。XML在web上應用主要是利用其強大的數(shù)據操作能力。一般用XML配合JavaScript和ASP等服務器端程序,可以實現(xiàn)網絡上幾乎所有的應用需求。 考慮講解方便,我們在下面介紹一個簡單的實例,不包含服務器端程序。目的在于讓您對XML的數(shù)據操作能力有一個感性的認識。 好,我們首先[ 點擊這里 ]來看實例的效果。(請用IE5.0以上版本瀏覽器打開) 這是一個簡單的CD唱片數(shù)據檢索功能。你通過點擊"上一張","下一張"可以看到單張CD的有關信息。這樣的效果我們原來用兩種方法可以實現(xiàn): 1.利用DHTML,將數(shù)據隱藏在不同的層中,通過鼠標事件依次顯示; 2.利用后臺程序(如ASP,CGI,PHP,JSP等),調用服務器端的數(shù)據。 但是在這個實例中,我們打開頁面原代碼可以看到,其中沒有用DHTML的DIV,也沒有表單的action,它完全是用XML來實現(xiàn)的。下面我們來分析它的制作過程: 第一步:定義新標識。 根據實際的CD數(shù)據,首先新建一個名為<CD>的標識;其次建立它相關的數(shù)據標識,分別是:CD名稱<Title>,演唱者<Artist>,出版年代<Year>,國家<Country>,發(fā)行公司<Company>和價格<Price>;最后還要建立一個名為目錄<CATALOG>的標識。為什么要再建立一個<CATALOG>標識呢?因為在XML文檔中規(guī)定,必須且只能有一個根元素(標識),我們有多個CD數(shù)據,這些數(shù)據是并列的關系,所以需要為這些并列的元素建立一個根元素。 以上元素的定義和關系都完全符合XML標準,不需要特別的DTD文件來定義,所以可以省略DTD定義。如果我們想使用DTD來定義,以上過程可以表示為: <!ELEMENT CATALOG (CD)*> <!ELEMENT CD (Title,Artist,Year,Country,Company,Price)> <!ELEMENT Title (#PCDATA)> <!ELEMENT Artist (#PCDATA)> <!ELEMENT Year (#PCDATA)> <!ELEMENT Country (#PCDATA)> <!ELEMENT Company (#PCDATA)> <!ELEMENT Price (#PCDATA)> 這段代碼表示:元素CATALOG包含多個CD子元素,而子元素CD又依次包含Title, Artist, Year, Country, Company, Price 六個子元素,它們的內容都定義為文本(字符,數(shù)字,文本)。(注:具體的語法說明可以看上一章關于DTD的介紹) 第二步:建立XML文檔。 <? <CATALOG> <CD> <TITLE>Empire Burlesque</TITLE> <ARTIST>Bob Dylan</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>Columbia</COMPANY> <PRICE>10.90</PRICE> <YEAR>1985</YEAR> </CD> <CD> <TITLE>Hide your heart</TITLE> <ARTIST>Bonnie Tylor</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>CBS Records</COMPANY> <PRICE>9.90</PRICE> <YEAR>1988</YEAR> </CD> <CD> <TITLE>Greatest Hits</TITLE> <ARTIST>Dolly Parton</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>RCA</COMPANY> <PRICE>9.90</PRICE> <YEAR>1982</YEAR> </CD> <CD> <TITLE>Still got the blues</TITLE> <ARTIST>Gary More</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>Virgin redords</COMPANY> <PRICE>10.20</PRICE> <YEAR>1990</YEAR> </CD> <CD> <TITLE>Eros</TITLE> <ARTIST>Eros Ramazzotti</ARTIST> <COUNTRY>EU</COUNTRY> <COMPANY>BMG</COMPANY> <PRICE>9.90</PRICE> <YEAR>1997</YEAR> </CD> </CATALOG> 上面代碼首先用<? <CATALOG> <CD> ...... </CD> <CD> ...... </CD> </CATALOG> 一共定義了5組數(shù)據。我們將上面的代碼存為cd.XML文件,以備調用。 第三步:建立相應的HTML文件。 1.導入XML數(shù)據。 我們知道,目前流行的瀏覽器中,暫時只有微軟的IE5.0以上版本瀏覽器支持XML。IE是通過在 CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> 定義一個object,ID名為XMLdso。然后在head區(qū)用js引入xml數(shù)據: <script for="window" event="onload"> </script> 2.捆綁數(shù)據。 然后將用<SPAN>標識來將XML數(shù)據綁定在表格中。其中ID,DATASRC,DTATFLD都是<SPAN>的屬性。代碼如下: <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> 3.動作操作。 最后,為數(shù)據提供瀏覽按鈕: <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> 并利用js來完成兩個鼠標點擊功能:movenext()和moveprevious()。在head區(qū)加入如下代碼: <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> 好,我們先看HTML文件的全部原代碼: <HTML> <head> <script for="window" event="onload"> </script> <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> <TITLE>CD Navigate</TITLE> </head> <body> <p> <object WIDTH="0" HEIGHT="0" CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> <p> <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> </p> </body> </HTML> 將以上代碼存為cd.htm文件,于第二步的cd.XML文件放在一起。打開cd.htm文件,你就看見和上面實例一樣的效果了。 好,到今天為止,我們已經學習了關于XML的不少知識,我們來總結一下前面五個章節(jié),分別是XML快速入門,XML的概念原理,XML的術語,XML的語法和本章的實例解析。到這里,教程部分就結束了。在寫作過程中,阿捷盡最大努力將有關XML概念講得通俗易懂,盡量把自己的理解告訴給大家,但因為本人學習XML時間也不長,對整個XML的技術把握還不夠系統(tǒng)和深入,所以難免有疏漏的地方,請大家指正和諒解,謝謝! posted on 2009-02-15 15:45 YXY 閱讀(187) 評論(0) 編輯 收藏
良好格式的文檔必須以一個XML聲明開始,例如:
<? 其中你必須說明文檔遵守的 良好格式的XML文檔必須有一個根元素,就是緊接著聲明后面建立的第一個元素,其它元素都是這個根元素的子元素,屬于根元素一組。 良好格式的XML文檔的內容書寫時必須遵守XML語法。(有關XML語法我們將在下一章仔細講解) 7.Valid XML(有效的XML) 一個遵守 將XML文檔和它的DTD文件進行比較分析,看是否符合DTD規(guī)則的過程叫validation(確認)。這樣的過程通常我們是通過一個名為parser的軟件來處理的。 有效的XML文檔也必須以一個XML聲明開始,例如: <? 和上面例子不同的,在standalone(獨立)屬性中,這里設置的是"no",因為它必須和相應的DTD一起使用,DTD文件的定義方法如下: <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 二.DTD的有關術語 什么是DTD,我們上面已經簡略提到。DTD是一種保證XML文檔格式正確的有效方法,可以比較XML文檔和DTD文件來看文檔是否符合規(guī)范,元素和標簽使用是否正確。一個DTD文檔包含:元素的定義規(guī)則,元素間關系的定義規(guī)則,元素可使用的屬性,可使用的實體或符號規(guī)則。 DTD文件也是一個ASCII的文本文件,后綴名為.dtd。例如:myfile.dtd。 為什么要用DTD文件呢?我的理解是它滿足了網絡共享和數(shù)據交互,使用DTD最大的好處在于DTD文件的共享。(就是上文DTD說明語句中的PUBLIC屬性)。比如,兩個相同行業(yè)不同地區(qū)的人使用同一個DTD文件來作為文檔創(chuàng)建規(guī)范,那么他們的數(shù)據就很容易交換和共享。網上有其他人想補充數(shù)據,也只需要根據公用的DTD規(guī)范來建立文檔,就立刻可以加入。 目前,已經有數(shù)量眾多的寫好的DTD文件可以利用。針對不同的行業(yè)和應用,這些DTD文件已經建立了通用的元素和標簽規(guī)則。你不需要自己重新創(chuàng)建,只要在他們的基礎上加入你需要的新標識。 當然,如果愿意,你可以創(chuàng)建自己的DTD,它可能和你的文檔配合的更加完美。建立自己的DTD也是很簡單的一件事,一般只需要定義4-5個元素就可以了。 調用DTD文件的方法有兩種: 1.直接包含在XML文檔內的DTD 你只要在DOCTYPE聲明中插入一些特別的說明就可以了,象這樣: 我們有一個XML文檔: <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 我們在第一行后面插入下面代碼就可以: <!DOCTYPE myfile [ <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> <!ENTITY copyright "Copyright 2001, Ajie."> ]> 2.調用獨立的DTD文件 將DTD文檔存為.dtd的文件,然后在DOCTYPE聲明行中調用,例如,將下面的代碼存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 然后在XML文檔中調用,在第一行后插入: <!DOCTYPE myfile SYSTEM "myfile.dtd"> 我們可以看到DTD文檔和HTML中js的調用是差不多的,關于DTD文檔具體如何寫,我們將在下一章和XML文檔的語法一起介紹。 下面我們來了解DTD有關的術語: 1.Schema(規(guī)劃) schema是數(shù)據規(guī)則的描述。schema做兩件事: a.它定義元素數(shù)據類型和元素之間的關系; b.它定義元素所能包含的內容類型。 DTD就是關于XML文檔的一個schema。 2.Document Tree(文檔樹) "文檔樹"在前面第二章我們已經提到過,它是文檔元素分級結構的形象表示。一個文檔結構樹包含根元素,根元素是最頂級的元素,(就是緊接著XML聲明語句后的第一個元素)。看例子: <? <filelist> <myfile> <title>...</title> <author>...</author> </myfile> </filelist> 上面的例子分三級結構排列成"樹"狀,其中的<filelist>就是根元素。在XML和DTD文件中,第一個定義的都是根元素。 3.Parent Element(父元素)/Child Element(子元素) 父元素是指包含有其它元素的元素,被包含的元素稱為它的子元素??瓷厦娴?結構樹",其中<myfile>是父元素,<title>,<author>是它的子元素,而<myfile>又是<filelist>的子元素。象<title>這樣沒有包含任何子元素的最后一級元素我們也稱之為"頁元素"。 4.Parser(解析軟件) Parser是一種檢查XML文檔是否遵循DTD規(guī)范的工具軟件。 Parser能獨立使用,也可以成為編輯軟件或瀏覽器的一部分。在后面的相關資源列表里,我列出了當前比較流行的一些parsers。 好了,通過第三章的學習,我們已經了解了一些XML和DTD的基本術語,但是我們還不知道怎樣來寫這些文件,需要遵循什么樣的語法,在下一章,將重點介紹有關撰寫XML和DTD文檔的語法。請繼續(xù)瀏覽,謝謝! XML輕松學習手冊(4)XML語法 第四章 XML語法 提綱: 一.XML語法規(guī)則 二.元素的語法 三.注釋的語法 四.CDATA的語法 五.Namespaces的語法 六.entity的語法 七.DTD的語法 通過前面三章的學習,我們已經對什么是XML,它的實現(xiàn)原理以及相關的術語有所了解。接下來我們就開始學習XML的語法規(guī)范,動手寫自己的XML文檔。 一.XML語法規(guī)則 XML的文檔和HTML的原代碼類似,也是用標識來標識內容。創(chuàng)建XML文檔必須遵守下列重要規(guī)則: 規(guī)則1:必須有XML聲明語句 這一點我們在上一章學習時已經提到過。聲明是XML文檔的第一句,其格式如下: <? 聲明的作用是告訴瀏覽器或者其它處理程序:這個文檔是XML文檔。聲明語句中的version表示文檔遵守的XML規(guī)范的版本;standalone表示文檔是否附帶DTD文件,如果有,參數(shù)為no;encoding表示文檔所用的語言編碼,默認是UTF-8。 規(guī)則2:是否有DTD文件 如果文檔是一個"有效的 <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 規(guī)則3:注意你的大小寫 在XML文檔中,大小寫是有區(qū)別的。<P>和<p>是不同的標識。注意在寫元素時,前后標識大小寫要保持一樣。例如:<Author>ajie</Author>,寫成<Author>ajie</author>是錯誤的。 你最好養(yǎng)成一種習慣,或者全部大寫,或者全部小寫,或者大寫第一個字母。這樣可以減少因為大小寫不匹配產生的文檔錯誤。 規(guī)則4:給屬性值加引號 在HTML代碼里面,屬性值可以加引號,也可以不加。例如:<font color=red> 但是在XML中則規(guī)定,所有屬性值必須加引號(可以是單引號,也可以是雙引號),否則將被視為錯誤。 規(guī)則5:所有的標識必須有相應的結束標識 在HTML中,標識可能不是成對出現(xiàn)的,比?lt;br>。而在XML中規(guī)定,所有標識必須成對出現(xiàn),有一個開始標識,就必須有一個結束標識。否則將被視為錯誤。 規(guī)則6:所有的空標識也必須被關閉 空標識就是標識對之間沒有內容的標識。比如 ,<img>等標識。在XML中,規(guī)定所有的標識必須有結束標識,針對這樣的空標識,XML中處理的方法是在原標識最后加/,就可以了。例如: 應寫為<br />; <META name="keyXML, SGML, <IMG src= "cool.gif">應寫為<IMG src= "cool.gif" /> 第四章 XML語法 二.元素的語法 元素由一對標識以及其中的內容組成。就象這樣:ajie。元素的名稱和標識的名稱是一樣的。標識可以用屬性來進一步描述。 在XML中,沒有任何保留字,所以你可以隨心所欲的用任何詞語來作為元素名稱。但是也必須遵守下列規(guī)范: 1.名稱中可以包含字母、數(shù)字以及其它字母; 2.名稱不能以數(shù)字或"_" (下劃線)開頭; 3.名稱不能以字母 XML(或 XML 或 Xml ..)開頭 4.名稱中不能包含空格 5.名稱中間不能包含":"(冒號) 為了使元素更容易閱讀理解和操作,我們還有一些建議: 1.名稱中不要使用"."。因為在很多程序語言中,"."是作為對象的屬性,例如:font.color。同樣的原因"-"也最好不要用,必須使用的,以"_"代替; 2.名稱盡量簡短。 3.名稱的大小寫盡量采用同一標準。 4.名稱可以使用非英文字符,比如用中文。但是有些軟件可能不支持。(IE5目前是支持中文元素的。) 另外,補充一點關于屬性的說明。在word</font>將把word顯示為紅色。而在CSS或者XSL,我們在下面詳細講述。) 三.注釋的語法 注釋是為了便于閱讀和理解,在XML文檔添加的附加信息,將不會被程序解釋或則瀏覽器顯示。 注釋的語法如下: <!-- 這里是注釋信息 --> 可以看到,它和HTML中的注釋語法是一樣的,非常容易。養(yǎng)成良好的注釋習慣將使你的文檔更加便于維護,共享,看起來也更專業(yè)。 四.CDATA的語法 CDATA全稱character data,翻譯為字符數(shù)據。我們在寫 <![CDATA[這里放置需要顯示的字符]]> 例如: <![CDATA[<AUTHOR sex="female">ajie</AUTHOR>]]> 在頁面上顯示的內容將是"<AUTHOR sex="female">ajie</AUTHOR>" 第四章 XML語法 五.Namespaces的語法 Namespaces翻譯為名字空間。名字空間有什么作用呢?當我們在一個XML文檔中使用他人的或者多個DTD文件,就會出現(xiàn)這樣的矛盾:因為XML中標識都是自己創(chuàng)建的,在不同的DTD文件中,標識名可能相同但表示的含義不同,這就可能引起數(shù)據混亂。 比如在一個文檔<table>wood table</table>中<table>表示桌子, 而在另一個文檔<table>namelist</table>中<table>表示表格。如果我需要同時處理這兩個文檔,就會發(fā)生名字沖突。 了解決這個問題,我們引進了namespaces這個概念。namespaces通過給標識名稱加一個網址(URL)定位的方法來區(qū)別這些名稱相同的標識。 Namespaces同樣需要在XML文檔的開頭部分聲明,聲明的語法如下: <document 其中yourname是由你定義的namespaces的名稱,URL就是名字空間的網址。 假設上面的"桌子<table>"文檔來自http://www.zhuozi.com,我們就可以聲明為 <document http://www.zhuozi.com'> 然后在后面的標識中使用定義好的名字空間: <zhuozi:table>wood table</table> 這樣就將這兩個<table>區(qū)分開來。注意的是:設置URL并不是說這個標識真的要到那個網址去讀取,僅僅作為一種區(qū)別的標志而已。 六.entity的語法 entity翻譯為"實體"。它的作用類似 entity可以包含字符,文字等等,使用entity的好處在于:1.它可以減少差錯,文檔中多個相同的部分只需要輸入一遍就可以了。2.它提高維護效率。比如你有40個文檔都包含copyright的entity,如果需要修改這個copyright,不需要所有的文件都修改,只要改最初定義的entity語句就可以了。 XML定義了兩種類型的entity。一種是我們這里說的普通entity,在XML文檔中使用;另一種是參數(shù)entity,在DTD文件中使用。 entity的定義語法為: <!DOCTYPE filename [ <!ENTITY entity-name "entity-content" ] > 例如我要定義一段版權信息: <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved" ] > 如果我的版權信息內容和他人共享一個XML文件,也可以使用外部調用的方法,語法象這樣: <!DOCTYPE copyright [ <!ENTITY copyright SYSTEM "http://www.sample.com/copyright. ] > 定義好的entity在文檔中的引用語法為:&entity-name; 例如,上面定義的版權信息,調用時寫作?copyright; 完整的例子如下,你可以copy下來存為copyright.XML觀看實例: <? <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved"> ]> <myfile> <title>XML</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> ©right; </myfile> 第四章 XML語法 七.DTD的語法 DTD是"有效 1.設置元素 元素是XML文檔的基本組成部分。你要在DTD中定義一個元素,然后在XML文檔中使用。元素的定義語法為:<!ELEMENT DESCRIPTION (#PCDATA, DEFINITION)*> 說明: "<!ELEMENT" 是元素的聲明,說明你要定義的是一個元素; 聲明后面的"DESCRIPTION",是元素的名稱; "(#PCDATA, DEFINITION)*>"則是該元素的使用規(guī)則。規(guī)則定義了元素可以包含的內容以及相互的關系。下面的表格概要列出了元素的規(guī)則: 2.元素規(guī)則表: 此主題相關圖片如下: 另外,我們還可以為元素定義屬性,因為我們不推薦使用屬性,在這里就不詳細展開了。 最后,我們來總結一些前四章學習的內容,寫一個包含DTD,XML,以及Script的簡單實例,便于讀者理解: 1.將下面文件存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 2.然后建立XML文檔myfile.xml: <? <!DOCTYPE myfile SYSTEM "myfile.dtd"> <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 3.建立HTML文檔myfile.html <HTML> <head> <script language=" var nodes = XMLDoc.documentElement.childNodes; title.innerText = nodes.item(0).text; author.innerText = nodes.item(1).text; </script> <title>在HTML中調用XML數(shù)據</title> </head> <body bgcolor="#FFFFFF"> <b>標題: </b> <span id="title"></span><br> <b>作者: </b> <span id="author"></span><br> </body> </HTML> 4.用IE5.0以上瀏覽器打開myfile.HTML就可以看到效果了。 XML輕松學習手冊(5)XML實例解析 第五章:XML實例解析 提綱: 一:實例效果 二:實例解析 1.定義新標識。 2.建立XML文檔。 3.建立相應的HTML文件。 XML在不同領域有著廣泛的應用,比如在科技領域的MathML,無線通信應用的WML,在網絡圖象方面的SVG等等,我們這里側重討論XML在web上的應用。XML在web上應用主要是利用其強大的數(shù)據操作能力。一般用XML配合JavaScript和ASP等服務器端程序,可以實現(xiàn)網絡上幾乎所有的應用需求。 考慮講解方便,我們在下面介紹一個簡單的實例,不包含服務器端程序。目的在于讓您對XML的數(shù)據操作能力有一個感性的認識。 好,我們首先[ 點擊這里 ]來看實例的效果。(請用IE5.0以上版本瀏覽器打開) 這是一個簡單的CD唱片數(shù)據檢索功能。你通過點擊"上一張","下一張"可以看到單張CD的有關信息。這樣的效果我們原來用兩種方法可以實現(xiàn): 1.利用DHTML,將數(shù)據隱藏在不同的層中,通過鼠標事件依次顯示; 2.利用后臺程序(如ASP,CGI,PHP,JSP等),調用服務器端的數(shù)據。 但是在這個實例中,我們打開頁面原代碼可以看到,其中沒有用DHTML的DIV,也沒有表單的action,它完全是用XML來實現(xiàn)的。下面我們來分析它的制作過程: 第一步:定義新標識。 根據實際的CD數(shù)據,首先新建一個名為<CD>的標識;其次建立它相關的數(shù)據標識,分別是:CD名稱<Title>,演唱者<Artist>,出版年代<Year>,國家<Country>,發(fā)行公司<Company>和價格<Price>;最后還要建立一個名為目錄<CATALOG>的標識。為什么要再建立一個<CATALOG>標識呢?因為在XML文檔中規(guī)定,必須且只能有一個根元素(標識),我們有多個CD數(shù)據,這些數(shù)據是并列的關系,所以需要為這些并列的元素建立一個根元素。 以上元素的定義和關系都完全符合XML標準,不需要特別的DTD文件來定義,所以可以省略DTD定義。如果我們想使用DTD來定義,以上過程可以表示為: <!ELEMENT CATALOG (CD)*> <!ELEMENT CD (Title,Artist,Year,Country,Company,Price)> <!ELEMENT Title (#PCDATA)> <!ELEMENT Artist (#PCDATA)> <!ELEMENT Year (#PCDATA)> <!ELEMENT Country (#PCDATA)> <!ELEMENT Company (#PCDATA)> <!ELEMENT Price (#PCDATA)> 這段代碼表示:元素CATALOG包含多個CD子元素,而子元素CD又依次包含Title, Artist, Year, Country, Company, Price 六個子元素,它們的內容都定義為文本(字符,數(shù)字,文本)。(注:具體的語法說明可以看上一章關于DTD的介紹) 第二步:建立XML文檔。 <? <CATALOG> <CD> <TITLE>Empire Burlesque</TITLE> <ARTIST>Bob Dylan</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>Columbia</COMPANY> <PRICE>10.90</PRICE> <YEAR>1985</YEAR> </CD> <CD> <TITLE>Hide your heart</TITLE> <ARTIST>Bonnie Tylor</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>CBS Records</COMPANY> <PRICE>9.90</PRICE> <YEAR>1988</YEAR> </CD> <CD> <TITLE>Greatest Hits</TITLE> <ARTIST>Dolly Parton</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>RCA</COMPANY> <PRICE>9.90</PRICE> <YEAR>1982</YEAR> </CD> <CD> <TITLE>Still got the blues</TITLE> <ARTIST>Gary More</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>Virgin redords</COMPANY> <PRICE>10.20</PRICE> <YEAR>1990</YEAR> </CD> <CD> <TITLE>Eros</TITLE> <ARTIST>Eros Ramazzotti</ARTIST> <COUNTRY>EU</COUNTRY> <COMPANY>BMG</COMPANY> <PRICE>9.90</PRICE> <YEAR>1997</YEAR> </CD> </CATALOG> 上面代碼首先用<? <CATALOG> <CD> ...... </CD> <CD> ...... </CD> </CATALOG> 一共定義了5組數(shù)據。我們將上面的代碼存為cd.XML文件,以備調用。 第三步:建立相應的HTML文件。 1.導入XML數(shù)據。 我們知道,目前流行的瀏覽器中,暫時只有微軟的IE5.0以上版本瀏覽器支持XML。IE是通過在 CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> 定義一個object,ID名為XMLdso。然后在head區(qū)用js引入xml數(shù)據: <script for="window" event="onload"> </script> 2.捆綁數(shù)據。 然后將用<SPAN>標識來將XML數(shù)據綁定在表格中。其中ID,DATASRC,DTATFLD都是<SPAN>的屬性。代碼如下: <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> 3.動作操作。 最后,為數(shù)據提供瀏覽按鈕: <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> 并利用js來完成兩個鼠標點擊功能:movenext()和moveprevious()。在head區(qū)加入如下代碼: <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> 好,我們先看HTML文件的全部原代碼: <HTML> <head> <script for="window" event="onload"> </script> <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> <TITLE>CD Navigate</TITLE> </head> <body> <p> <object WIDTH="0" HEIGHT="0" CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> <p> <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> </p> </body> </HTML> 將以上代碼存為cd.htm文件,于第二步的cd.XML文件放在一起。打開cd.htm文件,你就看見和上面實例一樣的效果了。 好,到今天為止,我們已經學習了關于XML的不少知識,我們來總結一下前面五個章節(jié),分別是XML快速入門,XML的概念原理,XML的術語,XML的語法和本章的實例解析。到這里,教程部分就結束了。在寫作過程中,阿捷盡最大努力將有關XML概念講得通俗易懂,盡量把自己的理解告訴給大家,但因為本人學習XML時間也不長,對整個XML的技術把握還不夠系統(tǒng)和深入,所以難免有疏漏的地方,請大家指正和諒解,謝謝! posted on 2009-02-15 15:45 YXY 閱讀(187) 評論(0) 編輯 收藏
其中你必須說明文檔遵守的 良好格式的XML文檔必須有一個根元素,就是緊接著聲明后面建立的第一個元素,其它元素都是這個根元素的子元素,屬于根元素一組。 良好格式的XML文檔的內容書寫時必須遵守XML語法。(有關XML語法我們將在下一章仔細講解) 7.Valid XML(有效的XML) 一個遵守 將XML文檔和它的DTD文件進行比較分析,看是否符合DTD規(guī)則的過程叫validation(確認)。這樣的過程通常我們是通過一個名為parser的軟件來處理的。 有效的XML文檔也必須以一個XML聲明開始,例如: <? 和上面例子不同的,在standalone(獨立)屬性中,這里設置的是"no",因為它必須和相應的DTD一起使用,DTD文件的定義方法如下: <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 二.DTD的有關術語 什么是DTD,我們上面已經簡略提到。DTD是一種保證XML文檔格式正確的有效方法,可以比較XML文檔和DTD文件來看文檔是否符合規(guī)范,元素和標簽使用是否正確。一個DTD文檔包含:元素的定義規(guī)則,元素間關系的定義規(guī)則,元素可使用的屬性,可使用的實體或符號規(guī)則。 DTD文件也是一個ASCII的文本文件,后綴名為.dtd。例如:myfile.dtd。 為什么要用DTD文件呢?我的理解是它滿足了網絡共享和數(shù)據交互,使用DTD最大的好處在于DTD文件的共享。(就是上文DTD說明語句中的PUBLIC屬性)。比如,兩個相同行業(yè)不同地區(qū)的人使用同一個DTD文件來作為文檔創(chuàng)建規(guī)范,那么他們的數(shù)據就很容易交換和共享。網上有其他人想補充數(shù)據,也只需要根據公用的DTD規(guī)范來建立文檔,就立刻可以加入。 目前,已經有數(shù)量眾多的寫好的DTD文件可以利用。針對不同的行業(yè)和應用,這些DTD文件已經建立了通用的元素和標簽規(guī)則。你不需要自己重新創(chuàng)建,只要在他們的基礎上加入你需要的新標識。 當然,如果愿意,你可以創(chuàng)建自己的DTD,它可能和你的文檔配合的更加完美。建立自己的DTD也是很簡單的一件事,一般只需要定義4-5個元素就可以了。 調用DTD文件的方法有兩種: 1.直接包含在XML文檔內的DTD 你只要在DOCTYPE聲明中插入一些特別的說明就可以了,象這樣: 我們有一個XML文檔: <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 我們在第一行后面插入下面代碼就可以: <!DOCTYPE myfile [ <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> <!ENTITY copyright "Copyright 2001, Ajie."> ]> 2.調用獨立的DTD文件 將DTD文檔存為.dtd的文件,然后在DOCTYPE聲明行中調用,例如,將下面的代碼存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 然后在XML文檔中調用,在第一行后插入: <!DOCTYPE myfile SYSTEM "myfile.dtd"> 我們可以看到DTD文檔和HTML中js的調用是差不多的,關于DTD文檔具體如何寫,我們將在下一章和XML文檔的語法一起介紹。 下面我們來了解DTD有關的術語: 1.Schema(規(guī)劃) schema是數(shù)據規(guī)則的描述。schema做兩件事: a.它定義元素數(shù)據類型和元素之間的關系; b.它定義元素所能包含的內容類型。 DTD就是關于XML文檔的一個schema。 2.Document Tree(文檔樹) "文檔樹"在前面第二章我們已經提到過,它是文檔元素分級結構的形象表示。一個文檔結構樹包含根元素,根元素是最頂級的元素,(就是緊接著XML聲明語句后的第一個元素)。看例子: <? <filelist> <myfile> <title>...</title> <author>...</author> </myfile> </filelist> 上面的例子分三級結構排列成"樹"狀,其中的<filelist>就是根元素。在XML和DTD文件中,第一個定義的都是根元素。 3.Parent Element(父元素)/Child Element(子元素) 父元素是指包含有其它元素的元素,被包含的元素稱為它的子元素??瓷厦娴?結構樹",其中<myfile>是父元素,<title>,<author>是它的子元素,而<myfile>又是<filelist>的子元素。象<title>這樣沒有包含任何子元素的最后一級元素我們也稱之為"頁元素"。 4.Parser(解析軟件) Parser是一種檢查XML文檔是否遵循DTD規(guī)范的工具軟件。 Parser能獨立使用,也可以成為編輯軟件或瀏覽器的一部分。在后面的相關資源列表里,我列出了當前比較流行的一些parsers。 好了,通過第三章的學習,我們已經了解了一些XML和DTD的基本術語,但是我們還不知道怎樣來寫這些文件,需要遵循什么樣的語法,在下一章,將重點介紹有關撰寫XML和DTD文檔的語法。請繼續(xù)瀏覽,謝謝! XML輕松學習手冊(4)XML語法 第四章 XML語法 提綱: 一.XML語法規(guī)則 二.元素的語法 三.注釋的語法 四.CDATA的語法 五.Namespaces的語法 六.entity的語法 七.DTD的語法 通過前面三章的學習,我們已經對什么是XML,它的實現(xiàn)原理以及相關的術語有所了解。接下來我們就開始學習XML的語法規(guī)范,動手寫自己的XML文檔。 一.XML語法規(guī)則 XML的文檔和HTML的原代碼類似,也是用標識來標識內容。創(chuàng)建XML文檔必須遵守下列重要規(guī)則: 規(guī)則1:必須有XML聲明語句 這一點我們在上一章學習時已經提到過。聲明是XML文檔的第一句,其格式如下: <? 聲明的作用是告訴瀏覽器或者其它處理程序:這個文檔是XML文檔。聲明語句中的version表示文檔遵守的XML規(guī)范的版本;standalone表示文檔是否附帶DTD文件,如果有,參數(shù)為no;encoding表示文檔所用的語言編碼,默認是UTF-8。 規(guī)則2:是否有DTD文件 如果文檔是一個"有效的 <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 規(guī)則3:注意你的大小寫 在XML文檔中,大小寫是有區(qū)別的。<P>和<p>是不同的標識。注意在寫元素時,前后標識大小寫要保持一樣。例如:<Author>ajie</Author>,寫成<Author>ajie</author>是錯誤的。 你最好養(yǎng)成一種習慣,或者全部大寫,或者全部小寫,或者大寫第一個字母。這樣可以減少因為大小寫不匹配產生的文檔錯誤。 規(guī)則4:給屬性值加引號 在HTML代碼里面,屬性值可以加引號,也可以不加。例如:<font color=red> 但是在XML中則規(guī)定,所有屬性值必須加引號(可以是單引號,也可以是雙引號),否則將被視為錯誤。 規(guī)則5:所有的標識必須有相應的結束標識 在HTML中,標識可能不是成對出現(xiàn)的,比?lt;br>。而在XML中規(guī)定,所有標識必須成對出現(xiàn),有一個開始標識,就必須有一個結束標識。否則將被視為錯誤。 規(guī)則6:所有的空標識也必須被關閉 空標識就是標識對之間沒有內容的標識。比如 ,<img>等標識。在XML中,規(guī)定所有的標識必須有結束標識,針對這樣的空標識,XML中處理的方法是在原標識最后加/,就可以了。例如: 應寫為<br />; <META name="keyXML, SGML, <IMG src= "cool.gif">應寫為<IMG src= "cool.gif" /> 第四章 XML語法 二.元素的語法 元素由一對標識以及其中的內容組成。就象這樣:ajie。元素的名稱和標識的名稱是一樣的。標識可以用屬性來進一步描述。 在XML中,沒有任何保留字,所以你可以隨心所欲的用任何詞語來作為元素名稱。但是也必須遵守下列規(guī)范: 1.名稱中可以包含字母、數(shù)字以及其它字母; 2.名稱不能以數(shù)字或"_" (下劃線)開頭; 3.名稱不能以字母 XML(或 XML 或 Xml ..)開頭 4.名稱中不能包含空格 5.名稱中間不能包含":"(冒號) 為了使元素更容易閱讀理解和操作,我們還有一些建議: 1.名稱中不要使用"."。因為在很多程序語言中,"."是作為對象的屬性,例如:font.color。同樣的原因"-"也最好不要用,必須使用的,以"_"代替; 2.名稱盡量簡短。 3.名稱的大小寫盡量采用同一標準。 4.名稱可以使用非英文字符,比如用中文。但是有些軟件可能不支持。(IE5目前是支持中文元素的。) 另外,補充一點關于屬性的說明。在word</font>將把word顯示為紅色。而在CSS或者XSL,我們在下面詳細講述。) 三.注釋的語法 注釋是為了便于閱讀和理解,在XML文檔添加的附加信息,將不會被程序解釋或則瀏覽器顯示。 注釋的語法如下: <!-- 這里是注釋信息 --> 可以看到,它和HTML中的注釋語法是一樣的,非常容易。養(yǎng)成良好的注釋習慣將使你的文檔更加便于維護,共享,看起來也更專業(yè)。 四.CDATA的語法 CDATA全稱character data,翻譯為字符數(shù)據。我們在寫 <![CDATA[這里放置需要顯示的字符]]> 例如: <![CDATA[<AUTHOR sex="female">ajie</AUTHOR>]]> 在頁面上顯示的內容將是"<AUTHOR sex="female">ajie</AUTHOR>" 第四章 XML語法 五.Namespaces的語法 Namespaces翻譯為名字空間。名字空間有什么作用呢?當我們在一個XML文檔中使用他人的或者多個DTD文件,就會出現(xiàn)這樣的矛盾:因為XML中標識都是自己創(chuàng)建的,在不同的DTD文件中,標識名可能相同但表示的含義不同,這就可能引起數(shù)據混亂。 比如在一個文檔<table>wood table</table>中<table>表示桌子, 而在另一個文檔<table>namelist</table>中<table>表示表格。如果我需要同時處理這兩個文檔,就會發(fā)生名字沖突。 了解決這個問題,我們引進了namespaces這個概念。namespaces通過給標識名稱加一個網址(URL)定位的方法來區(qū)別這些名稱相同的標識。 Namespaces同樣需要在XML文檔的開頭部分聲明,聲明的語法如下: <document 其中yourname是由你定義的namespaces的名稱,URL就是名字空間的網址。 假設上面的"桌子<table>"文檔來自http://www.zhuozi.com,我們就可以聲明為 <document http://www.zhuozi.com'> 然后在后面的標識中使用定義好的名字空間: <zhuozi:table>wood table</table> 這樣就將這兩個<table>區(qū)分開來。注意的是:設置URL并不是說這個標識真的要到那個網址去讀取,僅僅作為一種區(qū)別的標志而已。 六.entity的語法 entity翻譯為"實體"。它的作用類似 entity可以包含字符,文字等等,使用entity的好處在于:1.它可以減少差錯,文檔中多個相同的部分只需要輸入一遍就可以了。2.它提高維護效率。比如你有40個文檔都包含copyright的entity,如果需要修改這個copyright,不需要所有的文件都修改,只要改最初定義的entity語句就可以了。 XML定義了兩種類型的entity。一種是我們這里說的普通entity,在XML文檔中使用;另一種是參數(shù)entity,在DTD文件中使用。 entity的定義語法為: <!DOCTYPE filename [ <!ENTITY entity-name "entity-content" ] > 例如我要定義一段版權信息: <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved" ] > 如果我的版權信息內容和他人共享一個XML文件,也可以使用外部調用的方法,語法象這樣: <!DOCTYPE copyright [ <!ENTITY copyright SYSTEM "http://www.sample.com/copyright. ] > 定義好的entity在文檔中的引用語法為:&entity-name; 例如,上面定義的版權信息,調用時寫作?copyright; 完整的例子如下,你可以copy下來存為copyright.XML觀看實例: <? <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved"> ]> <myfile> <title>XML</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> ©right; </myfile> 第四章 XML語法 七.DTD的語法 DTD是"有效 1.設置元素 元素是XML文檔的基本組成部分。你要在DTD中定義一個元素,然后在XML文檔中使用。元素的定義語法為:<!ELEMENT DESCRIPTION (#PCDATA, DEFINITION)*> 說明: "<!ELEMENT" 是元素的聲明,說明你要定義的是一個元素; 聲明后面的"DESCRIPTION",是元素的名稱; "(#PCDATA, DEFINITION)*>"則是該元素的使用規(guī)則。規(guī)則定義了元素可以包含的內容以及相互的關系。下面的表格概要列出了元素的規(guī)則: 2.元素規(guī)則表: 此主題相關圖片如下: 另外,我們還可以為元素定義屬性,因為我們不推薦使用屬性,在這里就不詳細展開了。 最后,我們來總結一些前四章學習的內容,寫一個包含DTD,XML,以及Script的簡單實例,便于讀者理解: 1.將下面文件存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 2.然后建立XML文檔myfile.xml: <? <!DOCTYPE myfile SYSTEM "myfile.dtd"> <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 3.建立HTML文檔myfile.html <HTML> <head> <script language=" var nodes = XMLDoc.documentElement.childNodes; title.innerText = nodes.item(0).text; author.innerText = nodes.item(1).text; </script> <title>在HTML中調用XML數(shù)據</title> </head> <body bgcolor="#FFFFFF"> <b>標題: </b> <span id="title"></span><br> <b>作者: </b> <span id="author"></span><br> </body> </HTML> 4.用IE5.0以上瀏覽器打開myfile.HTML就可以看到效果了。 XML輕松學習手冊(5)XML實例解析 第五章:XML實例解析 提綱: 一:實例效果 二:實例解析 1.定義新標識。 2.建立XML文檔。 3.建立相應的HTML文件。 XML在不同領域有著廣泛的應用,比如在科技領域的MathML,無線通信應用的WML,在網絡圖象方面的SVG等等,我們這里側重討論XML在web上的應用。XML在web上應用主要是利用其強大的數(shù)據操作能力。一般用XML配合JavaScript和ASP等服務器端程序,可以實現(xiàn)網絡上幾乎所有的應用需求。 考慮講解方便,我們在下面介紹一個簡單的實例,不包含服務器端程序。目的在于讓您對XML的數(shù)據操作能力有一個感性的認識。 好,我們首先[ 點擊這里 ]來看實例的效果。(請用IE5.0以上版本瀏覽器打開) 這是一個簡單的CD唱片數(shù)據檢索功能。你通過點擊"上一張","下一張"可以看到單張CD的有關信息。這樣的效果我們原來用兩種方法可以實現(xiàn): 1.利用DHTML,將數(shù)據隱藏在不同的層中,通過鼠標事件依次顯示; 2.利用后臺程序(如ASP,CGI,PHP,JSP等),調用服務器端的數(shù)據。 但是在這個實例中,我們打開頁面原代碼可以看到,其中沒有用DHTML的DIV,也沒有表單的action,它完全是用XML來實現(xiàn)的。下面我們來分析它的制作過程: 第一步:定義新標識。 根據實際的CD數(shù)據,首先新建一個名為<CD>的標識;其次建立它相關的數(shù)據標識,分別是:CD名稱<Title>,演唱者<Artist>,出版年代<Year>,國家<Country>,發(fā)行公司<Company>和價格<Price>;最后還要建立一個名為目錄<CATALOG>的標識。為什么要再建立一個<CATALOG>標識呢?因為在XML文檔中規(guī)定,必須且只能有一個根元素(標識),我們有多個CD數(shù)據,這些數(shù)據是并列的關系,所以需要為這些并列的元素建立一個根元素。 以上元素的定義和關系都完全符合XML標準,不需要特別的DTD文件來定義,所以可以省略DTD定義。如果我們想使用DTD來定義,以上過程可以表示為: <!ELEMENT CATALOG (CD)*> <!ELEMENT CD (Title,Artist,Year,Country,Company,Price)> <!ELEMENT Title (#PCDATA)> <!ELEMENT Artist (#PCDATA)> <!ELEMENT Year (#PCDATA)> <!ELEMENT Country (#PCDATA)> <!ELEMENT Company (#PCDATA)> <!ELEMENT Price (#PCDATA)> 這段代碼表示:元素CATALOG包含多個CD子元素,而子元素CD又依次包含Title, Artist, Year, Country, Company, Price 六個子元素,它們的內容都定義為文本(字符,數(shù)字,文本)。(注:具體的語法說明可以看上一章關于DTD的介紹) 第二步:建立XML文檔。 <? <CATALOG> <CD> <TITLE>Empire Burlesque</TITLE> <ARTIST>Bob Dylan</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>Columbia</COMPANY> <PRICE>10.90</PRICE> <YEAR>1985</YEAR> </CD> <CD> <TITLE>Hide your heart</TITLE> <ARTIST>Bonnie Tylor</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>CBS Records</COMPANY> <PRICE>9.90</PRICE> <YEAR>1988</YEAR> </CD> <CD> <TITLE>Greatest Hits</TITLE> <ARTIST>Dolly Parton</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>RCA</COMPANY> <PRICE>9.90</PRICE> <YEAR>1982</YEAR> </CD> <CD> <TITLE>Still got the blues</TITLE> <ARTIST>Gary More</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>Virgin redords</COMPANY> <PRICE>10.20</PRICE> <YEAR>1990</YEAR> </CD> <CD> <TITLE>Eros</TITLE> <ARTIST>Eros Ramazzotti</ARTIST> <COUNTRY>EU</COUNTRY> <COMPANY>BMG</COMPANY> <PRICE>9.90</PRICE> <YEAR>1997</YEAR> </CD> </CATALOG> 上面代碼首先用<? <CATALOG> <CD> ...... </CD> <CD> ...... </CD> </CATALOG> 一共定義了5組數(shù)據。我們將上面的代碼存為cd.XML文件,以備調用。 第三步:建立相應的HTML文件。 1.導入XML數(shù)據。 我們知道,目前流行的瀏覽器中,暫時只有微軟的IE5.0以上版本瀏覽器支持XML。IE是通過在 CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> 定義一個object,ID名為XMLdso。然后在head區(qū)用js引入xml數(shù)據: <script for="window" event="onload"> </script> 2.捆綁數(shù)據。 然后將用<SPAN>標識來將XML數(shù)據綁定在表格中。其中ID,DATASRC,DTATFLD都是<SPAN>的屬性。代碼如下: <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> 3.動作操作。 最后,為數(shù)據提供瀏覽按鈕: <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> 并利用js來完成兩個鼠標點擊功能:movenext()和moveprevious()。在head區(qū)加入如下代碼: <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> 好,我們先看HTML文件的全部原代碼: <HTML> <head> <script for="window" event="onload"> </script> <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> <TITLE>CD Navigate</TITLE> </head> <body> <p> <object WIDTH="0" HEIGHT="0" CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> <p> <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> </p> </body> </HTML> 將以上代碼存為cd.htm文件,于第二步的cd.XML文件放在一起。打開cd.htm文件,你就看見和上面實例一樣的效果了。 好,到今天為止,我們已經學習了關于XML的不少知識,我們來總結一下前面五個章節(jié),分別是XML快速入門,XML的概念原理,XML的術語,XML的語法和本章的實例解析。到這里,教程部分就結束了。在寫作過程中,阿捷盡最大努力將有關XML概念講得通俗易懂,盡量把自己的理解告訴給大家,但因為本人學習XML時間也不長,對整個XML的技術把握還不夠系統(tǒng)和深入,所以難免有疏漏的地方,請大家指正和諒解,謝謝! posted on 2009-02-15 15:45 YXY 閱讀(187) 評論(0) 編輯 收藏
良好格式的XML文檔必須有一個根元素,就是緊接著聲明后面建立的第一個元素,其它元素都是這個根元素的子元素,屬于根元素一組。
良好格式的XML文檔的內容書寫時必須遵守XML語法。(有關XML語法我們將在下一章仔細講解)
7.Valid XML(有效的XML)
一個遵守 將XML文檔和它的DTD文件進行比較分析,看是否符合DTD規(guī)則的過程叫validation(確認)。這樣的過程通常我們是通過一個名為parser的軟件來處理的。 有效的XML文檔也必須以一個XML聲明開始,例如: <? 和上面例子不同的,在standalone(獨立)屬性中,這里設置的是"no",因為它必須和相應的DTD一起使用,DTD文件的定義方法如下: <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 二.DTD的有關術語 什么是DTD,我們上面已經簡略提到。DTD是一種保證XML文檔格式正確的有效方法,可以比較XML文檔和DTD文件來看文檔是否符合規(guī)范,元素和標簽使用是否正確。一個DTD文檔包含:元素的定義規(guī)則,元素間關系的定義規(guī)則,元素可使用的屬性,可使用的實體或符號規(guī)則。 DTD文件也是一個ASCII的文本文件,后綴名為.dtd。例如:myfile.dtd。 為什么要用DTD文件呢?我的理解是它滿足了網絡共享和數(shù)據交互,使用DTD最大的好處在于DTD文件的共享。(就是上文DTD說明語句中的PUBLIC屬性)。比如,兩個相同行業(yè)不同地區(qū)的人使用同一個DTD文件來作為文檔創(chuàng)建規(guī)范,那么他們的數(shù)據就很容易交換和共享。網上有其他人想補充數(shù)據,也只需要根據公用的DTD規(guī)范來建立文檔,就立刻可以加入。 目前,已經有數(shù)量眾多的寫好的DTD文件可以利用。針對不同的行業(yè)和應用,這些DTD文件已經建立了通用的元素和標簽規(guī)則。你不需要自己重新創(chuàng)建,只要在他們的基礎上加入你需要的新標識。 當然,如果愿意,你可以創(chuàng)建自己的DTD,它可能和你的文檔配合的更加完美。建立自己的DTD也是很簡單的一件事,一般只需要定義4-5個元素就可以了。 調用DTD文件的方法有兩種: 1.直接包含在XML文檔內的DTD 你只要在DOCTYPE聲明中插入一些特別的說明就可以了,象這樣: 我們有一個XML文檔: <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 我們在第一行后面插入下面代碼就可以: <!DOCTYPE myfile [ <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> <!ENTITY copyright "Copyright 2001, Ajie."> ]> 2.調用獨立的DTD文件 將DTD文檔存為.dtd的文件,然后在DOCTYPE聲明行中調用,例如,將下面的代碼存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 然后在XML文檔中調用,在第一行后插入: <!DOCTYPE myfile SYSTEM "myfile.dtd"> 我們可以看到DTD文檔和HTML中js的調用是差不多的,關于DTD文檔具體如何寫,我們將在下一章和XML文檔的語法一起介紹。 下面我們來了解DTD有關的術語: 1.Schema(規(guī)劃) schema是數(shù)據規(guī)則的描述。schema做兩件事: a.它定義元素數(shù)據類型和元素之間的關系; b.它定義元素所能包含的內容類型。 DTD就是關于XML文檔的一個schema。 2.Document Tree(文檔樹) "文檔樹"在前面第二章我們已經提到過,它是文檔元素分級結構的形象表示。一個文檔結構樹包含根元素,根元素是最頂級的元素,(就是緊接著XML聲明語句后的第一個元素)。看例子: <? <filelist> <myfile> <title>...</title> <author>...</author> </myfile> </filelist> 上面的例子分三級結構排列成"樹"狀,其中的<filelist>就是根元素。在XML和DTD文件中,第一個定義的都是根元素。 3.Parent Element(父元素)/Child Element(子元素) 父元素是指包含有其它元素的元素,被包含的元素稱為它的子元素??瓷厦娴?結構樹",其中<myfile>是父元素,<title>,<author>是它的子元素,而<myfile>又是<filelist>的子元素。象<title>這樣沒有包含任何子元素的最后一級元素我們也稱之為"頁元素"。 4.Parser(解析軟件) Parser是一種檢查XML文檔是否遵循DTD規(guī)范的工具軟件。 Parser能獨立使用,也可以成為編輯軟件或瀏覽器的一部分。在后面的相關資源列表里,我列出了當前比較流行的一些parsers。 好了,通過第三章的學習,我們已經了解了一些XML和DTD的基本術語,但是我們還不知道怎樣來寫這些文件,需要遵循什么樣的語法,在下一章,將重點介紹有關撰寫XML和DTD文檔的語法。請繼續(xù)瀏覽,謝謝! XML輕松學習手冊(4)XML語法 第四章 XML語法 提綱: 一.XML語法規(guī)則 二.元素的語法 三.注釋的語法 四.CDATA的語法 五.Namespaces的語法 六.entity的語法 七.DTD的語法 通過前面三章的學習,我們已經對什么是XML,它的實現(xiàn)原理以及相關的術語有所了解。接下來我們就開始學習XML的語法規(guī)范,動手寫自己的XML文檔。 一.XML語法規(guī)則 XML的文檔和HTML的原代碼類似,也是用標識來標識內容。創(chuàng)建XML文檔必須遵守下列重要規(guī)則: 規(guī)則1:必須有XML聲明語句 這一點我們在上一章學習時已經提到過。聲明是XML文檔的第一句,其格式如下: <? 聲明的作用是告訴瀏覽器或者其它處理程序:這個文檔是XML文檔。聲明語句中的version表示文檔遵守的XML規(guī)范的版本;standalone表示文檔是否附帶DTD文件,如果有,參數(shù)為no;encoding表示文檔所用的語言編碼,默認是UTF-8。 規(guī)則2:是否有DTD文件 如果文檔是一個"有效的 <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 規(guī)則3:注意你的大小寫 在XML文檔中,大小寫是有區(qū)別的。<P>和<p>是不同的標識。注意在寫元素時,前后標識大小寫要保持一樣。例如:<Author>ajie</Author>,寫成<Author>ajie</author>是錯誤的。 你最好養(yǎng)成一種習慣,或者全部大寫,或者全部小寫,或者大寫第一個字母。這樣可以減少因為大小寫不匹配產生的文檔錯誤。 規(guī)則4:給屬性值加引號 在HTML代碼里面,屬性值可以加引號,也可以不加。例如:<font color=red> 但是在XML中則規(guī)定,所有屬性值必須加引號(可以是單引號,也可以是雙引號),否則將被視為錯誤。 規(guī)則5:所有的標識必須有相應的結束標識 在HTML中,標識可能不是成對出現(xiàn)的,比?lt;br>。而在XML中規(guī)定,所有標識必須成對出現(xiàn),有一個開始標識,就必須有一個結束標識。否則將被視為錯誤。 規(guī)則6:所有的空標識也必須被關閉 空標識就是標識對之間沒有內容的標識。比如 ,<img>等標識。在XML中,規(guī)定所有的標識必須有結束標識,針對這樣的空標識,XML中處理的方法是在原標識最后加/,就可以了。例如: 應寫為<br />; <META name="keyXML, SGML, <IMG src= "cool.gif">應寫為<IMG src= "cool.gif" /> 第四章 XML語法 二.元素的語法 元素由一對標識以及其中的內容組成。就象這樣:ajie。元素的名稱和標識的名稱是一樣的。標識可以用屬性來進一步描述。 在XML中,沒有任何保留字,所以你可以隨心所欲的用任何詞語來作為元素名稱。但是也必須遵守下列規(guī)范: 1.名稱中可以包含字母、數(shù)字以及其它字母; 2.名稱不能以數(shù)字或"_" (下劃線)開頭; 3.名稱不能以字母 XML(或 XML 或 Xml ..)開頭 4.名稱中不能包含空格 5.名稱中間不能包含":"(冒號) 為了使元素更容易閱讀理解和操作,我們還有一些建議: 1.名稱中不要使用"."。因為在很多程序語言中,"."是作為對象的屬性,例如:font.color。同樣的原因"-"也最好不要用,必須使用的,以"_"代替; 2.名稱盡量簡短。 3.名稱的大小寫盡量采用同一標準。 4.名稱可以使用非英文字符,比如用中文。但是有些軟件可能不支持。(IE5目前是支持中文元素的。) 另外,補充一點關于屬性的說明。在word</font>將把word顯示為紅色。而在CSS或者XSL,我們在下面詳細講述。) 三.注釋的語法 注釋是為了便于閱讀和理解,在XML文檔添加的附加信息,將不會被程序解釋或則瀏覽器顯示。 注釋的語法如下: <!-- 這里是注釋信息 --> 可以看到,它和HTML中的注釋語法是一樣的,非常容易。養(yǎng)成良好的注釋習慣將使你的文檔更加便于維護,共享,看起來也更專業(yè)。 四.CDATA的語法 CDATA全稱character data,翻譯為字符數(shù)據。我們在寫 <![CDATA[這里放置需要顯示的字符]]> 例如: <![CDATA[<AUTHOR sex="female">ajie</AUTHOR>]]> 在頁面上顯示的內容將是"<AUTHOR sex="female">ajie</AUTHOR>" 第四章 XML語法 五.Namespaces的語法 Namespaces翻譯為名字空間。名字空間有什么作用呢?當我們在一個XML文檔中使用他人的或者多個DTD文件,就會出現(xiàn)這樣的矛盾:因為XML中標識都是自己創(chuàng)建的,在不同的DTD文件中,標識名可能相同但表示的含義不同,這就可能引起數(shù)據混亂。 比如在一個文檔<table>wood table</table>中<table>表示桌子, 而在另一個文檔<table>namelist</table>中<table>表示表格。如果我需要同時處理這兩個文檔,就會發(fā)生名字沖突。 了解決這個問題,我們引進了namespaces這個概念。namespaces通過給標識名稱加一個網址(URL)定位的方法來區(qū)別這些名稱相同的標識。 Namespaces同樣需要在XML文檔的開頭部分聲明,聲明的語法如下: <document 其中yourname是由你定義的namespaces的名稱,URL就是名字空間的網址。 假設上面的"桌子<table>"文檔來自http://www.zhuozi.com,我們就可以聲明為 <document http://www.zhuozi.com'> 然后在后面的標識中使用定義好的名字空間: <zhuozi:table>wood table</table> 這樣就將這兩個<table>區(qū)分開來。注意的是:設置URL并不是說這個標識真的要到那個網址去讀取,僅僅作為一種區(qū)別的標志而已。 六.entity的語法 entity翻譯為"實體"。它的作用類似 entity可以包含字符,文字等等,使用entity的好處在于:1.它可以減少差錯,文檔中多個相同的部分只需要輸入一遍就可以了。2.它提高維護效率。比如你有40個文檔都包含copyright的entity,如果需要修改這個copyright,不需要所有的文件都修改,只要改最初定義的entity語句就可以了。 XML定義了兩種類型的entity。一種是我們這里說的普通entity,在XML文檔中使用;另一種是參數(shù)entity,在DTD文件中使用。 entity的定義語法為: <!DOCTYPE filename [ <!ENTITY entity-name "entity-content" ] > 例如我要定義一段版權信息: <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved" ] > 如果我的版權信息內容和他人共享一個XML文件,也可以使用外部調用的方法,語法象這樣: <!DOCTYPE copyright [ <!ENTITY copyright SYSTEM "http://www.sample.com/copyright. ] > 定義好的entity在文檔中的引用語法為:&entity-name; 例如,上面定義的版權信息,調用時寫作?copyright; 完整的例子如下,你可以copy下來存為copyright.XML觀看實例: <? <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved"> ]> <myfile> <title>XML</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> ©right; </myfile> 第四章 XML語法 七.DTD的語法 DTD是"有效 1.設置元素 元素是XML文檔的基本組成部分。你要在DTD中定義一個元素,然后在XML文檔中使用。元素的定義語法為:<!ELEMENT DESCRIPTION (#PCDATA, DEFINITION)*> 說明: "<!ELEMENT" 是元素的聲明,說明你要定義的是一個元素; 聲明后面的"DESCRIPTION",是元素的名稱; "(#PCDATA, DEFINITION)*>"則是該元素的使用規(guī)則。規(guī)則定義了元素可以包含的內容以及相互的關系。下面的表格概要列出了元素的規(guī)則: 2.元素規(guī)則表: 此主題相關圖片如下: 另外,我們還可以為元素定義屬性,因為我們不推薦使用屬性,在這里就不詳細展開了。 最后,我們來總結一些前四章學習的內容,寫一個包含DTD,XML,以及Script的簡單實例,便于讀者理解: 1.將下面文件存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 2.然后建立XML文檔myfile.xml: <? <!DOCTYPE myfile SYSTEM "myfile.dtd"> <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 3.建立HTML文檔myfile.html <HTML> <head> <script language=" var nodes = XMLDoc.documentElement.childNodes; title.innerText = nodes.item(0).text; author.innerText = nodes.item(1).text; </script> <title>在HTML中調用XML數(shù)據</title> </head> <body bgcolor="#FFFFFF"> <b>標題: </b> <span id="title"></span><br> <b>作者: </b> <span id="author"></span><br> </body> </HTML> 4.用IE5.0以上瀏覽器打開myfile.HTML就可以看到效果了。 XML輕松學習手冊(5)XML實例解析 第五章:XML實例解析 提綱: 一:實例效果 二:實例解析 1.定義新標識。 2.建立XML文檔。 3.建立相應的HTML文件。 XML在不同領域有著廣泛的應用,比如在科技領域的MathML,無線通信應用的WML,在網絡圖象方面的SVG等等,我們這里側重討論XML在web上的應用。XML在web上應用主要是利用其強大的數(shù)據操作能力。一般用XML配合JavaScript和ASP等服務器端程序,可以實現(xiàn)網絡上幾乎所有的應用需求。 考慮講解方便,我們在下面介紹一個簡單的實例,不包含服務器端程序。目的在于讓您對XML的數(shù)據操作能力有一個感性的認識。 好,我們首先[ 點擊這里 ]來看實例的效果。(請用IE5.0以上版本瀏覽器打開) 這是一個簡單的CD唱片數(shù)據檢索功能。你通過點擊"上一張","下一張"可以看到單張CD的有關信息。這樣的效果我們原來用兩種方法可以實現(xiàn): 1.利用DHTML,將數(shù)據隱藏在不同的層中,通過鼠標事件依次顯示; 2.利用后臺程序(如ASP,CGI,PHP,JSP等),調用服務器端的數(shù)據。 但是在這個實例中,我們打開頁面原代碼可以看到,其中沒有用DHTML的DIV,也沒有表單的action,它完全是用XML來實現(xiàn)的。下面我們來分析它的制作過程: 第一步:定義新標識。 根據實際的CD數(shù)據,首先新建一個名為<CD>的標識;其次建立它相關的數(shù)據標識,分別是:CD名稱<Title>,演唱者<Artist>,出版年代<Year>,國家<Country>,發(fā)行公司<Company>和價格<Price>;最后還要建立一個名為目錄<CATALOG>的標識。為什么要再建立一個<CATALOG>標識呢?因為在XML文檔中規(guī)定,必須且只能有一個根元素(標識),我們有多個CD數(shù)據,這些數(shù)據是并列的關系,所以需要為這些并列的元素建立一個根元素。 以上元素的定義和關系都完全符合XML標準,不需要特別的DTD文件來定義,所以可以省略DTD定義。如果我們想使用DTD來定義,以上過程可以表示為: <!ELEMENT CATALOG (CD)*> <!ELEMENT CD (Title,Artist,Year,Country,Company,Price)> <!ELEMENT Title (#PCDATA)> <!ELEMENT Artist (#PCDATA)> <!ELEMENT Year (#PCDATA)> <!ELEMENT Country (#PCDATA)> <!ELEMENT Company (#PCDATA)> <!ELEMENT Price (#PCDATA)> 這段代碼表示:元素CATALOG包含多個CD子元素,而子元素CD又依次包含Title, Artist, Year, Country, Company, Price 六個子元素,它們的內容都定義為文本(字符,數(shù)字,文本)。(注:具體的語法說明可以看上一章關于DTD的介紹) 第二步:建立XML文檔。 <? <CATALOG> <CD> <TITLE>Empire Burlesque</TITLE> <ARTIST>Bob Dylan</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>Columbia</COMPANY> <PRICE>10.90</PRICE> <YEAR>1985</YEAR> </CD> <CD> <TITLE>Hide your heart</TITLE> <ARTIST>Bonnie Tylor</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>CBS Records</COMPANY> <PRICE>9.90</PRICE> <YEAR>1988</YEAR> </CD> <CD> <TITLE>Greatest Hits</TITLE> <ARTIST>Dolly Parton</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>RCA</COMPANY> <PRICE>9.90</PRICE> <YEAR>1982</YEAR> </CD> <CD> <TITLE>Still got the blues</TITLE> <ARTIST>Gary More</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>Virgin redords</COMPANY> <PRICE>10.20</PRICE> <YEAR>1990</YEAR> </CD> <CD> <TITLE>Eros</TITLE> <ARTIST>Eros Ramazzotti</ARTIST> <COUNTRY>EU</COUNTRY> <COMPANY>BMG</COMPANY> <PRICE>9.90</PRICE> <YEAR>1997</YEAR> </CD> </CATALOG> 上面代碼首先用<? <CATALOG> <CD> ...... </CD> <CD> ...... </CD> </CATALOG> 一共定義了5組數(shù)據。我們將上面的代碼存為cd.XML文件,以備調用。 第三步:建立相應的HTML文件。 1.導入XML數(shù)據。 我們知道,目前流行的瀏覽器中,暫時只有微軟的IE5.0以上版本瀏覽器支持XML。IE是通過在 CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> 定義一個object,ID名為XMLdso。然后在head區(qū)用js引入xml數(shù)據: <script for="window" event="onload"> </script> 2.捆綁數(shù)據。 然后將用<SPAN>標識來將XML數(shù)據綁定在表格中。其中ID,DATASRC,DTATFLD都是<SPAN>的屬性。代碼如下: <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> 3.動作操作。 最后,為數(shù)據提供瀏覽按鈕: <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> 并利用js來完成兩個鼠標點擊功能:movenext()和moveprevious()。在head區(qū)加入如下代碼: <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> 好,我們先看HTML文件的全部原代碼: <HTML> <head> <script for="window" event="onload"> </script> <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> <TITLE>CD Navigate</TITLE> </head> <body> <p> <object WIDTH="0" HEIGHT="0" CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> <p> <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> </p> </body> </HTML> 將以上代碼存為cd.htm文件,于第二步的cd.XML文件放在一起。打開cd.htm文件,你就看見和上面實例一樣的效果了。 好,到今天為止,我們已經學習了關于XML的不少知識,我們來總結一下前面五個章節(jié),分別是XML快速入門,XML的概念原理,XML的術語,XML的語法和本章的實例解析。到這里,教程部分就結束了。在寫作過程中,阿捷盡最大努力將有關XML概念講得通俗易懂,盡量把自己的理解告訴給大家,但因為本人學習XML時間也不長,對整個XML的技術把握還不夠系統(tǒng)和深入,所以難免有疏漏的地方,請大家指正和諒解,謝謝! posted on 2009-02-15 15:45 YXY 閱讀(187) 評論(0) 編輯 收藏
將XML文檔和它的DTD文件進行比較分析,看是否符合DTD規(guī)則的過程叫validation(確認)。這樣的過程通常我們是通過一個名為parser的軟件來處理的。
有效的XML文檔也必須以一個XML聲明開始,例如:
<? 和上面例子不同的,在standalone(獨立)屬性中,這里設置的是"no",因為它必須和相應的DTD一起使用,DTD文件的定義方法如下: <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 二.DTD的有關術語 什么是DTD,我們上面已經簡略提到。DTD是一種保證XML文檔格式正確的有效方法,可以比較XML文檔和DTD文件來看文檔是否符合規(guī)范,元素和標簽使用是否正確。一個DTD文檔包含:元素的定義規(guī)則,元素間關系的定義規(guī)則,元素可使用的屬性,可使用的實體或符號規(guī)則。 DTD文件也是一個ASCII的文本文件,后綴名為.dtd。例如:myfile.dtd。 為什么要用DTD文件呢?我的理解是它滿足了網絡共享和數(shù)據交互,使用DTD最大的好處在于DTD文件的共享。(就是上文DTD說明語句中的PUBLIC屬性)。比如,兩個相同行業(yè)不同地區(qū)的人使用同一個DTD文件來作為文檔創(chuàng)建規(guī)范,那么他們的數(shù)據就很容易交換和共享。網上有其他人想補充數(shù)據,也只需要根據公用的DTD規(guī)范來建立文檔,就立刻可以加入。 目前,已經有數(shù)量眾多的寫好的DTD文件可以利用。針對不同的行業(yè)和應用,這些DTD文件已經建立了通用的元素和標簽規(guī)則。你不需要自己重新創(chuàng)建,只要在他們的基礎上加入你需要的新標識。 當然,如果愿意,你可以創(chuàng)建自己的DTD,它可能和你的文檔配合的更加完美。建立自己的DTD也是很簡單的一件事,一般只需要定義4-5個元素就可以了。 調用DTD文件的方法有兩種: 1.直接包含在XML文檔內的DTD 你只要在DOCTYPE聲明中插入一些特別的說明就可以了,象這樣: 我們有一個XML文檔: <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 我們在第一行后面插入下面代碼就可以: <!DOCTYPE myfile [ <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> <!ENTITY copyright "Copyright 2001, Ajie."> ]> 2.調用獨立的DTD文件 將DTD文檔存為.dtd的文件,然后在DOCTYPE聲明行中調用,例如,將下面的代碼存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 然后在XML文檔中調用,在第一行后插入: <!DOCTYPE myfile SYSTEM "myfile.dtd"> 我們可以看到DTD文檔和HTML中js的調用是差不多的,關于DTD文檔具體如何寫,我們將在下一章和XML文檔的語法一起介紹。 下面我們來了解DTD有關的術語: 1.Schema(規(guī)劃) schema是數(shù)據規(guī)則的描述。schema做兩件事: a.它定義元素數(shù)據類型和元素之間的關系; b.它定義元素所能包含的內容類型。 DTD就是關于XML文檔的一個schema。 2.Document Tree(文檔樹) "文檔樹"在前面第二章我們已經提到過,它是文檔元素分級結構的形象表示。一個文檔結構樹包含根元素,根元素是最頂級的元素,(就是緊接著XML聲明語句后的第一個元素)。看例子: <? <filelist> <myfile> <title>...</title> <author>...</author> </myfile> </filelist> 上面的例子分三級結構排列成"樹"狀,其中的<filelist>就是根元素。在XML和DTD文件中,第一個定義的都是根元素。 3.Parent Element(父元素)/Child Element(子元素) 父元素是指包含有其它元素的元素,被包含的元素稱為它的子元素??瓷厦娴?結構樹",其中<myfile>是父元素,<title>,<author>是它的子元素,而<myfile>又是<filelist>的子元素。象<title>這樣沒有包含任何子元素的最后一級元素我們也稱之為"頁元素"。 4.Parser(解析軟件) Parser是一種檢查XML文檔是否遵循DTD規(guī)范的工具軟件。 Parser能獨立使用,也可以成為編輯軟件或瀏覽器的一部分。在后面的相關資源列表里,我列出了當前比較流行的一些parsers。 好了,通過第三章的學習,我們已經了解了一些XML和DTD的基本術語,但是我們還不知道怎樣來寫這些文件,需要遵循什么樣的語法,在下一章,將重點介紹有關撰寫XML和DTD文檔的語法。請繼續(xù)瀏覽,謝謝! XML輕松學習手冊(4)XML語法 第四章 XML語法 提綱: 一.XML語法規(guī)則 二.元素的語法 三.注釋的語法 四.CDATA的語法 五.Namespaces的語法 六.entity的語法 七.DTD的語法 通過前面三章的學習,我們已經對什么是XML,它的實現(xiàn)原理以及相關的術語有所了解。接下來我們就開始學習XML的語法規(guī)范,動手寫自己的XML文檔。 一.XML語法規(guī)則 XML的文檔和HTML的原代碼類似,也是用標識來標識內容。創(chuàng)建XML文檔必須遵守下列重要規(guī)則: 規(guī)則1:必須有XML聲明語句 這一點我們在上一章學習時已經提到過。聲明是XML文檔的第一句,其格式如下: <? 聲明的作用是告訴瀏覽器或者其它處理程序:這個文檔是XML文檔。聲明語句中的version表示文檔遵守的XML規(guī)范的版本;standalone表示文檔是否附帶DTD文件,如果有,參數(shù)為no;encoding表示文檔所用的語言編碼,默認是UTF-8。 規(guī)則2:是否有DTD文件 如果文檔是一個"有效的 <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 規(guī)則3:注意你的大小寫 在XML文檔中,大小寫是有區(qū)別的。<P>和<p>是不同的標識。注意在寫元素時,前后標識大小寫要保持一樣。例如:<Author>ajie</Author>,寫成<Author>ajie</author>是錯誤的。 你最好養(yǎng)成一種習慣,或者全部大寫,或者全部小寫,或者大寫第一個字母。這樣可以減少因為大小寫不匹配產生的文檔錯誤。 規(guī)則4:給屬性值加引號 在HTML代碼里面,屬性值可以加引號,也可以不加。例如:<font color=red> 但是在XML中則規(guī)定,所有屬性值必須加引號(可以是單引號,也可以是雙引號),否則將被視為錯誤。 規(guī)則5:所有的標識必須有相應的結束標識 在HTML中,標識可能不是成對出現(xiàn)的,比?lt;br>。而在XML中規(guī)定,所有標識必須成對出現(xiàn),有一個開始標識,就必須有一個結束標識。否則將被視為錯誤。 規(guī)則6:所有的空標識也必須被關閉 空標識就是標識對之間沒有內容的標識。比如 ,<img>等標識。在XML中,規(guī)定所有的標識必須有結束標識,針對這樣的空標識,XML中處理的方法是在原標識最后加/,就可以了。例如: 應寫為<br />; <META name="keyXML, SGML, <IMG src= "cool.gif">應寫為<IMG src= "cool.gif" /> 第四章 XML語法 二.元素的語法 元素由一對標識以及其中的內容組成。就象這樣:ajie。元素的名稱和標識的名稱是一樣的。標識可以用屬性來進一步描述。 在XML中,沒有任何保留字,所以你可以隨心所欲的用任何詞語來作為元素名稱。但是也必須遵守下列規(guī)范: 1.名稱中可以包含字母、數(shù)字以及其它字母; 2.名稱不能以數(shù)字或"_" (下劃線)開頭; 3.名稱不能以字母 XML(或 XML 或 Xml ..)開頭 4.名稱中不能包含空格 5.名稱中間不能包含":"(冒號) 為了使元素更容易閱讀理解和操作,我們還有一些建議: 1.名稱中不要使用"."。因為在很多程序語言中,"."是作為對象的屬性,例如:font.color。同樣的原因"-"也最好不要用,必須使用的,以"_"代替; 2.名稱盡量簡短。 3.名稱的大小寫盡量采用同一標準。 4.名稱可以使用非英文字符,比如用中文。但是有些軟件可能不支持。(IE5目前是支持中文元素的。) 另外,補充一點關于屬性的說明。在word</font>將把word顯示為紅色。而在CSS或者XSL,我們在下面詳細講述。) 三.注釋的語法 注釋是為了便于閱讀和理解,在XML文檔添加的附加信息,將不會被程序解釋或則瀏覽器顯示。 注釋的語法如下: <!-- 這里是注釋信息 --> 可以看到,它和HTML中的注釋語法是一樣的,非常容易。養(yǎng)成良好的注釋習慣將使你的文檔更加便于維護,共享,看起來也更專業(yè)。 四.CDATA的語法 CDATA全稱character data,翻譯為字符數(shù)據。我們在寫 <![CDATA[這里放置需要顯示的字符]]> 例如: <![CDATA[<AUTHOR sex="female">ajie</AUTHOR>]]> 在頁面上顯示的內容將是"<AUTHOR sex="female">ajie</AUTHOR>" 第四章 XML語法 五.Namespaces的語法 Namespaces翻譯為名字空間。名字空間有什么作用呢?當我們在一個XML文檔中使用他人的或者多個DTD文件,就會出現(xiàn)這樣的矛盾:因為XML中標識都是自己創(chuàng)建的,在不同的DTD文件中,標識名可能相同但表示的含義不同,這就可能引起數(shù)據混亂。 比如在一個文檔<table>wood table</table>中<table>表示桌子, 而在另一個文檔<table>namelist</table>中<table>表示表格。如果我需要同時處理這兩個文檔,就會發(fā)生名字沖突。 了解決這個問題,我們引進了namespaces這個概念。namespaces通過給標識名稱加一個網址(URL)定位的方法來區(qū)別這些名稱相同的標識。 Namespaces同樣需要在XML文檔的開頭部分聲明,聲明的語法如下: <document 其中yourname是由你定義的namespaces的名稱,URL就是名字空間的網址。 假設上面的"桌子<table>"文檔來自http://www.zhuozi.com,我們就可以聲明為 <document http://www.zhuozi.com'> 然后在后面的標識中使用定義好的名字空間: <zhuozi:table>wood table</table> 這樣就將這兩個<table>區(qū)分開來。注意的是:設置URL并不是說這個標識真的要到那個網址去讀取,僅僅作為一種區(qū)別的標志而已。 六.entity的語法 entity翻譯為"實體"。它的作用類似 entity可以包含字符,文字等等,使用entity的好處在于:1.它可以減少差錯,文檔中多個相同的部分只需要輸入一遍就可以了。2.它提高維護效率。比如你有40個文檔都包含copyright的entity,如果需要修改這個copyright,不需要所有的文件都修改,只要改最初定義的entity語句就可以了。 XML定義了兩種類型的entity。一種是我們這里說的普通entity,在XML文檔中使用;另一種是參數(shù)entity,在DTD文件中使用。 entity的定義語法為: <!DOCTYPE filename [ <!ENTITY entity-name "entity-content" ] > 例如我要定義一段版權信息: <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved" ] > 如果我的版權信息內容和他人共享一個XML文件,也可以使用外部調用的方法,語法象這樣: <!DOCTYPE copyright [ <!ENTITY copyright SYSTEM "http://www.sample.com/copyright. ] > 定義好的entity在文檔中的引用語法為:&entity-name; 例如,上面定義的版權信息,調用時寫作?copyright; 完整的例子如下,你可以copy下來存為copyright.XML觀看實例: <? <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved"> ]> <myfile> <title>XML</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> ©right; </myfile> 第四章 XML語法 七.DTD的語法 DTD是"有效 1.設置元素 元素是XML文檔的基本組成部分。你要在DTD中定義一個元素,然后在XML文檔中使用。元素的定義語法為:<!ELEMENT DESCRIPTION (#PCDATA, DEFINITION)*> 說明: "<!ELEMENT" 是元素的聲明,說明你要定義的是一個元素; 聲明后面的"DESCRIPTION",是元素的名稱; "(#PCDATA, DEFINITION)*>"則是該元素的使用規(guī)則。規(guī)則定義了元素可以包含的內容以及相互的關系。下面的表格概要列出了元素的規(guī)則: 2.元素規(guī)則表: 此主題相關圖片如下: 另外,我們還可以為元素定義屬性,因為我們不推薦使用屬性,在這里就不詳細展開了。 最后,我們來總結一些前四章學習的內容,寫一個包含DTD,XML,以及Script的簡單實例,便于讀者理解: 1.將下面文件存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 2.然后建立XML文檔myfile.xml: <? <!DOCTYPE myfile SYSTEM "myfile.dtd"> <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 3.建立HTML文檔myfile.html <HTML> <head> <script language=" var nodes = XMLDoc.documentElement.childNodes; title.innerText = nodes.item(0).text; author.innerText = nodes.item(1).text; </script> <title>在HTML中調用XML數(shù)據</title> </head> <body bgcolor="#FFFFFF"> <b>標題: </b> <span id="title"></span><br> <b>作者: </b> <span id="author"></span><br> </body> </HTML> 4.用IE5.0以上瀏覽器打開myfile.HTML就可以看到效果了。 XML輕松學習手冊(5)XML實例解析 第五章:XML實例解析 提綱: 一:實例效果 二:實例解析 1.定義新標識。 2.建立XML文檔。 3.建立相應的HTML文件。 XML在不同領域有著廣泛的應用,比如在科技領域的MathML,無線通信應用的WML,在網絡圖象方面的SVG等等,我們這里側重討論XML在web上的應用。XML在web上應用主要是利用其強大的數(shù)據操作能力。一般用XML配合JavaScript和ASP等服務器端程序,可以實現(xiàn)網絡上幾乎所有的應用需求。 考慮講解方便,我們在下面介紹一個簡單的實例,不包含服務器端程序。目的在于讓您對XML的數(shù)據操作能力有一個感性的認識。 好,我們首先[ 點擊這里 ]來看實例的效果。(請用IE5.0以上版本瀏覽器打開) 這是一個簡單的CD唱片數(shù)據檢索功能。你通過點擊"上一張","下一張"可以看到單張CD的有關信息。這樣的效果我們原來用兩種方法可以實現(xiàn): 1.利用DHTML,將數(shù)據隱藏在不同的層中,通過鼠標事件依次顯示; 2.利用后臺程序(如ASP,CGI,PHP,JSP等),調用服務器端的數(shù)據。 但是在這個實例中,我們打開頁面原代碼可以看到,其中沒有用DHTML的DIV,也沒有表單的action,它完全是用XML來實現(xiàn)的。下面我們來分析它的制作過程: 第一步:定義新標識。 根據實際的CD數(shù)據,首先新建一個名為<CD>的標識;其次建立它相關的數(shù)據標識,分別是:CD名稱<Title>,演唱者<Artist>,出版年代<Year>,國家<Country>,發(fā)行公司<Company>和價格<Price>;最后還要建立一個名為目錄<CATALOG>的標識。為什么要再建立一個<CATALOG>標識呢?因為在XML文檔中規(guī)定,必須且只能有一個根元素(標識),我們有多個CD數(shù)據,這些數(shù)據是并列的關系,所以需要為這些并列的元素建立一個根元素。 以上元素的定義和關系都完全符合XML標準,不需要特別的DTD文件來定義,所以可以省略DTD定義。如果我們想使用DTD來定義,以上過程可以表示為: <!ELEMENT CATALOG (CD)*> <!ELEMENT CD (Title,Artist,Year,Country,Company,Price)> <!ELEMENT Title (#PCDATA)> <!ELEMENT Artist (#PCDATA)> <!ELEMENT Year (#PCDATA)> <!ELEMENT Country (#PCDATA)> <!ELEMENT Company (#PCDATA)> <!ELEMENT Price (#PCDATA)> 這段代碼表示:元素CATALOG包含多個CD子元素,而子元素CD又依次包含Title, Artist, Year, Country, Company, Price 六個子元素,它們的內容都定義為文本(字符,數(shù)字,文本)。(注:具體的語法說明可以看上一章關于DTD的介紹) 第二步:建立XML文檔。 <? <CATALOG> <CD> <TITLE>Empire Burlesque</TITLE> <ARTIST>Bob Dylan</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>Columbia</COMPANY> <PRICE>10.90</PRICE> <YEAR>1985</YEAR> </CD> <CD> <TITLE>Hide your heart</TITLE> <ARTIST>Bonnie Tylor</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>CBS Records</COMPANY> <PRICE>9.90</PRICE> <YEAR>1988</YEAR> </CD> <CD> <TITLE>Greatest Hits</TITLE> <ARTIST>Dolly Parton</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>RCA</COMPANY> <PRICE>9.90</PRICE> <YEAR>1982</YEAR> </CD> <CD> <TITLE>Still got the blues</TITLE> <ARTIST>Gary More</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>Virgin redords</COMPANY> <PRICE>10.20</PRICE> <YEAR>1990</YEAR> </CD> <CD> <TITLE>Eros</TITLE> <ARTIST>Eros Ramazzotti</ARTIST> <COUNTRY>EU</COUNTRY> <COMPANY>BMG</COMPANY> <PRICE>9.90</PRICE> <YEAR>1997</YEAR> </CD> </CATALOG> 上面代碼首先用<? <CATALOG> <CD> ...... </CD> <CD> ...... </CD> </CATALOG> 一共定義了5組數(shù)據。我們將上面的代碼存為cd.XML文件,以備調用。 第三步:建立相應的HTML文件。 1.導入XML數(shù)據。 我們知道,目前流行的瀏覽器中,暫時只有微軟的IE5.0以上版本瀏覽器支持XML。IE是通過在 CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> 定義一個object,ID名為XMLdso。然后在head區(qū)用js引入xml數(shù)據: <script for="window" event="onload"> </script> 2.捆綁數(shù)據。 然后將用<SPAN>標識來將XML數(shù)據綁定在表格中。其中ID,DATASRC,DTATFLD都是<SPAN>的屬性。代碼如下: <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> 3.動作操作。 最后,為數(shù)據提供瀏覽按鈕: <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> 并利用js來完成兩個鼠標點擊功能:movenext()和moveprevious()。在head區(qū)加入如下代碼: <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> 好,我們先看HTML文件的全部原代碼: <HTML> <head> <script for="window" event="onload"> </script> <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> <TITLE>CD Navigate</TITLE> </head> <body> <p> <object WIDTH="0" HEIGHT="0" CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> <p> <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> </p> </body> </HTML> 將以上代碼存為cd.htm文件,于第二步的cd.XML文件放在一起。打開cd.htm文件,你就看見和上面實例一樣的效果了。 好,到今天為止,我們已經學習了關于XML的不少知識,我們來總結一下前面五個章節(jié),分別是XML快速入門,XML的概念原理,XML的術語,XML的語法和本章的實例解析。到這里,教程部分就結束了。在寫作過程中,阿捷盡最大努力將有關XML概念講得通俗易懂,盡量把自己的理解告訴給大家,但因為本人學習XML時間也不長,對整個XML的技術把握還不夠系統(tǒng)和深入,所以難免有疏漏的地方,請大家指正和諒解,謝謝! posted on 2009-02-15 15:45 YXY 閱讀(187) 評論(0) 編輯 收藏
和上面例子不同的,在standalone(獨立)屬性中,這里設置的是"no",因為它必須和相應的DTD一起使用,DTD文件的定義方法如下:
<!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name">
其中:
"!DOCTYPE"是指你要定義一個DOCTYPE;
"type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同;
"SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。
"dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。
我們還是用上面的例子,應該寫成這樣:
<? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 二.DTD的有關術語 什么是DTD,我們上面已經簡略提到。DTD是一種保證XML文檔格式正確的有效方法,可以比較XML文檔和DTD文件來看文檔是否符合規(guī)范,元素和標簽使用是否正確。一個DTD文檔包含:元素的定義規(guī)則,元素間關系的定義規(guī)則,元素可使用的屬性,可使用的實體或符號規(guī)則。 DTD文件也是一個ASCII的文本文件,后綴名為.dtd。例如:myfile.dtd。 為什么要用DTD文件呢?我的理解是它滿足了網絡共享和數(shù)據交互,使用DTD最大的好處在于DTD文件的共享。(就是上文DTD說明語句中的PUBLIC屬性)。比如,兩個相同行業(yè)不同地區(qū)的人使用同一個DTD文件來作為文檔創(chuàng)建規(guī)范,那么他們的數(shù)據就很容易交換和共享。網上有其他人想補充數(shù)據,也只需要根據公用的DTD規(guī)范來建立文檔,就立刻可以加入。 目前,已經有數(shù)量眾多的寫好的DTD文件可以利用。針對不同的行業(yè)和應用,這些DTD文件已經建立了通用的元素和標簽規(guī)則。你不需要自己重新創(chuàng)建,只要在他們的基礎上加入你需要的新標識。 當然,如果愿意,你可以創(chuàng)建自己的DTD,它可能和你的文檔配合的更加完美。建立自己的DTD也是很簡單的一件事,一般只需要定義4-5個元素就可以了。 調用DTD文件的方法有兩種: 1.直接包含在XML文檔內的DTD 你只要在DOCTYPE聲明中插入一些特別的說明就可以了,象這樣: 我們有一個XML文檔: <? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 我們在第一行后面插入下面代碼就可以: <!DOCTYPE myfile [ <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> <!ENTITY copyright "Copyright 2001, Ajie."> ]> 2.調用獨立的DTD文件 將DTD文檔存為.dtd的文件,然后在DOCTYPE聲明行中調用,例如,將下面的代碼存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 然后在XML文檔中調用,在第一行后插入: <!DOCTYPE myfile SYSTEM "myfile.dtd"> 我們可以看到DTD文檔和HTML中js的調用是差不多的,關于DTD文檔具體如何寫,我們將在下一章和XML文檔的語法一起介紹。 下面我們來了解DTD有關的術語: 1.Schema(規(guī)劃) schema是數(shù)據規(guī)則的描述。schema做兩件事: a.它定義元素數(shù)據類型和元素之間的關系; b.它定義元素所能包含的內容類型。 DTD就是關于XML文檔的一個schema。 2.Document Tree(文檔樹) "文檔樹"在前面第二章我們已經提到過,它是文檔元素分級結構的形象表示。一個文檔結構樹包含根元素,根元素是最頂級的元素,(就是緊接著XML聲明語句后的第一個元素)。看例子: <? <filelist> <myfile> <title>...</title> <author>...</author> </myfile> </filelist> 上面的例子分三級結構排列成"樹"狀,其中的<filelist>就是根元素。在XML和DTD文件中,第一個定義的都是根元素。 3.Parent Element(父元素)/Child Element(子元素) 父元素是指包含有其它元素的元素,被包含的元素稱為它的子元素??瓷厦娴?結構樹",其中<myfile>是父元素,<title>,<author>是它的子元素,而<myfile>又是<filelist>的子元素。象<title>這樣沒有包含任何子元素的最后一級元素我們也稱之為"頁元素"。 4.Parser(解析軟件) Parser是一種檢查XML文檔是否遵循DTD規(guī)范的工具軟件。 Parser能獨立使用,也可以成為編輯軟件或瀏覽器的一部分。在后面的相關資源列表里,我列出了當前比較流行的一些parsers。 好了,通過第三章的學習,我們已經了解了一些XML和DTD的基本術語,但是我們還不知道怎樣來寫這些文件,需要遵循什么樣的語法,在下一章,將重點介紹有關撰寫XML和DTD文檔的語法。請繼續(xù)瀏覽,謝謝! XML輕松學習手冊(4)XML語法 第四章 XML語法 提綱: 一.XML語法規(guī)則 二.元素的語法 三.注釋的語法 四.CDATA的語法 五.Namespaces的語法 六.entity的語法 七.DTD的語法 通過前面三章的學習,我們已經對什么是XML,它的實現(xiàn)原理以及相關的術語有所了解。接下來我們就開始學習XML的語法規(guī)范,動手寫自己的XML文檔。 一.XML語法規(guī)則 XML的文檔和HTML的原代碼類似,也是用標識來標識內容。創(chuàng)建XML文檔必須遵守下列重要規(guī)則: 規(guī)則1:必須有XML聲明語句 這一點我們在上一章學習時已經提到過。聲明是XML文檔的第一句,其格式如下: <? 聲明的作用是告訴瀏覽器或者其它處理程序:這個文檔是XML文檔。聲明語句中的version表示文檔遵守的XML規(guī)范的版本;standalone表示文檔是否附帶DTD文件,如果有,參數(shù)為no;encoding表示文檔所用的語言編碼,默認是UTF-8。 規(guī)則2:是否有DTD文件 如果文檔是一個"有效的 <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 規(guī)則3:注意你的大小寫 在XML文檔中,大小寫是有區(qū)別的。<P>和<p>是不同的標識。注意在寫元素時,前后標識大小寫要保持一樣。例如:<Author>ajie</Author>,寫成<Author>ajie</author>是錯誤的。 你最好養(yǎng)成一種習慣,或者全部大寫,或者全部小寫,或者大寫第一個字母。這樣可以減少因為大小寫不匹配產生的文檔錯誤。 規(guī)則4:給屬性值加引號 在HTML代碼里面,屬性值可以加引號,也可以不加。例如:<font color=red> 但是在XML中則規(guī)定,所有屬性值必須加引號(可以是單引號,也可以是雙引號),否則將被視為錯誤。 規(guī)則5:所有的標識必須有相應的結束標識 在HTML中,標識可能不是成對出現(xiàn)的,比?lt;br>。而在XML中規(guī)定,所有標識必須成對出現(xiàn),有一個開始標識,就必須有一個結束標識。否則將被視為錯誤。 規(guī)則6:所有的空標識也必須被關閉 空標識就是標識對之間沒有內容的標識。比如 ,<img>等標識。在XML中,規(guī)定所有的標識必須有結束標識,針對這樣的空標識,XML中處理的方法是在原標識最后加/,就可以了。例如: 應寫為<br />; <META name="keyXML, SGML, <IMG src= "cool.gif">應寫為<IMG src= "cool.gif" /> 第四章 XML語法 二.元素的語法 元素由一對標識以及其中的內容組成。就象這樣:ajie。元素的名稱和標識的名稱是一樣的。標識可以用屬性來進一步描述。 在XML中,沒有任何保留字,所以你可以隨心所欲的用任何詞語來作為元素名稱。但是也必須遵守下列規(guī)范: 1.名稱中可以包含字母、數(shù)字以及其它字母; 2.名稱不能以數(shù)字或"_" (下劃線)開頭; 3.名稱不能以字母 XML(或 XML 或 Xml ..)開頭 4.名稱中不能包含空格 5.名稱中間不能包含":"(冒號) 為了使元素更容易閱讀理解和操作,我們還有一些建議: 1.名稱中不要使用"."。因為在很多程序語言中,"."是作為對象的屬性,例如:font.color。同樣的原因"-"也最好不要用,必須使用的,以"_"代替; 2.名稱盡量簡短。 3.名稱的大小寫盡量采用同一標準。 4.名稱可以使用非英文字符,比如用中文。但是有些軟件可能不支持。(IE5目前是支持中文元素的。) 另外,補充一點關于屬性的說明。在word</font>將把word顯示為紅色。而在CSS或者XSL,我們在下面詳細講述。) 三.注釋的語法 注釋是為了便于閱讀和理解,在XML文檔添加的附加信息,將不會被程序解釋或則瀏覽器顯示。 注釋的語法如下: <!-- 這里是注釋信息 --> 可以看到,它和HTML中的注釋語法是一樣的,非常容易。養(yǎng)成良好的注釋習慣將使你的文檔更加便于維護,共享,看起來也更專業(yè)。 四.CDATA的語法 CDATA全稱character data,翻譯為字符數(shù)據。我們在寫 <![CDATA[這里放置需要顯示的字符]]> 例如: <![CDATA[<AUTHOR sex="female">ajie</AUTHOR>]]> 在頁面上顯示的內容將是"<AUTHOR sex="female">ajie</AUTHOR>" 第四章 XML語法 五.Namespaces的語法 Namespaces翻譯為名字空間。名字空間有什么作用呢?當我們在一個XML文檔中使用他人的或者多個DTD文件,就會出現(xiàn)這樣的矛盾:因為XML中標識都是自己創(chuàng)建的,在不同的DTD文件中,標識名可能相同但表示的含義不同,這就可能引起數(shù)據混亂。 比如在一個文檔<table>wood table</table>中<table>表示桌子, 而在另一個文檔<table>namelist</table>中<table>表示表格。如果我需要同時處理這兩個文檔,就會發(fā)生名字沖突。 了解決這個問題,我們引進了namespaces這個概念。namespaces通過給標識名稱加一個網址(URL)定位的方法來區(qū)別這些名稱相同的標識。 Namespaces同樣需要在XML文檔的開頭部分聲明,聲明的語法如下: <document 其中yourname是由你定義的namespaces的名稱,URL就是名字空間的網址。 假設上面的"桌子<table>"文檔來自http://www.zhuozi.com,我們就可以聲明為 <document http://www.zhuozi.com'> 然后在后面的標識中使用定義好的名字空間: <zhuozi:table>wood table</table> 這樣就將這兩個<table>區(qū)分開來。注意的是:設置URL并不是說這個標識真的要到那個網址去讀取,僅僅作為一種區(qū)別的標志而已。 六.entity的語法 entity翻譯為"實體"。它的作用類似 entity可以包含字符,文字等等,使用entity的好處在于:1.它可以減少差錯,文檔中多個相同的部分只需要輸入一遍就可以了。2.它提高維護效率。比如你有40個文檔都包含copyright的entity,如果需要修改這個copyright,不需要所有的文件都修改,只要改最初定義的entity語句就可以了。 XML定義了兩種類型的entity。一種是我們這里說的普通entity,在XML文檔中使用;另一種是參數(shù)entity,在DTD文件中使用。 entity的定義語法為: <!DOCTYPE filename [ <!ENTITY entity-name "entity-content" ] > 例如我要定義一段版權信息: <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved" ] > 如果我的版權信息內容和他人共享一個XML文件,也可以使用外部調用的方法,語法象這樣: <!DOCTYPE copyright [ <!ENTITY copyright SYSTEM "http://www.sample.com/copyright. ] > 定義好的entity在文檔中的引用語法為:&entity-name; 例如,上面定義的版權信息,調用時寫作?copyright; 完整的例子如下,你可以copy下來存為copyright.XML觀看實例: <? <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved"> ]> <myfile> <title>XML</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> ©right; </myfile> 第四章 XML語法 七.DTD的語法 DTD是"有效 1.設置元素 元素是XML文檔的基本組成部分。你要在DTD中定義一個元素,然后在XML文檔中使用。元素的定義語法為:<!ELEMENT DESCRIPTION (#PCDATA, DEFINITION)*> 說明: "<!ELEMENT" 是元素的聲明,說明你要定義的是一個元素; 聲明后面的"DESCRIPTION",是元素的名稱; "(#PCDATA, DEFINITION)*>"則是該元素的使用規(guī)則。規(guī)則定義了元素可以包含的內容以及相互的關系。下面的表格概要列出了元素的規(guī)則: 2.元素規(guī)則表: 此主題相關圖片如下: 另外,我們還可以為元素定義屬性,因為我們不推薦使用屬性,在這里就不詳細展開了。 最后,我們來總結一些前四章學習的內容,寫一個包含DTD,XML,以及Script的簡單實例,便于讀者理解: 1.將下面文件存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 2.然后建立XML文檔myfile.xml: <? <!DOCTYPE myfile SYSTEM "myfile.dtd"> <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 3.建立HTML文檔myfile.html <HTML> <head> <script language=" var nodes = XMLDoc.documentElement.childNodes; title.innerText = nodes.item(0).text; author.innerText = nodes.item(1).text; </script> <title>在HTML中調用XML數(shù)據</title> </head> <body bgcolor="#FFFFFF"> <b>標題: </b> <span id="title"></span><br> <b>作者: </b> <span id="author"></span><br> </body> </HTML> 4.用IE5.0以上瀏覽器打開myfile.HTML就可以看到效果了。 XML輕松學習手冊(5)XML實例解析 第五章:XML實例解析 提綱: 一:實例效果 二:實例解析 1.定義新標識。 2.建立XML文檔。 3.建立相應的HTML文件。 XML在不同領域有著廣泛的應用,比如在科技領域的MathML,無線通信應用的WML,在網絡圖象方面的SVG等等,我們這里側重討論XML在web上的應用。XML在web上應用主要是利用其強大的數(shù)據操作能力。一般用XML配合JavaScript和ASP等服務器端程序,可以實現(xiàn)網絡上幾乎所有的應用需求。 考慮講解方便,我們在下面介紹一個簡單的實例,不包含服務器端程序。目的在于讓您對XML的數(shù)據操作能力有一個感性的認識。 好,我們首先[ 點擊這里 ]來看實例的效果。(請用IE5.0以上版本瀏覽器打開) 這是一個簡單的CD唱片數(shù)據檢索功能。你通過點擊"上一張","下一張"可以看到單張CD的有關信息。這樣的效果我們原來用兩種方法可以實現(xiàn): 1.利用DHTML,將數(shù)據隱藏在不同的層中,通過鼠標事件依次顯示; 2.利用后臺程序(如ASP,CGI,PHP,JSP等),調用服務器端的數(shù)據。 但是在這個實例中,我們打開頁面原代碼可以看到,其中沒有用DHTML的DIV,也沒有表單的action,它完全是用XML來實現(xiàn)的。下面我們來分析它的制作過程: 第一步:定義新標識。 根據實際的CD數(shù)據,首先新建一個名為<CD>的標識;其次建立它相關的數(shù)據標識,分別是:CD名稱<Title>,演唱者<Artist>,出版年代<Year>,國家<Country>,發(fā)行公司<Company>和價格<Price>;最后還要建立一個名為目錄<CATALOG>的標識。為什么要再建立一個<CATALOG>標識呢?因為在XML文檔中規(guī)定,必須且只能有一個根元素(標識),我們有多個CD數(shù)據,這些數(shù)據是并列的關系,所以需要為這些并列的元素建立一個根元素。 以上元素的定義和關系都完全符合XML標準,不需要特別的DTD文件來定義,所以可以省略DTD定義。如果我們想使用DTD來定義,以上過程可以表示為: <!ELEMENT CATALOG (CD)*> <!ELEMENT CD (Title,Artist,Year,Country,Company,Price)> <!ELEMENT Title (#PCDATA)> <!ELEMENT Artist (#PCDATA)> <!ELEMENT Year (#PCDATA)> <!ELEMENT Country (#PCDATA)> <!ELEMENT Company (#PCDATA)> <!ELEMENT Price (#PCDATA)> 這段代碼表示:元素CATALOG包含多個CD子元素,而子元素CD又依次包含Title, Artist, Year, Country, Company, Price 六個子元素,它們的內容都定義為文本(字符,數(shù)字,文本)。(注:具體的語法說明可以看上一章關于DTD的介紹) 第二步:建立XML文檔。 <? <CATALOG> <CD> <TITLE>Empire Burlesque</TITLE> <ARTIST>Bob Dylan</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>Columbia</COMPANY> <PRICE>10.90</PRICE> <YEAR>1985</YEAR> </CD> <CD> <TITLE>Hide your heart</TITLE> <ARTIST>Bonnie Tylor</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>CBS Records</COMPANY> <PRICE>9.90</PRICE> <YEAR>1988</YEAR> </CD> <CD> <TITLE>Greatest Hits</TITLE> <ARTIST>Dolly Parton</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>RCA</COMPANY> <PRICE>9.90</PRICE> <YEAR>1982</YEAR> </CD> <CD> <TITLE>Still got the blues</TITLE> <ARTIST>Gary More</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>Virgin redords</COMPANY> <PRICE>10.20</PRICE> <YEAR>1990</YEAR> </CD> <CD> <TITLE>Eros</TITLE> <ARTIST>Eros Ramazzotti</ARTIST> <COUNTRY>EU</COUNTRY> <COMPANY>BMG</COMPANY> <PRICE>9.90</PRICE> <YEAR>1997</YEAR> </CD> </CATALOG> 上面代碼首先用<? <CATALOG> <CD> ...... </CD> <CD> ...... </CD> </CATALOG> 一共定義了5組數(shù)據。我們將上面的代碼存為cd.XML文件,以備調用。 第三步:建立相應的HTML文件。 1.導入XML數(shù)據。 我們知道,目前流行的瀏覽器中,暫時只有微軟的IE5.0以上版本瀏覽器支持XML。IE是通過在 CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> 定義一個object,ID名為XMLdso。然后在head區(qū)用js引入xml數(shù)據: <script for="window" event="onload"> </script> 2.捆綁數(shù)據。 然后將用<SPAN>標識來將XML數(shù)據綁定在表格中。其中ID,DATASRC,DTATFLD都是<SPAN>的屬性。代碼如下: <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> 3.動作操作。 最后,為數(shù)據提供瀏覽按鈕: <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> 并利用js來完成兩個鼠標點擊功能:movenext()和moveprevious()。在head區(qū)加入如下代碼: <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> 好,我們先看HTML文件的全部原代碼: <HTML> <head> <script for="window" event="onload"> </script> <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> <TITLE>CD Navigate</TITLE> </head> <body> <p> <object WIDTH="0" HEIGHT="0" CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> <p> <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> </p> </body> </HTML> 將以上代碼存為cd.htm文件,于第二步的cd.XML文件放在一起。打開cd.htm文件,你就看見和上面實例一樣的效果了。 好,到今天為止,我們已經學習了關于XML的不少知識,我們來總結一下前面五個章節(jié),分別是XML快速入門,XML的概念原理,XML的術語,XML的語法和本章的實例解析。到這里,教程部分就結束了。在寫作過程中,阿捷盡最大努力將有關XML概念講得通俗易懂,盡量把自己的理解告訴給大家,但因為本人學習XML時間也不長,對整個XML的技術把握還不夠系統(tǒng)和深入,所以難免有疏漏的地方,請大家指正和諒解,謝謝! posted on 2009-02-15 15:45 YXY 閱讀(187) 評論(0) 編輯 收藏
什么是DTD,我們上面已經簡略提到。DTD是一種保證XML文檔格式正確的有效方法,可以比較XML文檔和DTD文件來看文檔是否符合規(guī)范,元素和標簽使用是否正確。一個DTD文檔包含:元素的定義規(guī)則,元素間關系的定義規(guī)則,元素可使用的屬性,可使用的實體或符號規(guī)則。
DTD文件也是一個ASCII的文本文件,后綴名為.dtd。例如:myfile.dtd。
為什么要用DTD文件呢?我的理解是它滿足了網絡共享和數(shù)據交互,使用DTD最大的好處在于DTD文件的共享。(就是上文DTD說明語句中的PUBLIC屬性)。比如,兩個相同行業(yè)不同地區(qū)的人使用同一個DTD文件來作為文檔創(chuàng)建規(guī)范,那么他們的數(shù)據就很容易交換和共享。網上有其他人想補充數(shù)據,也只需要根據公用的DTD規(guī)范來建立文檔,就立刻可以加入。
目前,已經有數(shù)量眾多的寫好的DTD文件可以利用。針對不同的行業(yè)和應用,這些DTD文件已經建立了通用的元素和標簽規(guī)則。你不需要自己重新創(chuàng)建,只要在他們的基礎上加入你需要的新標識。
當然,如果愿意,你可以創(chuàng)建自己的DTD,它可能和你的文檔配合的更加完美。建立自己的DTD也是很簡單的一件事,一般只需要定義4-5個元素就可以了。
調用DTD文件的方法有兩種:
1.直接包含在XML文檔內的DTD
你只要在DOCTYPE聲明中插入一些特別的說明就可以了,象這樣:
我們有一個XML文檔:
<? <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 我們在第一行后面插入下面代碼就可以: <!DOCTYPE myfile [ <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> <!ENTITY copyright "Copyright 2001, Ajie."> ]> 2.調用獨立的DTD文件 將DTD文檔存為.dtd的文件,然后在DOCTYPE聲明行中調用,例如,將下面的代碼存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 然后在XML文檔中調用,在第一行后插入: <!DOCTYPE myfile SYSTEM "myfile.dtd"> 我們可以看到DTD文檔和HTML中js的調用是差不多的,關于DTD文檔具體如何寫,我們將在下一章和XML文檔的語法一起介紹。 下面我們來了解DTD有關的術語: 1.Schema(規(guī)劃) schema是數(shù)據規(guī)則的描述。schema做兩件事: a.它定義元素數(shù)據類型和元素之間的關系; b.它定義元素所能包含的內容類型。 DTD就是關于XML文檔的一個schema。 2.Document Tree(文檔樹) "文檔樹"在前面第二章我們已經提到過,它是文檔元素分級結構的形象表示。一個文檔結構樹包含根元素,根元素是最頂級的元素,(就是緊接著XML聲明語句后的第一個元素)。看例子: <? <filelist> <myfile> <title>...</title> <author>...</author> </myfile> </filelist> 上面的例子分三級結構排列成"樹"狀,其中的<filelist>就是根元素。在XML和DTD文件中,第一個定義的都是根元素。 3.Parent Element(父元素)/Child Element(子元素) 父元素是指包含有其它元素的元素,被包含的元素稱為它的子元素??瓷厦娴?結構樹",其中<myfile>是父元素,<title>,<author>是它的子元素,而<myfile>又是<filelist>的子元素。象<title>這樣沒有包含任何子元素的最后一級元素我們也稱之為"頁元素"。 4.Parser(解析軟件) Parser是一種檢查XML文檔是否遵循DTD規(guī)范的工具軟件。 Parser能獨立使用,也可以成為編輯軟件或瀏覽器的一部分。在后面的相關資源列表里,我列出了當前比較流行的一些parsers。 好了,通過第三章的學習,我們已經了解了一些XML和DTD的基本術語,但是我們還不知道怎樣來寫這些文件,需要遵循什么樣的語法,在下一章,將重點介紹有關撰寫XML和DTD文檔的語法。請繼續(xù)瀏覽,謝謝! XML輕松學習手冊(4)XML語法 第四章 XML語法 提綱: 一.XML語法規(guī)則 二.元素的語法 三.注釋的語法 四.CDATA的語法 五.Namespaces的語法 六.entity的語法 七.DTD的語法 通過前面三章的學習,我們已經對什么是XML,它的實現(xiàn)原理以及相關的術語有所了解。接下來我們就開始學習XML的語法規(guī)范,動手寫自己的XML文檔。 一.XML語法規(guī)則 XML的文檔和HTML的原代碼類似,也是用標識來標識內容。創(chuàng)建XML文檔必須遵守下列重要規(guī)則: 規(guī)則1:必須有XML聲明語句 這一點我們在上一章學習時已經提到過。聲明是XML文檔的第一句,其格式如下: <? 聲明的作用是告訴瀏覽器或者其它處理程序:這個文檔是XML文檔。聲明語句中的version表示文檔遵守的XML規(guī)范的版本;standalone表示文檔是否附帶DTD文件,如果有,參數(shù)為no;encoding表示文檔所用的語言編碼,默認是UTF-8。 規(guī)則2:是否有DTD文件 如果文檔是一個"有效的 <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 規(guī)則3:注意你的大小寫 在XML文檔中,大小寫是有區(qū)別的。<P>和<p>是不同的標識。注意在寫元素時,前后標識大小寫要保持一樣。例如:<Author>ajie</Author>,寫成<Author>ajie</author>是錯誤的。 你最好養(yǎng)成一種習慣,或者全部大寫,或者全部小寫,或者大寫第一個字母。這樣可以減少因為大小寫不匹配產生的文檔錯誤。 規(guī)則4:給屬性值加引號 在HTML代碼里面,屬性值可以加引號,也可以不加。例如:<font color=red> 但是在XML中則規(guī)定,所有屬性值必須加引號(可以是單引號,也可以是雙引號),否則將被視為錯誤。 規(guī)則5:所有的標識必須有相應的結束標識 在HTML中,標識可能不是成對出現(xiàn)的,比?lt;br>。而在XML中規(guī)定,所有標識必須成對出現(xiàn),有一個開始標識,就必須有一個結束標識。否則將被視為錯誤。 規(guī)則6:所有的空標識也必須被關閉 空標識就是標識對之間沒有內容的標識。比如 ,<img>等標識。在XML中,規(guī)定所有的標識必須有結束標識,針對這樣的空標識,XML中處理的方法是在原標識最后加/,就可以了。例如: 應寫為<br />; <META name="keyXML, SGML, <IMG src= "cool.gif">應寫為<IMG src= "cool.gif" /> 第四章 XML語法 二.元素的語法 元素由一對標識以及其中的內容組成。就象這樣:ajie。元素的名稱和標識的名稱是一樣的。標識可以用屬性來進一步描述。 在XML中,沒有任何保留字,所以你可以隨心所欲的用任何詞語來作為元素名稱。但是也必須遵守下列規(guī)范: 1.名稱中可以包含字母、數(shù)字以及其它字母; 2.名稱不能以數(shù)字或"_" (下劃線)開頭; 3.名稱不能以字母 XML(或 XML 或 Xml ..)開頭 4.名稱中不能包含空格 5.名稱中間不能包含":"(冒號) 為了使元素更容易閱讀理解和操作,我們還有一些建議: 1.名稱中不要使用"."。因為在很多程序語言中,"."是作為對象的屬性,例如:font.color。同樣的原因"-"也最好不要用,必須使用的,以"_"代替; 2.名稱盡量簡短。 3.名稱的大小寫盡量采用同一標準。 4.名稱可以使用非英文字符,比如用中文。但是有些軟件可能不支持。(IE5目前是支持中文元素的。) 另外,補充一點關于屬性的說明。在word</font>將把word顯示為紅色。而在CSS或者XSL,我們在下面詳細講述。) 三.注釋的語法 注釋是為了便于閱讀和理解,在XML文檔添加的附加信息,將不會被程序解釋或則瀏覽器顯示。 注釋的語法如下: <!-- 這里是注釋信息 --> 可以看到,它和HTML中的注釋語法是一樣的,非常容易。養(yǎng)成良好的注釋習慣將使你的文檔更加便于維護,共享,看起來也更專業(yè)。 四.CDATA的語法 CDATA全稱character data,翻譯為字符數(shù)據。我們在寫 <![CDATA[這里放置需要顯示的字符]]> 例如: <![CDATA[<AUTHOR sex="female">ajie</AUTHOR>]]> 在頁面上顯示的內容將是"<AUTHOR sex="female">ajie</AUTHOR>" 第四章 XML語法 五.Namespaces的語法 Namespaces翻譯為名字空間。名字空間有什么作用呢?當我們在一個XML文檔中使用他人的或者多個DTD文件,就會出現(xiàn)這樣的矛盾:因為XML中標識都是自己創(chuàng)建的,在不同的DTD文件中,標識名可能相同但表示的含義不同,這就可能引起數(shù)據混亂。 比如在一個文檔<table>wood table</table>中<table>表示桌子, 而在另一個文檔<table>namelist</table>中<table>表示表格。如果我需要同時處理這兩個文檔,就會發(fā)生名字沖突。 了解決這個問題,我們引進了namespaces這個概念。namespaces通過給標識名稱加一個網址(URL)定位的方法來區(qū)別這些名稱相同的標識。 Namespaces同樣需要在XML文檔的開頭部分聲明,聲明的語法如下: <document 其中yourname是由你定義的namespaces的名稱,URL就是名字空間的網址。 假設上面的"桌子<table>"文檔來自http://www.zhuozi.com,我們就可以聲明為 <document http://www.zhuozi.com'> 然后在后面的標識中使用定義好的名字空間: <zhuozi:table>wood table</table> 這樣就將這兩個<table>區(qū)分開來。注意的是:設置URL并不是說這個標識真的要到那個網址去讀取,僅僅作為一種區(qū)別的標志而已。 六.entity的語法 entity翻譯為"實體"。它的作用類似 entity可以包含字符,文字等等,使用entity的好處在于:1.它可以減少差錯,文檔中多個相同的部分只需要輸入一遍就可以了。2.它提高維護效率。比如你有40個文檔都包含copyright的entity,如果需要修改這個copyright,不需要所有的文件都修改,只要改最初定義的entity語句就可以了。 XML定義了兩種類型的entity。一種是我們這里說的普通entity,在XML文檔中使用;另一種是參數(shù)entity,在DTD文件中使用。 entity的定義語法為: <!DOCTYPE filename [ <!ENTITY entity-name "entity-content" ] > 例如我要定義一段版權信息: <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved" ] > 如果我的版權信息內容和他人共享一個XML文件,也可以使用外部調用的方法,語法象這樣: <!DOCTYPE copyright [ <!ENTITY copyright SYSTEM "http://www.sample.com/copyright. ] > 定義好的entity在文檔中的引用語法為:&entity-name; 例如,上面定義的版權信息,調用時寫作?copyright; 完整的例子如下,你可以copy下來存為copyright.XML觀看實例: <? <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved"> ]> <myfile> <title>XML</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> ©right; </myfile> 第四章 XML語法 七.DTD的語法 DTD是"有效 1.設置元素 元素是XML文檔的基本組成部分。你要在DTD中定義一個元素,然后在XML文檔中使用。元素的定義語法為:<!ELEMENT DESCRIPTION (#PCDATA, DEFINITION)*> 說明: "<!ELEMENT" 是元素的聲明,說明你要定義的是一個元素; 聲明后面的"DESCRIPTION",是元素的名稱; "(#PCDATA, DEFINITION)*>"則是該元素的使用規(guī)則。規(guī)則定義了元素可以包含的內容以及相互的關系。下面的表格概要列出了元素的規(guī)則: 2.元素規(guī)則表: 此主題相關圖片如下: 另外,我們還可以為元素定義屬性,因為我們不推薦使用屬性,在這里就不詳細展開了。 最后,我們來總結一些前四章學習的內容,寫一個包含DTD,XML,以及Script的簡單實例,便于讀者理解: 1.將下面文件存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 2.然后建立XML文檔myfile.xml: <? <!DOCTYPE myfile SYSTEM "myfile.dtd"> <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 3.建立HTML文檔myfile.html <HTML> <head> <script language=" var nodes = XMLDoc.documentElement.childNodes; title.innerText = nodes.item(0).text; author.innerText = nodes.item(1).text; </script> <title>在HTML中調用XML數(shù)據</title> </head> <body bgcolor="#FFFFFF"> <b>標題: </b> <span id="title"></span><br> <b>作者: </b> <span id="author"></span><br> </body> </HTML> 4.用IE5.0以上瀏覽器打開myfile.HTML就可以看到效果了。 XML輕松學習手冊(5)XML實例解析 第五章:XML實例解析 提綱: 一:實例效果 二:實例解析 1.定義新標識。 2.建立XML文檔。 3.建立相應的HTML文件。 XML在不同領域有著廣泛的應用,比如在科技領域的MathML,無線通信應用的WML,在網絡圖象方面的SVG等等,我們這里側重討論XML在web上的應用。XML在web上應用主要是利用其強大的數(shù)據操作能力。一般用XML配合JavaScript和ASP等服務器端程序,可以實現(xiàn)網絡上幾乎所有的應用需求。 考慮講解方便,我們在下面介紹一個簡單的實例,不包含服務器端程序。目的在于讓您對XML的數(shù)據操作能力有一個感性的認識。 好,我們首先[ 點擊這里 ]來看實例的效果。(請用IE5.0以上版本瀏覽器打開) 這是一個簡單的CD唱片數(shù)據檢索功能。你通過點擊"上一張","下一張"可以看到單張CD的有關信息。這樣的效果我們原來用兩種方法可以實現(xiàn): 1.利用DHTML,將數(shù)據隱藏在不同的層中,通過鼠標事件依次顯示; 2.利用后臺程序(如ASP,CGI,PHP,JSP等),調用服務器端的數(shù)據。 但是在這個實例中,我們打開頁面原代碼可以看到,其中沒有用DHTML的DIV,也沒有表單的action,它完全是用XML來實現(xiàn)的。下面我們來分析它的制作過程: 第一步:定義新標識。 根據實際的CD數(shù)據,首先新建一個名為<CD>的標識;其次建立它相關的數(shù)據標識,分別是:CD名稱<Title>,演唱者<Artist>,出版年代<Year>,國家<Country>,發(fā)行公司<Company>和價格<Price>;最后還要建立一個名為目錄<CATALOG>的標識。為什么要再建立一個<CATALOG>標識呢?因為在XML文檔中規(guī)定,必須且只能有一個根元素(標識),我們有多個CD數(shù)據,這些數(shù)據是并列的關系,所以需要為這些并列的元素建立一個根元素。 以上元素的定義和關系都完全符合XML標準,不需要特別的DTD文件來定義,所以可以省略DTD定義。如果我們想使用DTD來定義,以上過程可以表示為: <!ELEMENT CATALOG (CD)*> <!ELEMENT CD (Title,Artist,Year,Country,Company,Price)> <!ELEMENT Title (#PCDATA)> <!ELEMENT Artist (#PCDATA)> <!ELEMENT Year (#PCDATA)> <!ELEMENT Country (#PCDATA)> <!ELEMENT Company (#PCDATA)> <!ELEMENT Price (#PCDATA)> 這段代碼表示:元素CATALOG包含多個CD子元素,而子元素CD又依次包含Title, Artist, Year, Country, Company, Price 六個子元素,它們的內容都定義為文本(字符,數(shù)字,文本)。(注:具體的語法說明可以看上一章關于DTD的介紹) 第二步:建立XML文檔。 <? <CATALOG> <CD> <TITLE>Empire Burlesque</TITLE> <ARTIST>Bob Dylan</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>Columbia</COMPANY> <PRICE>10.90</PRICE> <YEAR>1985</YEAR> </CD> <CD> <TITLE>Hide your heart</TITLE> <ARTIST>Bonnie Tylor</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>CBS Records</COMPANY> <PRICE>9.90</PRICE> <YEAR>1988</YEAR> </CD> <CD> <TITLE>Greatest Hits</TITLE> <ARTIST>Dolly Parton</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>RCA</COMPANY> <PRICE>9.90</PRICE> <YEAR>1982</YEAR> </CD> <CD> <TITLE>Still got the blues</TITLE> <ARTIST>Gary More</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>Virgin redords</COMPANY> <PRICE>10.20</PRICE> <YEAR>1990</YEAR> </CD> <CD> <TITLE>Eros</TITLE> <ARTIST>Eros Ramazzotti</ARTIST> <COUNTRY>EU</COUNTRY> <COMPANY>BMG</COMPANY> <PRICE>9.90</PRICE> <YEAR>1997</YEAR> </CD> </CATALOG> 上面代碼首先用<? <CATALOG> <CD> ...... </CD> <CD> ...... </CD> </CATALOG> 一共定義了5組數(shù)據。我們將上面的代碼存為cd.XML文件,以備調用。 第三步:建立相應的HTML文件。 1.導入XML數(shù)據。 我們知道,目前流行的瀏覽器中,暫時只有微軟的IE5.0以上版本瀏覽器支持XML。IE是通過在 CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> 定義一個object,ID名為XMLdso。然后在head區(qū)用js引入xml數(shù)據: <script for="window" event="onload"> </script> 2.捆綁數(shù)據。 然后將用<SPAN>標識來將XML數(shù)據綁定在表格中。其中ID,DATASRC,DTATFLD都是<SPAN>的屬性。代碼如下: <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> 3.動作操作。 最后,為數(shù)據提供瀏覽按鈕: <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> 并利用js來完成兩個鼠標點擊功能:movenext()和moveprevious()。在head區(qū)加入如下代碼: <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> 好,我們先看HTML文件的全部原代碼: <HTML> <head> <script for="window" event="onload"> </script> <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> <TITLE>CD Navigate</TITLE> </head> <body> <p> <object WIDTH="0" HEIGHT="0" CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> <p> <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> </p> </body> </HTML> 將以上代碼存為cd.htm文件,于第二步的cd.XML文件放在一起。打開cd.htm文件,你就看見和上面實例一樣的效果了。 好,到今天為止,我們已經學習了關于XML的不少知識,我們來總結一下前面五個章節(jié),分別是XML快速入門,XML的概念原理,XML的術語,XML的語法和本章的實例解析。到這里,教程部分就結束了。在寫作過程中,阿捷盡最大努力將有關XML概念講得通俗易懂,盡量把自己的理解告訴給大家,但因為本人學習XML時間也不長,對整個XML的技術把握還不夠系統(tǒng)和深入,所以難免有疏漏的地方,請大家指正和諒解,謝謝! posted on 2009-02-15 15:45 YXY 閱讀(187) 評論(0) 編輯 收藏
我們在第一行后面插入下面代碼就可以:
<!DOCTYPE myfile [
<!ELEMENT title (#PCDATA)>
<!ELEMENT author (#PCDATA)>
<!ENTITY copyright "Copyright 2001, Ajie.">
]>
2.調用獨立的DTD文件
將DTD文檔存為.dtd的文件,然后在DOCTYPE聲明行中調用,例如,將下面的代碼存為myfile.dtd
<!ELEMENT myfile (title, author)>
然后在XML文檔中調用,在第一行后插入:
<!DOCTYPE myfile SYSTEM "myfile.dtd">
我們可以看到DTD文檔和HTML中js的調用是差不多的,關于DTD文檔具體如何寫,我們將在下一章和XML文檔的語法一起介紹。
下面我們來了解DTD有關的術語:
1.Schema(規(guī)劃)
schema是數(shù)據規(guī)則的描述。schema做兩件事:
a.它定義元素數(shù)據類型和元素之間的關系;
b.它定義元素所能包含的內容類型。
DTD就是關于XML文檔的一個schema。
2.Document Tree(文檔樹)
"文檔樹"在前面第二章我們已經提到過,它是文檔元素分級結構的形象表示。一個文檔結構樹包含根元素,根元素是最頂級的元素,(就是緊接著XML聲明語句后的第一個元素)。看例子:
<? <filelist> <myfile> <title>...</title> <author>...</author> </myfile> </filelist> 上面的例子分三級結構排列成"樹"狀,其中的<filelist>就是根元素。在XML和DTD文件中,第一個定義的都是根元素。 3.Parent Element(父元素)/Child Element(子元素) 父元素是指包含有其它元素的元素,被包含的元素稱為它的子元素??瓷厦娴?結構樹",其中<myfile>是父元素,<title>,<author>是它的子元素,而<myfile>又是<filelist>的子元素。象<title>這樣沒有包含任何子元素的最后一級元素我們也稱之為"頁元素"。 4.Parser(解析軟件) Parser是一種檢查XML文檔是否遵循DTD規(guī)范的工具軟件。 Parser能獨立使用,也可以成為編輯軟件或瀏覽器的一部分。在后面的相關資源列表里,我列出了當前比較流行的一些parsers。 好了,通過第三章的學習,我們已經了解了一些XML和DTD的基本術語,但是我們還不知道怎樣來寫這些文件,需要遵循什么樣的語法,在下一章,將重點介紹有關撰寫XML和DTD文檔的語法。請繼續(xù)瀏覽,謝謝! XML輕松學習手冊(4)XML語法 第四章 XML語法 提綱: 一.XML語法規(guī)則 二.元素的語法 三.注釋的語法 四.CDATA的語法 五.Namespaces的語法 六.entity的語法 七.DTD的語法 通過前面三章的學習,我們已經對什么是XML,它的實現(xiàn)原理以及相關的術語有所了解。接下來我們就開始學習XML的語法規(guī)范,動手寫自己的XML文檔。 一.XML語法規(guī)則 XML的文檔和HTML的原代碼類似,也是用標識來標識內容。創(chuàng)建XML文檔必須遵守下列重要規(guī)則: 規(guī)則1:必須有XML聲明語句 這一點我們在上一章學習時已經提到過。聲明是XML文檔的第一句,其格式如下: <? 聲明的作用是告訴瀏覽器或者其它處理程序:這個文檔是XML文檔。聲明語句中的version表示文檔遵守的XML規(guī)范的版本;standalone表示文檔是否附帶DTD文件,如果有,參數(shù)為no;encoding表示文檔所用的語言編碼,默認是UTF-8。 規(guī)則2:是否有DTD文件 如果文檔是一個"有效的 <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 規(guī)則3:注意你的大小寫 在XML文檔中,大小寫是有區(qū)別的。<P>和<p>是不同的標識。注意在寫元素時,前后標識大小寫要保持一樣。例如:<Author>ajie</Author>,寫成<Author>ajie</author>是錯誤的。 你最好養(yǎng)成一種習慣,或者全部大寫,或者全部小寫,或者大寫第一個字母。這樣可以減少因為大小寫不匹配產生的文檔錯誤。 規(guī)則4:給屬性值加引號 在HTML代碼里面,屬性值可以加引號,也可以不加。例如:<font color=red> 但是在XML中則規(guī)定,所有屬性值必須加引號(可以是單引號,也可以是雙引號),否則將被視為錯誤。 規(guī)則5:所有的標識必須有相應的結束標識 在HTML中,標識可能不是成對出現(xiàn)的,比?lt;br>。而在XML中規(guī)定,所有標識必須成對出現(xiàn),有一個開始標識,就必須有一個結束標識。否則將被視為錯誤。 規(guī)則6:所有的空標識也必須被關閉 空標識就是標識對之間沒有內容的標識。比如 ,<img>等標識。在XML中,規(guī)定所有的標識必須有結束標識,針對這樣的空標識,XML中處理的方法是在原標識最后加/,就可以了。例如: 應寫為<br />; <META name="keyXML, SGML, <IMG src= "cool.gif">應寫為<IMG src= "cool.gif" /> 第四章 XML語法 二.元素的語法 元素由一對標識以及其中的內容組成。就象這樣:ajie。元素的名稱和標識的名稱是一樣的。標識可以用屬性來進一步描述。 在XML中,沒有任何保留字,所以你可以隨心所欲的用任何詞語來作為元素名稱。但是也必須遵守下列規(guī)范: 1.名稱中可以包含字母、數(shù)字以及其它字母; 2.名稱不能以數(shù)字或"_" (下劃線)開頭; 3.名稱不能以字母 XML(或 XML 或 Xml ..)開頭 4.名稱中不能包含空格 5.名稱中間不能包含":"(冒號) 為了使元素更容易閱讀理解和操作,我們還有一些建議: 1.名稱中不要使用"."。因為在很多程序語言中,"."是作為對象的屬性,例如:font.color。同樣的原因"-"也最好不要用,必須使用的,以"_"代替; 2.名稱盡量簡短。 3.名稱的大小寫盡量采用同一標準。 4.名稱可以使用非英文字符,比如用中文。但是有些軟件可能不支持。(IE5目前是支持中文元素的。) 另外,補充一點關于屬性的說明。在word</font>將把word顯示為紅色。而在CSS或者XSL,我們在下面詳細講述。) 三.注釋的語法 注釋是為了便于閱讀和理解,在XML文檔添加的附加信息,將不會被程序解釋或則瀏覽器顯示。 注釋的語法如下: <!-- 這里是注釋信息 --> 可以看到,它和HTML中的注釋語法是一樣的,非常容易。養(yǎng)成良好的注釋習慣將使你的文檔更加便于維護,共享,看起來也更專業(yè)。 四.CDATA的語法 CDATA全稱character data,翻譯為字符數(shù)據。我們在寫 <![CDATA[這里放置需要顯示的字符]]> 例如: <![CDATA[<AUTHOR sex="female">ajie</AUTHOR>]]> 在頁面上顯示的內容將是"<AUTHOR sex="female">ajie</AUTHOR>" 第四章 XML語法 五.Namespaces的語法 Namespaces翻譯為名字空間。名字空間有什么作用呢?當我們在一個XML文檔中使用他人的或者多個DTD文件,就會出現(xiàn)這樣的矛盾:因為XML中標識都是自己創(chuàng)建的,在不同的DTD文件中,標識名可能相同但表示的含義不同,這就可能引起數(shù)據混亂。 比如在一個文檔<table>wood table</table>中<table>表示桌子, 而在另一個文檔<table>namelist</table>中<table>表示表格。如果我需要同時處理這兩個文檔,就會發(fā)生名字沖突。 了解決這個問題,我們引進了namespaces這個概念。namespaces通過給標識名稱加一個網址(URL)定位的方法來區(qū)別這些名稱相同的標識。 Namespaces同樣需要在XML文檔的開頭部分聲明,聲明的語法如下: <document 其中yourname是由你定義的namespaces的名稱,URL就是名字空間的網址。 假設上面的"桌子<table>"文檔來自http://www.zhuozi.com,我們就可以聲明為 <document http://www.zhuozi.com'> 然后在后面的標識中使用定義好的名字空間: <zhuozi:table>wood table</table> 這樣就將這兩個<table>區(qū)分開來。注意的是:設置URL并不是說這個標識真的要到那個網址去讀取,僅僅作為一種區(qū)別的標志而已。 六.entity的語法 entity翻譯為"實體"。它的作用類似 entity可以包含字符,文字等等,使用entity的好處在于:1.它可以減少差錯,文檔中多個相同的部分只需要輸入一遍就可以了。2.它提高維護效率。比如你有40個文檔都包含copyright的entity,如果需要修改這個copyright,不需要所有的文件都修改,只要改最初定義的entity語句就可以了。 XML定義了兩種類型的entity。一種是我們這里說的普通entity,在XML文檔中使用;另一種是參數(shù)entity,在DTD文件中使用。 entity的定義語法為: <!DOCTYPE filename [ <!ENTITY entity-name "entity-content" ] > 例如我要定義一段版權信息: <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved" ] > 如果我的版權信息內容和他人共享一個XML文件,也可以使用外部調用的方法,語法象這樣: <!DOCTYPE copyright [ <!ENTITY copyright SYSTEM "http://www.sample.com/copyright. ] > 定義好的entity在文檔中的引用語法為:&entity-name; 例如,上面定義的版權信息,調用時寫作?copyright; 完整的例子如下,你可以copy下來存為copyright.XML觀看實例: <? <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved"> ]> <myfile> <title>XML</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> ©right; </myfile> 第四章 XML語法 七.DTD的語法 DTD是"有效 1.設置元素 元素是XML文檔的基本組成部分。你要在DTD中定義一個元素,然后在XML文檔中使用。元素的定義語法為:<!ELEMENT DESCRIPTION (#PCDATA, DEFINITION)*> 說明: "<!ELEMENT" 是元素的聲明,說明你要定義的是一個元素; 聲明后面的"DESCRIPTION",是元素的名稱; "(#PCDATA, DEFINITION)*>"則是該元素的使用規(guī)則。規(guī)則定義了元素可以包含的內容以及相互的關系。下面的表格概要列出了元素的規(guī)則: 2.元素規(guī)則表: 此主題相關圖片如下: 另外,我們還可以為元素定義屬性,因為我們不推薦使用屬性,在這里就不詳細展開了。 最后,我們來總結一些前四章學習的內容,寫一個包含DTD,XML,以及Script的簡單實例,便于讀者理解: 1.將下面文件存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 2.然后建立XML文檔myfile.xml: <? <!DOCTYPE myfile SYSTEM "myfile.dtd"> <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 3.建立HTML文檔myfile.html <HTML> <head> <script language=" var nodes = XMLDoc.documentElement.childNodes; title.innerText = nodes.item(0).text; author.innerText = nodes.item(1).text; </script> <title>在HTML中調用XML數(shù)據</title> </head> <body bgcolor="#FFFFFF"> <b>標題: </b> <span id="title"></span><br> <b>作者: </b> <span id="author"></span><br> </body> </HTML> 4.用IE5.0以上瀏覽器打開myfile.HTML就可以看到效果了。 XML輕松學習手冊(5)XML實例解析 第五章:XML實例解析 提綱: 一:實例效果 二:實例解析 1.定義新標識。 2.建立XML文檔。 3.建立相應的HTML文件。 XML在不同領域有著廣泛的應用,比如在科技領域的MathML,無線通信應用的WML,在網絡圖象方面的SVG等等,我們這里側重討論XML在web上的應用。XML在web上應用主要是利用其強大的數(shù)據操作能力。一般用XML配合JavaScript和ASP等服務器端程序,可以實現(xiàn)網絡上幾乎所有的應用需求。 考慮講解方便,我們在下面介紹一個簡單的實例,不包含服務器端程序。目的在于讓您對XML的數(shù)據操作能力有一個感性的認識。 好,我們首先[ 點擊這里 ]來看實例的效果。(請用IE5.0以上版本瀏覽器打開) 這是一個簡單的CD唱片數(shù)據檢索功能。你通過點擊"上一張","下一張"可以看到單張CD的有關信息。這樣的效果我們原來用兩種方法可以實現(xiàn): 1.利用DHTML,將數(shù)據隱藏在不同的層中,通過鼠標事件依次顯示; 2.利用后臺程序(如ASP,CGI,PHP,JSP等),調用服務器端的數(shù)據。 但是在這個實例中,我們打開頁面原代碼可以看到,其中沒有用DHTML的DIV,也沒有表單的action,它完全是用XML來實現(xiàn)的。下面我們來分析它的制作過程: 第一步:定義新標識。 根據實際的CD數(shù)據,首先新建一個名為<CD>的標識;其次建立它相關的數(shù)據標識,分別是:CD名稱<Title>,演唱者<Artist>,出版年代<Year>,國家<Country>,發(fā)行公司<Company>和價格<Price>;最后還要建立一個名為目錄<CATALOG>的標識。為什么要再建立一個<CATALOG>標識呢?因為在XML文檔中規(guī)定,必須且只能有一個根元素(標識),我們有多個CD數(shù)據,這些數(shù)據是并列的關系,所以需要為這些并列的元素建立一個根元素。 以上元素的定義和關系都完全符合XML標準,不需要特別的DTD文件來定義,所以可以省略DTD定義。如果我們想使用DTD來定義,以上過程可以表示為: <!ELEMENT CATALOG (CD)*> <!ELEMENT CD (Title,Artist,Year,Country,Company,Price)> <!ELEMENT Title (#PCDATA)> <!ELEMENT Artist (#PCDATA)> <!ELEMENT Year (#PCDATA)> <!ELEMENT Country (#PCDATA)> <!ELEMENT Company (#PCDATA)> <!ELEMENT Price (#PCDATA)> 這段代碼表示:元素CATALOG包含多個CD子元素,而子元素CD又依次包含Title, Artist, Year, Country, Company, Price 六個子元素,它們的內容都定義為文本(字符,數(shù)字,文本)。(注:具體的語法說明可以看上一章關于DTD的介紹) 第二步:建立XML文檔。 <? <CATALOG> <CD> <TITLE>Empire Burlesque</TITLE> <ARTIST>Bob Dylan</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>Columbia</COMPANY> <PRICE>10.90</PRICE> <YEAR>1985</YEAR> </CD> <CD> <TITLE>Hide your heart</TITLE> <ARTIST>Bonnie Tylor</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>CBS Records</COMPANY> <PRICE>9.90</PRICE> <YEAR>1988</YEAR> </CD> <CD> <TITLE>Greatest Hits</TITLE> <ARTIST>Dolly Parton</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>RCA</COMPANY> <PRICE>9.90</PRICE> <YEAR>1982</YEAR> </CD> <CD> <TITLE>Still got the blues</TITLE> <ARTIST>Gary More</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>Virgin redords</COMPANY> <PRICE>10.20</PRICE> <YEAR>1990</YEAR> </CD> <CD> <TITLE>Eros</TITLE> <ARTIST>Eros Ramazzotti</ARTIST> <COUNTRY>EU</COUNTRY> <COMPANY>BMG</COMPANY> <PRICE>9.90</PRICE> <YEAR>1997</YEAR> </CD> </CATALOG> 上面代碼首先用<? <CATALOG> <CD> ...... </CD> <CD> ...... </CD> </CATALOG> 一共定義了5組數(shù)據。我們將上面的代碼存為cd.XML文件,以備調用。 第三步:建立相應的HTML文件。 1.導入XML數(shù)據。 我們知道,目前流行的瀏覽器中,暫時只有微軟的IE5.0以上版本瀏覽器支持XML。IE是通過在 CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> 定義一個object,ID名為XMLdso。然后在head區(qū)用js引入xml數(shù)據: <script for="window" event="onload"> </script> 2.捆綁數(shù)據。 然后將用<SPAN>標識來將XML數(shù)據綁定在表格中。其中ID,DATASRC,DTATFLD都是<SPAN>的屬性。代碼如下: <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> 3.動作操作。 最后,為數(shù)據提供瀏覽按鈕: <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> 并利用js來完成兩個鼠標點擊功能:movenext()和moveprevious()。在head區(qū)加入如下代碼: <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> 好,我們先看HTML文件的全部原代碼: <HTML> <head> <script for="window" event="onload"> </script> <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> <TITLE>CD Navigate</TITLE> </head> <body> <p> <object WIDTH="0" HEIGHT="0" CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> <p> <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> </p> </body> </HTML> 將以上代碼存為cd.htm文件,于第二步的cd.XML文件放在一起。打開cd.htm文件,你就看見和上面實例一樣的效果了。 好,到今天為止,我們已經學習了關于XML的不少知識,我們來總結一下前面五個章節(jié),分別是XML快速入門,XML的概念原理,XML的術語,XML的語法和本章的實例解析。到這里,教程部分就結束了。在寫作過程中,阿捷盡最大努力將有關XML概念講得通俗易懂,盡量把自己的理解告訴給大家,但因為本人學習XML時間也不長,對整個XML的技術把握還不夠系統(tǒng)和深入,所以難免有疏漏的地方,請大家指正和諒解,謝謝! posted on 2009-02-15 15:45 YXY 閱讀(187) 評論(0) 編輯 收藏
<title>...</title>
<author>...</author>
上面的例子分三級結構排列成"樹"狀,其中的<filelist>就是根元素。在XML和DTD文件中,第一個定義的都是根元素。
3.Parent Element(父元素)/Child Element(子元素)
父元素是指包含有其它元素的元素,被包含的元素稱為它的子元素??瓷厦娴?結構樹",其中<myfile>是父元素,<title>,<author>是它的子元素,而<myfile>又是<filelist>的子元素。象<title>這樣沒有包含任何子元素的最后一級元素我們也稱之為"頁元素"。 4.Parser(解析軟件)
Parser是一種檢查XML文檔是否遵循DTD規(guī)范的工具軟件。
Parser能獨立使用,也可以成為編輯軟件或瀏覽器的一部分。在后面的相關資源列表里,我列出了當前比較流行的一些parsers。 好了,通過第三章的學習,我們已經了解了一些XML和DTD的基本術語,但是我們還不知道怎樣來寫這些文件,需要遵循什么樣的語法,在下一章,將重點介紹有關撰寫XML和DTD文檔的語法。請繼續(xù)瀏覽,謝謝! XML輕松學習手冊(4)XML語法 第四章 XML語法 提綱: 一.XML語法規(guī)則 二.元素的語法 三.注釋的語法 四.CDATA的語法 五.Namespaces的語法 六.entity的語法 七.DTD的語法 通過前面三章的學習,我們已經對什么是XML,它的實現(xiàn)原理以及相關的術語有所了解。接下來我們就開始學習XML的語法規(guī)范,動手寫自己的XML文檔。 一.XML語法規(guī)則 XML的文檔和HTML的原代碼類似,也是用標識來標識內容。創(chuàng)建XML文檔必須遵守下列重要規(guī)則: 規(guī)則1:必須有XML聲明語句 這一點我們在上一章學習時已經提到過。聲明是XML文檔的第一句,其格式如下: <? 聲明的作用是告訴瀏覽器或者其它處理程序:這個文檔是XML文檔。聲明語句中的version表示文檔遵守的XML規(guī)范的版本;standalone表示文檔是否附帶DTD文件,如果有,參數(shù)為no;encoding表示文檔所用的語言編碼,默認是UTF-8。 規(guī)則2:是否有DTD文件 如果文檔是一個"有效的 <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd"> 規(guī)則3:注意你的大小寫 在XML文檔中,大小寫是有區(qū)別的。<P>和<p>是不同的標識。注意在寫元素時,前后標識大小寫要保持一樣。例如:<Author>ajie</Author>,寫成<Author>ajie</author>是錯誤的。 你最好養(yǎng)成一種習慣,或者全部大寫,或者全部小寫,或者大寫第一個字母。這樣可以減少因為大小寫不匹配產生的文檔錯誤。 規(guī)則4:給屬性值加引號 在HTML代碼里面,屬性值可以加引號,也可以不加。例如:<font color=red> 但是在XML中則規(guī)定,所有屬性值必須加引號(可以是單引號,也可以是雙引號),否則將被視為錯誤。 規(guī)則5:所有的標識必須有相應的結束標識 在HTML中,標識可能不是成對出現(xiàn)的,比?lt;br>。而在XML中規(guī)定,所有標識必須成對出現(xiàn),有一個開始標識,就必須有一個結束標識。否則將被視為錯誤。 規(guī)則6:所有的空標識也必須被關閉 空標識就是標識對之間沒有內容的標識。比如 ,<img>等標識。在XML中,規(guī)定所有的標識必須有結束標識,針對這樣的空標識,XML中處理的方法是在原標識最后加/,就可以了。例如: 應寫為<br />; <META name="keyXML, SGML, <IMG src= "cool.gif">應寫為<IMG src= "cool.gif" /> 第四章 XML語法 二.元素的語法 元素由一對標識以及其中的內容組成。就象這樣:ajie。元素的名稱和標識的名稱是一樣的。標識可以用屬性來進一步描述。 在XML中,沒有任何保留字,所以你可以隨心所欲的用任何詞語來作為元素名稱。但是也必須遵守下列規(guī)范: 1.名稱中可以包含字母、數(shù)字以及其它字母; 2.名稱不能以數(shù)字或"_" (下劃線)開頭; 3.名稱不能以字母 XML(或 XML 或 Xml ..)開頭 4.名稱中不能包含空格 5.名稱中間不能包含":"(冒號) 為了使元素更容易閱讀理解和操作,我們還有一些建議: 1.名稱中不要使用"."。因為在很多程序語言中,"."是作為對象的屬性,例如:font.color。同樣的原因"-"也最好不要用,必須使用的,以"_"代替; 2.名稱盡量簡短。 3.名稱的大小寫盡量采用同一標準。 4.名稱可以使用非英文字符,比如用中文。但是有些軟件可能不支持。(IE5目前是支持中文元素的。) 另外,補充一點關于屬性的說明。在word</font>將把word顯示為紅色。而在CSS或者XSL,我們在下面詳細講述。) 三.注釋的語法 注釋是為了便于閱讀和理解,在XML文檔添加的附加信息,將不會被程序解釋或則瀏覽器顯示。 注釋的語法如下: <!-- 這里是注釋信息 --> 可以看到,它和HTML中的注釋語法是一樣的,非常容易。養(yǎng)成良好的注釋習慣將使你的文檔更加便于維護,共享,看起來也更專業(yè)。 四.CDATA的語法 CDATA全稱character data,翻譯為字符數(shù)據。我們在寫 <![CDATA[這里放置需要顯示的字符]]> 例如: <![CDATA[<AUTHOR sex="female">ajie</AUTHOR>]]> 在頁面上顯示的內容將是"<AUTHOR sex="female">ajie</AUTHOR>" 第四章 XML語法 五.Namespaces的語法 Namespaces翻譯為名字空間。名字空間有什么作用呢?當我們在一個XML文檔中使用他人的或者多個DTD文件,就會出現(xiàn)這樣的矛盾:因為XML中標識都是自己創(chuàng)建的,在不同的DTD文件中,標識名可能相同但表示的含義不同,這就可能引起數(shù)據混亂。 比如在一個文檔<table>wood table</table>中<table>表示桌子, 而在另一個文檔<table>namelist</table>中<table>表示表格。如果我需要同時處理這兩個文檔,就會發(fā)生名字沖突。 了解決這個問題,我們引進了namespaces這個概念。namespaces通過給標識名稱加一個網址(URL)定位的方法來區(qū)別這些名稱相同的標識。 Namespaces同樣需要在XML文檔的開頭部分聲明,聲明的語法如下: <document 其中yourname是由你定義的namespaces的名稱,URL就是名字空間的網址。 假設上面的"桌子<table>"文檔來自http://www.zhuozi.com,我們就可以聲明為 <document http://www.zhuozi.com'> 然后在后面的標識中使用定義好的名字空間: <zhuozi:table>wood table</table> 這樣就將這兩個<table>區(qū)分開來。注意的是:設置URL并不是說這個標識真的要到那個網址去讀取,僅僅作為一種區(qū)別的標志而已。 六.entity的語法 entity翻譯為"實體"。它的作用類似 entity可以包含字符,文字等等,使用entity的好處在于:1.它可以減少差錯,文檔中多個相同的部分只需要輸入一遍就可以了。2.它提高維護效率。比如你有40個文檔都包含copyright的entity,如果需要修改這個copyright,不需要所有的文件都修改,只要改最初定義的entity語句就可以了。 XML定義了兩種類型的entity。一種是我們這里說的普通entity,在XML文檔中使用;另一種是參數(shù)entity,在DTD文件中使用。 entity的定義語法為: <!DOCTYPE filename [ <!ENTITY entity-name "entity-content" ] > 例如我要定義一段版權信息: <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved" ] > 如果我的版權信息內容和他人共享一個XML文件,也可以使用外部調用的方法,語法象這樣: <!DOCTYPE copyright [ <!ENTITY copyright SYSTEM "http://www.sample.com/copyright. ] > 定義好的entity在文檔中的引用語法為:&entity-name; 例如,上面定義的版權信息,調用時寫作?copyright; 完整的例子如下,你可以copy下來存為copyright.XML觀看實例: <? <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved"> ]> <myfile> <title>XML</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> ©right; </myfile> 第四章 XML語法 七.DTD的語法 DTD是"有效 1.設置元素 元素是XML文檔的基本組成部分。你要在DTD中定義一個元素,然后在XML文檔中使用。元素的定義語法為:<!ELEMENT DESCRIPTION (#PCDATA, DEFINITION)*> 說明: "<!ELEMENT" 是元素的聲明,說明你要定義的是一個元素; 聲明后面的"DESCRIPTION",是元素的名稱; "(#PCDATA, DEFINITION)*>"則是該元素的使用規(guī)則。規(guī)則定義了元素可以包含的內容以及相互的關系。下面的表格概要列出了元素的規(guī)則: 2.元素規(guī)則表: 此主題相關圖片如下: 另外,我們還可以為元素定義屬性,因為我們不推薦使用屬性,在這里就不詳細展開了。 最后,我們來總結一些前四章學習的內容,寫一個包含DTD,XML,以及Script的簡單實例,便于讀者理解: 1.將下面文件存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 2.然后建立XML文檔myfile.xml: <? <!DOCTYPE myfile SYSTEM "myfile.dtd"> <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 3.建立HTML文檔myfile.html <HTML> <head> <script language=" var nodes = XMLDoc.documentElement.childNodes; title.innerText = nodes.item(0).text; author.innerText = nodes.item(1).text; </script> <title>在HTML中調用XML數(shù)據</title> </head> <body bgcolor="#FFFFFF"> <b>標題: </b> <span id="title"></span><br> <b>作者: </b> <span id="author"></span><br> </body> </HTML> 4.用IE5.0以上瀏覽器打開myfile.HTML就可以看到效果了。 XML輕松學習手冊(5)XML實例解析 第五章:XML實例解析 提綱: 一:實例效果 二:實例解析 1.定義新標識。 2.建立XML文檔。 3.建立相應的HTML文件。 XML在不同領域有著廣泛的應用,比如在科技領域的MathML,無線通信應用的WML,在網絡圖象方面的SVG等等,我們這里側重討論XML在web上的應用。XML在web上應用主要是利用其強大的數(shù)據操作能力。一般用XML配合JavaScript和ASP等服務器端程序,可以實現(xiàn)網絡上幾乎所有的應用需求。 考慮講解方便,我們在下面介紹一個簡單的實例,不包含服務器端程序。目的在于讓您對XML的數(shù)據操作能力有一個感性的認識。 好,我們首先[ 點擊這里 ]來看實例的效果。(請用IE5.0以上版本瀏覽器打開) 這是一個簡單的CD唱片數(shù)據檢索功能。你通過點擊"上一張","下一張"可以看到單張CD的有關信息。這樣的效果我們原來用兩種方法可以實現(xiàn): 1.利用DHTML,將數(shù)據隱藏在不同的層中,通過鼠標事件依次顯示; 2.利用后臺程序(如ASP,CGI,PHP,JSP等),調用服務器端的數(shù)據。 但是在這個實例中,我們打開頁面原代碼可以看到,其中沒有用DHTML的DIV,也沒有表單的action,它完全是用XML來實現(xiàn)的。下面我們來分析它的制作過程: 第一步:定義新標識。 根據實際的CD數(shù)據,首先新建一個名為<CD>的標識;其次建立它相關的數(shù)據標識,分別是:CD名稱<Title>,演唱者<Artist>,出版年代<Year>,國家<Country>,發(fā)行公司<Company>和價格<Price>;最后還要建立一個名為目錄<CATALOG>的標識。為什么要再建立一個<CATALOG>標識呢?因為在XML文檔中規(guī)定,必須且只能有一個根元素(標識),我們有多個CD數(shù)據,這些數(shù)據是并列的關系,所以需要為這些并列的元素建立一個根元素。 以上元素的定義和關系都完全符合XML標準,不需要特別的DTD文件來定義,所以可以省略DTD定義。如果我們想使用DTD來定義,以上過程可以表示為: <!ELEMENT CATALOG (CD)*> <!ELEMENT CD (Title,Artist,Year,Country,Company,Price)> <!ELEMENT Title (#PCDATA)> <!ELEMENT Artist (#PCDATA)> <!ELEMENT Year (#PCDATA)> <!ELEMENT Country (#PCDATA)> <!ELEMENT Company (#PCDATA)> <!ELEMENT Price (#PCDATA)> 這段代碼表示:元素CATALOG包含多個CD子元素,而子元素CD又依次包含Title, Artist, Year, Country, Company, Price 六個子元素,它們的內容都定義為文本(字符,數(shù)字,文本)。(注:具體的語法說明可以看上一章關于DTD的介紹) 第二步:建立XML文檔。 <? <CATALOG> <CD> <TITLE>Empire Burlesque</TITLE> <ARTIST>Bob Dylan</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>Columbia</COMPANY> <PRICE>10.90</PRICE> <YEAR>1985</YEAR> </CD> <CD> <TITLE>Hide your heart</TITLE> <ARTIST>Bonnie Tylor</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>CBS Records</COMPANY> <PRICE>9.90</PRICE> <YEAR>1988</YEAR> </CD> <CD> <TITLE>Greatest Hits</TITLE> <ARTIST>Dolly Parton</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>RCA</COMPANY> <PRICE>9.90</PRICE> <YEAR>1982</YEAR> </CD> <CD> <TITLE>Still got the blues</TITLE> <ARTIST>Gary More</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>Virgin redords</COMPANY> <PRICE>10.20</PRICE> <YEAR>1990</YEAR> </CD> <CD> <TITLE>Eros</TITLE> <ARTIST>Eros Ramazzotti</ARTIST> <COUNTRY>EU</COUNTRY> <COMPANY>BMG</COMPANY> <PRICE>9.90</PRICE> <YEAR>1997</YEAR> </CD> </CATALOG> 上面代碼首先用<? <CATALOG> <CD> ...... </CD> <CD> ...... </CD> </CATALOG> 一共定義了5組數(shù)據。我們將上面的代碼存為cd.XML文件,以備調用。 第三步:建立相應的HTML文件。 1.導入XML數(shù)據。 我們知道,目前流行的瀏覽器中,暫時只有微軟的IE5.0以上版本瀏覽器支持XML。IE是通過在 CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> 定義一個object,ID名為XMLdso。然后在head區(qū)用js引入xml數(shù)據: <script for="window" event="onload"> </script> 2.捆綁數(shù)據。 然后將用<SPAN>標識來將XML數(shù)據綁定在表格中。其中ID,DATASRC,DTATFLD都是<SPAN>的屬性。代碼如下: <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> 3.動作操作。 最后,為數(shù)據提供瀏覽按鈕: <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> 并利用js來完成兩個鼠標點擊功能:movenext()和moveprevious()。在head區(qū)加入如下代碼: <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> 好,我們先看HTML文件的全部原代碼: <HTML> <head> <script for="window" event="onload"> </script> <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> <TITLE>CD Navigate</TITLE> </head> <body> <p> <object WIDTH="0" HEIGHT="0" CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> <p> <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> </p> </body> </HTML> 將以上代碼存為cd.htm文件,于第二步的cd.XML文件放在一起。打開cd.htm文件,你就看見和上面實例一樣的效果了。 好,到今天為止,我們已經學習了關于XML的不少知識,我們來總結一下前面五個章節(jié),分別是XML快速入門,XML的概念原理,XML的術語,XML的語法和本章的實例解析。到這里,教程部分就結束了。在寫作過程中,阿捷盡最大努力將有關XML概念講得通俗易懂,盡量把自己的理解告訴給大家,但因為本人學習XML時間也不長,對整個XML的技術把握還不夠系統(tǒng)和深入,所以難免有疏漏的地方,請大家指正和諒解,謝謝! posted on 2009-02-15 15:45 YXY 閱讀(187) 評論(0) 編輯 收藏
Parser能獨立使用,也可以成為編輯軟件或瀏覽器的一部分。在后面的相關資源列表里,我列出了當前比較流行的一些parsers。
好了,通過第三章的學習,我們已經了解了一些XML和DTD的基本術語,但是我們還不知道怎樣來寫這些文件,需要遵循什么樣的語法,在下一章,將重點介紹有關撰寫XML和DTD文檔的語法。請繼續(xù)瀏覽,謝謝!
XML輕松學習手冊(4)XML語法
第四章 XML語法
一.XML語法規(guī)則 二.元素的語法 三.注釋的語法 四.CDATA的語法 五.Namespaces的語法 六.entity的語法 七.DTD的語法
通過前面三章的學習,我們已經對什么是XML,它的實現(xiàn)原理以及相關的術語有所了解。接下來我們就開始學習XML的語法規(guī)范,動手寫自己的XML文檔。
一.XML語法規(guī)則
XML的文檔和HTML的原代碼類似,也是用標識來標識內容。創(chuàng)建XML文檔必須遵守下列重要規(guī)則: 規(guī)則1:必須有XML聲明語句 這一點我們在上一章學習時已經提到過。聲明是XML文檔的第一句,其格式如下: <? 聲明的作用是告訴瀏覽器或者其它處理程序:這個文檔是XML文檔。聲明語句中的version表示文檔遵守的XML規(guī)范的版本;standalone表示文檔是否附帶DTD文件,如果有,參數(shù)為no;encoding表示文檔所用的語言編碼,默認是UTF-8。
規(guī)則2:是否有DTD文件 如果文檔是一個"有效的 <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name"> 其中: "!DOCTYPE"是指你要定義一個DOCTYPE; "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同; "SYSTEM/PUBLIC"這兩個參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。 "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。 我們還是用上面的例子,應該寫成這樣: <? <!DOCTYPE filelist SYSTEM "filelist.dtd">
規(guī)則3:注意你的大小寫 在XML文檔中,大小寫是有區(qū)別的。<P>和<p>是不同的標識。注意在寫元素時,前后標識大小寫要保持一樣。例如:<Author>ajie</Author>,寫成<Author>ajie</author>是錯誤的。 你最好養(yǎng)成一種習慣,或者全部大寫,或者全部小寫,或者大寫第一個字母。這樣可以減少因為大小寫不匹配產生的文檔錯誤。
規(guī)則4:給屬性值加引號 在HTML代碼里面,屬性值可以加引號,也可以不加。例如:<font color=red> 但是在XML中則規(guī)定,所有屬性值必須加引號(可以是單引號,也可以是雙引號),否則將被視為錯誤。
規(guī)則5:所有的標識必須有相應的結束標識 在HTML中,標識可能不是成對出現(xiàn)的,比?lt;br>。而在XML中規(guī)定,所有標識必須成對出現(xiàn),有一個開始標識,就必須有一個結束標識。否則將被視為錯誤。
規(guī)則6:所有的空標識也必須被關閉 空標識就是標識對之間沒有內容的標識。比如 ,<img>等標識。在XML中,規(guī)定所有的標識必須有結束標識,針對這樣的空標識,XML中處理的方法是在原標識最后加/,就可以了。例如:
應寫為<br />; <META name="keyXML, SGML, <IMG src= "cool.gif">應寫為<IMG src= "cool.gif" />
二.元素的語法
元素由一對標識以及其中的內容組成。就象這樣:ajie。元素的名稱和標識的名稱是一樣的。標識可以用屬性來進一步描述。
在XML中,沒有任何保留字,所以你可以隨心所欲的用任何詞語來作為元素名稱。但是也必須遵守下列規(guī)范:
1.名稱中可以包含字母、數(shù)字以及其它字母;
2.名稱不能以數(shù)字或"_" (下劃線)開頭;
3.名稱不能以字母 XML(或 XML 或 Xml ..)開頭
4.名稱中不能包含空格
5.名稱中間不能包含":"(冒號)
為了使元素更容易閱讀理解和操作,我們還有一些建議:
1.名稱中不要使用"."。因為在很多程序語言中,"."是作為對象的屬性,例如:font.color。同樣的原因"-"也最好不要用,必須使用的,以"_"代替;
2.名稱盡量簡短。
3.名稱的大小寫盡量采用同一標準。
4.名稱可以使用非英文字符,比如用中文。但是有些軟件可能不支持。(IE5目前是支持中文元素的。)
另外,補充一點關于屬性的說明。在word</font>將把word顯示為紅色。而在CSS或者XSL,我們在下面詳細講述。)
三.注釋的語法
注釋是為了便于閱讀和理解,在XML文檔添加的附加信息,將不會被程序解釋或則瀏覽器顯示。
注釋的語法如下:
<!-- 這里是注釋信息 -->
可以看到,它和HTML中的注釋語法是一樣的,非常容易。養(yǎng)成良好的注釋習慣將使你的文檔更加便于維護,共享,看起來也更專業(yè)。
四.CDATA的語法
CDATA全稱character data,翻譯為字符數(shù)據。我們在寫 <![CDATA[這里放置需要顯示的字符]]> 例如: <![CDATA[<AUTHOR sex="female">ajie</AUTHOR>]]> 在頁面上顯示的內容將是"<AUTHOR sex="female">ajie</AUTHOR>" 第四章 XML語法 五.Namespaces的語法 Namespaces翻譯為名字空間。名字空間有什么作用呢?當我們在一個XML文檔中使用他人的或者多個DTD文件,就會出現(xiàn)這樣的矛盾:因為XML中標識都是自己創(chuàng)建的,在不同的DTD文件中,標識名可能相同但表示的含義不同,這就可能引起數(shù)據混亂。 比如在一個文檔<table>wood table</table>中<table>表示桌子, 而在另一個文檔<table>namelist</table>中<table>表示表格。如果我需要同時處理這兩個文檔,就會發(fā)生名字沖突。 了解決這個問題,我們引進了namespaces這個概念。namespaces通過給標識名稱加一個網址(URL)定位的方法來區(qū)別這些名稱相同的標識。 Namespaces同樣需要在XML文檔的開頭部分聲明,聲明的語法如下: <document 其中yourname是由你定義的namespaces的名稱,URL就是名字空間的網址。 假設上面的"桌子<table>"文檔來自http://www.zhuozi.com,我們就可以聲明為 <document http://www.zhuozi.com'> 然后在后面的標識中使用定義好的名字空間: <zhuozi:table>wood table</table> 這樣就將這兩個<table>區(qū)分開來。注意的是:設置URL并不是說這個標識真的要到那個網址去讀取,僅僅作為一種區(qū)別的標志而已。 六.entity的語法 entity翻譯為"實體"。它的作用類似 entity可以包含字符,文字等等,使用entity的好處在于:1.它可以減少差錯,文檔中多個相同的部分只需要輸入一遍就可以了。2.它提高維護效率。比如你有40個文檔都包含copyright的entity,如果需要修改這個copyright,不需要所有的文件都修改,只要改最初定義的entity語句就可以了。 XML定義了兩種類型的entity。一種是我們這里說的普通entity,在XML文檔中使用;另一種是參數(shù)entity,在DTD文件中使用。 entity的定義語法為: <!DOCTYPE filename [ <!ENTITY entity-name "entity-content" ] > 例如我要定義一段版權信息: <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved" ] > 如果我的版權信息內容和他人共享一個XML文件,也可以使用外部調用的方法,語法象這樣: <!DOCTYPE copyright [ <!ENTITY copyright SYSTEM "http://www.sample.com/copyright. ] > 定義好的entity在文檔中的引用語法為:&entity-name; 例如,上面定義的版權信息,調用時寫作?copyright; 完整的例子如下,你可以copy下來存為copyright.XML觀看實例: <? <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved"> ]> <myfile> <title>XML</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> ©right; </myfile> 第四章 XML語法 七.DTD的語法 DTD是"有效 1.設置元素 元素是XML文檔的基本組成部分。你要在DTD中定義一個元素,然后在XML文檔中使用。元素的定義語法為:<!ELEMENT DESCRIPTION (#PCDATA, DEFINITION)*> 說明: "<!ELEMENT" 是元素的聲明,說明你要定義的是一個元素; 聲明后面的"DESCRIPTION",是元素的名稱; "(#PCDATA, DEFINITION)*>"則是該元素的使用規(guī)則。規(guī)則定義了元素可以包含的內容以及相互的關系。下面的表格概要列出了元素的規(guī)則: 2.元素規(guī)則表: 此主題相關圖片如下: 另外,我們還可以為元素定義屬性,因為我們不推薦使用屬性,在這里就不詳細展開了。 最后,我們來總結一些前四章學習的內容,寫一個包含DTD,XML,以及Script的簡單實例,便于讀者理解: 1.將下面文件存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 2.然后建立XML文檔myfile.xml: <? <!DOCTYPE myfile SYSTEM "myfile.dtd"> <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 3.建立HTML文檔myfile.html <HTML> <head> <script language=" var nodes = XMLDoc.documentElement.childNodes; title.innerText = nodes.item(0).text; author.innerText = nodes.item(1).text; </script> <title>在HTML中調用XML數(shù)據</title> </head> <body bgcolor="#FFFFFF"> <b>標題: </b> <span id="title"></span><br> <b>作者: </b> <span id="author"></span><br> </body> </HTML> 4.用IE5.0以上瀏覽器打開myfile.HTML就可以看到效果了。 XML輕松學習手冊(5)XML實例解析 第五章:XML實例解析 提綱: 一:實例效果 二:實例解析 1.定義新標識。 2.建立XML文檔。 3.建立相應的HTML文件。 XML在不同領域有著廣泛的應用,比如在科技領域的MathML,無線通信應用的WML,在網絡圖象方面的SVG等等,我們這里側重討論XML在web上的應用。XML在web上應用主要是利用其強大的數(shù)據操作能力。一般用XML配合JavaScript和ASP等服務器端程序,可以實現(xiàn)網絡上幾乎所有的應用需求。 考慮講解方便,我們在下面介紹一個簡單的實例,不包含服務器端程序。目的在于讓您對XML的數(shù)據操作能力有一個感性的認識。 好,我們首先[ 點擊這里 ]來看實例的效果。(請用IE5.0以上版本瀏覽器打開) 這是一個簡單的CD唱片數(shù)據檢索功能。你通過點擊"上一張","下一張"可以看到單張CD的有關信息。這樣的效果我們原來用兩種方法可以實現(xiàn): 1.利用DHTML,將數(shù)據隱藏在不同的層中,通過鼠標事件依次顯示; 2.利用后臺程序(如ASP,CGI,PHP,JSP等),調用服務器端的數(shù)據。 但是在這個實例中,我們打開頁面原代碼可以看到,其中沒有用DHTML的DIV,也沒有表單的action,它完全是用XML來實現(xiàn)的。下面我們來分析它的制作過程: 第一步:定義新標識。 根據實際的CD數(shù)據,首先新建一個名為<CD>的標識;其次建立它相關的數(shù)據標識,分別是:CD名稱<Title>,演唱者<Artist>,出版年代<Year>,國家<Country>,發(fā)行公司<Company>和價格<Price>;最后還要建立一個名為目錄<CATALOG>的標識。為什么要再建立一個<CATALOG>標識呢?因為在XML文檔中規(guī)定,必須且只能有一個根元素(標識),我們有多個CD數(shù)據,這些數(shù)據是并列的關系,所以需要為這些并列的元素建立一個根元素。 以上元素的定義和關系都完全符合XML標準,不需要特別的DTD文件來定義,所以可以省略DTD定義。如果我們想使用DTD來定義,以上過程可以表示為: <!ELEMENT CATALOG (CD)*> <!ELEMENT CD (Title,Artist,Year,Country,Company,Price)> <!ELEMENT Title (#PCDATA)> <!ELEMENT Artist (#PCDATA)> <!ELEMENT Year (#PCDATA)> <!ELEMENT Country (#PCDATA)> <!ELEMENT Company (#PCDATA)> <!ELEMENT Price (#PCDATA)> 這段代碼表示:元素CATALOG包含多個CD子元素,而子元素CD又依次包含Title, Artist, Year, Country, Company, Price 六個子元素,它們的內容都定義為文本(字符,數(shù)字,文本)。(注:具體的語法說明可以看上一章關于DTD的介紹) 第二步:建立XML文檔。 <? <CATALOG> <CD> <TITLE>Empire Burlesque</TITLE> <ARTIST>Bob Dylan</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>Columbia</COMPANY> <PRICE>10.90</PRICE> <YEAR>1985</YEAR> </CD> <CD> <TITLE>Hide your heart</TITLE> <ARTIST>Bonnie Tylor</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>CBS Records</COMPANY> <PRICE>9.90</PRICE> <YEAR>1988</YEAR> </CD> <CD> <TITLE>Greatest Hits</TITLE> <ARTIST>Dolly Parton</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>RCA</COMPANY> <PRICE>9.90</PRICE> <YEAR>1982</YEAR> </CD> <CD> <TITLE>Still got the blues</TITLE> <ARTIST>Gary More</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>Virgin redords</COMPANY> <PRICE>10.20</PRICE> <YEAR>1990</YEAR> </CD> <CD> <TITLE>Eros</TITLE> <ARTIST>Eros Ramazzotti</ARTIST> <COUNTRY>EU</COUNTRY> <COMPANY>BMG</COMPANY> <PRICE>9.90</PRICE> <YEAR>1997</YEAR> </CD> </CATALOG> 上面代碼首先用<? <CATALOG> <CD> ...... </CD> <CD> ...... </CD> </CATALOG> 一共定義了5組數(shù)據。我們將上面的代碼存為cd.XML文件,以備調用。 第三步:建立相應的HTML文件。 1.導入XML數(shù)據。 我們知道,目前流行的瀏覽器中,暫時只有微軟的IE5.0以上版本瀏覽器支持XML。IE是通過在 CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> 定義一個object,ID名為XMLdso。然后在head區(qū)用js引入xml數(shù)據: <script for="window" event="onload"> </script> 2.捆綁數(shù)據。 然后將用<SPAN>標識來將XML數(shù)據綁定在表格中。其中ID,DATASRC,DTATFLD都是<SPAN>的屬性。代碼如下: <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> 3.動作操作。 最后,為數(shù)據提供瀏覽按鈕: <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> 并利用js來完成兩個鼠標點擊功能:movenext()和moveprevious()。在head區(qū)加入如下代碼: <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> 好,我們先看HTML文件的全部原代碼: <HTML> <head> <script for="window" event="onload"> </script> <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> <TITLE>CD Navigate</TITLE> </head> <body> <p> <object WIDTH="0" HEIGHT="0" CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> <p> <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> </p> </body> </HTML> 將以上代碼存為cd.htm文件,于第二步的cd.XML文件放在一起。打開cd.htm文件,你就看見和上面實例一樣的效果了。 好,到今天為止,我們已經學習了關于XML的不少知識,我們來總結一下前面五個章節(jié),分別是XML快速入門,XML的概念原理,XML的術語,XML的語法和本章的實例解析。到這里,教程部分就結束了。在寫作過程中,阿捷盡最大努力將有關XML概念講得通俗易懂,盡量把自己的理解告訴給大家,但因為本人學習XML時間也不長,對整個XML的技術把握還不夠系統(tǒng)和深入,所以難免有疏漏的地方,請大家指正和諒解,謝謝! posted on 2009-02-15 15:45 YXY 閱讀(187) 評論(0) 編輯 收藏
<![CDATA[這里放置需要顯示的字符]]>
例如:
<![CDATA[<AUTHOR sex="female">ajie</AUTHOR>]]>
在頁面上顯示的內容將是"<AUTHOR sex="female">ajie</AUTHOR>"
五.Namespaces的語法
Namespaces翻譯為名字空間。名字空間有什么作用呢?當我們在一個XML文檔中使用他人的或者多個DTD文件,就會出現(xiàn)這樣的矛盾:因為XML中標識都是自己創(chuàng)建的,在不同的DTD文件中,標識名可能相同但表示的含義不同,這就可能引起數(shù)據混亂。 比如在一個文檔<table>wood table</table>中<table>表示桌子, 而在另一個文檔<table>namelist</table>中<table>表示表格。如果我需要同時處理這兩個文檔,就會發(fā)生名字沖突。 了解決這個問題,我們引進了namespaces這個概念。namespaces通過給標識名稱加一個網址(URL)定位的方法來區(qū)別這些名稱相同的標識。 Namespaces同樣需要在XML文檔的開頭部分聲明,聲明的語法如下: <document 其中yourname是由你定義的namespaces的名稱,URL就是名字空間的網址。 假設上面的"桌子<table>"文檔來自http://www.zhuozi.com,我們就可以聲明為 <document http://www.zhuozi.com'> 然后在后面的標識中使用定義好的名字空間: <zhuozi:table>wood table</table> 這樣就將這兩個<table>區(qū)分開來。注意的是:設置URL并不是說這個標識真的要到那個網址去讀取,僅僅作為一種區(qū)別的標志而已。
六.entity的語法
entity翻譯為"實體"。它的作用類似 entity可以包含字符,文字等等,使用entity的好處在于:1.它可以減少差錯,文檔中多個相同的部分只需要輸入一遍就可以了。2.它提高維護效率。比如你有40個文檔都包含copyright的entity,如果需要修改這個copyright,不需要所有的文件都修改,只要改最初定義的entity語句就可以了。 XML定義了兩種類型的entity。一種是我們這里說的普通entity,在XML文檔中使用;另一種是參數(shù)entity,在DTD文件中使用。 entity的定義語法為: <!DOCTYPE filename [ <!ENTITY entity-name "entity-content" ] > 例如我要定義一段版權信息: <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved" ] > 如果我的版權信息內容和他人共享一個XML文件,也可以使用外部調用的方法,語法象這樣: <!DOCTYPE copyright [ <!ENTITY copyright SYSTEM "http://www.sample.com/copyright. ] > 定義好的entity在文檔中的引用語法為:&entity-name; 例如,上面定義的版權信息,調用時寫作?copyright; 完整的例子如下,你可以copy下來存為copyright.XML觀看實例: <? <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved"> ]> <myfile> <title>XML</title> <author>ajie</author> <email>ajie@aolhoo.com</email> <date>20010115</date> ©right; </myfile>
七.DTD的語法
DTD是"有效 1.設置元素 元素是XML文檔的基本組成部分。你要在DTD中定義一個元素,然后在XML文檔中使用。元素的定義語法為:<!ELEMENT DESCRIPTION (#PCDATA, DEFINITION)*> 說明: "<!ELEMENT" 是元素的聲明,說明你要定義的是一個元素; 聲明后面的"DESCRIPTION",是元素的名稱; "(#PCDATA, DEFINITION)*>"則是該元素的使用規(guī)則。規(guī)則定義了元素可以包含的內容以及相互的關系。下面的表格概要列出了元素的規(guī)則: 2.元素規(guī)則表: 此主題相關圖片如下: 另外,我們還可以為元素定義屬性,因為我們不推薦使用屬性,在這里就不詳細展開了。 最后,我們來總結一些前四章學習的內容,寫一個包含DTD,XML,以及Script的簡單實例,便于讀者理解: 1.將下面文件存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> 2.然后建立XML文檔myfile.xml: <? <!DOCTYPE myfile SYSTEM "myfile.dtd"> <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile> 3.建立HTML文檔myfile.html <HTML> <head> <script language=" var nodes = XMLDoc.documentElement.childNodes; title.innerText = nodes.item(0).text; author.innerText = nodes.item(1).text; </script> <title>在HTML中調用XML數(shù)據</title> </head> <body bgcolor="#FFFFFF"> <b>標題: </b> <span id="title"></span><br> <b>作者: </b> <span id="author"></span><br> </body> </HTML> 4.用IE5.0以上瀏覽器打開myfile.HTML就可以看到效果了。 XML輕松學習手冊(5)XML實例解析 第五章:XML實例解析 提綱: 一:實例效果 二:實例解析 1.定義新標識。 2.建立XML文檔。 3.建立相應的HTML文件。 XML在不同領域有著廣泛的應用,比如在科技領域的MathML,無線通信應用的WML,在網絡圖象方面的SVG等等,我們這里側重討論XML在web上的應用。XML在web上應用主要是利用其強大的數(shù)據操作能力。一般用XML配合JavaScript和ASP等服務器端程序,可以實現(xiàn)網絡上幾乎所有的應用需求。 考慮講解方便,我們在下面介紹一個簡單的實例,不包含服務器端程序。目的在于讓您對XML的數(shù)據操作能力有一個感性的認識。 好,我們首先[ 點擊這里 ]來看實例的效果。(請用IE5.0以上版本瀏覽器打開) 這是一個簡單的CD唱片數(shù)據檢索功能。你通過點擊"上一張","下一張"可以看到單張CD的有關信息。這樣的效果我們原來用兩種方法可以實現(xiàn): 1.利用DHTML,將數(shù)據隱藏在不同的層中,通過鼠標事件依次顯示; 2.利用后臺程序(如ASP,CGI,PHP,JSP等),調用服務器端的數(shù)據。 但是在這個實例中,我們打開頁面原代碼可以看到,其中沒有用DHTML的DIV,也沒有表單的action,它完全是用XML來實現(xiàn)的。下面我們來分析它的制作過程: 第一步:定義新標識。 根據實際的CD數(shù)據,首先新建一個名為<CD>的標識;其次建立它相關的數(shù)據標識,分別是:CD名稱<Title>,演唱者<Artist>,出版年代<Year>,國家<Country>,發(fā)行公司<Company>和價格<Price>;最后還要建立一個名為目錄<CATALOG>的標識。為什么要再建立一個<CATALOG>標識呢?因為在XML文檔中規(guī)定,必須且只能有一個根元素(標識),我們有多個CD數(shù)據,這些數(shù)據是并列的關系,所以需要為這些并列的元素建立一個根元素。 以上元素的定義和關系都完全符合XML標準,不需要特別的DTD文件來定義,所以可以省略DTD定義。如果我們想使用DTD來定義,以上過程可以表示為: <!ELEMENT CATALOG (CD)*> <!ELEMENT CD (Title,Artist,Year,Country,Company,Price)> <!ELEMENT Title (#PCDATA)> <!ELEMENT Artist (#PCDATA)> <!ELEMENT Year (#PCDATA)> <!ELEMENT Country (#PCDATA)> <!ELEMENT Company (#PCDATA)> <!ELEMENT Price (#PCDATA)> 這段代碼表示:元素CATALOG包含多個CD子元素,而子元素CD又依次包含Title, Artist, Year, Country, Company, Price 六個子元素,它們的內容都定義為文本(字符,數(shù)字,文本)。(注:具體的語法說明可以看上一章關于DTD的介紹) 第二步:建立XML文檔。 <? <CATALOG> <CD> <TITLE>Empire Burlesque</TITLE> <ARTIST>Bob Dylan</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>Columbia</COMPANY> <PRICE>10.90</PRICE> <YEAR>1985</YEAR> </CD> <CD> <TITLE>Hide your heart</TITLE> <ARTIST>Bonnie Tylor</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>CBS Records</COMPANY> <PRICE>9.90</PRICE> <YEAR>1988</YEAR> </CD> <CD> <TITLE>Greatest Hits</TITLE> <ARTIST>Dolly Parton</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>RCA</COMPANY> <PRICE>9.90</PRICE> <YEAR>1982</YEAR> </CD> <CD> <TITLE>Still got the blues</TITLE> <ARTIST>Gary More</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>Virgin redords</COMPANY> <PRICE>10.20</PRICE> <YEAR>1990</YEAR> </CD> <CD> <TITLE>Eros</TITLE> <ARTIST>Eros Ramazzotti</ARTIST> <COUNTRY>EU</COUNTRY> <COMPANY>BMG</COMPANY> <PRICE>9.90</PRICE> <YEAR>1997</YEAR> </CD> </CATALOG> 上面代碼首先用<? <CATALOG> <CD> ...... </CD> <CD> ...... </CD> </CATALOG> 一共定義了5組數(shù)據。我們將上面的代碼存為cd.XML文件,以備調用。 第三步:建立相應的HTML文件。 1.導入XML數(shù)據。 我們知道,目前流行的瀏覽器中,暫時只有微軟的IE5.0以上版本瀏覽器支持XML。IE是通過在 CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> 定義一個object,ID名為XMLdso。然后在head區(qū)用js引入xml數(shù)據: <script for="window" event="onload"> </script> 2.捆綁數(shù)據。 然后將用<SPAN>標識來將XML數(shù)據綁定在表格中。其中ID,DATASRC,DTATFLD都是<SPAN>的屬性。代碼如下: <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> 3.動作操作。 最后,為數(shù)據提供瀏覽按鈕: <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> 并利用js來完成兩個鼠標點擊功能:movenext()和moveprevious()。在head區(qū)加入如下代碼: <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> 好,我們先看HTML文件的全部原代碼: <HTML> <head> <script for="window" event="onload"> </script> <script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script> <TITLE>CD Navigate</TITLE> </head> <body> <p> <object WIDTH="0" HEIGHT="0" CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object> <table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table> <p> <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> </p> </body> </HTML> 將以上代碼存為cd.htm文件,于第二步的cd.XML文件放在一起。打開cd.htm文件,你就看見和上面實例一樣的效果了。 好,到今天為止,我們已經學習了關于XML的不少知識,我們來總結一下前面五個章節(jié),分別是XML快速入門,XML的概念原理,XML的術語,XML的語法和本章的實例解析。到這里,教程部分就結束了。在寫作過程中,阿捷盡最大努力將有關XML概念講得通俗易懂,盡量把自己的理解告訴給大家,但因為本人學習XML時間也不長,對整個XML的技術把握還不夠系統(tǒng)和深入,所以難免有疏漏的地方,請大家指正和諒解,謝謝! posted on 2009-02-15 15:45 YXY 閱讀(187) 評論(0) 編輯 收藏
1.設置元素
元素是XML文檔的基本組成部分。你要在DTD中定義一個元素,然后在XML文檔中使用。元素的定義語法為:<!ELEMENT DESCRIPTION (#PCDATA, DEFINITION)*>
說明:
"<!ELEMENT" 是元素的聲明,說明你要定義的是一個元素;
聲明后面的"DESCRIPTION",是元素的名稱;
"(#PCDATA, DEFINITION)*>"則是該元素的使用規(guī)則。規(guī)則定義了元素可以包含的內容以及相互的關系。下面的表格概要列出了元素的規(guī)則:
2.元素規(guī)則表:
另外,我們還可以為元素定義屬性,因為我們不推薦使用屬性,在這里就不詳細展開了。
最后,我們來總結一些前四章學習的內容,寫一個包含DTD,XML,以及Script的簡單實例,便于讀者理解: 1.將下面文件存為myfile.dtd <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)>
2.然后建立XML文檔myfile.xml: <? <!DOCTYPE myfile SYSTEM "myfile.dtd"> <myfile> <title>XML輕松學習手冊</title> <author>ajie</author> </myfile>
3.建立HTML文檔myfile.html <HTML> <head> <script language=" var nodes = XMLDoc.documentElement.childNodes; title.innerText = nodes.item(0).text; author.innerText = nodes.item(1).text; </script> <title>在HTML中調用XML數(shù)據</title> </head> <body bgcolor="#FFFFFF"> <b>標題: </b> <span id="title"></span><br> <b>作者: </b> <span id="author"></span><br> </body> </HTML>
4.用IE5.0以上瀏覽器打開myfile.HTML就可以看到效果了。
XML輕松學習手冊(5)XML實例解析
第五章:XML實例解析
一:實例效果
二:實例解析 1.定義新標識。 2.建立XML文檔。 3.建立相應的HTML文件。
XML在不同領域有著廣泛的應用,比如在科技領域的MathML,無線通信應用的WML,在網絡圖象方面的SVG等等,我們這里側重討論XML在web上的應用。XML在web上應用主要是利用其強大的數(shù)據操作能力。一般用XML配合JavaScript和ASP等服務器端程序,可以實現(xiàn)網絡上幾乎所有的應用需求。
考慮講解方便,我們在下面介紹一個簡單的實例,不包含服務器端程序。目的在于讓您對XML的數(shù)據操作能力有一個感性的認識。
好,我們首先[ 點擊這里 ]來看實例的效果。(請用IE5.0以上版本瀏覽器打開)
這是一個簡單的CD唱片數(shù)據檢索功能。你通過點擊"上一張","下一張"可以看到單張CD的有關信息。這樣的效果我們原來用兩種方法可以實現(xiàn):
1.利用DHTML,將數(shù)據隱藏在不同的層中,通過鼠標事件依次顯示;
2.利用后臺程序(如ASP,CGI,PHP,JSP等),調用服務器端的數(shù)據。
但是在這個實例中,我們打開頁面原代碼可以看到,其中沒有用DHTML的DIV,也沒有表單的action,它完全是用XML來實現(xiàn)的。下面我們來分析它的制作過程:
第一步:定義新標識。 根據實際的CD數(shù)據,首先新建一個名為<CD>的標識;其次建立它相關的數(shù)據標識,分別是:CD名稱<Title>,演唱者<Artist>,出版年代<Year>,國家<Country>,發(fā)行公司<Company>和價格<Price>;最后還要建立一個名為目錄<CATALOG>的標識。為什么要再建立一個<CATALOG>標識呢?因為在XML文檔中規(guī)定,必須且只能有一個根元素(標識),我們有多個CD數(shù)據,這些數(shù)據是并列的關系,所以需要為這些并列的元素建立一個根元素。 以上元素的定義和關系都完全符合XML標準,不需要特別的DTD文件來定義,所以可以省略DTD定義。如果我們想使用DTD來定義,以上過程可以表示為:
<!ELEMENT CATALOG (CD)*> <!ELEMENT CD (Title,Artist,Year,Country,Company,Price)> <!ELEMENT Title (#PCDATA)> <!ELEMENT Artist (#PCDATA)> <!ELEMENT Year (#PCDATA)> <!ELEMENT Country (#PCDATA)> <!ELEMENT Company (#PCDATA)> <!ELEMENT Price (#PCDATA)>
這段代碼表示:元素CATALOG包含多個CD子元素,而子元素CD又依次包含Title, Artist, Year, Country, Company, Price 六個子元素,它們的內容都定義為文本(字符,數(shù)字,文本)。(注:具體的語法說明可以看上一章關于DTD的介紹)
第二步:建立XML文檔。
<? <CATALOG> <CD> <TITLE>Empire Burlesque</TITLE> <ARTIST>Bob Dylan</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>Columbia</COMPANY> <PRICE>10.90</PRICE> <YEAR>1985</YEAR> </CD> <CD> <TITLE>Hide your heart</TITLE> <ARTIST>Bonnie Tylor</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>CBS Records</COMPANY> <PRICE>9.90</PRICE> <YEAR>1988</YEAR> </CD> <CD> <TITLE>Greatest Hits</TITLE> <ARTIST>Dolly Parton</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>RCA</COMPANY> <PRICE>9.90</PRICE> <YEAR>1982</YEAR> </CD> <CD> <TITLE>Still got the blues</TITLE> <ARTIST>Gary More</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>Virgin redords</COMPANY> <PRICE>10.20</PRICE> <YEAR>1990</YEAR> </CD> <CD> <TITLE>Eros</TITLE> <ARTIST>Eros Ramazzotti</ARTIST> <COUNTRY>EU</COUNTRY> <COMPANY>BMG</COMPANY> <PRICE>9.90</PRICE> <YEAR>1997</YEAR> </CD> </CATALOG>
上面代碼首先用<? <CATALOG> <CD> ...... </CD> <CD> ...... </CD>
</CATALOG> 一共定義了5組數(shù)據。我們將上面的代碼存為cd.XML文件,以備調用。
第三步:建立相應的HTML文件。 1.導入XML數(shù)據。 我們知道,目前流行的瀏覽器中,暫時只有微軟的IE5.0以上版本瀏覽器支持XML。IE是通過在 CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object>
定義一個object,ID名為XMLdso。然后在head區(qū)用js引入xml數(shù)據:
<script for="window" event="onload"> </script>
2.捆綁數(shù)據。 然后將用<SPAN>標識來將XML數(shù)據綁定在表格中。其中ID,DATASRC,DTATFLD都是<SPAN>的屬性。代碼如下:
<table> <tr><td>Title:</td><td><SPAN ID="title" DATASRC=# <tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=# <tr><td>Year:</td><td><SPAN ID="year" DATASRC=# <tr><td>Country:</td><td><SPAN ID="country" DATASRC=# <tr><td>Company:</td><td><SPAN ID="company" DATASRC=# <tr><td>Price:</td><td><SPAN ID="price" DATASRC=# </table>
3.動作操作。 最后,為數(shù)據提供瀏覽按鈕: <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()">
并利用js來完成兩個鼠標點擊功能:movenext()和moveprevious()。在head區(qū)加入如下代碼:
<script language=" function movenext() { if (XMLdso.recordset.absoluteposition < xmldso.recordset.recordcount) { XMLdso.recordset.movenext(); } } function moveprevious() { if (XMLdso.recordset.absoluteposition > 1) { XMLdso.recordset.moveprevious(); } } </script>
好,我們先看HTML文件的全部原代碼:
<HTML> <head>
<TITLE>CD Navigate</TITLE> </head>
<body> <p> <object WIDTH="0" HEIGHT="0" CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID=" </object>
<p> <INPUT TYPE=button value="上一張CD" onCLICK="moveprevious()"> <INPUT TYPE=button value="下一張CD" onCLICK="movenext()"> </p>
</body> </HTML>
將以上代碼存為cd.htm文件,于第二步的cd.XML文件放在一起。打開cd.htm文件,你就看見和上面實例一樣的效果了。
好,到今天為止,我們已經學習了關于XML的不少知識,我們來總結一下前面五個章節(jié),分別是XML快速入門,XML的概念原理,XML的術語,XML的語法和本章的實例解析。到這里,教程部分就結束了。在寫作過程中,阿捷盡最大努力將有關XML概念講得通俗易懂,盡量把自己的理解告訴給大家,但因為本人學習XML時間也不長,對整個XML的技術把握還不夠系統(tǒng)和深入,所以難免有疏漏的地方,請大家指正和諒解,謝謝!
posted on 2009-02-15 15:45 YXY 閱讀(187) 評論(0) 編輯 收藏
Powered by: BlogJava Copyright © YXY