<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    posts - 73,  comments - 55,  trackbacks - 0
      XML文件和HTML文件一樣,實際上是一個文本文件。顯然大家立刻就會明白,創建XML文件最普通的工具和HTML一樣,就是“記事本”了。除了“記事本”之外,當然還有一些更加方便的工具,如XML Notepad、XML Pro、CLIP!XML Editor等,這些工具的一大特點是:能夠檢查你所建立的XML文件是否符合XML規范。不過,現在這些工具都只有英文版的,并且需要付費使用。當然,你仍然能夠使用FrontPage、DreamWeaver等工具,不過使用起來不是很方便。隨著XML的逐漸普及,相信在不久后,也會出現非常好用的創建XML文件的工具。
     現在我們暫且使用“記事本”來創建我們的XML文件吧。先看一個XML文件:

      例1

      〈?xml version="1.0" encoding="gb2312" ?〉
       〈參考資料〉
       〈書籍〉
       〈名稱〉XML入門精解〈/名稱〉
       〈作者〉張三〈/作者〉
       〈價格 貨幣單位="人民幣"〉20.00〈/價格〉
       〈/書籍〉
       〈書籍〉
       〈名稱〉XML語法〈/名稱〉
       〈!--此書即將出版--〉
       〈作者〉李四〈/作者〉
       〈價格 貨幣單位="人民幣"〉18.00〈/價格〉
       〈/書籍〉
       〈/參考資料〉

      這是一個典型的XML文件,編輯好后保存為一個以.xml為后綴的文件。我們可以將此文件分為文件序言(Prolog)和文件主體兩個大的部分。在此文件中的第一行即是文件序言。該行是一個XML文件必須要聲明的東西,而且也必須位于XML文件的第一行,它主要是告訴XML解析器如何工作。其中,version是標明此XML文件所用的標準的版本號,必須要有;encoding指明了此XML文件中所使用的字符類型,可以省略,在你省略此聲明的時候,后面的字符碼必須是Unicode字符碼(建議不要省略)。因為我們在這個例子中使用的是GB2312字符碼,所以encoding這個聲明也不能省略。在文件序言部分還有一些聲明語句,我們在后面給予介紹。

      文件的其余部分都是屬于文件主體,XML文件的內容信息存放在此。我們可以看到,文件主體是由開始的〈參考資料〉和結束的〈/參考資料〉控制標記組成,這個稱為XML文件的“根元素”;〈書籍〉是作為直屬于根元素下的“子元素”;在〈書籍〉下又有〈名稱〉、〈作者〉、〈價格〉這些子元素。貨幣單位是〈價格〉元素中的一個“屬性”,“人民幣”則是“屬性值”。

      〈!--此書即將出版--〉這一句同HTML一樣,是注釋,在XML文件里,注釋部分是放在“〈!--”與“--〉”標記之間的部分。

      大家可以看到,XML文件是相當簡單的。同HTML一樣,XML文件也是由一系列的標記組成,不過,XML文件中的標記是我們自定義的標記,具有明確的含義,我們可以對標記中的內容的含義作出說明。

      對XML文件有了初步的印象之后,我們就來詳細地談一談XML文件的語法。在講語法之前,我們必須要了解一個重要的概念,就是XML解析器(XML Parse)。

      1.XML解析器

      解析器的主要功能就是檢查XML文件是否有結構上的錯誤,剝離XML文件中的標記,讀出正確的內容,以交給下一步的應用程序處理。XML是一種用來結構化文件信息的標記語言,XML規范中對于如何標記文件的結構性有一個詳細的法則,解析器就是根據這些法則寫出來的軟件(多用Java寫成)。同HTML一樣,在瀏覽器中,必須有HTML的解析器,這樣瀏覽器才能夠“讀懂”各種用HTML標記所組成的網頁,將它們顯示在我們面前。如果有瀏覽器的HTML解析器讀不懂的標記,將會返回給我們錯誤信息。

      由于現在的HTML標記實際上相當混亂,存在大量不規范的標記(有的網頁用IE能正常顯示,而用Netscape Navigator則不行),所以從一開始,XML的設計者就嚴格規定了XML的語法和結構,我們編寫的XML文件必須遵循這些規定,否則XML解析器將毫不留情地給你顯示錯誤信息。

      有兩種XML文件,一種是Well-Formed XML文件,一種是Validating XML文件。

      如果一個XML文件滿足XML規范中的某些相關法則,且沒有使用DTD(文件格式定義——后詳述)時,可稱這份文件是Well-Formed。而如果一個XML文件是Well-Formed,且正確地使用了DTD,DTD中的語法又是正確的,那么這個文件就是Validating。對應兩種XML文件,有兩種XML解析器,一種是Well-Formed 解析器,一種是Validating解析器。IE 5中就內含Validating解析器,Validating解析器也可用來解析Well-Formed XML文件。

      檢查它是否滿足了Well-Formed的條件。我們可以將剛才編輯的第一個XML 文件用IE 5以上版本的瀏覽器打開。

      大家可能要問為什么在瀏覽器中的顯示和我的源文件一樣?沒錯,因為對于XML文件,我們黿齬匭乃 的內容,而它的顯示形式是交給CSS或XSL來完成的。這里,我們并沒有給這個XML文件定義它的CSS或XSL文件,所以它按照原來的形式來顯示。實際上,對于電子數據交換,僅僅需要一個XML文件即可,如果要將它以某種形式顯示出來,我們就必須編輯CSS或XSL文件(這個問題會在以后討論)。

      2.Well-Formed的XML文件

      我們知道,XML必須是Well-Formed的,才能夠被解析器正確地解析出來,顯示在瀏覽器中。那么什么是Well-Formed的XML文件呢?主要有下面幾個準則,我們在創建XML文件的時候,必須滿足它們。

      首先,XML文件的第一行必須是聲明該文件是XML文件以及它所使用的XML規范版本。在文件的前面不能夠有其它元素或者注釋。

      第二,在XML文件中有且只能夠有一個根元素。我們的第一個例子中,〈參考資料〉... 〈/參考資料〉就是此XML文件的根元素。

      第三,在XML文件中的標記必須正確地關閉,也就是說,在XML文件中,控制標記必 須有與之對應的結束標記。如:〈名稱〉標記必須有對應的〈/名稱〉結束標記,不像HTML,某些標記的結束標記可有可無。如果在XML文件中遇到自成一個單元的標記,就是類似于HTML 中的〈img src=.....〉的這些沒有結束標記的時候,XML把它稱為“空元素”,必須用這樣的寫法:〈空元素名/〉,如果元素中含有屬性時寫法則為:〈空元素名 屬性名=“屬性值”/〉。

      第四,標記之間不得交叉。在以前的HTML文件中,可以這樣寫:

      〈B〉〈H〉XXXXXXX〈/B〉〈/H〉,〈B〉和〈H〉

      標記之間有相互重疊的區域,而在XML中,是嚴格禁止這樣標記交錯的寫法,標記必須以規則性的次序來出現。?

      第五,屬性值必須要用“ ”號括起來。如第一個例子中的“1.0”、“gb2312”、“人民幣”。都是用“ ”號括起來了的,不能漏掉。

      第六,控制標記、指令和屬性名稱等英文要區分大小寫。與HTML不同的是,在HTML中, 類似〈B〉和〈b〉的標記含義是一樣的,而在XML中,類似〈name〉、〈NAME〉或〈Name〉這樣的標記是不同的

      第七,我們知道,在HTML文件中,如果我們要瀏覽器原封不動地將我們所輸入的東西顯示出來,可以將這些東西放到〈pre〉〈/pre〉或者〈xmp〉〈/xmp〉標記中間。這對于我們創建HTML教學的網頁是必不可少的,因為網頁中要顯示HTML的源代碼。而在XML中,要實現這樣的功能,就必須使用CDATA標記。在CDATA標記中的信息被解析器原封不動地傳給應用程序,并且不解析該段信息中的任何控制標記。CDATA區域是由:“〈![CDATA[”為開始標記,以“>〉”為結束標記。例如:例2中的源碼,除了“〈![CDATA[”和“>〉”符號,其余的內容解析器將原封不動地交給下游的應用程序,即使CDATA區域中的開始和結尾的空白以及換行字符等,都同樣會被轉交(注意CDATA是大寫的字符)。

      例2

      〈![CDATA[飛翔的xml〉〉〉〉〉,:-)
       oooo〈〈〈〈〈〈〈
       >〉

      第八,XML處理空白字符和HTML不一樣。HTML標準規定,不管有多少個空白,都當作一個空白來處理;而在XML中規定,所有標記以外的空白,解析器都要忠實地交給下游的應用程序處理。這樣,我們有時必須摒棄編寫HTML文件時的縮排習慣,因為縮排的空格,解析器也要處理。如:

       〈作者〉張三〈/作者〉
       和
       〈作者〉
       張三
       〈/作者〉

      上述內容對于解析器來說是不同的(后者在〈作者〉〈/作者〉標記之內除了張三這個字符以外,還包括兩個換行記號以及“張三”前的文字縮排符號)。所以解析器在去掉標記后將信息傳給應用程序將有不同的處理結果。

      如果我們想明確地告訴XML程序,標記中的空白有明確的含義,不要隨便去掉(如在一些詩中,空格有它具體的意義),則可在標記中加入一個XML內置的屬性——xml:space 。如(注意屬性名稱和值的大小寫):   

      〈詩歌 xml:space="preserver"〉
       祖國??! 祖國!
       我的祖國!
       〈/詩歌〉

      另外,在XML文件中,如果要用到表1的特殊字符,必須用相應符號代替。

      表1

      特殊字符 替代符號
       && &
       < &it;
       > >
       " "
       ' &apos;

      在此做個小結:符合上述規定的XML文件就是Well-Formed的XML文件。這是編寫XML文件的最基本要求。可以看到XML文件的語法規定比HTML要嚴格多了。由于有這樣的嚴格規定,軟件工程師編寫XML的解析器就容易多了,不像編寫HTML語言的解析器,必須費盡心思去適應不同的網頁寫法,提高自己瀏覽器的適應能力。實際上,這對于我們初學者來說,也是一件好事。該怎樣就怎樣,不必像原來那樣去疑惑各種HTML的寫法。

      我們看到,在XML文件中,用的大多都是自定義的標記。但是大家考慮一下,如果兩個同行業的公司A和B要用XML文件相互交換數據,A公司用〈價格〉標記來表示他們產品的價格信息,而B公司可能用〈售價〉來表示價格信息。如果一個XML應用程序來讀取他們各自的XML文件中的信息時,如果它只知道〈價格〉標記里表示的是價格信息,那么B公司的價格信息就讀不出來,必將產生錯誤。顯然,對于想利用XML文件來交換信息的實體來說,他們之間必須有一個約定——即編寫XML文件可以用哪些標記,母元素中能夠包括哪些子元素,各個元素出現的順序,元素中的屬性怎樣定義等。這樣他們在用XML交換數據時才能夠暢通無阻。這種約定稱為DTD(Document Type Definition,文檔格式定義)??梢园袲TD看作編寫XML文件的模板。對于同行業之間的XML數據交換,有一個固定的DTD將會方便很多。比如說,如果網上的各大電子商場的XML網頁都遵循同一個DTD時,那么我們就可以輕松地依據這個DTD 編寫一個應用程序,去網上將我們感興趣的東西自動抓回來。事實上已經有了好幾個定義好的DTD,如前面所說的MathML、SMIL等。

      如果一個XML文件是Well-Formed的,并且它是正確的依據某個DTD建立的,那么,這個XML文件就被稱為:Validating XML文件。相應的解析器就稱為:Validating Parser。

    posted on 2006-08-10 11:14 保爾任 閱讀(137) 評論(0)  編輯  收藏

    只有注冊用戶登錄后才能發表評論。


    網站導航:
     

    <2025年5月>
    27282930123
    45678910
    11121314151617
    18192021222324
    25262728293031
    1234567

    常用鏈接

    留言簿(4)

    隨筆分類

    隨筆檔案

    文章分類

    文章檔案

    搜索

    •  

    最新評論

    閱讀排行榜

    評論排行榜

    主站蜘蛛池模板: 亚洲精品在线免费观看| 无码人妻久久一区二区三区免费| 毛片大全免费观看| 亚洲国产成AV人天堂无码| 最近中文字幕免费完整| 亚洲av永久无码精品秋霞电影影院| 精品国产免费一区二区三区| 亚洲精品在线视频| 国产日韩精品无码区免费专区国产| 免费大黄网站在线看| 免费无码国产在线观国内自拍中文字幕| 免费在线观看日韩| 九九免费精品视频在这里| 亚洲性久久久影院| 久久青草91免费观看| 久久精品国产亚洲AV嫖农村妇女| 在线永久看片免费的视频| 亚洲国产精品综合一区在线| 在线观看特色大片免费视频| 亚洲最大无码中文字幕| 国产又粗又长又硬免费视频| jizz18免费视频| 久久久亚洲裙底偷窥综合| 最近最新MV在线观看免费高清| 亚洲AV无码AV男人的天堂不卡| 四虎免费影院4hu永久免费| ssswww日本免费网站片| 97se亚洲综合在线| 日本免费v片一二三区| h在线看免费视频网站男男| 亚洲视频网站在线观看| 国产成人免费永久播放视频平台| jizz18免费视频| 亚洲三级视频在线观看| 波多野结衣中文一区二区免费| 国产一级片免费看| 亚洲乱亚洲乱妇24p| 久久精品国产亚洲夜色AV网站| 成年女人午夜毛片免费视频| 一级毛片试看60分钟免费播放| 亚洲国产精品成人综合久久久 |