Posted on 2005-02-28 11:44
wxb_nudt 閱讀(4620)
評論(14) 編輯 收藏 所屬分類:
技術雜談
(這里的XML不僅僅指XML腳本語言,還包括XML的一系列技術,包括DTD,XSLT,XML SCHEMA,XPATH,DOM,SAX等等)
XML的本質(zhì)是什么?這個問題對于很多XML的初學者來說都不容易回答。因為XML涉及的方面太多,有人是為了寫出更漂亮的網(wǎng)頁才從HTML進一步學到XML;有人是為了學JAVA才來了解XML;有人是從數(shù)據(jù)庫到XML;有人是從UML到XML;當然還有一些人是從SOAP或者其他網(wǎng)絡協(xié)議而了解到XML。那么到底如何解釋XML的本質(zhì)呢?
我認為XML的本質(zhì)是數(shù)據(jù),XML文檔實際上是對數(shù)據(jù)的格式化存儲,而XML的一系列技術都是圍繞著數(shù)據(jù)來發(fā)展的。例如DTD、Schema是對數(shù)據(jù)格式的定義和檢驗;XSLT是對數(shù)據(jù)的轉(zhuǎn)換;DOM、SAX是對數(shù)據(jù)的提取和操作。
既然XML只是數(shù)據(jù),而且是用文本形式存儲的數(shù)據(jù),那么為什么不更簡單的用普通文本來存儲數(shù)據(jù)呢?早期的一些程序員確實是這么做的,但是這么做的缺點是對于每一組數(shù)據(jù),都需要專用的數(shù)據(jù)格式定義、檢驗、轉(zhuǎn)換和操作的程序。如果使用XML來存儲數(shù)據(jù),由于XML的一系列技術已經(jīng)對以上的問題提供了工具,我們只需要使用那些技術即可快捷的達到自己的目的。有人可能會說,使用數(shù)據(jù)庫不是更方便么?它也提供了以上的功能。確實如此,但是并不是每個地方都適用數(shù)據(jù)庫的,如果說數(shù)據(jù)庫是大而全的數(shù)據(jù)解決方案的話,XML可以用“舉重若輕,大象無形”來形容,這一點后面再討論。
XML的本質(zhì)決定了它在網(wǎng)頁制作方面比HTML更具有優(yōu)越性。傳統(tǒng)的網(wǎng)頁包括HTML+CSS,在這種模式中,數(shù)據(jù)和數(shù)據(jù)的顯示特性都包含在HTML中,CSS只是對顯示特性的一種補充;而XML網(wǎng)頁包括XML+XML Schema+XSL,其中XML存儲數(shù)據(jù),XML Schema定義了數(shù)據(jù)的存儲格式,XSL定義了數(shù)據(jù)的顯示特性(其實它定義了如何將XML轉(zhuǎn)換為HTML,實際上就是定義了數(shù)據(jù)的顯示特性)。使用XML制作的網(wǎng)頁將數(shù)據(jù)、數(shù)據(jù)格式和顯示特性清晰的分為三個部分,在添加或者修改網(wǎng)頁的時候可以單獨的修改每個部分,從而得到更好的維護性和更高的制作效率。當然動態(tài)網(wǎng)頁可以由Database+腳本語言(JSP、ASP、PHP)+HTML+CSS組成;同樣基于XML的動態(tài)網(wǎng)頁可以由Database+中間程序(提取數(shù)據(jù)庫內(nèi)容形成XML文檔)+XML+XML Schema+XSL組成。基于XML的解決方案同樣保持了層次清晰的優(yōu)點。
對于XML和數(shù)據(jù)庫的比較,我的上一篇文章中有過討論()。從本質(zhì)上來說,XML和數(shù)據(jù)的本質(zhì)差不多,都是圍繞著數(shù)據(jù)來提供一系列的解決方案,但是它們之間存在幾個顯著的不同:1.XML是輕量級的數(shù)據(jù)解決方案,容易學習,可以用文本編輯器進行編輯,一般的瀏覽器都支持XSLT,適用于數(shù)據(jù)量小的各種環(huán)境;2.XML是完全平臺無關的,不需要依賴于特定的操作系統(tǒng)、瀏覽器或者編程語言,而數(shù)據(jù)庫不是完全平臺無關的;3.XML是基于文本的,適合于網(wǎng)絡傳輸,你不能指望每個EJB的配置文檔都用數(shù)據(jù)庫來表示吧;4.XML和數(shù)據(jù)庫是可以互相結合和轉(zhuǎn)換的。
對數(shù)據(jù)的不同理解可以將XML應用到不同的方面。你可以這樣理解:XML是數(shù)據(jù)庫中的數(shù)據(jù);Schema是數(shù)據(jù)庫的表;XSL是顯示數(shù)據(jù)的程序;也可以這么理解:XML是網(wǎng)頁素材;Schema是素材的數(shù)據(jù)結構;XSL是素材的顯示特性。同樣,在軟件建模方面,也可以用XML來替代UML。這是基于這么一種理解:Schema代表類圖,它如同UML一樣存儲了類的結構特性;XML代表對象,它存儲了類的實例化對象的屬性數(shù)據(jù);而XSL是對類圖的轉(zhuǎn)換,即MDA(Model Driven Architecture,模型驅(qū)動架構)中的提到的模型轉(zhuǎn)換。在UML中沒有模型轉(zhuǎn)換技術,但是一些UML工具提供了代碼生成的功能(例如RationalRose),這中功能可以理解為模型轉(zhuǎn)換的一個特例。因此有人提出了用XSLT做代碼生成的建議,事實上這種代碼生成技術已經(jīng)比較成熟。由于XML Schema并不是天生就用來刻劃類圖的,所以它在類的繼承等方面存在一些不足之處,為了修正這些不足,OMG(Object Manage Group,對象管理組)組織提出了XMI(XML Metadata Interchange,XML元數(shù)據(jù)交換)標準,用來補充XML Schema在軟件建模方面的不足。現(xiàn)在XMI已經(jīng)變成了各種軟件建模工具的通用存儲方式,可以將不同建模工具建立的模型互相轉(zhuǎn)換。
總的來說,XML是一種基于文本的、格式化的數(shù)據(jù)存儲技術,它包括一系列的數(shù)據(jù)解決方案,它們是輕量級的、易于學習的、平臺無關的數(shù)據(jù)解決方案。弄清楚了這個概念再去學習XML,也許更有幫助。