xml(可擴展標記語言)看起來可能像某種w3c標準——現在沒有什么實際影響,即使以后能派上用場,也是很久以后的事。但實際上,它現在已經得到了應用。所以,不要等到xml已被加進了你最喜愛的html編輯器中才開始使用它。它現在就可以解決各種內部問題和b2b系統問題。
在sparks.com,我們使用xml來標準化從java對象到html數據顯示等不同系統之間的數據表示。
特別需要指出的是,我們發現,只要以非常基本的xml結構來實現標準化,就可以更容易地共享和操作數據。在這一過程中,我們發現了使用xml的很多有效方法。下面詳細介紹我們現在的應用情況。
標準化
在使用xml之前,建立與你要使用的信息不同的xml數據格式。
生成動態xml
從數據庫中生成html并不新鮮,但生成xml卻很新鮮。這里我們介紹具體的生成步驟。
用xsl作為模板語言
xsl(可擴展樣式表語言)是定義xml數據顯示格式的好方法,如果寫成幾個靜態模板會更有效。
生成html
xml加上xsl就等于html。這聽起來似乎不對,但用戶所見的我們的html頁面其實就是xml和xsl共同產生的效果。
一、標準化
xml的能力來自于它的靈活性。但不幸的是,它有時太靈活了,以至于你會面對一個空白的頁面,發愁該怎么解決問題。
在任何xml的項目中,第一步工作都是創建標準的數據格式。為此你要作出以下決定:
? 要涉及哪些數據
? 是否要使用dtd(文件類型定義)
? 是否要使用dom(文檔對象模型)或sax(xml的簡化api)解析
確定數據:
因為沒有標準的xml格式,開發者可以自由地開發自己的格式。然而,如果你的格式只能被一個應用程序識別,那么你只能運行這個程序來使用該格式。如果還有其他程序也能讀懂你的xml格式,那顯然會更有幫助。如果某個xml格式被修改,則使用它的系統可能也需要被修改,所以你應該建立盡可能完整的格式。因為大多數系統忽略它們無法識別的標簽,所以改變一個xml格式的最安全的方法是添加標簽,而不是修改標簽。
單擊此處查看xml數據格式實例
在sparks.com,我們查看了不同的產品展示需要的所有產品數據。盡管并不是所有的頁面都使用全部數據,但我們還是由此開發出適用于所有數據的非常完整的xml數據格式。例如,我們的產品明細信息頁面顯示的數據要比產品瀏覽頁面多。然而,我們在這兩種情況下仍然使用相同的數據格式,因為每個頁面的xsl模板都只使用它所需要的字段。
是否使用dtd
在sparks.com,我們使用組織良好的xml,而不使用僅僅是正確的xml,因為前者不需要dtd。dtd在用戶點擊和看到頁面之間加入了一個處理層。我們發現這一層需要太多的處理。當然,在以xml格式與其他公司通信時,使用dtd還是很不錯的。因為dtd能在發送和接受時能保證數據結構正確。
選擇解析引擎
現在,可以使用的解析引擎有好幾個。選擇哪一個幾乎完全取決于你的應用需要。如果你決定使用dtd,那么這個解析引擎必須能使你的xml被dtd驗證。你可以將驗證另放到一個進程中,但那樣會影響性能。
sax和dom是兩個基本的解析模型。sax基于事件,所以在xml被解析時,事件被發送給引擎。接下來,事件與輸出文件同步。dom解析引擎為動態xml數據和xsl樣式表建立層次樹狀結構。通過隨機訪問dom樹,可以提供xml數據,就象由xsl樣式表來決定一樣。sax模型上的爭論主要集中于對dom結構的內存降低過度和加快xsl樣式表解析時間縮短方面。
然而,我們發現使用sax的很多系統并沒有充分發揮它的能力。這些系統用它來建立dom結構并通過dom結構來發送事件。用這種方法,在任何xml處理之前必須從樣式表中建立dom,所以性能會下降。
二、生成動態xml
一旦建立了xml格式,我們需要一種能夠將其從數據庫中動態移植的方法。
生成xml文檔相對來說比較簡單,因為它只需要一個可以處理字符串的系統。我們建立了一個使用java servlet、enterprise javabean server、jdbc和rdbms(關系型數據庫管理系統)的系統。
? servlet通過把生成xml文檔的任務交給enterprise javabean (ejb)來處理產品信息請求。
? ejb使用jdbc從數據庫里查詢所需的產品詳細信息。
? ejb生成xml文件并把它傳遞給servlet。
? servlet調用解析引擎,從xml文件和靜態的xsl樣式表中創建html輸出。
(有關xsl應用的其他信息,請參閱用xsl作為模板語言。)
生成xml的例子
在java中創建xml文檔字符串的真正代碼可以分成幾個方法和類。
啟動xml生成過程的代碼放在ejb方法里。這一實例會立即創建一個stringbuffer,以便存儲生成的xml字符串。
stringbuffer xml = new stringbuffer();
xml.append(xmlutils.begindocument("/browse_find/browse.xsl", "browse", request));
xml.append(product.toxml());
xml.append(xmlutils.enddocument("browse");
out.print(xml.tostring());
后面的三個xml.append()變元本身就是對其他方法的調用。
產生文件頭
第一個附加方法調用xmlutils類來產生xml文件頭。我們的java servlet中的代碼如下:
public static string begindocument(string stylesheet, string page)
{
stringbuffer xml = new stringbuffer();
xml.append("\n")
.append(" .append(stylesheet).append("\"")
.append(" type =\"text/xsl\"?>\n");
xml.append("<").append(page).append(">\n");
return xml.tostring();
}
這段代碼生成了xml文件頭。標簽把本文件定義為支持1.0版本的xml文件。第二行代碼指向用以顯示數據的正確樣式表的位置。最后包括進去的是項級標簽(本實例中為)。在文件末尾,只有標簽需要被關閉。
填入產品信息
完成了文件頭后,控制方法會調用java對象來產生它的xml。本例中調用的是product對象。product對象使用兩個方法來產生它的xml表示。第一個方法toxml()通過產生和標簽來建立product節點。然后它會調用internalxml(),這樣就能提供產品xml所需的內容。internalxml()是一系列的stringbuffer.append()調用。stringbuffer也被轉換成字符串并返回給控制方法。
public string toxml()
{
stringbuffer xml = new stringbuffer("\n");
xml.append(internalxml());
xml.append("\n");
return xml.tostring();
}
public string internalxml()
{
stringbuffer xml = new
stringbuffer("\t")
.append(producttype).append("\n");
xml.append("\t").append(idvalue.trim())
.append("\n");
xml.append("\t").append(idname.trim())
.append("\n");
xml.append("\t").append(page.trim())
.append("\n");
厖?
xml.append("\t").append(amount).append("\n");
xml.append("\t").append(vendor).append("\n");
xml.append("\t\n");
xml.append("\t").append(pubdesc).append("\n");
xml.append("\t").append(vendesc).append("\n";
厖?
return xml.tostring();
}
關閉文件
最后,xmlutils.enddocument()方法被調用。這個調用關閉xml標簽(本例中為),并最終完成架構好的xml文件。來自控制方法的整個stringbuffer也轉換成字符串,并返回給處理最初http請求的servlet。
三、用xsl作為模板語言
為了得到html輸出,我們把生成的xml文件和控制xml數據如何表示的xsl模板相結合。我們的xsl模板由精心組織的xsl和html標簽組成。
開始建模板
我們的xsl模板開始部分與下面這段代碼類似。第一行代碼為必需代碼,將本文件定義為xsl樣式表。xmlns:xsl=屬性引用本文件所使用的xml名稱空間,而version=屬性則定義名稱空間的版本號。在文件的末尾,我們關閉標簽。
由開始的第二行代碼確定了xsl模板的模式。match屬性是必需的,在這里指向xml標簽。在我們的系統里,標簽里包含 標簽,這使得xsl模板可以訪問嵌在標簽內的產品信息。我們又一次必須在文件末尾關閉標簽。
接下來,我們來看一看組織良好的html。由于它將被xml解析引擎處理,所以必須符合組織良好的xml的所有規則。從本質上來講,這意味著所有的開始標簽必須有對應的結束標簽。例如,通常不被結束的
標簽,必須用
關閉。
http://www.w3.org/1999/xsl/transform"
version="1.0">?br> 在模板的主體內,有很多xsl標簽被用于為數據表示提供邏輯。下面解釋兩個常用的標簽。
choose
標簽類似于傳統編程語言中if-then-else結構的開始部分。在xsl中,choose標簽表示在代碼進入的部分中,賦值將觸發動作的發生。擁有賦值屬性的標簽跟在choose標簽后面。如果賦值是正確的,位于的開始和結束標簽之間的內容將被使用。如果賦值錯誤,就使用的開始和結束標簽之間的內容。整個部分用來結束。
在這個例子里,when標簽會為quantity標簽檢查xml。如果quantity標簽里含有值為真的error屬性,quantity標簽將會顯示列在下面的表格單元。如果屬性的值不為真,xsl將會顯示otherwise標簽間的內容。在下面的實例里,如果error屬性不真,則什么都不會被顯示。