在windows下開發程序，用M$提供的接口處理.ini文件或管理注冊表的鍵值是非常方便的。在java平臺上開發程序，則習慣于以xml格式的文件來存放系統的配置信息，對這種文件的解析和處理，可以用sax或dom。有沒有更簡便的方法呢？有，就是用digester模塊。
Digester是Jakarta 子項目Commons下的一個模塊，支持基于規則的對任意XML文檔的處理。它最初是Structs項目的一部分，后因其通用性而劃歸Commons.

下載及編譯

cvs -d :pserver:anoncvs@cvs.apache.org:/home/cvspublic login
password: anoncvs
cvs -d :pserver:anoncvs@cvs.apache.org:/home/cvspublic checkout jakarta-commons/digester
cd jakarta-commons/digester
ant dist

Digester的運行依賴下列包：

一個遵循Jaxp(1.1版本及以后)的XML解析器
Jakarta commons beanutils包(1.5版本及以后)
Jakarta commons collections包(2.1版本及以后)
Jakarta commons logging包(1.0.2版本及以后)

一個簡單的例子

假定有兩個JavaBean如下，分別為Foo和Bar

package mypackage;
public class Foo {
   public void addBar(Bar bar);
   public Bar findBar(int id);
   public Iterator getBars();
   public String getName();
   public void setName(String name);
}
public mypackage;
public class Bar {
   public int getId();
   public void setId(int id);
   public String getTitle();
   public void setTitle(String title);
}

用下面的xml文件進行配置

用下面幾行代碼即可完成配置文件解析工作：

Digest解析代碼	注釋
Digester digester = new Digester();
digester.setValidating(false);	不進行XML與相應的DTD的合法性驗證
digester.addObjectCreate("foo", "mypackage.Foo");	當遇到<foo>時創建一個mypackage.Foo對象，并將其放在棧頂
digester.addSetProperties("foo");	根據<foo>元素的屬性(attribute)，對剛創建的Foo對象的屬性(property)進行設置
digester.addObjectCreate("foo/bar", "mypackage.Bar");	當遇到<foo>的子元素<bar>時創建一個mypackage.Bar對象，并將其放在棧頂。
digester.addSetProperties("foo/bar");	根據<bar>元素的屬性(attribute)，對剛創建的Bar對象的屬性(property)進行設置
digester.addSetNext("foo/bar", "addBar", "mypackage.Bar");	當再次遇到<foo>的子元素<bar>時創建一個mypackage.Bar對象，并將其放在棧頂，同時調用第二棧頂元素(Foo對象)的addBar方法。
Foo foo = (Foo) digester.parse();	分析結束后，返回根元素。

基本情況

熟悉用SAX來處理XML文檔的程序員，會發現Digester隱藏了遍歷XML元素這些細節，而是提供了更高一層的、更友好的SAX事件接口，從而讓程序員的精力放在對數據的處理過程中。
使用Digester，須按照以下步驟：

創建一個org.apache.commons.digester.Digester實例。一個解析請求完成后，這個Digester可以被后面復用。但也不要試圖在不同的線程中從共享一個Digester實例。
根據需要設置一些配置屬性(configuration properties)，以控制下一步的解析操作。
將一個或幾個初始對象(initial object)壓入Digester對象棧,本步驟不是必須的。
注冊所有的元素匹配模板(elemet matching pattern)。當一個模板被從輸入文檔中識別出來以后，與其相聯系的處理規則(processing rules)被激活。對一個特定的模板，可以定義任意多的規則，當識別出該模板后，這些規則依序依次執行。
調用digester.parse()方法，一個XML文檔的引用(用多種方式供選擇)要傳給這個方法。注意，需要捕捉并處理IOException或SAXEception或處理過程中拋出的異常。

元素匹配模板

Digester能自動遍歷目標XML文檔的元素形成的層次結構，這個過程無需程序員參與。程序員的任務是決定，在解析的過程中，當由嵌套的元素形成的一個特定序列被識別出時，如何處理它。用以描述這種序列的機制，就叫“元素匹配模板”。
具體說來，元素和其子元素間，用”/”相隔，如果一些元素前沒有”/”則其必為根元素。如例：

字符”*”表示任意級別，如”*/a”表示任意級別的<a>都可匹配(不包括根元素級的).熟悉XLST的朋友，對這種思路一定不陌生。
從上面的描述，可知某個元素同時滿足多個匹配模板是非常可能的，在這種情況下，與各個模板相關聯的處理規則（processing rule）的執行順序如下：對begin或body方法，按照各個rule的注冊順序的先后，對end方法則是注冊順序的反序。

處理規則(processing rule)

元素匹配模板用以識別什么時候采取行動，處理規則則用以定義行動的內容。
從形式上講，一個處理規則是一個java類，它擴展了org.apache.commons.digester.Rule類。每個處理規則，實現下列的一個或幾個事件處理方法(event method)，當相應的模板匹配成功以后，在已定義的某個時刻，這些事件方法會被觸發。

begin(),在一個匹配元素被識別出后的“開始”時刻被調用，這個元素的所有屬性放在一個數據結構中被傳遞給begin()
body(),當元素的嵌套內容（如子元素）被識別出時被調用。在解析的過程中，前后的空白被去掉了
end(),匹配元素的“結束”時刻被調用。如果子元素也匹配相關的規則，則這些規則的方法需都執行畢，才能達到該元素的“結束”時刻。
finish(),解析結束時被調用，以提供給各個規則以清理臨時數據的機會。

在設置digester時，通過調用addRule()方法，來注冊一個特定的元素匹配模板以及相應的一個Rule類的實例。如上所述，Rule類中的事件處理方法，會在適當的時間被調用。這個機制，允許動態地生成Rule的實現。
另外，digester也提供了一些處理常見情況的處理規則類。

ObjectCreateRule,當begin()方法被調用時，這個規則類實例化一個指定的java類，并將其壓入棧頂。這個被實例化的類的名字，默認是這個規則類構造函數得到的參數，也可以通過指定正在處理的xml元素的屬性來傳遞一個新的類的名字。當end()方法被調用　時，棧頂的對象被彈出，Digester中對它的任何引用將被忽略。
FactoryCreateRule,一個非常有用的ObjectCreateRule的變體。
SetPropertiesRule,當begin()方法被調用時，digester使用標準的Java Relection API來識別JavaBean的屬性設置方法(setter method)，這些方法名稱中包含屬性（property）的名字，這些屬性與XML元素的屬性(attribute)匹配，于是這些方法被調用并將相應的屬性值(attribute value)傳給它們。這些自然的映射可以被重寫。建議不要過度使用這項功能，在大多數情況下，使用標準的BeanInfo機制會更好。
SetPropertyRule,當begin()方法被調用時，digester調用棧頂對象的一個特定的屬性設置方法(property setter)并傳給它特定的值(property和值分別由兩個attribute命名)。這對XML需要遵循一個指定的DTD時比較有用，你可以設置一個特別的屬性(property)，雖然在指定DTD沒有attribute與其相對應。
SetNextRule,當end()方法被調用時，digester分析第二棧頂元素，尋找一個特定屬性(property)的設置方法 (setter method)，并接著調用這個方法，以棧頂的元素作參數。這個規則通常用來在兩個對象間建立1對多的關系，所用的方法也常被叫做addChild什么的。
SetTopRule,當end()方法被調用時，digester分析棧頂元素，尋找一個特定屬性(property)的設置方法 (setter method)，并接著調用這個方法，以第二棧頂的元素作參數。這個規則通常用來在兩個對象間建立1對多的關系，所用的方法也常被叫做setParent 什么的。
CallMethodRule,這個規則設置當end()被調用時執行的棧頂對象的自定義方法，通過對這個規則的設置，來指定方法的名字、參數的數量以及定義的參數類型的Java類的名字。實際的參數值，來自激活這個方法的元素的子元素。
CallParamRule,這個規則用來指定CallMethodRule的參數的值的來源，它可以來自一個特定的屬性，或子元素的body的內容.
NodeCreateRule,一個特殊的規則，將對象樹的一部分轉換成一個DOM結點(Node)，并壓入棧頂。

對這些標準的規則類，可以創建它們的實例，并調用digester.addRule來注冊它們。由于經常使用它們，所以digester定義了一些簡便的方法來注冊它們。如：

Rule rule = new SetNextRule(digester, "addChild","com.mycompany.mypackage.MyChildClass");
digester.addRule("a/b/c", rule);

可以用下列代碼替換digester.addSetNext("a/b/c", "addChild", "com.mycompany.mypackage.MyChildClass");

原文章鏈接：竹筍炒肉

小時候家的對面有一座山，山的上面就是藍天，所以總是幻想著有一天站到山頂用手摸一下藍天……

posted on 2007-11-04 16:34 丫丫閱讀(251) 評論(0) 編輯收藏

新用戶注冊刷新評論列表


只有注冊用戶登錄后才能發表評論。




網站導航: 博客園 IT新聞 Chat2DB C++博客博問管理

2007年11月

日

一

二

三

四

五

六

下載及編譯

一個簡單的例子

基本情況

元素匹配模板

處理規則(processing rule)

常用鏈接

留言簿(1)

隨筆分類(25)

隨筆檔案(27)

文章分類

搜索

最新評論

閱讀排行榜

評論排行榜