可擴展標記語言(XML)作為一種簡單的、中性的、易讀的數據表示形式已經變得越來越流行,許多軟件廠商宣布的“支持XML",意味著他們的產品將能生成或處理XML數據。XML也被看作再企業間交換數據最佳格式。它允許企業在所交換的數據的XML的文檔類型定義(Document Type Definitions,DTDs)或模式(Schema)上取得一致。這些DTDs或Schema是獨立于企業使用的數據庫模式的。 本文將用研究在不同計算機之間通訊與處理XML數據的分布式系統的構建方法,主要是運行在不同的虛擬機上的JAVA應用之間的XML通訊。 XML通訊 萬維網協會(World Wide Web Consortium, W3C)在XML規范中定義了XML的語法和語義。為了處理XML數據,XML文檔必須經過解析。W3C定義了文檔對象模型(DOM),它是應用程序員處理XML數據的接口。DOM已經有包括JAVA在內的許多語言的實現。JAVA應用程序可以通過DOM API來訪問XML數據。XML解析器將產生XML文檔的DOM表示。 圖1說明了處理XML文檔的JAVA分布式應用的簡單模型。這個模型假設數據可以從諸如關系數據庫之類的數據源得到。JAVA代碼處理數據并最終產生DOM表示,這些代碼表示為圖中的處理器。 處理器代碼將DOM代表的XML數據傳給發送者。發送者是與接收者進行XML數據通訊的JAVA代碼。接收者JAVA代碼來接受XML數據,產生DOM表示的數據并把它傳送給另一個處理器。簡而言之,發送者和接收者抽象了DOM表示的XML數據的通訊。 發送者和接收者不是在同一個JAVA虛擬機上執行的。他們是通過分布式系統的構件來相連的。無論是接收者還是發送者都既是客戶端又是服務器端,兩者的數據傳輸都是雙向的。 Xbeans 就像將要看到的一樣,在本文中描述的發送者和接收者的三種實現方法都都是通過Xbeans來實現。Xbeans是一種接受XML數據作為輸入,處理這個輸入然后向下一個Xbeans輸出XML結果的軟件構件。Xbeans的輸入輸出都是XML的DOM文檔,亦即傳送給Xbeans的不是需要XML解析器解析的字符串,而是通過W3C的標準DOM API解析成了文檔對象。圖2說明了一個Xbeans。 Xbeans是JavaBeans,支持封裝、重用、連接和客戶化Java代碼。通過適當的一些Xbeans和JavaBeans的設計工具,我們就能編很少的代碼構建非常有用的分布式應用。 Xbeans從IBM的XML的JAVA開發工具包而來,在其上作了少量修改以便更適合分布式的應用。Xbeans能夠從www.Xbeans.org的開放源碼項目中免費獲得。 實現發送方和接收方 下面將介紹用JAVA實現發送者和接收者的三種不同的方法。然后對每種方法作一個簡單的分析。 方法一:用標準的web 服務器 這種方法將只是簡單的將XML作為文本發送給遠程計算機上的web服務器。發送方必須將DOM表示的XML轉化為文本來與接收方進行通訊。然后,接受方必須將文本還原為DOM表示,如圖3: 以下代碼段用HTTP來實現發送者。這里用到了IBM Java開發包中的DOMWriter類來實現DOM表示到文本XML表示的轉換。


/**偷窺無罪 http://www.bt285.cn/content.php?id=141970
            《我的丑娘》  http://www.bt285.cn/wodechounian/
甜性澀愛 http://www.bt285.cn/1196863/story/story_1.html
public void documentReady(DOMEvent evt) throws XbeansException { try { URL receiver = new URL (getRemoteURL ()); URLConnection receiverConnection = receiver.openConnection(); receiverConnection.setDoOutput(true); //向發送者打開一個輸出流然后發送文本形式的XML數據 OutputStream out = receiverConnection.getOutputStream(); DOMWriter writer = new DOMWriter(); writer.setPrintWriter(new PrintWriter(out)); writer.documentReady( new com.ibm.xml.xpk4j.dom.DOMEvent( this,evt.getDocument())); out.close(); // 為結果打開一個輸入流 BufferedReader in = New BufferedReader( new InputStreamReader(receiverConnection.getInputStream())); // 處理結果:"OK" 表示成功;"Exception" 表示輸入流串行化異常 ... in.close(); } catch (Throwable e) { e.printStackTrace(System.err); } }

注意到以上的documentReady()方法用remoteURL屬性得到服務器上的CGI腳本的URL。為了與HTTP兼容,CGI腳本類用字符串”Content-type: text/html"封裝接收者的輸出。這個腳本然后調用服務器上的the receiverMain()方法。 Main()函數只是簡單的實例化接收者然后調用其receiveDocument()方法。



            import org.xbeans.communication.stdio.receiver.*;
            public class receiverMain {
            static Bean theReceiver = new Bean();
            public static void main(String[] args) {
            theReceiver.receiveDocument();
            }
            }
            

最后receiveDocument()方法的代碼段將重新生成DOM表示以便進一步處理。這里用到了IBM的XML解析器。



            DOMParser parser = new DOMParser(); // 構造解析器
            try { // 調用解析器
            parser.parse(new InputSource(System.in));
            } catch (Throwable e) {
            throw new XbeansException("","receiver","io error parsing incoming document",
            "io error parsing incoming document "+e);
            }
            //將文檔傳向下一個bean
            DOMListener.documentReady(new DOMEvent(this,parser.getDocument()));
            

方法二:通過JAVA遠程方法調用串行化文檔 這個方法通過JAVA遠程方法調用(JAVA RMI)和DOM串行化(serialization)來從發送者向接收者傳輸XML DOM 文檔。如圖4: 以下代碼用JAVA遠程方法調用實現發送方與接受方的通訊.



            public void documentReady(DOMEvent evt) throws XbeansException {
            if (DOMListener==null) {
            try {
            DOMListener = (DOMListener)Naming.lookup(getReceiverName());
            } catch (Exception e) {
            throw new XbeansException( evt.getDocument().getNodeName(),
            "sender", "error obtaining remote receiver",
            "The name may be wrong or the network may be down.");
            }
            }
            DOMListener.documentReady(evt); }
            

以下是接受方的JAVA 遠程方法調用的實現。setName()方法將接受這傳送給RMI注冊(registry),documentReady()方法僅僅將接收到的文檔傳送給下一個組件。


            
/**偷窺無罪 http://www.bt285.cn/content.php?id=141970
                        《我的丑娘》  http://www.bt285.cn/wodechounian/
甜性澀愛 http://www.bt285.cn/1196863/story/story_1.html
public void setReceiverName(String newName) { try { if (receiverName!=null) Naming.unbind(receiverName); receiverName = newName; Naming.rebind(receiverName, this ); } catch( Exception e ) { System.out.println( e ); } } public void documentReady(Document incomingDocument) throws RemoteException, XbeansException { if (DOMListener==null) { throw new XbeansException(incomingDocument.getNodeName(),"rmiReceiver", "next component not established", "The component needs to be configured."); } DOMListener.documentReady(new DOMEvent(this,incomingDocument)); }

方法三:CORBA-IIOP 第三方法用CORBA-IIOP(CORBA over Internet Inter-ORB Protocol)來傳輸數據。對象管理組織(OMG)正在建議擴展接口定義語言(IDL)將XML數據類型包括進去。這樣,將來CORBA產品將能傳輸XML數據。如圖5所示: 以下的OMG IDL給出了發送者和接收者CORBA實現的接口。



            exception RemoteReceiverException {
            string remoteIdentifier;
            string documentName;
            string componentName;
            string message;
            string moreMessage;
            };
            typedef sequence byteArray;
            interface XMLReceiver {
            void documentReady(in byteArray serializedDocument)
            raises(RemoteReceiverException);
            };
            

以下代碼用JAVA串行化DOM和CORBA實現發送者。



            public void documentReady(DOMEvent evt) throws XbeansException {
            Document documentToSend = evt.getDocument();
            try {
            ByteArrayOutputStream bastream = new ByteArrayOutputStream();
            ObjectOutputStream p = new ObjectOutputStream(bastream);
            p.writeObject(documentToSend);
            p.flush();
            org.omg.CORBA.ORB orb = org.omg.CORBA.ORB.init( new String[0],
            System.getProperties());
            XMLReceiver receiver = urlToObject(orb,getReceiverURL());
            receiver.documentReady(bastream.toByteArray());
            } catch (RemoteReceiverException rre) {
            throw new XbeansException(rre.remoteIdentifier, rre.documentName,
            rre.componentName, rre.message,rre.moreMessage);
            } catch (Throwable e) {
            throw new XbeansException("","sender", "error sending document "+e,
            "error sending document "+e);
            }
            }
            

以下代碼用JAVA串行化DOM和CORBA實現接收者。



            public void documentReady(byte[] serializedDocument)throws RemoteReceiverException {
            // 反串行化字節流
            ByteArrayInputStream bais = new ByteArrayInputStream(serializedDocument);
            Document theDocument;
            try {
            ObjectInputStream ois = new ObjectInputStream(bais);
            theDocument = (Document)ois.readObject();
            } catch(Throwable e) {
            throw new RemoteReceiverException(corbaName,"incoming document","receiver",
            "error deserializing document","error deserializing document"+e);
            }
            try { //將文檔傳向監聽者
            local.DOMListener.documentReady(new DOMEvent(this,theDocument));
            } catch (XbeansException xbe) {
            throw new RemoteReceiverException( xbe.remoteIdentifier(),
            xbe.documentName(),xbe.componentName(),
            xbe.message(),xbe.moreMessage());
            }
            }
            

分析: 測試表明,純文本表示的XML要比DOM串行化表示性能更好。同時,解析DOM和文本所用的時間也要比用JAVA直接串行化和法串行化所用的時間少。 標準的web服務器方式的優勢是其應用基礎要廣泛許多。CGI腳本能夠在絕大多數web服務器上運行,而且,接受方能夠很容易的通過URL標識。而對于RMI,則需要RMI注冊。CORBA的解決辦法則需要在服務器上安裝對象請求代理(Object Request Broker,ORB ),而且,CORBA發送者的實現使用的是一個URL的命名模式而不是接收者的CORBA對象引用,用一個字符串與一個URL相聯系,然后在客戶端轉化。 CORBA 和RMI支持JAVA 客戶端到JAVA服務器的解決方案。沒有CGI腳本也不需要從標準輸入中讀取編碼異常。而且,不需要在發送者每次用XML通訊時都啟動一個JAVA虛擬機。他們兩則均支持接收者的自動激活。 JAVA RMI方式只能在JAVA代碼之間工作,對于web服務器包括CORBA理論上能在任何編程語言之間通訊。對于JAVA串行化的DOM來說,即便是客戶端和服務器端均需要是JAVA代碼的要求不是問題,它還存在另外一個困難,即JAVA串行化要求客戶端和服務器運行的是相同的DOM實現。 結論 正如上面所述,有許多方法可以實現在JAVA分布式應用中發送XML數據,每一種方法的性能和互操作性都是不同的。重要的是應該把XML通訊從分布式應用邏輯中抽取出來。也就是,實現發送和接受XML的代碼應和應用邏輯的代碼中分離出來。通過把代碼打包成軟件組件,就能夠改變發送方和接受方的代碼而不會影響到應用其余實現。