今天需要讀取xml文件.
以前幾乎沒有做過xml文件的解析(在一個面試的測試題中做過一道xml解析的題),覺得xml解析挺容易的.上網找了找,資料還挺多,下面就是一篇很不錯的文章,原文地址為
http://www.jdon.com/idea/xml.htm
Java和XML是黃金組合,網上已經有很多文章介紹,XML作為電子商務中數據交換,已經有其不可替代的作用,但是在平時系統開發中,我們不一定都用到數據交換,是不是無法使用XML了?
當然不是,現在已經有一個新趨勢,java程序的配置文件都開始使用XML格式,以前是使用類似windows的INI格式.(Java中也有Propertiesy這樣的類專門處理這樣的屬性配置文件).使用XML作為Java的配置文件有很多好處,從Tomcat的安裝配置文件和J2ee的配置文件中,我們已經看到XML的普遍應用,讓我們也跟隨流行趨勢用XML武裝起來.
現在關鍵是如何讀取XML配置文件?有好幾種XML解析器:主要有DOM和SAX ,這些區別網上文章介紹很多.
在apache的XML項目組中,目前有Xerces Xalan Cocoon幾個開發XML相關技術的project.Tomcat本身使用的是 Sun 的 JAXP,而其XSL Taglib project中使用Xerces解析器.
好了,上面都是比較煩人的理論問題,還是趕快切入XML的配置文件的讀取吧.
在我們的程序中,通常要有一些根據主機環境確定的變量.比如數據庫訪問用戶名和密碼,不同的主機可能設置不一樣.只要更改XML配置文件,就可以正常運行.
<myenv>
<datasource> <dbhost>localhost</dbhost> <dbname>sqlname</dbname> <dbuser>username</dbuser> <dbpassword>password</dbpassword> </datasource>
</myenv> |
上面這個myenv.xml配置文件一般是放在tomcat的WEB-INF/classes目錄下.
我們編制一個Java程序直接讀取,將dbhost dbuser dbpassword提取出來供其他程序訪問數據庫用.
目前使用SAX比較的多,與DOM主要區別是 SAX是一行一行讀取XML文件進行分析,適合比較大文件,DOM是一次性讀入內存,顯然不能對付大文件.這里我們使用SAX解析,由于SAX解析器不斷在發展,網上有不少文章是針對老版本的.如果你使用JDK1.4 ,可以參考 使用SAX處理XML文檔 一文.這里的程序是根據其改進并且經過實踐調試得來的.
對上面myenv.xml讀取的Java程序:
import org.xml.sax.Attributes; import org.xml.sax.helpers.DefaultHandler; import org.xml.sax.SAXException;
import java.util.Properties;
//使用DefaultHandler的好處 是 不必陳列出所有方法, public class ConfigParser extends DefaultHandler {
////定義一個Properties 用來存放 dbhost dbuser dbpassword的值 private Properties props;
private String currentSet; private String currentName; private StringBuffer currentValue = new StringBuffer();
//構建器初始化props public ConfigParser() {
this.props = new Properties(); }
public Properties getProps() { return this.props; }
//定義開始解析元素的方法. 這里是將<xxx>中的名稱xxx提取出來. public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException { currentValue.delete(0, currentValue.length()); this.currentName =qName;
}
//這里是將<xxx></xxx>之間的值加入到currentValue
public void characters(char[] ch, int start, int length) throws SAXException {
currentValue.append(ch, start, length);
}
//在遇到</xxx>結束后,將之前的名稱和值一一對應保存在props中
public void endElement(String uri, String localName, String qName) throws SAXException {
props.put(qName.toLowerCase(), currentValue.toString().trim()); }
} |
上面的這個解析程序比較簡單吧? 其實解析XML就是這么簡單.
現在我們已經將dbhost dbuser dbpassword的值localhost sqlname username password提取了出來.但是這只是在在解析器內部,我們的程序還不能訪問.需要再編制一個程序.
import java.util.Properties; import javax.xml.parsers.SAXParser; import javax.xml.parsers.SAXParserFactory; import java.net.URL;
public class ParseXML{
//定義一個Properties 用來存放 dbhost dbuser dbpassword的值 private Properties props;
//這里的props public Properties getProps() { return this.props; }
public void parse(String filename) throws Exception {
//將我們的解析器對象化 ConfigParser handler = new ConfigParser();
//獲取SAX工廠對象 SAXParserFactory factory = SAXParserFactory.newInstance(); factory.setNamespaceAware(false); factory.setValidating(false);
//獲取SAX解析 SAXParser parser = factory.newSAXParser();
//得到配置文件myenv.xml所在目錄. tomcat中是在WEB-INF/classes //下例中BeansConstants是用來存放xml文件中配置信息的類,可以自己代替或定義 URL confURL = BeansConstants.class.getClassLoader().getResource(filename);
try { //將解析器和解析對象myenv.xml聯系起來,開始解析 parser.parse(confURL.toString(), handler); //獲取解析成功后的屬性 以后 我們其他應用程序只要調用本程序的props就可以提取出屬性名稱和值了 props = handler.getProps(); }finally{ factory=null; parser=null; handler=null; }
}
} |
由于我們的XML文件是使用最簡單的形式 ,因此解析器相對簡單,但是這已經足夠對付我們的配置文件了.
判斷一個程序系統的先進性,我們先看看他的配置文件,如果還在使用老套的xxx=123 這樣類似.ini的文件,
我們也許會微微一笑,他又落伍了.....