亚洲午夜国产精品无码,亚洲片一区二区三区,国产av无码专区亚洲av果冻传媒

关于SAX�Q�DOM�Q�JAXP�Q�JDOM�Q�DOM4J的一些理�?

Thu, 09 Aug 2007 06:02:00 GMT

�W�一�Q�首先介�l�一下SAX�Q�DOM�Q�JAXP�Q�JDOM�Q�DOM4J的基本知识：
1、sax、dom是两�U�对xml文��q�行分析的方法（没有具体的实玎ͼ�只有接口�Q?br>所以不是解释器�Q�如果光有他们，你是完成不了对xml文档的处理的�?br>sax的包是org.xml.sax
dom的包是org.w3c.dom
包的名称很重要，它有助于你理解他们之间的关系�?

2、jaxp是api�Q�他��装了sax\dom两种接口。�ƈ在sax\dom的基��之上�Q�作了一套比较简单的api以供开发�h员��用�?br>jaxp的包是javax.xml.parsers
可以看看jaxp的源文�g�Q�它的文件中包含了对sax或者dom的引用（import�Q?br>jaxp也不是具体的实现�Q�他只是一套api。如果你仅仅有jaxp那是无法工作�?br>�Q�其实jaxp只是完成对sax、dom的包装，生成了DocumentBuilderFactory\DocumentBuilder
和SAXParserFactory SAXParser。也��是设计模式中的工厂模式�Q�他的好处就是具体的对象�Q?解释器）建立由子�c�d��成）

3、xerces解释器（��L��地球上最快的xml解释器）
在xerces中对jaxp中定义的SAXParser SAXParserFactory DocumentBuilder DocumentBuilderFactory�q�行了��承（extends�Q�对应SAXParserImpl SAXParserFactoryImpl DocumentBuilderImpl DocumentBuilderFactoryImpl
�q�就是�ؓ什么你的classpath中只要有xerces.jar�Q�其中包含了sax dom jaxp �Q�和 xercesImpl.jar��可以的原因�?

4、什么时候可以用别的解释�?比如crimson�?br>他也是和xerces一�?是解释器�Q�很��单，用crimson.jar 替代xercesImpl.jar

5、jdom和dom4j
W3C的DOM标准API隄��的让人想撞墙�Q�于是有一帮�h开发Java专用的XML API目的是�ؓ了便于��用，�q�就是jdom的由来，开发到一半的时候，另一部分人又分了出来�Q�他们有自己的想法，于是他们��去开发dom4j�Q��Ş成了今天�q�样两个API�Q�至于他们之间的性能�Q�jdom全面惨��|�Q�dom4j大获全胜。我觉得jdom和dom4j��q��当于sax/dom+jaxp�Q�具体的解释器可以选择�?

�W�二�Q�再介绍一下，dom,sax,jdom,dom4j的技术特点：

1: DOM
DOM 是用与��^台和语言无关的方式表�C?XML 文��的官�?W3C 标准。DOM 是以层次�l�构�l�织的节�Ҏ(gu��)��信息片断的集合。这个层�ơ结构允许开发�h员在树中��L��特定信息。分析该�l�构通常需要加载整个文档和构造层�ơ结构，然后才能做�Q何工作。由于它是基于信息层�ơ的�Q�因�?DOM 被认为是��Z��树或��Z��对象的。DOM 以及�q�义的基于树的处理具有几个优炏V��首先，�׃��树在内存中是持久的，因此可以修改它以便应用程序能�Ҏ(gu��)��据和�l�构作出更改。它�q�可以在��M��时候在树中上下��D��Q�而不是像 SAX 那样是一�ơ性的处理。DOM 使用��h��也要��单得多�?br>　　另一斚w��Q�对于特别大的文��，解析和加载整个文��可能很慢且很耗资源，因此使用其他手段来处理这��L��数据会更好。这些基于事件的模型�Q�比�?SAX�?

2:SAX
　　�q�种处理的优炚w��常类��g��媒体的优点。分析能够立卛_��始，而不是等待所有的数据被处理。而且�Q�由于应用程序只是在��d��数据时检查数据，因此不需要将数据存储在内存中。这对于大型文��来说是个巨大的优炏V��事实上�Q�应用程序甚至不必解析整个文��；它可以在某个条�g得到满��时停止解析。一般来��_��SAX �q�比它的替代�?DOM 快许多�?

3:　选择 DOM �q�是选择 SAX �Q?br>　　对于需要自��q��写代码来处理 XML 文档的开发�h员来��_��选择 DOM �q�是 SAX 解析模型是一个非帔R��要的设计决策�?
　　DOM 采用建立树�Ş�l�构的方式访�?XML 文��Q��?SAX 采用的事件模型�?
　　DOM 解析器把 XML 文��转化��Z��个包含其内容的树�Q��ƈ可以�Ҏ(gu��)��q�行遍历。用 DOM 解析模型的优�Ҏ(gu��)��~�程�Ҏ(gu��)��Q�开发�h员只需要调用徏树的指��o�Q�然后利用navigation APIs讉K��所需的树节点来完成�Q务。可以很�Ҏ(gu��)��的添加和修改树中的元素。然而由于��?DOM 解析器的时候需要处理整�?XML 文��Q�所以对性能和内存的要求比较高，��其是遇到很大的 XML 文�g的时候。由于它的遍历能力，DOM 解析器常用于 XML 文��需要频�J�的改变的服务中�?
　　SAX 解析器采用了��Z��事�g的模型，它在解析 XML 文档的时候可以触发一�p�d��的事�Ӟ��当发现给定的tag的时候，它可以激�z�M��个回调方法，告诉该方法制定的标签已经扑ֈ�。SAX 对内存的要求通常会比较低�Q�因为它让开发�h员自己来军_��所要处理的tag。特别是当开发�h员只需要处理文��中所包含的部分数据时�Q�SAX �q�种扩展能力得到了更好的体现。但�?SAX 解析器的时候编码工作会比较困难�Q�而且很难同时讉K��同一个文档中的多处不同数据�?

4:jdom http://www.jdom.org
JDOM 的目的是成�ؓ Java 特定文��模型�Q�它��化与 XML 的交互�ƈ且比使用 DOM 实现更快。由于是�W�一�?Java 特定模型�Q�JDOM 一直得到大力推�q�和促进。正在考虑通过“Java 规范��h�� JSR-102”��它最�l�用�?#8220;Java 标准扩展”。从 2000 �q�初��已�l�开始了 JDOM 开发�?br>　　JDOM �?DOM 主要有两斚w��不同。首先，JDOM 仅��用具体类而不使用接口。这在某些方面简化了 API�Q�但是也限制了灵�z�L��。第二，API 大量使用�?Collections �c�，��化了那些已经熟�?zh��n)��q�些�cȝ�� Java 开发者的使用�?br>　　JDOM 文��声明其目的是“使用 20%�Q�或更少�Q�的�_�֊�解决 80%�Q�或更多�Q�Java/XML 问题”�Q�根据学习曲�U�假定�ؓ 20%�Q�。JDOM 对于大多�?Java/XML 应用�E�序来说当然是有用的�Q��ƈ且大多数开发者发�?API �?DOM �Ҏ(gu��)��理解得多。JDOM �q�包括对�E�序行�ؓ的相当广泛检查以防止用户做�Q何在 XML 中无意义的事。然而，它仍需要�?zh��n)�充分理�?XML 以便做一些超出基本的工作�Q�或者甚至理解某些情况下的错误）。这也许是比学习 DOM �?JDOM 接口都更有意义的工作�?br>　　JDOM 自��n不包含解析器。它通常使用 SAX2 解析器来解析和验证输�?XML 文��Q�尽��它�q�可以将以前构造的 DOM 表示作�ؓ输入�Q�。它包含一些�{换器以将 JDOM 表示输出�?SAX2 事�g��、DOM 模型�?XML 文本文��。JDOM 是在 Apache 许可证变体下发布的开放源码�?

5: DOM4J http://dom4j.sourceforge.net/
　虽然 DOM4J 代表了完全独立的开发结果，但最初，它是 JDOM 的一�U�智能分支。它合�ƈ了许多超出基�?XML 文��表示的功能，包括集成�?XPath 支持、XML Schema 支持以及用于大文��或��化文��的基于事件的处理。它�q�提供了构徏文档表示的选项�Q�它通过 DOM4J API 和标�?DOM 接口��h��q�行讉K��功能。从 2000 下半�q�开始，它就一直处于开发之中�?br>　　为支持所有这些功能，DOM4J 使用接口和抽象基本类�Ҏ(gu��)��。DOM4J 大量使用�?API 中的 Collections �c�，但是在许多情况下�Q�它�q�提供一些替代方法以允许更好的性能或更直接的编码方法。直接好处是�Q�虽�?DOM4J 付出了更复杂�?API 的代��P��但是它提供了�?JDOM 大得多的灉|��性�?br>　　在添加灵�z�L��、XPath 集成和对大文��处理的目标�Ӟ��DOM4J 的目标与 JDOM 是一��L��Q�针�?Java 开发者的易用性和直观操作。它�q�致力于成�ؓ�?JDOM 更完整的解决�Ҏ(gu��)��Q�实现在本质上处理所�?Java/XML 问题的目标。在完成该目标时�Q�它�?JDOM 更少��防止不正��的应用�E�序行�ؓ�?br>　　DOM4J 是一个非帔R��怼��U�的Java XML API�Q�具有性能优异、功能强大和极端易用使用的特点，同时它也是一个开放源代码的��Y件。如今你可以看到��来��多�?Java 软�g都在使用 DOM4J 来读�?XML�Q�特别值得一提的是连 Sun �?JAXM 也在�?DOM4J�?

最后：我徏议用dom4j

　JDOM �?DOM 在性能��试时表��C��佻I��在测�?10M 文��时内存溢出。在��文��情况下�q�值得考虑使用 DOM �?JDOM。虽�?JDOM 的开发者已�l�说明他们期望在正式发行版前专注性能问题�Q�但是从性能观点来看�Q�它��实没有值得推荐之处。另外，DOM 仍是一个非常好的选择。DOM 实现�q�泛应用于多�U�编�E�语�a�。它�q�是许多其它�?XML 相关的标准的基础�Q�因为它正式获得 W3C 推荐�Q�与��Z��非标准的 Java 模型相对�Q�，所以在某些�c�d��的项目中可能也需要它�Q�如�?javascript 中��?DOM�Q��?br>　　SAX表现较好�Q�这要依赖于它特定的解析方式。一�?SAX ��即��到来的XML��，但�ƈ没有载入到内存（当然当XML��被��d��Ӟ��会有部分文档暂时隐藏在内存中�Q��?br>　　无疑�Q�DOM4J是最好的�Q�目前许多开源项目中大量采用 DOM4J�Q�例如大名鼎鼎的 Hibernate 也用 DOM4J 来读�?XML 配置文�g。如果不考虑可移植性，那就采用DOM4J吧！

四种xml操作方式的基本��用方�?

�Q?/span>?xml version="1.0" encoding="GB2312"?�Q?/span>
�Q?/span>RESULT�Q?/span>
�Q?/span>VALUE�Q?/span>
　　 �Q?/span>NO�Q?/span>苏A88888�Q?/span>/NO�Q?/span>
　　 �Q?/span>ADDR�Q�南京市新街�?0�?/span>�Q?/span>/ADDR�Q?/span>
�Q?/span>/VALUE�Q?/span>
�Q?/span>VALUE�Q?/span>
　　 �Q?/span>NO�Q?/span>苏A99999�Q?/span>/NO�Q?/span>
　　�Q?/span>ADDR�Q�南京市��p��?0�?/span>�Q?/span>/ADDR�Q?/span>
�Q?/span>/VALUE�Q?/span>
�Q?/span>/RESULT�Q?/span>

1�Q?/span>DOM

import java.io.*;
import java.util.*;
import org.w3c.dom.*;
import javax.xml.parsers.*;

public class MyXMLReader{
　public static void main(String arge[]){

　　long lasting =System.currentTimeMillis();
　　try{
　　　File f=new File("data_10k.xml");
　　　DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance();
　　　DocumentBuilder builder=factory.newDocumentBuilder();
　　　Document doc = builder.parse(f);
　　　NodeList nl = doc.getElementsByTagName("VALUE");
　　　for (int i=0;i�Q?/span>nl.getLength();i++){
　　　　System.out.print("车牌��L��:" + doc.getElementsByTagName("NO").item(i).getFirstChild().getNodeValue());
　　　　System.out.println("车主地址:" + doc.getElementsByTagName("ADDR").item(i).getFirstChild().getNodeValue());
　　}
　　}catch(Exception e){
　　　e.printStackTrace();
}

2�Q?/span>SAX

import org.xml.sax.*;
import org.xml.sax.helpers.*;
import javax.xml.parsers.*;

public class MyXMLReader extends DefaultHandler {

　java.util.Stack tags = new java.util.Stack();
　public MyXMLReader() {
　　super();
}

　public static void main(String args[]) {
　　long lasting = System.currentTimeMillis();
　　try {
　　　SAXParserFactory sf = SAXParserFactory.newInstance();
　　　SAXParser sp = sf.newSAXParser();
　　　MyXMLReader reader = new MyXMLReader();
　　　sp.parse(new InputSource("data_10k.xml"), reader);
　　} catch (Exception e) {
　　　e.printStackTrace();
　　}

　　System.out.println("�q�行旉��Q?/span>" + (System.currentTimeMillis() - lasting) + "毫秒");}
　　public void characters(char ch[], int start, int length) throws SAXException {
　　String tag = (String) tags.peek();
　　if (tag.equals("NO")) {
　　　System.out.print("车牌��L��Q?/span>" + new String(ch, start, length));
}
if (tag.equals("ADDR")) {
　　System.out.println("地址:" + new String(ch, start, length));
}
}

　　public void startElement(String uri,String localName,String qName,Attributes attrs) {
　　tags.push(qName);}
}

3�Q?/span> JDOM

import java.io.*;
import java.util.*;
import org.jdom.*;
import org.jdom.input.*;

public class MyXMLReader {

　public static void main(String arge[]) {
　　long lasting = System.currentTimeMillis();
　　try {
　　　SAXBuilder builder = new SAXBuilder();
　　　Document doc = builder.build(new File("data_10k.xml"));
　　　Element foo = doc.getRootElement();
　　　List allChildren = foo.getChildren();
　　　for(int i=0;i�Q?/span>allChildren.size();i++) {
　　　　System.out.print("车牌��L��:" + ((Element)allChildren.get(i)).getChild("NO").getText());
　　　　System.out.println("车主地址:" + ((Element)allChildren.get(i)).getChild("ADDR").getText());
　　　}
　　} catch (Exception e) {
　　　e.printStackTrace();
}

}

4�Q?/span>DOM4J

import java.io.*;
import java.util.*;
import org.dom4j.*;
import org.dom4j.io.*;

public class MyXMLReader {

　public static void main(String arge[]) {
　　long lasting = System.currentTimeMillis();
　　try {
　　　File f = new File("data_10k.xml");
　　　SAXReader reader = new SAXReader();
　　　Document doc = reader.read(f);
　　　Element root = doc.getRootElement();
　　　Element foo;
　　　for (Iterator i = root.elementIterator("VALUE"); i.hasNext() {
　　　　foo = (Element) i.next();
　　　　System.out.print("车牌��L��:" + foo.elementText("NO"));
　　　　System.out.println("车主地址:" + foo.elementText("ADDR"));
　　　}
　　} catch (Exception e) {
　　　e.printStackTrace();
}
)

�?ji��)�?/a> 2007-08-09 14:02 发表评论

DOM教程�Q�什么是DOM�Q?----来源�Q�IBM developerWorks

Thu, 09 Aug 2007 04:55:00 GMT

DOM教程�Q�什么是DOM�Q?br>                        作�ؓ�l�构�?nbsp;DOM
      DOM是以层次�l�构�l�织的节�Ҏ(gu��)��信息片断的集合。这个层�ơ结构允许开发�h员在树中��D��仪寻扄��定信息。分析该�l�构通常需要加载整个文档和构造层�ơ结构，然后才能做�Q何工作。由于它是基于信息层�ơ的�Q�因�?nbsp;DOM 被认为是��Z��树或��Z��对象的�?br>      对于特别大的文档�Q�解析和加蝲整个文档可能很慢且很耗资源，因此使用其他手段来处理这��L��数据会更好。这些基于事件的模型�Q�比�?nbsp;Simple API for XML�Q�SAX�Q�，适用于处理数据流�Q�即随着数据的流动而依�ơ处理数据。基于事件的 API 消除了在内存中构造树的需要，但是却不允许开发�h员实际更改原始文档中的数据�?br>     另一斚w��Q�DOM �q�提供了一�?nbsp;API�Q�允许开发�h员添加、编辑、移动或删除树中��L��位置的节点，从而创��Z��个引用程序�?br>     解析器是一个��Y件应用程序，设计用于分析文档�Q�这里是�?nbsp;XML 文�g�Q�，以及做一些特定于该信息的事情。在诸如 SAX �q�样��Z��事�g�?nbsp;API 中，解析器将向某�U�监听器发送事件。在诸如 DOM �q�样��Z��树的 API 中，解析器将在内存中构造一颗数据树�?br>作�ؓ API �?nbsp;DOM
     �?nbsp;DOM Level 1 开始，DOM API 包含了一些接口，用于表示可从 XML 文档中找到的所有不同类型的信息。它�q�包含��用这些对象所必需的方法和属性�?br>Level 1 包括�?nbsp;XML 1.0 �?nbsp;HTML 的支持，每个 HTML 元素被表�C�Zؓ一个接口。它包括用于��d��、编辑、移动和��d��节点中包含的信息的方法，�{�等。然而，它没有包括对 XML 名称�I�间�Q�XML Namespace�Q�的支持�Q�XML 名称�I�间提供分割文档中的信息的能力�?br>     DOM Level 2 ��d��了名�U�空间支持。Level 2 扩展�?nbsp;Level 1�Q�允许开发�h员检��和使用可能适用于某个节点的名称�I�间信息。Level 2 �q�增加了几个新的模块�Q�以支持�U�联样式表、事件和增强的树操作�?br>     当前正处于定�E�K��D늚� DOM Level 3 包括对创�?nbsp;Document 对象�Q�以前的版本��这个�Q务留�l�实玎ͼ�使得创徏通用应用�E�序很困难）的更好支持、增强的名称�I�间支持�Q�以及用来处理文档加载和保存、验证以�?nbsp;XPath 的新模块�Q�XPath 是在 XSL 转换�Q�XSL Transformation�Q�以及其�?nbsp;XML 技术中用来选择节点的手�D�c�?br>     DOM 的模块化意味着作�ؓ开发�h员，�(zh��n)�必��ȝ��道自己希望��用的�Ҏ(gu��)��是否受正在使用�?nbsp;DOM 实现所支持�?br>                                        ��定�Ҏ(gu��)��可用�?br>     DOM 推荐标准的模块性质允许实现者挑选将要包括到产品中的部分�Q�因而在使用某个特定的特性之前，首先��定该特性是否可用可能是必要的。本教程仅��?nbsp;DOM Level 2 Core API�Q�不�q�在着手�?zh��n)�自己的项目时�Q�了解如何能够检��特性是有所帮助的�?br>     DOM 中定义的接口之一��是 DOMImplementation。通过使用 hasFeature() �Ҏ(gu��)��Q��?zh��n)�可以��定某个特定的特性是否受支持。DOM Level 2 中不存在创徏DOMImplementation 的标准方法，不过下面的代码将展示如何使用 hasFeature() 来确�?nbsp;DOM Level 2 样式表模块在某个 Java 应用�E�序中是否受支持�?br>import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.DocumentBuilder;
import org.w3c.dom.DOMImplementation;
public class ShowDomImpl {
   public static void main (String args[]) {
      try {
         DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
         DocumentBuilder docb = dbf.newDocumentBuilder();
         DOMImplementation domImpl = docb.getDOMImplementation();
         if (domImpl.hasFeature("StyleSheets", "2.0")) {
            System.out.println("Style Sheets are supported.");
         } else {
            System.out.println("Style Sheets are not supported.");
         }
      } catch (Exception e) {}
}
}
�Q�DOM Level 3 ��包括用于创�?nbsp;DOMImplementation 的标准方法。）
     本教�E�将使用单个文��来展�C?nbsp;DOM Level 2 Core API 的对象和�Ҏ(gu��)��?br>                                        基本�?nbsp;XML 文�g
     本教�E�中的所有例子都是用了一个包含如下节点的 XML 文�g�Q�它表示输入某个商业�pȝ��的订单。回��一下，XML 文�g的基本组成部分包括：
     XML 声明�Q?/strong>基本的声�?nbsp; ��这个文件定义�ؓ XML 文档。在声明中指定一�U�字�W�编码的情况�q�不鲜见�Q�如下所�C�。通过�q�种方式�Q�不��该 XML 文�g使用的语�a�或字�W�编码是什么，只要解析器理解特定的�~�码�Q�它?y��u)��p��够正��地��d��?nbsp;XML 文�g�?nbsp;
     DOCTYPE 声明�Q?/strong>XML 是�h��Z��间交换信息的便利手段�Q�但是要使它能够��利地工作，必须要有一个公��q��词汇表。可选的 DOCTYPE 声明可用于指定一个应该用来与此文件做比较的文档（在本例中�?nbsp;orders.dtd�Q�，以确保不会��生�Q何�؜淆或丢失信息�Q�例如，丢失一�?nbsp;userid 或错误拼写某个元素名�U�ͼ�。以�q�种方式处理�q�的文��U�Cؓ有效的文��。成功的有效性检查�ƈ不是 XML 所必需的，后面的例子实际上从文��中省略�?nbsp;DOCTYPE 声明�?nbsp;
     数据本��n�Q?/strong>XML 文��中的数据必须包含在单个根元素内，比如下面�?nbsp;orders 元素。要�?nbsp;XML 文档得到处理�Q�它必须是格式良好的�Q�well-formed�Q��?nbsp;


      12341
      pending

         Silver Show Saddle, 16 inch
         825.00
         1


         Premium Cinch
         49.00
         1



      251222
      pending

         Winter Blanket (78 inch)
         20
         10



    �?nbsp;DOM 中，使用 XML 信息意味着首先��它划分��炏V�?/p>

�?ji��)�?/a> 2007-08-09 12:55 发表评论