国产成人精品曰本亚洲79ren,久久夜色精品国产噜噜噜亚洲AV ,91午夜精品亚洲一区二区三区

Tomcat启动分析

dybjsun — Thu, 10 Jan 2008 03:24:00 GMT

1 - Tomcat Server的组成部�?

1.1 - Server

A Server element represents the entire Catalina servlet container. (Singleton)

1.2 - Service

A Service element represents the combination of one or more Connector components that share a single Engine
Service是这样一个集合：(x��)它由一个或者多个Connector�l�成�Q�以�?qi��ng)一个Engine�Q�负责处理所有Connector所获得的客戯��?br />

1.3 - Connector

一个Connector��在某个指定端口上侦听客戯��求，�q�将获得的请求交�l�Engine来处理，从Engine处获得回应�ƈ�q�回客户
TOMCAT有两个典型的Connector�Q�一个直接侦听来自browser的http��h��Q�一个侦听来自其它WebServer的请�?br />Coyote Http/1.1 Connector 在端�?080处侦听来自客户browser的http��h��
Coyote JK2 Connector 在端�?009处侦听来自其它WebServer(Apache)的servlet/jsp代理��h��

1.4 - Engine

The Engine element represents the entire request processing machinery associated with a particular Service
It receives and processes all requests from one or more Connectors
and returns the completed response to the Connector for ultimate transmission back to the client
Engine下可以配�|�多个虚拟主机Virtual Host�Q�每个虚拟主机都有一个域�?br />当Engine获得一个请求时�Q�它把该��h��匚w��到某个Host上，然后把该��h��交给该Host来处�?br />Engine有一个默认虚拟主机，当请求无法匹配到��M��一个Host上的时候，��交�l�该默认Host来处�?br />

1.5 - Host

代表一个Virtual Host�Q�虚拟主机，每个虚拟��L��和某个网�l�域名Domain Name相匹�?br />每个虚拟��L��下都可以部��v(deploy)一个或者多个Web App�Q�每个Web App对应于一个Context�Q�有一个Context path
当Host获得一个请求时�Q�将把该��h��匚w��到某个Context上，然后把该��h��交给该Context来处�?br />匚w��的方法是“最长匹配”，所以一个path==""的Context��成��Host的默认Context
所有无法和其它Context的�\径名匚w��的请求都��最�l�和该默认Context匚w��

1.6 - Context

一个Context对应于一个Web Application�Q�一个Web Application�׃��个或者多个Servlet�l�成
Context在创建的时候将�Ҏ(gu��)��配置文�g$CATALINA_HOME/conf/web.xml�?WEBAPP_HOME/WEB-INF/web.xml载入Servlet�c?br />当Context获得��h��Ӟ��在自己的映��表(mapping table)中寻扄��匚w��的Servlet�c?br />如果扑ֈ��Q�则执行该类�Q�获得请求的回应�Q��ƈ�q�回

2 - Tomcat Server的结构图

3 - 配置文�g$CATALINA_HOME/conf/server.xml的说�?

该文件描�q�C��如何启动Tomcat Server

4 - Context的部�|�配�|�文件web.xml的说�?

一个Context对应于一个Web App�Q�每个Web App是由一个或者多个servlet�l�成�?br />当一个Web App被初始化的时候，它将用自��q��ClassLoader对象载入“部�|�配�|�文件web.xml”中定义的每个servlet�c?br />它首先蝲入在$CATALINA_HOME/conf/web.xml中部�|�的servlet�c?br />然后载入在自��q��Web App根目录下的WEB-INF/web.xml中部�|�的servlet�c?br />web.xml文�g有两部分�Q�servlet�c�d��义和servlet映射定义
每个被蝲入的servlet�c�都有一个名字，且被填入该Context的映��表(mapping table)中，和某�U�URL PATTERN对应
当该Context获得��h��Ӟ��查询mapping table�Q�找到被��h��的servlet�Q��ƈ执行以获得请求回�?br />

分析一下所有的Context�׃�n的web.xml文�g�Q�在其中定义的servlet被所有的Web App载入

5 - Tomcat Server处理一个http��h��的过�E?

假设来自客户的请求�ؓ(f��)�Q?br />http://localhost:8080/wsota/wsota_index.jsp

1) ��h��被发送到本机端口8080�Q�被在那里侦听的Coyote HTTP/1.1 Connector获得
2) Connector把该��h��交给它所在的Service的Engine来处理，�q�等待来自Engine的回�?br />3) Engine获得��h��localhost/wsota/wsota_index.jsp�Q�匹配它所拥有的所有虚拟主机Host
4) Engine匚w��到名为localhost的Host�Q�即使匹配不��C��把请求交�l�该Host处理�Q�因��Host被定义�ؓ(f��)该Engine的默认主机）(j��)
5) localhost Host获得��h��/wsota/wsota_index.jsp�Q�匹配它所拥有的所有Context
6) Host匚w��到�\径�ؓ(f��)/wsota的Context�Q�如果匹配不到就把该��h��交给路径名�ؓ(f��)""的Context��d��理）(j��)
7) path="/wsota"的Context获得��h��/wsota_index.jsp�Q�在它的mapping table中寻扑֯�应的servlet
8) Context匚w��到URL PATTERN�?.jsp的servlet�Q�对应于JspServlet�c?br />9) 构造HttpServletRequest对象和HttpServletResponse对象�Q�作为参数调用JspServlet的doGet或doPost�Ҏ(gu��)��
10)Context把执行完了之后的HttpServletResponse对象�q�回�l�Host
11)Host把HttpServletResponse对象�q�回�l�Engine
12)Engine把HttpServletResponse对象�q�回�l�C(j��)onnector
13)Connector把HttpServletResponse对象�q�回�l�客户browser








  



  
  
  



  

    
        default
        
          org.apache.catalina.servlets.DefaultServlet
        
        
            debug
            0
        
        
            listings
            true
        
        1
    


  

    
        invoker
        
          org.apache.catalina.servlets.InvokerServlet
        
        
            debug
            0
        
        2
    


  

    
        jsp
        org.apache.jasper.servlet.JspServlet
        
            logVerbosityLevel
            WARNING
        
        3
    



  
  
  


    
        default
        /
    

    
        invoker
        /servlet/*
    

    
        jsp
        *.jsp
    


  
  
  

    ... ... ... ...











  

  
  


  

  
    ... ... ... ...
  


  

  


    

                   port="8080" 
               minProcessors="5" maxProcessors="75" acceptCount="100" 
               enableLookups="true" 
               redirectPort="8443" 
               debug="0" 
               connectionTimeout="20000" 
               useURIValidationHack="false" 
               disableUploadTimeout="true" />

dybjsun 2008-01-10 11:24 发表评论

dybjsun — Wed, 09 Jan 2008 09:17:00 GMT

1 lucene��?br />1.1 什么是lucene
Lucene是一个全文搜索框�Ӟ��而不是应用��品。因此它�q�不像www.baidu.com 或者google Desktop那么拿来��p��用，它只是提供了一�U�工兯��你能实现�q�些产品�?br />
1.2 lucene能做什�?br />要回�{�这个问题，先要了解lucene的本质。实际上lucene的功能很单一�Q�说到底�Q�就是你�l�它若干个字�W�串�Q�然后它��Z��提供一个全文搜索服务，告诉你你要搜索的关键词出现在哪里。知道了�q�个本质�Q�你��可以发挥想象做��M��W�合�q�个条�g的事情了。你可以把站内新闻都索引了，做个资料库；你可以把一个数据库表的若干个字�D늃�(ch��)引�v来，那就不用再担心因为�?like%”而锁表了�Q�你也可以写个自��q��搜烦(ch��)引擎…�?br />
1.3 你该不该选择lucene
下面�l�出一些测试数据，如果你觉得可以接受，那么可以选择�?br />��试一�Q?50万记录，300M左右文本�Q�生成烦(ch��)�?80M左右�Q?00�U�程下��^均处理时�?00ms�?br />��试二：(x��)37000记录�Q�烦(ch��)引数据库中的两个varchar字段�Q�烦(ch��)引文�?.6M�Q?00�U�程下��^均处理时�?.5ms�?br />
2 lucene的工作方�?br />lucene提供的服务实际包含两部分�Q�一入一出。所谓入是写入，卛_��你提供的源（本质是字�W�串�Q�写入烦(ch��)引或者将其从索引中删除；所谓出是读出，卛_��用户提供全文搜烦(ch��)服务�Q�让用户可以通过关键词定位源�?br />
2.1写入��程
源字�W�串首先�l�过analyzer处理�Q�包括：(x��)分词�Q�分成一个个单词�Q�去除stopword�Q�可选）(j��)�?br />��源中需要的信息加入Document的各个Field中，�q�把需要烦(ch��)引的Field索引��h��Q�把需要存储的Field存储��h��?br />��烦(ch��)引写入存储器�Q�存储器可以是内存或��盘�?br />
2.2��d��程
用户提供搜烦(ch��)关键词，�l�过analyzer处理�?br />对处理后的关键词搜烦(ch��)索引扑և�对应的Document�?br />用户�Ҏ(gu��)��需要从扑ֈ�的Document中提取需要的Field�?br />
3 一些需要知道的概念
lucene用到一些概念，了解它们的含义，有利于下面的讲解�?br />
3.1 analyzer
Analyzer 是分析器�Q�它的作用是把一个字�W�串按某�U�规则划分成一个个词语�Q��ƈ去除其中的无效词语，�q�里说的无效词语是指英文中的“of”�?“the”，中文中的 “的”、“地”等词语�Q�这些词语在文章中大量出玎ͼ�但是本��n不包含什么关键信息，��L��有利于羃?y��u)��?ch��)引文件、提高效率、提高命中率�?br />分词的规则千变万化，但目的只有一个：(x��)按语义划分。这点在英文中比较容易实玎ͼ�因�ؓ(f��)英文本��n��是以单词�ؓ(f��)单位的，已经用空格分开�Q�而中文则必须以某�U�方法将�q�成一片的句子划分成一个个词语。具体划分方法下面再详细介绍�Q�这里只需了解分析器的概念卛_��?br />
3.2 document
用户提供的源是一条条记录�Q�它们可以是文本文�g、字�W�串或者数据库表的一条记录等�{�。一条记录经�q�烦(ch��)引之后，��是以一个Document的�Ş式存储在索引文�g中的。用戯��行搜索，也是以Document列表的�Ş式返回�?br />
3.3 field
一个Document可以包含多个信息域，例如一��文章可以包含“标题”、“正文”、“最后修�Ҏ(gu��)��间”等信息域，�q�些信息域就是通过Field在Document中存储的�?br />Field有两个属性可选：(x��)存储和烦(ch��)引。通过存储属性你可以控制是否对这个Field�q�行存储�Q�通过索引属性你可以控制是否对该Field�q�行索引。这看�v来似乎有些废话，事实上对�q�两个属性的正确�l�合很重要，下面举例说明�Q?br />�q�是以刚才的文章��Z��子，我们需要对标题和正文进行全文搜索，所以我们要把烦(ch��)引属性设�|��ؓ(f��)真，同时我们希望能直接从搜烦(ch��)�l�果中提取文章标题，所以我们把标题域的存储属性设�|��ؓ(f��)真，但是�׃��正文域太大了�Q�我们�ؓ(f��)了羃?y��u)��?ch��)引文件大��，��正文域的存储属性设�|��ؓ(f��)假，当需要时再直接读取文�Ӟ��我们只是希望能从搜烦(ch��)解果中提取最后修�Ҏ(gu��)��_(d��)��不需要对它进行搜索，所以我们把最后修�Ҏ(gu��)��间域的存储属性设�|��ؓ(f��)真，索引属性设�|��ؓ(f��)假。上面的三个域涵盖了两个属性的三种�l�合�Q�还有一�U�全为假的没有用刎ͼ�事实上Field不允�怽�那么讄��Q�因为既不存储又不烦(ch��)引的域是没有意义的�?br />
3.4 term
term是搜索的最��单位，它表�C�文档的一个词语，term�׃��部分�l�成�Q�它表示的词语和�q�个词语所出现的field�?br />
3.5 tocken
tocken是term的一�ơ出玎ͼ�它包含trem文本和相应的��h��偏移�Q�以�?qi��ng)一个类型字�W�串。一句话中可以出现多�ơ相同的词语�Q�它们都用同一个term表示�Q�但是用不同的tocken�Q�每个tocken标记该词语出现的地方�?br />
3.6 segment
��d��索引时�ƈ不是每个document都马上添加到同一个烦(ch��)引文�Ӟ��它们首先被写入到不同的小文�g�Q�然后再合�ƈ成一个大索引文�g�Q�这里每个小文�g都是一个segment�?br />
4 lucene的结�?br />lucene包括core和sandbox两部分，其中core是lucene�E�_��的核心部分，sandbox包含了一些附加功能，例如highlighter、各�U�分析器�?br />Lucene core有七个包�Q�analysis�Q�document�Q�index�Q�queryParser�Q�search�Q�store�Q�util�?br />4.1 analysis
Analysis包含一些内建的分析器，例如按空白字�W�分词的WhitespaceAnalyzer�Q�添加了stopwrod�q��o(h��)的StopAnalyzer�Q�最常用的StandardAnalyzer�?br />4.2 document
Document包含文档的数据结构，例如Document�c�d��义了存储文档的数据结构，Field�c�d��义了Document的一个域�?br />4.3 index
Index 包含了烦(ch��)引的��d��c�，例如对烦(ch��)引文件的segment�q�行写、合�q�、优化的IndexWriter�c�d��对烦(ch��)引进行读取和删除操作的�?IndexReader�c�，�q�里要注意的是不要被I(xi��n)ndexReader�q�个名字误导�Q�以为它是烦(ch��)引文件的��d��c�，实际上删除烦(ch��)引也是由它完成， IndexWriter只关心如何将索引写入一个个segment�Q��ƈ��它们合�q�优化；IndexReader则关注烦(ch��)引文件中各个文档的组�l��Ş式�?br />4.4 queryParser
QueryParser 包含了解析查询语句的�c�，lucene的查询语句和sql语句有点�c�M��Q�有各种保留字，按照一定的语法可以�l�成各种查询�?Lucene有很多种 Query�c�，它们都��承自Query�Q�执行各�U�特�D�的查询�Q�QueryParser的作用就是解析查询语句，按顺序调用各�U?Query�c�L��扑և��l�果�?br />4.5 search
Search包含了从索引中搜索结果的各种�c�，例如刚才说的各种Query�c�，包括TermQuery、BooleanQuery�{�就在这个包里�?br />4.6 store
Store包含了烦(ch��)引的存储�c�，例如Directory定义了烦(ch��)引文件的存储�l�构�Q�FSDirectory为存储在文�g中的索引�Q�RAMDirectory为存储在内存中的索引�Q�MmapDirectory��Z��用内存映��的索引�?br />4.7 util
Util包含一些公共工��L(f��ng)��Q�例如时间和字符串之间的转换工具�?br />
5 如何建烦(ch��)�?br />5.1 最��单的能完成烦(ch��)引的代码片断

IndexWriter writer = new IndexWriter(�?data/index/�? new StandardAnalyzer(), true);
Document doc = new Document();
doc.add(new Field("title", "lucene introduction", Field.Store.YES, Field.Index.TOKENIZED));
doc.add(new Field("content", "lucene works well", Field.Store.YES, Field.Index.TOKENIZED));
writer.addDocument(doc);
writer.optimize();
writer.close();

下面我们分析一下这�D�代码�?br />首先我们创徏了一个writer�Q��ƈ指定存放索引的目录�ؓ(f��)�?data/index”，使用的分析器为StandardAnalyzer�Q�第三个参数说明如果已经有烦(ch��)引文件在索引目录下，我们��覆盖它们�?br />然后我们新徏一个document�?br />我们向document��d��一个field�Q�名字是“title”，内容是“lucene introduction”，对它�q�行存储�q�烦(ch��)引�?br />再添加一个名字是“content”的field�Q�内�Ҏ(gu��)��“lucene works well”，也是存储�q�烦(ch��)引�?br />然后我们��这个文档添加到索引中，如果有多个文档，可以重复上面的操作，创徏document�q�添加�?br />��d��完所有document�Q�我们对索引�q�行优化�Q�优化主要是��多个segment合�ƈ��C��个，有利于提高烦(ch��)引速度�?br />随后��writer关闭�Q�这点很重要�?br />
对，创徏索引��p��么简单！
当然你可能修改上面的代码获得更具个性化的服务�?br />
5.2 ��烦(ch��)引直接写在内�?br />你需要首先创��Z��个RAMDirectory�Q��ƈ��其传给writer�Q�代码如下：(x��)

Directory dir = new RAMDirectory();
IndexWriter writer = new IndexWriter(dir, new StandardAnalyzer(), true);
Document doc = new Document();
doc.add(new Field("title", "lucene introduction", Field.Store.YES, Field.Index.TOKENIZED));
doc.add(new Field("content", "lucene works well", Field.Store.YES, Field.Index.TOKENIZED));
writer.addDocument(doc);
writer.optimize();
writer.close();

5.3 索引文本文�g
如果你想把纯文本文�g索引��h��Q�而不惌��己将它们��d��字符串创建field�Q�你可以用下面的代码创徏field�Q?br />
Field field = new Field("content", new FileReader(file));

�q�里的file��是该文本文件。该构造函数实际上是读��L��件内容，�q�对其进行烦(ch��)引，但不存储�?br />
6 如何�l�护索引
索引的维护操作都是由IndexReader�c�L��供�?br />
6.1 如何删除索引
lucene提供了两�U�从索引中删除document的方法，一�U�是

void deleteDocument(int docNum)

�q�种�Ҏ(gu��)��是根据document在烦(ch��)引中的编��h��删除�Q�每个document加进索引后都�?x��)有个唯一�~�号�Q�所以根据编号删除是一�U�精��删除，但是�q�个�~�号是烦(ch��)引的内部�l�构�Q�一般我们不�?x��)知道某个文件的�~�号到底是几�Q�所以用处不大。另一�U�是

void deleteDocuments(Term term)

�q�种�Ҏ(gu��)��实际上是首先�Ҏ(gu��)��参数term执行一个搜索操作，然后把搜索到的结果批量删除了。我们可以通过�q�个�Ҏ(gu��)��提供一个严格的查询条�g�Q�达到删除指定document的目的�?br />下面�l�出一个例子：(x��)

Directory dir = FSDirectory.getDirectory(PATH, false);
IndexReader reader = IndexReader.open(dir);
Term term = new Term(field, key);
reader.deleteDocuments(term);
reader.close();

6.2 如何更新索引
lucene�q�没有提供专门的索引更新�Ҏ(gu��)��Q�我们需要先��相应的document删除�Q�然后再��新的document加入索引。例如：(x��)

Directory dir = FSDirectory.getDirectory(PATH, false);
IndexReader reader = IndexReader.open(dir);
Term term = new Term(“title�? “lucene introduction�?;
reader.deleteDocuments(term);
reader.close();

IndexWriter writer = new IndexWriter(dir, new StandardAnalyzer(), true);
Document doc = new Document();
doc.add(new Field("title", "lucene introduction", Field.Store.YES, Field.Index.TOKENIZED));
doc.add(new Field("content", "lucene is funny", Field.Store.YES, Field.Index.TOKENIZED));
writer.addDocument(doc);
writer.optimize();
writer.close();

7 如何搜烦(ch��)
lucene 的搜索相当强大，它提供了很多辅助查询�c�，每个�c�都�l�承自Query�c�，各自完成一�U�特�D�的查询�Q�你可以像搭�U�木一样将它们��L��l�合使用�Q�完成一些复杂操作；另外lucene�q�提供了Sort�c�d��l�果�q�行排序�Q�提供了Filter�c�d��查询条�g�q�行限制。你或许�?x��)不自觉地拿它跟SQL语句�q�行比较�Q?“lucene能执行and、or、order by、where、like �?xx%’操作吗�Q�”回�{�是�Q�“当然没问题�Q��?br />
7.1 各种各样的Query
下面我们看看lucene到底允许我们�q�行哪些查询操作�Q?br />
7.1.1 TermQuery
首先介绍最基本的查询，如果你想执行一个这��L(f��ng)��查询�Q�“在content域中包含‘lucene’的document”，那么你可以用TermQuery�Q?br />
Term t = new Term("content", " lucene";
Query query = new TermQuery(t);

7.1.2 BooleanQuery
如果你想�q�么查询�Q�“在content域中包含java或perl的document”，那么你可以徏立两个TermQuery�q�把它们用BooleanQuery�q�接��h��Q?br />
TermQuery termQuery1 = new TermQuery(new Term("content", "java");
TermQuery termQuery 2 = new TermQuery(new Term("content", "perl");
BooleanQuery booleanQuery = new BooleanQuery();
booleanQuery.add(termQuery 1, BooleanClause.Occur.SHOULD);
booleanQuery.add(termQuery 2, BooleanClause.Occur.SHOULD);

7.1.3 WildcardQuery
如果你想�Ҏ(gu��)��单词�q�行通配�W�查询，你可以用WildcardQuery�Q�通配�W�包括�?’匹配一个�Q意字�W�和�?’匹配零个或多个��L��字符�Q�例如你搜烦(ch��)’use*’，你可能找到’useful’或者’useless’：(x��)

Query query = new WildcardQuery(new Term("content", "use*");

7.1.4 PhraseQuery
你可能对中日关系比较感兴��，��x��䏀�中’和‘日’挨得比较近�Q?个字的距��d��Q�的文章�Q�超�q�这个距��ȝ��不予考虑�Q�你可以�Q?br />
PhraseQuery query = new PhraseQuery();
query.setSlop(5);
query.add(new Term("content ", “中�?);
query.add(new Term(“content�? “日�?);

那么它可能搜到“中日合作……”、“中方和日方……”，但是搜不到“中国某高层领导说日本欠扁”�?br />
7.1.5 PrefixQuery
如果你想搜以‘中’开头的词语�Q�你可以用PrefixQuery�Q?br />
PrefixQuery query = new PrefixQuery(new Term("content ", "�?);

7.1.6 FuzzyQuery
FuzzyQuery用来搜烦(ch��)�怼�的term�Q��用Levenshtein��法。假设你��x��索跟‘wuzza’相似的词语�Q�你可以�Q?br />
Query query = new FuzzyQuery(new Term("content", "wuzza");

你可能得到‘fuzzy’和‘wuzzy’�?br />
7.1.7 RangeQuery
另一个常用的Query是RangeQuery�Q�你也许��x��索时间域�?0060101�?0060130之间的document�Q�你可以用RangeQuery�Q?br />
RangeQuery query = new RangeQuery(new Term(“time�? �?0060101�?, new Term(“time�? �?0060130�?, true);

最后的true表示用闭合区间�?br />
7.2 QueryParser
看了�q�么多Query�Q�你可能�?x��)问�Q�“不�?x��)让我自��q��合各�U�Query吧，太麻�?ch��)了�Q�”当然不�?x��)，lucene提供了一�U�类��g��SQL语句的查询语句，我们姑且叫它lucene语句�Q�通过它，你可以把各种查询一句话搞定�Q�lucene�?x��)自动把它们查分成小块交�l�相应Query执行。下面我们对应每�U?Query演示一下：(x��)
TermQuery可以用“field:key”方式，例如“content:lucene”�?br />BooleanQuery中‘与’用�?’，‘或’用�?’，例如“content:java contenterl”�?br />WildcardQuery仍然用�?’和�?’，例如“content:use*”�?br />PhraseQuery用‘~’，例如“content:"中日"~5”�?br />PrefixQuery用�?’，例如“中*”�?br />FuzzyQuery用‘~’，例如“content: wuzza ~”�?br />RangeQuery用‘[]’或‘{}’，前者表�C�闭区间�Q�后者表�C�开区间�Q�例如“time:[20060101 TO 20060130]”，注意TO区分大小写�?br />你可以�Q意组合query string�Q�完成复杂操作，例如“标题或正文包括lucene�Q��ƈ且时间在20060101�?0060130之间的文章”可以表�C�Zؓ(f��)�Q��? (title:lucene content:lucene) +time:[20060101 TO 20060130]”。代码如下：(x��)

Directory dir = FSDirectory.getDirectory(PATH, false);
IndexSearcher is = new IndexSearcher(dir);
QueryParser parser = new QueryParser("content", new StandardAnalyzer());
Query query = parser.parse("+(title:lucene content:lucene) +time:[20060101 TO 20060130]";
Hits hits = is.search(query);
for (int i = 0; i < hits.length(); i++)
{
Document doc = hits.doc(i);
System.out.println(doc.get("title");
}
is.close();

首先我们创徏一个在指定文�g目录上的IndexSearcher�?br />然后创徏一个��用StandardAnalyzer作�ؓ(f��)分析器的QueryParser�Q�它默认搜烦(ch��)的域是content�?br />接着我们用QueryParser来parse查询字串�Q�生成一个Query�?br />然后利用�q�个Query��L��扄��果，�l�果以Hits的�Ş式返回�?br />�q�个Hits对象包含一个列表，我们挨个把它的内�Ҏ(gu��)��C�出来�?br />
7.3 Filter
filter 的作用就是限制只查询索引的某个子集，它的作用有点像SQL语句里的where�Q�但又有区别�Q�它不是正规查询的一部分�Q�只是对数据源进行预处理�Q�然后交�l�查询语句。注意它执行的是预处理，而不是对查询�l�果�q�行�q��o(h��)�Q�所以��用filter的代��h��很大的，它可能会(x��)使一�ơ查询耗时提高一癑ր��?br />最常用的filter是RangeFilter和QueryFilter。RangeFilter是设定只搜烦(ch��)指定范围内的索引�Q�QueryFilter是在上次查询的结果中搜烦(ch��)�?br />Filter的��用非常简单，你只需创徏一个filter实例�Q�然后把它传�l�searcher。��l�上面的例子�Q�查询“时间在20060101�?0060130之间的文章”除了将限制写在query string中，你还可以写在RangeFilter中：(x��)

Directory dir = FSDirectory.getDirectory(PATH, false);
IndexSearcher is = new IndexSearcher(dir);
QueryParser parser = new QueryParser("content", new StandardAnalyzer());
Query query = parser.parse("title:lucene content:lucene";
RangeFilter filter = new RangeFilter("time", "20060101", "20060230", true, true);
Hits hits = is.search(query, filter);
for (int i = 0; i < hits.length(); i++)
{
Document doc = hits.doc(i);
System.out.println(doc.get("title");
}
is.close();

7.4 Sort
有时你想要一个排好序的结果集�Q�就像SQL语句的“order by”，lucene能做刎ͼ�(x��)通过Sort�?br />Sort sort = new Sort(“time�?; //相当于SQL的“order by time�?br />Sort sort = new Sort(“time�? true); // 相当于SQL的“order by time desc�?br />下面是一个完整的例子�Q?br />
Directory dir = FSDirectory.getDirectory(PATH, false);
IndexSearcher is = new IndexSearcher(dir);
QueryParser parser = new QueryParser("content", new StandardAnalyzer());
Query query = parser.parse("title:lucene content:lucene";
RangeFilter filter = new RangeFilter("time", "20060101", "20060230", true, true);
Sort sort = new Sort(“time�?;
Hits hits = is.search(query, filter, sort);
for (int i = 0; i < hits.length(); i++)
{
Document doc = hits.doc(i);
System.out.println(doc.get("title");
}
is.close();

8 分析�?br />在前面的概念介绍中我们已�l�知道了分析器的作用�Q�就是把句子按照语义切分成一个个词语。英文切分已�l�有了很成熟的分析器�Q��?StandardAnalyzer�Q�很多情况下StandardAnalyzer是个不错的选择。甚至你�?x��)发现StandardAnalyzer也能对中文进行分词�?br />但是我们的焦�Ҏ(gu��)��中文分词�Q�StandardAnalyzer能支持中文分词吗�Q�实践证明是可以的，但是效果�q�不好，搜烦(ch��)“如果�?�?x��)把“牛奶不如果汁好喝”也搜烦(ch��)出来�Q�而且索引文�g很大。那么我们手头上�q�有什么分析器可以使用呢？core里面没有�Q�我们可以在sandbox里面扑ֈ�两个�Q?ChineseAnalyzer和CJKAnalyzer。但是它们同样都有分词不准的问题。相比之下用StandardAnalyzer和�?ChineseAnalyzer建立索引旉��差不多，索引文�g大小也差不多�Q�CJKAnalyzer表现�?x��)差些，索引文�g大且耗时比较�ѝ�?br />要解决问题，首先分析一下这三个分析器的分词方式。StandardAnalyzer和ChineseAnalyzer都是把句子按单个字切分，也就是说 “牛奶不如果汁好喝”会(x��)被它们切分成“牛 �?�?�?�?�?�?喝”；而CJKAnalyzer则会(x��)切分成“牛�?奶不不如如果果汁汁好好喝”。这也就解释了�ؓ(f��)什么搜索“果汁”都能匹配这个句子�?br />以上分词的缺点至��有两个�Q�匹配不准确和烦(ch��)引文件大。我们的目标是将上面的句子分解成 “牛�?不如果汁好喝”。这里的关键��是语义识别�Q�我们如何识别“牛奶”是一个词而“奶不”不是词语？我们很自然会(x��)惛_��Z��词库的分词法�Q�也��是我们先得��C��个词库，里面列�D了大部分词语�Q�我们把句子按某�U�方式切分，当得到的词语与词库中的项匚w��Ӟ��我们��p��U�切分是正确的。这样切词的�q�程��p�{变成匚w��的过�E�，而匹配的方式最��单的有正向最大匹配和逆向最大匹配两�U�，说白了就是一个从句子开头向后进行匹配，一个从句子末尾向前�q�行匚w��。基于词库的分词词库非常重要�Q�词库的定w��直接影响搜烦(ch��)�l�果�Q�在相同词库的前提下�Q�据说逆向最大匹配优于正向最大匹配�?br />当然�q�有别的分词�Ҏ(gu��)��Q�这本��n��是一个学�U�，我这里也没有深入研究。回到具体应用，我们的目标是能找到成熟的、现成的分词工具�Q�避免重新发明�R轮。经�q�网上搜索，用的比较多的是中�U�院�?ICTCLAS和一个不开放源码但是免费的JE-Analysis。ICTCLAS有个问题是它是一个动态链接库�Q?java调用需要本地方法调用，不方便也有安全隐�(zh��n)�，而且口碑也确实不大好。JE-Analysis效果�q�不错，当然也会(x��)有分词不准的地方�Q�相比比较方便放心�?br />
9 性能优化
一直到�q�里�Q�我们还是在讨论怎么样��lucene跑�v来，完成指定��d��。利用前面说的也��实能完成大部分功能。但是测试表明lucene的性能�q�不是很好，在大数据量大�q�发的条件下甚至�?x��)有半分钟返回的情况。另外大数据量的数据初始化徏立烦(ch��)引也是一个十分耗时的过�E�。那么如何提高lucene的性能呢？下面从优化创建烦(ch��)引性能和优化搜索性能两方面介�l��?br />
9.1 优化创徏索引性能
�q�方面的优化途径比较有限�Q�IndexWriter提供了一些接口可以控制徏立烦(ch��)引的操作�Q�另外我们可以先��烦(ch��)引写入RAMDirectory�Q�再扚w��写入FSDirectory�Q�不��怎样�Q�目的都是尽量少的文件IO�Q�因为创建烦(ch��)引的最大瓶颈在于磁盘I(y��)O。另外选择一个较好的分析器也能提高一些性能�?br />
9.1.1 通过讄��IndexWriter的参��C��化烦(ch��)引徏�?br />setMaxBufferedDocs(int maxBufferedDocs)
控制写入一个新的segment前内存中保存的document的数目，讄��较大的数目可以加快徏索引速度�Q�默认�ؓ(f��)10�?br />setMaxMergeDocs(int maxMergeDocs)
控制一个segment中可以保存的最大document数目�Q��D��?y��u)��有利于�q�加索引的速度�Q�默认Integer.MAX_VALUE�Q�无需修改�?br />setMergeFactor(int mergeFactor)
控制多个segment合�ƈ的频率，��D��大时建立索引速度较快�Q�默认是10�Q�可以在建立索引时设�|��ؓ(f��)100�?br />
9.1.2 通过RAMDirectory�~�写提高性能
我们可以先把索引写入RAMDirectory�Q�达��C��定数量时再批量写�q�FSDirectory�Q�减��磁盘I(y��)O�ơ数�?br />
FSDirectory fsDir = FSDirectory.getDirectory("/data/index", true);
RAMDirectory ramDir = new RAMDirectory();
IndexWriter fsWriter = new IndexWriter(fsDir, new StandardAnalyzer(), true);
IndexWriter ramWriter = new IndexWriter(ramDir, new StandardAnalyzer(), true);
while (there are documents to index)
{
... create Document ...
ramWriter.addDocument(doc);
if (condition for flushing memory to disk has been met)
{
fsWriter.addIndexes(new Directory[] { ramDir });
ramWriter.close();
ramWriter = new IndexWriter(ramDir, new StandardAnalyzer(), true);
}
}

9.1.3 选择较好的分析器
�q�个优化主要是对��盘�I�间的优化，可以��烦(ch��)引文件减��将�q�一半，相同��试数据下由600M减少�?80M。但是对旉��q�没有什么帮助，甚至�?x��)需要更长时��_(d��)��因�ؓ(f��)较好的分析器需要匹配词库，�?x��)消耗更多cpu�Q�测试数据用StandardAnalyzer耗时133分钟�Q�用MMAnalyzer耗时150分钟�?br />
9.2 优化搜烦(ch��)性能
虽然建立索引的操作非常耗时�Q�但是那毕竟只在最初创建时才需要，�q�x��只是��量的维护操作，更何况这些可以放��C��个后台进�E�处理，�q�不影响用户搜烦(ch��)。我们创建烦(ch��)引的目的��是�l�用��h��索，所以搜索的性能才是我们最兛_��的。下面就来探讨一下如何提高搜索性能�?br />
9.2.1 ��烦(ch��)引放入内�?br />�q�是一个最直观的想法，因�ؓ(f��)内存比磁盘快很多。Lucene提供了RAMDirectory可以在内存中容纳索引�Q?br />
Directory fsDir = FSDirectory.getDirectory(�?data/index/�? false);
Directory ramDir = new RAMDirectory(fsDir);
Searcher searcher = new IndexSearcher(ramDir);

但是实践证明RAMDirectory和FSDirectory速度差不多，当数据量很小时两者都非常快，当数据量较大�Ӟ��索引文�g400M�Q�RAMDirectory甚至比FSDirectory�q�要慢一点，�q�确实让人出乎意料�?br />而且lucene的搜索非常耗内存，即�ɞ�?00M的烦(ch��)引文件蝲入内存，在运行一�D�|��间后都会(x��)out of memory�Q�所以个��入内存的作用�q�不大�?br />
9.2.2 优化旉��范围限制
既然载入内存�q�不能提高效率，一定有其它瓉��Q�经�q�测试发现最大的瓉��居然是时间范围限�Ӟ��那么我们可以怎样使时间范围限制的代�h(hu��n)最��呢�Q?br />当需要搜索指定时间范围内的结果时�Q�可以：(x��)
1、用RangeQuery�Q�设�|�范��_(d��)��但是RangeQuery的实现实际上是将旉��范围内的旉��点展开�Q�组成一个个BooleanClause加入刊W?BooleanQuery中查询，因此旉��范围不可能设�|�太大，�l�测试，范围��过一个月��׃��(x��)�?BooleanQuery.TooManyClauses�Q�可以通过讄�� BooleanQuery.setMaxClauseCount (int maxClauseCount)扩大�Q�但是扩大也是有限的�Q��ƈ且随着maxClauseCount扩大�Q�占用内存也扩大
2、用 RangeFilter代替RangeQuery�Q�经��试速度不会(x��)比RangeQuery慢，但是仍然有性能瓉��Q�查询的90%以上旉��耗费在�?RangeFilter�Q�研�I�其源码发现RangeFilter实际上是首先遍历所有烦(ch��)引，生成一个BitSet�Q�标记每个document�Q�在旉��范围内的标记为true�Q�不在的标记为false�Q�然后将�l�果传递给Searcher查找�Q�这是十分耗时的�?br />3、进一步提高性能�Q�这个又有两个思�\�Q?br />a、缓存Filter�l�果。既然RangeFilter的执行是在搜索之前，那么它的输入都是一定的�Q�就是IndexReader�Q�而�?IndexReader是由Directory军_��的，所以可以认为RangeFilter的结果是��p��围的上下限决定的�Q�也��是由具体的 RangeFilter对象军_��Q�所以我们只要以RangeFilter对象为键�Q�将filter�l�果BitSet�~�存��h��卛_��。lucene API 已经提供了一个CachingWrapperFilter�c�d��装了Filter�?qi��ng)其�l�果�Q�所以具体实施�v来我们可�?cache CachingWrapperFilter对象�Q�需要注意的是，不要被CachingWrapperFilter的名字及(qi��ng)其说明误��|�� CachingWrapperFilter看�v来是有缓存功能，但的�~�存是针对同一个filter的，也就是在你用同一个filter�q��o(h��)不同 IndexReader�Ӟ��它可以帮你缓存不同IndexReader的结果，而我们的需求恰恰相反，我们是用不同filter�q��o(h��)同一个�?IndexReader�Q�所以只能把它作��Z��个封装类�?br />b、降低时间精度。研�I�Filter的工作原理可以看出，它每�ơ工作都是遍历整个烦(ch��)引的�Q�所以时间粒度越大，�Ҏ(gu��)��快�Q�搜索时间越短，在不影响功能的情况下�Q�时间精度越低越好，有时甚至牺牲一点精度也值得�Q�当然最好的情况是根本不作时间限制�?br />下面针对上面的两个思�\演示一下优化结果（都采�?00�U�程随机关键词随��x��间范��_(d��)��(j��)�Q?br />�W�一�l�，旉��_�ֺ�为秒�Q?br />方式直接用RangeFilter 使用cache 不用filter
�q�_��每个�U�程耗时 10s 1s 300ms

�W�二�l�，旉��_�ֺ�为天
方式直接用RangeFilter 使用cache 不用filter
�q�_��每个�U�程耗时 900ms 360ms 300ms

�׃��上数据可以得出结论：(x��)
1�?��量降低旉��_�ֺ��Q�将�_�ֺ��q��换成天带来的性能提高甚至比��用cache�q�好�Q�最好不使用filter�?br />2�?在不能降低时间精度的情况下，使用cache能带�?0倍左右的性能提高�?br />
9.2.3 使用更好的分析器
�q�个跟创建烦(ch��)引优化道理差不多�Q�烦(ch��)引文件小了搜索自然会(x��)加快。当然这个提高也是有限的。较好的分析器相对于最差的分析器对性能的提升在20%以下�?br />
10 一些经�?br />
10.1关键词区分大��写
or AND TO�{�关键词是区分大��写的，lucene只认大写的，��写的当做普通单词�?br />
10.2 ��d��互斥�?br />同一时刻只能有一个对索引的写操作�Q�在写的同时可以�q�行搜烦(ch��)

10.3 文�g�?br />在写索引的过�E�中��退出将在tmp目录留下一个lock文�g�Q��以后的写操作无法�q�行�Q�可以将其手工删�?br />
10.4 旉��格式
lucene只支持一�U�时间格式yyMMddHHmmss�Q�所以你传一个yy-MM-dd HH:mm:ss的时间给lucene它是不会(x��)当作旉��来处理的

10.5 讄��boost
有些时候在搜烦(ch��)时某个字�D늚�权重需要大一些，例如你可能认为标题中出现关键词的文章比正文中出现关键词的文章更有价��|��你可以把标题的boost讄��的更大，那么搜烦(ch��)�l�果�?x��)优先显�C�标题中出现关键词的文章�Q�没有��用排序的前题下）(j��)。��用方法：(x��)
Field. setBoost(float boost);默认值是1.0�Q�也��是说要增加权重的需要设�|�得�?大�?br />

dybjsun 2008-01-09 17:17 发表评论

log4j

dybjsun — Mon, 24 Dec 2007 03:46:00 GMT

在强调可重用�l��g开发的今天�Q�除了自�׃��头到��ּ�发一个可重用的日志操作类外，Apache为我们提供了一个强有力的日志操作包-Log4j�?br />
Log4j是Apache的一个开放源代码��目�Q�通过使用Log4j�Q�我们可以控制日志信息输送的目的地是控制台、文件、GUI�l��g、甚��x��套接口服务器、NT的事件记录器、UNIX Syslog守护�q�程�{�；我们也可以控制每一条日志的输出格式�Q�通过定义每一条日志信息的�U�别�Q�我们能够更加细致地控制日志的生成过�E�。最令�h感兴��的��是�Q�这些可以通过一个配�|�文件来灉|��地进行配�|�，而不需要修改应用的代码�?br />
此外�Q�通过Log4j其他语言接口�Q��?zh��n)�可以在C、C++�?Net、PL/SQL�E�序中��用Log4j�Q�其语法和用法与在Java�E�序中一��P��使得多语�a�分布式系�l�得��C��个统一一致的日志�l��g模块。而且�Q�通过使用各种�W�三�Ҏ(gu��)��展，�(zh��n)�可以很方便地将Log4j集成到J2EE、JINI甚至是SNMP应用中�?br />
说明�Q�下面分��Z��部分�Q�第一部分讲解如何配置log4j�Q�第二部分�ؓ(f��)对log4j.properties配置文�g中的各个属性的讲解�Q�第三部分�ؓ(f��)�?log4j的详�l�讲解，如果只想配置上log4j�Q�那么只需要看前两个部分就可以�Q�如果想对log4j深入了解�Q�则�q�需看第三部分�?br />
一、Log4j配置

�W�一步：(x��)加入log4j-1.2.8.jar到l(f��)ib下�?br />
�W�二步：(x��)在CLASSPATH下徏立log4j.properties。内容如下：(x��)

1 log4j.rootCategory=INFO, stdout , R

2

3 log4j.appender.stdout=org.apache.log4j.ConsoleAppender

4 log4j.appender.stdout.layout=org.apache.log4j.PatternLayout

5 log4j.appender.stdout.layout.ConversionPattern=[QC] %p [%t] %C.%M(%L) | %m%n

6

7 log4j.appender.R=org.apache.log4j.DailyRollingFileAppender

8 log4j.appender.R.File=D:\\Tomcat 5.5\\logs\\qc.log

9 log4j.appender.R.layout=org.apache.log4j.PatternLayout

10 log4j.appender.R.layout.ConversionPattern=%d-[TS] %p %t %c - %m%n

11

12 log4j.logger.com.neusoft=DEBUG

13 log4j.logger.com.opensymphony.oscache=ERROR

14 log4j.logger.net.sf.navigator=ERROR

15 log4j.logger.org.apache.commons=ERROR

16 log4j.logger.org.apache.struts=WARN

17 log4j.logger.org.displaytag=ERROR

18 log4j.logger.org.springframework=DEBUG

19 log4j.logger.com.ibatis.db=WARN

20 log4j.logger.org.apache.velocity=FATAL

21

22 log4j.logger.com.canoo.webtest=WARN

23

24 log4j.logger.org.hibernate.ps.PreparedStatementCache=WARN

25 log4j.logger.org.hibernate=DEBUG

26 log4j.logger.org.logicalcobwebs=WARN

�W�三步：(x��)相应的修改其中属性，修改之前��必��ȝ��道这些都是干什么的�Q�在�W�二部分讲解�?br />
�W�四步：(x��)在要输出日志的类中加入相兌��句：(x��)

定义属性：(x��)protected final Log log = LogFactory.getLog(getClass());

在相应的�Ҏ(gu��)��中：(x��)

if (log.isDebugEnabled())

{

log.debug(“System �?.�?;

}

二、Log4j说明

1 log4j.rootCategory=INFO, stdout , R

此句为将�{��为INFO的日志信息输出到stdout和R�q�两个目的地�Q�stdout和R的定义在下面的代码，可以��L��起名。等�U�可分�ؓ(f��)OFF�?FATAL、ERROR、WARN、INFO、DEBUG、ALL�Q�如果配�|�OFF则不打出��M��信息�Q�如果配�|��ؓ(f��)INFO�q�样只显�C�INFO, WARN, ERROR的log信息�Q�而DEBUG信息不会(x��)被显�C�，具体讲解可参照第三部分定义配�|�文件中的logger�?br />
3 log4j.appender.stdout=org.apache.log4j.ConsoleAppender

此句为定义名为stdout的输出端是哪�U�类型，可以�?br />
org.apache.log4j.ConsoleAppender�Q�控制台�Q�，

org.apache.log4j.FileAppender�Q�文�Ӟ��(j��)�Q?br />
org.apache.log4j.DailyRollingFileAppender�Q�每天��生一个日志文�Ӟ��(j��)�Q?br />
org.apache.log4j.RollingFileAppender�Q�文件大��到达指定尺寸的时候��生一个新的文�Ӟ��(j��)

org.apache.log4j.WriterAppender�Q�将日志信息以流格式发送到��L��指定的地方）(j��)

具体讲解可参照第三部分定义配�|�文件中的Appender�?br />
4 log4j.appender.stdout.layout=org.apache.log4j.PatternLayout

此句为定义名为stdout的输出端的layout是哪�U�类型，可以�?br />
org.apache.log4j.HTMLLayout�Q�以HTML表格形式布局�Q�，

org.apache.log4j.PatternLayout�Q�可以灵�z�d��指定布局模式�Q�，

org.apache.log4j.SimpleLayout�Q�包含日志信息的�U�别和信息字�W�串�Q�，

org.apache.log4j.TTCCLayout�Q�包含日志��生的旉��、线�E�、类别等�{�信息）(j��)

具体讲解可参照第三部分定义配�|�文件中的Layout�?br />
5 log4j.appender.stdout.layout.ConversionPattern= [QC] %p [%t] %C.%M(%L) | %m%n

如果使用pattern布局��p��指定的打��C��息的具体格式ConversionPattern�Q�打印参数如下：(x��)

%m 输出代码中指定的消息

%p 输出优先�U�，即DEBUG�Q�INFO�Q�W(xu��)ARN�Q�ERROR�Q�FATAL

%r 输出自应用启动到输出该log信息耗费的毫�U�数

%c 输出所属的�cȝ��Q�通常��是所在类的全�?br />
%t 输出产生该日志事件的�U�程�?br />
%n 输出一个回车换行符�Q�W(xu��)indows�q�_��为“rn”，Unix�q�_��为“n�?br />
%d 输出日志旉��点的日期或时��_(d��)��默认格式为ISO8601�Q�也可以在其后指定格式，比如�Q?d{yyyy MMM dd HH:mm:ss,SSS}�Q�输出类��|��(x��)2002�q?0�?8�?22�Q?0�Q?8�Q?21

%l 输出日志事�g的发生位�|�，包括�cȝ��名、发生的�U�程�Q�以�?qi��ng)在代码中的行数�?br />
[QC]是log信息的开��_(d��)��可以��Z�Q意字�W�，一般�ؓ(f��)��目��U��?br />
输出的信�?br />
[TS] DEBUG [main] AbstractBeanFactory.getBean(189) | Returning cached instance of singleton bean 'MyAutoProxy'

具体讲解可参照第三部分定义配�|�文件中的格式化日志信息�?br />
7 log4j.appender.R=org.apache.log4j.DailyRollingFileAppender

此句与第3行一栗��定义名为R的输出端的类型�ؓ(f��)每天产生一个日志文件�?br />
8 log4j.appender.R.File=D:\\Tomcat 5.5\\logs\\qc.log

此句为定义名为R的输出端的文件名为D:\\Tomcat 5.5\\logs\\qc.log

可以自行修改�?br />
9 log4j.appender.R.layout=org.apache.log4j.PatternLayout

与第4行相同�?br />
10 log4j.appender.R.layout.ConversionPattern=%d-[TS] %p %t %c - %m%n

与第5行相同�?br />
12 log4j.logger.com. neusoft =DEBUG

指定com.neusoft包下的所有类的等�U��ؓ(f��)DEBUG�?br />
可以把com.neusoft改�ؓ(f��)自己��目所用的包名�?br />
13 log4j.logger.com.opensymphony.oscache=ERROR

14 log4j.logger.net.sf.navigator=ERROR

�q�两句是把这两个包下出现的错误的�{��设�ؓ(f��)ERROR�Q�如果项目中没有配置EHCache�Q�则不需要这两句�?br />
15 log4j.logger.org.apache.commons=ERROR

16 log4j.logger.org.apache.struts=WARN

�q�两句是struts的包�?br />
17 log4j.logger.org.displaytag=ERROR

�q�句是displaytag的包。（QC问题列表��面所用）(j��)

18 log4j.logger.org.springframework=DEBUG

此句为Spring的包�?br />
24 log4j.logger.org.hibernate.ps.PreparedStatementCache=WARN

25 log4j.logger.org.hibernate=DEBUG

此两句是hibernate的包�?br />
以上�q�些包的讄��可根据项目的实际情况而自行定制�?br />
三、log4j详解

1、定义配�|�文�?br />
Log4j支持两种配置文�g格式�Q�一�U�是XML格式的文�Ӟ��一�U�是Java�Ҏ(gu��)��文件log4j.properties�Q�键=��|��(j��)。下面将介绍使用log4j.properties文�g作�ؓ(f��)配置文�g的方�?

①、配�|�根Logger

Logger 负责处理日志记录的大部分操作�?br />
其语法�ؓ(f��)�Q?br />
log4j.rootLogger = [ level ] , appenderName, appenderName, �?br />
其中�Q�level 是日志记录的优先�U�，分�ؓ(f��)OFF、FATAL、ERROR、WARN、INFO、DEBUG、ALL或者自定义的��别。Log4j��只��用四个��别，优先�U�从高到低分别是ERROR、WARN、INFO、DEBUG。通过在这里定义的�U�别�Q��?zh��n)�可以控制到应用程序中相应�U�别的日志信息的开兟뀂比如在�q�里定义了INFO�U�别�Q�只有等于及(qi��ng)高于�q�个�U�别的才�q�行处理�Q�则应用�E�序中所有DEBUG�U�别的日志信息将不被打印出来。ALL:打印所有的日志�Q�OFF�Q�关闭所有的日志输出�?appenderName��是指定日志信息输出到哪个地斏V��可同时指定多个输出目的地�?br />
②、配�|�日志信息输出目的地 Appender

Appender 负责控制日志记录操作的输出�?br />
其语法�ؓ(f��)�Q?br />
log4j.appender.appenderName = fully.qualified.name.of.appender.class

log4j.appender.appenderName.option1 = value1

�?br />
log4j.appender.appenderName.optionN = valueN

�q�里的appenderName为在①里定义的，可�Q意�v名�?br />
其中�Q�Log4j提供的appender有以下几�U�：(x��)

org.apache.log4j.ConsoleAppender�Q�控制台�Q�，

org.apache.log4j.FileAppender�Q�文�Ӟ��(j��)�Q?br />
org.apache.log4j.DailyRollingFileAppender�Q�每天��生一个日志文�Ӟ��(j��)�Q?br />
org.apache.log4j.RollingFileAppender�Q�文件大��到达指定尺寸的时候��生一个新的文�Ӟ��(j��)�Q�可通过 log4j.appender.R.MaxFileSize=100KB讄��文�g大小�Q�还可通过 log4j.appender.R.MaxBackupIndex=1讄��Z��存一个备份文件�?br />
org.apache.log4j.WriterAppender�Q�将日志信息以流格式发送到��L��指定的地方）(j��)

例如�Q�log4j.appender.stdout=org.apache.log4j.ConsoleAppender

定义一个名为stdout的输出目的地�Q�ConsoleAppender为控制台�?br />
③、配�|�日志信息的格式�Q�布局�Q�Layout

Layout 负责格式化Appender的输出�?br />
其语法�ؓ(f��)�Q?br />
log4j.appender.appenderName.layout = fully.qualified.name.of.layout.class

log4j.appender.appenderName.layout.option1 = value1

�?br />
log4j.appender.appenderName.layout.optionN = valueN

其中�Q�Log4j提供的layout有以下几�U�：(x��)

org.apache.log4j.HTMLLayout�Q�以HTML表格形式布局�Q�，

org.apache.log4j.PatternLayout�Q�可以灵�z�d��指定布局模式�Q�，

org.apache.log4j.SimpleLayout�Q�包含日志信息的�U�别和信息字�W�串�Q�，

org.apache.log4j.TTCCLayout�Q�包含日志��生的旉��、线�E�、类别等�{�信息）(j��)

2、格式化日志信息

Log4J采用�c�M��C语言中的printf函数的打印格式格式化日志信息�Q�打印参数如下：(x��)

%m 输出代码中指定的消息

%p 输出优先�U�，即DEBUG�Q�INFO�Q�W(xu��)ARN�Q�ERROR�Q�FATAL

%r 输出自应用启动到输出该log信息耗费的毫�U�数

%c 输出所属的�cȝ��Q�通常��是所在类的全�?br />
%t 输出产生该日志事件的�U�程�?br />
%n 输出一个回车换行符�Q�W(xu��)indows�q�_��为“rn”，Unix�q�_��为“n�?br />
%d 输出日志旉��点的日期或时��_(d��)��默认格式为ISO8601�Q�也可以在其后指定格式，比如�Q?d{yyyy MMM dd HH:mm:ss,SSS}�Q�输出类��|��(x��)2002�q?0�?8�?22�Q?0�Q?8�Q?21

%l 输出日志事�g的发生位�|�，包括�cȝ��名、发生的�U�程�Q�以�?qi��ng)在代码中的行数�?br />
3、在代码中��用Log4j

我们在需要输出日志信息的�c�M��做如下的三个工作�Q?br />
1、导入所有需的commongs-logging�c�：(x��)

import org.apache.commons.logging.Log;

import org.apache.commons.logging.LogFactory;

2、在自己的类中定义一个org.apache.commons.logging.Log�cȝ��U�有静态类成员�Q?br />
private final Log log = LogFactory.getLog(getClass());

LogFactory.getLog()�Ҏ(gu��)��的参��C��用的是当前类的class�?br />
3、��用org.apache.commons.logging.Log�cȝ��成员�Ҏ(gu��)��输出日志信息�Q?br />
if (log.isDebugEnabled())

{

log.debug("111");

}

if (log.isInfoEnabled())

{

log.info("222");

}

if (log.isWarnEnabled())

{

log.warn("333");

}

if (log.isErrorEnabled())

{

log.error("444");

}

if (log.isFatalEnabled())

{

log.fatal("555")

}

dybjsun 2007-12-24 11:46 发表评论

dybjsun — Thu, 06 Dec 2007 01:33:00 GMT

软�g��试虽然辛苦�Q�但是掌握了一定的技巧之后将使你事半功倍�?br />
　　(1) 边界��试�Q�测试用戯��入框中的数值的最大数和最��数�Q�以�?qi��ng)��?f��)�I�时的情��c(di��n)�?br />
　　(2) 非法��试�Q�例如在输入数字的地方输入字母�?br />
　　(3) 跟踪��试�Q�跟�t�一条数据的��程,保证数据的正��性�?br />
　　(4) 在开始测试时应保证数据的正确性，然后在从�pȝ��中找出各�U�BUG�?br />
　　(5) 接口��试�Q�程序往往在接口的地方很容易发生错误，要在此模块测试勿掉以��d��?br />
　　(6) 代码重用��试�Q�在开发过�E�中有些模块功能几乎相同�Q�程序员在重用代码时可能忘记在原有代码上修改或修改不全面�Q�而造成的错误�?br />
　　(7) �H�发事�g��试�Q�服务器上可能发生意外情�늚��试�?br />
　　(8) 外界环境��试�Q�有些系�l�在开发时依赖于另外一个系�l?当另外一个系�l�发生错误时, �q�个�pȝ��所受到的媄(ji��ng)响的情况�?br />
　　(9) 在程序员刚修复Bug之后的地�?再找一找，往往�E�序员只修复报告出来的缺陯��(g��)�不去考虑别的功能在修�Ҏ(gu��)��可能�?x��)重新造成错误�?br />
　　(10) 认真做好��试记录在做完一天的��试记录之后,�W�二天再�Ҏ(gu��)��W�一天的��试记录重复��试你会(x��)发现有未修正的错误�?br />
　　(11) 文字��试�Q�如果在�pȝ��中有用词不当的地方，我想�q�是不应该的�?br />
　　(12) �pȝ��兼容��试�Q�例如有些程序在IE6能运行正常，到IE5下不能运行。有些程序在WIN2000下能�q�行�Q�而到WIN98却不能运行。像一些很特别的用户去使用�pȝ��Q�你很有可能发现BUG�?br />
　　(13) 用户的易用性测试，往往用户的需求是不断的变化的�Q�而其中的一部䆾变化的原因，是有用户操作上不方便引�v的�?br />
　　软�g��试是��Y件开发中的重中之重，没有一点可以马虎的�Q�在��目��理�q�程�Q�我��的是每个�q�程的每一个环节都要进行测试，保证�pȝ��在每个阶�D�可以控制。因��Y件测试中考虑的问题基本上是项目管理中考虑的问题�?br />
　　我认为在��目��理中考虑的一些问题应该是在��Y件测试时有些体现�Q�体现的内容是��Y件测试的一些侧重点�Q�具体说�Q��Y件测试是事务性的�Q�而项目管理是�{�略性，一些策略性的东西必须在一些事务性的事务上来实现�?br />
　　软�g��试是一门新兴的行业�Q�现在��Y件测试在我国的地位虽说还不是很高�Q�但�q�几�q�却是逐渐转好�Q�国内对软�g��试的重视程度也慢慢高�v来了。大家如果对IT有兴��的话，不烦(ch��)了解一下，�怿�也会(x��)有所感�?zh��n)�的。我��q��常在�|�上看一些��Y件测试方面的文章或技巧，�q�对我的成长也是具大的。大家有旉��不烦(ch��)��M��下北大测试的�|�站�Q�那里面��有很多软�g��试技巧和行业新闻�Q�对我启发很多�?img src ="http://www.tkk7.com/dybjsun/aggbug/165716.html" width = "1" height = "1" />

dybjsun 2007-12-06 09:33 发表评论

SESSION机制

dybjsun — Thu, 08 Nov 2007 17:45:00 GMT

摘要: 虽然session机制在web应用�E�序中被采用已经很长旉��了，但是仍然有很多�h不清楚session机制的本质，以至不能正确的应用这一技术。本文将详细讨论session的工作机制�ƈ且对在Java web application中应用session机制时常见的问题作出解答�?nbsp; 阅读全文

dybjsun 2007-11-09 01:45 发表评论

印度人是怎样开发��Y件的

dybjsun — Tue, 17 Oct 2006 17:54:00 GMT

摘要: 我在工作中，接触到印度��Y件公司开发出来的软�g�Q�整个体�p�L��构非常清晎ͼ�按照我们的要求实��C��全部功能�Q�而且相当�E�_��。但是打开具体的代码一看，拖沓冗长�Q�水�q�不咋样。我们自��q��一些程序员��有怪话了，说他们水�q�真低。但是！印度��够把软�g整体把握得很好，能够完成软�g�Q��ƈ得到相当好的设计文档。而中国�h在那里琢��数据结构、算法，界面人员��p��没编码就想着是Outlook式的�q�是VisualStudio式的界面。到最后就成�ؓ(f��)Code高手�Q�对某些特定的开发工��L(f��ng)��通，但是��是不能保证能够把一个��Y件稳当、完整的开发出来�?nbsp; 阅读全文

dybjsun 2006-10-18 01:54 发表评论

�?Linux 上安�?PostgreSQL

dybjsun — Fri, 13 Oct 2006 11:27:00 GMT

摘要: MySQL 是一条轻快的��v豚，但是�~�少很多��C��关系数据库应有的特色�Q�例如：(x��)引用完整性，视图�Q�触发器�{�。因此，如果你需要开发一个电(sh��)子商务的�|�站�Q�需要这些功能的话，你或许应该考虑 PostgreSQL 了。本文将通过其在 Red Hat 7.1 上安装过�E�，��要介�l�其用法�?nbsp; 阅读全文

dybjsun 2006-10-13 19:27 发表评论

dybjsun — Tue, 10 Oct 2006 01:24:00 GMT

摘要: 每一个Java应用都唯一对应一个JVM实例�Q�每一个实例唯一对应一个堆。应用程序在�q�行中所创徏的所有类实例或数�l�都攑֜��q�个堆中,�q�由应用所有的�U�程�׃�n.跟C/C++不同�Q�Java中分配堆内存是自动初始化的。Java中所有对象的存储�I�间都是在堆中分配的�Q�但是这个对象的引用却是在堆栈中分配,也就是说在徏立一个对象时从两个地斚w��分配内存�Q�在堆中分配的内存实际徏立这个对象，而在堆栈中分配的内存只是一个指向这个堆对象的指�?引用)而已�?nbsp; 阅读全文

dybjsun 2006-10-10 09:24 发表评论