亚洲综合成人网在线观看,亚洲国产亚洲综合在线尤物,亚洲av无码片在线观看

在第一章中作者主要講了Lucene 是什么能用來干什么, 以及一個 indexing 和 searching 的例子, 通過例子講解了一點基本(核心)概念.給讀者一個基本的Lucene 概況. 然后又介紹了現在流行的搜索框架.

我們主要來看看這個 indexing and searching 例子然后了解一些基本概念.

package?lia.meetlucene; import?org.apache.lucene.index.IndexWriter; import?org.apache.lucene.analysis.standard.StandardAnalyzer; import?org.apache.lucene.document.Document; import?org.apache.lucene.document.Field; import?java.io.File; import?java.io.IOException; import?java.io.FileReader; import?java.util.Date; /** ?*?This?code?was?originally?written?for ?*?Erik's?Lucene?intro?java.net?article ?*/ public?class?Indexer?{ ??public?static?void?main(String[]?args)?throws?Exception?{ ????if?(args.length?!=?2)?{ ??????throw?new?Exception("Usage:?java?"?+?Indexer.class.getName() ????????+?"?<index?dir>?<data?dir>"); ????} ????File?indexDir?=?new?File(args[0]); // 在該目錄中創建Lucene Incex ????File?dataDir?=?new?File(args[1]); // 該目錄中存放備索引的文件 ????long?start?=?new?Date().getTime(); ????int?numIndexed?=?index(indexDir,?dataDir); ????long?end?=?new?Date().getTime(); ????System.out.println("Indexing?"?+?numIndexed?+?"?files?took?" ??????+?(end?-?start)?+?"?milliseconds"); ??} ??public?static?int?index(File?indexDir,?File?dataDir) ????throws?IOException?{ ????if?(!dataDir.exists()?||?!dataDir.isDirectory())?{ ??????throw?new?IOException(dataDir ????????+?"?does?not?exist?or?is?not?a?directory"); ????} ????IndexWriter?writer?=?new?IndexWriter(indexDir, ??????new?StandardAnalyzer(),?true);?????????????? //(1)創建 Lucene Index ????writer.setUseCompoundFile(false); ????indexDirectory(writer,?dataDir); ????int?numIndexed?=?writer.docCount(); ????writer.optimize(); ????writer.close();?????????????????????????????? // close index ????return?numIndexed; ??} ??private?static?void?indexDirectory(IndexWriter?writer,?File?dir) ????throws?IOException?{ ????File[]?files?=?dir.listFiles(); ????for?(int?i?=?0;?i?<?files.length;?i++)?{ ??????File?f?=?files[i]; ??????if?(f.isDirectory())?{ ????????indexDirectory(writer,?f);??//(2)?recurse ??????}?else?if?(f.getName().endsWith(".txt"))?{ ????????indexFile(writer,?f); ??????} ????} ??} ??private?static?void?indexFile(IndexWriter?writer,?File?f) ????throws?IOException?{ ????if?(f.isHidden()?||?!f.exists()?||?!f.canRead())?{ ??????return; ????} ????System.out.println("Indexing?"?+?f.getCanonicalPath()); ????Document?doc?=?new?Document(); ????doc.add(Field.Text("contents",?new?FileReader(f)));? // (3) index file content ????doc.add(Field.Keyword("filename",?f.getCanonicalPath())); // (4) index file name ????writer.addDocument(doc);?????????????????? //(5) add document in Lucene index ??} }

上面的Indexer 使用了幾行 Lucene的API, 來indexing 一個目錄下面的文件. 運行時候需要兩個參數 , 一個保存index的目錄和要索引的文件目錄.

在上面的類中,需要下面的一些Lucene classes 來執行 indexing 處理:

■

IndexWriter

■

Lucene In Action ch 1 筆記 -- 基本概念

導航

統計

常用鏈接

留言簿(5)

隨筆檔案

文章分類

文章檔案

java

工具

朋友

搜索

積分與排名

最新評論

閱讀排行榜

評論排行榜