国产天堂亚洲精品,午夜亚洲国产精品福利,亚洲av无码一区二区三区在线播放

IndexWriter writer = new IndexWriter(“/data/index/”, new StandardAnalyzer(), true);
Document doc = new Document();
doc.add(new Field("title", "lucene introduction", Field.Store.YES, Field.Index.TOKENIZED));
doc.add(new Field("content", "lucene works well", Field.Store.YES, Field.Index.TOKENIZED));
writer.addDocument(doc);
writer.optimize();
writer.close();

下面我們分析一下這段代碼。

首先我們創(chuàng)建了一個(gè)writer，并指定存放索引的目錄為“/data/index”，使用的分析器為StandardAnalyzer，第三個(gè)
參數(shù)說明如果已經(jīng)有索引文件在索引目錄下，我們將覆蓋它們。然后我們新建一個(gè)document。

　我們向document添加一個(gè)field，名字是“title”，內(nèi)容是“lucene introduction”，對它進(jìn)行存儲并索引。再添加一個(gè)名
字是“content”的field，內(nèi)容是“lucene works well”，也是存儲并索引。然后我們將這個(gè)文檔添加到索引中，如果有多個(gè)文
檔，可以重復(fù)上面的操作，創(chuàng)建document并添加。

添加完所有document，我們對索引進(jìn)行優(yōu)化，優(yōu)化主要是將多個(gè)segment合并到一個(gè)，有利于提高索引速度。隨后將
writer關(guān)閉，這點(diǎn)很重要。

如果你想把純文本文件索引起來，而不想自己將它們讀入字符串創(chuàng)建field，你可以用下面的代碼創(chuàng)建

field： Field field = new Field("content", new FileReader(file));

這里的file就是該文本文件。該構(gòu)造函數(shù)實(shí)際上是讀去文件內(nèi)容，并對其進(jìn)行索引，但不存儲。

posted on 2012-09-19 17:22 Nirvana reborn 閱讀(395) 評論(0) 編輯收藏所屬分類: ★搜索引擎

新用戶注冊刷新評論列表


只有注冊用戶登錄后才能發(fā)表評論。




網(wǎng)站導(dǎo)航: 博客園 IT新聞 Chat2DB C++博客博問管理

統(tǒng)計(jì)

公告

隨筆分類(19)

文章檔案(1)

博主鏈接

最新評論

閱讀排行榜

Lucene 學(xué)習(xí)第一天

導(dǎo)航