摘要: 1 lucene簡介
1.1 什么是lucene
Lucene是一個全文搜索框架,而不是應(yīng)用產(chǎn)品。因此它并不像www.baidu.com 或者google Desktop那么拿來就能用,它只是提供了一種工具讓你能實(shí)現(xiàn)這些產(chǎn)品。
1.2 lucene能做什么
要回答這個問題,先要了解lucene的本質(zhì)。實(shí)際上lucene的功能很單一,說到底,就是你給它若干個字符串,然后它為你提供一個全文搜索服務(wù),告訴你你要搜索的關(guān)鍵詞出現(xiàn)在哪里。知道了這個本質(zhì),你就可以發(fā)揮想象做任何符合這個條件的事情了。你可以把站內(nèi)新聞都索引了,做個資料庫;你可以把一個數(shù)據(jù)庫表的若干個字段索引起來,那就不用再擔(dān)心因?yàn)椤?like%”而鎖表了;你也可以寫個自己的搜索引擎……
1.3 你該不該選擇lucene
下面給出一些測試數(shù)據(jù),如果你覺得可以接受,那么可以選擇。
測試一:250萬記錄,300M左右文本,生成索引380M左右,800線程下平均處理時間300ms。
測試二:37000記錄,索引數(shù)據(jù)庫中的兩個varchar字段,索引文件2.6
閱讀全文