摘要: 1 lucene簡介
1.1 什么是lucene
Lucene是一個全文搜索框架,而不是應用產品。因此它并不像www.baidu.com 或者google Desktop那么拿來就能用,它只是提供了一種工具讓你能實現這些產品。
1.2 lucene能做什么
要回答這個問題,先要了解lucene的本質。實際上lucene的功能很單一,說到底,就是你給它若干個字符串,然后它為你提供一個全文搜索服務,告訴你你要搜索的關鍵詞出現在哪里。知道了這個本質,你就可以發揮想象做任何符合這個條件的事情了。你可以把站內新聞都索引了,做個資料庫;你可以把一個數據庫表的若干個字段索引起來,那就不用再擔心因為“%like%”而鎖表了;你也可以寫個自己的搜索引擎……
1.3 你該不該選擇lucene
下面給出一些測試數據,如果你覺得可以接受,那么可以選擇。
測試一:250萬記錄,300M左右文本,生成索引380M左右,800線程下平均處理時間300ms。
測試二:37000記錄,索引數據庫中的兩個varchar字段,索引文件2.6
閱讀全文