原文:::
http://wangfei4553693.blog.163.com/blog/static/270104772011451312819/
Lucene其實是一個提供全文文本搜索的函數庫,它不是一個應用軟件。它提供很多API函數讓你可以運用到各種實際應用程序中?,F在,它已經成為Apache的一個項目并被廣泛應用著。這里列出一些已經使用Lucene的系統。
Nutch 是一個建立在Lucene核心之上的Web搜索的實現,它是一個真正的應用程序。也就是說,你可以直接下載下來拿過來用。它在Lucene的基礎上加了網 絡爬蟲和一些和Web相關的東東。其目的就是想從一個簡單的站內索引和搜索推廣到全球網絡的搜索上,就像Google和Yahoo一樣。當然,和那些巨人 競爭,你得動一些腦筋,想一些辦法。我們已經測試過100M的網頁,并且它的設計用在超過1B的網頁上應該沒有問題。當然,讓它運行在一臺機器上,搜索一 些服務器,也運行的很好。
總的來說,我認為LUCENE會應用在本地服務器的網站內部搜索,而Nutch則擴展到整個網絡、Internet的檢索。當然LUCENE加上爬蟲程序等就會成為Nutch,這樣理解應該沒錯吧。
本文來自CSDN博客,轉載請標明出處:http://blog.csdn.net/rokii/archive/2008/03/01/2137450.aspx
簡單的說:
z Lucene 不是完整的應用程序,而是一個用于實現全文檢索的軟件庫。
z Nutch 是一個應用程序,可以以 Lucene 為基礎實現搜索引擎應用。
Lucene 為 Nutch 提供了文本索引和搜索的 API。一個常見的問題是;我應
該使用 Lucene 還是Nutch?最簡單的回答是:如果你不需要抓取數據的話,應該
使用Lucene。常見的應用場合是:你有數據源,需要為這些數據提供一個搜索頁
面。在這種情況下,最好的方式是直接從數據庫中取出數據并用 Lucene API 建立
索引。