Nutch 是基于 Lucene的。Lucene為 Nutch 提供了文本索引和搜索的API。一個(gè)常見(jiàn)的問(wèn)題是;我應(yīng)該使用Lucene還是Nutch?最簡(jiǎn)單的回答是:如果你不需要抓取數(shù)據(jù)的話,應(yīng)該使用Lucene。常見(jiàn)的應(yīng)用場(chǎng)合是:你有數(shù)據(jù)源,需要為這些數(shù)據(jù)提供一個(gè)搜索頁(yè)面。在這種情況下,最好的方式是直接從數(shù)據(jù)庫(kù)中取出數(shù)據(jù)并用Lucene API建立索引。Nutch 適用于你無(wú)法直接獲取數(shù)據(jù)庫(kù)中的網(wǎng)站,或者比較分散的數(shù)據(jù)源的情況下使用。
posted on 2009-09-18 22:48
壞男孩 閱讀(1243)
評(píng)論(1) 編輯 收藏 所屬分類:
搜索引擎