使用SQL?SERVER?2000的全文檢索功能?
?
步驟:
1、??打開NorthWind數(shù)據(jù)庫,右鍵Products表,選擇“全文索引表”,“在表上定義全文索引”,為其創(chuàng)建全文目錄。在“全文索引向?qū)А敝校x擇你需要全文查詢條件的列(可以是文本或圖像),我們選擇Productname和QuantityPerUnit列。然后下一步,輸入一個新的目錄proCatalog,點擊下一步。在填充調(diào)度一項里,我們暫時不建立填充調(diào)度。接著“下一步”,全成全文索引向?qū)АM瓿珊螅覀兛梢钥吹皆凇叭哪夸洝崩铮嗔艘粋€全文目錄proCatalog。右鍵proCatalog屬性,可以看到其狀態(tài)、表、調(diào)度情況。
2、??右鍵全文目錄proCatalog,?“啟動完全填充”,系統(tǒng)會出現(xiàn)“全文目錄填充成功啟動”。
3、??這時,我們可以使用Transact-SQL進行全文檢索了,我們使用CONTAINS、FREETEXT等謂詞。如:
檢索ProductName中,即包含b又包含c的所有列
SELECT?*
FROM?Products
WHERE?CONTAINS(ProductName,?'"c*"?and?"b*"?')
?
檢索ProductName中,即包含chai?chang?tofu之一的所有列
SELECT?*
FROM?Products
WHERE?FREETEXT(ProductName,?'chai?chang?tofu?')
?
我們還可以使用CONTAINSTABLE、FREETEXTTABLE等
?
4、??我們可以用.NET創(chuàng)建WEB或Form客戶端,提供一個良好的全文檢索界面,使自己的應用程序得到擴展
?
?
?
參考:
全文查詢有關的系統(tǒng)存儲過程
(1)啟動數(shù)據(jù)庫的全文處理功能(sp_fulltext_datebase);?
(2)建立全文目錄(sp_fulltext_catalog);?
(3)在全文目錄中注冊需要全文索引的表(sp_fulltext_table);?
(4)指出表中需要全文檢索的列名(sp_fulltext_column)?
(5)為表創(chuàng)建全文索引(sp_fulltext_table);?
(6)填充全文索引(sp_fulltext_catalog)。
?
?
?
全文查詢支持
Microsoft®?SQL?Server™?2000?在接收帶全文構造的?Transact-SQL?語句時,使用全文提供程序從?Microsoft?搜索服務檢索所需信息。全文構造是?CONTAINS?或?FREETEXT?謂詞,或者是?CONTAINSTABLE?或?FREETEXTTABLE?行集函數(shù)。如果不知道包含搜索條件的列,全文構造可以在全文索引中引用多列。該進程的流程如下圖所示。
?
這一進程涉及的步驟包括:?
應用程序給?SQL?Server?實例發(fā)送帶全文構造的?Transact-SQL?語句。
SQL?Server?關系引擎通過查詢系統(tǒng)表驗證全文構造,確定全文索引是否覆蓋列引用。關系引擎將每個?SQL?語句簡化為一系列行集操作,并使用?OLE?DB?將這些操作傳遞給基礎組件,通常是存儲引擎。關系引擎通過全文提供程序而不是存儲引擎,將任何全文構造轉換成對行集的請求。請求的行集是滿足搜索條件和等級的鍵集,而這個等級表示每個鍵的數(shù)據(jù)滿足搜索條件的程度。向全文提供程序發(fā)送的行集請求命令包括全文檢索條件。
全文提供程序驗證請求并將搜索條件更改為由Microsoft?搜索服務的查詢支持組件使用的形式。將請求發(fā)送到搜索服務。
查詢支持組件使用搜索引擎組件從全文索引析取所請求的數(shù)據(jù)。然后以行集的形式將這些數(shù)據(jù)傳遞回全文提供程序。
全文提供程序?qū)⑦@個行集返回給關系引擎。
關系引擎將它從存儲引擎和全文提供程序收到的所有行集進行組合,以生成發(fā)送回客戶端的最終結果集。?
?
全文目錄和索引
Microsoft®?SQL?Server™?2000?全文索引為在字符串數(shù)據(jù)中進行復雜的詞搜索提供有效支持。全文索引存儲關于重要詞和這些詞在特定列中的位置的信息。全文查詢利用這些信息,可快速搜索包含具體某個詞或一組詞的行。
全文索引包含在全文目錄中。每個數(shù)據(jù)庫可以包含一個或多個全文目錄。一個目錄不能屬于多個數(shù)據(jù)庫,而每個目錄可以包含一個或多個表的全文索引。一個表只能有一個全文索引,因此每個有全文索引的表只屬于一個全文目錄。
全文目錄和索引不存儲在它們所屬的數(shù)據(jù)庫中。目錄和索引由?Microsoft?搜索服務分開管理。
全文索引必須在基表上定義,而不能在視圖、系統(tǒng)表或臨時表上定義。?全文索引的定義包括:?
能唯一標識表中各行的列(主鍵或候選鍵),而且不允許?NULL?值。
索引所覆蓋的一個或多個字符串列。?
全文索引由鍵值填充。每個鍵的項提供與該鍵相關聯(lián)的重要詞(干擾詞或終止詞除外)、它們所在的列和它們在列中的位置等有關信息。
格式化文本字符串(如?Microsoft®?Word™?文檔文件或?HTML?文件)不能存儲在字符串或?Unicode?列中,因為這些文件中的許多字節(jié)包含不構成有效字符的數(shù)據(jù)結構。數(shù)據(jù)庫應用程序可能仍需要訪問這些數(shù)據(jù)并對其應用全文檢索。因為?image?列并不要求每一字節(jié)都構成一個有效字符,所以許多站點將這類數(shù)據(jù)存儲在?image?列中。SQL?Server?2000?引入了對存儲在?image?列中的這些類型的數(shù)據(jù)執(zhí)行全文檢索的能力。SQL?Server?2000?提供篩選,可從?Microsoft?Office™?文件(.doc、.xls?和?.ppt?文件)、文本文件(.txt?文件)及?HTML?文件(.htm?文件)中析取文本化數(shù)據(jù)。設計表時除包括保存數(shù)據(jù)的?image?列外,還需包括綁定列來保存存儲在?image?列中的數(shù)據(jù)格式的文件擴展名。可以創(chuàng)建引用?image?列和綁定列的全文索引,以便在存儲于?image?列中的文本化信息上啟用全文檢索。SQL?Server?2000?全文檢索引擎使用綁定列中的文件擴展名信息,選擇從列中析取文本化數(shù)據(jù)的合適的篩選。
全文索引是用于執(zhí)行兩個?Transact-SQL?謂詞的組件,以便根據(jù)全文檢索條件對行進行測試:?
CONTAINS
FREETEXT?
Transact-SQL?還包含兩個返回符合全文檢索條件的行集的函數(shù):?
CONTAINSTABLE
FREETEXTTABLE?
SQL?Server?在內(nèi)部將搜索條件發(fā)送給?Microsoft?搜索服務。Microsoft?搜索服務查找所有符合全文檢索條件的鍵并將它們返回給?SQL?Server。SQL?Server?隨后使用鍵的列表來確定表中要處理的行。
全文索引
對?Microsoft®?SQL?Server™?2000?數(shù)據(jù)的全文支持涉及兩個功能:對字符數(shù)據(jù)發(fā)出查詢的能力和創(chuàng)建及維護基礎索引以簡化這些查詢的能力。
全文索引在許多地方與普通的?SQL?索引不同。
普通?SQL?索引
?全文索引
?
存儲時受定義它們所在的數(shù)據(jù)庫的控制。
?存儲在文件系統(tǒng)中,但通過數(shù)據(jù)庫管理。
?
每個表允許有若干個普通索引。
?每個表只允許有一個全文索引。
?
當對作為其基礎的數(shù)據(jù)進行插入、更新或刪除時,它們自動更新。
?將數(shù)據(jù)添加到全文索引稱為填充,全文索引可通過調(diào)度或特定請求來請求,也可以在添加新數(shù)據(jù)時自動發(fā)生。
?
不分組。
?在同一個數(shù)據(jù)庫內(nèi)分組為一個或多個全文目錄。
?
使用?SQL?Server?企業(yè)管理器、向?qū)Щ?Transact-SQL?語句創(chuàng)建和除去。
?使用?SQL?Server?企業(yè)管理器、向?qū)Щ虼鎯^程創(chuàng)建、管理和除去。
?
?
這些差異使大量管理任務變得不可缺少。全文管理是在幾個層次上實施的:?
服務器?
可以對服務器范圍的某些屬性(如?resource_usage)加以設置,以便增加或減少全文服務所使用的系統(tǒng)資源數(shù)量。
說明??全文引擎作為名為?Microsoft?搜索的服務在?Microsoft?Windows?NT®?Server?和?Microsoft?Windows®?2000?Server?上運行。對于?Microsoft?SQL?Server?個人版,Microsoft?搜索服務不可用。盡管這意味著?Microsoft?搜索服務既未安裝在?Microsoft?Windows?95/98?上,也未安裝在?Windows?NT?工作站或?Windows?2000?Professional?客戶端上,但這些客戶端在連接到?SQL?Server?標準版安裝或企業(yè)版實例時可以使用這項服務。
數(shù)據(jù)庫?
必須啟用數(shù)據(jù)庫才能使用全文服務。可以在已啟用的數(shù)據(jù)庫中創(chuàng)建和除去一個或多個全文目錄的元數(shù)據(jù)。
全文目錄?
全文目錄包含數(shù)據(jù)庫中的全文索引。每個目錄可以用于數(shù)據(jù)庫內(nèi)的一個或多個表的索引需求。該目錄中的索引是使用這里介紹的管理功能來填充的。(全文目錄必須駐留在與?SQL?Server?實例相關聯(lián)的本地硬盤驅(qū)動器上。不支持可移動的驅(qū)動器、軟盤和網(wǎng)絡驅(qū)動器)。在每個服務器上最多可創(chuàng)建?256?個全文目錄。
說明??Windows?NT?故障轉移群集環(huán)境完全支持全文索引。有關更多信息,請參見在故障轉移群集中運行全文查詢。
表?
首先,必須為全文支持啟用表。然后,為與該表相關聯(lián)的全文索引創(chuàng)建元數(shù)據(jù)(如表名及其全文目錄)。表啟用后,可以用為全文支持而啟用的列中的數(shù)據(jù)填充它。如果表的全文定義被更改(例如,添加一個也將為全文檢索而索引的新列),則必須重新填充相關的全文目錄以使全文索引與新的全文定義同步。
列?
可以從非活動的注冊表中添加或除去支持全文查詢的列。
在所有這些級別上,可使用工具檢索元數(shù)據(jù)和狀態(tài)信息。
和常規(guī)?SQL?索引一樣,當在相關表中修改數(shù)據(jù)時,可自動更新全文索引。或者,也可以適當?shù)拈g隔手工重新填充全文索引。這種重寫可能既耗時又大量占用資源,因此,在數(shù)據(jù)庫活動較少時,這通常是在后臺運行的異步進程。
應將具有相同更新特性的表(如更改少的與更改多的,或在一天的特定時段內(nèi)頻繁更改的表)組合在一起,并分配給相同的全文目錄。通過以此方法設置全文目錄填充調(diào)度,使得全文索引和表保持同步,且在數(shù)據(jù)庫活動較多時不對數(shù)據(jù)庫服務器的資源使用產(chǎn)生負面影響。
為全文目錄中的表安排全文索引的位置是非常重要的。在為全文目錄指定表時,應該注意下列基本原則:?
始終選擇可用于全文唯一鍵的最小唯一索引。(4?個字節(jié)且基于整數(shù)的索引是最佳的。)這將顯著減少文件系統(tǒng)中?Microsoft?搜索服務所需要的資源。如果主鍵很大(超過?100?字節(jié)),可以考慮選擇表中其它唯一索引(或創(chuàng)建另一個唯一索引)作為全文唯一鍵。否則,如果全文唯一鍵的大小達到允許的上限(450?字節(jié)),全文填充將無法繼續(xù)進行。
如果進行索引的表有成千上萬行,請將該表指定給其自己的全文目錄。
應該考慮對其進行全文索引的表中發(fā)生的更改數(shù)以及表的行數(shù)。如果要更改的總行數(shù),加上上次全文填充期間表中出現(xiàn)的行數(shù)達到成千上萬行,請將該表指定給其自己的全文目錄。?
請參見
sp_fulltext_table
CONTAINS
一個謂詞,用于搜索包含基于字符的數(shù)據(jù)類型的列,該列與單個詞和短語,以及與另一個詞一定范圍之內(nèi)的近似詞精確或模糊(不太精確的)匹配或者加權匹配。CONTAINS?可以搜索:?
詞或短語。
詞或短語的前綴。
另一個詞附近的詞。
由另一個詞的詞尾變化生成的詞(例如,詞?drive?是?drives、drove、driving?和?driven?詞尾變化的詞干)。
比另一個詞具有更高加權的詞。?
語法
CONTAINS
????(?{?column?|?*?}?,?'<?contains_search_condition?>'?????

?
?
FREETEXT
是個謂詞,用于搜索含有基于字符的數(shù)據(jù)類型的列,其中的值符合在搜索條件中所指定文本的含義,但不符合表達方式。使用?FREETEXT?時,全文查詢引擎內(nèi)部將?freetext_string?拆分為若干個搜索詞,并賦予每個詞以不同的加權,然后查找匹配。
語法
FREETEXT?(?{?column?|?*?}?,?'freetext_string'?

?
CONTAINSTABLE?和?FREETEXTTABLE?函數(shù)用來指定返回每行的相對排名的全文查詢。這兩個函數(shù)與全文謂詞?CONTAINS?和?FREETEXT?很相似,但是用法不同。
(此文部分資料來自MSDN)