<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    sunfruit[請?jiān)L問http://www.fruitres.cn]

    --我相信JAVA能走得更遠(yuǎn) QQ:316228067

    全文檢索技術(shù)概述

    --sunfruit

    ??????? 最近做了一個(gè)資料管理軟件用來管理日常資料,編寫好了基本功能以后總是感覺這個(gè)軟件缺少了什么,是的,是全文檢索,沒有全文檢索功能,這個(gè)管理軟件用到最后也一定對于查找資料相當(dāng)困難,于是加緊趕工加上了作為基本功能的全文檢索。
    ??????? 有人了解檢索技術(shù),而且也不是什么高深技術(shù),我也不班門弄斧,就是把原理大概介紹一下,感興趣的朋友也可以自己嘗試編寫一下。
    ??????? 全文檢索技術(shù)其實(shí)就是用空間換時(shí)間--用硬盤空間換取檢索時(shí)間。
    ??????? 首先需要字索引,要想建立字索引就需要字庫,這個(gè)字庫其實(shí)就是每一個(gè)漢字,大概6000個(gè)漢字左右吧,再加上a-z,A-Z,0-9,基本上就可以作為字索引的字庫了,然后就是利用字庫生成字索引。
    ????????生成字索引的原來就是以字庫為基礎(chǔ),為字庫里面的每一個(gè)字做索引,在每一個(gè)文章里面做匹配,把一個(gè)文章里面所有的匹配的位置記錄下來,舉個(gè)例子:比如字庫里面的"啊",如果現(xiàn)在要建立"啊"的索引,那么要遍歷所有要做索引的文章,把所有的"啊"的位置要記錄下來,當(dāng)然要可以區(qū)分位置是哪個(gè)文章的,要不然混成一堆,就沒有意義了[因?yàn)樽詈髾z索索引的最終目的是要定位出文章的ID],這樣就形成了字索引。依此類推,所有漢字的字索引,索引建立就完成了
    ??????? 檢索索引,這個(gè)是關(guān)鍵的關(guān)鍵,速度是否快,全看這里,當(dāng)然索引建立的合理與否也能影響檢索速度,舉個(gè)例子:比如要查詢"業(yè)務(wù)"這個(gè)關(guān)鍵詞,
    ??????? 首先在字索引中查到"業(yè)": 在文件號11111 中的位置有11,40,99? 在文件號11112 中的位置有22,33,45
    ???????? 然后在字索引中查到"務(wù)": 在文件號11111 中的位置有12,66,100? 在文件號11112 中的位置有27,39,60

    ??????? 經(jīng)過計(jì)算會得到命中的文件號為 11111 ,因?yàn)闃I(yè)務(wù)必須位置號碼要連續(xù)的出現(xiàn)才算命中

    ??????? 大概的思路就是這樣
    ?????? 當(dāng)然檢索技術(shù)還會有詞索引技術(shù),根據(jù)字索引可以進(jìn)一步生成詞索引,并且有切詞技術(shù)。。。就不多說了
    ???????
    ??????? 那個(gè)資料管理軟件的DEMO下載地址 http://www.tkk7.com/sunfruit/archive/2006/04/01/38625.html
    ??????? DEMO的界面樣式如下
    ??????? 檢索界面
    ????????Shell00.jpg
    ??????? 主界面
    ????????Shell01.jpg

    ??????? 注意:使用全文檢索的時(shí)候,首先要生成索引[在工具菜單欄里面],并且不能重復(fù)生成同一個(gè)文章的索引,而只能重新生成,這個(gè)在生成的時(shí)候有選項(xiàng),因?yàn)槿绻貜?fù)生成那么在字索引里面就會重復(fù)記錄,到時(shí)候檢索的時(shí)候就會檢索出來多個(gè)同樣的文章了

    posted on 2006-04-05 00:20 sunfruit 閱讀(2555) 評論(2)  編輯  收藏 所屬分類: JAVA SE & EE

    評論

    # re: 全文檢索技術(shù)概述 2006-04-05 14:09 lizongbo



    為什么不用lucene呢?

    曾經(jīng)有過想用lucene做一個(gè)類似樓主的工具的程序。

    結(jié)果因?yàn)樘珣卸鴽]有做了:(


      回復(fù)  更多評論   

    # re: 全文檢索技術(shù)概述 2006-04-05 14:44 sun fruit

    自己嘗試一下檢索制作過程,原理上一樣

    lucene聽說過,一直沒有嘗試,這段時(shí)間也在看,吸取一些經(jīng)驗(yàn)  回復(fù)  更多評論   

    主站蜘蛛池模板: 亚洲精品无码成人片久久| 久久久受www免费人成| 国产免费啪嗒啪嗒视频看看| 一级毛片免费在线播放| 亚洲成AV人片天堂网无码| 无码精品A∨在线观看免费| 中文字幕亚洲综合久久综合| 亚洲国产一区视频| 99re6热视频精品免费观看| 亚洲av成人一区二区三区观看在线 | 亚洲精品无码成人片久久不卡 | 亚洲乱码一区av春药高潮| 免费国产综合视频在线看| 日本免费大黄在线观看| 亚洲av日韩精品久久久久久a| 亚洲国产精品无码专区在线观看| 免费电视剧在线观看| 两个人看的www免费视频| 亚洲中文字幕乱码一区| 亚洲AV永久无码区成人网站| 日韩中文无码有码免费视频 | 一区二区三区免费视频观看| 亚洲最大在线观看| av在线亚洲欧洲日产一区二区| 成人女人A级毛片免费软件| a级片免费观看视频| 亚洲GV天堂无码男同在线观看| 久久久亚洲欧洲日产国码aⅴ| 亚洲国产日韩成人综合天堂| 成人性生交大片免费看无遮挡| 99久久国产精品免费一区二区| 美女羞羞免费视频网站| 亚洲三级中文字幕| 久久精品国产亚洲AV麻豆不卡| 亚洲国产成人乱码精品女人久久久不卡 | 99免费在线视频| 黄色一级免费网站| 亚洲高清毛片一区二区| 亚洲最大在线观看| 亚洲高清中文字幕综合网| 好看的亚洲黄色经典|