<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    bbmonkey62笨笨猴

    中文分詞

      BlogJava :: 首頁 :: 新隨筆 :: 聯(lián)系 :: 聚合  :: 管理 ::
      2 隨筆 :: 0 文章 :: 38 評論 :: 0 Trackbacks

    我的評論

    re: 對搜索引擎同義詞支持的實驗, 分析模擬 bbmonkey62笨笨猴 2010-08-16 10:02  
    目前所有的搜索引擎都只是按關(guān)鍵詞查找內(nèi)容,最多也只是做了一些很簡單的處理,比如搜索:武大,可能會把武漢大學(xué)也搜索出來,但像你這篇文章中提到的,現(xiàn)在還沒有搜索引擎能做到。
    以后的搜索引擎可能會在智能程度提高,但難度也是非常大的。
    寫得很好
    請在2009-04-17下午5點35分以前下過1.1.6版本的朋友們再重新下一遍,由于我之前測試得不夠嚴(yán)密,5點35分以前的1.1.6版本在對搜索詞進(jìn)行處理(segmentKeyExact(key)和segmentKeyFuzzy(key))時,當(dāng)搜索詞是某種組合的時候會導(dǎo)致比較嚴(yán)重的錯誤,其他功能沒有發(fā)現(xiàn)問題,非常抱歉,敬請諒解
    @mrzhu
    在建立索引時,lucene是支持索引非文本數(shù)據(jù)的,我不知道你在索引的時候是怎么用的,但我建議你去看如下內(nèi)容:
    在org.apache.lucene.document.Field里的構(gòu)造方法:
    public Field(String name, byte[] value, Store store)
    請留意第二個參數(shù),在建立索引的時候允許非文本的字符,比如大文件類型轉(zhuǎn)換為byte[]型索引起來,然后你取的時候再做相應(yīng)的轉(zhuǎn)換

    我沒做測試,你可以去測試下是否可行,我覺得是可以的。。。
    主站蜘蛛池模板: 91久久精品国产免费直播| 日韩免费高清大片在线| 四虎影在线永久免费观看| 亚洲一线产品二线产品| 成全视频免费高清| 亚洲精品天堂无码中文字幕| 18禁超污无遮挡无码免费网站国产| 亚洲成人黄色网址| 最近免费中文字幕大全视频| 伊人久久五月丁香综合中文亚洲| 24小时日本在线www免费的| 亚洲免费网站观看视频| 日韩成全视频观看免费观看高清| 国产精品亚洲二区在线| 国产亚洲情侣一区二区无码AV| 99精品全国免费观看视频..| 亚洲大成色www永久网站| 8x8×在线永久免费视频| 亚洲乱码在线卡一卡二卡新区| 在线免费一区二区| 免费人成网上在线观看| 亚洲精品无码午夜福利中文字幕 | 亚洲色大成网站www永久一区| 四虎国产精品免费永久在线| 久久精品国产亚洲AV大全| 国产在线观看免费观看不卡| 亚洲av无码一区二区三区四区| 免费a级毛片网站| 免费国产在线视频| 亚洲色图激情文学| 亚洲国产日韩成人综合天堂| 日韩精品在线免费观看| 亚洲夂夂婷婷色拍WW47| 国产精品亚洲二区在线观看| 84pao强力永久免费高清| 亚洲欧美日韩中文二区| 亚洲精品午夜国产VA久久成人| 毛片高清视频在线看免费观看| 乱爱性全过程免费视频| 亚洲导航深夜福利| 亚洲无码黄色网址|