<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    bbmonkey62笨笨猴

    中文分詞

      BlogJava :: 首頁 :: 新隨筆 :: 聯(lián)系 :: 聚合  :: 管理 ::
      2 隨筆 :: 0 文章 :: 38 評論 :: 0 Trackbacks

    2009年4月17日 #

         摘要: 這款發(fā)布的淑珍分詞器版本是1.1.9,完全是基于字典分詞,在提供下載的壓縮包中含有編譯好的jar包和所有的源代碼,可以應(yīng)用于Lucene3.0版本及以上中。
    為了方便根據(jù)自己需要對分詞器進(jìn)行修改,我這里介紹一下淑珍分詞器的核心數(shù)據(jù)結(jié)構(gòu),這個數(shù)據(jù)結(jié)構(gòu)也是當(dāng)初我在寫分詞器的時候,為了解決詞庫條目多和索引速度之間的相互制約而想出來的。
    這個數(shù)據(jù)結(jié)構(gòu)就是將詞庫中的每一個條目以一種特定的結(jié)構(gòu)存儲在JDBM或內(nèi)存中,比如,對一個很常見的條目例子:“男女搭配干活不累”來舉例子,在這種數(shù)據(jù)結(jié)構(gòu)中,將被存儲為如下key-value鍵值對:  閱讀全文
    posted @ 2010-08-16 00:26 bbmonkey62笨笨猴 閱讀(1482) | 評論 (0)編輯 收藏

         摘要: 對于搜索引擎而言,如果是提供一個類似于Google那樣的web界面搜索的話,那對搜索結(jié)果進(jìn)行高亮顯示就很重要且必要了,不然將是非常不友好的,本篇文章就是介紹在lucene中應(yīng)用HighLighter時的一些方面;文章分兩部分,第一部分是介紹如何在lucene中應(yīng)用Highlighter進(jìn)行高亮顯示而不影響到搜索速度。第二部分則是對一些高亮錯誤現(xiàn)象進(jìn)行分析并給出解決方法,以及糾正對高亮錯誤存在的認(rèn)識誤區(qū)。總之,這篇文章就是希望能徹底解決在lucene中應(yīng)用高亮顯示所遇到的一切問題!另外淑珍分詞器也發(fā)布了新的版本ShuzhenAnalyzer-1.1.7,也給出了一個淑珍分詞器的演示地址
      閱讀全文
    posted @ 2009-04-17 00:49 bbmonkey62笨笨猴 閱讀(1876) | 評論 (3)編輯 收藏

    主站蜘蛛池模板: 无码专区AAAAAA免费视频| 免费高清资源黄网站在线观看| 久久综合亚洲色一区二区三区| 亚洲免费闲人蜜桃| 看Aⅴ免费毛片手机播放| 亚洲一区二区三区在线观看精品中文| 免费国产99久久久香蕉| 久久久久久亚洲精品影院| 亚洲区小说区图片区| 91精品全国免费观看含羞草| 色窝窝亚洲av网| 久久久久亚洲精品日久生情| 国产一级淫片a免费播放口之| 国产精成人品日日拍夜夜免费| 亚洲国产精品成人综合色在线| 久久91亚洲精品中文字幕| 国产美女精品视频免费观看| 国产精品偷伦视频观看免费| 国产精品亚洲专区无码WEB| 中文字幕亚洲色图| 国产福利电影一区二区三区,亚洲国模精品一区| 无码国产精品一区二区免费16| 黄色一级免费网站| 亚洲六月丁香婷婷综合| 日韩亚洲一区二区三区| 波多野结衣免费视频观看| 成人浮力影院免费看| 三年片免费高清版 | 国产亚洲情侣久久精品| 亚洲一区二区免费视频| 久久亚洲国产欧洲精品一| 又黄又大又爽免费视频| 免费精品一区二区三区在线观看| 午夜精品一区二区三区免费视频| 免费一区二区三区在线视频| 久久亚洲精品国产精品婷婷| 亚洲国产精品国自产电影| 中文字幕亚洲综合久久菠萝蜜| 永久久久免费浮力影院| 免费人成网站在线观看10分钟| 久久久久久影院久久久久免费精品国产小说|