<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    東北大學計算機應用技術研究所Web信息處理小組

    urrr... These guys do research ?!

    搜狗拼音輸入法研究

    輸入法是基于詞庫的,詞庫中除了詞條信息意外還有詞頻(也是最重要的了),詞頻表達用戶使用詞條概率,所以以概率解決問題較多。不管是包含多少種詞庫,詞頻信息必不可少,盡管有時還要對詞頻進行加權處理,如用戶詞庫的詞頻肯定不會像系統詞庫的詞頻那么高,將二者進行排序時不能直接利用現有詞頻,要加權處理。尤其在智能組詞那塊,要形成短語,短句,就要找到頻率最大的組句路徑,會有計算公式。

    將用戶需求進行分解:盡量覆蓋用戶的詞匯當然是好,但是隨之會產生問題,詞庫的臃腫化和計算的代價加大,就要剔除掉不必要的詞條信息了,可我們怎么知道哪些才是用戶需要的呢,通過獲取用戶輸入環境找到符合用戶需求的最小詞匯,才是王道。這樣詞庫構成基本分為系統共有詞庫+輔助詞庫,布局合理,其中后者是動態加載和更新的,很智能化。

    個性化:提高用戶體驗離不開個性化,適合大家的有可能適合自己,適合自己的不一定適合大家,個體之間存在差異,捕捉用戶的使用習慣,找到個性部分很重要,用戶詞庫,個性詞等技術基本解決部分問題。引用原文的話:“記錄用戶輸入的字詞,學習某個用戶適用的詞匯;通過一段時間地不斷學習,將詞庫逐漸收斂到某個用戶輸入的最佳狀態,從而形成用戶詞庫。通過動態調頻,使其逐漸適應該用戶,當用戶是唯一時,很好地提升效率”,很到位。

    策略問題:如搜狗輸入法有很多用戶,利用用戶的信息,反過來又回饋給用戶,這樣反復過程,最終要達到一個收斂平衡的狀態。

    資源的重要性:搜狗寶貴的東西是語料庫,各種想法實施的先決條件。

    詳細的PPT在:http://d.onto.ac.cn/wipt/sogou.zip(教育網服務器)

    (by 韓艷景)

    posted on 2009-05-11 08:42 wipt 閱讀(1865) 評論(2)  編輯  收藏

    Feedback

    # re: 搜索拼音輸入法研究[未登錄] 2009-05-11 10:25 whm

    我是第一個?。?!  回復  更多評論   

    # re: 搜索拼音輸入法研究[未登錄] 2009-05-11 10:50 kafka0102

    ding一個  回復  更多評論   


    只有注冊用戶登錄后才能發表評論。


    網站導航:
     
    主站蜘蛛池模板: 性色av极品无码专区亚洲| 精品亚洲国产成人| 国产精品亚洲二区在线| 成人午夜免费福利| 亚洲国产成人久久综合| 国产高清视频在线免费观看| 亚洲色偷偷综合亚洲av78 | 狠狠亚洲狠狠欧洲2019| 曰批免费视频播放免费| 中文字幕亚洲一区| 久久国产乱子精品免费女| 婷婷久久久亚洲欧洲日产国码AV| 99在线免费观看视频| 亚洲精品国产肉丝袜久久| 免费在线看v网址| 亚洲第一街区偷拍街拍| 亚洲福利在线播放| 国产羞羞的视频在线观看免费| 亚洲尹人九九大色香蕉网站| 又大又硬又爽又粗又快的视频免费| 亚洲香蕉在线观看| 免费国产精品视频| 四虎国产精品免费永久在线| 亚洲欧洲国产日韩精品| 97视频热人人精品免费| 色网站在线免费观看| 亚洲另类激情综合偷自拍| 99re热免费精品视频观看| 黄色一级视频免费| 亚洲一卡2卡三卡4卡有限公司| 动漫黄网站免费永久在线观看| 四虎国产精品成人免费久久 | 永久久久免费浮力影院| 一个人免费观看日本www视频| 久久久亚洲AV波多野结衣| 国产成人免费福利网站| 99精品视频免费观看| 理论亚洲区美一区二区三区| 亚洲熟妇av一区二区三区漫画| 永久免费AV无码国产网站| 成人a毛片免费视频观看|