中文字幕亚洲男人的天堂网络 ,国产午夜亚洲精品理论片不卡,精品亚洲成a人片在线观看少妇

搜狗拼音輸入法研究

輸入法是基于詞庫的，詞庫中除了詞條信息意外還有詞頻（也是最重要的了），詞頻表達用戶使用詞條概率，所以以概率解決問題較多。不管是包含多少種詞庫，詞頻信息必不可少，盡管有時還要對詞頻進行加權處理，如用戶詞庫的詞頻肯定不會像系統詞庫的詞頻那么高，將二者進行排序時不能直接利用現有詞頻，要加權處理。尤其在智能組詞那塊，要形成短語，短句，就要找到頻率最大的組句路徑，會有計算公式。

將用戶需求進行分解：盡量覆蓋用戶的詞匯當然是好，但是隨之會產生問題，詞庫的臃腫化和計算的代價加大，就要剔除掉不必要的詞條信息了，可我們怎么知道哪些才是用戶需要的呢，通過獲取用戶輸入環境找到符合用戶需求的最小詞匯，才是王道。這樣詞庫構成基本分為系統共有詞庫+輔助詞庫，布局合理，其中后者是動態加載和更新的，很智能化。

個性化：提高用戶體驗離不開個性化，適合大家的有可能適合自己，適合自己的不一定適合大家，個體之間存在差異，捕捉用戶的使用習慣，找到個性部分很重要，用戶詞庫，個性詞等技術基本解決部分問題。引用原文的話：“記錄用戶輸入的字詞，學習某個用戶適用的詞匯；通過一段時間地不斷學習，將詞庫逐漸收斂到某個用戶輸入的最佳狀態，從而形成用戶詞庫。通過動態調頻，使其逐漸適應該用戶，當用戶是唯一時，很好地提升效率”，很到位。

策略問題：如搜狗輸入法有很多用戶，利用用戶的信息，反過來又回饋給用戶，這樣反復過程，最終要達到一個收斂平衡的狀態。

資源的重要性：搜狗寶貴的東西是語料庫，各種想法實施的先決條件。

詳細的PPT在：http://d.onto.ac.cn/wipt/sogou.zip（教育網服務器）

(by 韓艷景)

posted on 2009-05-11 08:42 wipt 閱讀(1865) 評論(2) 編輯收藏

Feedback

# re: 搜索拼音輸入法研究[未登錄] 2009-05-11 10:25 whm

我是第一個?。?！回復更多評論

# re: 搜索拼音輸入法研究[未登錄] 2009-05-11 10:50 kafka0102

ding一個回復更多評論

新用戶注冊刷新評論列表


只有注冊用戶登錄后才能發表評論。




網站導航: 博客園 IT新聞 Chat2DB C++博客博問管理

東北大學計算機應用技術研究所Web信息處理小組

搜狗拼音輸入法研究

Feedback

# re: 搜索拼音輸入法研究[未登錄] 2009-05-11 10:25 whm

# re: 搜索拼音輸入法研究[未登錄] 2009-05-11 10:50 kafka0102

My Links

Blog Stats

常用鏈接

留言簿(2)

隨筆檔案(2)

最新隨筆

搜索

最新評論

閱讀排行榜

評論排行榜