<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    自由,平等,開源,分享

      BlogJava :: 首頁 :: 聯系 :: 聚合  :: 管理
      2 Posts :: 61 Stories :: 3 Comments :: 0 Trackbacks

      召回率(Recall Rate)(查全率):是檢索出的相關文檔數和文檔庫中所有的相關文檔數的比率,衡量的是檢索系統的查全率。
      精度(Precision)(查準率):是檢索出的相關文檔數與檢索出的文檔總數的比率,衡量的是檢索系統的查準率。

      對于一個檢索系統來講,召回率和精度不可能兩全其美:召回率高時,精度低,精度高時,召回率低。
      所以常常用 11 種召回率下 11 種精度的平均值來衡量一個檢索系統的精度。
      對于搜索引擎系統來講,因為沒有一個搜索引擎系統能夠搜集到所有的 Web 網頁,所以召回率很難計算。
      目前的搜索引擎系統都非常關心精度。

      影響一個搜索引擎系統的性能有很多因素,最主要的是信息檢索模型,包括文檔和查詢的表示方法、評價文檔和用戶查詢相關性的匹配策略、查詢結果的排序方法和用戶進行相關度反饋的機制。

      從一個大規模數據集合中檢索文檔的時,可把文檔分成四組:

        ※ 系統檢索到的相關文檔(A)
        ※ 系統檢索到的不相關文檔(B)
        ※ 相關但是系統沒有檢索到的文檔(C)
        ※ 相關但是被系統檢索到的文檔(D)

    相關 不相關
    檢索到 A B
    未檢索到 C D

      直觀的說,一個好的檢索系統檢索到的相關文檔越多越好,不相關文檔越少越好。

      召回率 R:用檢索到相關文檔數作為分子,所有相關文檔總數作為分母,即 R=A/(A+C)
      精度 P:用檢索到相關文檔數作為分子,所有檢索到的文檔總數作為分母,即 P=A/(A+B)

      舉例:一個數據庫有 500 個文檔,其中有 50 個文檔符合定義的問題;系統檢索到 75 個文檔,但其中只有 45 個文檔符合定義。

        召回率:R=45/50=90%。
        精度:P=45/75=60%。

      上例中:系統檢索是比較有效的,召回率為 90%;但是結果有很大的噪音,有近一半的檢索結果是不相關。

      研究表明:在不犧牲精度的情況下,獲得一個高召回率是很困難的;召回率越高,精度下降的很快,而且這種趨勢不是線性的。

    posted on 2008-05-08 09:22 龍震 閱讀(1540) 評論(0)  編輯  收藏 所屬分類: 概念,術語,基礎,理解
    主站蜘蛛池模板: 国产一级a毛一级a看免费人娇| 自拍偷自拍亚洲精品播放| 亚洲va精品中文字幕| 亚洲熟妇无码八V在线播放| 亚洲AV无码国产精品永久一区| 日韩免费在线中文字幕| 久久国产精品成人免费| 最新黄色免费网站| 日韩a级毛片免费观看| 在线观看亚洲精品福利片| 亚洲美女视频免费| 亚洲国产精品成人午夜在线观看| 皇色在线免费视频| 免费观看激色视频网站bd | 亚洲一区二区三区免费观看| 最近免费中文字幕4| 综合亚洲伊人午夜网| 亚洲午夜成激人情在线影院| 美国免费高清一级毛片| 国产精品免费观看调教网| 在线观看无码的免费网站| 亚洲自偷自偷偷色无码中文| 亚洲天堂一区二区三区四区| 美女黄网站人色视频免费| 日韩精品无码一区二区三区免费| 成人免费毛片观看| 久久精品亚洲视频| 亚洲AV无码一区二区三区鸳鸯影院| 国内精品免费视频精选在线观看 | 亚洲AV无码乱码在线观看| 无码专区—VA亚洲V天堂| 亚洲精品无播放器在线播放 | 日韩成人免费视频| 免费无码又爽又刺激高潮的视频| 亚洲男同帅GAY片在线观看| 在线观看亚洲AV日韩AV| 成人性做爰aaa片免费看| 老司机永久免费网站在线观看| 亚洲成AV人片在| 精品亚洲成a人在线观看| 亚洲视频在线免费播放|