<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    學海拾遺

    生活、技術、思想無處不在學習
    posts - 52, comments - 23, trackbacks - 0, articles - 3
      BlogJava :: 首頁 :: 新隨筆 :: 聯系 :: 聚合  :: 管理

    數據挖掘相關

    Posted on 2007-06-27 08:43 tanzek 閱讀(323) 評論(0)  編輯  收藏

    什么是規則?就是一個條件和一個結果的和:If condition then result。實際中有用的往往是結果中只有一個元素的情況。

    關聯規則(association rule)挖掘技術用于發現數據庫中屬性之間的有趣聯系。和傳統的產生式規則不同,關聯規則可以有一個或多個輸出,同時一個規則的輸出屬性可以是另一個規則的輸入屬性。關聯規則分析有時也叫購物籃分析,是因為它可以找尋出潛在的令人感興趣的所有的產品組合。由此,有限數目的屬性可能生成上百條規則。

    關聯規則的置信度支持度興趣度

    元組

    出現頻率

    A

    45%

    B

    42.5%

    C

    40%

    A和B

    25%

    A和C

    20%

    B和C

    15%

    A和B和C

    5%


    支持度:就是一個元組在整個數據庫中出現的概率。如上面的例子中S(A)=0.45

    置信度:它是針對規則而言的。對于一般的規則,它的可信度=p(condition and result)/p(condition)。例如有如下規則:If B and C then A。則它的置信度是:p(B and C and A)/p(B and C)=5%/15%=0.33

    提高率(或者叫興趣度):對于上面的一個規則,我們可以發現,當我們從從數據庫中直接取A的時候,概率是45%;可在我們的規則中,取到A的概率卻只有33.3%。顯然,這種情況是我們不愿意見到的,我們應該略去這樣的一些規則。所以我們引入了興趣度的概念,具體的公式如下:興趣度=p(condition and result)/p(condition)*p(result)。當興趣度大于1的時候,這條規則就是比較好的;當興趣度小于1的時候,這條規則就是沒有很大意義的。興趣度越大,規則的實際意義就越好。

    克服實際應用中數據量暴大的問題。當數據量增大時,要考慮的元素組就增長的很快了。

    關聯規則的優缺點:
    優點:
    ·它可以產生清晰有用的結果。
    ·它支持間接數據挖掘。
    ·可以處理變長的數據。
    ·它的計算的消耗量是可以預見的。

    缺點:
    ·當問題變大時,計算量增長得厲害。
    ·難以決定正確的數據。
    ·容易忽略稀有的數據。


    只有注冊用戶登錄后才能發表評論。


    網站導航:
     
    主站蜘蛛池模板: 亚洲理论片在线中文字幕| 亚洲成AV人片在线观看ww| 亚洲香蕉久久一区二区| 亚洲成人免费网站| 亚洲成a人不卡在线观看| 毛片免费全部播放无码| 亚洲人成网站日本片| 在线a级毛片免费视频| 亚洲国产精品久久久久秋霞小| 精品国产精品久久一区免费式| 蜜桃传媒一区二区亚洲AV | 精品一区二区三区免费视频| 久久久青草青青国产亚洲免观 | 久久久精品免费国产四虎| 亚洲一区二区三区四区在线观看| 一区二区三区四区免费视频| 亚洲福利一区二区| 午夜小视频免费观看| 日韩大片免费观看视频播放| 亚洲日韩欧洲无码av夜夜摸| 182tv免费观看在线视频| 亚洲香蕉久久一区二区| 亚洲AV无码一区二区三区国产 | 在线观看日本亚洲一区| 婷婷亚洲天堂影院| 久久青草免费91线频观看不卡 | 国产卡二卡三卡四卡免费网址| 亚洲综合色一区二区三区| 亚洲国产精品成人一区| 久久99热精品免费观看牛牛| 亚洲一区二区三区免费视频| 午夜亚洲国产成人不卡在线| 久久精品国产免费| 亚洲国产欧美一区二区三区| 亚洲人成精品久久久久| 好爽又高潮了毛片免费下载 | 亚洲av永久无码精品三区在线4| 国产色婷婷精品免费视频| 国产午夜精品免费一区二区三区| 亚洲人成免费网站| 国产成人亚洲综合无码精品 |