<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    無為

    無為則可為,無為則至深!

      BlogJava :: 首頁 :: 聯系 :: 聚合  :: 管理
      190 Posts :: 291 Stories :: 258 Comments :: 0 Trackbacks

    分類器的定義:輸入的數據含有千萬個記錄,每個記錄又有很多個屬性,其中有一個特別的屬性叫做類(例如信用程度的高,中,低)。分類器的目的就是分析輸入的數據,并建立一個模型,并用這個模型對未來的數據進行分類,應用于信用確認,醫療診斷等。

    運用在決策樹上的分類器&#0;&#0; SLIQ

    一:樹的建立。

      1. 預分類:為訓練集中的每個屬性建立一個屬性表,每個屬性表包含屬性值和索引,每個索引對應一個記錄,而特殊的屬性&#0;&#0;類中還包含枝節點。

      2. 節點的分割過程:
    a, 選取哪個屬性來分割。 b, 對于選取的屬性,確定分割標準。在 SLIQ 里采用的是 gini 分割系數的方法。具體到每個 node 的分割又包括矩形類圖的的更新和類表的更新。

  • 以上介紹的是連續值的屬性的分割方法,對于分類屬性的值(例如地區屬性):
  • S 代表 A 所有可能的值的集合(有 2 n 次方個), S’ S 的子集。如果 n 小于某個門限時,就對每個 S’ 都估算一遍,否則就采用一種叫做 greedy algorithrm 的方法。

    二:樹的修剪。

    SLIQ 采用了 MDL (最小敘述長度)的方法來修剪樹。

    COST(M,D)=COST(D|M)+COST(M);

    COST(D|M)

    是指對于 Data 的編碼的“費用”,定義為分類器錯誤個數的總和。

    COST(M)

    包含兩部分:

    a,

    樹的編碼的“費用”,有 code1 code2 code3 三種。 

    b,

    分割方法的編碼的“費用”。有連續值屬性的(每一個判斷定為 L(test)=1 )和分類屬性( L(test)=lnAi, 其中樹中所有采用類屬性分割的方法的總和)的兩種。

    上述公式又可分成四種情況:

    如果該節點是一個葉子,

    Cleaf(t)= L(t)+Errorst;

    如果該節點有兩個孩子,

    Cboth(t)=L(t)+Ltest+C(t1)+C(t2);

    如果該節點只有左邊有一個孩子,

    Cleft(t)=L(t)+Ltest+C(t1)+C’(t2);

    如果該節點只有右邊有一個孩子,

    Cright(t)=L(t)+Ltest+C’(t1)+C(t2);

    這里

    C’ ti )指的是:被修剪了的那個枝里的記錄用母節點里的統計方法來編碼所用的“費 用”。

    根據上面的敘述,可以采用三種策略來進行修剪。

    1. Full:
    2. 采用這種方法,只是考慮第一和第二種情況,也就是如果 Cleaf 計算下來比 Cboth 小的話就將這個節點變為一片葉子。這樣樹的編碼“費用”里就只用了一個比特。

    3. Partial:
    4. 這種方法將四種情況都考慮了進去,比較四種計算“費用”的大小,選擇“費用”最小的那種作為修剪的方法。

      3, Hybrid

      (混合的) : 這種方法包含兩個過程,第一步先用 Full 的策略來得到一個比較小的 樹,然后再考慮后三種的計算方法來修剪樹。

      三:綜述:

      SLIQ 采用了 Pre-sorting,breadth-first MDL 的方法來建立和修剪決策樹,它能夠對大量的數據進行處理,突破了傳統分類器的只能處理 700KB 數據的瓶頸。

      凡是有該標志的文章,都是該blog博主Caoer(草兒)原創,凡是索引、收藏
      、轉載請注明來處和原文作者。非常感謝。

      posted on 2006-06-10 14:04 草兒 閱讀(315) 評論(0)  編輯  收藏 所屬分類: BI and DM
      主站蜘蛛池模板: 深夜福利在线视频免费| 久久国产精品免费看| 久久久久国产成人精品亚洲午夜| 香蕉视频在线免费看| 亚洲欧洲精品一区二区三区| 免费无码成人AV片在线在线播放| v片免费在线观看| 亚洲国产模特在线播放| 亚洲人成色7777在线观看不卡| 99久久免费看国产精品| 美女被羞羞网站免费下载| 亚洲AV无码码潮喷在线观看| 成人免费毛片内射美女APP| 中文字幕免费在线看电影大全| 亚洲激情视频网站| 亚洲一级片免费看| 日韩av无码成人无码免费| 三年片免费高清版| 亚洲AV女人18毛片水真多| 久久精品亚洲一区二区三区浴池| 免费观看国产精品| 美女视频黄是免费的网址| 一级特黄录像免费播放肥| 亚洲hairy多毛pics大全| 91亚洲精品视频| 中文字幕亚洲日本岛国片| 四虎在线视频免费观看| 四虎影视成人永久免费观看视频| 免费国产在线精品一区| 亚洲国产成人手机在线电影bd| 亚洲AV永久青草无码精品| 免费播放春色aⅴ视频| 成熟女人特级毛片www免费| 84pao国产成视频免费播放| 中文字幕不卡免费高清视频| 亚洲日韩在线中文字幕综合| va天堂va亚洲va影视中文字幕| 久久亚洲国产中v天仙www| 亚洲国产婷婷综合在线精品| 日本特黄a级高清免费大片| 97在线观免费视频观看|