<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    花花JAVA
    ____________花花之java寒舍
    posts - 10,comments - 4,trackbacks - 0
    數(shù)據(jù)挖掘技術實現(xiàn),可以根據(jù)它的工作過程分為:數(shù)據(jù)的抽取、數(shù)據(jù)的存儲和管理、數(shù)據(jù)的展現(xiàn)等關鍵技術。

    數(shù)據(jù)挖掘有6種分析方法:

            · 分類 (Classification)
      · 估值(Estimation)
      · 預言(Prediction)
      · 相關性分組或關聯(lián)規(guī)則(Affinity grouping or association rules)
      · 聚集(Clustering)
      · 描述和可視化(Description and Visualization)
      · 復雜數(shù)據(jù)類型挖掘(Text, Web ,圖形圖像,視頻,音頻等)
        *前3種屬于直接數(shù)據(jù)挖掘,后3種屬于間接數(shù)據(jù)挖掘

            · 分類 (Classification) 
                    首先從數(shù)據(jù)中選出已經分好類的訓練集,在該訓練集上運用數(shù)據(jù)挖掘分類的技術,建立分類模型,對于沒有分類的數(shù)據(jù)進行分類。
      例子:
      a. 信用卡申請者,分類為低、中、高風險
      b. 分配客戶到預先定義的客戶分片
      注意: 類的個數(shù)是確定的,預先定義好的 

             
         · 估值(Estimation)
                    估值與分類類似,不同之處在于,分類描述的是離散型變量的輸出,而估值處理連續(xù)值的輸出;分類的類別是確定數(shù)目的,估值的量是不確定的。
      例子:
      a. 根據(jù)購買模式,估計一個家庭的孩子個數(shù)
      b. 根據(jù)購買模式,估計一個家庭的收入
      c. 估計real estate的價值
      一般來說,估值可以作為分類的前一步工作。給定一些輸入數(shù)據(jù),通過估值,得到未知的連續(xù)變量的值,然后,根據(jù)預先設定的閾值,進行分類。例如:銀行對家庭貸款業(yè)務,運用估值,給各個客戶記分(Score 0~1)。然后,根據(jù)閾值,將貸款級別分類。     
                                               
         · 言(Prediction) 
                    通常,預言是通過分類或估值起作用的,也就是說,通過分類或估值得出模型,該模型用于對未知變量的預言。從這種意義上說,預言其實沒有必要分為一個單獨的類。預言其目的是對未來未知變量的預測,這種預測是需要時間來驗證的,即必須經過一定時間后,才知道預言準確性是多少。
                    
         · 相關性分組或關聯(lián)規(guī)則(Affinity grouping or association rules) 
                    決定哪些事情將一起發(fā)生。
      例子:
      a. 超市中客戶在購買A的同時,經常會購買B,即A => B(關聯(lián)規(guī)則)
      b. 客戶在購買A后,隔一段時間,會購買B (序列分析)
                    
         · 聚集(Clustering) 
                    聚集是對記錄分組,把相似的記錄在一個聚集里。聚集和分類的區(qū)別是聚集不依賴于預先定義好的類,不需要訓練集。
      例子:
      a. 一些特定癥狀的聚集可能預示了一個特定的疾病
      b. 租VCD類型不相似的客戶聚集,可能暗示成員屬于不同的亞文化群
      聚集通常作為數(shù)據(jù)挖掘的第一步。例如,"哪一種類的促銷對客戶響應最好?",對于這一 類問題,首先對整個客戶做聚集,將客戶分組在各自的聚集里,然后對每個不同的聚集,回答問題,可能效果更好。
                    
         · 描述和可視化(Description and Visualization) 
                    是對數(shù)據(jù)挖掘結果的表示方式。
                    
         · 復雜數(shù)據(jù)類型挖掘(Text, Web ,圖形圖像,視頻,音頻等)
                    
    posted on 2009-02-05 14:18 花-花 閱讀(748) 評論(0)  編輯  收藏 所屬分類: 數(shù)據(jù)挖掘(Data Mining)

    只有注冊用戶登錄后才能發(fā)表評論。


    網站導航:
     
    主站蜘蛛池模板: 亚洲欧洲日产国码久在线观看| 亚洲一级特黄无码片| 久久精品亚洲精品国产色婷 | 亚洲中文字幕无码久久精品1| 国产精品亚洲综合| 亚洲国产精品无码中文字| 一区二区三区在线免费观看视频| 免费夜色污私人影院在线观看| 日韩精品无码永久免费网站| 亚洲AⅤ视频一区二区三区| 久久九九免费高清视频| 亚洲成在人线av| 在线精品一卡乱码免费| 亚洲日韩久久综合中文字幕| 精品国产麻豆免费网站 | 一级做a爰片久久免费| 亚洲日韩精品一区二区三区无码| 日本免费A级毛一片| 亚洲美女色在线欧洲美女| 亚洲精品动漫免费二区| 国产精品亚洲综合| 久久亚洲AV午夜福利精品一区| 国产91色综合久久免费| 亚洲第一街区偷拍街拍| 国产成人毛片亚洲精品| 91福利视频免费| 色偷偷尼玛图亚洲综合| 亚洲αv在线精品糸列| 成人AV免费网址在线观看| 国产亚洲女在线线精品| 亚洲AV综合色一区二区三区| 啦啦啦高清视频在线观看免费| 污污污视频在线免费观看| 亚洲国产精品无码专区| 免费无码又爽又高潮视频| 国产无限免费观看黄网站| 亚洲人成在久久综合网站| 亚洲成a人片在线播放| 四虎成年永久免费网站 | 久久亚洲精品中文字幕| 免费人妻av无码专区|