<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    隨筆-95  評論-31  文章-10  trackbacks-0

    機器學習最常見用途:預測和分類

    機器學習常見分為兩種:

    1:有監督學習  -->  根據已經分類好的原始數據,訓練生成模型,通過模型再去預測未知的數據進行分類, 數學含義通俗解釋就是:我知道Y軸是什么,通過原始數據集(y=f(x)函數也可以是其它函數) 進行訓練生成模型后,代入X來求得Y軸數據。
    2:無監督學習  -->  并無分類好的原始數據,需要學習并提取分類,再進行訓練生成模型

    入門只看有監督學習

    流程:
    1:獲取原始數據集
    2:對每行數據的標簽即分類進行離散化或者數值化,也就是轉換成連續型數字或者0/1、true/false等離散化值,這里可能存在多類別問題即0,1,2,3,4,5.....多個類別
    3:提取特征值并離散化或者數值化
    4:根據類別對數據集進行有效劃分,這個劃分又有多種方式,按照信息熵變化來劃分(就是數據集變化前后的百分比,值越大表示混淆度越高)、按照比例進行有效劃分(這里是針對多類別劃分)即按照每種類別提取數據集再進行劃分訓練集和測試集,最終合并起來,
         這個時候數據分類劃分的比例就和原始數據比例是一樣的了。后面附上代碼
    5:根據業務(即是預測數值型還是預測離散型即類別),選取合適算法模型線性回歸、邏輯回歸、KNN(k-鄰近算法)、隨機森林、神經網絡等等。 線性回歸算法適合數值型預測、KNN、隨機森林、ID3、C4.5等算法適合分類也即離散型
    6:通過第4步的數據劃分和第3步的特征提取,調用模型來進行訓練、測試、預測,正確率越高,該模型越優
    7:對模型進行性能評估,提取模型參數
    8:調用matplotlib等圖庫,對模型參數進行可視化處理,以及特征值的權重大小展示
    9:調用模型,對新的數據集進行預測分類,即可完成實際業務問題

    整個流程結束


    posted on 2017-08-01 11:47 朔望魔刃 閱讀(298) 評論(0)  編輯  收藏 所屬分類: python

    只有注冊用戶登錄后才能發表評論。


    網站導航:
     
    主站蜘蛛池模板: xxxxx做受大片在线观看免费| 日本系列1页亚洲系列| 国产高潮流白浆喷水免费A片 | 青青青国产手机频在线免费观看| 亚洲国产成人影院播放| 黄色免费在线网址| 亚洲AV永久无码精品一区二区国产| 国产AV日韩A∨亚洲AV电影| 国产一级淫片免费播放电影| 国产偷国产偷亚洲高清人| 免费一看一级毛片人| 一区二区三区免费精品视频| 久久亚洲国产成人影院网站| 91视频精品全国免费观看| 亚洲短视频男人的影院| 两性刺激生活片免费视频| 亚洲色大成网站www久久九| 日本高清免费aaaaa大片视频| 精品韩国亚洲av无码不卡区 | 午夜影院免费观看| 久久久久亚洲AV无码麻豆| 成人免费大片免费观看网站| 亚洲色大成WWW亚洲女子| 四虎国产精品免费久久影院| 一个人免费观看www视频| 亚洲Av熟妇高潮30p| 亚洲人成网站免费播放| 曰批全过程免费视频免费看 | 成全高清视频免费观看| 国产精品亚洲二区在线| 亚洲乱码精品久久久久..| 亚洲免费在线视频观看| 亚洲风情亚Aⅴ在线发布| 亚洲宅男天堂在线观看无病毒| 精品无码国产污污污免费网站| 亚洲中文字幕久久精品无码A| 亚洲国产精品13p| 亚洲免费闲人蜜桃| 一级做a爰黑人又硬又粗免费看51社区国产精品视 | 国产偷国产偷亚洲高清在线| 亚洲AV电影院在线观看|