這是最基礎的入門算法,屬于有監督學習,主要用途進行分類
流程
1:獲取樣本數據集(包括分類標簽和特征屬性值)
2:獲取待預測數據集的特征值,通過與樣本數據集的特征進行比較
3:然后算法提取樣本集中特征最相似數據的分類標簽
4:一般只提取樣本數據集中前K個最相似的數據分類標簽,這就是k-鄰近算法的出處,通常k是不大于20的整數
5:最后從K數據里面提取出現次數最多的分類標簽,作為待預測數據集的分類標簽,即完成實際分類業務
通俗說法
1:拿一堆水果
2:拿一個未知水果
3:根據未知水果的特征與每一種水果的特征進行比較
4:取出最相似的前K個水果,這個K通常是不大于20的整數
5:從這K個水果里面,提取出出現次數最多的水果A
6:把這個未知水果歸結為水果A
7:完成分類
posted on 2017-08-01 12:02
朔望魔刃 閱讀(150)
評論(0) 編輯 收藏 所屬分類:
python