這是最基礎(chǔ)的入門算法,屬于有監(jiān)督學(xué)習(xí),主要用途進(jìn)行分類
流程
1:獲取樣本數(shù)據(jù)集(包括分類標(biāo)簽和特征屬性值)
2:獲取待預(yù)測數(shù)據(jù)集的特征值,通過與樣本數(shù)據(jù)集的特征進(jìn)行比較
3:然后算法提取樣本集中特征最相似數(shù)據(jù)的分類標(biāo)簽
4:一般只提取樣本數(shù)據(jù)集中前K個(gè)最相似的數(shù)據(jù)分類標(biāo)簽,這就是k-鄰近算法的出處,通常k是不大于20的整數(shù)
5:最后從K數(shù)據(jù)里面提取出現(xiàn)次數(shù)最多的分類標(biāo)簽,作為待預(yù)測數(shù)據(jù)集的分類標(biāo)簽,即完成實(shí)際分類業(yè)務(wù)
通俗說法
1:拿一堆水果
2:拿一個(gè)未知水果
3:根據(jù)未知水果的特征與每一種水果的特征進(jìn)行比較
4:取出最相似的前K個(gè)水果,這個(gè)K通常是不大于20的整數(shù)
5:從這K個(gè)水果里面,提取出出現(xiàn)次數(shù)最多的水果A
6:把這個(gè)未知水果歸結(jié)為水果A
7:完成分類
posted on 2017-08-01 12:02
朔望魔刃 閱讀(158)
評(píng)論(0) 編輯 收藏 所屬分類:
python