在第一章的Collective Intelligence的介紹中,作者通過Netflix和google兩個公司的例子來說明了Collective Intelligence的應(yīng)用.但具體Collective Intelligence的定義到底是什么呢?作者并沒有明確給出,所以我在讀書筆記中也就直接用這兩個單詞了.
這本書將會告訴讀者,通過一些API,應(yīng)用機器學(xué)習(xí)算法和統(tǒng)計方法來收集數(shù)據(jù)的一些方法.那么什么是機器學(xué)習(xí)呢?這個概念我倒是還有映像,幸好以前研究過語音識別,所以對人工智能方面的知識還有一點基礎(chǔ)^_^作者給出的定義是:
An algorithm is given a set of data and infers information about the properties of the data---and that information allows it to make predictions about other data that it might see in the future.簡單的說,就是給定一組數(shù)據(jù),然后通過一個算法推斷出一個數(shù)據(jù)模型,然后,利用這個模型可以對未來的其它數(shù)據(jù)做出預(yù)測.作者通過一個垃圾郵件過濾的簡單例子形象的說明了機器學(xué)習(xí)的過程!
機器學(xué)習(xí)常用到的一些算法包括決策樹,神經(jīng)網(wǎng)絡(luò)等,我還記得語音識別中用到了隱馬爾科夫模型,DTW,線性預(yù)測LPC,聚類等模型,但主要的都是基于數(shù)學(xué)方法和統(tǒng)計方法,真是后悔數(shù)學(xué)沒學(xué)好啊:(
作者羅列了一些機器學(xué)習(xí)算法的應(yīng)用場景,例如Google的page rank,Amozon的推薦系統(tǒng),在金融系統(tǒng)中的防欺騙檢測,產(chǎn)品市場預(yù)測,供應(yīng)鏈管理等方面.