在第一章的Collective Intelligence的介紹中,作者通過Netflix和google兩個公司的例子來說明了Collective Intelligence的應用.但具體Collective Intelligence的定義到底是什么呢?作者并沒有明確給出,所以我在讀書筆記中也就直接用這兩個單詞了.
這本書將會告訴讀者,通過一些API,應用機器學習算法和統計方法來收集數據的一些方法.那么什么是機器學習呢?這個概念我倒是還有映像,幸好以前研究過語音識別,所以對人工智能方面的知識還有一點基礎^_^作者給出的定義是:
An algorithm is given a set of data and infers information about the properties of the data---and that information allows it to make predictions about other data that it might see in the future.簡單的說,就是給定一組數據,然后通過一個算法推斷出一個數據模型,然后,利用這個模型可以對未來的其它數據做出預測.作者通過一個垃圾郵件過濾的簡單例子形象的說明了機器學習的過程!
機器學習常用到的一些算法包括決策樹,神經網絡等,我還記得語音識別中用到了隱馬爾科夫模型,DTW,線性預測LPC,聚類等模型,但主要的都是基于數學方法和統計方法,真是后悔數學沒學好啊:(
作者羅列了一些機器學習算法的應用場景,例如Google的page rank,Amozon的推薦系統,在金融系統中的防欺騙檢測,產品市場預測,供應鏈管理等方面.