網站推薦機制是電子商務或內容網站的核心功能之一。例如你在一個網站買了一本書后,網站會推薦其他你可能會感興趣的書。這被認為是亞馬遜等電子商務巨頭成功的關鍵。本文對幾個出色的推薦系統(tǒng)進行了較透徹的分析。
2006年10月,Netflix搞了一次不尋常的有獎競賽。這家網上DVD租賃公司開出獎金一百萬美元,獎勵給能把他們網站的產品推薦機制提高10%的人。Netflix 以富有創(chuàng)新精神和闖勁著稱。而一百萬美元的獎金對于這樣一家公司來說,其實并不象聽起來那么多。
有獎競賽還在進行當中(“至少要進行到2011年10月2日”)。所以這是一場炒作活動還是希望花小錢進行研究,我們還不得而知。而對Netflix來說,更好的推薦機制是必不可少還是錦上添花?今天,Netflix正面對從沉睡中醒來的巨人BlockBuster的挑戰(zhàn),因此它必然要尋找制勝的先機。出色的推薦機制會留住老用戶,吸引新用戶。比如當一個用戶還DVD時,系統(tǒng)會推薦給他/她可能會喜歡的另一部電影。這就增加了這個用戶回來再租DVD的可能。
瀏覽與推薦
一個出色的推薦機制不光對Netflix,對其他網絡企業(yè)也非常重要。這是因為用戶的網上活動分為兩類:搜索和瀏覽。當消費者明確知道她想要什么的時候,她搜索。但當她不太清楚想要什么的時候,她瀏覽。瀏覽活動為推薦系統(tǒng)帶來了絕好的機會。因為當用戶沒有集中注意力在找她想要的東西時,她對外來的建議是敞開的。
在瀏覽過程中,用戶的注意力(和他們的錢),都等著你去抓住。通過向用戶展示有吸引力的東西,網站可以使交易成功的可能最大化。所以如果網站能增加給用戶提供好推薦的幾率,就能賺更多錢。顯然這不是一個容易解決的問題,但解決這個問題帶來的好處是巨大的。推薦的幾種方式如下:
- 個性化的推薦--根據(jù)用戶過去在網站的行為進行推薦
- 社會化推薦--根據(jù)類似用戶過去在網站的行為進行推薦
- 基于產品的推薦--基于產品本身的特性進行推薦
- 以上三者的混合
我們現(xiàn)在通過實例詳述上述方式。包括老牌網站如亞馬遜 Amazon,以及新秀如Pandora(譯者:一個收聽網上音樂的站點)和del.icio.us(譯者:著名的社會化書簽網站)。
亞馬遜--推薦之王
亞馬遜被廣泛認為是網上購物行業(yè)的領袖,特別是推薦機制的使用。過去十幾年間,該公司投入了大量金錢和腦力開發(fā)推薦機制,來促使用戶更多地購物--包括對你瀏覽歷史、購買歷史,以及其他用戶購買數(shù)據(jù)的分析。讓我們看看亞馬遜推薦機制的幾個方面。下面是登陸到我的亞馬遜帳戶后網頁顯示的主要部分:

(譯者:上圖抬頭是“消費者瀏覽了這件商品后買了什么?”下面是三件商品:52%的消費者買了你正在看的這套襯衣;19%買了另一種款式;5%買了灰色的那種)
這部分是社會化推薦。注意,非常量化的分析,給我一個基于數(shù)據(jù)統(tǒng)計的理由為什么我應該買這套襯衣。而同時這又是個性化的推薦,因為它基于我剛剛點擊查看的產品。

(譯者:上圖抬頭是“為你準備的新貨”。下面是幾本書以及鏈接“為什么我們推薦這本書給你?”)
這一部分是“基于產品的推薦”,具體說是新書推薦。點擊“為什么我們推薦這本書給你?”的鏈接會顯示我的購買歷史。因此這同時也是個性化推薦--基于我過去行為的推薦。
這一頁上有其他四個部分采用上述推薦機制的結合。我們用下表概括:
亞馬遜個性化推薦系統(tǒng)
|
你的瀏覽歷史 |
你的購買歷史 |
實際瀏覽商品 |
新產品(基于產品的推薦) |
相關商品(基于產品的推薦) |
相關商品(基于產品的推薦) |
別人購買的(社會化推薦) |
別人購買的(社會化推薦) |
很自然,這個系統(tǒng)是對稱和覆蓋全面的。所有推薦都基于用戶個人行為,加上商品本身,或者是其他用戶在亞馬遜的活動。不管是因為你以前購買過相關產品,還是因為其他很多用戶都喜歡,亞馬遜每推薦給你一件商品,都增大你把它放進你的購物筐的可能。
超越亞馬遜
亞馬遜的推薦系統(tǒng)是程序自動化和用戶相關購物信息天才集合的經典之作。亞馬遜花了十幾年的時間建立和完善了這個系統(tǒng)。這個系統(tǒng)基于產品和相關用戶的巨大數(shù)據(jù)庫;記錄的信息包括你在過去幾年或幾分鐘內做過什么。其他新公司如何與之競爭呢?
出乎意料的是,有辦法競爭。答案來自與網絡購物沒什么關系的學科--遺傳學。如你所知,遺傳學研究DNA片段--基因,如何承載影響人類特性和行為的密碼。比如一家人因為他們有某些基因是相同的,因此長相和行為有類似之處。遺傳學是一門有150年歷史的學科,在醫(yī)學和歷史學的研究中都是一個重要工具。但遺傳學一個出乎意料的應用于2000年1月6日出現(xiàn)--Time Westergren和他的朋友們決定把遺傳學的概念引入到音樂中。
潘朵拉(Pandora)--基于遺傳學的推薦系統(tǒng)
音樂染色體組項目的推出,目的在于把音樂解析成為最基本的基因組成。它的基本想法是:我們因為音樂的某些特性喜歡音樂--那么為什么不能根據(jù)音樂的某些相似之處設計出一套推薦系統(tǒng)呢?這類推薦系統(tǒng)應該屬于基于產品的推薦。但具有深刻創(chuàng)新意義的是,產品(音樂產品)的相似性,通過“基因”組成來衡量。

(譯者:上圖是Pandora音樂播放器向用戶解釋為什么播放一首歌曲:“基于你告訴我們的信息,我們播放這段音樂。因為這段音樂微妙地使用人聲合聲,混合了聲學和電子樂器,有以人聲為核心的審美特點,音調以大調為主,以及其他音樂基因組項目中發(fā)現(xiàn)的相似性。”)
在奮斗了幾年,分析了海量的音樂后,這個項目積累了足夠的數(shù)據(jù),并推出了名為Pandora的在網上收聽音樂的服務。Pandora 由于準確的推薦和用戶低成本進入(譯者:指用戶可以很容易地就試用Pandora的服務)取得巨大成功。用戶只需選一名歌手,或一首歌,就可以建立一個用戶自己的電臺,播放類似的音樂。
這種“即刻滿足感”是很難抗拒的。因為Pandora 了解音樂相似性背后的因素,它不需要了解用戶的好惡,就可以把用戶黏住。確實,Pandora 需要把握用戶的口味或記憶--但這正是蘊藏在音樂本身的DNA中了。當然Pandora有時并不完美,會播放不對用戶口味的音樂。但這很少發(fā)生。
很自然地我們會問:這個基于基因的推薦方式能不能應用于其他產品--如書籍、電影、酒、餐館、或旅游點呢?對于每一類產品,它的基因又由什么因素組成呢?比如說,對葡萄酒來說,它的基因是否包括對酒的口味的描述呢:黑莓口味、土味、果香型、復合型、混合型,等等。而書籍的基因是否是描述故事情節(jié)的用語呢?如果基因真的是讓某一個物體在我們頭腦中產生獨特形象的因素,對于不同的事物我們應該可以把他們的基因定義出來。其實在過去的幾年間,我們已經在互聯(lián)網上做這樣的事了。這就是“標簽(tagging)”。
Del.icio.us -標簽會成為基因么?
Pandora 的初始投入是巨大的。因為成千上萬的音樂需要人工來鑒定。社會化書簽網站中首屈一指的 del.icio.us 則采用不同的辦法--讓用戶自己來鑒定、標識。這種自組織的方式相當成功,del.icio.us 很快在最初的使用者中流行起來。今天,del.icio.us 已經不僅僅是一個書簽網站--它還是一個新聞網站和搜索引擎。但del.icio.us是否也是一個推薦系統(tǒng)呢?

(譯者:上圖顯示加了“Linux”標簽的最受歡迎的網頁鏈接,右側是相關標簽。)
答案是肯定的。這是一個非常簡明的推薦系統(tǒng),它指基于一個基因--那就是一個標簽。例如在上圖中,我們看到最受歡迎的加了“Linux”標簽的網頁鏈接,同時還看到相關鏈接如“Open source (開源軟件)”和“ubuntu (Linux 操作系統(tǒng)的一個版本)”。而一個更令人興奮的推薦系統(tǒng)是基于多個標簽的吻合。然而由于算法還不完善,這一點的作用并不明顯。但至少,這一功能對于Read/WriteWeb 的網頁(譯者:原文的站點)是有效的,在下圖中,可以看到右側顯示的與 Read/WriteWeb 類似的其他博客。

因此,del.icio.us 的機制有可能發(fā)展成為一個有趣的自助分類、組織的推薦系統(tǒng)。如果有足夠的用戶并逐步調整系統(tǒng),用群體的力量加標簽的方式可以建立起一個對書、葡萄酒、音樂同樣有效的推薦系統(tǒng)。前題是,標簽要準確到能夠成為被標簽對象的基因!
結論
推薦引擎是網上電子商務系統(tǒng)和用戶體驗的一個重要組成部分。網上零售商們有強烈的意愿向那些正在瀏覽的用戶提供推薦,以驅使他們購買。亞馬遜有一套非常出色的個性化推薦系統(tǒng),是這個領域的領先者。其他網上零售商面臨的問題是缺乏用戶信息和軟件構架不完善。
最新的推薦引擎,如受遺傳學啟發(fā)的Pandora和基于群體社會化標簽的del.icio.us都是非常有趣的新發(fā)展。這些系統(tǒng)的長處在于“即刻滿意度”--不需要用戶提供他們的偏好和過去的瀏覽或消費歷史。不管未來如何發(fā)展,亞馬遜、Pandora和del.icio.us目前展示了極其出色的推薦技術。我們向您推薦這幾個系統(tǒng),并對未來拭目以待。
轉載:http://blog.csdn.net/java060515/archive/2007/04/18/1568824.aspx
posted on 2008-07-31 16:03
流浪汗 閱讀(271)
評論(0) 編輯 收藏 所屬分類:
Search