由于工作的需要,最近對搜索引擎感興趣起來,下面有些心得:
?
1。 其實要讓自己的Blog的點擊率狂漲的辦法很簡單,就是寫一個最簡單的webcrawler程序,不斷的訪問自己的主頁(發送http請求),很多計數器的原理就是根據這個來計算的,而不會核實IP地址,不信,只要自己F5刷新一下自己的頁面就知道了。照這樣下去,點擊率超過老徐是肯定沒有問題的。不過,新浪本來就玩點擊率貓膩的,因為他們可以自己修改計數器,所以和他們玩這個沒有意義。
?
2。點擊率高并不表示你的頁面排名高(PageRank)。PageRank是一個技術含量比較高的詞,想當初Google那兩個毛頭小伙子Larry Page(真的很巧和,那小子的姓居然是Page,真的想不做Page的老大都不行)和 Sergey Brin就是靠在斯坦福期間有關PageRank的研究發家的,如今年紀輕輕就可以和MS叫板。當然,Google的PageRank的算法是商業秘密。不過網上牛人不乏其數,居然有人根據Google的一些搜索行為和利用概率建模等數學知識硬是弄出一套PageRank的解釋,在網上大為流行。那篇Paper只要Google一下PageRank Uncovered(by Chris Ridings and Mike Shishigin)就可以找到。據說,還有人利用里面的機制大大戲弄了一把Google的搜索引擎。不過已無法考證,因為Google也在不斷完善自己。
?
3。簡單來說,PageRank就是一個衡量自己網站或網頁的重要性的一個很關鍵的指標。其概念的核心簡單來說就是看有多少網頁鏈接到你的網頁,特別是有多少重要的網頁鏈接到你的網頁。換句話說,如果老徐的Blog因為其點擊率或在全國人民的博客世界的影響力使得其PageRank達到10,即為一非常重要之網頁,而你又有幸得到老徐的青睞加為友情鏈接,即她之重要網頁有鏈接指向了你的網頁,則你的PageRank必有所提高。當然,這只是一個非常簡單的例子,具體的公式還沒那么簡單,自己有興趣可以在網上查到,即便這樣,這只是一個因素而已。不過這就不難理解為什么會有那么多的人會在名人的博客上搶沙發甚至故意大放厥詞已引起各方注意了。也就不難理解廣告做到博客上去了。
?
4.其實,PageRank的idea來源于我們平時的生活中。比如,我想買一個電腦,我希望一個懂電腦的人告訴我買什么電腦。比如我知道小王比較懂,我就會問小王,小王說,恩,
dedian牌電腦不錯,就買
dedian牌電腦吧。我說,好吧,就買它了,可你是怎么知道的呢,哪里有介紹呢,有哪些優點呢?小王說,這。。。,我也不是很清楚,我也是聽小李那丫說的,你去問那小子吧。這時,即便我不認識小李,可他在我心目中的形象一下高大了許多,小王都要聽他丫的。。。
?
5。所以,要讓自己的網頁或網站就有影響力,就要千方百計讓別人來連接你,來引用你。當然還有一種辦法,就是不斷的引用別人的文章,這里的引用不是說在你自己的網頁里嵌上別人的連接,而是利用別人的網頁嵌上自己網頁。怎么做,其實就是很多Blog的Trackback的功能,細心可以發現,只要你Trackback別人的Blog,你的Blog地址就留在別人的Blog的網頁里(comments一樣)。不過,現在大都的blog都開始有設置不允許別人Trackback或comments.新浪好像也開始做了手腳,名人的博客不讓引用了好像,不過新浪的博客對很多的搜索引擎都不友好,也就別動他的主意了。倒是MSN space似乎可以,可以寫一段代碼自動連到各個網頁上fetch出每個blog的permalink然后執行一段MSN自己提供的javascript就可以trackback了,不過這只是我最近想到的,還沒有寫代碼實現。如果可以成功的話,很多其他的博客也一樣可以成功。這個想法是最近老看到一些亂七八糟的網站出現在我的trackback里想到的。
?
6。不過現在網上提供越來越多的服務會杜絕類似的不友好攻擊行為。比如,如果你很討厭有人在你的博客里亂引用,亂寫評論。你可以申請一個類似托管的服務,就是讓另一個網站先收集那些留言或評論,再篩選,再放到你的博客上。總之,網絡的林子大了,什么鳥都有。