在網(wǎng)站中由于某種原因經(jīng)常會用到頁面跳轉(zhuǎn)。這種跳轉(zhuǎn)從底層原理來看,都是利用了HTTP協(xié)議的30X返回碼來實現(xiàn)的。
常用的30X返回碼有下面幾種:
301 永久性跳轉(zhuǎn)
302 暫時性跳轉(zhuǎn)
304 Not Modified 文檔未修改
305 Use Proxy 客戶請求的文檔應(yīng)該通過Location頭所指明的代理服務(wù)器提取,屬于HTTP 1.1新增內(nèi)容
其中,對SEO產(chǎn)生影響的是前兩個,即301和302。我就先詳細的介紹這兩個狀態(tài)碼的區(qū)別。
一、302
對用戶而已,301,302是沒有區(qū)別的。他們看到效果只是一個跳轉(zhuǎn),瀏覽器中舊的URL變成了新的URL。頁面跳到了這個新URL指向的地方。
但是對于搜索引擎,302轉(zhuǎn)向可能會有URL規(guī)范化及網(wǎng)址劫持的問題。可能被搜索引擎判為是作弊。網(wǎng)址規(guī)范化的內(nèi)容可以參考這篇文章:
http://www.chinamyhosting.com/seoblog/2006/04/10/url-canonicalization/
那么,網(wǎng)址劫持是怎么回事呢?
302重定向和網(wǎng)址劫持有什么關(guān)系呢?這要從搜索引擎如何處理302轉(zhuǎn)向說起。從定義來說,從網(wǎng)址A做一個302重定向到網(wǎng)址B時,主機服務(wù)器的隱含意思是網(wǎng)址A隨時有可能改主意,重新顯示本身的內(nèi)容或轉(zhuǎn)向其他的地方。大部分的搜索引擎在大部分情況下,當(dāng)收到302重定向時,一般只要去抓取目標(biāo)網(wǎng)址就可以了,也就是說網(wǎng)址B。實際上如果搜索引擎在遇到302轉(zhuǎn)向時,百分之百的都抓取目標(biāo)網(wǎng)址B的話,就不用擔(dān)心網(wǎng)址URL劫持了。
問題就在于,有的時候搜索引擎,尤其是Google,并不能總是抓取目標(biāo)網(wǎng)址。為什么呢?比如說,有的時候A網(wǎng)址很短,但是它做了一個302重定向到B網(wǎng)址,而B網(wǎng)址是一個很長的亂七八糟的URL網(wǎng)址,甚至還有可能包含一些問號之類的參數(shù)。很自然的,A網(wǎng)址更加用戶友好,而B網(wǎng)址既難看,又不用戶友好。這時Google很有可能會仍然顯示網(wǎng)址A。
由于搜索引擎排名算法只是程序而不是人,在遇到302重定向的時候,并不能像人一樣的去準(zhǔn)確判定哪一個網(wǎng)址更適當(dāng),這就造成了網(wǎng)址URL劫持的可能性。也就是說,一個不道德的人在他自己的網(wǎng)址A做一個302重定向到你的網(wǎng)址B,出于某種原因, Google搜索結(jié)果所顯示的仍然是網(wǎng)址A,但是所用的網(wǎng)頁內(nèi)容卻是你的網(wǎng)址B上的內(nèi)容,這種情況就叫做網(wǎng)址URL劫持。你辛辛苦苦所寫的內(nèi)容就這樣被別人偷走了。
二、301
當(dāng)網(wǎng)頁A用301重定向轉(zhuǎn)到網(wǎng)頁B時,搜索引擎可以肯定網(wǎng)頁A永久的改變位置,或者說實際上不存在了,搜索引擎就會把網(wǎng)頁B當(dāng)作唯一有效目標(biāo)。301的好處是:
(1)沒有網(wǎng)址規(guī)范化問題。
(2)網(wǎng)頁A的PR網(wǎng)頁級別會傳到網(wǎng)頁B,這對SEO非常重要!
在實際操作過程中,我和同事對一個站點(www.woshuone.com)做了實驗。結(jié)果發(fā)現(xiàn)不管是使用301還是302,很容易被Google “K掉”,取消跳轉(zhuǎn)之后過一周左右的時間就又恢復(fù)了。看來搜索引擎蜘蛛現(xiàn)在對頁面跳轉(zhuǎn)還是比較反感,認為作弊的可能性大,寧可錯殺一百也不放過一人!