開始進行優化的時候并沒有在意百度的分詞研究,只是在某一次的SITE時無意中發現一個關鍵詞其中只相關了一個字,就完全不是那么回事了,排名大相徑庭。我是做房產的作的是二手房的關鍵詞,因為這個關鍵詞太熱鬧,所以我把頁面上的關鍵詞設置成“二手房源”,大家看了可能會說,這樣不錯啊,“二手房源”不是包含了二手房這個關鍵詞嗎?但是如果沒有仔細對百度的分詞進行研究,大家可能不知道這兩個詞會有什么區別,不過大家只要稍微留心一下搜索出來的結果,就可以看出端倪了,百度在對“二手房”和“二手房源”這兩個詞分詞出來是不一樣的,百度自己建立有自己的詞庫,所以他會把“二手房“這個詞當作一個整體,但是對于”二手房源“這個詞,百度則拆分成了”二手“和”房源“兩個詞,自然別人在搜索二手房這個關鍵詞的時候就找不到我的頁面了。通過這個小細節,我覺得有必要對百度的分詞進行一下深入的研究,我大概地總結出了以下這么幾點:
1、百度分詞是根據內容中,第一次出現關鍵詞相關詞為標準來分的。例如”今日新開熱血江湖sf“這個詞
如果你的正文中第一個出現的是”今日“這個詞,那么你的頁面上的關鍵詞就會被拆分成”今日”和“新開熱血江湖sf“兩個詞,標題中一定要包含關鍵詞,但不一定要完全匹配,但內容中出現的關鍵詞是要跟百度分詞完全匹配的,在完全匹配中又會根據文件URL路徑的深度來進行排序,在關鍵詞都完全匹配的情況下,比如說目錄比文件有優先權,根目錄下的文件要比二級目錄下的文件有優先權,完全匹配的會排在前面,然后再是部分匹配的。
2、在關鍵詞沒有完全匹配的情況下,如果有分詞,比如說:游覽器下載
這個關鍵詞,有一個網頁里第一次出現的關鍵詞是游覽器,并且有較高的關鍵詞密度,但是這個網頁中卻沒有”下載“這個關鍵詞
而另一個網頁里第一次出現的關鍵詞是下載,那么這個網頁的關鍵詞就會被拆分成 游覽器 下載 兩個詞,雖然第二個網頁里包含有“游覽器” “下載” 但是第一個網頁還是會排在第二個網頁的前面,這說明關鍵詞的前面部分是最重要的。
3、關鍵詞第一部分出現的頻率是排名的關鍵,比如說 ”游覽器 下載“,如果兩個網頁都沒有完全匹配,都是含有兩個分詞,那么“游覽器”這個分詞密度高的網頁將會排在前面。
4、如果完全匹配,但是關鍵詞第一出現是在頁面內容的最后面部分,那么這個網頁的排名將比前面這些頁面還要低。所以關鍵詞盡早在內容中出現是非常重要的.
本篇文章來源于 站盟-站長學習基地 原文鏈接:http://www.81zm.cn/zm/wangzhanyunying/wangzhanyouhua/20090817/579.html