開始進(jìn)行優(yōu)化的時(shí)候并沒有在意百度的分詞研究,只是在某一次的SITE時(shí)無意中發(fā)現(xiàn)一個(gè)關(guān)鍵詞其中只相關(guān)了一個(gè)字,就完全不是那么回事了,排名大相徑庭。我是做房產(chǎn)的作的是二手房的關(guān)鍵詞,因?yàn)檫@個(gè)關(guān)鍵詞太熱鬧,所以我把頁面上的關(guān)鍵詞設(shè)置成“二手房源”,大家看了可能會(huì)說,這樣不錯(cuò)啊,“二手房源”不是包含了二手房這個(gè)關(guān)鍵詞嗎?但是如果沒有仔細(xì)對(duì)百度的分詞進(jìn)行研究,大家可能不知道這兩個(gè)詞會(huì)有什么區(qū)別,不過大家只要稍微留心一下搜索出來的結(jié)果,就可以看出端倪了,百度在對(duì)“二手房”和“二手房源”這兩個(gè)詞分詞出來是不一樣的,百度自己建立有自己的詞庫(kù),所以他會(huì)把“二手房“這個(gè)詞當(dāng)作一個(gè)整體,但是對(duì)于”二手房源“這個(gè)詞,百度則拆分成了”二手“和”房源“兩個(gè)詞,自然別人在搜索二手房這個(gè)關(guān)鍵詞的時(shí)候就找不到我的頁面了。通過這個(gè)小細(xì)節(jié),我覺得有必要對(duì)百度的分詞進(jìn)行一下深入的研究,我大概地總結(jié)出了以下這么幾點(diǎn):
1、百度分詞是根據(jù)內(nèi)容中,第一次出現(xiàn)關(guān)鍵詞相關(guān)詞為標(biāo)準(zhǔn)來分的。例如”今日新開熱血江湖sf“這個(gè)詞
如果你的正文中第一個(gè)出現(xiàn)的是”今日“這個(gè)詞,那么你的頁面上的關(guān)鍵詞就會(huì)被拆分成”今日”和“新開熱血江湖sf“兩個(gè)詞,標(biāo)題中一定要包含關(guān)鍵詞,但不一定要完全匹配,但內(nèi)容中出現(xiàn)的關(guān)鍵詞是要跟百度分詞完全匹配的,在完全匹配中又會(huì)根據(jù)文件URL路徑的深度來進(jìn)行排序,在關(guān)鍵詞都完全匹配的情況下,比如說目錄比文件有優(yōu)先權(quán),根目錄下的文件要比二級(jí)目錄下的文件有優(yōu)先權(quán),完全匹配的會(huì)排在前面,然后再是部分匹配的。
2、在關(guān)鍵詞沒有完全匹配的情況下,如果有分詞,比如說:游覽器下載
這個(gè)關(guān)鍵詞,有一個(gè)網(wǎng)頁里第一次出現(xiàn)的關(guān)鍵詞是游覽器,并且有較高的關(guān)鍵詞密度,但是這個(gè)網(wǎng)頁中卻沒有”下載“這個(gè)關(guān)鍵詞
而另一個(gè)網(wǎng)頁里第一次出現(xiàn)的關(guān)鍵詞是下載,那么這個(gè)網(wǎng)頁的關(guān)鍵詞就會(huì)被拆分成 游覽器 下載 兩個(gè)詞,雖然第二個(gè)網(wǎng)頁里包含有“游覽器” “下載” 但是第一個(gè)網(wǎng)頁還是會(huì)排在第二個(gè)網(wǎng)頁的前面,這說明關(guān)鍵詞的前面部分是最重要的。
3、關(guān)鍵詞第一部分出現(xiàn)的頻率是排名的關(guān)鍵,比如說 ”游覽器 下載“,如果兩個(gè)網(wǎng)頁都沒有完全匹配,都是含有兩個(gè)分詞,那么“游覽器”這個(gè)分詞密度高的網(wǎng)頁將會(huì)排在前面。
4、如果完全匹配,但是關(guān)鍵詞第一出現(xiàn)是在頁面內(nèi)容的最后面部分,那么這個(gè)網(wǎng)頁的排名將比前面這些頁面還要低。所以關(guān)鍵詞盡早在內(nèi)容中出現(xiàn)是非常重要的.
本篇文章來源于 站盟-站長(zhǎng)學(xué)習(xí)基地 原文鏈接:http://www.81zm.cn/zm/wangzhanyunying/wangzhanyouhua/20090817/579.html