URL 是統一資源定位,即每個網頁的網址、路徑。網站文件的目錄結構直接體現于 URL。清 晰簡短的目錄結構和規范的命名不僅有利于用戶體驗和網址傳播,更是搜索引擎友好的體 現。
1.目錄訪問層次: :
即通過幾層能夠訪問到最終頁面,Google 最好為三層。?
問題1:如果我的網站目錄層次大于三層,該怎么辦?
回答:由于三層的目錄,容納的頁面有限,需要多級目錄。
這個時候使用前面我們講過的二級域名的方式擴大級數。因為二級域名算獨立網站,目錄層次從當前二級域名算起。
例如:搜狐 ,汽車頻道 auto.sohu.com
問題2:為什么有的網頁在本網站層數很多,也被Google收錄呢?
回答:這些頁面被其他網站引用,而Google從其他頁面進入這個頁面也少于三層。
可以使用 link 命令查詢該頁的反相鏈接。例如:link:prod.it.com.cn/pricelist/2/1/14/534.htm 。
link 命令只能查詢3個月前的歷史記錄,當前的外鏈需要3個月后查詢。
問題3:所有的搜索引擎是否都和Google一樣?
回答:不是
百度收錄的時候相對 寬容一些。
總結:三層目錄,是最佳的目錄結構。
2.目錄和文件命名:
a.根據關鍵字無所不在的原則,可以在目錄名稱和文件名稱中使用到關鍵詞。但如果是關鍵詞 組,則需要用分隔符分開。我們常用連字符“-”和下劃線“_”進行分隔,URL 中還經常出 現空格碼“%20”。因此,如果以“中國制造”作文件名,就可能出現以下三種分隔形式:
made-in-china.htm
made_in_china.htm
made%20in%20china.htm
連在一起之后,關鍵詞就失去了意義。但事實上,至少在目前 Google 并不認同“_”為分隔符。對 Google 來說, made-in-china 和 made%20in%20china 都等于 made in china,但 made_in_china 就被讀成了 madeinchina,
因此,目錄和文件名稱如果有關鍵詞組,要用連字符“-”而不是下劃線“_”進行分隔。
問題1:所有的搜索引擎是否都和Google一樣?
回答:不是
在百度圖片中,拼音路徑比較有效的。
例如:site:www.***.cn,收錄大部分都排在第一。
b.URL 應該越短越好。
有人為了單純增加關鍵字而額外建多一個帶有關鍵字的子目錄,改變目 錄結構。由于 URL 中含有關鍵字本身對排名提高幫助并不大,因而這種做法多此一舉,也是搜索引擎反感的。
例如:要做英文關鍵詞 computer,這樣的目錄 http://www.ibm.com/computer/computer/computer.html 是錯誤的。
總結:合理的目錄命名,可以對網頁排名是加分的。
3.絕對 URL 和相對 URL:
?絕 對 URL : 即 網 頁 路 徑 使 用 包 含 頂 級 域 名 在 內 的 完 整 的 URL 。 如 : www.yoursite.com/page1/index.html 是一個絕對路徑,其中/page1/index.html 則為相對 路徑,由瀏覽器自動在該鏈接前加上 www.yoursite.com。
總體上,Google 在排名時并不在意 URL 使用的是相對路徑還是絕對路徑。
4.動態 URL:
?目前很多網站都有數據庫驅動生成的 URL,即動態 URL,往往表現為在 URL 中出現“?”、“= ”、 “%”,以及“&”、“$”等字符。動態 URL 極不利于搜索引擎抓取網頁,嚴重影響網站排名, 通常是通過技術解決方案將動態 URL 轉化成靜態的 URL 形式,如: 將http://www.domain.com/messages.php?id=2&type=5 轉化為 http://www.domain.com/messages/2/5/ 下文將會專門提到動態 URL 的解決方案。
問題1:為什么動態頁面對搜索引擎不友好呢?
回答:1.因為這樣會陷入死循環。這就是所謂的蜘蛛陷阱(spider traps)。
1.主導航醒目清晰
主導航一般體現為一級目錄,通過它們用戶和蜘蛛程序都可以層層深入訪問到網站所有重要 內容。因此主欄目必須在網站首頁第一屏的醒目位置體現,并最好采用文本鏈接而不是圖片。
2.“面包屑型(Breadcrumbs)”路徑 : ?所謂“面包屑”是比喻用戶通過主導航到目標網頁的訪問過程中的路徑提示,使用戶了解所 處網站中的位置而不至于迷失“方向”,并方便回到上級頁面和起點。路徑中的每個欄目最 好添加鏈接。
即使沒有詳細的路徑來源,也至少應該在每個子頁面提示回首頁的鏈接,包括頁面的 LOGO 作鏈接。良好的目錄導航,可以提高網站的流量。
3.首頁突出重要內容 :
?除了主欄目,還應該將次級目錄中的重要內容以鏈接的方式在首頁或其它子頁中多次呈現, 以突出重點。搜索引擎會對這種一站內多次出現的鏈接給予充分重視,對網頁級別 (PageRank)提高有很大幫助,這也是每個網站首頁的網頁級別一般高于其它頁面級別的重 要因素,因為每個子頁都對首頁進行了鏈接。
例如:以前很多人使用博客做排名,原因就在于博客首頁PR值大,而剛剛更新的博客會出現在首頁,如果此時 搜索引擎來索引,收錄,對個人博客作用很大,通常能夠獲得不錯的排名。
4.使用網站地圖:
?網站地圖(Site Map)是輔助導航的手段,多采用文本鏈接,以加快頁面加載速度。 尤其對于那些采用圖片導航和動態技術生成的網頁,通過在網站地圖中進行文本鏈接, 可在一定程度上彌補蜘蛛程序無法識別圖片和動態網頁造成的頁面不可見的風險。
需要注意,網站地圖也要突出重點,盡量給出主干性內容及鏈接,而不是所有細枝末節。
一頁內不適宜放太多鏈接。Google 明確提出“如果網站地圖上的鏈接超過大約 100 個,則最 好將網站地圖拆成多個網頁”。?
若頁面太多,可以考慮使用前面講到的二級域名擴展。
使用工具 Xenu 生成網站地圖.
總結:良好的導航結構能夠使搜索引擎收錄更多的網頁。
5.Google SiteMap:
Google新推出的Sitemap,是對原來robots.txt的擴展,它使用XML格式來記錄整個網站的信息并供Google讀取,使搜索引擎能更快更全面的收錄網站的內容。 Sitemap的作用就好像為網站提供了整站的RSS,而Google就是這些RSS的訂閱者,只要網站有更新就會自動通知Google。這樣一來,搜索引擎的收錄由被動的拉變成了主動的推。
Google SiteMap使用 Sitemap 協議
總結:利用google sitemap,可以提高收錄的數量。
框架結構,即幀結構(Frame),包括IFrame,Frame。
例如:
<frameset rows="30,1%" frameborder="NO" border="0" framespacing="0" >
<frame name="mainFrame" src="top.jsp" scrolling="NO">
<frameset cols="168,1%" frameborder="NO" border="0" framespacing="0">
<frame name="avdNsVDmJQC7" scrolling="AUTO" src="left.jsp">
<frame name="rightFrame" scrolling="AUTO" noresize src="right.jsp">
</frameset>
</frameset>
<noframes>
<body bgcolor="#FFFFFF" text="#000000">
</body>
</noframes>
框架型網站的優越性體現在頁面的整體一致性和更新方便上。尤其對于那些大型網站而言, 框架結構的使用可以使網站的維護變得相對容易。但框架對搜索引擎來說是一個很大的問 題,這是由于大多數搜索引擎都無法識別框架,也沒有什么興趣去抓取框架中的內容。此外, 某些瀏覽器也不支持框架頁面。
如果網頁已經使用了框架,或出于某種原因一定要使用框架結構,則必須在代碼中使用 “Noframes”標簽進行優化,把 Noframe 標簽看做是一個普通文本內容的主頁。在 <Noframe></Noframe>區域中包含指向 frame 頁的鏈接以及帶有關鍵詞的描述文本,同時在 框架以外的區域也出現關鍵詞文本。這樣,搜索引擎才能夠正確索引到框架內的信息。
總結:盡量避免使用Iframe,如果必須使用,采用對應的優化方式。
1.圖片優化
一般而言,搜索引擎只識讀文本內容,對圖片文件是視而不見的。同時,圖像文件直接延緩頁面加載時間,如果超過 20 秒網站還不能加載,用戶極有可能離開你的網站。因此, 除非你的網站內容是圖片為主,比如游戲站點或者圖片至關重要,否則盡量避免使用大圖片, 更不要采用純圖像制作網頁(SPLASH PAGE)。
網站圖片優化的有三點:
1. 在保持圖像質量的情況下盡量壓縮圖像的文件大小。
2. Alt 屬性:
每個圖像<IMG>標簽中都有 ALT 屬性,搜索引擎會讀取該屬性以了解圖像的信息。因此,最 好在所有插圖的 ALT 屬性中都有文字描述,并帶上該頁關鍵字在其中。
<img align="center" src="NP110.jpg" alt="浪潮英信NP110 G2服務器圖片" >
3.在圖片上方或下方加上包含關鍵詞的描述文本;
4.使用鏈接鏈接到這個圖片。
Google的圖像搜索(Googlebot-Image)和Google的文本搜索(Googlebot)不是同蜘蛛。
總結:避免使用大圖片,使用Alt屬性、文本或鏈接優化圖片。
2.FLASH 優化:
?Flash 會使頁面很好看,不過FLASH 網頁有一個非常致命的問題,即大部分搜索引擎無法識別 FLASH 中的信息。
例如:
一汽轎車FLASH 優化可以從以下三個方面來考慮:
1、做一個輔助 HTML 版本:
保留原有 FLASH 版本的同時,還可以設計一個 HTML 格式的版本,這樣既可以保持動態美觀 效果,也可以讓搜索引擎通過 HTML 版本的網頁來發現網站。
2、將 Flash 內嵌 HTML 文件:
還可以通過改變網頁結構進行彌補,即不要將整個網頁都設計成 Flash 動畫,而是將 Flash 內容嵌入到 HTML 文件中,這樣對于用戶瀏覽并不會削弱視覺效果,搜索引擎也可以從 HTML 代碼中發現一些必要的信息,尤其是進入內容頁面的鏈接。
總結:避免使用FLASH 做首頁。
表格是網頁最重要的排版方式。
a.如果某個網頁采用了大段的長篇文本,除了可以將一頁文本 分成多面,還可以考慮將文本置入不同表格中,這樣不僅管理方便,也使得該頁加載時每個 表格內容依次加載,這樣訪問者就可以一邊看已下載內容一邊等待剩余部分加載,而不是等 待很久之后才一齊加載出來。
例如:
新浪新聞
b.表格之內套嵌太多表格也不利于頁面加載,因瀏覽器是先加載完大表格之后再加載內嵌的小 表格,因此內嵌表格會最終降低整頁加載速度。
c.盡量采用XHTML標準,使用DIV代替表格。
具體方法是采用CSS里面的 FLOAT 屬性,position 屬性等定位
問題1:什么是XHTML?
回答:XHTML是The Extensible HyperText Markup Language(可擴展標識語言)的縮寫。HTML是一種基本的WEB網頁設計語言,XHTML是一個基于XML的置標語言,看起來與HTML有些相象,只有一些小的但重要的區別,XHTML就是一個扮演著類似HTML的角色的XML,所以,本質上說,XHTML是一個過渡技術,結合了部分XML的強大功能及大多數HTML的簡單特性。
參考資料:什么是XHTML。
總結:合理使用表格,最多不超過三層;如果允許,最好使用DIV替換表格。
代碼設置不妥不僅延長網頁加載時間,也嚴重影響蜘蛛程序對網頁內容的抓取。通過對網頁代碼進行清減去掉臃腫雜亂的代碼,減小網頁文件大小,能夠加快網 頁加載速度,讓蜘蛛快速索引到重要內容。最好不要超過 50K。 網頁減肥重點涉及以下幾個要點:
?a.CSS 樣式
網頁制作應通過 CSS(層疊樣式表單)來統一定制字體風格。 例如:
<b style="color:red;font-size:16px;">測試</b>
<div id="divmain" style="font-size:12px;">DIV</b>
<div style="color:red;"> 紅色 <b style="color:green;">綠色</b> </div>
----------------------
<style type="text/css">
b { color:red;font-size:16px; } /*通用對象*/
#divmain {font-size:12px;} /* ID 對象 */
.red {color:red;}/* 定制類別 */
.red b {color:green;}/* 定制類別下的 通用對象*/
</style>
<b>測試</b>
<div id="divmain">DIV</b>
<div class="red"> 紅色 <b>綠色</b> </div>
把文字的字體、字號、顏色、背景色等統一起來,不用對每段文字單獨進行格式定義,從而減少大量重復性標簽。注意把所有 css 文件單獨存放在命名為 css 的外 部文件中。
語法: <link rel="stylesheet" type="text/css" href="/common/client.css">
作用的優先級:自身的style屬性 > 頁面的內部style對象 > 頁面外部css文件。
總結:多使用CSS 樣式,能夠減小文件大小。
b.JavaScript:
1.簡化js中的函數名稱和變量。
例如:
Google,里面的函數名稱只有1個或者2個字符。
2.將網頁的公共部分轉換為腳本并存于js文件里。這樣可以減少文件大小,加快下載速度,同時也方便管理。
不過不能將導航等等優化的關鍵代碼轉換成js,否則搜索引擎搜索不到。
例如:
華軍軟件園 ,將標題、導航等等都放著js文件里,將導航放在js里面就不太好了。
總結:將網頁的公共的不需要優化的部分轉換為腳本并存于js文件里,這樣可以減少文件大小,加快下載速度,同時也方便管理。
c.慎用網頁減肥工具
通常的網頁減肥工具,對htm減肥具有一定的破壞性,常常為了減肥將標簽的 后半個標簽刪除,造成網頁的不完整。
jwebee
我的個人網站
posted on 2007-05-16 09:27
周行 閱讀(400)
評論(0) 編輯 收藏 所屬分類:
SEO