Cal Henderson 是大名鼎鼎的 Flickr 網站的開發者之一.在一篇名為 Serving JavaScript Fast 的文章中,他介紹了用于 Flickr 站點應用優化的技巧,讀罷感覺獲益良多."嚼一下別人的饃",概括一下該文的主要內容.
Flickr 是 Web 2.0 的代表站點。面對的網絡問題除了一般 Web 站點都會有的內容優化之外, 還有必須要靈活處理 JavaScript 與 CSS 的頻繁變化后部署分發帶來的復雜性。
設定文件大小的策略 首先面臨的一個問題是把所有的 JavaScript 與 CSS 放到一個文件中好呢,還是分割成多個文件 ? 從減少網絡請求的角度上考慮, 前者更好,后者差。但是從并行的角度考慮, IE 與 Firefox 默認情況下都只能同時從一個域請求兩個資源. 這會在很多情況下給用戶帶來不良的使用體驗--必須所有的文件都下載完畢才可以看到像樣的頁面. Flickr 采用了折衷的辦法--在保持文件數量盡可能少的情況下,把 JavaScript 與 CSS 分成多個子文件. 這在開發上帶來了復雜性,但是對性能的收益是巨大的。
壓縮的優化問題 毫無疑問,對站點內容進行壓縮是一個比較常用的 Web 優化手段.但是并不一定都能達到理想的效果.原因在于 mod-gzip 模塊不但消耗服務器端 CPU 資源,也消耗客戶端 CPU 資源. 而且, mod_gzip 壓縮文件后創建的臨時文件是放到磁盤上的,這也會給磁盤 IO 帶來嚴重的問題. Flickr 采用的是 Httpd 2.x 以后支持的 mod_deflate 模塊.壓縮操作都在內存中進行.mod_deflate 在 Httpd 1.x 是不可用的, 不過可以通過創建 RAM 盤的方式來間接提高性能.
當然, mod_gzip 到也不是一無是處, 對于預壓縮的文件, 還是有好處的. 而且, 采用壓縮的時候,也要注意策略. 圖片文件壓縮就沒什么必要了(Flickr 上圖像多, 而且壓縮得不到什么好處). Flickr 只對 JavaScript 和 CSS 進行壓縮. mod_gzip 新一點的版本能夠自動通過配置 mod_gzip_update_static 選項自動處理 預壓縮的文件. Cal 也指出這個特性在一些舊版本的瀏覽器上會出問題.
壓縮的另一個主要手段是內容的壓縮. 針對 JavaScript 可以進行通過減少注釋、合并空格、使用緊湊的語法等小技巧(Google 的所有腳本都非常難讀,而且非常緊湊,思想類似).當然,經過這樣處理的 JavaScript 可能帶了很多括號不容易解析,Flickr 使用了 Dojo Compressor 來構建解析樹。Dojo Compressor 開銷很低,而且對于最終用戶是透明的. JavaScript 的處理方法介紹過,CSS 處理則相對簡單.通過簡單的正則表達式替換(比如把多個空格替換為一個空格符), 最高可以獲得 50% 的壓縮比。
Caching 的優化 Flickr 的開發者充分利用了 Http 1.1 規范定義的 Etag 與 Last-Modified 機制 來提高 Caching 的效率. 值得注意的是,Cal 介紹了一個在負載均衡條件下的 e-Tag 小技巧. 即可以設定 Apache 通過文件調整時間與文件大小獲得 E-Tag ,而默認情況下, Apache 是通過文件節點獲取 e-Tag 的。當然,這也不是很完美,因為會影響 if-modified-since 。
靈活運用 mod_rewrite 據說 Flickr 網站應用是進行每日構建的(Daily Build)。 如果沒有一個靈活的機制恐怕這是不可想象的。而且,在 Flickr 這樣的站點, 內容的修改同步的處理都是很讓人頭疼的難題. 他們的利器是 mod_rewrite 的靈活運用。通過配置 URL 重寫規則,很容易切換到不同的環境下。聽起來很簡單, 但是沒有一定的 Web 技術功力談何容易做到 ?!
通過這幾個主要方法的運用,我們看到了如夢幻一般高性能的 Flickr .