Chrome源碼剖析下《轉》

【四】Chrome的UI繪制

1. Chrome的窗口控件

Chrome提供了自己的一個UI控件庫，相關文檔可以參見這里。用Chrome自己的話來說，我覺得市面上的七葷八素的圖形控件庫都不好用，于是自己倒騰倒騰實現(xiàn)了一套。。。

廣告雖如此說，不過，Chrome的圖形控件結構，我還未發(fā)現(xiàn)有啥非常非常特別的地方。Chrome的窗口、按鈕、菜單之類的控件，都直接或間接派生自View，這個是控件基類。Chrome的View具有樹形結構，其內部有一個子View數(shù)組，由此構成一個控件常用的組合模式。。。

有一個比較特殊的View子類，叫做RootView，顧名思義，它是整個View控件樹的根，在Chrome中，一個正確的樹形的控件結構，必須由RootView作為根。之所以要這樣設計，是因為RootView有一個比較特殊的功能，那就是分發(fā)消息。。。

我們知道，一般的Windows控件，都有一個HWND，用與占據一塊屏幕，捕獲系統(tǒng)消息。Chrome中的View只是保存控件相關信息和繪制控件，里面沒有HWND句柄，因此不能夠捕獲系統(tǒng)消息。在Chrome中，完整的控件架構是這樣的，首先需要有一個ViewContainer，它里面包含一個RootView。ViewContainer是一個抽象類，在Window中的一個子類是HWNDViewContainer，同時，HWNDViewContainer還是MessageLoopForUI::Observer的子類。如果你看過本文第一部分描述的線程通信的內容的話，你就應該還記得，Observer是用于監(jiān)聽本線程內系統(tǒng)消息的東東。。。

當有系統(tǒng)消息進入此線程消息循環(huán) 后，HWNDViewContainer會監(jiān)聽到這個情況，如果和View相關的消息，它就會調用RootView的相關方法，傳遞給控件。在 RootView的內部，會遍歷整個控件樹上的控件，將消息傳遞給各個控件。當然，有的消息是可以獨占的，比如鼠標移動發(fā)送在某個View所管轄的范圍內，它會告知RootView（通過方法的返回值...），這個消息我要了，那么RootView會停止遍歷。。。

在設計的時候，View對消息的處理，采取的是大而全的接口模式。就是說在View內部，提供了所有可能的消息處理接口，并提供了默認實現(xiàn)，所有子類只需要覆蓋自己需要的消息處理函數(shù)即可。如果對MFC的消息映射有了解的話，可以知道兩者的區(qū)別。MFC在設計的時候，覺得無法提供大而全的接口，因為消息總類實在太多，而且還是可擴展的，于是就有了消息映射著一套繁瑣的宏。但Chrome的圖形框架，顯然沒有做一個通用的Framework的打算，因此，可以采用這樣的策略，使得子類的派生變得簡單而自然。。。

每一個View的子類控件，比如Button之類的，會存儲一些數(shù)據，根據消息做一些行為，并且繪制出自己。在Chrome中，畫圖的東西是ChromeCanvas這個類，在其內部，通過Skia和GDI實現(xiàn)繪制。 Skia是Android團隊開發(fā)的一個跨平臺的圖形引擎，在Chrome中負責除了文字之外，所有內容的繪制；而文字繪制的重擔，在Windows中交到了GDI的手上。這樣的設計會給跨平臺帶來一些困難，估計是由Skia實現(xiàn)文本繪制會比較繁瑣，才會帶出如此一個設計的模式。。。

另外一個歷史遺留產物，就是在Windows下的圖形控件，還有一些是原生的，就是說帶有HWND那種傳統(tǒng)的控件，這是Chrome身上不多的趕工期的痕跡，隨著時間的寬裕，這樣的原生控件會被淘汰進歷史的垃圾箱，而全部變?yōu)閺腣iew派生的控件。。。

其實，對于Chrome這套控件架構我還沒算摸得很熟悉，估計等到做一次插件之后會了解的更透徹，因此，只說了點皮毛，聊表心意。。。

2. Chrome的頁面加載和繪制

上面這些UI控件，都是用在窗口上的（比如瀏覽器的外框，菜單，對話框之類的...）。我們在瀏覽器中看到的大部分內容，是網頁頁面。頁面的繪制（繪制，就是把一個HTML文件變成一個活靈活現(xiàn)的頁面展示的過程...），只有一半輪子是Chrome自己做的，還有一部分來自于WebKit，這個Apple打造的Web渲染器。。。

之所以說是一半輪子來源于WebKit，是因為WebKit本身包含兩部分主要內容，一部分是做Html渲染的，另一部分是做JavaScript解析的。在Chrome中，只有Html的渲染采用了WebKit的代碼，而在JavaScript上，重新搭建了一個NB哄哄的V8引擎。目標是，用WebKit + V8的強強聯(lián)手，打造一款上網沖浪的法拉利，從效果來看，還著實做的不錯。。。

不過，雖說Chrome和WebKit都是開源的，并聯(lián)手工作。但是，Chrome還是刻意的和WebKit保持了距離，為其始亂終棄埋下了伏筆。Chrome在WebKit上封裝了一層，稱為 WebKit Glue。Glue層中，大部分類型的結構和接口都和WebKit類似，Chrome中依托WebKit的組件，都只是調用WebKit Glue層的接口，而不是直接調用WebKit中的類型。按照Chrome自己文檔中的話來說，就是，雖然我們再用WebKit實現(xiàn)頁面的渲染，但通過這個設計（加一個間接層...）已經從某種程度大大降低了與WebKit的耦合，使得可以很容易將WebKit換成某個未來可能出現(xiàn)的更好的渲染引擎。。。

重用
在《夢斷代碼》中，有一坨調侃重用的文字。他覺著軟件重用的困難一方面來自于場景本身很多變，很難設計出一套包羅萬象的東西；另一方面來自于人，程序員總是瞅著別人寫的代碼不順眼，總喜歡自己寫一套。。。
于是，解決重用這個問題也就只有兩種，寫最NB人見人服無所不能的代碼，或者是有很多很多NB代碼共君任選。Google無疑在這兩個方面做得都不錯，Map/Reduce，Big Table之類的一套東西，強大到可以適合太多的場景，大大簡化了N多上層應用的開發(fā)。而對開源的利用使用，使得其可以隨意挑一個巨人站到他肩膀上跳舞，每看到這種場景，MS估計都會氣得拍著胸口吐血。。。
Google本身在服務端的基礎底層，有很深積累，隨著Chrome，Android等等客戶端應用的開發(fā)，客戶端的積累也逐步提升，也許，擁抱開源才是MS的正道？。。。

當你鍵入一個Url并敲下回車后，Chrome會在Browser進程中下載Url對應的頁面資源（包括Web頁面和Cookie），而不是直接將Url發(fā)送給Render進程讓它們自行下載（你會越來越發(fā)現(xiàn)，Render進程絕對是100%的名符其實，除了繪制，幾乎啥多余的事情都不會干的...）。與各個Render進程各自為站，各自管好自己所需的資源相比，這種策略仿佛會增加大量的進程間通信。之所以采用，按照這篇文檔的解釋，主要有三個優(yōu)點，一個是避免子進程與網絡通信，從而將網絡通信的權限牢牢握在主進程手中，Render進程能力弱了，想造反干壞事的可能性就降低了（可以更好控制各個Render進程的權限...）；另一個是有利于Cookie等持久化資源在不同頁面中的共享，否則在不同Render進程中傳遞 Cookie這樣的事情，做起來更麻煩；還有一點很重要的，是可以控制與網絡建立HTTP連接的數(shù)量，以Browser為代表與網絡各方進行通信，各種優(yōu) 化策略都比較好開展（比如池化）。。。

當然，在Browser進程中進行統(tǒng)一的資源管理，也就意味著不再方便用WebKit進行資源下載（WebKit當然有此能力，不過再次被Chrome拋棄了...），而是依托WinHTTP來做的。WinHTTP在接受數(shù)據的過程中，會不停的把數(shù)據和相關的消息通過IPC，發(fā)送給負責繪制此頁面的Render進程中對應的RenderView。在這里，路由消息中的那個ID值起了關鍵的作用，系統(tǒng)依照此ID，能夠準確的將相關的消息發(fā)送到相關的View頭上，這玩意發(fā)錯了地方還真不是和有人把錢錯到你賬戶上一樣，因為錯收的進程基本上無福消受這個意外來客，輕者頁面顯示混亂，重者消化不良直接噎死。。。

RenderView接收到頁面信息，會一邊繪制一邊等待更多的資源到來，在用戶看來，所請求的頁面正在一點一點顯示出來。當然，如果是一個通知傳輸開始、傳輸結束這樣的消息，通過序列化到消息參數(shù) 里面，經由IPC發(fā)過來，代價還是可以承受的，但是，想資源內容這樣大段大段的字節(jié)流，如果通過消息發(fā)過來，浪費兩邊進程大量空間和時間，就不合適了。于是這里用到了共享內存。Browser進程將下載到的資源寫到共享內存中，并將共享內存的句柄和共享區(qū)域的大小序列化在消息中發(fā)送給Render進程。Render進程拿到這個句柄，就可以通過它訪問到共享內存相關的區(qū) 域，讀取信息并進行繪制。通過這樣的方式，即享用到了統(tǒng)一資源管理的優(yōu)點，由避免了很高的進程通信開銷，左右逢源，好不快活。。。

3. Chrome頁面的消息響應

Render進程是一個嬌生慣養(yǎng)的進程，這一點從上面一段已經可以看出來了。它自己的資源它自己都不下載，而是由Browser進程來幫忙。不過Render進程也許比你想象的還要懶惰一些，它不但不自己下載資源，甚至，連自己的系統(tǒng)消息都不接收。。。

Render進程中不包含HWND，當你鼠標在頁面上劃來劃去，點上點下，這些消息其實都發(fā)到了Browser進程，它們擁有頁面呈現(xiàn)部分的HWND。Browser會將這些消息轉手通過IPC發(fā)送給對應的Render進程中的RenderView，很多時候WebKit會處理此類消息，當它發(fā)現(xiàn)出現(xiàn)了某種值得告訴Browser進程的事情，它會組個報回贈給Browser進程。舉個例子，你打開一個頁面，然后拿鼠標在頁面上亂晃。Browser這時候就像一個碎嘴大嬸，不厭其煩的告訴Render 進程，“鼠標動了，鼠標動了”。如果Render對這個信息無所謂，就會很無聊的應答著：“哦，哦”（發(fā)送一個回包...）。但是，當鼠標劃過鏈接的時候，矜持的Render進程坐不住了，會大聲告訴Browser進程：“換鼠標，換鼠標~~”，Browser聽到后，會將鼠標從箭頭狀換成手指狀，然后繼續(xù)以上過程。。。

比較麻煩的是Paint消息，重新繪制頁面是一個太頻繁發(fā)生的事情，不可能重繪一次就序列化一坨字節(jié)流過去。于是策略也很清楚了，就是依然用共享內存讀寫，用消息發(fā)句柄。在Render進程中，會有一個共享內存池（默認值為2...），以size為key，以共享內存為值，簡單的先入先出淘汰算法，利用局部性的特征，避免反復的創(chuàng)建和銷毀共享內存（這和資源傳遞不一樣，因為資源傳遞可以開一塊固定大小的共享內存...）。Render進程從共享內存池中拿起一塊（二維字節(jié)數(shù)組...），就好像拿著一塊屏幕似的，拼了命往上繪制，為了讓Render安心覺著有成就感，Browser會偷偷幫Render把這些內容繪制到屏幕上，造成Render進程直接繪制屏幕的假象。這可就苦了屏幕取詞的工具們，因為在HWND上壓根就沒啥字符信息，全部就是一坨圖像而已，啥也取不著。于是Google金山詞霸，網易有道詞霸各自發(fā)揮智慧，另辟蹊徑，也算是都利用Chrome做了一把廣告。。。

為什么不讓Render進程自己擁有HWND，自己管理自己的消息，既快捷又便利。在Chrome的官方Blog上，有一篇解釋的文章，基本上是這個意思，速度是必須快的發(fā)指的，但是為了用戶響應，放棄一些速度是必要的，畢竟，沒有人喜歡總假死的瀏覽器。在Browser進程中，基本上是杜絕任何同步Render進程的工作，所有操作都是異步完成。因為Render進程是不靠譜的，隨時可能犧牲掉，同步它們往往導致主進程停止響應，從而導致整個瀏覽器停下來甚至掛掉，這個代價是不可以容忍的。但是，Windows有一個惡習，喜歡往整個HWND繼承體系中發(fā)送同步消息（我不是很清楚這個狀況，有人能解釋么？...），這時候，如果HWND在Render進程中，就務必會導致主進程與Render進程的同步，Chrome無法控制 Windows，于是，它們只能夠控制Render，把它們的HWND搬到主進程中，避免同步操作，換取用戶響應的速度。。。

4. 結論

整個Chrome的UI架構，就是一個權責分配的問題。可以把Browser進程看成是一個類似于朱元璋般的勤勞皇帝（詳見《明朝那些事一》...），把大多數(shù)的權利都牢牢把握在手中，這樣，雖然Browser很操勞，但是整體上的協(xié)調和同步，都進行的非常順暢。Render進程就是皇帝手下的傀儡宰相們，只負責自己的一畝三分地，聽從皇帝的調配即可。這這樣的環(huán)境下，Render進程的生死變得無足輕重，Render的死亡，只是少了一個繪制頁面的工具而已，其他一切如故。通過控制權力，換取天下太平，這招在coding界，同樣是一個不錯的策略，但是，唯一的意外來自于Plugin。按照規(guī)范，Chrome的Plugin是可以創(chuàng)立窗口的（HWND），這必然導致同步問題，Chrome沒有辦法通過控制權力的方式解決這個問題，只能想些別的亡羊補牢的招來搞定。。。

【五】 Chrome的插件模型

1. NPAPI

為了緊密的與各個開源瀏覽器團結起來，共同抗擊IE的壟斷，Chrome的插件，也遵循了NPAPI(Netscape Plugin Application Programming Interface)標準，支持這個標準的瀏覽器需要實現(xiàn)一組規(guī)定的API供插件調用，這組API形如NPN_XXX，比如NPN_GetURL，插件可以利用這些API進行二次開發(fā)。而NPAPI插件以一個Dll之類的作為物理載體（windows下dll，linux下是so...）進行提供，里面同樣也實現(xiàn)了一組規(guī)定的API。形式包括NP_XXX和NPP_XXX，NP_XXX是系統(tǒng)需要默認調用的方法，用于認知這個插件，比如NP_Initialize，而NPP_XXX是用于插件完成一些實際功能，比如NPP_New。。。

所有的插件dll都需要放置在指定目錄下（根據操作系統(tǒng)的不同而不同...），每個插件可以處理一種或多種MIME格式的數(shù)據，比如application/pdf，說明該插件可以處理pdf相關的文檔。在Chrome中鍵入about:plugins，可以查看當前Chrome中具有的插件信息。。。

NPAPI是一個很經典的插件方案，用dll進行注入，用協(xié)定的API進行通信，用字符串描述插件能力。插件宿主（在這里就是瀏覽器...），會根據能力描述，動態(tài)加載插件，并負責插件調用的流程和生命周期管理。而插件中，負責真實邏輯的處理，并可以構造 UI與用戶交流。以此類方式實現(xiàn)的插件系統(tǒng)，往往是處理的邏輯比較固定適用范圍一般（用API寫死了邏輯...），但可擴展性不錯（用字符串描述能力，可無限擴展...）。。。

在Chrome中nphostapi.h中，定義了所有NPAPI相關的函數(shù)指針和結構，這個文件放置在glue目錄下，如果看過前面碰過的文章就知道，在WebKit內肯定也有一套相同的東西；在npapi.h/.cc中，提供了Chrome瀏覽器端的NPN_XXX系列函數(shù)的實現(xiàn)；每一個插件物理實例，用PluginLib類來表示，而每一個插件的邏輯實例，用PluginInstance類來表示。這個概念牽強附會的可以用windows中的句柄來類比，當你想操作一個內核對象，你需要獲得一個內核對象的句柄，每個進程中的句柄肯定不相同，但后面的內核對象卻是同一個，內核對象的生命周期通過句柄的計數(shù)來控制，有人用則或，無人用則死（當然這個類比相當?shù)臓繌姡饕窍胝f明引用計數(shù)和邏輯與物理的關系，但一個關鍵性的區(qū)別在于，PluginLib與PluginInstance都是在一個進程內的，不能跨越進程邊界...）。在Chrome中，PluginLib負責加載和銷毀一個dll，拿到所有導出函數(shù)的函數(shù)指針，PluginInstance對這些東西進行了封裝，可以更好的來調用。。。

關于NPAPI的更多細節(jié)，Chrome并沒有提供任何文檔，但是，各個先驅的瀏覽器們都提供了大量豐富的文檔。比如，你可以到這里，查看firefox中的NPAPI文檔，基本通用。。。

2. Chrome的多進程插件模型

Chrome的插件模型，與早先的瀏覽器的最大不同，是它采用了多進程的方式，每一個插件，都有一個單獨的進程來承載（Shift + Esc打開Chrome進程管理器，可以看到現(xiàn)在已經加載的插件進程...）。當WebKit進行頁面渲染的時候，發(fā)現(xiàn)了未知的MIME類型數(shù)據，它會告知給Browser進程，召喚它提供一個插件來解析。如果該插件還未加載，Browser會在指定目錄中搜尋出具有此實力的插件（如果沒有此類人才只能作罷...），并為它創(chuàng)建一個進程，讓它負責所有的該插件相關的任務，然后建立起一個IPC通路，與它“保持通話”。這套流程一定不會太陌生，因為它與 Render進程的創(chuàng)建大同小異換湯不換藥。。。

Plugin進程與Render進程最大的區(qū) 別在于，Render需要與Browser進程大量通信，因為它的HWND歸Browser老大掌管著，相關所有內容都需要通信完成。但Plugin不需要與Browser頻繁聯(lián)系，它大部分的通信都是與Render進程發(fā)生的。如果Plugin與Render之間的通信，還需要走Browser中轉一下，這就顯得有些脫褲子放屁了，雖然Browser是大頭，但不是冤大頭，它不會干這種吃力不討好的事情。他只是做了一回Render與Plugin間的媒婆而已。當Plugin與Browser建立好了IPC通路后，它會讓Render建立一個新IPC通路，用以與Plugin通信，IPC的有名管道名，經由Browser通知給Plugin。完成名字協(xié)商后，Render與Plugin的通信關系就建立好了，它們之間就可以直接進行通信了。。。

整個通信模式，可以看這里。這是一個很標準的代理模式的應用，稍有了解的都可以跳過我后面會做的一段羅嗦的描述，一看官方文檔中的圖便能知曉。在Render進程端，WebPluginImpl是WebPlugin的一個子類，WebPlugin是供Webkit進行調用的一個接口，利用依賴倒置，實現(xiàn)了擴展。在Plugin進程端，實現(xiàn)了一個WebPluginDelegateImpl類，該類會調用PluginInstance的相關接口實現(xiàn)真實的插件功能。這樣的話，只需要WebPluginImpl調用 WebPluginDelegateImpl中的相應方法，就可以實現(xiàn)功能。但問題是WebPluginImpl與 WebPluginDelegateImpl天各一方各處于一個進程，很顯然，這里需要一個代理模式。這里沿用了COM的架構，Delegate + Stub + Proxy。WebPluginImpl調用代理WebPluginDelegateProxy，該代理會將調用轉換成消息，通過IPC發(fā)送給Plugin進程，在Plugin端，通過WebPluginDelegateStub監(jiān)聽消息，并轉換成對真實WebPluginDelegateImpl的調用，從而完成了跨進程的一個調用，反之亦然。。。

3. Chrome的可擴展性

總所周知，firefox通過三種方式進行自定義，插件、擴展和皮膚。其中，插件是使得瀏覽器能用，不會出現(xiàn)一大塊一大塊的無法顯示的區(qū)域；擴展是使得瀏覽器好用，可以簡單方便的進行功能的定制和個性化配置；皮膚是幫助瀏覽器變得好看，畢竟羅卜白菜，給有所愛。。。

與之對比，來看Chrome。Chrome有了插件，有了皮膚，但是沒有擴展。這就意味著，你很難為Chrome定制一些特色的功能。目前，所有對Chrome的功能擴展，都是通過書簽抑或是修改內核來實現(xiàn)的。前者能力太弱，后者開發(fā)起來太麻煩，容易出錯不提，還必須要與時俱進，跟上版本的變化，并且還不能自由的選擇或關閉。因此，這都不是長遠之計，Chrome提供一套類似于firefox的擴展機制，也許才是正道。據傳說，Chrome團隊正在琢磨這件事，不知道最終會出來個怎么樣的結果，是盡力接近firefox降低移植成本，還是另立門戶特立獨行，我想可以拭目以待一把。。。

在多進程模式下，Chrome的插件還有一個問題，前面提到過，就是關于UI控件的。由于NPAPI的標準，是允許插件創(chuàng)建HWND窗口的，這就使得當Plugin繁忙，且Browser進程發(fā)起 HWND的同步的時候，主進程被掛起，這個瀏覽器停滯。在Render進程中，解決這個問題的思路是控制權限，不然Render創(chuàng)建HWND，到了 Plugin中，這招不能使用，只能夠使用另一招，就是監(jiān)管。不停的檢查Plugin是否太繁忙，無法響應，一旦發(fā)現(xiàn)，立即殺死該Plugin及其所處的頁面。這就好比你想解決奶中有三氯氰胺的問題，要么控制奶源，不從奶站購買全部用自家的，要么加強監(jiān)管，提高檢查力度防止隱患。兩種策略的優(yōu)缺點一眼便知，依照不同環(huán)境采取不同策略即可。。。

總體說來，Chrome的可擴展性著實一般，不過Chrome還處于Beta中，我們可以繼續(xù)期待。。。

posted on 2012-02-16 17:10 小馬歌閱讀(793) 評論(0) 編輯收藏所屬分類: c/c++

新用戶注冊刷新評論列表


只有注冊用戶登錄后才能發(fā)表評論。




網站導航: 博客園 IT新聞 Chat2DB C++博客博問管理
相關文章: 13 款開源的全文搜索引擎［轉］ WebSocket協(xié)議分析 Websocket協(xié)議簡介如何將Int轉String? (C/C++) (C) linux使用msgpack及測試對象序列化類庫MsgPack介紹 thrift rpc 使用常見問題解答和經驗從Lua中調用C函數(shù) 更好的內存管理-jemalloc Darts: Double-ARray Trie System [zz]

My Links

Blog Stats

留言簿(26)

隨筆分類

文章分類

文章檔案

博客連接

搜索

最新評論

閱讀排行榜

評論排行榜

Chrome源碼剖析下《轉》

【四】Chrome的UI繪制

1. Chrome的窗口控件

2. Chrome的頁面加載和繪制

3. Chrome頁面的消息響應

4. 結論

【五】 Chrome的插件模型

1. NPAPI

2. Chrome的多進程插件模型

3. Chrome的可擴展性

My Links

Blog Stats

留言簿(26)

隨筆分類

文章分類

文章檔案

博客連接

搜索

最新評論

閱讀排行榜

評論排行榜

Chrome源碼剖析 下《轉》

【四】Chrome的UI繪制

1. Chrome的窗口控件

2. Chrome的頁面加載和繪制

3. Chrome頁面的消息響應

4. 結論

【五】 Chrome的插件模型

1. NPAPI

2. Chrome的多進程插件模型

3. Chrome的可擴展性

Chrome源碼剖析下《轉》