久久亚洲国产欧洲精品一,亚洲午夜电影在线观看高清,久久久久久亚洲精品不卡

高效穩(wěn)定的大型網(wǎng)站系統(tǒng)架構(gòu)分析(轉(zhuǎn))

千萬人同時訪問的網(wǎng)站，一般是有很多個數(shù)據(jù)庫同時工作，說明白一點就是數(shù)據(jù)庫集群和并發(fā)控制，這樣的網(wǎng)站實時性也是相對的。這些網(wǎng)站都有一些共同的特點：數(shù)據(jù)量大，在線人數(shù)多，并發(fā)請求多，pageview高，響應速度快。總結(jié)了一下各個大網(wǎng)站的架構(gòu)，主要提高效率及穩(wěn)定性的幾個地方包括：

　　1、程序

　　程序開發(fā)是一方面，系統(tǒng)架構(gòu)設計（硬件+網(wǎng)絡+軟件）是另一方面。

　　軟件架構(gòu)方面，做網(wǎng)站首先需要很多web服務器存儲靜態(tài)資源，比如圖片、視頻、靜態(tài)頁等，千萬不要把靜態(tài)資源和應用服務器放在一起。

　　一個好的程序員寫出來的程序會非常簡潔、性能很好，一個初級程序員可能會犯很多低級錯誤，這也是影響網(wǎng)站性能的原因之一。

　　網(wǎng)站要做到效率高，不光是程序員的事情，數(shù)據(jù)庫優(yōu)化、程序優(yōu)化這是必須的，在性能優(yōu)化上要數(shù)據(jù)庫和程序齊頭并進！緩存也是兩方面同時入手。第一，數(shù)據(jù)庫緩存和數(shù)據(jù)庫優(yōu)化，這個由dba完成（而且這個有非常大的潛力可挖，只是由于我們都是程序員而忽略了他而已）。第二，程序上的優(yōu)化，這個非常的有講究，比如說重要一點就是要規(guī)范ＳＱＬ語句，少用in 多用or，多用preparestatement，另外避免程序冗余如查找數(shù)據(jù)少用雙重循環(huán)等。另外選用優(yōu)秀的開源框架加以支持，我個人認為中后臺的支持是最最重要的，可以選取spring＋ibatis。因為ibatis直接操作SQL并有緩存機制。spring的好處就不用我多說了，ＩＯＣ的機制可以避免new對象，這樣也節(jié)省開銷。據(jù)我分析，絕大部分的開銷就是在NEW的時候和連接數(shù)據(jù)庫時候產(chǎn)生的，請盡量避免。另外可以用一些內(nèi)存測試工具來做一個demo說明hibernate和ibatis誰更快！前臺你想用什么就用什么，struts,webwork都成，如果覺得自己挺牛X可以試試tapestry。

　　用數(shù)據(jù)庫也未必不能解決訪問量巨大所帶來的問題，作成靜態(tài)文件硬盤的尋址時間也未必少于數(shù)據(jù)庫的搜索時間，當然對資料的索引要下一翻工夫。我自己覺得門戶往往也就是當天、熱門的資料點擊率較高，將其做緩存最多也不過1~2G的數(shù)據(jù)量吧，舉個例子：

拿網(wǎng)易新聞來http://news.163.com/07/0606/09/3GA0D10N00011229.html

　　格式化一下，方便理解：http://域名/年/月日/新聞所屬分類/新聞ID.html

　　可以把當天發(fā)布的、熱門的、流攬量大的作個緩寸，用hashtable（key：年-月-日-分類-ID，value：新聞對象），靜態(tài)將其放到內(nèi)存（速度絕對快過硬盤尋址靜態(tài)頁面）。

通常是采用oracle存儲過程＋2個weblogic，更新機制也幾乎一樣每簽發(fā)一條新聞，就會生成靜態(tài)頁面，然后發(fā)往前端的web服務器，前端的web都是做負載均衡的。另外還有定時的程序，每5-15分鐘自動生成一次。在發(fā)布新聞的同時將數(shù)據(jù)緩存。當然緩存也不會越來越大，在個特定的時間段（如凌晨）剔除過期的數(shù)據(jù)。做一個大的網(wǎng)站遠沒有想象中那么簡單，服務器基本就要百十個的。

　　這樣可以大大增加一臺計算機的處理速度，如果一臺機器處理不了，可以用httpserver集群來解決問題了。

　　2、網(wǎng)絡
　　中國的網(wǎng)絡分南北電信和網(wǎng)通，訪問的ip就要區(qū)分南北進入不同的網(wǎng)絡。

　　3、集群
　　通常會使用CDN與GSBL與DNS負載均衡技術(shù)，每個地區(qū)一組前臺服務器群，例如：網(wǎng)易，百度使用了DNS負載均衡技術(shù)，每個頻道一組前臺服務器，一搜使用了DNS負載技術(shù)，所有頻道共用一組前臺服務器集群。

　　網(wǎng)站使用基于Linux集群的負載均衡，失敗恢復，包括應用服務器和數(shù)據(jù)庫服務器，基于linux-ha的服務狀態(tài)檢測及高可用化。

　　應用服務器集群可以采用apache+tomcat集群和weblogic集群等；web服務器集群可以用反向代理，也可以用NAT的方式，或者多域名解析都可以；Squid也可以，方法很多，可以根據(jù)情況選擇。

　4、數(shù)據(jù)庫

　　因為是千萬人同時訪問的網(wǎng)站，所以一般是有很多個數(shù)據(jù)庫同時工作的，說明白一點就是數(shù)據(jù)庫集群和并發(fā)控制，數(shù)據(jù)分布到地理位置不同的數(shù)據(jù)中心，以免發(fā)生斷電事故。另外還有一點的是，那些網(wǎng)站的靜態(tài)化網(wǎng)頁并不是真的，而是通過動態(tài)網(wǎng)頁與靜態(tài)網(wǎng)頁網(wǎng)址交換做出現(xiàn)的假象，這可以用urlrewrite 這樣的開源網(wǎng)址映射器實現(xiàn)。這樣的網(wǎng)站實時性也是相對的，因為在數(shù)據(jù)庫復制數(shù)據(jù)的時候有一個過程，一般在技術(shù)上可以用到hibernate和 ecache，但是如果要使網(wǎng)站工作地更好，可以使用EJB和websphere，weblogic這樣大型的服務器來支持，并且要用oracle這樣的大型數(shù)據(jù)庫。

　　大型門戶網(wǎng)站不建議使用Mysql數(shù)據(jù)庫，除非你對Mysql數(shù)據(jù)的優(yōu)化非常熟悉。Mysql數(shù)據(jù)庫服務器的master-slave模式，利用數(shù)據(jù)庫服務器在主從服務器間進行同步，應用只把數(shù)據(jù)寫到主服務器，而讀數(shù)據(jù)時則根據(jù)負載選擇一臺從服務器或者主服務器來讀取，將數(shù)據(jù)按不同策略劃分到不同的服務器（組）上，分散數(shù)據(jù)庫壓力。

　　大型網(wǎng)站要用oracle，數(shù)據(jù)方面操作盡量多用存儲過程，絕對提升性能；同時要讓DBA對數(shù)據(jù)庫進行優(yōu)化，優(yōu)化后的數(shù)據(jù)庫與沒優(yōu)化的有天壤之別；同時還可以擴展分布式數(shù)據(jù)庫，以后這方面的研究會越來越多；

　　5、頁面

　　從開始就考慮使用虛擬存儲/簇文件系統(tǒng)。它能讓你大量并行IO訪問，而且不需要任何重組就能夠增加所需要的磁盤。

　　頁面數(shù)據(jù)調(diào)用更要認真設計，一些數(shù)據(jù)查詢可以不通過數(shù)據(jù)庫的方式，實時性要求不高的可以使用lucene來實現(xiàn)，即使有實時性的要求也可以用lucene，lucene+compass還是非常優(yōu)秀的。

　　新聞類的網(wǎng)站可以用靜態(tài)頁存儲，采用定時更新機制減輕服務器負擔；首頁每個小模塊可以使用oscache緩存，這樣不用每次都拉數(shù)據(jù)。

　　前端的基于靜態(tài)頁面緩存的web加速器，主要應用有squid等。squid 將大部分靜態(tài)資源(圖片，js，css等）緩存起來，直接返回給訪問者，減少應用服務器的負載網(wǎng)站的靜態(tài)化網(wǎng)頁并不是真的，而是通過動態(tài)網(wǎng)頁與靜態(tài)網(wǎng)頁網(wǎng)址交換做出現(xiàn)的假象，這可以用urlrewrite這樣的開源網(wǎng)址映射器實現(xiàn)，后綴名為htm或者html并不能說明程序生成了靜態(tài)頁面，可能是通過 url重寫來實現(xiàn)的，為的只不過是在搜索引擎中提升自己網(wǎng)站的覆蓋面積罷了。

　　生成靜態(tài)頁面的服務器和www服務器是兩組不同的服務器，頁面生成后才會到www服務器，一部分數(shù)據(jù)庫并不是關(guān)系數(shù)據(jù)庫，這樣更適合信息衍生，www、mail服務器、路由器多，主要用負載平衡解決訪問瓶頸。

　　靜態(tài)頁面的缺點：

　　1) 增加了程序的復雜度

　　2) 不利于管理資料

　　3) 速度不是最快

　　4) 傷硬盤

　　6、緩存

　　從一開始就應該使用緩存，高速緩存是一個更好的地方存儲臨時數(shù)據(jù)，比如Web站點上跟蹤一個特定用戶的會話產(chǎn)生的臨時文件，就不再需要記錄到數(shù)據(jù)庫里。

　　不能用lucene實現(xiàn)的可以用緩存，分布式緩存可以用memcached，如果有錢的話用10來臺機器做緩存，> 10G的存儲量相信存什么都夠了；如果沒錢的話可以在頁面緩存和數(shù)據(jù)緩存上下功夫，多用OSCACHE和EHCACHE，SWARMCACHE也可以，不過據(jù)說同步性不是很好；

　　可以使用Memcache進行緩存，用大內(nèi)存把這些不變的數(shù)據(jù)全都緩存起來，而當修改時就通知cache過期，memcache是LJ開發(fā)的一款分布式緩存產(chǎn)品，很多大型網(wǎng)站在應用，我們可以把Cache Server與AppServer裝在一起。因為Cache Server對CPU消耗不大，而有了Cache Server的支援，App Server對內(nèi)存要求也不是太高，所以可以和平共處，更有效的利用資源。

posted on 2009-11-30 16:50 筱筱閱讀(272) 評論(0) 編輯收藏

新用戶注冊刷新評論列表


只有注冊用戶登錄后才能發(fā)表評論。




網(wǎng)站導航: 博客園 IT新聞 Chat2DB C++博客博問管理

vickzhu

常用鏈接

留言簿(6)

隨筆檔案

搜索

最新評論

閱讀排行榜

評論排行榜