亚洲欧洲日产国码二区首页,亚洲国语精品自产拍在线观看,久久精品国产亚洲

Redis 3.X版本引入了集��的新特性的三种用法

Sun, 07 Aug 2016 09:32:00 GMT

一、利用Jedis来实�?br />

Set jedisClusterNodes = new HashSet();

//Jedis Cluster will attempt to discover cluster nodes automatically

jedisClusterNodes.add(new HostAndPort("10.96.5.183",9001));

jedisClusterNodes.add(new HostAndPort("10.96.5.183",9002));

jedisClusterNodes.add(new HostAndPort("10.96.5.183",9003));

JedisCluster jc = new JedisCluster(jedisClusterNodes);

二、利用spring-data-redis来实�?br />

org.springframework.data.redis.connection.RedisNode">

....

org.springframework.data.redis.connection.RedisClusterConfiguration">

clusterNodes">

org.springframework.data.redis.connection.jedis.JedisConnectionFactory" p:use-pool="true">

org.springframework.data.redis.core.RedisTemplate" p:connection-factory-ref="jedisConnFactory" />

personRepo" class="com.example.repo.impl.PersonRepoImpl">

三、简单集成Spring

自己�~�写jedisCluster的工厂类JedisClusterFactory,然后通过Spring注入的方式获取jedisCluster,实现客户端��用Redis3.0版本的集��特性�?/p>

常言�W?/a> 2016-08-07 17:32 发表评论

Thu, 28 Jun 2012 07:41:00 GMT

提问

◆ Perl、Python、Ruby和PHP各自有何特点?

◆ ��Z��么动态语�a�多作��量��的解��x��?

◆ LAMP��Z��么受�Ƣ迎?

◆ Ruby on Rails��Z��么会(x��)��行?

◆ �~�程语言的发展趋势是什�?

讲解

“剩下四种动态语�a��Q�我们将之归为后台脚本语�a��?#8221;冒号说着��M��张图�?#8212;—

引号听得仔细�Q?#8220;我记得�?zh��n)�开始是把这些语�a�划分为C族静态语�a�、非C族静态语�a�和动态语�a�三类的�?#8221;

冒号解释�Q?#8220;那是按语法来划分的，偏重理论;现在是按应用来划分，偏重实践�?#8221;

句号旋即联想刎ͼ�(x��)“�q�种分法貌似三层架构——前台语言对应表现�?�q�_��语言和后台脚本语�a�对应业务逻辑�?�pȝ��语言对应数据层�?#8221;

“�?��有几分��似�Q�但千万不可��h��?#8221;冒号提醒道，“三层架构(three-layer architecture)是模块设计上的逻辑划分[1];而这里是按语�a�应用范围�q�行的物理划�?#8212;—与用户交互的是前台语�a��Q�与机器交互的是�pȝ��语言�Q?介于其中的�ؓ(f��)前台提供服务同时又需要底层系�l�服务的是后台语�a��?#8221;

逗号询问�Q?#8220;后台语言又细分成�q�_��语言与后台脚本语�a�?”

“�q?是基于程�?program)与脚�?script)、静态与动态而分的�?#8221;冒号�q�行说明�Q?#8220;其实Perl�Q�PHP�Q�Python和Ruby都有自己的虚拟机(virtual machine)�Q�从�q�种意义上说它们也可作�ؓ(f��)�q�_��语言。但在实际应用中�Q�它们没有Java�q�_��?NET�q�_��那种整合凝聚力和核心作用�Q�通常作�ؓ(f��)轻量�U?的解��x��案�?#8221;

问号��x��个究竟：(x��)“�q�是�׃��它们都是动态语�a�的缘故吗?”

冒号回答�Q?#8220;理论上动态语�a�同样能承担大型应用，但实践上它们多作为粘合语�a�或用于中��型应用。用句时髦的话来形容�Q�暂时还是主��的配角或非��L��的主角。毕竟在�q�行效率、类型安全、可用资源、开发工兗��技术支持等斚w��Q�它们与Java、C#相比��有一定差距。另外它们同�?#8216;草根’语言�Q�虽有开源社区的大力支持�Q�在影响力上与后者未可同日而语�?#8221;

叹号揣测�Q?#8220;说不定在不久的将来，动态语�a�也会(x��)成�ؓ(f��)��L��的主角�?#8221;

“�?易时�U�，�D�难逆料。但有一点可以肯定，语言的发展趋势一定是动静�l�合、刚柔�ƈ��?#8221;冒号断言�Q?#8220;一斚w��以Java和C#��Z��表的静态语�a�中嫁接了动态语�a� 的枝�?另一斚w��以Java�?NET��Z��表的�q�_��与动态语�a�的交壤地带也在逐步扩大。比如JRuby允许Ruby与Java之间互相调用�Q�类似的�q�有 Jython、IronRuby、IronPython�{�等。此外值得一提的是，动态语�a�最�z�跃的舞台当数LAMP�Q�L-A-M-P�?#8221;

引号接茬�Q?#8220;L是Linux�Q�A是Apache�Q�M是MySQL�Q�P是PHP。这四大�l��g形成了一个完整的开源网�l�开发��^台�?#8221;

冒号补充道：(x��)“P也可指Perl、Python�Q�甚至Ruby�?#8221;

逗号调侃�Q?#8220;可惜Ruby�?#8216;R’�?#8216;P’多了一根尾巴�?#8221;

“�?��Zؓ(f��)了自圆其��_(d��)��q�脆让P表示‘Programming language’�Q�这下所有语�a�都囊括其中了。老外��喜�Ƣ玩�q�种首字母羃�?acronym)的文字游戏，��其LAMP正好�q�有‘�?#8217;的含义，寓意开�?世界的一盏明灯，他们一定更得意了�?#8221;冒号语带调笑�Q?#8220;前面我们曾提�?qi��ng)，�|�络应用是生长动态语�a�最肥沃的土壤，而LAMP��是�q�块土壤上搭建的�q�_��。作�?�|�络�q�_��Q�LAMP以其开攄��z�R��开发迅速、部�|�方�ѝ��高可配�|�、安全可靠、成本低廉等特色而与Java�q�_��?NET�q�_��鼎��三分�Q�尤其受中小企业的欢 �q�。LAMP中Linux是操作系�l�，Apache是Web服务器，MySQL是数据库�pȝ��Q�而我们当下最兛_��的是‘P族语�a�’�Q�PHP、Perl�?Python�q�有Ruby�?#8221;

问号��Q?#8220;作�ؓ(f��)动态语�a��Q�它们的共性上节课已经谈了不少�Q�能说说它们的个性吗?”

“它们的个性极为鲜明：(x��)Perl凝练晦�ӆ�Q�Python优雅明晰�Q�Ruby�_��y灵动�Q�PHP��明单�U�。先看老大哥Perl�Q�它博采众家之长�Q�综合了C语言的结构、sed的正则表辑ּ�、AWK的关联数�l?associative array)、Lisp的表(list)和Unix Shell的命令，此外�q�有借鉴了一�U�语�a��Q�你们知道是哪种�?”冒号忽然卖了个关子�?br />
逗号猜想�Q?#8220;应该是某�U�OOP语言吧�?#8221;

“Perl 中确有不��C++的媄子，但它的对象模型在5.0以后才引入，典型的半路出�Ӟ��q�不如前面的特征那么自然。与其说是一�U�自然而然的发展，不如说是在OOP 潮流�Ҏ(gu��)��下的一�U��n不由��q��q�合。真正深入骨髓的借鉴是自然语�a��?#8221;冒号�l�出了答案，“我们提过�Q�Perl的发明者Larry Wall是一名语�a�学家�Q�他认�ؓ(f��)�E�序语言应该与自然语�a�一��P��z�自然、易��L��写、表辑֤�栗��不拘一根{��Perl�q�有不少的格�a�或哲学，使得�~�程语言一�?严�}��L��的面孔，散发出浓郁的人文气息�?#8221;

叹号�q�了一默：(x��)“我见�q�Perl的代码，人文气息没闻出来�Q�但我怀疑有乙醚气息——看一�?x��)就觉得晕晕乎乎的�?#8221;

众�h大笑�?br />
“�?��Z��用一行Perl代码��实��C��RSA��法�Q�你看了那还不得当场晕倒啊?”冒号打趣道，“Perl的各�U�魔�W�好��g��把把锋利的剪刀�Q�做��h��本裁剪之�cȝ��?作来游刃有余。这是它最大的长处�Q�当初Perl��是Wall用来做Unix�pȝ��理的，以后在CGI上的�q�泛应用也得益于此。这也赋予Perl极强的粘�?力，因而有‘internet上的胶带(duct tape)[2]’的说法。它又号�U�瑞士军刀�Q�精�l�而复杂，实用而强大。但Perl�q�于灉|��自由�Q�缺乏规范，影响了程序的可读性、一致性、整�z�性和可维�?性。不熟�?zh��n)�该语�a�的固然如��d��书，熟�?zh��n)�语言而不熟�?zh��n)�问题的也颇费思量。相比之下Python被认为是Perl有力的挑战者，不仅在于它天然的OO设计和丰富的�c�d��Q�更重要的是它对�E�序员友好度大大��过Perl。Python也有一�p�d��的被�U�Cؓ(f��)��?Zen)的哲学，不少与Perl是针锋相对的。比如：(x��)Perl认�ؓ(f��)做一件事可以有多�U�方法，而Python认�ؓ(f��)一件事应该最好只有一�U�方�?Perl�q�求语言的表现力�Q�Python�q�求��单优 �?Perl喜欢隐性暗�C�，Python��显性明�C?Perl��紧凑�Q�Python��松散; Perl的语法和语义丰富�Q�Python的语法和语义��单而类库丰富。或许Python最让�h不习(f��n)惯的是它对空白符敏感性�?#8221;

引号感到惊奇�Q?#8220;对空白符敏感?�q�个倒真怪异�?#8221;

�?可��惯不怪：(x��)“虽然有点�q�反�?f��n)惯�Q�但非常�W�合Python一贯的规范��z�的风格——一斚w��从语法上保证了良好的�~�码风格;另一斚w��Q�每个代码块不再需要�v 始的大括��h��begin/end之类的，减少了的代码行数。顺便插一句，另外一�U�优雅的语言Haskell同样对空白符敏感�Q�或�怼�雅正是来自对�l�节和规范的重视吧。此外许多�h抱怨Python中的自引用self太多�Q�殊不知�q�也是它倡导昑ּ�表达的一�U�体现。�ȝ��看来�Q�Python主要的问题还是在性能�?率上不尽如�h意�?#8221;

叹号好奇地问�Q?#8220;Ruby怎么�?据说它将取代Java�?#8221;

“不要轻言‘取代’二字�?#8221;冒号规诫道，“Java没有取代C++�Q�也不会(x��)被Ruby取代�Q�至多只是一�U�再分配。不�q�Ruby的确是门很可��q��语言�Q�兼具Perl的表现力和Python的可 ��L��。Ruby背后最��L(f��ng)��色的理念是：(x��)��x��E�序员��用语�a�时的感受��过语言本��n的功能。通俗地说�Q�兵器的�U�手比锋利更重要;文雅地说�Q�应�l�予�E�序员更多的人文��x��。就拿代码块(block)和�P代器(iterator)来说�Q�虽然均非Ruby首创�Q�但其语法最��心�?zh��n)�目。类似的例子比比皆是。Ruby的元 �~�程能力特别强，也是它高度灵�zȝ��一�U�体玎ͼ�但�ƈ不是所有�h都喜�Ƣ这�U�风根{��Ruby的主要弱�Ҏ(gu��)��两个�Q�一个与Python�c�M��Q�在性能上还有待提高;�?一个是它的�U�程��q��L(f��ng)��?user space)而不是内核空�?kernel space)来管理[3]�Q�不能充分利用多核或多CPU。真正让Ruby变得炙手可热的是web应用框架 Ruby on Rails(RoR)的成功，它们�q�催生了Java�q�_��上的Groovy语言和Groovy on Grails框架。RoR奉行的CoC(Convention over Configuration)和DRY(Don’t repeat yourself )原则以及(qi��ng)MVC架构看似了无新意�Q�但与Ruby�l�合之后�Q�便如一只猱�w�而上�늌��Q�立刻衬托出Java�?NET大象般的�w�媄�?#8221;

逗号有些怀疑：(x��)“框架竟然捧红了语�a��Q�框架真有这么重要吗?”

“�?果web应用中动态页面较?y��u)��或业务逻辑不复杂，框架的�h(hu��n)值�ƈ不大。以前CGI�~�程��是往Perl之类的代码中嵌入HTML代码�Q�如同Java中的 Servlet;PHP则单�U�地在HTML代码中插入PHP代码�Q�如同早期的JSP。没有MVC�Q�也不管什么三层架构，更没有ORM。但�?#8212;—”冒号拖了个�{折音�Q?#8220;一旦业务逻辑变得复杂�Q�开发�h员增多，手工作坊式编�E�开始捉襟见肘，引入框架�q�个��水生��U�来提高生��力便是大势所��?#8221;

句号不解�Q?#8220;我想Perl、Python和PHP一定也有不��框�Ӟ��Java中的框架更是泛滥成灾�Q�何以独独RoR脱颖而出?”

�?号作出分析：(x��)“正值web2.0和敏捷开�?agile development)的概忉|��行之际，RoR��AJAX与Ruby�l�合在一��h��为绝佳的回应。以前各�U�web应用框架是不��，但在RoR之前轻量�U�套 ��式解决�Ҏ(gu��)��q�不多。Perl中的Catalyst、Python中的Pylon�q�有PHP中的CakePHP�{�应是效仿之作。因此RoR出现的时机可�?是不早不晚，正当其时。此外，Perl和PHP�׃��q�于��行�Q�反而有不少的历史包袱，��Z��?f��n)惯了将表示逻辑和业务逻辑�~�织在一赗��至于Java企业解决�?案，框架太多�Q�搭配组合更多，增加了选择的难度。即佉K��用最常见的轻量��SSH(Struts+Spring+Hibernate)�l�合�Q�维护�v来也�?RoR�J�杂得多�?#8221;

叹号愈发担忧�Q?#8220;听这意思，Java�q�是危险�?”

“�a�之过早�?#8221;冒号不以为然�Q?#8220;首先RoR�q�有待进一步检验，目前无论是应用广度还是深度上��无法与Java相提�q�论;其次Java在性能、安全等斚w��q�是有不��优势，而这些对于大型和关键性的应用来说��ؓ(f��)重要。即使在中小型web应用中，RoR较之PHP�q�远��Z��?qi��ng)�?#8221;

问号接下话题�Q?#8220;PHP��Z��如此��行?”

“�?为它��单、专一�?#8221;冒号�{�得很干脆，“与Python和Ruby一开始就定位通用语言不同�Q�PHP是专为网�l�而生的。同早期的Perl�怼��Q�PHP起初�?要�v文本�q��o(h��)器的作用�Q�只不过Perl多处理文件流(file stream)�Q�而PHP多处理套接字��?socket stream)。PHP的语法简单，且�ؓ(f��)�|�络应用度��n定造，受到�|�络开发�h员的�q�捧当在情理之中。它虽很实用很流行，但�ƈ不完��。比如：(x��)变量名大��写敏感而函数名大小写不敏感;函数命名规则不一�?不支持namespace和unicode[4];与Perl一��P��它的对象模型不是先天的，直到PHP 5才真正完�?对线�E�支持不��?相比Perl、Python和Ruby�Q�它的功能稍昑֍�薄等�{��?#8221;

引号�H�然惌��v�Q?#8220;我记得�?zh��n)�在第一堂课提到PHP�q�能用于桌面应用�?#8221;

“�?仅PHP�Q�Perl、Python�q�有Ruby�Q�都能作为前台语�a�来开发命令行或图形界面的应用。同样地�Q�VB、Delphi和JavaScript也能作�ؓ(f��)后台语言。现代的�E�序语言既有自己的专长，又向通用化和全能化发展，以争取更多的生存�I�间。试想一下，��C��的程序员又何��不是如此呢?”�a��?qi��ng)于此，�?��h��住话题，“语言��评告一�D�落�Q�还有不��既有趣又有用的语言�Q�在此就不一一评说了。我们看刎ͼ�每种�~�程语言都有其独特的惯例用法和哲学理念，它们与编�E?范式一道�Ş成了语言的编�E�风根{��体�(zh��n)�愈��p��编�E�语感愈强，思维与语�a�愈交融无��，渐从必然王国走向自由王国�?#8221;

逗号满怀憧憬�Q?#8220;那是不是一�U��h剑合一的境�?”

“或许人器合一更准��吧�Q�程序员可不能只�?x��)一�U�兵器哟�?#8221;冒号故意抠他的字��|��“现在请大家每人写一句对本节评��感言�?#8221;

众�h沉思片刻，齐齐挥笔而就——

叹号——没有最好的语言�Q�只有最合适的语言�?br />
逗号——没有�p�糕的语�a��Q�只有糟�p�的�E�序员�?br />
问号——没有一�U�语�a�是万能的�Q�只�?x��)一�U�语�a�是万万不能的�?br />
引号——废除对语�a�的宗教信从ͼ�建立对语�a�的哲学思维�?br />
句号——�~�程��是在�h脑和�?sh��)脑之间��L��最�?j��ng)_�^衡点的过�E��?br />
冒号�ȝŞ大�?zh��n)��Q�顺手一掌拍��Z��记马屁：(x��)“�_�ֽ�之极!可谓字字珠玑、句句联璧啊。兹军_��Q�给�怽�的奖赏是——立时下课!”

众�h�ƣ然领赏而去�?br />
插语

[1] 有两�U�三层架构，一�U�是three-layer architecture�Q�一�U�是three-tier architecture。它们经常换用，但其实是有分别的�Q�前者仅仅在逻辑�q�行划分�Q�而后者在物理上也�q�行了划�?#8212;—不同层次的模块运行在不同的主��Z��?br />
[2] 不少地方译作‘输送带’�?#8216;传送带’�Q�因为duct�?#8216;输送管’�?#8216;导管’之意�Q�于是想当然地认��表明Perl在internet上�v着输送作用。殊不知‘duct type’专指一�U�万能的�_�性极强的胶带�Q�用以比喻Perl的粘合力�?br />
[3] �q�类�U�程被称为绿色线�E?green thread)�Q�也�U�C��U�程。据�U�Ruby2.0��支持原生线�E?native thread)�?br />
[4] PHP��在5.3.0支持namespace�Q�将�?.0支持unicode�?br />
�ȝ��

◆ 比�vJava�q�_��?NET�q�_��Q�动态语�a��M��灉|��、开发效率高�Q�但整合凝聚力还不够�Q�在�q�行效率、类型安全、可用资源、开发工兗��技术支持以�?qi��ng)媄响力�{�方面也有一定差距，故通常作�ؓ(f��)轻量�U�的解决�Ҏ(gu��)��?br />
◆ LAMP是由Linux、Apache、MySQL和包括PHP、Perl、Python或Ruby在内的脚本语�a��l�成的网�l�开发��^収ͼ��h��开攄��z�R��开发迅速、部�|�方�ѝ��高可配�|�、安全可靠、成本低廉等优点�?br />
◆ Perl�_��、复杂、强大、灵�z�R��自由、隐晦、表现力强，但规范性、可��L��、一致性、整�z�性和可维护性较差�?br />
◆ Python优雅规范、简�z�明晰、易学易用、类库丰富，但效率稍差，有些��Z��喜欢它对�I�白�W�敏感的�Ҏ(gu��)��?br />
◆ Ruby语法�_��y、高度灵�z�，兼具Perl的表现力和Python的可��L��，��其注重�E�序员的感受�Q�但其性能和线�E�模型尚有待改进�?br />
◆ PHP��单、专一、实用、流行，在但相比其他三种语言�Q�在语法和功能上�E�有�Ơ缺�?br />
◆ RoR是一�U�轻量��套餐式的web应用解决�Ҏ(gu��)��Q�是由好的设�?MVC架构和CoC、DRY原则)加上好的语言(Ruby)在好的时�?web2.0和敏捷开发风行之�?打造出的好的框架�?br />
◆ 静态语�a�与动态语�a�从语�a�特征到运行环境都在逐渐融合�?br />
◆ �E�序员应该与�E�序语言一��P��既要有自��q��专长�Q�又要向通用化和全能化发展�?br />
◆ �~�程语言惯例用法、哲学理念和�~�程范式形成了语�a�的编�E�风根{�?/div>

常言�W?/a> 2012-06-28 15:41 发表评论

LAMP�|�站架构�Ҏ(gu��)��分析

Thu, 28 Jun 2012 07:00:00 GMT

LAMP�Q�Linux-Apache-MySQL-PHP�Q�网站架构是目前国际��行的Web框架�Q�该框架包括�Q�Linux操作�pȝ��Q�Apache�|?�l�服务器�Q�MySQL数据库，Perl、PHP或者Python�~�程语言�Q�所有组成��品均是开源��Y�Ӟ��是国际上成熟的架构框�Ӟ��很多��行的商业应用都是采取这个架构，和Java/J2EE架构相比�Q�LAMP��h��Web资源丰富、轻量、快速开发等特点�Q�微软的.NET架构相比�Q�LAMP��h��通用、跨�q�_��、高性能、低��h��的优势，因此LAMP无论是性能、质量还是�h(hu��n)格都是企业搭建网站的首选��^台�?p>　　对于大流量、大�q�发量的�|�站�pȝ��架构来说�Q�除了硬件上使用高性能的服务器、负载均衡、CDN�{�之外，在��Y件架构上需要重点关注下面几个环节：(x��)使用高性能的操作系�l�（OS�Q�、高性能的网��|��务器 �Q�Web Server�Q�、高性能的数据库�Q�Databse�Q�、高效率的编�E�语�a��{�。下面我��从�q�几点对其一一讨论�?/p>

　　操作�pȝ��

　　Linux操作�pȝ��有很多个不同的发行版�Q�如Red Hat Enterprise Linux、SUSE Linux Enterprice、Debian、Ubuntu、CentOS�{�，每一个发行版都有自己的特�Ԍ��比如RHEL的稳定，Ubuntu的易用，��Z��E�_��?和性能的考虑�Q�操作系�l�选择CentOS�Q�Community ENTerprise Operating System�Q�是一个理想的�Ҏ(gu��)��?/p>

　　CentOS�Q�Community ENTerprise Operating System�Q�是Linux发行版之一�Q�是RHEL/Red Hat Enterprise Linux的精��免费版，和RHEL为同��L(f��ng)��源代码，不过�Q�RHEL和SUSE LE�{�企业版�Q�提供的升��服务均是收费升��Q�无法免费在�U�升�U�，因此要求免费的高度稳定性的服务器可以用CentOS替代Red Hat Enterprise Linux使用�?/p>

LAMP�|�站架构�?/p>

　　Web服务器、缓存和PHP加�?/strong>

　　Apache是LAMP架构最核心的Web Server�Q�开源、稳定、模块丰富是Apache的优�ѝ��但Apache的缺�Ҏ(gu��)��有些臃肿�Q�内存和CPU开销大，性能上有损耗，不如一些轻量��的Web 服务器（例如nginx�Q�高效，轻量�U�的Web服务器对于静态文件的响应能力来说�q�高于Apache服务器�?/p>

　　Apache做�ؓ(f��)Web Server是负载PHP的最佳选择�Q�如果流量很大的话，可以采用nginx来负载非PHP的Web��h��。nginx是一个高性能的HTTP和反向代理服务器�Q�Nginx以它的稳定性、丰富的功能集、示例配�|�文件和低系�l�资源的消耗而闻名。Nginx不支持PHP和CGI�{�动态语�a��Q�但支持负蝲均衡和容错，可和Apache配合使用�Q�是轻量�U�的HTTP服务器的首选�?/p>

　　Web服务器的�~�存也有多种�Ҏ(gu��)��Q�Apache提供了自��q��~�存�?块，也可以��用外加的Squid模块�q�行�~�存�Q�这两种方式均可以有效的提高Apache的访问响应能力。Squid Cache是一个Web�~�存服务器，支持高效的缓存，可以作�ؓ(f��)�|�页服务器的前置cache服务器缓存相兌��求来提高Web服务器的速度�Q�把Squid攑֜� Apache的前端来�~�存Web服务器生成的动态内容，而W(xu��)eb应用�E�序只需要适当地设�|�页面实效时间即可。如讉K��量巨大则可考虑使用memcache�?为分布式�~�存�?/p>

　　PHP的加速��用eAccelerator加速器�Q�eAccelerator是一个自由开放源码PHP加速器�Q�优化和�?态内容缓存，提高了性能PHP脚本的缓存性能�Q��得PHP脚本在编译的状态下�Q�对服务器的开销几乎完全消除。它�q�有对脚本�v优化作用�Q�以加快其执行效率�?使PHP�E�序代码执效率能提高1-10倍�?/p>

　　具体的解��x��案有以下几种�Q?/p>

　　1、squid + Apache + PHP + eAccelerator

　　使用Apache负蝲PHP�Q��用squid�q�行�~�存�Q�html或图片的��h��可以直接由squid�q�回�l�用戗��很多大型网站都采用�q�种架构�?/p>

　　2、nginx/Apache + PHP�Q�fastcgi�Q?+ eAccelerator

　　使用nginx或Apache负蝲PHP�Q�PHP使用fastcgi方式�q�行�Q�效率较高�?/p>

　　3、nginx + Apache + PHP + eAccelerator

　　此方案综合了nginx和Apache的优点，使用Apache负蝲PHP�Q�nginx负责解析其他Web��h��Q��用nginx的rewrite模块�Q�Apache端口不对外开放�?/p>

　　数据�?/strong>

　　开源的数据库中�Q�MySQL在性能、稳定性和功能上是首选，可以辑ֈ�百万�U�别的数据存储，�|�站初期可以��MySQL和W(xu��)eb服务器放在一��P��但是当访�?量达��C��定规模后�Q�应该将MySQL数据库从Web Server上独立出来，在单独的服务器上�q�行�Q�同时保持Web Server和MySQL服务器的�E�_��q�接�?/p>

　　当数据库讉K��量达到更大的�U�别�Q�可以考虑使用MySQL Cluster�{�数据库集群或者库表散列等解决�Ҏ(gu��)��?/p>

　　�ȝ��来说�Q�LAMP架构的网站性能�?x��)远�q�优于Windows IIS + ASP + Access�Q�例如月光博客）�q�样的网站，可以负蝲的访问量也非常大�Q�国内的大量个�h�|�站如果惌��支撑大访问量�Q�采用LAMP架构是一个不错的�Ҏ(gu��)��?/p>

　　�l�g��所�q�ͼ��Z��LAMP架构设计��h��成本低廉、部�|�灵�z�R��快速开发、安全稳定等特点�Q�是Web�|�络应用和环境的优秀�l�合�?/p>

常言�W?/a> 2012-06-28 15:00 发表评论

Thu, 28 Jun 2012 06:53:00 GMT

一个小型的�|�站�Q�比如个人网站，可以使用最��单的html静态页面就实现了，配合一些图片达到美化效果，所有的��面均存攑֜�一个目录下�Q�这��L(f��ng)��|�站对系�l�架构、性能的要求都很简单，随着互联�|�业务的不断丰富�Q�网站相关的技术经�q�这些年�?发展�Q�已�l�细分到很细的方斚w��面，��其对于大型�|�站来说�Q�所采用的技术更是涉�?qi��ng)面非常�q�，从硬件到软�g、编�E�语�a�、数据库、WebServer、防火墙�{?各个领域都有了很高的要求�Q�已�l�不是原来简单的html静态网站所能比拟的�?
    大型�|�站�Q�比如门��L(f��ng)��站。在面对大量用户讉K��、高�q�发��h��斚w��Q�基本的解决�Ҏ(gu��)��集中在这样几个环节：(x��)使用高性能的服务器、高性能的数据库、高效率的编�E�语�a�、还有高性能的Web容器。但是除了这几个斚w��Q�还没法�Ҏ(gu��)��解决大型�|�站面��(f��)的高负蝲和高�q�发问题�?/span>
    上面提供的几个解��x��\在一定程度上也意味着更大的投入，�q�且�q�样的解��x��\具备瓉��Q�没有很好的扩展性，下面我从低成本、高性能和高扩张性的角度来说说我的一些经�?�?/span>
1、HTML静态化
    其实大家都知道，效率最高、消耗最��的��是�U�静态化的html��面�Q�所以我们尽可能使我们的�|�站上的��面采用静态页面来实现�Q�这个最��单的�Ҏ(gu��)��其实也是最有效的方法。但是对于大量内容�ƈ且频�J�更新的�|�站�Q�我们无法全部手动去挨个实现�Q�于是出��C��我们常见的信息发布系�l�CMS �Q�像我们常访问的各个门户站点的新闻频道，甚至他们的其他频道，都是通过信息发布�pȝ��来管理和实现的，信息发布�pȝ��可以实现最��单的信息录入自动生成静�?��面�Q�还能具备频道管理、权限管理、自动抓取等功能�Q�对于一个大型网站来��_(d��)��拥有一套高效、可��理的CMS是必不可��的�?/span>
    除了门户和信息发布类型的�|�站�Q�对于交互性要求很高的�C�֌��c�d��|�站来说�Q�尽可能的静态化也是提高性能的必要手�D�，��社区内的帖子、文章进行实时的静态化�Q�有更新的时候再重新静态化也是大量使用的策略，像Mop的大杂烩��是使用了这��L(f��ng)��{�略�Q�网易社区等也是如此�?/span>
    同时�Q�html静态化也是某些�~�存�{�略使用的手�D�，对于�pȝ��中频�J��用数据库查询但是内容更新很小的应用，可以考虑使用html静态化来实玎ͼ�比如论坛�?论坛的公用设�|�信息，�q�些信息目前的主��论坛都可以�q�行后台��理�q�且存储在数据库中，�q�些信息其实大量被前台程序调用，但是更新频率很小�Q�可以考虑��这�?分内容进行后台更新的时候进行静态化�Q�这样避免了大量的数据库讉K��h��?/span>
2、图片服务器分离
    大家知道�Q�对于Web服务器来��_(d��)��不管是Apache、IIS�q�是其他容器�Q�图片是最消耗资源的�Q�于是我们有必要��图片与��面�q�行分离�Q�这是基本上大型�|?站都�?x��)采用的�{�略�Q�他们都有独立的囄��服务器，甚至很多台图片服务器。这��L(f��ng)��架构可以降低提供��面讉K��h��的服务器�pȝ��压力�Q��ƈ且可以保证系�l�不�?x��)因为�?片问题而崩溃，在应用服务器和图片服务器上，可以�q�行不同的配�|�优化，比如apache在配�|�ContentType的时候可以尽量少支持�Q�尽可能��的 LoadModule�Q�保证更高的�pȝ��消耗和执行效率�?/span>
3、数据库集群和库表散�?/span>
    大型�|�站都有复杂的应用，�q�些应用必须使用数据库，那么在面对大量访问的时候，数据库的瓉��很快��p��昄��出来�Q�这时一台数据库��很快无法满��_��用，于是�?们需要��用数据库集群或者库表散列。在数据库集��方面，很多数据库都有自��q��解决�Ҏ(gu��)��Q? Oracle、Sybase�{�都有很好的�Ҏ(gu��)��Q�常用的MySQL提供的Master/Slave也是�c�M��的方案，�(zh��n)��用了什么样的DB�Q�就参考相应的解决 �Ҏ(gu��)��来实施即可�?/span>
    上面提到的数据库集群�׃��在架构、成本、扩张性方面都�?x��)受到所采用DB�c�d��的限�Ӟ��于是我们需要从应用�E�序的角度来考虑改善�pȝ��架构�Q�库表散列是常用�q�且最有效的解��x��案。我们在应用�E�序中安装业务和应用或者功能模块将数据库进行分��，不同的模块对应不同的数据库或者表�Q�再按照一定的�{�略�Ҏ(gu��)��个页面或者功能进行更��的数据库散列，比如用户表，按照用户ID�q�行表散列，�q�样��p��够低成本的提升系�l�的性能�q�且有很好的扩展性。sohu的论坛就是采用了�q�样的架构，��论坛的用户、设�|�、帖子等信息�q�行数据库分��，然后对帖子、用��h��照板块和ID�q�行散列数据库和表，最�l�可以在配置文�g中进行简单的配置便能让系�l?随时增加一��C��成本的数据库�q�来补充�pȝ��性能�?/span>
4、缓�?/strong>
    �~�存一词搞技术的都接触过�Q�很多地方用到缓存。网站架构和�|�站开发中的缓存也是非帔R��要。这里先讲述最基本的两�U�缓存。高�U�和分布式的�~�存在后面讲�q�。架构方面的�~�存�Q�对Apache比较熟�?zh��n)�的�h都能知道Apache提供了自��q��~�存模块�Q�也可以使用外加的Squid模块�q�行�~�存�Q�这两种方式均可以有效的提高Apache的访问响应能力�?/span>
    �|�站�E�序开发方面的�~�存�Q�Linux上提供的Memory Cache是常用的�~�存接口�Q�可以在web开发中�? 用，比如用Java开发的时候就可以调用MemoryCache对一些数据进行缓存和通讯�׃�n�Q�一些大型社��Z��用了�q�样的架构。另外，在��用web语言开发的时候，各种语言基本都有自己的缓存模块和�Ҏ(gu��)��?/span>
5、镜�?/span>
    镜像是大型网站常采用的提高性能和数据安全性的方式�Q�镜像的技术可以解决不同网�l�接入商和地域带来的用户讉K��速度差异�Q�比如ChinaNet�?EduNet之间的差异就促��了很多网站在教育�|�内搭徏镜像站点�Q�数据进行定时更新或者实时更新。在镜像的细节技术方面，�q�里不阐�q�太深，有很多专业的�?成的解决架构和��品可选。也有廉��L(f��ng)��通过软�g实现的思�\�Q�比如Linux上的rsync�{�工�?�?/span>
6、负载均�?/span>
    负蝲均衡��是大型�|�站解决高负药��问和大量�q�发��h��采用的终极解军_��法�?/span>
    负蝲均衡技术发展了多年�Q�有很多专业的服务提供商和��品可以选择�Q�我个�h接触�q�一些解��x��法，其中有两个架构可以给大家做参考�?/span>
��g四层交换
    �W�四层交换��用第三层和第四层信息包的报头信息�Q�根据应用区间识别业务流�Q�将整个区间�D늚�业务��分配到合适的应用服务器进行处理。第四层交换功能��p��是虚 IP�Q�指向物理服务器。它传输的业务服从的协议多种多样�Q�有HTTP、FTP、NFS、Telnet或其他协议。这些业务在物理服务器基��上，需要复杂的载量�q��法。在IP世界�Q�业务类型由�l�端TCP或UDP 端口地址来决定，在第四层交换中的应用区间则由源端和终端IP地址、TCP和UDP端口共同军_��?/span>
    在硬件四层交换��品领域，有一些知名的产品可以选择�Q�比如Alteon、F5�{�，�q�些产品很昂贵，但是物有所��|��能够提供非常优秀的性能和很灉|��的管理能力。Yahoo中国当初接近2000台服务器使用了三四台Alteon��搞定了�?/span>
软�g四层交换
    大家知道了硬件四层交换机的原理后�Q�基于OSI模型来实现的软�g四层交换也就应运而生�Q�这��L(f��ng)��解决�Ҏ(gu��)��实现的原理一��_(d��)��不过性能�E�差。但是满��一定量的压力还是游刃有余的�Q�有��软�g实现方式其实更灵�z�，处理能力完全看你配置的熟�(zh��n)�能力�?/span>
    软�g四层交换我们可以使用Linux上常用的LVS来解冻I��LVS��是Linux Virtual Server�Q�他提供了基于心跳线heartbeat的实时灾隑ֺ�对解��x��案，提高�pȝ��的鲁��性，同时可供了灵�zȝ��虚拟VIP配置和管理功能，可以同时�?��_��U�应用需求，�q�对于分布式的系�l�来说必不可��?/span>
    一个典型的使用负蝲均衡的策略就是，在��Y件或者硬件四层交换的基础上搭建squid集群�Q�这�U�思�\在很多大型网站包括搜索引擎上被采用，�q�样的架构低�?本、高性能�q�有很强的扩张性，随时往架构里面增减节点都非常容易。这��L(f��ng)��架构我准备空了专门详�l�整理一下和大家探讨�?/span>
    对于大型�|�站来说�Q�前面提到的每个�Ҏ(gu��)��可能都会(x��)被同时��用到�Q�我�q�里介绍得比较浅显，具体实现�q�程中很多细节还需要大家慢慢熟�(zh��n)�和体会(x��)�Q�有时一个很��的squid参数或者apache参数讄��Q�对于系�l�性能的媄响就�?x��)很大，希望大家一赯��论，辑ֈ�抛砖引玉之效�?/span>
讨论大型高�ƈ发负载网站的�pȝ��架构问题�Q�作者提��Z��几点��Q?/span>
1. HTML静态化�Q�这可以通过CMS 自动实现�Q?/span>
2. 囄��服务器分��（�c�M��的，在视频网站中�Q�视频文件也应独立出来）�Q?/span>
3. 数据库集��和库表散列�Q�Oracle、MySQL�{�DBMS都有完美的支持；
4. �~�存�Q�比如��?Apache的Squid模块�Q�或者是开发语�a�的缓存模块，�Q?/span>
5. �|�站镜像�Q?/span>
6. 负蝲均衡�?/span>
    作者将负蝲均衡�U�Cؓ(f��)“是大型网站解决高负荷讉K��和大量�ƈ发请求采用的�l�极解决办法”�Q��ƈ提出“一个典型的使用负蝲均衡的策略就是，在��Y件或者硬件四层交�?的基��上搭建squid集群”。在实践时可以考虑建立应用服务器集��和W(xu��)eb服务器集��，应用服务器集��可以采用Apache+Tomcat集群�?WebLogic集群�{�，W(xu��)eb服务器集��可以用反向代理�Q�也可以用NAT的方式，或者多域名解析均可�?/span>
    从提升网站性能的角度出发，静态资源不应和应用服务器放在一��P��数据库服务器也应��? 量独立开来。在典型的MVC模式中，��p��来完成数据逻辑处理的，对系�l�性能有着臛_��重要的媄响。以Java EE��Z��Q�在OO的设计思想中，我们��pȝ��的抽象、重用、可�l�护性，��下层的更改不�?x��)扩散到上层逻辑�Q�强调系�l�移植的便捷性，因而往往存在一�U�过分抽象的问题�Q�比如在Hibernate的基��上再加入一层DAO的设计。另外一斚w��Q�却�?x��)忽视利用DBMS本��n的优�U��Ҏ(gu��)��（存储�q?�E�、触发器�Q�来完成高效的数据处理。诚�Ӟ��如果客户要求��数据从Oracle�U�L��到MySQL�Q�那么DBMS�Ҏ(gu��)��的东西��少�Q�移植便��容易。但事实上，�?实践中，提出�c�M��U�L��要求的情况非常少见，因此在做架构设计�Ӟ��不一定�ؓ(f��)了这�U�潜在的需求而大�q�牺牲系�l�的性能与稳定性。此外，我不��采用分布式数据库 ��理�l�构�Q�这样带来的开销太大�Q�数据维护也是个头痛的问题，��可能采用集中式的数据管理�?/span>
    在商业系�l�中�Q�算法逻辑本��n�q�不复杂�Q�在�q�种情况下，�E�序设计本��n的好坏不�?x��)对�pȝ��的性能造成致命的媄响。重要的影响因素反而变��Y件系�l�架构本�w�。在�?�l�的CORBA、J2EE、DCOM�{�对象模型中�Q�我们看��C��家们对分布式对象计算的理论偏好，但实践证明，对象的分布带来的恶劣影响�q�远胜过其积极意义。这�? 是现在轻量��的开发框架受推崇的一个重要原因。如果能用简单的�Q�就不要用复杂的�Q�例如能够用Python、RoR完成的�Q务，是否一定要用Java来做�Q?我看未必。对于用��h��_(d��)��他们兛_��的不是采用什么先�q�的技术，而是我们提供的��品能否满��他的需求。而且�Q�Python、RoR�q�些开发工具已�l�强大到��?以应对大部分�|�站应用�Q�在各种�~�存�pȝ��的帮助下�Q�在其他技术的协调配合下，完全能够胜�Q高负载高�q�发的网站访问�Q务�?/span>
    在HTML静态化斚w��Q�如果是对于更新相对较少的页面，可以�q�样处理�Q�例如新闅R��社区通告、或者类��g��淘宝�|�的产品分类信息。但若数据更新频�J�，�q�样做的意义便不大�?/span>
    �|�站镜像是个传统的技术，更高�U�的应用来自��媒体领域的CDN(Content Delivery Network)�Q�CDN的概念可以由��媒体数据扩展到囄��、视频文件等静态资源的传输。不�q�，在电(sh��)子商务领域，很少有这��L(f��ng)��应用�?/span>

开源��^台的高�ƈ发集��思考目前碰到的高�ƈ发应用，需要高性能需求的主要是两个方�?
1。网�l?/span>
2。数据库
�q�两个方面的解决方式其实�q�是一致的
1。充分接�q�单机的性能瓉��Q�自我优�?/span>
2。单机搞不定的时�?数据传输瓉��:单位旉��内磁盘读�?�|�络数据包的收发cpu计算瓉��)�Q�把负荷分担�l�多台机器，��是所谓的负蝲均衡
�|�络斚w��单机的处�?/span>
1。底层包收发处理的模式变�?从select 模式到epoll / kevent)
2。应用模式的变化
2.1 应用层包的构造方�?/span>
2.2 应用协议的实�?/span>
2.3 包的�~�冲模式
2.4 单线�E�到多线�E?/span>
�|�络负蝲均衡的几个办�?/span>
1。代理模式：(x��)代理服务器只��收发包�Q�收到包以后转给后面的应用服务器��（服务器群后可能还�?x��)有一堆堆的数据库服务器等�{�）�Q��ƈ且把�q�回的结果再�q�回�l�请求端
2。虚拟代理ip�Q�代理服务器收发包还负蝲太高�Q�那��增加多��C��理服务器�Q�都来管包的转发。这些代理服务器可以用统一的虚拟ip�Q�也可以单独的ip
3。p2p�Q�一些广播的数据可以p2p的模式来减轻服务器的�|�络压力
数据�?指mysql)�?机的处理
1。数据库本��n�l�构的设计优化（分表�Q�分记录�Q�目的在于保证每个表的记录数在可定的范围内）
2。sql语句的优�?/span>
3。master + slave模式
数据库集��的处理
1。master + slave模式 �Q�可有效地处�?�q�发查询�Q?/span>
2。mysql cluster 模式 �Q�可有效地处理�ƈ发数据变化）

常言�W?/a> 2012-06-28 14:53 发表评论

Thu, 28 Jun 2012 06:48:00 GMT

我们知道�Q�对于一个大型网站来��_(d��)��可�׾~�性是非常重要的，怎么样在�U�向和横向有良好的可伸羃性，��需要在做架构设计的时候考虑��C��个分的原则，我想在多个方面说一下怎么分：(x��)
首先是横向的分：(x��)
1. 大的�|�站化解为多个小�|�站�Q�当我们一个网站有多个功能的时候，可以考虑把这个网站拆分成几个��模块，每一个模块可以是一个网站，�q�样的话我们到时候就可以很灵�z�d��L��q�些�|�站部��v��C��同的服务器上�?/p>
2. 静态动态分��：(x��)静态文件和动态文件最好分��d��?个网站，我们知道静态网站和动态网站对服务器来说压力的侧重不同�Q�前者可能重IO后者重CPU�Q�那么我�?在选择��g的时候也可以有侧重，而且静态和动态内容的�~�存�{�略也不一栗��典型的应用�Q�我们一般会(x��)有独立的文�g或图片服务器。而且�Q��用不用的域名�q�可以提高浏览器�q�行加蝲的能力�?/p>
3. 按照功能来分�Q�比如有一个模块是负责上传的，上传操作很消耗时��_(d��)��如果和其它应用�؜在一��L(f��ng)��话很可能�Q�一点点讉K��׃��(x��)使服务器瘫痪�Q�这�U�特�D�的模块应该分开。安全的不安全的也要分开�Q�还需要考虑��C��后SSL的购买�?/p>
4. 我们不一定要全部用自��q��服务器，搜烦、报表可以依靠别人的服务�Q�比如google的搜索和报表服务�Q�自己做的不一定比得过别�h�Q�服务器带宽都省了�?/p>
其次是纵向的分：(x��)
1. 文�g也相当于数据库，IO的流量可能比数据库还大，�q�也��是�U�向�U�别的访问，上传的文件图片一定要和W(xu��)EB服务器分开。当�Ӟ��数据库和�|�站都放在一个服务器上的很少了，�q�是最基本的�?/p>
2. 对于涉及(qi��ng)到数据库讉K��的动态程序来��_(d��)��我们可以使用一个中间层�Q�所谓的应用层或逻辑层）来访问数据库�Q�部�|�在独立的服务器上）�Q�最大的好处��是�~�存和灵�z?性。缓存的内存占用比较大，我们要把它和�|�站�q�程分开�Q�而且�q�样做我们可以很方便的去改变一些数据访问的�{�略�Q�即使到时候数据库有分布的话在�q�里可以做一个调配工作，�q�样灉|��性就很大了。还有好处是中间层可以做�늺��|�通桥梁，可能�|�通访问双�U�再讉K��?sh��)信会(x��)比�|�通直接访问电(sh��)信服务器快�?/p>
有�h说我不分�Q�我可以做负载均衡，对，是可以的�Q�但是如果分的话�Q�同��L(f��ng)��10台机器肯定比不分10台机器可以承受更多的讉K��量，而且对硬件的需求可能不 �?x��)很高，因��?f��)知道需要哪个硬件特别好。争取让每一个服务期都不�I�闲�Q�又都不是太忙，合理�q�行�l�合调整和扩充，�q�样的系�l��׾~�性就高了�Q�能�Ҏ(gu��)��讉K��量来调整的前提就是之前有考虑到分�Q�分的好处是灉|��性、�׾~�性、隔��L��以�?qi��ng)安全性�?/p>
�Ҏ(gu��)��务器来说�Q�我们有几点是要长期观察的，��M��一炚w��可能是瓶颈：(x��)
1. CPU�Q�动态文件的解析需要比较多的CPU�Q�CPU出现瓉��p��看是不是哪个功能�q�长旉��占用�U�程�Q�如果是��分出去。或者就是每一个请求处理时间不长，但是讉K��量很高，那么��加服务器。CPU是好东西�Q�不能让他干�{�，不做事情�?/p>
2. 内存�Q�缓存从IIS�q�程独立出去�Q�一般对WEB服务器来说内存不够的情况不是很多。内存比��盘快，要合理利用�?/p>
3. ��盘I(y��)O�Q�用性能监视器找到哪些文件IO特别大，扑ֈ�了就分到独立的一�l�文件服务器上去�Q�或者直接做CDN。磁盘慢�Q�大规模��d��数据的应用靠�~�存�Q�大规模写入数据的应用可以靠队列来降低突发的�q�发�?/p>
4. �|�络�Q�我们知道，�|�络的通讯是比较慢的，比磁盘还慢，如果是做分布式缓存，分布式计��的话，要考虑到物理服务器之间�|�络通讯的时��_(d��)��当然�Q�在��量大了�?后，�q�可以提高系�l�的接纳能力一个等�U�。静态内容可以借助CSD分担一部分�Q�在做服务器假设的时候还要考虑中国特色的电(sh��)信网通情况以�?qi��ng)防火墙�?/p>
对SQL SERVER数据库服务器来说�Q?/p>
其实�q�是水��^分割和纵向分�Ԍ��一个二�l�表�Q�水�q�_��割就是横�q�来切一刀�Q�纵向分割就是竖直切一刀�Q?/p>
1、纵向分割就是，我们不同的应用可以分��C��同的DB中，不同的实例中�Q�或者说把某个拥有很多字�D늚�表拆分成��表�?/p>
2、横向分割就是，某些应用可能不负载，比如用户注册�Q�但是用戯��?x��)非常大�Q�可以把大表分开。可以采用表分区�Q�数据存储在不同文�g上，然后再部�|�到独立物理服务器增加IO吞吐以改善读写性能�Q�土一点的做法��是自己定期把老的数据存档。表分区的另外一个优势可以增加数据查询速度�Q�因为我们的��늃�引可以有�?层了�Q�就像一个文件夹中的文�g不要太多�Q�多分几层文件夹一栗��?/p>
3、还可以通过数据库镜像、复制订阅、事物日志，把读写分开��C��同的镜像物理数据库上�Q�一般来说够用，如果�q�不行可以用��g来实现数据库的负载均衡。当�Ӟ��对于BI�Q�我们可能还�?x��)有数据仓库�?/p>
架构上考虑��C��q�些之后�Q�流量大了，��可以在�q�个的基��上再去调整或者做WEB服务器或者应用服务器的负载均衡。很多时候我们都是在重复发现问题-》找到瓶�?》解册��个过�E��?/p>
典型的架构如下：(x��)
动态WEB服务器配好点的CPU�Q�静态WEB服务器和文�g服务器磁盘好�?br style="font-size:12px;" /> 应用服务器内存大点，�~�存服务器也是，数据库服务器当然内存和CPU都要�?/p>
上次说的“�?#8221;是一个比较大的原则也是一个比较高层的原则�Q�这�ơ我惌��一下其它两个原则：(x��)�q�与换�?/p>
�q?/p>
��Z��么要分？是因为我们希望通过分来提高�pȝ��的承载能力，那�ƈ又是�q�什么呢�Q�我想了一下有几个斚w��可以�qӞ��(x��)
1. 合�ƈ用户��h��Q�最基本的就是合�q�CSS/囄��/脚本�Q�还可以合�ƈ��面。不�q�合�q�就可能产生��量的浪费，需要有一个��^衡点�?/p>
2. 合�ƈ接口的粒度，如果做分布式应用的话�Q�我们可能不�?x��)直接访问数据库而是调用应用层提供的接口�Q�由于是�|�络调用�Q�代��h��较大�Q�因此在设计的时候尽量提供粒度比较粗的接口，一�ơ调用返回比较多的数据，而不是细化到��d��删除修改的层�ơ�?/p>
3. 合�ƈ接口的部�|Ԍ��对于频繁的跨机器调用可以考虑有一些数据冗余，把跨�|�络的服务编�E�进�E�间通讯�Q�甚臌��{到客��L(f��ng)��来做。比如论坛发贴时候脏词的�q��o(h��)�Q�直接调用应用层提供的接口（跨机器）是可以的�Q�但是可能代��h��较大�Q�可以把�q�个接口使用IPC方式部��v在本机�?/p>
�?/p>
旉��换空��_(d��)��I�间换时间是常见的做法，具体一点说�Q?/p>
1. �~�存。缓存的重要性早计算机的��g中就有重要的体现。对于网站，有很多种�~�存�Q�可以是客户端资源的�~�存�Q�可以是��面输出�~�存�Q�也可以是应用层的数据缓存，目的都是一��L(f��ng)��Q�或是减��了服务器请求次敎ͼ�或是减少了请求的处理�q�程�Q�或是减��了数据库的讉K��ơ数。当�Ӟ��生成静态文件也可以��是一�U�缓存。不讉K��盘固然不可能，但是我们要极大限度降低磁盘访问的��Z��(x��)�?/p>
2. 有的时候�ؓ(f��)了获取极快的响应�Q�我们还�?x��)不惜代价采用重复计��。比如，我们的某个操作很可能�?x��)由于网�l�问题等原因响应比较慢，在设计的时候可以有一个统一�?处理接口�Q�由�q�个接口分发��C��同的服务器去异步实现�q�个操作�Q�哪个服务器先返回了�l�果我们��q��q�个�l�果�Q�然后杀��d��他服务器的冗余操作�?/p>
3. �|�站一般追求比较快的响应，一般不太会(x��)在比较高的层�ơ用旉��来换取空��_(d��)��但是在一些用��L(f��ng)��有数据的处理��法上可能还是会(x��)考虑到空间的节省问题�?/p>
4. 有的时候我们会(x��)用一些聚合表来存放聚合数据，也就是进行一些预计算提高复杂计算�Q�比如报表）的性能。当�Ӟ��对于数据分析�Q�构建多�l�数据库也是一�U�不错的选择�?/p>
有很多网友留�a�说说的比较粗�Q�没有什么具体的东西。我觉得架构�q�个东西很难去说具体怎么做，因�ؓ(f��)具体实施的时候要看情况去应用的，�׃��没有完美的东西，所以做架构通常是去做一个��^衡，很可能某一个侧重不同会(x��)影响到架构的实施。希望我的这些文章能�l�大家一个提�C�的作用�Q�看了之后如果你觉得“�q�点我倒没有考虑刎ͼ�以后要注�?#8221;那或许就是最大的帮助了，下面我想说一些其它方面的问题�Q�每一条都很零散，��是一个补充吧�Q?/p>
1. 到底是采用已有的东西�q�是自己��d��需要详�l�考虑的，采用别�h的东西可能比较稳定，但是自己的控制少了一点，采用自己做的东西可以很灵�z�，但是可能�?x��)问题�?较多。不��怎么��P��我们在采用一个第三方框架的时候务必要�q�行�~�密的调查，看到他的不��Q�否则项目很可能在后期被�q�个框架制约�Q�反之，军_��自己��d��一个框架的时候也要看到自己需要什么其他框架不能提供的东西�?/p>
2. 数据传输的时候可以做压羃�Q�但要考虑到压�~�解压羃需要CPU资源�Q�在IO�Q�磁盘，带宽�Q�传输能力）和CPU之间有一个��^衡的考虑�?/p>
3. 理想的可伸羃性架构是可以自由增加或替换服务器�Q�无需��d��机维护或做很大的调整。在使用一个统一的调度中心来调度�q�些服务器，分配��h��的时候，我们要考虑一下调度服务器能承受多��流量�?/p>
4. 使用大量的廉��h��务器�q�是��量的高配服务器�Q�如何根据需求来�l�合服务器发挥最大作用�?/p>
5. 对于分布式构�Ӟ��我们��量让每一个节点保持简单的逻辑�Q�尽量减��同一层次节点之间的依赖，另外。需要有�l�一的地�Ҏ(gu��)��理所有的节点�?/p>
6. 功能分解、��用异步进行整合、故障�{�U�R��失效保护�?/p>
7. 软�g的架构升�U�和计算机硬件的架构升��很像�Q�可能有一�D�|��期，我们是在慢慢提高整体能力�Q?�q�也才提高了几倍，之后发现只有通过某种��d��的架构改变才能提高数十倍的能力�Q�升�U�之后，我们或许又会(x��)遇到其他问题。就像CPU�Q�是��单提高主频还是彻底更换架构�?/p>
8. 数据斚w��Q�读写分��R��数据库分隔、功能划分、缓存、镜像�?/p>
9. ��g�|�络上的架构很重要，但��Y件开发中的一些细节不可忽略，好的架构不意味着不需要代码审阅�?/p>

常言�W?/a> 2012-06-28 14:48 发表评论

大型�|�站架构设计�?qi��ng)技术�ȝ��

Thu, 28 Jun 2012 06:37:00 GMT

随着中国大型IT企业信息化速度的加快，大部分应用的数据量和讉K��量都急剧增加�Q�大型企业网站正面��(f��)性能和高数据讉K��量的压力�Q�而且对存储、安全以�?qi��ng)信息检索等�{�方面都提出了更高的要求……
     本文中，我想通过几个国外大型IT企业�?qi��ng)网站的成功案例�Q�从Web技术�h员角度探讨如何积极地应对国内大型�|�站卛_��面��(f��)的扩展（主要是技术方面，而较?y��u)��涉及(qi��ng)管理�?qi��ng)营销�{�方面）矛盾�?

一�?国外大型IT�|�站的成功之�?/strong>
(一) MySpace
     今天�Q�MySpace已经成�ؓ(f��)全球众口皆碑的社区网站之王。尽��一��和营销和管理经验自然是每个IT企业取得成功的首要因素，但是本节中我们却抛弃�q�一点，而主要着��g��探讨在数�ơ面临系�l�扩张的紧急关头MySpace是如何从技术方面采取应对策略的�?
�W�一代架�?#8212;�ȝ��更多的Web服务�?
     MySpace最初的�pȝ��很小�Q�只有两台Web服务器（分担处理用户��h��的工作量�Q�和一个数据库服务器（所有数据都存储在这一个地方）。那时��用的�? Dell双CPU�?G内存的系�l�。在早期阶段�Q�MySpace基本是通过�ȝ��更多Web服务器来对付用户暴增问题的。但到在2004�q�早期，�? MySpace用户数增长到五十万后�Q�其数据库服务器已经开始疲于奔命了�?

�W�二代架�?#8212;增加数据库服务器
     与增加Web服务器不同，增加数据库�ƈ没那么简单。如果一个站点由多个数据库支持，设计者必��考虑的是�Q�如何在保证数据一致性的前提下让多个数据库分担压力�?br />
     MySpace�q�行在三个SQL Server数据库服务器�?#8212;一个�ؓ(f��)主，所有的新数据都向它提交�Q�然后由它复制到其它两个�Q�另两个数据库服务器全力向用户供�l�数据，用以在博客和个�h资料栏显�C�。这�U�方式在一�D�|��间内效果很好——只要增加数据库服务器�Q�加大硬盘，��可以应对用��h��和访问量的增加�?br />
     �q�一�ơ的数据库架构按照垂直分割模式设计，不同的数据库服务于站点的不同功能�Q�如��d��、用戯��料和博客。垂直分割策略利于多个数据库分担讉K��压力�Q�当用户要求增加新功能时�Q�MySpace只需要投入新的数据库加以支持。在账户到达二百万后�Q�MySpace�q�从存储讑֤�与数据库服务器直接交互的方式切换�? SAN�Q�存储区域网�l�）—用高带宽、专门设计的�|�络��大量磁盘存储设备连接在一��P��而数据库�q�接到SAN。这��Ҏ(gu��)��施极大提升了�pȝ��性能、正常运行时间和�?靠性。然而，当用��L(f��ng)��l�增加到三百万后�Q�垂直分割策略也变得难以�l�持下去�?br />
�W�三代架�?#8212;转到分布式计��架�?
     几经折腾�Q�最�l�，MySpace��目光移到分布式计算架构——它在物理上分布的众多服务器，整体必须逻辑上等同于单台机器。拿数据库来��_(d��)��׃��能再像过�?那样��应用拆分，再以不同数据库分别支持，而必��d��整个站点看作一个应用。现在，数据库模型里只有一个用戯��Q�支持博客、个��料和其他核心功能的数据都存储在相同数据库�?br />
     既然所有的核心数据逻辑上都�l�织��C��个数据库�Q�那么MySpace必须扑ֈ�新的办法以分担负�?#8212;—昄��Q�运行在普通硬件上的单个数据库服务器是无能为力的。这�ơ，不再按站点功能和应用分割数据库，MySpace开始将它的用户按每百万一�l�分�Ԍ��然后��各�l�的全部数据分别存入独立的SQL Server实例。目前，MySpace的每台数据库服务器实际运行两个SQL Server实例�Q�也��是说每台服务器服务大约二百万用戗��据MySpace的技术�h员说�Q�以后还可以按照�q�种模式以更��粒度划分架构，从而优化负荷分担�?

�W�四代架�?#8212;求助于微软方�?
     2005�q�早期，账户辑ֈ��?ji��)百万，MySpace开始用微��Y的C#�~�写ASP.NET�E�序。在收到一定成效后�Q�MySpace开始大规模�q�移到ASP.NET�?
     账户辑ֈ�一千万�Ӟ��MySpace再次遭遇存储瓉��问题。SAN的引入解决了早期一些性能问题�Q�但站点目前的要求已�l�开始周期性超��SAN的I/O定w��——卛_��从磁盘存储系�l�读写数据的极限速度�?

�W�五代架�?#8212;增加数据�~�存层�ƈ转到支持64位处理器的SQL Server 2005
     2005�q�春天，MySpace账户辑ֈ�一千七百万�Q�MySpace又启用了新的�{�略以减��d��储系�l�压力，卛_��加数据缓存层——位于Web服务器和数据�?服务器之��_(d��)��其唯一职能是在内存中徏立被频繁��h��数据对象的副本，如此一来，不访问数据库也可以向Web应用供给数据�?br />
     2005�q�中期，服务账户数达��C��千六百万�Ӟ��MySpace因�ؓ(f��)我们对内存的渴求而切换到了还处于beta��试的支�?4位处理器的SQL Server 2005。升�U�到SQL Server 2005�?4位Windows Server 2003后，MySpace每台服务器配备了32G内存�Q�后�?006�q�再�ơ将配置标准提升�?4G�?br />
     事实上，MySpace的Web服务器和数据库仍然经常发生超负荷�Q�其用户频繁遭遇“意外错误”�?#8220;站点��ȝ��l�护”�{�告�C�，他们不得不在论坛抱怨不�?#8230;…
     MySpace正是在这样不断重构站点��Y件、数据库和存储系�l�中�Q�才一步步走到今天。事实上�Q�MySpace已经成功解决了很多系�l�扩展性问题，其中存在相当的经验值得我们借鉴。MySpace�pȝ��架构到目前�ؓ(f��)止保持了相对�E�_��Q�但其技术�h员仍然在为SQL Server支持的同时连接数�{�方面��l�攻坚，��可能把事情做到最好�?

(�? Amazon
     亚马逊书店无疑是�?sh��)子商务发展的里�E�碑�?000�q�到现在�Q�世界网�l�业腥风血雨。Amazon曄��成�ؓ(f��)�|�络泡沫的头号代表。如今，当这�?#8220;最大的泡沫”用几�l�易改的数字把自己变成了坚实的IT巨�h�?
     历览Amazon发展�q�程�Q�其成功�l�验在于�Q�它创造性地�q�行了电(sh��)子商务中每一环节的探索，包括�pȝ��q�_��的徏设，�E�序�~�写、网站设立、配送系�l�等�{�方面。用 Amazon当家��索斯的话说就是，“在现实世界的商店最有力的武器就是地�D�，地段�Q�地�D�，而对于我们来说最重要的三件事��是技术，技术，技术�?#8221;

(�? eBay
     eBay是世界闻名的拍卖�|�站�Q�eBay公司通信部主��凯�?帕斯格拉夫认为，“eBay成功的最重要原因在于公司��理和服务�?#8221;
     其成功的奥秘可以列�D��Z��下几点：(x��)
     ①敢�ؓ(f��)天下�?#8212;在网�l�尚不普�?qi��ng)的时代�Q�eBay率先�q�入�|�络拍卖领域�Q?
     ②依托虚拟商场所产生的特有的“零库�?#8221;是eBay公司取得成功的另一个重要原因。该公司的核心业务没有�Q何库存风险，所有的商品都是由客��h��供，它只需要负责提供虚拟的拍卖�q�_��—�|�络和��Y件。所以，eBay公司的胦务报表上不会(x��)出现“库存费用”�?#8220;保管费用”�{��?
③自eBay公司成立开始，它就一直遵循两�?#8220;黄金原则”�Q�徏设虚拟社区，�l�网民以家的感觉�Q�保证网站稳定安全地�q�行�?br />二�? 国内大型�|�站开发时的几点徏�?/strong>
     从本节开始，我们��结合国内外大型IT�|�站在技术扩展方面的沉痛教训和成功经验，探讨在如今刚刚开始的Web 2.0时代如何应对国内�|�站卛_��面��(f��)的数据访问量增加�Q�甚��x��急剧膨胀�Q�的问题�Q��ƈ提出一些供参考的�{�略和徏议�?

(�? 搭徏�U�学的系�l�架�?
     构徏大型的商业网站绝对不可能像构建普通的��型�|�站一样一�y�而就�Q�需要从严格的��Y件工�E�管理的角度�q�行认真规划�Q�有步骤有逻辑地进行开发。对于大型网站来 ��_(d��)��所采用的技术涉�?qi��ng)面极其�q�泛�Q�从��g到��Y件、编�E�语�a�、数据库、Web服务器、防火墙�{�各个领域都有了很高的要求，已经不是原来��单的html静态网站所能比拟的。以著名的Yahoo!��Z��Q�他们的每一个大型网站工�E�都需要大量相应专业�h员的参与�?

(�? ��面静态化
     可不要小看纯静态化的HTML��面�Q�其实在很多情况下，HTML往往意味着“效率最高、消耗最��?#8221;�Q�所以我们尽可能使我们的�|�站上的��面采用静态页面来�?现。但是，对于大量内容�q�且频繁更新的网站，我们无法全部手动实现�Q�因此可以开发相应的自动化更新工��P��例如我们常见的信息发布系�l�CMS。像我们�l�常�?问的各个门户站点的新闻频道，甚至他们的其他频道，都是通过信息发布�pȝ��来管理和实现的。信息发布系�l�可以实现最��单的信息录入自动生成静态页面，�q�能�?备频道管理、权限管理、自动抓取等功能�Q�对于一个大型网站来��_(d��)��拥有一套高效、可��理的CMS是必不可��的�?

(�? 存储问题
     存储也是一个大问题�Q�一�U�是��文件的存储�Q�比如图片这�c�；另一�U�是大文件的存储�Q�比如搜索引擎的索引�?
�?家知道，对于Web服务器来��_(d��)��不管是Apache、IIS�q�是其他容器�Q�图片是最消耗资源的�Q�于是我们有必要��图片与��面�q�行分离�Q�这是基本上大型�|�站都会(x��)采用的策略，他们都有独立的图片服务器�Q�甚臛_��多台囄��服务器。这��L(f��ng)��架构可以降低提供��面讉K��h��的服务器�pȝ��压力�Q��ƈ且可以保证系�l�不�?x��)因为图�?问题而崩溃，在应用服务器和图片服务器上，可以�q�行不同的配�|�优化以保证更高的系�l�消耗和执行效率�?br />
(�? 数据库技�?#8212;集群和库表散�?
     对于大型�|�站而言�Q��用大型的数据库服务器是必��ȝ��事情。但是，在面对大量访问的时候，数据库的瓉��仍然�?x��)显现出来，�q�时一台数据库��很快无法满��_��用，于是我们需要借助于数据库集群或者库表散列技术�?br />
     在数据库集群斚w��Q�很多数据库厂商都有自己的解��x��案，Oracle、Sybase、SQL Server�{�都有很好的�Ҏ(gu��)��Q�常用的MySQL提供的Master/Slave也是�c�M��的方案。因此，你��用了什么样的数据库�Q�就参考相应的解决�Ҏ(gu��)��?实施卛_��?

     上面提到的数据库集群�׃��在架构、成本、扩张性方面都�?x��)受到所采用数据库类型的限制�Q�于是我们需要从应用�E�序的角度来考虑改善�pȝ��架构�Q�其中，库表散列�?常用�q�且最有效的解��x��案。我们在应用�E�序中安装业务和应用或者功能模块将数据库进行分��，不同的模块对应不同的数据库或者表�Q�再按照一定的�{�略�Ҏ(gu��)��个页面或者功能进行更��的数据库散列，比如用户表，按照用户ID�q�行表散列，�q�样��p��够低成本的提升系�l�的性能�q�且有很好的扩展性。在�q�一斚w��一个现成的例子 ��是搜狐。它的论坛就是采用了�q�样的架构，��论坛的用户、设�|�、帖子等信息�q�行数据库分��，然后对帖子、用��h��照板块和ID�q�行散列数据库和表，最�l�可�?在配�|�文件中�q�行��单的配置便能让系�l�随时增加一��C��成本的数据库�q�来补充�pȝ��性能�?

(�? �~�存�{�略
     �q�绝对不单指低��的缓存技术相关的�~�程�Q�应从整个架构角度着��|��深入研究Web服务器、数据库服务器的各层�U�的�~�冲�{�略�Q�最后才是低�U�的�~�冲技术的�~�程�?不同的Web服务器、数据库服务器及(qi��ng)Web�~�程语言都有自己不同的缓冲策略。例如数据库存储斚w��Q�SQL Serve 2005中的��d��式缓存机�Ӟ��Oracle数据的cache group技术，Hibernate的缓存包括Session的缓存和SessionFactory的缓存；Web服务器方面，Apache提供了自��q�� ~�存模块�Q�也可以使用外加的Squid模块�q�行�~�存�Q�这两种方式均可以有效的提高Apache的访问响应能力，IIS�~�冲器技术；至于web开发语�a��Q�所用缓存技术更存在很大不同�Q�例如ASP.NET 2.0中提��Z��两种�~�存应用�E�序数据和缓存服务页输出的策略，�q�两�U�缓存技术相互独立但不相互排斥，PHP有Pear的Cache模块�Q�等�{��?

(�? 镜像
     镜像是大型网站常采用的提高性能和数据安全性的方式�Q�镜像的技术可以解决不同网�l�接入商和地域带来的用户讉K��速度差异。在镜像的细节技术方面，�q�里不阐�q?太深�Q�有很多专业的现成的解决架构和��品可选。也有廉��L(f��ng)��通过软�g实现的思�\�Q�比如Linux上的rsync�{�工兗��?

(�? 负蝲均衡
     负蝲均衡��是大型�|�站解决高负药��问和大量�q�发��h��采用的终极解军_��法�?
负蝲均衡技术发展了多年�Q�有很多专业的服务提供商和��品可以选择�Q�基于LAMP解决�Ҏ(gu��)��的Lighttped+Squid是相当不错的解决负蝲均衡和加速系�l�的有效方式�?br />
(十一) ��g四层交换
     �W�四层交换��用第三层和第四层信息包的报头信息�Q�根据应用区间识别业务流�Q�将整个区间�D늚�业务��分配到合适的应用服务器进行处理。第四层交换功能��p��是虚 IP�Q�指向物理服务器。它传输的业务服从的协议多种多样�Q�有HTTP、FTP、NFS、Telnet或其他协议。这些业务在物理服务器基��上，需要复杂的载量�q��法。在IP世界�Q�业务类型由�l�端TCP或UDP端口地址来决定，在第四层交换中的应用区间则由源端和终端IP地址、TCP和UDP端口共同�?定�?br />
     在硬件四层交换��品领域，有一些知名的产品可以选择�Q�比如Alteon、F5�{�，�q�些产品很昂贵，但是物有所��|��能够提供非常优秀的性能和很灉|��的管理能力。Yahoo中国当初接近2000台服务器使用了三四台Alteon��搞定了�?br />(十二) 软�g四层交换
     大家知道了硬件四层交换机的原理后�Q�基于OSI模型来实现的软�g四层交换也就应运而生�Q�这��L(f��ng)��解决�Ҏ(gu��)��实现的原理一��_(d��)��不过性能�E�差。但是满��一定量的压力还是游刃有余的�?br />     一个典型的使用负蝲均衡的策略就是，在��Y件或者硬件四层交换的基础上搭建squid集群�Q�这�U�思�\在很多大型网站包括搜索引擎上被采用，�q�样的架构低成本、高性能�q�有很强的扩张性，随时往架构里面增减节点都非常容易�?

(十三) 软�g投资问题
     据报��|��目前国内除了一些上市企业和特别大知名大公司以外�Q�很��有企业在成本中考虑正版软�g的购�|�费用。这�U�思维极有可能�l�中国互联网带来噩梦。如果一�?公司真正面��(f��)软�g资金斚w��的困难，完全可以考虑使用开源世界的LAMP解决�Ҏ(gu��)��Q�Linux�Q�Apache�Q�MySQL�Q�Perl、PHP或�? Python Web�~�程语言�Q�；否则�Q�随着我国加入WTO范围的不断扩大，盗版打击必然��来��严。因此，“苟且��L(f��ng)��”必将自食其果�?

     另外�Q�随着�|�络带宽日渐提升�Q�W(xu��)EB 2.0技术必��媄响到�|�络世界的几乎每一个角落。因此，如何�U�聚技术�h员进行技术攻兛_ƈ�q�一步加强安全防范也成�ؓ(f��)一个日益严�ȝ��问题�Q�宜��早�U�_��到公司的议事日程�?

四�?�ȝ��
     中国�?sh��)子商务真正理性发展的一个标志，是大量的传统企业实实在在地开始用互联�|�来处理商务、做生意�Q�而现在这��L(f��ng)��潮已经开始。北京发行集团，联合SINA�?688.com�{�单位共同推出的�|�上虚拟书店—新新书店��是�q�样的一个标志�?
     随着�|�络带宽日渐提升�Q�随着�|�络理念和W(xu��)EB 2.0技术的断深入�h心，各种B2B、B2C、C2C�{�电(sh��)子商务模式很可能以立体交叉方式整合到各种大型商务�|�站中来。因此，作�ؓ(f��)公司的技术�h员，作�ؓ(f��)�?危救驄��“白衣骑士”�Q�如何应�Ҏ(gu��)�v量存储、�v量访问问题，��量信息��索的问题�Q�日益严�ȝ��安全问题�Q�等�{�，已经��M��容缓�?img src="http://cnc.imgcache.qq.com/ac/b.gif" alt="" />

常言�W?/a> 2012-06-28 14:37 发表评论

Thu, 28 Jun 2012 06:35:00 GMT

1. PlentyOfFish �|�站架构学习(f��n)

http://www.dbanotes.net/arch/plentyoffish_arch.html

采取 Windows 技术�\�U�的 Web 2.0 站点�q�不多，除了 MySpace �Q�另外就是这�?PlentyOfFish。这个站�Ҏ(gu��)��? “Online Dating” 服务。一个��o(h��)人��|�z�乐道的、惊人的数据是这个只有一个�h(创徏人Markus Frind�Q�的站点价�?10 亿，估计要让很多人眼热，更何�?Markus Frind 每天只用两个��时打理�|�站–可操作性很强嘛�?/p>
2. 从LiveJournal后台发展�?大型�|�站�pȝ��架构以及(qi��ng)性能优化�Ҏ(gu��)��

http://www.example.net.cn/archives/2006/03/olivejournaloio.html

LiveJournal�?9�q�始于校园中的项目，几个人出于爱好做了这样一个应用，以实��C��下功能：(x��)

* 博客�Q�论�?/p>
* �C�会(x��)性网�l�，扑ֈ�朋友

* 聚合�Q�把朋友的文章聚合在一�?/p>
LiveJournal采用了大量的开源��Y�Ӟ��甚至它本�w�也是一个开源��Y件�?/p>
在上�U�后�Q�LiveJournal实现了非常快速的增长�Q?/p>
* 2004�q?月䆾�Q?80万注册用戗��?/p>
* 2005�q?月䆾�Q?80万注册用戗��?/p>
* 2005�q?月䆾�Q?90万注册用戗��?/p>
* 辑ֈ�了每�U�钟上千�ơ的��面��h��?qi��ng)处理�?/p>
* 使用了大量MySQL服务器�?/p>
* 使用了大量通用�l��g�?/p>
3. YouTube 的架构扩�?/p>
http://www.dbanotes.net/opensource/youtube_web_arch.html

在西雅图扩展性的技术研讨会(x��)上，YouTube �?Cuong Do 做了关于 YouTube Scalability 的报告。视频内容在 Google Video 上有(地址)�Q�可惜国内用��L(f��ng)��不到�?/p>
Kyle Cordes 对这个视频中的内容做了介�l�。里面有不少技术性的内容。值得分��n一下�?Kyle Cordes 的介�l�是本文的主要来�?

4. WikiPedia 技术架构学�?f��n)分�?/p>
http://www.dbanotes.net/opensource/wikipedia_arch.html

�l�基癄��(WikiPedia.org)位列世界十大�|�站�Q�目前排名第八位。这是开攄��力量�?/p>
来点直接的数据：(x��)

* 峰值每�U�钟3万个 HTTP ��h��

* 每秒�?3Gbit ��量, �q�乎375MB

* 350 �?PC 服务�?/p>
5. Tailrank �|�站架构

http://www.dbanotes.net/review/tailrank_arch.html

每天��C��千万计的 Blog 内容中，实时的热�Ҏ(gu��)��什�? Tailrank �q�个 Web 2.0 Startup 致力于回�{�这个问题�?/p>
专门爆料�|�站架构�?Todd Hoff �?Kevin Burton �q�行了采�ѝ��于是我们能了解一�?Tailrank 架构的一些信息。每��时索引 2400 万的 Blog �?Feed�Q�内容处理能力�ؓ(f��) 160-200Mbps�Q�IO 写入大约�?0-15MBps。每个月要处�?52T 之多的原始数据。Tailrank 所用的爬虫现在已经成�ؓ(f��)一个独立��品：(x��)spinn3r�?/p>
6. LinkedIn 架构�W�记

http://www.dbanotes.net/arch/linkedin.html

LinkedIn 雇员�?180 个，�?Web 2.0 公司中算是比较多的，不过人家自从 2006 �q�就盈利了，�q�在 Web 2.0 站点中可��少的。用戯��q?1600 万，现在每月新增 100 万，50�Q?�?x��)员来自��?中国用户不少�Q�也包括�?.

7. Yahoo�Q�社区架�?/p>
http://www.dbanotes.net/arch/yahoo_arch.html

旧金�׃�D行的 QCon �?x��)议带给我们很多新鲜的信息。虽然没��Z��(x��)参加�Q�但是看看各个网�?#8221;晒架�?#8221;也是个比较过瘄��事情。请参观�q�收藏这个页面：(x��)Architectures you’ve always wondered about�?/p>
8. Craigslist 的数据库架构

http://www.dbanotes.net/database/craigslist_database_arch.html

Craigslist �l�对是互联网的一个传奇公司。根据以前的一则报道：(x��)

每月��过 1000 万�h使用该站服务�Q�月��览量超�q?30 亿次�Q?Craigslist每月新增的帖子近 10 亿条??)�|�站的网��|��量在以每�q�近癑ր�的速度增长。Craigslist 至今却只�?18 名员�?现在可能�?x��)多一些了)�?/p>
9. Fotolog.com 的技术信息拾�?/p>
http://www.dbanotes.net/review/fotolog_arch.html

��管是世界上最大的囄��服务�|�站, Fotolog.com 在国内的名气�q�不是很响亮, 每当提到囄��服务, 很多人第一个会(x��)惌��v Flickr. 但实际上 Fotolog 也的��是很猛�? Alexa 上的排名一直在 Flickr 前面, 目前注册用户��过 1100 �? 而前不久也卖了一个好价钱, 9000 万美�? ��下来的�? 1 个注册用户大�U?9 ��金. Yupoo 的刘�q�阳可以��L(f��ng)��算自己的网站如果卖�l�老外是怎样一个�h(hu��n)��g��.

10. Digg �|�站架构

http://www.dbanotes.net/arch/digg_arch_cache_and_shard.html

Digg 工程师采�?LAMP (Linux, Apache, MySQL and PHP) 模式。这�?Alexa 排名�?100 左右的、自我估�?1.5 亿美金的站点目前有超�q?100 台的 PC 服务�?��_��了)�Q�可以粗略分成三个部分：(x��)数据库服务器�Q�W(xu��)eb 服务器，搜烦服务器�?/p>
11. Amazon �?Dynamo 架构

http://www.dbanotes.net/techmemo/amazon_dynamo.html

我在 DBAnotes.net 上记录过不少比较大的�|�站架构分析(eg: eBay [1], eBay [2]) �Q�Amazon 一直找不到太多的资料。国庆期间读��C��一��关�?Amazon Dynamo 的论文，非常�_�ֽ�。Amazon Dynamo �q�个高可用、可扩展存储体系支撑了Amazon 不少核心服务.

12. 财帮子（caibangzi.com�Q�网站架�?/p>
http://www.dbanotes.net/arch/caibangzi_web_arch.html

财帮�?caibangzi.com) 定位�?#8221;基金理胦�C�֌�”。是国内讉K��量最大的��Z�� Ruby on rails �?startup ��目�?#8220;理胦”�q�个词据说是光大银行发明的，且不�ȝ��Q�不可否认的是，目前国内”理胦”是个很有潜力的切入点。胦帮子�|�站潜在用户��还是很大的�?/p>
13. 了解一�?Technorati 的后台数据库架构

http://www.dbanotes.net/web/technorati_db_arch.html

目前处理着大约 10Tb 核心数据, 分布在大�U?20 台机器上.通过复制, 多增加了 100Tb 数据, 分布�?200 台机器上. 每天增长的数�?1TB. 通过 SOA 的运�? 物理与逻辑的访问相隔离,��g��消除了数据库的瓶�? 值得一提的�? 该扩展过�E�始�l�是利用普通的��g与开源��Y件来完成�? 毕竟 , Web 2.0 站点都不是烧��q��? 从数据量来看�Q�这�l�对是一个相�Ҏ(gu��)��较大�? Web 2.0 应用.

14. 说说大型高�ƈ发高负蝲�|�站的系�l�架�?/p>
http://www.toplee.com/blog/?p=71

我在CERNET做过拨号接入�q�_��的搭建，而后在Yahoo&3721从事�q�搜索引擎前端开发，又在MOP处理�q�大型社区猫扑大杂烩的架�?升��{�工作，同时自己接触和开发过不少大中型网站的模块�Q�因此在大型�|�站应对高负载和�q�发的解��x��案上有一些积累和�l�验�Q�可以和大家一��h��讨一下�?/p>
15. 大型高负载网站架�?的感�?/p>
http://atman.memoab.com/articles/194

昨日认识了位健谈的IT人，原在verycd作系�l�管理的叶宁(�q�哥们现飘泊去见首都人民�?.

以前sweater�l�我介绍的他写的《大型高负蝲�|�站架构和应用初探�? 他�ȝ��了很多信息和数据�Q�感谢叶宁的辛劳成果. �q�里我也惛_��此PPT写些自己的感�?

常言�W?/a> 2012-06-28 14:35 发表评论

大型�|�站架构设计

Thu, 28 Jun 2012 05:34:00 GMT

按需提供大型�|�站的架构设计，具体包括�Q?/p>

A. 提供后台数据库设计：(x��)�Ҏ(gu��)��业务需求的理解�Q�针�Ҏ(gu��)��定的数据库（�늛�Oracle,MySql,SqlServer,DB2�Q�提供网站项目的后台数据库设计�?/p>
后台数据库的设计是整个网站最重要的环节，其结构定义通常��定了后��C��务数据的存储方式以及(qi��ng) �l�大部分后台数据讉K��模型。对大型�|�站而言�Q�由于其需要支撑的负荷很大�Q�数据库设计��关�p�d��数据储存量，数据讉K��效率�Q�缓存效率，数据安全�{�多个方面，�?型网站的数据库设计原则与普通企业应用的设计原则有许多区别，需要经验丰富的架构师才能胜仅R�?/p>
提供后台持久层设计：(x��)持久层设计是在后台数据库设计的基��上，�Ҏ(gu��)��具体�~�程语言�Q�根据网站访问特征具体设计的�~�程框架。设计目标将兼顾处理效率和代码的可维护性、可理解性（如面向对象）�?/p>
B. 提供�~�存设计�Q�根据业务需求，�l�合后台数据库设计和后台持久层设计，提供�|�站的缓存设计方案。具体包括前端缓存，�׃�n数据�~�存�Q�分布式�~�存�?/p>
所谓前端缓存，指把�|�页上短期内不太变化的内宏V��根据访问效率评伎ͼ�通过片段形式以一定策略缓存�v来，从而减��后台内容生成的旉��Q�提升网站的响应效率和节省服务器的处理资源占用�?/p>
所谓共享数据缓存，指把后台中公��q��数据�Ҏ(gu��)��讉K��频度和更新频度以一定策略在服务器缓存�v来，避免每次使用都需要从数据库或��盘提取�?/p>
所谓分布式�~�存�Q�指大型�|�站需要利用分布式的缓存来在多台集��机器之间共享某些处理结果内宏V�?/p>
C. 提供MVC�Q�Model-View-Controller�Q�框架设计：(x��)�Ҏ(gu��)��业务需求和�|�站特点提供合适的、高效的MVC处理框架�?/p>
MVC是Web应用前端的重要架构组成，�|�站交互的绝大部分内容将集中在这个部分，一套高效而易于扩展和使用的MVC框架是整个网站中重要�l�成�?/p>
D. 提供安全框架�Q�根据业务需要和数据安全保护的需要，提供�|�站安全框架�?/p>
E. 提供SEO�Q�Search Engine Optimize)�Ҏ(gu��)��Q�面向搜索引擎提供网站搜索优化方案�?/p>
F. 提供备䆾�Ҏ(gu��)��Q�根据业务需要提供针对不同��^台的数据�Q�代码、数据、用戯��料）�{�备份方案�?/p>

常言�W?/a> 2012-06-28 13:34 发表评论

Thu, 28 Jun 2012 05:26:00 GMT

�q�里的大型网站架构只包括高互动性高交互性的数据型大型网站，��Z��大家众所周知的原因，我们��׃��谈新�ȝ��和一些依靠HTML静态化��可以实现的架构了，我们以高负蝲高数据交换高数据��动性的�|�站��Z��Q�比如�v内，开心网�{�类似的web2.0�p�d��架构。我们这里不讨论是PHP�q�是JSP或�?NET�?境，我们从架构的斚w��ȝ��问题�Q�实现语�a�斚w��q�不是问题，语言的优势在于实现而不是好坏，不论你选择��M��语言�Q�架构都是必��要面对的�?/p>
�q�里讨论一下大型网站需要注意和考虑的问�?/p>
1、�v量数据的处理

众所周知�Q�对于一些相对小的站�Ҏ(gu��)��_(d��)��数据量�ƈ不是很大�Q�select和update��可以解��x��们面对的问题�Q�本�w�负载量不是很大�Q�最多再加几�?索引��可以搞定。对于大型网站，每天的数据量可能��׃��百万�Q�如果一个设计不好的多对多关�p�，在前期是没有��M��问题的，但是随着用户的增长，数据量会(x��)是几�?�U�的增长的。在�q�个时候我们对于一个表的select和update的时�?�q�不说多表联合查�?的成本的非常高的�?/p>
2、数据�ƈ发的处理

在一些时候，2.0的CTO都有个尚方宝剑，��是�~�存。对于缓存，在高�q�发高处理的时候也是个大问题。在整个应用�E�序下，�~�存是全局�׃�n的，然而在我们�q�行修改的时候就�Q�如果两个或者多个请求同时对�~�存有更新的要求的情况下�Q�应用程序会(x��)直接的死掉。这个时候，��需要一个好的数据�ƈ发处理策略以�?qi��ng)缓�?�{�略�?/p>
另外�Q�就是数据库的死锁问题，也许�q�x��我们感觉不到�Q�死锁在高�ƈ发的情况下的出现的概率是非常高的�Q�磁盘缓存就是一个大问题�?/p>
3、文件存贮的问题

对于一些支持文件上传的2.0的站点，在庆�q�硬盘容量越来越大的时候我们更多的应该考虑的是文�g应该如何被存储�ƈ且被有效的烦引。常见的�Ҏ(gu��)��是对�?件按照日期和�c�d��q�行存贮。但是当文�g量是��量的数据的情况下，如果一块硬盘存贮了500个G的琐��文�Ӟ��那么�l�护的时候和使用的时候磁盘的Io��是一�?巨大的问题，哪怕你的带宽��够，但是你的��盘也未必响应过来。如果这个时候还涉及(qi��ng)上传�Q�磁盘很�Ҏ(gu��)��over了�?/p>
也许用raid和专用存贮服务器能解决眼下的问题�Q�但是还有个问题��是各地的访问问题，也许我们的服务器在北京，可能在云南或者新疆的讉K��速度如何解决?如果做分布式�Q�那么我们的文�g索引以及(qi��ng)架构该如何规划�?/p>
所以我们不得不承认�Q�文件存贮是个很不容易的问题

4、数据关�pȝ��处理

我们可以很容易的规划��Z��个符合第三范式的数据库，里面布满了多对多关系�Q�还能用GUID来替换INDENTIFY COLUMN 但是�Q�多对多关系充斥�?.0时代�Q�第三范式是�W�一个应该被抛弃的。必��L��效的把多表联合查询降到最低�?/p>
5、数据烦引的问题

众所周知�Q�烦引是提高数据库效率查询的最斚w��最廉�h(hu��n)最�Ҏ(gu��)��实现的方案。但是，在高UPDATE的情况下�Q�update和delete付出的成本会(x��)高的无法��x��Q�笔者遇到过一个情况，在更��C��个聚焦烦引的时候需�?0分钟来完成，那么对于站点来说�Q�这些基本上是不可忍受的�?/p>
索引和更新是一对天生的冤家�Q�问题A�Q�D�Q�E�q�些是我们在做架构的时候不得不考虑的问题，�q�且也可能是��p��旉��最多的问题�Q?/p>
6、分布式处理

对于2.0�|�站�׃��光��互动性，CDN实现的效果基本上�?�Q�内�Ҏ(gu��)��实时更新的，我们常规的处理。�ؓ(f��)了保证各地的讉K��速度�Q�我们就需要面对一个绝大的问题�Q�就是如何有效的实现数据同步和更斎ͼ�实现各地服务器的实时通讯有是一个不得不需要考虑的问题�?/p>
7、Ajax的利弊分�?/strong>

成也AJAX�Q��|也AJAX�Q�AJAX成�ؓ(f��)了主��趋势，�H�然发现��Z��XMLHTTP的post和get是如此的�Ҏ(gu��)��。客��L(f��ng)��get或者post 到服务器数据�Q�服务器接到数据��h��之后�q�回来，�q�是一个很正常的AJAX��h��。但是在AJAX处理的时候，如果我们使用一个抓包工��L(f��ng)��话，�Ҏ(gu��)��据返回和�?理是一目了然。对于一些计��量大的AJAX��h��的话�Q�我们可以构造一个发包机�Q�很�Ҏ(gu��)��可以把一个webserver�q�掉�?/p>
8、数据安全性的分析

对于HTTP协议来说�Q�数据包都是明文传输的，也许我们可以说我们可以用加密啊，但是对于G问题来说的话�Q�加密的�q�程��可能是明文�?比如我们知道的QQ�Q�可以很�Ҏ(gu��)��的判断他的加密，�q�有效的写一个跟他一��L(f��ng)��加密和解密方法出来的)。当你站�Ҏ(gu��)��量不是很大的时候没有�h�?x��)在乎你�Q�但是当你流量上来之后，那么所谓的外挂�Q�所谓的��发��׃��(x��)接踵而来(从qq一开始的��发可见端�?。也许我们可以很的意的说�Q�我们可以采用更高��别的判断甚至HTTPS来实玎ͼ�注意�Q�当你做�q�些处理的时候付出的��是��量的database�Q�io以及(qi��ng)CPU的成本。对于一些群发，基本上是不可能的。笔者已�l�可以实现对于百度空间和qq�I�间的群发了。大家愿意试试，实际上�ƈ不是很难�?/p>
9、数据同步和集群的处理的问题

当我们的一台databaseserver不堪重负的时候，�q�个时候我们就需要做��Z��数据库的负蝲和集��了。而这个时候可能是最让�h困扰的的问题了，数据��Z��|�络传输�Ҏ(gu��)��数据库的设计的不同，数据延迟是很可怕的问题�Q�也是不可避免的问题�Q�这��L(f��ng)��话，我们��需要通过另外的手�D�|��保证在这延迟的几�U�或者更长的几分钟时间内�Q�实现有效的交互。比如数据散列，分割�Q�内容处理等�{�问�?/p>
10、数据共享的渠道以及(qi��ng)OPENAPI��势

Openapi已经成�ؓ(f��)一个不可避免的��势�Q�从google�Q�facebook�Q�myspace到�v内校内，都在考虑�q�个问题�Q�它可以更有效的留住用户�q�激发用��L(f��ng)��更多的兴��以�?qi��ng)让更多的�h帮助你做最有效的开发。这个时候一个有效的数据�׃�n�q�_��Q�数据开攑��^台就成�ؓ(f��)必不可少的途径了，而在开攄��接口的情况保证数据的安全性和性能�Q�又是一个我们必��要认真思考的问题了�?/p>

常言�W?/a> 2012-06-28 13:26 发表评论

亚洲欧洲日产国码二区首页,亚洲国语精品自产拍在线观看,久久精品国产亚洲

Redis 3.X版本引入了集���的新特性的三种用法

LAMP�|�站架构�Ҏ(gu��)��分析

大型�|�站架构设计�?qi��ng)技术�ȝ��

大型�|�站架构设计

Redis 3.X版本引入了集��的新特性的三种用法