優(yōu)化雜談
Author :放翁
Blog:http://blog.csdn.net/cenwenchu79/
當(dāng)應(yīng)用遇到規(guī)模化問(wèn)題的時(shí)候,就是考慮性能優(yōu)化的時(shí)候了。今天同事和我聊起了NIO在客戶(hù)端的使用與BIO有什么優(yōu)勢(shì),也勾起了我前一陣子和其他同學(xué)交流優(yōu)化的一些想法,純粹個(gè)人的一點(diǎn)想法。
CPU利用率和Load
在過(guò)去做壓力測(cè)試的時(shí)候,我們經(jīng)常會(huì)關(guān)注兩個(gè)指標(biāo),CPU和Load。有同學(xué)覺(jué)得CPU利用率上去了Load肯定也上去了,Load上去了CPU利用率同樣會(huì)上去。但是在一些需要優(yōu)化的場(chǎng)景下,常常會(huì)看到Load很高,CPU利用率卻可能比較低(多核更是可能出現(xiàn)分配不均的情況)。Load其實(shí)就是等待處理的任務(wù)隊(duì)列,當(dāng)你的應(yīng)用在等待同步消息返回處理的同時(shí),CPU還是會(huì)將時(shí)間切片分配給這些線(xiàn)程,而真正需要CPU的線(xiàn)程,卻不得不在到了時(shí)間片以后暫時(shí)放棄工作被掛起。因此在程序設(shè)計(jì)的時(shí)候就要考慮如何利用好CPU的這個(gè)資源,如何均勻的將壓力分?jǐn)偟礁鱾€(gè)CPU上(有時(shí)候就一個(gè)線(xiàn)程在不斷循環(huán),導(dǎo)致單個(gè)CPU負(fù)荷很高)。
NIO在客戶(hù)端的使用
Http消息設(shè)置keepalive和采用NIO的方式復(fù)用信道、BIO結(jié)合連接池的方式,最基本的目的就是降低建立TCP產(chǎn)生握手的成本,最大限度的復(fù)用已有的資源,但是否NIO就只有復(fù)用信道這點(diǎn)呢?
NIO和BIO在數(shù)據(jù)傳輸和處理的模式上有不同,NIO采用的是BufferPacket+Channel的模式,這其實(shí)和操作系統(tǒng)本身的傳輸模式很類(lèi)似,而BIO的Stream的模式是Java自己獨(dú)特的模式。在采用NIO的這種數(shù)據(jù)傳輸模式以后,可以充分利用操作系統(tǒng)本身對(duì)傳輸?shù)膬?yōu)化,因此這是一方面好處。另一方面異步和事件機(jī)制的使用,可以降低對(duì)于昂貴的資源申請(qǐng),在高并發(fā)下提高處理能力。
NIO客戶(hù)端的編程模型最大特點(diǎn):依賴(lài)反置,松耦合帶來(lái)性能提升。在請(qǐng)求流程協(xié)議中支持“票根”,也就是我們說(shuō)的回執(zhí)。例如,你今天面試完了,不需要你在阿里巴巴前臺(tái)等著結(jié)果,直接留個(gè)電話(huà),有消息就會(huì)直接通知,電話(huà)就是通知結(jié)果和服務(wù)請(qǐng)求者的關(guān)聯(lián)手段。(此時(shí)阿里巴巴前臺(tái)和會(huì)議室就會(huì)有足夠的空間給其他人來(lái)面試,這就是資源)
服務(wù)端使用NIO就不多說(shuō)了,這里主要說(shuō)一下在客戶(hù)端的使用場(chǎng)景。兩者是否真的有很大的差別,是否NIO有絕對(duì)的優(yōu)勢(shì),其實(shí)還是和場(chǎng)景有關(guān)。簡(jiǎn)單說(shuō)來(lái)就一個(gè)判斷標(biāo)準(zhǔn):應(yīng)用對(duì)于通道的利用率是否夠高。下面列了4種場(chǎng)景:
1. 一次請(qǐng)求數(shù)據(jù)量很少,服務(wù)處理速度很快。
2. 一次請(qǐng)求數(shù)據(jù)量很多,服務(wù)處理速度很快。
3. 一次請(qǐng)求數(shù)據(jù)量很少,服務(wù)處理速度很慢。
4. 一次請(qǐng)求數(shù)據(jù)量很多,服務(wù)處理速度很慢。
場(chǎng)景1,傳輸效率很高,服務(wù)處理速度很快,一次請(qǐng)求很快就被完成,采用NIO和BIO,在性能優(yōu)勢(shì)上除了操作系統(tǒng)對(duì)NIO的優(yōu)化以外,BIO連接池不輸于NIO。在易用性上,BIO更加容易處理。(NIO的異步機(jī)制,就要求消息傳輸協(xié)議需要有會(huì)話(huà)碼來(lái)提供異步處理入口選擇如何處理)
場(chǎng)景2,傳輸過(guò)程比較長(zhǎng),消耗時(shí)間比較多,服務(wù)處理速度很快,因此交互的時(shí)間大部分都還是在數(shù)據(jù)通道傳輸上,由于NIO在傳輸過(guò)程中依然是串行化的,因此BIO的連接池優(yōu)于NIO,同時(shí)NIO一個(gè)客戶(hù)端只有一個(gè)通道,因此BIO開(kāi)的連接池越大,并行處理能力越強(qiáng),因此BIO效率比較好一些。
場(chǎng)景3,傳輸量比較少,服務(wù)處理比較慢,很明顯這是通道利用率低的表現(xiàn),NIO有絕對(duì)的優(yōu)勢(shì),特別是在高并發(fā)下。信道和服務(wù)端客戶(hù)端資源被充分利用。
場(chǎng)景4,傳輸量比較多,服務(wù)處理也比較慢,這時(shí)候可以發(fā)現(xiàn)信道利用率取決于服務(wù)事件和傳輸消耗時(shí)間的比例,這類(lèi)場(chǎng)景某些情況下BIO也會(huì)優(yōu)于NIO。
單線(xiàn)程和多線(xiàn)程
在使用多線(xiàn)程來(lái)優(yōu)化程序的時(shí)候,是否考慮過(guò)多線(xiàn)程的使用場(chǎng)景,多線(xiàn)程不是萬(wàn)能藥,在某些情況下還可能是毒藥。使用多線(xiàn)程的過(guò)程中,需要考慮這么幾個(gè)因素:
1. 資源競(jìng)爭(zhēng),復(fù)雜度增加。
為什么前面提到的NIO客戶(hù)端在處理數(shù)據(jù)流發(fā)送和讀取的時(shí)候都是采用單線(xiàn)程,數(shù)據(jù)流的發(fā)送和讀取都是在一個(gè)數(shù)據(jù)通道上的,而讀取和發(fā)送本身時(shí)間消耗是固定的(不論是多線(xiàn)程還是單線(xiàn)程),同時(shí)增加了復(fù)雜度(需要處理數(shù)據(jù)包整合問(wèn)題)。這其實(shí)就是在資源上的串行化操作直接導(dǎo)致了任務(wù)的串行化,因此任務(wù)多線(xiàn)程反而起到了反作用。
2. 是否是關(guān)鍵路徑的工作,占關(guān)鍵路徑的比例。
首先,在優(yōu)化以前需要考慮優(yōu)化的內(nèi)容是否是關(guān)鍵路徑的工作,如果不是,那么增加復(fù)雜度實(shí)現(xiàn)的多線(xiàn)程模式,就沒(méi)有價(jià)值。其次就是看是否是在關(guān)鍵路徑中占有比較大的比例,同樣的,還是投入產(chǎn)出比例(多線(xiàn)程帶來(lái)的復(fù)雜度以及在高并發(fā)下的一些資源保護(hù)措施都需要很多的維護(hù)成本)。
3. 任務(wù)的合理切分。
在NIO的客戶(hù)端,接受數(shù)據(jù)的事件將會(huì)寫(xiě)得很輕量級(jí),但是接受到數(shù)據(jù)然后分析數(shù)據(jù)還原成業(yè)務(wù)對(duì)象,則會(huì)通過(guò)線(xiàn)程池的方式來(lái)分別處理。就好比監(jiān)聽(tīng)連接到來(lái),和實(shí)際的去建立連接分成了兩個(gè)階段的任務(wù),讓事件型的任務(wù)單純,快速執(zhí)行,讓與業(yè)務(wù)相關(guān)的部分通過(guò)多線(xiàn)程并行的方式提高處理效率。總的來(lái)說(shuō)就是把任務(wù)劃分成為系統(tǒng)性的任務(wù)和業(yè)務(wù)性的任務(wù),前者消耗時(shí)間少,設(shè)計(jì)盡量簡(jiǎn)單高效,采用單線(xiàn)程處理即可,后者通常情況下在處理流程和資源上不沖突的情況可以通過(guò)多線(xiàn)程并行提高效率。
優(yōu)化應(yīng)用關(guān)注點(diǎn):
A.關(guān)鍵路徑是否可以?xún)?yōu)化,關(guān)鍵路徑的任務(wù)拆分。
B.關(guān)鍵路徑上的單個(gè)任務(wù)是否可以拆分并行執(zhí)行。(是否有資源競(jìng)爭(zhēng),是否會(huì)有流程上的前后依賴(lài),是否增加復(fù)雜度引入新的不穩(wěn)定因素)
C.系統(tǒng)資源和依賴(lài)外部系統(tǒng)是否會(huì)成為瓶頸。(單機(jī)的CPU,IO都會(huì)在一定的壓力下成下降趨勢(shì),并行執(zhí)行反而降低了處理能力)
因此,可以看到不論是MapReduce設(shè)計(jì)下的Hadoop,還是Erlang語(yǔ)言級(jí)別的特性,都盡量的希望任務(wù)之間可以并行執(zhí)行,相互之間低耦合,通過(guò)異步事件消息通知方式來(lái)交互,同時(shí)數(shù)據(jù)沒(méi)有共享,防止資源競(jìng)爭(zhēng)導(dǎo)致無(wú)法并行高效處理。系統(tǒng)設(shè)計(jì)還是要根據(jù)場(chǎng)景來(lái)判斷使用什么方式優(yōu)化,越簡(jiǎn)單越好。