線程同步
作者 : buaawhl
我們可以在計(jì)算機(jī)上運(yùn)行各種計(jì)算機(jī)軟件程序。每一個(gè)運(yùn)行的程序可能包括多個(gè)獨(dú)立運(yùn)行的線程(Thread)。
線程(Thread)是一份獨(dú)立運(yùn)行的程序,有自己專用的運(yùn)行棧。線程有可能和其他線程共享一些資源,比如,內(nèi)存,文件,數(shù)據(jù)庫等。
當(dāng)多個(gè)線程同時(shí)讀寫同一份共享資源的時(shí)候,可能會(huì)引起沖突。這時(shí)候,我們需要引入線程“同步”機(jī)制,即各位線程之間要有個(gè)先來后到,不能一窩蜂擠上去搶作一團(tuán)。
同步這個(gè)詞是從英文synchronize(使同時(shí)發(fā)生)翻譯過來的。我也不明白為什么要用這個(gè)很容易引起誤解的詞。既然大家都這么用,咱們也就只好這么將就。
線程同步的真實(shí)意思和字面意思恰好相反。線程同步的真實(shí)意思,其實(shí)是“排隊(duì)”:幾個(gè)線程之間要排隊(duì),一個(gè)一個(gè)對共享資源進(jìn)行操作,而不是同時(shí)進(jìn)行操作。
因此,關(guān)于線程同步,需要牢牢記住的第一點(diǎn)是:線程同步就是線程排隊(duì)。同步就是排隊(duì)。線程同步的目的就是避免線程“同步”執(zhí)行。這可真是個(gè)無聊的繞口令。
關(guān)于線程同步,需要牢牢記住的第二點(diǎn)是 “共享”這兩個(gè)字。只有共享資源的讀寫訪問才需要同步。如果不是共享資源,那么就根本沒有同步的必要。
關(guān)于線程同步,需要牢牢記住的第三點(diǎn)是,只有“變量”才需要同步訪問。如果共享的資源是固定不變的,那么就相當(dāng)于“常量”,線程同時(shí)讀取常量也不需要同步。至少一個(gè)線程修改共享資源,這樣的情況下,線程之間就需要同步。
關(guān)于線程同步,需要牢牢記住的第四點(diǎn)是:多個(gè)線程訪問共享資源的代碼有可能是同一份代碼,也有可能是不同的代碼;無論是否執(zhí)行同一份代碼,只要這些線程的代碼訪問同一份可變的共享資源,這些線程之間就需要同步。
為了加深理解,下面舉幾個(gè)例子。
有兩個(gè)采購員,他們的工作內(nèi)容是相同的,都是遵循如下的步驟:
(1)到市場上去,尋找并購買有潛力的樣品。
(2)回到公司,寫報(bào)告。
這兩個(gè)人的工作內(nèi)容雖然一樣,他們都需要購買樣品,他們可能買到同樣種類的樣品,但是他們絕對不會(huì)購買到同一件樣品,他們之間沒有任何共享資源。所以,他們可以各自進(jìn)行自己的工作,互不干擾。
這兩個(gè)采購員就相當(dāng)于兩個(gè)線程;兩個(gè)采購員遵循相同的工作步驟,相當(dāng)于這兩個(gè)線程執(zhí)行同一段代碼。
下面給這兩個(gè)采購員增加一個(gè)工作步驟。采購員需要根據(jù)公司的“布告欄”上面公布的信息,安排自己的工作計(jì)劃。
這兩個(gè)采購員有可能同時(shí)走到布告欄的前面,同時(shí)觀看布告欄上的信息。這一點(diǎn)問題都沒有。因?yàn)椴几鏅谑侵蛔x的,這兩個(gè)采購員誰都不會(huì)去修改布告欄上寫的信息。
下面增加一個(gè)角色。一個(gè)辦公室行政人員這個(gè)時(shí)候,也走到了布告欄前面,準(zhǔn)備修改布告欄上的信息。
如果行政人員先到達(dá)布告欄,并且正在修改布告欄的內(nèi)容。兩個(gè)采購員這個(gè)時(shí)候,恰好也到了。這兩個(gè)采購員就必須等待行政人員完成修改之后,才能觀看修改后的信息。
如果行政人員到達(dá)的時(shí)候,兩個(gè)采購員已經(jīng)在觀看布告欄了。那么行政人員需要等待兩個(gè)采購員把當(dāng)前信息記錄下來之后,才能夠?qū)懮闲碌男畔ⅰ?
上述這兩種情況,行政人員和采購員對布告欄的訪問就需要進(jìn)行同步。因?yàn)槠渲幸粋€(gè)線程(行政人員)修改了共享資源(布告欄)。而且我們可以看到,行政人員的工作流程和采購員的工作流程(執(zhí)行代碼)完全不同,但是由于他們訪問了同一份可變共享資源(布告欄),所以他們之間需要同步。
同步鎖
前面講了為什么要線程同步,下面我們就來看如何才能線程同步。
線程同步的基本實(shí)現(xiàn)思路還是比較容易理解的。我們可以給共享資源加一把鎖,這把鎖只有一把鑰匙。哪個(gè)線程獲取了這把鑰匙,才有權(quán)利訪問該共享資源。
生活中,我們也可能會(huì)遇到這樣的例子。一些超市的外面提供了一些自動(dòng)儲(chǔ)物箱。每個(gè)儲(chǔ)物箱都有一把鎖,一把鑰匙。人們可以使用那些帶有鑰匙的儲(chǔ)物箱,把東西放到儲(chǔ)物箱里面,把儲(chǔ)物箱鎖上,然后把鑰匙拿走。這樣,該儲(chǔ)物箱就被鎖住了,其他人不能再訪問這個(gè)儲(chǔ)物箱。(當(dāng)然,真實(shí)的儲(chǔ)物箱鑰匙是可以被人拿走復(fù)制的,所以不要把貴重物品放在超市的儲(chǔ)物箱里面。于是很多超市都采用了電子密碼鎖。)
線程同步鎖這個(gè)模型看起來很直觀。但是,還有一個(gè)嚴(yán)峻的問題沒有解決,這個(gè)同步鎖應(yīng)該加在哪里?
當(dāng)然是加在共享資源上了。反應(yīng)快的讀者一定會(huì)搶先回答。
沒錯(cuò),如果可能,我們當(dāng)然盡量把同步鎖加在共享資源上。一些比較完善的共享資源,比如,文件系統(tǒng),數(shù)據(jù)庫系統(tǒng)等,自身都提供了比較完善的同步鎖機(jī)制。我們不用另外給這些資源加鎖,這些資源自己就有鎖。
但是,大部分情況下,我們在代碼中訪問的共享資源都是比較簡單的共享對象。這些對象里面沒有地方讓我們加鎖。
讀者可能會(huì)提出建議:為什么不在每一個(gè)對象內(nèi)部都增加一個(gè)新的區(qū)域,專門用來加鎖呢?這種設(shè)計(jì)理論上當(dāng)然也是可行的。問題在于,線程同步的情況并不是很普遍。如果因?yàn)檫@小概率事件,在所有對象內(nèi)部都開辟一塊鎖空間,將會(huì)帶來極大的空間浪費(fèi)。得不償失。
于是,現(xiàn)代的編程語言的設(shè)計(jì)思路都是把同步鎖加在代碼段上。確切的說,是把同步鎖加在“訪問共享資源的代碼段”上。這一點(diǎn)一定要記住,同步鎖是加在代碼段上的。
同步鎖加在代碼段上,就很好地解決了上述的空間浪費(fèi)問題。但是卻增加了模型的復(fù)雜度,也增加了我們的理解難度。
現(xiàn)在我們就來仔細(xì)分析“同步鎖加在代碼段上”的線程同步模型。
首先,我們已經(jīng)解決了同步鎖加在哪里的問題。我們已經(jīng)確定,同步鎖不是加在共享資源上,而是加在訪問共享資源的代碼段上。
其次,我們要解決的問題是,我們應(yīng)該在代碼段上加什么樣的鎖。這個(gè)問題是重點(diǎn)中的重點(diǎn)。這是我們尤其要注意的問題:訪問同一份共享資源的不同代碼段,應(yīng)該加上同一個(gè)同步鎖;如果加的是不同的同步鎖,那么根本就起不到同步的作用,沒有任何意義。
這就是說,同步鎖本身也一定是多個(gè)線程之間的共享對象。
Java語言的synchronized關(guān)鍵字
為了加深理解,舉幾個(gè)代碼段同步的例子。
不同語言的同步鎖模型都是一樣的。只是表達(dá)方式有些不同。這里我們以當(dāng)前最流行的Java語言為例。Java語言里面用synchronized關(guān)鍵字給代碼段加鎖。整個(gè)語法形式表現(xiàn)為
synchronized(同步鎖) {
// 訪問共享資源,需要同步的代碼段
}
這里尤其要注意的就是,同步鎖本身一定要是共享的對象。
… f1() {
Object lock1 = new Object(); // 產(chǎn)生一個(gè)同步鎖
synchronized(lock1){
// 代碼段 A
// 訪問共享資源 resource1
// 需要同步
}
}
上面這段代碼沒有任何意義。因?yàn)槟莻€(gè)同步鎖是在函數(shù)體內(nèi)部產(chǎn)生的。每個(gè)線程調(diào)用這段代碼的時(shí)候,都會(huì)產(chǎn)生一個(gè)新的同步鎖。那么多個(gè)線程之間,使用的是不同的同步鎖。根本達(dá)不到同步的目的。
同步代碼一定要寫成如下的形式,才有意義。
public static final Object lock1 = new Object();
… f1() {
synchronized(lock1){ // lock1 是公用同步鎖
// 代碼段 A
// 訪問共享資源 resource1
// 需要同步
}
你不一定要把同步鎖聲明為static或者public,但是你一定要保證相關(guān)的同步代碼之間,一定要使用同一個(gè)同步鎖。
講到這里,你一定會(huì)好奇,這個(gè)同步鎖到底是個(gè)什么東西。為什么隨便聲明一個(gè)Object對象,就可以作為同步鎖?
在Java里面,同步鎖的概念就是這樣的。任何一個(gè)Object Reference都可以作為同步鎖。我們可以把Object Reference理解為對象在內(nèi)存分配系統(tǒng)中的內(nèi)存地址。因此,要保證同步代碼段之間使用的是同一個(gè)同步鎖,我們就要保證這些同步代碼段的synchronized關(guān)鍵字使用的是同一個(gè)Object Reference,同一個(gè)內(nèi)存地址。這也是為什么我在前面的代碼中聲明lock1的時(shí)候,使用了final關(guān)鍵字,這就是為了保證lock1的Object Reference在整個(gè)系統(tǒng)運(yùn)行過程中都保持不變。
一些求知欲強(qiáng)的讀者可能想要繼續(xù)深入了解synchronzied(同步鎖)的實(shí)際運(yùn)行機(jī)制。Java虛擬機(jī)規(guī)范中(你可以在google用“JVM Spec”等關(guān)鍵字進(jìn)行搜索),有對synchronized關(guān)鍵字的詳細(xì)解釋。synchronized會(huì)編譯成 monitor enter, … monitor exit之類的指令對。Monitor就是實(shí)際上的同步鎖。每一個(gè)Object Reference在概念上都對應(yīng)一個(gè)monitor。
這些實(shí)現(xiàn)細(xì)節(jié)問題,并不是理解同步鎖模型的關(guān)鍵。我們繼續(xù)看幾個(gè)例子,加深對同步鎖模型的理解。
public static final Object lock1 = new Object();
… f1() {
synchronized(lock1){ // lock1 是公用同步鎖
// 代碼段 A
// 訪問共享資源 resource1
// 需要同步
}
}
… f2() {
synchronized(lock1){ // lock1 是公用同步鎖
// 代碼段 B
// 訪問共享資源 resource1
// 需要同步
}
}
上述的代碼中,代碼段A和代碼段B就是同步的。因?yàn)樗鼈兪褂玫氖峭粋€(gè)同步鎖lock1。
如果有10個(gè)線程同時(shí)執(zhí)行代碼段A,同時(shí)還有20個(gè)線程同時(shí)執(zhí)行代碼段B,那么這30個(gè)線程之間都是要進(jìn)行同步的。
這30個(gè)線程都要競爭一個(gè)同步鎖lock1。同一時(shí)刻,只有一個(gè)線程能夠獲得lock1的所有權(quán),只有一個(gè)線程可以執(zhí)行代碼段A或者代碼段B。其他競爭失敗的線程只能暫停運(yùn)行,進(jìn)入到該同步鎖的就緒(Ready)隊(duì)列。
每一個(gè)同步鎖下面都掛了幾個(gè)線程隊(duì)列,包括就緒(Ready)隊(duì)列,待召(Waiting)隊(duì)列等。比如,lock1對應(yīng)的就緒隊(duì)列就可以叫做lock1 - ready queue。每個(gè)隊(duì)列里面都可能有多個(gè)暫停運(yùn)行的線程。
注意,競爭同步鎖失敗的線程進(jìn)入的是該同步鎖的就緒(Ready)隊(duì)列,而不是后面要講述的待召隊(duì)列(Waiting Queue,也可以翻譯為等待隊(duì)列)。就緒隊(duì)列里面的線程總是時(shí)刻準(zhǔn)備著競爭同步鎖,時(shí)刻準(zhǔn)備著運(yùn)行。而待召隊(duì)列里面的線程則只能一直等待,直到等到某個(gè)信號的通知之后,才能夠轉(zhuǎn)移到就緒隊(duì)列中,準(zhǔn)備運(yùn)行。
成功獲取同步鎖的線程,執(zhí)行完同步代碼段之后,會(huì)釋放同步鎖。該同步鎖的就緒隊(duì)列中的其他線程就繼續(xù)下一輪同步鎖的競爭。成功者就可以繼續(xù)運(yùn)行,失敗者還是要乖乖地待在就緒隊(duì)列中。
因此,線程同步是非常耗費(fèi)資源的一種操作。我們要盡量控制線程同步的代碼段范圍。同步的代碼段范圍越小越好。我們用一個(gè)名詞“同步粒度”來表示同步代碼段的范圍。
同步粒度
在Java語言里面,我們可以直接把synchronized關(guān)鍵字直接加在函數(shù)的定義上。
比如。
… synchronized … f1() {
// f1 代碼段
}
這段代碼就等價(jià)于
… f1() {
synchronized(this){ // 同步鎖就是對象本身
// f1 代碼段
}
}
同樣的原則適用于靜態(tài)(static)函數(shù)
比如。
… static synchronized … f1() {
// f1 代碼段
}
這段代碼就等價(jià)于
…static … f1() {
synchronized(Class.forName(…)){ // 同步鎖是類定義本身
// f1 代碼段
}
}
但是,我們要盡量避免這種直接把synchronized加在函數(shù)定義上的偷懶做法。因?yàn)槲覀円刂仆搅6?。同步的代碼段越小越好。synchronized控制的范圍越小越好。
我們不僅要在縮小同步代碼段的長度上下功夫,我們同時(shí)還要注意細(xì)分同步鎖。
比如,下面的代碼
public static final Object lock1 = new Object();
… f1() {
synchronized(lock1){ // lock1 是公用同步鎖
// 代碼段 A
// 訪問共享資源 resource1
// 需要同步
}
}
… f2() {
synchronized(lock1){ // lock1 是公用同步鎖
// 代碼段 B
// 訪問共享資源 resource1
// 需要同步
}
}
… f3() {
synchronized(lock1){ // lock1 是公用同步鎖
// 代碼段 C
// 訪問共享資源 resource2
// 需要同步
}
}
… f4() {
synchronized(lock1){ // lock1 是公用同步鎖
// 代碼段 D
// 訪問共享資源 resource2
// 需要同步
}
}
上述的4段同步代碼,使用同一個(gè)同步鎖lock1。所有調(diào)用4段代碼中任何一段代碼的線程,都需要競爭同一個(gè)同步鎖lock1。
我們仔細(xì)分析一下,發(fā)現(xiàn)這是沒有必要的。
因?yàn)閒1()的代碼段A和f2()的代碼段B訪問的共享資源是resource1,f3()的代碼段C和f4()的代碼段D訪問的共享資源是resource2,它們沒有必要都競爭同一個(gè)同步鎖lock1。我們可以增加一個(gè)同步鎖lock2。f3()和f4()的代碼可以修改為:
public static final Object lock2 = new Object();
… f3() {
synchronized(lock2){ // lock2 是公用同步鎖
// 代碼段 C
// 訪問共享資源 resource2
// 需要同步
}
}
… f4() {
synchronized(lock2){ // lock2 是公用同步鎖
// 代碼段 D
// 訪問共享資源 resource2
// 需要同步
}
}
這樣,f1()和f2()就會(huì)競爭lock1,而f3()和f4()就會(huì)競爭lock2。這樣,分開來分別競爭兩個(gè)鎖,就可以大大較少同步鎖競爭的概率,從而減少系統(tǒng)的開銷。
回復(fù) 更多評論