本文為原創(chuàng),如需轉(zhuǎn)載,請(qǐng)注明作者和出處,謝謝!
上一篇:Java多線程初學(xué)者指南(8):從線程返回?cái)?shù)據(jù)的兩種方法
Java中的變量分為兩類:局部變量和類變量。局部變量是指在方法內(nèi)定義的變量,如在run方法中定義的變量。對(duì)于這些變量來(lái)說(shuō),并不存在線程之間共享的問(wèn)題。因此,它們不需要進(jìn)行數(shù)據(jù)同步。類變量是在類中定義的變量,作用域是整個(gè)類。這類變量可以被多個(gè)線程共享。因此,我們需要對(duì)這類變量進(jìn)行數(shù)據(jù)同步。
數(shù)據(jù)同步就是指在同一時(shí)間,只能由一個(gè)線程來(lái)訪問(wèn)被同步的類變量,當(dāng)前線程訪問(wèn)完這些變量后,其他線程才能繼續(xù)訪問(wèn)。這里說(shuō)的訪問(wèn)是指有寫(xiě)操作的訪問(wèn),如果所有訪問(wèn)類變量的線程都是讀操作,一般是不需要數(shù)據(jù)同步的。
那么如果不對(duì)共享的類變量進(jìn)行數(shù)據(jù)同步,會(huì)發(fā)生什么情況呢?讓我們先看看下面的代碼會(huì)發(fā)生什么樣的事情:
package test;
public class MyThread extends Thread
{
public static int n = 0;
public void run()
{
int m = n;
yield();
m++;
n = m;
}
public static void main(String[] args) throws Exception
{
MyThread myThread = new MyThread ();
Thread threads[] = new Thread[100];
for (int i = 0; i < threads.length; i++)
threads[i] = new Thread(myThread);
for (int i = 0; i < threads.length; i++)
threads[i].start();
for (int i = 0; i < threads.length; i++)
threads[i].join();
System.out.println("n = " + MyThread.n);
}
}
在執(zhí)行上面代碼的可能結(jié)果如下:
n = 59
看到這個(gè)結(jié)果,可能很多讀者會(huì)感到奇怪。這個(gè)程序明明是啟動(dòng)了100個(gè)線程,然后每個(gè)線程將靜態(tài)變量n加1。最后使用join方法使這100個(gè)線程都運(yùn)行完后,再輸出這個(gè)n值。按正常來(lái)講,結(jié)果應(yīng)該是n = 100。可偏偏結(jié)果小于100。
其實(shí)產(chǎn)生這種結(jié)果的罪魁禍?zhǔn)拙褪俏覀兘?jīng)常提到的“臟數(shù)據(jù)”。而run方法中的yield()語(yǔ)句就是產(chǎn)生“臟數(shù)據(jù)”的始作俑者(不加yield語(yǔ)句也可能會(huì)產(chǎn)生“臟數(shù)據(jù)”,但不會(huì)這么明顯,只有將100改成更大的數(shù),才會(huì)經(jīng)常產(chǎn)生“臟數(shù)據(jù)”,在本例中調(diào)用yield就是為了放大“臟數(shù)據(jù)”的效果)。yield方法的作用是使線程暫停,也就是使調(diào)用yield方法的線程暫時(shí)放棄CPU資源,使CPU有機(jī)會(huì)來(lái)執(zhí)行其他的線程。為了說(shuō)明這個(gè)程序如何產(chǎn)生“臟數(shù)據(jù)”,我們假設(shè)只創(chuàng)建了兩個(gè)線程:thread1和thread2。由于先調(diào)用了thread1的start方法,因此,thread1的run方法一般會(huì)先運(yùn)行。當(dāng)thread1的run方法運(yùn)行到第一行(int m = n;)時(shí),將n的值賦給m。當(dāng)執(zhí)行到第二行的yield方法后,thread1就會(huì)暫時(shí)停止執(zhí)行,而當(dāng)thread1暫停時(shí),thread2獲得了CPU資源后開(kāi)始運(yùn)行(之前thread2一直處于就緒狀態(tài)),當(dāng)thread2執(zhí)行到第一行(int m = n;)時(shí),由于thread1在執(zhí)行到yield時(shí)n仍然是0,因此,thread2中的m獲得的值也是0。這樣就造成了thread1和thread2的m獲得的都是0。在它們執(zhí)行完yield方法后,都是從0開(kāi)始加1,因此,無(wú)論誰(shuí)先執(zhí)行完,最后n的值都是1,只是這個(gè)n被thread1和thread2各賦了一遍值。這個(gè)過(guò)程如下圖如示:
也許有人會(huì)問(wèn),如果只有n++,會(huì)產(chǎn)生“臟數(shù)據(jù)”嗎?答案是肯定的。那么n++只是一條語(yǔ)句,又如何在執(zhí)行過(guò)程中將CPU交給其他的線程呢?其實(shí)這只是表面現(xiàn)象,n++在被Java編譯器編譯成中間語(yǔ)言(也叫做字節(jié)碼)后,并不是一條語(yǔ)言。讓我們看看下面的Java代碼將會(huì)被編譯成什么樣的Java中間語(yǔ)言。
Java源代碼
public void run()
{
n++;
}
被編譯后的中間語(yǔ)言代碼
001 public void run()
002 {
003 aload_0
004 dup
005 getfield
006 iconst_1
007 iadd
008 putfield
009 return
010 }
大家可以看到在run方法中只有n++一條語(yǔ)句,而在編譯后,卻有7條中間語(yǔ)言語(yǔ)句。我們并不需要知道這些語(yǔ)句的功能是什么,只看一下第005、007和008行語(yǔ)句。在005行是getfield,根據(jù)它的英文含義可知是要得到某個(gè)值,因?yàn)檫@里只有一個(gè)n,所以毫無(wú)疑問(wèn),是要得到n的值。而在007行的iadd也不難猜測(cè)是將這個(gè)得到的n值加1。在008行的putfield的含義我想大家可能已經(jīng)猜出來(lái)了,它負(fù)責(zé)將這個(gè)加1后的n再更新回類變量n。說(shuō)到這,可能大家還有一個(gè)疑惑,執(zhí)行n++時(shí)直接將n加1不就行了,為什么要如此費(fèi)周折。其實(shí)這里涉及到一個(gè)Java內(nèi)存模型的問(wèn)題。
Java的內(nèi)存模型分為主存儲(chǔ)區(qū)和工作存儲(chǔ)區(qū)。主存儲(chǔ)區(qū)保存了Java中所有的實(shí)例。也就是說(shuō),在我們使用new來(lái)建立一個(gè)對(duì)象后,這個(gè)對(duì)象及它內(nèi)部的方法、變量等都保存在這一區(qū)域,在MyThread類中的n就保存在這個(gè)區(qū)域。主存儲(chǔ)區(qū)可以被所有線程共享。而工作存儲(chǔ)區(qū)就是我們前面所講的線程棧,在這個(gè)區(qū)域里保存了在run方法以及run方法所調(diào)用的方法中定義的變量,也就是方法變量。在線程要修改主存儲(chǔ)區(qū)中的變量時(shí),并不是直接修改這些變量,而是將它們先復(fù)制到當(dāng)前線程的工作存儲(chǔ)區(qū),在修改完后,再將這個(gè)變量值覆蓋主存儲(chǔ)區(qū)的相應(yīng)的變量值。
在了解了Java的內(nèi)存模型后,就不難理解為什么n++也不是原子操作了。它必須經(jīng)過(guò)一個(gè)拷貝、加1和覆蓋的過(guò)程。這個(gè)過(guò)程和在MyThread類中模擬的過(guò)程類似。大家可以想象,如果在執(zhí)行到getfield時(shí),thread1由于某種原因被中斷,那么就會(huì)發(fā)生和MyThread類的執(zhí)行結(jié)果類似的情況。要想徹底解決這個(gè)問(wèn)題,就必須使用某種方法對(duì)n進(jìn)行同步,也就是在同一時(shí)間只能有一個(gè)線程操作n,這也稱為對(duì)n的原子操作。
下一篇:Java多線程初學(xué)者指南(10):使用Synchronized關(guān)鍵字同步類方法
新浪微博:http://t.sina.com.cn/androidguy 昵稱:李寧_Lining