類的初始化和對象初始化是 JVM 管理的類型生命周期中非常重要的兩個環節,Google 了一遍網絡,有關類裝載機制的文章倒是不少,然而類初始化和對象初始化的文章并不多,特別是從字節碼和 JVM 層次來分析的文章更是鮮有所見。
本文主要對類和對象初始化全過程進行分析,通過一個實際問題引入,將源代碼轉換成 JVM 字節碼后,對 JVM 執行過程的關鍵點進行全面解析,并在文中穿插入了相關 JVM 規范和 JVM 的部分內部理論知識,以理論與實際結合的方式介紹對象初始化和類初始化之間的協作以及可能存在的沖突問題。
問題引入
近日我在調試一個枚舉類型的解析器程序,該解析器是將數據庫內一萬多條枚舉代碼裝載到緩存中,為了實現快速定位枚舉代碼和具體枚舉類別的所有枚舉元素,該類在裝載枚舉代碼的同時對其采取兩種策略建立內存索引。由于該類是一個公共服務類,在程序各個層面都會使用到它,因此我將它實現為一個單例類。這個類在我調整類實例化語句位置之前運行正常,但當我把該類實例化語句調整到靜態初始化語句之前時,我的程序不再為我工作了。
下面是經過我簡化后的示例代碼:
package com.redoffice.spreadsheets.data;

import java.util.Collections;
import java.util.HashMap;
import java.util.Map;


public class CachingEnumResolver
{
// 單態實例 一切問題皆由此行引起
private static final CachingEnumResolver SINGLE_ENUM_RESOLVER = new CachingEnumResolver();

/**//* MSGCODE->Category內存索引 */
private static Map<String, String> CODE_MAP_CACHE;

static
{
CODE_MAP_CACHE = new HashMap<String, String>();
// 為了說明問題,我在這里初始化一條數據
CODE_MAP_CACHE.put("0", "北京市");
}

// private, for single instance

private CachingEnumResolver()
{
// 初始化加載數據 引起問題,該方法也要負點責任
initEnums();
}


/** *//**
* 初始化所有的枚舉類型
*/

public static void initEnums()
{
// ~~~~~~~~~問題從這里開始暴露 ~~~~~~~~~~~//

if (null == CODE_MAP_CACHE)
{
System.out.println("CODE_MAP_CACHE為空,問題在這里開始暴露.");
CODE_MAP_CACHE = new HashMap<String, String>();
}
CODE_MAP_CACHE.put("1", "北京市");
CODE_MAP_CACHE.put("2", "云南省");

//
.. other code
}


public Map<String, String> getCache()
{
return Collections.unmodifiableMap(CODE_MAP_CACHE);
}


/** *//**
* 獲取單態實例
*
* @return
*/

public static CachingEnumResolver getInstance()
{
return SINGLE_ENUM_RESOLVER;
}


public static void main(String[] args)
{
System.out.println(CachingEnumResolver.getInstance().getCache());
}

}

想必大家看了上面的代碼后會感覺有些茫然,這個類看起來沒有問題啊,這的確屬于典型的餓漢式單態模式啊,怎么會有問題呢?
是的,他看起來的確沒有問題,可是如果將他 run 起來時,其結果是他不會為你正確 work。運行該類,它的執行結果是:
CODE_MAP_CACHE為空,問題在這里開始暴露.


{0=北京市}
我的程序怎么會這樣?為什么在 initEnum() 方法里 CODE_MAP_CACHE 為空?為什么我輸出的 CODE_MAP_CACHE 內容只有一個元素,其它兩個元素呢????!!
看到這里,如果是你在調試該程序,你此刻一定覺得很奇怪,難道是我的 Jvm 有問題嗎?非也!如果不是,那我的程序是怎么了?這絕對不是我想要的結果。可事實上無論怎么修改 initEnum() 方法都無濟于事,起碼我最初是一定不會懷疑到問題可能出在創建 CachingEnumResolver 實例這一環節上。正是因為我太相信我創建 CachingEnumResolver 實例的方法,加之對 Java 類初始化與對象實例化底層原理理解有所偏差,使我為此付出了三、四個小時--約半個工作日的大好青春。
那么問題究竟出在哪里呢?為什么會出現這樣的怪事呢?在解決這個問題之前,先讓我們來了解一下JVM的類和對象初始化的底層機制。
類的生命周期

上圖展示的是類生命周期流向;在本文里,我只打算談談類的"初始化"以及"對象實例化"兩個階段。
類初始化
類"初始化"階段,它是一個類或接口被首次使用的前階段中的最后一項工作,本階段負責為類變量賦予正確的初始值。
Java 編譯器把所有的類變量初始化語句和類型的靜態初始化器通通收集到 <clinit> 方法內,該方法只能被 Jvm 調用,專門承擔初始化工作。
除接口以外,初始化一個類之前必須保證其直接超類已被初始化,并且該初始化過程是由 Jvm 保證線程安全的。另外,并非所有的類都會擁有一個 <clinit>() 方法,在以下條件中該類不會擁有 <clinit>() 方法:
- 該類既沒有聲明任何類變量,也沒有靜態初始化語句;
- 該類聲明了類變量,但沒有明確使用類變量初始化語句或靜態初始化語句初始化;
- 該類僅包含靜態 final 變量的類變量初始化語句,并且類變量初始化語句是編譯時常量表達式。
對象初始化
在類被裝載、連接和初始化,這個類就隨時都可能使用了。對象實例化和初始化是就是對象生命的起始階段的活動,在這里我們主要討論對象的初始化工作的相關特點。
Java 編譯器在編譯每個類時都會為該類至少生成一個實例初始化方法--即 "<init>()" 方法。此方法與源代碼中的每個構造方法相對應,如果類沒有明確地聲明任何構造方法,編譯器則為該類生成一個默認的無參構造方法,這個默認的構造器僅僅調用父類的無參構造器,與此同時也會生成一個與默認構造方法對應的 "<init>()" 方法.
通常來說,<init>() 方法內包括的代碼內容大概為:調用另一個 <init>() 方法;對實例變量初始化;與其對應的構造方法內的代碼。
如果構造方法是明確地從調用同一個類中的另一個構造方法開始,那它對應的 <init>() 方法體內包括的內容為:一個對本類的 <init>() 方法的調用;對應用構造方法內的所有字節碼。
如果構造方法不是通過調用自身類的其它構造方法開始,并且該對象不是 Object 對象,那 <init>() 法內則包括的內容為:一個對父類 <init>() 方法的調用;對實例變量初始化方法的字節碼;最后是對應構造子的方法體字節碼。
如果這個類是 Object,那么它的 <init>() 方法則不包括對父類 <init>() 方法的調用。
類的初始化時機
本文到目前為止,我們已經大概有了解到了類生命周期中都經歷了哪些階段,但這個類的生命周期的開始階段--類裝載又是在什么時候被觸發呢?類又是何時被初始化的呢?讓我們帶著這三個疑問繼續去尋找答案。
Java 虛擬機規范為類的初始化時機做了嚴格定義:"initialize on first active use"--" 在首次主動使用時初始化"。這個規則直接影響著類裝載、連接和初始化類的機制--因為在類型被初始化之前它必須已經被連接,然而在連接之前又必須保證它已經被裝載了。
在與初始化時機相關的類裝載時機問題上,Java 虛擬機規范并沒有對其做嚴格的定義,這就使得 JVM 在實現上可以根據自己的特點提供采用不同的裝載策略。我們可以思考一下 Jboss AOP 框架的實現原理,它就是在對你的 class 文件裝載環節做了手腳--插入了 AOP 的相關攔截字節碼,這使得它可以對程序員做到完全透明化,哪怕你用 new 操作符創建出的對象實例也一樣能被 AOP 框架攔截--與之相對應的 Spring AOP,你必須通過他的 BeanFactory 獲得被 AOP 代理過的受管對象,當然 Jboss AOP 的缺點也很明顯--他是和 JBOSS 服務器綁定很緊密的,你不能很輕松的移植到其它服務器上。嗯~……,說到這里有些跑題了,要知道 AOP 實現策略足可以寫一本厚厚的書了,嘿嘿,就此打住。
說了這么多,類的初始化時機就是在"在首次主動使用時",那么,哪些情形下才符合首次主動使用的要求呢?
首次主動使用的情形:
- 創建某個類的新實例時--new、反射、克隆或反序列化;
- 調用某個類的靜態方法時;
- 使用某個類或接口的靜態字段或對該字段賦值時(final字段除外);
- 調用Java的某些反射方法時
- 初始化某個類的子類時
- 在虛擬機啟動時某個含有main()方法的那個啟動類。
除了以上幾種情形以外,所有其它使用JAVA類型的方式都是被動使用的,他們不會導致類的初始化。
我的問題究竟出在哪里
好了,了解了JVM的類初始化與對象初始化機制后,我們就有了理論基礎,也就可以理性的去分析問題了。
下面讓我們來看看前面[清單一]的JAVA源代碼反組譯出的字節碼:
Compiled from "CachingEnumResolver.java"
public class com.redoffice.spreadsheets.data.CachingEnumResolver extends java.la

ng.Object
{
public static void initEnums();
Code:
0: aconst_null
1: getstatic #3; //Field CODE_MAP_CACHE:Ljava/util/Map;
4: if_acmpne 25
7: getstatic #4; //Field java/lang/System.out:Ljava/io/PrintStream;
10: ldc #5; //String CODE_MAP_CACHE涓虹┖,闂鍦ㄨ繖閲屽紑濮嬫毚闇?.
12: invokevirtual #6; //Method java/io/PrintStream.println:(Ljava/lang/Str
ing;)V
15: new #7; //class java/util/HashMap
18: dup
19: invokespecial #8; //Method java/util/HashMap."<init>":()V
22: putstatic #3; //Field CODE_MAP_CACHE:Ljava/util/Map;
25: getstatic #3; //Field CODE_MAP_CACHE:Ljava/util/Map;
28: ldc #9; //String 1
30: ldc #10; //String 鍖椾含甯?
32: invokeinterface #11, 3; //InterfaceMethod java/util/Map.put:(Ljava/lang
/Object;Ljava/lang/Object;)Ljava/lang/Object;
37: pop
38: getstatic #3; //Field CODE_MAP_CACHE:Ljava/util/Map;
41: ldc #12; //String 2
43: ldc #13; //String 浜戝崡鐪?
45: invokeinterface #11, 3; //InterfaceMethod java/util/Map.put:(Ljava/lang
/Object;Ljava/lang/Object;)Ljava/lang/Object;
50: pop
51: return

public java.util.Map getCache();
Code:
0: getstatic #3; //Field CODE_MAP_CACHE:Ljava/util/Map;
3: invokestatic #14; //Method java/util/Collections.unmodifiableMap:(Lja
va/util/Map;)Ljava/util/Map;
6: areturn

public static com.redoffice.spreadsheets.data.CachingEnumResolver getInstance();

Code:
0: getstatic #15; //Field SINGLE_ENUM_RESOLVER:Lcom/redoffice/spreads
heets/data/CachingEnumResolver;
3: areturn

public static void main(java.lang.String[]);
Code:
0: getstatic #4; //Field java/lang/System.out:Ljava/io/PrintStream;
3: invokestatic #16; //Method getInstance:()Lcom/redoffice/spreadsheets/
data/CachingEnumResolver;
6: invokevirtual #17; //Method getCache:()Ljava/util/Map;
9: invokevirtual #18; //Method java/io/PrintStream.println:(Ljava/lang/Ob
ject;)V
12: return


static
{};
Code:
0: new #19; //class com/redoffice/spreadsheets/data/CachingEnumResolver

3: dup
4: invokespecial #20; //Method "<init>":()V
7: putstatic #15; //Field SINGLE_ENUM_RESOLVER:Lcom/redoffice/spreads
heets/data/CachingEnumResolver;
10: new #7; //class java/util/HashMap
13: dup
14: invokespecial #8; //Method java/util/HashMap."<init>":()V
17: putstatic #3; //Field CODE_MAP_CACHE:Ljava/util/Map;
20: getstatic #3; //Field CODE_MAP_CACHE:Ljava/util/Map;
23: ldc #21; //String 0
25: ldc #10; //String 鍖椾含甯?
27: invokeinterface #11, 3; //InterfaceMethod java/util/Map.put:(Ljava/lang
/Object;Ljava/lang/Object;)Ljava/lang/Object;
32: pop
33: return

}
如果上面顯示,清單內容是在 JDK1.4 環境下的字節碼內容,可能這份清單對于很大部分兄弟來說確實沒有多少吸引力,因為這些 JVM 指令確實不像源代碼那樣漂亮易懂。但它的的確確是查找和定位問題最直接的辦法,我們想要的答案就在這份 JVM 指令清單里。
現在,讓我們對該類從類初始化到對象實例初始化全過程分析[清單一]中的代碼執行軌跡。
如前面所述,類初始化是在類真正可用時的最后一項前階工作,該階段負責對所有類正確的初始化值,此項工作是線程安全的,JVM會保證多線程同步。
第1步:調用類初始化方法 CachingEnumResolver.<clinit>(),該方法對外界是不可見的,換句話說是 JVM 內部專用方法,<clinit>() 內包括了 CachingEnumResolver 內所有的具有指定初始值的類變量的初始化語句。要注意的是并非每個類都具有該方法,具體的內容在前面已有敘述。
第2步:進入 <clinit>() 方法內,讓我們看字節碼中的 "①" 行,該行與其上面兩行組合起來代表 new 一個 CachingEnumResolver 對象實例,而該代碼行本身是指調用 CachingEnumResolver 類的 <init>()方法。每一個 Java 類都具有一個 <init>() 方法,該方法是 Java 編譯器在編譯時生成的,對外界不可見,<init>() 方法內包括了所有具有指定初始化值的實例變量初始化語句和java類的構造方法內的所有語句。對象在實例化時,均通過該方法進行初始化。然而到此步,一個潛在的問題已經在此埋伏好,就等著你來犯了。
第3步:讓我們順著執行順序向下看,"④" 行,該行所在方法就是該類的構造器,該方法先調用父類的構造器 <init>() 對父對象進行初始化,然后調用 CachingEnumResolver.initEnum() 方法加載數據。
第4步:"⑤" 行,該行獲取 "CODE_MAP_CACHE" 字段值,其運行時該字段值為 null。注意,問題已經開始顯現了。(作為程序員的你一定是希望該字段已經被初始化過了,而事實上它還沒有被初始化)。通過判斷,由于該字段為 NULL,因此程序將繼續執行到 "⑥" 行,將該字段實例化為 HashMap()。
第5步:在 "⑦"、"⑧" 行,其功能就是為 "CODE_MAP_CACHE" 字段填入兩條數據。
第6步:退出對象初始化方法 <init>(),將生成的對象實例初始化給類字段 "SINGLE_ENUM_RESOLVER"。(注意,此刻該對象實例內的類變量還未初始化完全,剛才由 <init>() 調用 initEnum() 方法賦值的類變量 "CODE_MAP_CACHE" 是 <clinit>() 方法還未初始化字段,它還將在后面的類初始化過程再次被覆蓋)。
第7步:繼續執行 <clinit>()方法內的后繼代碼,"②" 行,該行對 "CODE_MAP_CACHE" 字段實例化為 HashMap 實例(注意:在對象實例化時已經對該字段賦值過了,現在又重新賦值為另一個實例,此刻,"CODE_MAP_CACHE"變量所引用的實例的類變量值被覆蓋,到此我們的疑問已經有了答案)。
第8步:類初始化完畢,同時該單態類的實例化工作也完成。
通過對上面的字節碼執行過程分析,或許你已經清楚了解到導致錯誤的深層原因了,也或許你可能早已被上面的分析過程給弄得暈頭轉向了,不過也沒折,雖然我也可以從源代碼的角度來闡述問題,但這樣不夠深度,同時也會有僅為個人觀點、不足可信之嫌。
如何解決
要解決上面代碼所存在的問題很簡單,那就是將 "SINGLE_ENUM_RESOLVER" 變量的初始化賦值語句轉移到 getInstance() 方法中去即可。換句話說就是要避免在類還未初始化完成時從內部實例化該類或在初始化過程中引用還未初始化的字段。
寫在最后

public class CachingEnumResolver
{
public static Map CODE_MAP_CACHE;

static
{
CODE_MAP_CACHE = new HashMap();
//為了說明問題,我在這里初始化一條數據
CODE_MAP_CACHE.put("0","北京市");
initEnums();
}


public class CachingEnumResolver
{
private static final CachingEnumResolver SINGLE_ENUM_RESOLVER;
public static Map CODE_MAP_CACHE;

static
{
CODE_MAP_CACHE = new HashMap();
//為了說明問題,我在這里初始化一條數據
CODE_MAP_CACHE.put("0","北京市");
SINGLE_ENUM_RESOLVER = new CachingEnumResolver();
initEnums();
}

注:以上來源于網絡
posted on 2009-03-31 15:17
ゞ沉默是金ゞ 閱讀(1387)
評論(1) 編輯 收藏 所屬分類:
Java SE