“polymorphism(多態(tài))”一詞來自希臘語,意為“多種形式”。多數(shù)Java程序員把多態(tài)看作對象的一種能力,使其能調(diào)用正確的方法版本。盡管如此,這種面向?qū)崿F(xiàn)的觀點(diǎn)導(dǎo)致了多態(tài)的神奇功能,勝于僅僅把多態(tài)看成純粹的概念。
Java中的多態(tài)總是子類型的多態(tài)。幾乎是機(jī)械式產(chǎn)生了一些多態(tài)的行為,使我們不去考慮其中涉及的類型問題。本文研究了一種面向類型的對象觀點(diǎn),分析了如何將對象能夠表現(xiàn)的行為和對象即將表現(xiàn)的行為分離開來。拋開Java中的多態(tài)都是來自繼承的概念,我們?nèi)匀豢梢愿械?,Java中的接口是一組沒有公共代碼的對象共享實(shí)現(xiàn)。
多態(tài)的分類
多態(tài)在面向?qū)ο笳Z言中是個很普遍的概念.雖然我們經(jīng)常把多態(tài)混為一談,但實(shí)際上有四種不同類型的多態(tài)。在開始正式的子類型多態(tài)的細(xì)節(jié)討論前,然我們先來看看普通面向?qū)ο笾械亩鄳B(tài)。
Luca Cardelli和Peter Wegner("On Understanding Types, Data Abstraction, and Polymorphism"一文的作者, 文章參考資源鏈接)把多態(tài)分為兩大類----特定的和通用的----四小類:強(qiáng)制的,重載的,參數(shù)的和包含的。他們的結(jié)構(gòu)如下:
screen.width-600)this.style.width=screen.width-600;">
在這樣一個體系中,多態(tài)表現(xiàn)出多種形式的能力。通用多態(tài)引用有相同結(jié)構(gòu)類型的大量對象,他們有著共同的特征。特定的多態(tài)涉及的是小部分沒有相同特征的對象。四種多態(tài)可做以下描述:
強(qiáng)制的:一種隱式做類型轉(zhuǎn)換的方法。
重載的:將一個標(biāo)志符用作多個意義。
參數(shù)的:為不同類型的參數(shù)提供相同的操作。
包含的:類包含關(guān)系的抽象操作。
我將在講述子類型多態(tài)前簡單介紹一下這幾種多態(tài)。
強(qiáng)制的多態(tài)
強(qiáng)制多態(tài)隱式的將參數(shù)按某種方法,轉(zhuǎn)換成編譯器認(rèn)為正確的類型以避免錯誤。在以下的表達(dá)式中,編譯器必須決定二元運(yùn)算符‘+’所應(yīng)做的工作:
2.0 + 2.0
2.0 + 2
2.0 + "2"
第一個表達(dá)式將兩個double的操作數(shù)相加;Java中特別聲明了這種用法。
第二個表達(dá)式將double型和int相加。Java中沒有明確定義這種運(yùn)算。不過,編譯器隱式的將第二個操作數(shù)轉(zhuǎn)換為double型,并作double型的加法。做對程序員來說十分方便,否則將會拋出一個編譯錯誤,或者強(qiáng)制程序員顯式的將int轉(zhuǎn)換為double。
第三個表達(dá)式將double與一個String相加。Java中同樣沒有定義這樣的操作。所以,編譯器將double轉(zhuǎn)換成String類型,并將他們做串聯(lián)。
強(qiáng)制多態(tài)也會發(fā)生在方法調(diào)用中。假設(shè)類Derived繼承了類Base,類C有一個方法,原型為m(Base),在下面的代碼中,編譯器隱式的將Derived類的對象derived轉(zhuǎn)化為Base類的對象。這種隱式的轉(zhuǎn)換使m(Base)方法使用所有能轉(zhuǎn)換成Base類的所有參數(shù)。
C c = new C();
Derived derived = new Derived();
c.m( derived );
并且,隱式的強(qiáng)制轉(zhuǎn)換,可以避免類型轉(zhuǎn)換的麻煩,減少編譯錯誤。當(dāng)然,編譯器仍然會優(yōu)先驗(yàn)證符合定義的對象類型。
重載的多態(tài)
重載允許用相同的運(yùn)算符或方法,去表示截然不同的意義。‘+’在上面的程序中有兩個意思:兩個double型的數(shù)相加;兩個串相連。另外還有整型相加,長整型,等等。這些運(yùn)算符的重載,依賴于編譯器根據(jù)上下文做出的選擇。以往的編譯器會把操作數(shù)隱式轉(zhuǎn)換為完全符合操作符的類型。雖然Java明確支持重載,但不支持用戶定義的操作符重載。
Java支持用戶定義的函數(shù)重載。一個類中可以有相同名字的方法,這些方法可以有不同的意義。這些重載的方法中,必須滿足參數(shù)數(shù)目不同,相同位置上的參數(shù)類型不同。這些不同可以幫助編譯器區(qū)分不同版本的方法。
編譯器以這種唯一表示的特征來表示不同的方法,比用名字表示更為有效。據(jù)此,所有的多態(tài)行為都能編譯通過。
強(qiáng)制和重載的多態(tài)都被分類為特定的多態(tài),因?yàn)檫@些多態(tài)都是在特定的意義上的。這些被劃入多態(tài)的特性給程序員帶來了很大的方便。強(qiáng)制多態(tài)排除了麻煩的類型和編譯錯誤。重載多態(tài)像一塊糖,允許程序員用相同的名字表示不同的方法,很方便。
參數(shù)的多態(tài)
參數(shù)多態(tài)允許把許多類型抽象成單一的表示。例如,List抽象類中,描述了一組具有同樣特征的對象,提供了一個通用的模板。你可以通過指定一種類型以重用這個抽象類。這些參數(shù)可以是任何用戶定義的類型,大量的用戶可以使用這個抽象類,因此參數(shù)多態(tài)毫無疑問的成為最強(qiáng)大的多態(tài)。
乍一看,上面抽象類好像是java.util.List的功能。然而,Java實(shí)際上并不支持真正的安全類型風(fēng)格的參數(shù)多態(tài),這也是java.util.List和java.util的其他集合類是用原始的java.lang.Object寫的原因(參考我的文章"A Primordial Interface?" 以獲得更多細(xì)節(jié))。Java的單根繼承方式解決了部分問題,但沒有發(fā)揮出參數(shù)多態(tài)的全部功能。Eric Allen有一篇精彩的文章“Behold the Power of Parametric Polymorphism”,描述了Java通用類型的需求,并建議給Sun的Java規(guī)格需求#000014號文檔"Add Generic Types to the Java Programming Language."(參考資源鏈接)
包含的多態(tài)
包含多態(tài)通過值的類型和集合的包含關(guān)系實(shí)現(xiàn)了多態(tài)的行為.在包括Java在內(nèi)的眾多面向?qū)ο笳Z言中,包含關(guān)系是子類型的。所以,Java的包含多態(tài)是子類型的多態(tài)。
在早期,Java開發(fā)者們所提及的多態(tài)就特指子類型的多態(tài)。通過一種面向類型的觀點(diǎn),我們可以看到子類型多態(tài)的強(qiáng)大功能。以下的文章中我們將仔細(xì)探討這個問題。為簡明起見,下文中的多態(tài)均指包含多態(tài)。
面向類型觀點(diǎn)
圖1的UML類圖給出了類和類型的簡單繼承關(guān)系,以便于解釋多態(tài)機(jī)制。模型中包含5種類型,4個類和一個接口。雖然UML中稱為類圖,我把它看成類型圖。如"Thanks Type and Gentle Class," 一文中所述,每個類和接口都是一種用戶定義的類型。按獨(dú)立實(shí)現(xiàn)的觀點(diǎn)(如面向類型的觀點(diǎn)),下圖中的每個矩形代表一種類型。從實(shí)現(xiàn)方法看,四種類型運(yùn)用了類的結(jié)構(gòu),一種運(yùn)用了接口的結(jié)構(gòu)。
screen.width-600)this.style.width=screen.width-600;"> 圖1:示范代碼的UML類圖
以下的代碼實(shí)現(xiàn)了每個用戶定義的數(shù)據(jù)類型,我把實(shí)現(xiàn)寫得很簡單。
/* Base.java */
public class Base { public String m1() { return "Base.m1()"; }
public String m2( String s ) { return "Base.m2( " + s + " )"; } }
/* IType.java */
interface IType { String m2( String s ); String m3(); }
/* Derived.java */
public class Derived extends Base implements IType { public String m1() { return "Derived.m1()"; }
public String m3() { return "Derived.m3()"; } }
/* Derived2.java */
public class Derived2 extends Derived { public String m2( String s ) { return "Derived2.m2( " + s + " )"; } public String m4() { return "Derived2.m4()"; } }
/* Separate.java */
public class Separate implements IType { public String m1() { return "Separate.m1()"; } public String m2( String s ) { return "Separate.m2( " + s + " )"; }
public String m3() { return "Separate.m3()"; } }
|
用這樣的類型聲明和類的定義,圖2從概念的觀點(diǎn)描述了Java指令。
Derived2 derived2 = new Derived2();
screen.width-600)this.style.width=screen.width-600;"> 圖2 :Derived2 對象上的引用
上文中聲明了derived2這個對象,它是Derived2類的。圖2種的最頂層把Derived2引用描述成一個集合的窗口,雖然其下的Derived2對象是可見的。這里為每個Derived2類型的操作留了一個孔。Derived2對象的每個操作都去映射適當(dāng)?shù)拇a,按照上面的代碼所描述的那樣。例如,Derived2對象映射了在Derived中定義的m1()方法。而且還重載了Base類的m1()方法。一個Derived2的引用變量無權(quán)訪問Base類中被重載的m1()方法。但這并不意味著不可以用super.m1()的方法調(diào)用去使用這個方法。關(guān)系到derived2這個引用的變量,這個代碼是不合適的。Derived2的其他的操作映射同樣表明了每種類型操作的代碼執(zhí)行。
既然你有一個Derived2對象,可以用任何一個Derived2類型的變量去引用它。如圖1所示,Derived, Base和IType都是Derived2的基類。所以,Base類的引用是很有用的。圖3描述了以下語句的概念觀點(diǎn)。
Base base = derived2;
screen.width-600)this.style.width=screen.width-600;"> 圖3:Base類引用附于Derived2對象之上 雖然Base類的引用不用再訪問m3()和m4(),但是卻不會改變它Derived2對象的任何特征及操作映射。無論是變量derived2還是base,其調(diào)用m1()或m2(String)所執(zhí)行的代碼都是一樣的。
String tmp; // Derived2 reference (Figure 2) tmp = derived2.m1(); // tmp is "Derived.m1()" tmp = derived2.m2( "Hello" ); // tmp is "Derived2.m2( Hello )"
// Base reference (Figure 3)
tmp = base.m1(); // tmp is "Derived.m1()" tmp = base.m2( "Hello" ); // tmp is "Derived2.m2( Hello )" |
兩個引用之所以調(diào)用同一個行為,是因?yàn)镈erived2對象并不知道去調(diào)用哪個方法。對象只知道什么時候調(diào)用,它隨著繼承實(shí)現(xiàn)的順序去執(zhí)行。這樣的順序決定了Derived2對象調(diào)用Derived里的m1()方法,并調(diào)用Derived2里的m2(String)方法。這種結(jié)果取決于對象本身的類型,而不是引用的類型。
盡管如此,但不意味著你用derived2和base引用的效果是完全一樣的。如圖3所示,Base的引用只能看到Base類型擁有的操作。所以,雖然Derived2有對方法m3()和m4()的映射,但是變量base不能訪問這些方法。
String tmp; // Derived2 reference (Figure 2) tmp = derived2.m3(); // tmp is "Derived.m3()" tmp = derived2.m4(); // tmp is "Derived2.m4()"
// Base reference (Figure 3)
tmp = base.m3(); // Compile-time error tmp = base.m4(); // Compile-time error |
運(yùn)行期的Derived2對象保持了接受m3()和m4()方法的能力。類型的限制使Base的引用不能在編譯期調(diào)用這些方法。編譯期的類型檢查像一套鎧甲,保證了運(yùn)行期對象只能和正確的操作進(jìn)行相互作用。換句話說,類型定義了對象間相互作用的邊界。
多態(tài)的依附性
類型的一致性是多態(tài)的核心。對象上的每一個引用,靜態(tài)的類型檢查器都要確認(rèn)這樣的依附和其對象的層次是一致的。當(dāng)一個引用成功的依附于另一個不同的對象時,有趣的多態(tài)現(xiàn)象就產(chǎn)生了。(嚴(yán)格的說,對象類型是指類的定義。)你也可以把幾個不同的引用依附于同一個對象。在開始更有趣的場景前,我們先來看一下下面的情況為什么不會產(chǎn)生多態(tài)。
多個引用依附于一個對象
圖2和圖3描述的例子是把兩個及兩個以上的引用依附于一個對象。雖然Derived2對象在被依附之后仍保持了變量的類型,但是,圖3中的Base類型的引用依附之后,其功能減少了。結(jié)論很明顯:把一個基類的引用依附于派生類的對象之上會減少其能力。
一個開發(fā)這怎么會選擇減少對象能力的方案呢?這種選擇是間接的。假設(shè)有一個名為ref的引用依附于一個包含如下方法的類的對象:
public String poly1( Base base ) { return base.m1(); } |
用一個Derived2的參數(shù)調(diào)用poly(Base)是符合參數(shù)類型檢查的:
方法調(diào)用把一個本地Base類型的變量依附在一個引入的對象上。所以,雖然這個方法只接受Base類型的參數(shù),但Derived2對象仍是允許的。開發(fā)這就不必選擇丟失功能的方案。從人眼在通過Derived2對象時所看到的情況,Base類型引用的依附導(dǎo)致了功能的喪失。但從執(zhí)行的觀點(diǎn)看,每一個傳入poly1(Base)的參數(shù)都認(rèn)為是Base的對象。執(zhí)行機(jī)并不在乎有多個引用指向同一個對象,它只注重把指向另一個對象的引用傳給方法。這些對象的類型不一致并不是主要問題。執(zhí)行器只關(guān)心給運(yùn)行時的對象找到適當(dāng)?shù)膶?shí)現(xiàn)。面向類型的觀點(diǎn)展示了多態(tài)的巨大能力。
附于多個對象的引用
讓我們來看一下發(fā)生在poly1(Base)中的多態(tài)行為。下面的代碼創(chuàng)建了三個對象,并通過引用傳給poly1(Base):
Derived2 derived2 = new Derived2(); Derived derived = new Derived(); Base base = new Base();
String tmp;
tmp = ref.poly1( derived2 ); // tmp is "Derived.m1()" tmp = ref.poly1( derived ); // tmp is "Derived.m1()" tmp = ref.poly1( base ); // tmp is "Base.m1()" |
poly1(Base)的實(shí)現(xiàn)代碼是調(diào)用傳進(jìn)來的參數(shù)的m1()方法。圖3和圖4展示了把三個類的對象傳給方法時,面向類型的所使用的體系結(jié)構(gòu)。
screen.width-600)this.style.width=screen.width-600;"> 圖4:將Base引用指向Derived類,以及Base對象
請注意每個圖中方法m1()的映射。圖3中,m1()調(diào)用了Derived類的代碼;上面代碼中的注釋標(biāo)明了ploy1(Base)調(diào)用Derived.m1()。圖4中Derived對象調(diào)用的仍然是Derived類的m1()方法。最后,圖4中,Base對象調(diào)用的m1()是Base類中定義的代碼。
多態(tài)的魅力何在?再來看一下poly1(Base)的代碼,它可以接受任何屬于Base類范疇的參數(shù)。然而,當(dāng)他收到一個Derived2的對象時,它實(shí)際上卻調(diào)用了Derived版本的方法。當(dāng)你根據(jù)Base類派生出其他類時,如Derived,Derived2,poly1(Base)都可以接受這些參數(shù),并作出選擇調(diào)用合適的方法。多態(tài)允許你在完成poly1(Base)后擴(kuò)展它的用途。
這看起來當(dāng)然很神奇。基本的理解展示了多態(tài)的內(nèi)部工作原理。在面向類型的觀點(diǎn)中,底層的對象所實(shí)現(xiàn)的代碼是非實(shí)質(zhì)性的。重要的是,類型檢查器會在編譯期間為每個引用選擇合適的代碼以實(shí)現(xiàn)其方法。多態(tài)使開發(fā)者運(yùn)用面向類型的觀點(diǎn),不考慮實(shí)現(xiàn)的細(xì)節(jié)。這樣有助于把類型和實(shí)現(xiàn)分離(實(shí)際用處是把接口和實(shí)現(xiàn)分離)。
對象接口
多態(tài)依賴于類型和實(shí)現(xiàn)的分離,多用來把接口和實(shí)現(xiàn)分離。但下面的觀點(diǎn)好像把Java的關(guān)鍵字interface搞得很糊涂。
更為重要的使開發(fā)者們怎樣理解短語“the interface to an object",典型地,根據(jù)上下文,這個短語的意思是指一切對象類中所定義的方法,至一切對象公開的方法。這種傾向于以實(shí)現(xiàn)為中心的觀點(diǎn)較之于面向類型的觀點(diǎn)來說,使我們更加注重于對象在運(yùn)行期的能力。圖3中,引用面板的對象表面被標(biāo)志成"Derived2 Object"。這個面板上列出了Derived2對象的所有可用的方法。但是要理解多態(tài),我們必須從實(shí)現(xiàn)這一層次上解放出來,并注意面向類型的透視圖中被標(biāo)為"Base Reference"的面板。在這一層意思上,引用變量的類型指明了一個對象的表面。這只是一個表面,不是接口。在類型一致的原則下,我們可以用面向類型的觀點(diǎn),為一個對象依附多個引用。對interface to an object這個短語的理解沒有確定的理解。
在類型概念中,the interface to an object refers 引用了面向類型觀點(diǎn)的最大可能----如圖2的情形。把一個基類的引用指向相同的對象縮小了這樣的觀點(diǎn)----如圖3所示。類型概念能使人獲得把對象間的相互作用同實(shí)現(xiàn)細(xì)節(jié)分離的要領(lǐng)。相對于一個對象的接口,面向類型的觀點(diǎn)更鼓勵人們?nèi)ナ褂靡粋€對象的引用。引用類型規(guī)定了對象間的相互作用。當(dāng)你考慮一個對象能做什么的時候,只需搞明白他的類型,而不需要去考慮他的實(shí)現(xiàn)細(xì)節(jié)。
Java接口
以上所談到的多態(tài)行為用到了類的繼承關(guān)系所建立起來的子類型關(guān)系。Java接口同樣支持用戶定義的類型,相對地,Java的接口機(jī)制啟動了建立在類型層次結(jié)構(gòu)上的多態(tài)行為。假設(shè)一個名為ref的引用變量,并使其指向一個包含一下方法的類對象:
public String poly2( IType iType ) { return iType.m3(); } | 為了弄明白poly2(IType)中的多態(tài),以下的代碼從不同的類創(chuàng)建兩個對象,并分別把他們傳給poly2(IType):
Derived2 derived2 = new Derived2(); Separate separate = new Separate();
String tmp;
tmp = ref.poly2( derived2 ); // tmp is "Derived.m3()" tmp = ref.poly2( separate ); // tmp is "Separate.m3()" | 上面的代碼類似于關(guān)于poly1(Base)中的多態(tài)的討論。poly2(IType)的實(shí)現(xiàn)代碼是調(diào)用每個對象的本地版本的m3()方法。如同以前,代碼的注釋表明了每次調(diào)用所返回的CString類型的結(jié)果。圖5表明了兩次調(diào)用poly2(IType)的概念結(jié)構(gòu):
screen.width-600)this.style.width=screen.width-600;"> 圖5:指向Derived2和Separate對象的IType引用
方法poly1(Base)和poly2(IType)中所表現(xiàn)的多態(tài)行為的相似之處可以從透視圖中直接看出來。把我們在實(shí)現(xiàn)在一層上的理解再提高一層,就可以看到這兩段代碼的技巧。基類的引用指向了作為參數(shù)傳進(jìn)的類,并且按照類型的限制調(diào)用對象的方法。引用既不知道也不關(guān)心執(zhí)行哪一段代碼。編譯期間的子類型關(guān)系檢查保證了通過的對象有能力在被調(diào)用的時候選擇合適的實(shí)現(xiàn)代碼。
然而,他們在實(shí)現(xiàn)層上有一個重要的差別。在poly1(Base)的例子中(圖3和圖4),Base-Derived-Derived2的類繼承結(jié)構(gòu)為子類型關(guān)系的建立提供了條件,并決定了方法去調(diào)用哪段代碼。在poly2(IType)的例子中(如圖5),則是完全不同的動態(tài)發(fā)生的。Derived2和Separate不共享任何實(shí)現(xiàn)的層次,但是他們還是通過IType的引用展示了多態(tài)的行為。
這樣的多態(tài)行為使Java的接口的功能的重大意義顯得很明顯。圖1中的UML類圖說明了Derived是Base和IType的子類型。通過完全脫離實(shí)現(xiàn)細(xì)節(jié)的類型的定義方法,Java實(shí)現(xiàn)了多類型繼承,并且不存在Java所禁止的多繼承所帶來的煩人的問題。完全脫離實(shí)現(xiàn)層次的類可以按照J(rèn)ava接口實(shí)現(xiàn)分組。在圖1中,接口IType和Derived,Separate以及這類型的其他子類型應(yīng)該劃為一組。
按照這種完全不同于實(shí)現(xiàn)層次的分類方法,Java的接口機(jī)制是多態(tài)變得很方便,哪怕不存在任何共享的實(shí)現(xiàn)或者復(fù)寫的方法。如圖5所示,一個IType的引用,用多態(tài)的方法訪問到了Derived2和Separate對象的m3()方法。
再次探討對象的接口
注意圖5中的Derived2和Separate對象的對m1()的映射方法。如前所述,每一個對象的接口都包含方法m1()。但卻沒有辦法用這兩個對象使方法m1()表現(xiàn)出多態(tài)的行為。每一個對象占有一個m1()方法是不夠的。必須存在一個可以操作m1()方法的類型,通過這個類型可以看到對象。這些對象似乎是共享了m1()方法,但在沒有共同基類的條件下,多態(tài)是不可能的。通過對象的接口來看多態(tài),會把這個概念搞混。
結(jié)論
從全文所述的面向?qū)ο蠖鄳B(tài)所建立起來的子類型多態(tài),你可以清楚地認(rèn)識到這種面向類型的觀點(diǎn)。如果你想理解子類型多態(tài)的思想,就應(yīng)該把注意力從實(shí)現(xiàn)的細(xì)節(jié)轉(zhuǎn)移到類型的上。類型把對象分成組,并且管理著這些對象的接口。類型的繼承層次結(jié)構(gòu)決定了實(shí)現(xiàn)多態(tài)所需的類型關(guān)系。
有趣的是,實(shí)現(xiàn)的細(xì)節(jié)并不影響子類型多態(tài)的層次結(jié)構(gòu)。類型決定了對象調(diào)用什么方法,而實(shí)現(xiàn)則決定了對象怎么執(zhí)行這個方法。也就是說,類型表明了責(zé)任,而負(fù)責(zé)實(shí)施的則是具體的實(shí)現(xiàn)。將實(shí)現(xiàn)和類型分離后,我們好像看到了這兩個部分在一起跳舞,類型決定了他的舞伴和舞蹈的名字,而實(shí)現(xiàn)則是舞蹈動作的設(shè)計師。
|