C++ 對象的內(nèi)存布局(上)
陳皓
http://blog.csdn.net/haoel
前言
07年12月,我寫了一篇《C++虛函數(shù)表解析》的文章,引起了大家的興趣。有很多朋友對我的文章留了言,有鼓勵(lì)我的,有批評我的,還有很多問問題的。我在這里一并對大家的留言表示感謝。這也是我為什么再寫一篇續(xù)言的原因。因?yàn)椋谏弦黄恼轮校矣昧说氖纠际欠浅:唵蔚模饕菫榱苏f明一些機(jī)理上的問題,也是為了圖一些表達(dá)上方便和簡單。不想,這篇文章成為了打開C++對象模型內(nèi)存布局的一個(gè)引子,引發(fā)了大家對C++對象的更深層次的討論。當(dāng)然,我之前的文章還有很多方面沒有涉及,從我個(gè)人感覺下來,在談?wù)撎摵瘮?shù)表里,至少有以下這些內(nèi)容沒有涉及:
1)有成員變量的情況。
2)有重復(fù)繼承的情況。
3)有虛擬繼承的情況。
4)有鉆石型虛擬繼承的情況。
這些都是我本篇文章需要向大家說明的東西。所以,這篇文章將會是《C++虛函數(shù)表解析》的一個(gè)續(xù)篇,也是一篇高級進(jìn)階的文章。我希望大家在讀這篇文章之前對C++有一定的基礎(chǔ)和了解,并能先讀我的上一篇文章。因?yàn)檫@篇文章的深度可能會比較深,而且會比較雜亂,我希望你在讀本篇文章時(shí)不會有大腦思維紊亂導(dǎo)致大腦死機(jī)的情況。;-)
對象的影響因素
簡而言之,我們一個(gè)類可能會有如下的影響因素:
1)成員變量
2)虛函數(shù)(產(chǎn)生虛函數(shù)表)
3)單一繼承(只繼承于一個(gè)類)
4)多重繼承(繼承多個(gè)類)
5)重復(fù)繼承(繼承的多個(gè)父類中其父類有相同的超類)
6)虛擬繼承(使用virtual方式繼承,為了保證繼承后父類的內(nèi)存布局只會存在一份)
上述的東西通常是C++這門語言在語義方面對對象內(nèi)部的影響因素,當(dāng)然,還會有編譯器的影響(比如優(yōu)化),還有字節(jié)對齊的影響。在這里我們都不討論,我們只討論C++語言上的影響。
本篇文章著重討論下述幾個(gè)情況下的C++對象的內(nèi)存布局情況。
1)單一的一般繼承(帶成員變量、虛函數(shù)、虛函數(shù)覆蓋)
2)單一的虛擬繼承(帶成員變量、虛函數(shù)、虛函數(shù)覆蓋)
3)多重繼承(帶成員變量、虛函數(shù)、虛函數(shù)覆蓋)
4)重復(fù)多重繼承(帶成員變量、虛函數(shù)、虛函數(shù)覆蓋)
5)鉆石型的虛擬多重繼承(帶成員變量、虛函數(shù)、虛函數(shù)覆蓋)
我們的目標(biāo)就是,讓事情越來越復(fù)雜。
知識復(fù)習(xí)
我們簡單地復(fù)習(xí)一下,我們可以通過對象的地址來取得虛函數(shù)表的地址,如:
typedefvoid(*Fun)(void);
Base b;
Fun pFun = NULL;
cout << "虛函數(shù)表地址:" << (int*)(&b) << endl;
cout << "虛函數(shù)表 — 第一個(gè)函數(shù)地址:" << (int*)*(int*)(&b) << endl;
// Invoke the first virtual function
pFun = (Fun)*((int*)*(int*)(&b));
pFun();
我們同樣可以用這種方式來取得整個(gè)對象實(shí)例的內(nèi)存布局。因?yàn)檫@些東西在內(nèi)存中都是連續(xù)分布的,我們只需要使用適當(dāng)?shù)牡刂菲屏浚覀兙涂梢垣@得整個(gè)內(nèi)存對象的布局。
本篇文章中的例程或內(nèi)存布局主要使用如下編譯器和系統(tǒng):
1)Windows XP 和 VC++ 2003
2)Cygwin 和 G++ 3.4.4
單一的一般繼承
下面,我們假設(shè)有如下所示的一個(gè)繼承關(guān)系:

請注意,在這個(gè)繼承關(guān)系中,父類,子類,孫子類都有自己的一個(gè)成員變量。而了類覆蓋了父類的f()方法,孫子類覆蓋了子類的g_child()及其超類的f()。
我們的源程序如下所示:
class Parent {
public:
int iparent;
Parent ():iparent (10) {}
virtualvoid f() { cout << "Parent::f()" << endl; }
virtualvoid g() { cout << "Parent::g()" << endl; }
virtualvoid h() { cout << "Parent::h()" << endl; }
};
class Child : public Parent {
public:
int ichild;
Child():ichild(100) {}
virtualvoid f() { cout << "Child::f()" << endl; }
virtualvoid g_child() { cout << "Child::g_child()" << endl; }
virtualvoid h_child() { cout << "Child::h_child()" << endl; }
};
class GrandChild : public Child{
public:
int igrandchild;
GrandChild():igrandchild(1000) {}
virtualvoid f() { cout << "GrandChild::f()" << endl; }
virtualvoid g_child() { cout << "GrandChild::g_child()" << endl; }
virtualvoid h_grandchild() { cout << "GrandChild::h_grandchild()" << endl; }
};
我們使用以下程序作為測試程序:(下面程序中,我使用了一個(gè)int** pVtab 來作為遍歷對象內(nèi)存布局的指針,這樣,我就可以方便地像使用數(shù)組一樣來遍歷所有的成員包括其虛函數(shù)表了,在后面的程序中,我也是用這樣的方法的,請不必感到奇怪,)
typedefvoid(*Fun)(void);
GrandChild gc;
int** pVtab = (int**)&gc;
cout << "[0] GrandChild::_vptr->" << endl;
for (int i=0; (Fun)pVtab[0][i]!=NULL; i++){
pFun = (Fun)pVtab[0][i];
cout << " ["<<i<<"] ";
pFun();
}
cout << "[1] Parent.iparent = " << (int)pVtab[1] << endl;
cout << "[2] Child.ichild = " << (int)pVtab[2] << endl;
cout << "[3] GrandChild.igrandchild = " << (int)pVtab[3] << endl;
其運(yùn)行結(jié)果如下所示:(在VC++ 2003和G++ 3.4.4下)
[0] GrandChild::_vptr->
[0] GrandChild::f()
[1] Parent::g()
[2] Parent::h()
[3] GrandChild::g_child()
[4] Child::h1()
[5] GrandChild::h_grandchild()
[1] Parent.iparent = 10
[2] Child.ichild = 100
[3] GrandChild.igrandchild = 1000
|
使用圖片表示如下:

可見以下幾個(gè)方面:
1)虛函數(shù)表在最前面的位置。
2)成員變量根據(jù)其繼承和聲明順序依次放在后面。
3)在單一的繼承中,被overwrite的虛函數(shù)在虛函數(shù)表中得到了更新。
多重繼承
下面,再讓我們來看看多重繼承中的情況,假設(shè)有下面這樣一個(gè)類的繼承關(guān)系。注意:子類只overwrite了父類的f()函數(shù),而還有一個(gè)是自己的函數(shù)(我們這樣做的目的是為了用g1()作為一個(gè)標(biāo)記來標(biāo)明子類的虛函數(shù)表)。而且每個(gè)類中都有一個(gè)自己的成員變量:
我們的類繼承的源代碼如下所示:父類的成員初始為10,20,30,子類的為100
class Base1 {
public:
int ibase1;
Base1():ibase1(10) {}
virtualvoid f() { cout << "Base1::f()" << endl; }
virtualvoid g() { cout << "Base1::g()" << endl; }
virtualvoid h() { cout << "Base1::h()" << endl; }
};
class Base2 {
public:
int ibase2;
Base2():ibase2(20) {}
virtualvoid f() { cout << "Base2::f()" << endl; }
virtualvoid g() { cout << "Base2::g()" << endl; }
virtualvoid h() { cout << "Base2::h()" << endl; }
};
class Base3 {
public:
int ibase3;
Base3():ibase3(30) {}
virtualvoid f() { cout << "Base3::f()" << endl; }
virtualvoid g() { cout << "Base3::g()" << endl; }
virtualvoid h() { cout << "Base3::h()" << endl; }
};
class Derive : public Base1, public Base2, public Base3 {
public:
int iderive;
Derive():iderive(100) {}
virtualvoid f() { cout << "Derive::f()" << endl; }
virtualvoid g1() { cout << "Derive::g1()" << endl; }
};
我們通過下面的程序來查看子類實(shí)例的內(nèi)存布局:下面程序中,注意我使用了一個(gè)s變量,其中用到了sizof(Base)來找下一個(gè)類的偏移量。(因?yàn)槲衣暶鞯氖?/span>int成員,所以是4個(gè)字節(jié),所以沒有對齊問題。關(guān)于內(nèi)存的對齊問題,大家可以自行試驗(yàn),我在這里就不多說了)
typedefvoid(*Fun)(void);
Derive d;
int** pVtab = (int**)&d;
cout << "[0] Base1::_vptr->" << endl;
pFun = (Fun)pVtab[0][0];
cout << " [0] ";
pFun();
pFun = (Fun)pVtab[0][1];
cout << " [1] ";pFun();
pFun = (Fun)pVtab[0][2];
cout << " [2] ";pFun();
pFun = (Fun)pVtab[0][3];
cout << " [3] ";pFun();
pFun = (Fun)pVtab[0][4];
cout << " [4] ";cout<<pFun<<endl;
cout << "[1] Base1.ibase1 = " << (int)pVtab[1] << endl;
int s = sizeof(Base1)/4;
cout << "[" << s << "] Base2::_vptr->"<<endl;
pFun = (Fun)pVtab[s][0];
cout << " [0] "; pFun();
Fun = (Fun)pVtab[s][1];
cout << " [1] "; pFun();
pFun = (Fun)pVtab[s][2];
cout << " [2] ";pFun();
pFun = (Fun)pVtab[s][3];
out << " [3] ";
cout<<pFun<<endl;
cout << "["<< s+1 <<"] Base2.ibase2 = " << (int)pVtab[s+1] << endl;
s = s + sizeof(Base2)/4;
cout << "[" << s << "] Base3::_vptr->"<<endl;
pFun = (Fun)pVtab[s][0];
cout << " [0] "; pFun();
pFun = (Fun)pVtab[s][1];
cout << " [1] ";pFun();
pFun = (Fun)pVtab[s][2];
cout << " [2] ";pFun();
pFun = (Fun)pVtab[s][3];
cout << " [3] ";
cout<<pFun<<endl;
s++;
cout << "["<< s <<"] Base3.ibase3 = " << (int)pVtab[s] << endl;
s++;
cout << "["<< s <<"] Derive.iderive = " << (int)pVtab[s] << endl;
其運(yùn)行結(jié)果如下所示:(在VC++ 2003和G++ 3.4.4下)
[0] Base1::_vptr->
[0] Derive::f()
[1] Base1::g()
[2] Base1::h()
[3] Driver::g1()
[4] 00000000 ç注意:在GCC下,這里是1
[1] Base1.ibase1 = 10
[2] Base2::_vptr->
[0] Derive::f()
[1] Base2::g()
[2] Base2::h()
[3] 00000000 ç注意:在GCC下,這里是1
[3] Base2.ibase2 = 20
[4] Base3::_vptr->
[0] Derive::f()
[1] Base3::g()
[2] Base3::h()
[3] 00000000
[5] Base3.ibase3 = 30
[6] Derive.iderive = 100
|
使用圖片表示是下面這個(gè)樣子:
我們可以看到:
1) 每個(gè)父類都有自己的虛表。
2) 子類的成員函數(shù)被放到了第一個(gè)父類的表中。
3) 內(nèi)存布局中,其父類布局依次按聲明順序排列。
4) 每個(gè)父類的虛表中的f()函數(shù)都被overwrite成了子類的f()。這樣做就是為了解決不同的父類類型的指針指向同一個(gè)子類實(shí)例,而能夠調(diào)用到實(shí)際的函數(shù)。
點(diǎn)擊這里查看下篇>>>
(轉(zhuǎn)載時(shí)請注明作者和出處。未經(jīng)許可,請勿用于商業(yè)用途)
更多文章請?jiān)L問我的Blog: http://blog.csdn.net/haoel
posted on 2009-05-15 19:16
Frank_Fang 閱讀(281)
評論(0) 編輯 收藏 所屬分類:
C++編程