我們在使用vc進行比較復雜的編程時,經常需要用到復雜的數組結構,并希望能實現動態管理。由于C++并不支持動態數組,MFC提供了一個CArray類來實現動態數組的功能。有效的使用CArray類,可以提高程序的效率。
MFC提供了一套模板庫,來實現一些比較常見的數據結構如Array,List,Map。CArray即為其中的一個,用來實現動態數組的功能。
CArray是從CObject派生,有兩個模板參數,第一個參數就是CArray類數組元素的變量類型,后一個是函數調用時的參數類型。
我們有一個類 class Object,我們要定義一個Object的動態數組,那么我們可以用以下兩種方法:
CArray<Object,Object> Var1;
CArray<Object,Object&> Var2;
Var1與Var2哪一個的效率要高呢? Var2的效率要高。為什么呢?接下來我們對CArray的源代碼做一個剖析就清楚了。
先了解一下CArray中的成員變量及作用。TYPE* m_pData; // 數據保存地址的指針
int m_nSize; // 用戶當前定義的數組的大小
int m_nMaxSize; // 當前實際分配的數組的大小
int m_nGrowBy; // 分配內存時增長的元素個數
首先來看它的構造函數,對成員變量進行了初始化。 CArray<TYPE, ARG_TYPE>::CArray()
{
m_pData = NULL;
m_nSize = m_nMaxSize = m_nGrowBy = 0;
}
SetSize成員函數是用來為數組分配空間的,從這里著手,看CArray是如何對數據進行管理的。SetSize的函數定義如下: void SetSize( int nNewSize, int nGrowBy = -1 );
nNewSize 指定數組的大小
nGrowBy 如果需要增加數組大小時增加的元素的個數。
對SetSize的代碼,進行分析。(由于代碼太長,只列出部分重要部分) void CArray<TYPE, ARG_TYPE>::SetSize(int nNewSize, int nGrowBy)
{
if (nNewSize == 0)
{
// 第一種情況
// 當nNewSize為0時,需要將數組置為空,
// 如果數組本身即為空,則不需做任何處理
// 如果數組本身已含有數據,則需要清除數組元素
if (m_pData != NULL)
{
//DestructElements 函數實現了對數組元素析構函數的調用
//不能使用delete m_pData 因為我們必須要調用數組元素的析構函數
DestructElements<TYPE>(m_pData, m_nSize);
//現在才能釋放內存
delete[] (BYTE*)m_pData;
m_pData = NULL;
}
m_nSize = m_nMaxSize = 0;
}
else if (m_pData == NULL)
{
// 第二種情況
// 當m_pData==NULL時還沒有為數組分配內存
//首先我們要為數組分配內存,sizeof(TYPE)可以得到數組元素所需的字節數
//使用new 數組分配了內存。注意,沒有調用構造函數
m_pData = (TYPE*) new BYTE[nNewSize * sizeof(TYPE)];
//下面的函數調用數組元素的構造函數
ConstructElements<TYPE>(m_pData, nNewSize);
//記錄下當前數組元素的個數
m_nSize = m_nMaxSize = nNewSize;
}
else if (nNewSize <= m_nMaxSize)
{
// 第三種情況
// 這種情況需要分配的元素個數比已經實際已經分配的元素個數要少
if (nNewSize > m_nSize)
{
// 需要增加元素的情況
// 與第二種情況的處理過程,既然元素空間已經分配,
// 只要調用新增元素的構造函數就Ok
ConstructElements<TYPE>(&m_pData[m_nSize], nNewSize-m_nSize);
}
else if (m_nSize > nNewSize)
{
// 現在是元素減少的情況,我們是否要重新分配內存呢?
// No,這種做法不好,后面來討論。
// 下面代碼釋放多余的元素,不是釋放內存,只是調用析構函數
DestructElements<TYPE>(&m_pData[nNewSize], m_nSize-nNewSize);
}
m_nSize = nNewSize;
}
else
{
//這是最糟糕的情況,因為需要的元素大于m_nMaxSize,
// 意味著需要重新分配內存才能解決問題
// 計算需要分配的數組元素的個數
int nNewMax;
if (nNewSize < m_nMaxSize + nGrowBy)
nNewMax = m_nMaxSize + nGrowBy;
else
nNewMax = nNewSize;
// 重新分配一塊內存
TYPE* pNewData = (TYPE*) new BYTE[nNewMax * sizeof(TYPE)];
//實現將已有的數據復制到新的的內存空間
memcpy(pNewData, m_pData, m_nSize * sizeof(TYPE));
// 對新增的元素調用構造函數
ConstructElements<TYPE>(&pNewData[m_nSize], nNewSize-m_nSize);
//釋放內存
delete[] (BYTE*)m_pData;
//將數據保存
m_pData = pNewData;
m_nSize = nNewSize;
m_nMaxSize = nNewMax;
}
}
注意上面代碼中標注為粗體的代碼,它們實現了對象的構造與析構。如果我們只為對象分配內存,卻沒有調用構造與析構函數,會不會有問題呢?
如果只是使用c++的基本數據類型,如果int,long,那的確不會有什么問題。如果使用的是一個類,比如下面的類: class Object
{
public:
Object(){ ID = 0; }
~Object();
protected:
int ID;
};
我們只為Object類分配了空間,也能正常使用。但是,類的成員變量ID的值卻是不定的,因為沒有初始化。如果是一個更復雜的組合類,在構造函數中做了許多工作,那可能就不能正常運行了。
同樣,刪除的數組元素時,也一定要調用它的析構函數。
我們來看下面的Preson類 class Preson
{
public:
Preson()
{
name = new char[10];
}
~Preson()
{
delete []name;
}
char* name;
int age;
}
如果我沒調用構造函數,那么對name操作肯定會出錯。我們調用了構造函數后,刪除元素時,如果不調用析構函數,那么,name所指向的內存不能正確釋放,就會造成內存泄漏。
我們來看一下ConstructElements與DestructElements如何實現構造與析構函數的調用。
下面是ConstructElements函數的實現代碼template<class TYPE>
AFX_INLINE void AFXAPI ConstructElements(TYPE* pElements, int nCount)
{
// first do bit-wise zero initialization
memset((void*)pElements, 0, nCount * sizeof(TYPE));
for (; nCount--; pElements++)
::new((void*)pElements) TYPE;
}
ConstructElements是一個模板函數。對構造函數的調用是通過標為黑體的代碼實現的。可能很多人不熟悉new 的這種用法,它可以實現指定的內存空間中構造類的實例,不會再分配新的內存空間。類的實例產生在已經分配的內存中,并且new操作會調用對象的構造函數。因為vc中沒有辦法直接調用構造函數,而通過這種方法,巧妙的實現對構造函數的調用。
再來看DestructElements 函數的代碼template<class TYPE>
AFX_INLINE void AFXAPI DestructElements(TYPE* pElements, int nCount)
{
for (; nCount--; pElements++)
pElements->~TYPE();
}
DestructElements函數同樣是一個模板函數,實現很簡單,直接調用類的析構函數即可。
如果定義一個CArray對象 CArray<Object,Object&> myObject ,對myObject就可象數組一樣,通過下標來訪問指定的數組元素。通過[]來訪問數組元素是如何實現的呢?其實只要重載運算符[]即可。
CArray[]有兩種實現,區別在于返回值不同。我們來看看代碼:
template<class TYPE, class ARG_TYPE>
AFX_INLINE TYPE CArray<TYPE, ARG_TYPE>::operator[](int nIndex) const
{ return GetAt(nIndex); }
template<class TYPE, class ARG_TYPE>
AFX_INLINE TYPE& CArray<TYPE, ARG_TYPE>::operator[](int nIndex)
{ return ElementAt(nIndex); }
前一種情況是返回的對象的實例,后一種情況是返回對象的引用。分別調用不同的成員函數來實現。我們來比較一下這兩個函數的實現(省略部分): TYPE GetAt(int nIndex) const
{ ASSERT(nIndex >= 0 && nIndex < m_nSize);
return m_pData[nIndex]; }
TYPE& ElementAt(int nIndex)
{ ASSERT(nIndex >= 0 && nIndex < m_nSize);
return m_pData[nIndex]; }
除了返回值不同,其它都一樣,有什么區別嗎?我們來看一個實例說明。 CArray<int,int&> arrInt;
arrInt.SetSize(10);
int n = arrInt.GetAt(0);
int& l = arrInt.ElementAt(0);
cout << arrInt[0] <<endl;
n = 10;
cout << arrInt[0] <<endl;
l = 20;
count << arrInt[0] << endl;
結果會發現,n的變化不會影響到數組,而l的變化會改變數組元素的值。實際即是對C++中引用運算符的運用。
CArray下標訪問是非安全的,它并沒有超標預警功能。雖然使用ASSERT提示,但下標超范圍時沒有進行處理,會引起非法內存訪問的錯誤。
前面談到模板實例化時有兩個參數,后一個參數一般用引用,為什么呢?看看Add成員函數就可以明。Add函數的作用是向數組添加一個元素。下面是它的定義: int CArray<TYPE, ARG_TYPE>::Add(ARG_TYPE newElement)
Add函數使用的參數是模板參數的二個參數,也就是說,這個參數的類型是我們來決定的,可以使用Object或Object&的方式。熟悉C++的朋友都知道,傳引用的效率要高一些。如果是傳值的話,會在堆棧中再產生一個新的對象,需要花費更多的時間。
下面來分析一下Add函數的代碼:
template<class TYPE, class ARG_TYPE>
AFX_INLINE int CArray<TYPE, ARG_TYPE>::Add(ARG_TYPE newElement)
{
int nIndex = m_nSize;
SetAtGrow(nIndex, newElement);
return nIndex;
}
它實際是通過SetAtGrow函數來完成這個功能的,它的作用是設置指定元素的值。下面是SetAtGrow的代碼: template<class TYPE, class ARG_TYPE>
void CArray<TYPE, ARG_TYPE>::SetAtGrow(int nIndex, ARG_TYPE newElement)
{
if (nIndex >= m_nSize)
SetSize(nIndex+1, -1);
m_pData[nIndex] = newElement;
}