一直對這塊內容都很怵頭,因為它看不到摸不著,我們只能盯著最后編譯鏈接之后的結果是成功或是失敗,但是卻不知道編譯器內部是如何操作的;每當編譯器給出錯誤時我們都只是單純的去處理錯誤,卻不知道編譯器是如何找出來的;我們都很熟悉許多編譯錯誤,但是卻不大熟悉鏈接錯誤,對鏈接錯誤產生的原因也不大清楚。今天,通過自己的努力終于對C/C++的編譯過程有了個粗略的了解,畢竟不想去翻《編譯原理》這樣的大部頭書籍,但是又急于對編譯的過程有個大概的了解,唉,這么多年來一直在苦苦掙扎,今天總算是對這個過程有了個大概的了解了。下面就說說我了解到的一些東西:
首先是預編譯,這一步可以粗略的認為只做了一件事情,那就是“宏展開”,也就是對那些#***的命令的一種展開,例如define MAX 1000就是建立起MAX和1000之間的對等關系,好在編譯階段進行替換;例如ifdef/ifndef就是從一個文件中有選擇性的挑出一些符合條件的代碼來交給下一步的編譯階段來處理;這里面最復雜的莫過于include了,其實也很簡單,就是相當于把那個對應的文件里面的內容一下子替換到這條include***語句的地方來。
其次是編譯,這一步很重要,編譯是以一個個獨立的文件作為單元的,一個文件就會編譯出一個目標文件。(這里插入一點關于編譯的文件的說明,編譯器通過后綴名來辨識是否編譯該文件,因此“.h”的頭文件一概不理會,而“.cpp”的源文件一律都要被編譯,我實驗過把.h文件的后綴名改為.cpp,然后在include的地方相應的改為***.cpp,這樣一來,編譯器就會編譯許多不必要的頭文件,只不過頭文件里我們通常只放置聲明而不是定義,因此最后鏈接生成的可執行文件的大小是不會改變的)清楚編譯是以一個個單獨的文件為單元的,這一點很重要,因此編譯只負責本單元的那些事,而對外部的事情一概不理會,在這一步里,我們可以調用一個函數而不必給出這個函數的定義,但是要在調用前得到這個函數的聲明(其實這就是include的本質,不就是為了給你提前提供個聲明而好讓你使用嗎?至于那個函數到底是如何實現的,需要在鏈接這一步里去找函數的入口地址。因此提供聲明的方式可以是用include把放在別的文件中的聲明拿過來,也可以是在調用之前自己寫一句void max(int,int);都行。),編譯階段剩下的事情就是分析語法的正確性之類的工作了。好啦,總結一下,可以粗略的認為編譯階段分兩步:第一步,檢驗函數或者變量是否存在它們的聲明;第二步,檢查語句是否符合C++語法。
最后一步是鏈接,它會把所有編譯好的單元全部鏈接為一個整體文件,其實這一步可以比作一個“連線”的過程,比如A文件用了B文件中的函數,那么鏈接的這一步會建立起這個關聯。鏈接時最重要的我認為是檢查全局空間里面是不是有重復定義或者缺失定義。這也就解釋了為什么我們一般不在頭文件中出現定義,因為頭文件有可能被釋放到多個源文件中,每個源文件都會單獨編譯,鏈接時就會發現全局空間中有多個定義了。
這里提到了全局的概念,大家可以參考我另一篇文章“extern和static釋析”。