<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    so true

    心懷未來,開創(chuàng)未來!
    隨筆 - 160, 文章 - 0, 評論 - 40, 引用 - 0
    數(shù)據(jù)加載中……

    __asm__ __volatile__ GCC的內(nèi)嵌匯編語法

    [Linux]__asm__ __volatile__ GCC的內(nèi)嵌匯編語法 AT&T匯編語言語法(一)
    2010-03-17 11:33
    http://hi.baidu.com/hilyjiang/blog/item/7db5077a8180dbec2e73b380.html
    http://blog.chinaunix.net/u3/93809/showart_1890394.html


    開發(fā)一個(gè)OS,盡管絕大部分代碼只需要用C/C++等高級語言就可以了,但至少和硬件相關(guān)部分的代碼需要使用匯編語言,另外,由于啟動部分的代碼有大小限 制,使用精練的匯編可以縮小目標(biāo)代碼的Size。另外,對于某些需要被經(jīng)常調(diào)用的代碼,使用匯編來寫可以提高性能。所以我們必須了解匯編語言,即使你有可 能并不喜歡它。



    如果你是計(jì)算機(jī)專業(yè)的話,在大學(xué)里你應(yīng)該學(xué)習(xí)過Intel格式的8086/80386匯編,這里就不再討論。如果我們選擇的OS開發(fā)工具是GCC以及GAS的話,就必須了解AT&T匯編語言語法,因?yàn)镚CC/GAS只支持這種匯編語法。



    本書不會去討論8086/80386的匯編編程,這類的書籍很多,你可以參考它們。這里只會討論AT&T的匯編語法,以及GCC的內(nèi)嵌匯編語法。



    --------------------------------------------------------------------------------



    0.3.2 Syntax

    1.寄存器引用

    引用寄存器要在寄存器號前加百分號%,如“movl %eax, %ebx”。

    80386有如下寄存器:

    8個(gè)32-bit寄存器 %eax,%ebx,%ecx,%edx,%edi,%esi,%ebp,%esp;
    8個(gè)16-bit寄存器,它們事實(shí)上是上面8個(gè)32-bit寄存器的低16位:%ax,%bx,%cx,%dx,%di,%si,%bp,%sp;
    8個(gè)8-bit寄存器:%ah,%al,%bh,%bl,%ch,%cl,%dh,%dl。它們事實(shí)上是寄存器%ax,%bx,%cx,%dx的高8位和低8位;
    6個(gè)段寄存器:%cs(code),%ds(data),%ss(stack), %es,%fs,%gs;
    3個(gè)控制寄存器:%cr0,%cr2,%cr3;
    6個(gè)debug寄存器:%db0,%db1,%db2,%db3,%db6,%db7;
    2個(gè)測試寄存器:%tr6,%tr7;
    8個(gè)浮點(diǎn)寄存器棧:%st(0),%st(1),%st(2),%st(3),%st(4),%st(5),%st(6),%st(7)。
    2. 操作數(shù)順序

    操作數(shù)排列是從源(左)到目的(右),如“movl %eax(源), %ebx(目的)”

    3. 立即數(shù)

    使用立即數(shù),要在數(shù)前面加符號$, 如“movl $0x04, %ebx”

    或者:

    para = 0x04

    movl $para, %ebx

    指令執(zhí)行的結(jié)果是將立即數(shù)04h裝入寄存器ebx。

    4. 符號常數(shù)

    符號常數(shù)直接引用 如

    value: .long 0x12a3f2de

    movl value , %ebx

    指令執(zhí)行的結(jié)果是將常數(shù)0x12a3f2de裝入寄存器ebx。

    引用符號地址在符號前加符號$, 如“movl $value, % ebx”則是將符號value的地址裝入寄存器ebx。

    5. 操作數(shù)的長度

    操作數(shù)的長度用加在指令后的符號表示b(byte, 8-bit), w(word, 16-bits), l(long, 32-bits),如“movb %al, %bl”,“movw %ax, %bx”,“movl %eax, %ebx ”。

    如 果沒有指定操作數(shù)長度的話,編譯器將按照目標(biāo)操作數(shù)的長度來設(shè)置。比如指令“mov %ax, %bx”,由于目標(biāo)操作數(shù)bx的長度為word,那么編譯器將把此指令等同于“movw %ax, %bx”。同樣道理,指令“mov $4, %ebx”等同于指令“movl $4, %ebx”,“push %al”等同于“pushb %al”。對于沒有指定操作數(shù)長度,但編譯器又無法猜測的指令,編譯器將會報(bào)錯(cuò),比如指令“push $4”。

    6. 符號擴(kuò)展和零擴(kuò)展指令

    絕大多數(shù)面向80386的AT&T匯編指令與Intel格式的匯編指令都是相同的,符號擴(kuò)展指令和零擴(kuò)展指令則是僅有的不同格式指令。

    符號擴(kuò)展指令和零擴(kuò)展指令需要指定源操作數(shù)長度和目的操作數(shù)長度,即使在某些指令中這些操作數(shù)是隱含的。

    在AT& T語法中,符號擴(kuò)展和零擴(kuò)展指令的格式為,基本部分"movs"和"movz"(對應(yīng)Intel語法的movsx和movzx),后面跟上源操作數(shù)長度和 目的操作數(shù)長度。movsbl意味著movs (from)byte (to)long;movbw意味著movs (from)byte (to)word;movswl意味著movs (from)word (to)long。對于movz指令也一樣。比如指令“movsbl %al, %edx”意味著將al寄存器的內(nèi)容進(jìn)行符號擴(kuò)展后放置到edx寄存器中。

    其它的Intel格式的符號擴(kuò)展指令還有:

    cbw -- sign-extend byte in %al to word in %ax;
    cwde -- sign-extend word in %ax to long in %eax;
    cwd -- sign-extend word in %ax to long in %dx:%ax;
    cdq -- sign-extend dword in %eax to quad in %edx:%eax;
    對應(yīng)的AT&T語法的指令為cbtw,cwtl,cwtd,cltd。

    7. 調(diào)用和跳轉(zhuǎn)指令

    段內(nèi)調(diào)用和跳轉(zhuǎn)指令為"call","ret"和"jmp",段間調(diào)用和跳轉(zhuǎn)指令為"lcall","lret"和"ljmp"。

    段間調(diào)用和跳轉(zhuǎn)指令的格式為“lcall/ljmp $SECTION, $OFFSET”,而段間返回指令則為“lret $STACK-ADJUST”。

    8. 前綴

    操作碼前綴被用在下列的情況:

    字符串重復(fù)操作指令(rep,repne);
    指定被操作的段(cs,ds,ss,es,fs,gs);
    進(jìn)行總線加鎖(lock);
    指定地址和操作的大小(data16,addr16);
    在AT&T匯編語法中,操作碼前綴通常被單獨(dú)放在一行,后面不跟任何操作數(shù)。例如,對于重復(fù)scas指令,其寫法為:

    repne
    scas

    上述操作碼前綴的意義和用法如下:

    指定被操作的段前綴為cs,ds,ss,es,fs,和gs。在AT&T語法中,只需要按照section:memory-operand的格式就指定了相應(yīng)的段前綴。比如:lcall %cs:realmode_swtch
    操作數(shù)/地址大小前綴是“data16”和"addr16",它們被用來在32-bit操作數(shù)/地址代碼中指定16-bit的操作數(shù)/地址。
    總 線加鎖前綴“lock”,它是為了在多處理器環(huán)境中,保證在當(dāng)前指令執(zhí)行期間禁止一切中斷。這個(gè)前綴僅僅對ADD, ADC, AND, BTC, BTR, BTS, CMPXCHG,DEC, INC, NEG, NOT, OR, SBB, SUB, XOR, XADD,XCHG指令有效,如果將Lock前綴用在其它指令之前,將會引起異常。
    字符串重復(fù)操作前綴"rep","repe","repne"用來讓字符串操作重復(fù)“%ecx”次。

    9. 內(nèi)存引用

    Intel語法的間接內(nèi)存引用的格式為:

    section:[base+index*scale+displacement]

    而在AT&T語法中對應(yīng)的形式為:

    section:displacement(base,index,scale)

    其 中,base和index是任意的32-bit base和index寄存器。scale可以取值1,2,4,8。如果不指定scale值,則默認(rèn)值為1。section可以指定任意的段寄存器作為段前 綴,默認(rèn)的段寄存器在不同的情況下不一樣。如果你在指令中指定了默認(rèn)的段前綴,則編譯器在目標(biāo)代碼中不會產(chǎn)生此段前綴代碼。

    下面是一些例子:

    -4(%ebp):base=%ebp,displacement=-4,section沒有指定,由于base=%ebp,所以默認(rèn)的section=%ss,index,scale沒有指定,則index為0。

    foo(,%eax,4):index=%eax,scale=4,displacement=foo。其它域沒有指定。這里默認(rèn)的section=%ds。

    foo(,1):這個(gè)表達(dá)式引用的是指針foo指向的地址所存放的值。注意這個(gè)表達(dá)式中沒有base和index,并且只有一個(gè)逗號,這是一種異常語法,但卻合法。

    %gs:foo:這個(gè)表達(dá)式引用的是放置于%gs段里變量foo的值。

    如果call和jump操作在操作數(shù)前指定前綴“*”,則表示是一個(gè)絕對地址調(diào)用/跳轉(zhuǎn),也就是說jmp/call指令指定的是一個(gè)絕對地址。如果沒有指定"*",則操作數(shù)是一個(gè)相對地址。

    任何指令如果其操作數(shù)是一個(gè)內(nèi)存操作,則指令必須指定它的操作尺寸(byte,word,long),也就是說必須帶有指令后綴(b,w,l)。

    .3 GCC Inline ASM

    GCC 支持在C/C++代碼中嵌入?yún)R編代碼,這些匯編代碼被稱作GCC Inline ASM——GCC內(nèi)聯(lián)匯編。這是一個(gè)非常有用的功能,有利于我們將一些C/C++語法無法表達(dá)的指令直接潛入C/C++代碼中,另外也允許我們直接寫 C/C++代碼中使用匯編編寫簡潔高效的代碼。

    1.基本內(nèi)聯(lián)匯編

    GCC中基本的內(nèi)聯(lián)匯編非常易懂,我們先來看兩個(gè)簡單的例子:

    __asm__("movl %esp,%eax"); // 看起來很熟悉吧!

    或者是

    __asm__("
    movl $1,%eax // SYS_exit
    xor %ebx,%ebx
    int $0x80
    ");



    __asm__(
    "movl $1,%eax\r\t" \
    "xor %ebx,%ebx\r\t" \
    "int $0x80" \
    );

    基本內(nèi)聯(lián)匯編的格式是

    __asm__ __volatile__("Instruction List");


    1、__asm__

    __asm__是GCC關(guān)鍵字asm的宏定義:

    #define __asm__ asm

    __asm__或asm用來聲明一個(gè)內(nèi)聯(lián)匯編表達(dá)式,所以任何一個(gè)內(nèi)聯(lián)匯編表達(dá)式都是以它開頭的,是必不可少的。

    2、Instruction List

    Instruction List是匯編指令序列。它可以是空的,比如:__asm__ __volatile__(""); 或__asm__ ("");都是完全合法的內(nèi)聯(lián)匯編表達(dá)式,只不過這兩條語句沒有什么意義。但并非所有Instruction List為空的內(nèi)聯(lián)匯編表達(dá)式都是沒有意義的,比如:__asm__ ("":::"memory"); 就非常有意義,它向GCC聲明:“我對內(nèi)存作了改動”,GCC在編譯的時(shí)候,會將此因素考慮進(jìn)去。

    我們看一看下面這個(gè)例子:

    $ cat example1.c

    int main(int __argc, char* __argv[])
    {
    int* __p = (int*)__argc;

    (*__p) = 9999;

    //__asm__("":::"memory");

    if((*__p) == 9999)
    return 5;

    return (*__p);
    }

    在 這段代碼中,那條內(nèi)聯(lián)匯編是被注釋掉的。在這條內(nèi)聯(lián)匯編之前,內(nèi)存指針__p所指向的內(nèi)存被賦值為9999,隨即在內(nèi)聯(lián)匯編之后,一條if語句判斷__p 所指向的內(nèi)存與9999是否相等。很明顯,它們是相等的。GCC在優(yōu)化編譯的時(shí)候能夠很聰明的發(fā)現(xiàn)這一點(diǎn)。我們使用下面的命令行對其進(jìn)行編譯:

    $ gcc -O -S example1.c

    選項(xiàng)-O表示優(yōu)化編譯,我們還可以指定優(yōu)化等級,比如-O2表示優(yōu)化等級為2;選項(xiàng)-S表示將C/C++源文件編譯為匯編文件,文件名和C/C++文件一樣,只不過擴(kuò)展名由.c變?yōu)?s。

    我們來查看一下被放在example1.s中的編譯結(jié)果,我們這里僅僅列出了使用gcc 2.96在redhat 7.3上編譯后的相關(guān)函數(shù)部分匯編代碼。為了保持清晰性,無關(guān)的其它代碼未被列出。

    $ cat example1.s

    main:
    pushl %ebp
    movl %esp, %ebp
    movl 8(%ebp), %eax # int* __p = (int*)__argc
    movl $9999, (%eax) # (*__p) = 9999
    movl $5, %eax # return 5
    popl %ebp
    ret

    參 照一下C源碼和編譯出的匯編代碼,我們會發(fā)現(xiàn)匯編代碼中,沒有if語句相關(guān)的代碼,而是在賦值語句(*__p)=9999后直接return 5;這是因?yàn)镚CC認(rèn)為在(*__p)被賦值之后,在if語句之前沒有任何改變(*__p)內(nèi)容的操作,所以那條if語句的判斷條件(*__p) == 9999肯定是為true的,所以GCC就不再生成相關(guān)代碼,而是直接根據(jù)為true的條件生成return 5的匯編代碼(GCC使用eax作為保存返回值的寄存器)。

    我們現(xiàn)在將example1.c中內(nèi)聯(lián)匯編的注釋去掉,重新編譯,然后看一下相關(guān)的編譯結(jié)果。

    $ gcc -O -S example1.c

    $ cat example1.s

    main:
    pushl %ebp
    movl %esp, %ebp
    movl 8(%ebp), %eax # int* __p = (int*)__argc
    movl $9999, (%eax) # (*__p) = 9999
    #APP

    # __asm__("":::"memory")
    #NO_APP
    cmpl $9999, (%eax) # (*__p) == 9999 ?
    jne .L3 # false
    movl $5, %eax # true, return 5
    jmp .L2
    .p2align 2
    .L3:
    movl (%eax), %eax
    .L2:
    popl %ebp
    ret

    由于內(nèi)聯(lián)匯編語句__asm__("":::"memory")向GCC聲明,在此內(nèi)聯(lián)匯編語句出現(xiàn)的位置內(nèi)存內(nèi)容可能了改變,所以GCC在編譯時(shí)就不能像剛才那樣處理。這次,GCC老老實(shí)實(shí)的將if語句生成了匯編代碼。

    可能有人會質(zhì)疑:為什么要使用__asm__("":::"memory")向GCC聲明內(nèi)存發(fā)生了變化?明明“Instruction List”是空的,沒有任何對內(nèi)存的操作,這樣做只會增加GCC生成匯編代碼的數(shù)量。

    確 實(shí),那條內(nèi)聯(lián)匯編語句沒有對內(nèi)存作任何操作,事實(shí)上它確實(shí)什么都沒有做。但影響內(nèi)存內(nèi)容的不僅僅是你當(dāng)前正在運(yùn)行的程序。比如,如果你現(xiàn)在正在操作的內(nèi)存 是一塊內(nèi)存映射,映射的內(nèi)容是外圍I/O設(shè)備寄存器。那么操作這塊內(nèi)存的就不僅僅是當(dāng)前的程序,I/O設(shè)備也會去操作這塊內(nèi)存。既然兩者都會去操作同一塊 內(nèi)存,那么任何一方在任何時(shí)候都不能對這塊內(nèi)存的內(nèi)容想當(dāng)然。所以當(dāng)你使用高級語言C/C++寫這類程序的時(shí)候,你必須讓編譯器也能夠明白這一點(diǎn),畢竟高 級語言最終要被編譯為匯編代碼。

    你可能已經(jīng)注意到了,這次輸出的匯編結(jié)果中,有兩個(gè)符號:#APP和#NO_APP,GCC將內(nèi)聯(lián)匯編語 句中"Instruction List"所列出的指令放在#APP和#NO_APP之間,由于__asm__("":::"memory")中“Instruction List”為空,所以#APP和#NO_APP中間也沒有任何內(nèi)容。但我們以后的例子會更加清楚的表現(xiàn)這一點(diǎn)。

    關(guān)于為什么內(nèi)聯(lián)匯編__asm__("":::"memory")是一條聲明內(nèi)存改變的語句,我們后面會詳細(xì)討論。

    剛才我們花了大量的內(nèi)容來討論"Instruction List"為空是的情況,但在實(shí)際的編程中,"Instruction List"絕大多數(shù)情況下都不是空的。它可以有1條或任意多條匯編指令。

    當(dāng) 在"Instruction List"中有多條指令的時(shí)候,你可以在一對引號中列出全部指令,也可以將一條或幾條指令放在一對引號中,所有指令放在多對引號中。如果是前者,你可以將 每一條指令放在一行,如果要將多條指令放在一行,則必須用分號(;)或換行符(\n,大多數(shù)情況下\n后還要跟一個(gè)\t,其中\(zhòng)n是為了換行,\t是為了 空出一個(gè)tab寬度的空格)將它們分開。比如:

    __asm__("movl %eax, %ebx
    sti
    popl %edi
    subl %ecx, %ebx");

    __asm__("movl %eax, %ebx; sti
    popl %edi; subl %ecx, %ebx");

    __asm__("movl %eax, %ebx; sti\n\t popl %edi
    subl %ecx, %ebx");

    都是合法的寫法。如果你將指令放在多對引號中,則除了最后一對引號之外,前面的所有引號里的最后一條指令之后都要有一個(gè)分號(;)或(\n)或(\n\t)。比如:

    __asm__("movl %eax, %ebx
    sti\n"
    "popl %edi;"
    "subl %ecx, %ebx");

    __asm__("movl %eax, %ebx; sti\n\t"
    "popl %edi; subl %ecx, %ebx");

    __asm__("movl %eax, %ebx; sti\n\t popl %edi\n"
    "subl %ecx, %ebx");

    __asm__("movl %eax, %ebx; sti\n\t popl %edi;" "subl %ecx, %ebx");

    都是合法的。

    上述原則可以歸結(jié)為:

    任意兩個(gè)指令間要么被分號(;)分開,要么被放在兩行;
    放在兩行的方法既可以從通過\n的方法來實(shí)現(xiàn),也可以真正的放在兩行;
    可以使用1對或多對引號,每1對引號里可以放任一多條指令,所有的指令都要被放到引號中。
    在基本內(nèi)聯(lián)匯編中,“Instruction List”的書寫的格式和你直接在匯編文件中寫非內(nèi)聯(lián)匯編沒有什么不同,你可以在其中定義Label,定義對齊(.align n ),定義段(.section name )。例如:

    __asm__(".align 2\n\t"
    "movl %eax, %ebx\n\t"
    "test %ebx, %ecx\n\t"
    "jne error\n\t"
    "sti\n\t"
    "error: popl %edi\n\t"
    "subl %ecx, %ebx");

    上面例子的格式是Linux內(nèi)聯(lián)代碼常用的格式,非常整齊。也建議大家都使用這種格式來寫內(nèi)聯(lián)匯編代碼。


    3、__volatile__

    __volatile__是GCC關(guān)鍵字volatile的宏定義:

    #define __volatile__ volatile

    __volatile__ 或volatile是可選的,你可以用它也可以不用它。如果你用了它,則是向GCC聲明“不要?jiǎng)游宜鶎懙腎nstruction List,我需要原封不動的保留每一條指令”,否則當(dāng)你使用了優(yōu)化選項(xiàng)(-O)進(jìn)行編譯時(shí),GCC將會根據(jù)自己的判斷決定是否將這個(gè)內(nèi)聯(lián)匯編表達(dá)式中的指 令優(yōu)化掉。

    那么GCC判斷的原則是什么?我不知道(如果有哪位朋友清楚的話,請告訴我)。我試驗(yàn)了一下,發(fā)現(xiàn)一條內(nèi)聯(lián)匯編語句如果是基本 內(nèi)聯(lián)匯編的話(即只有“Instruction List”,沒有Input/Output/Clobber的內(nèi)聯(lián)匯編,我們后面將會討論這一點(diǎn)),無論你是否使用__volatile__來修飾, GCC 2.96在優(yōu)化編譯時(shí),都會原封不動的保留內(nèi)聯(lián)匯編中的“Instruction List”。但或許我的試驗(yàn)的例子并不充分,所以這一點(diǎn)并不能夠得到保證。

    為了保險(xiǎn)起見,如果你不想讓GCC的優(yōu)化影響你的內(nèi)聯(lián)匯編代碼,你最好在前面都加上__volatile__,而不要依賴于編譯器的原則,因?yàn)榧词鼓惴浅A私猱?dāng)前編譯器的優(yōu)化原則,你也無法保證這種原則將來不會發(fā)生變化。而__volatile__的含義卻是恒定的。

    2、帶有C/C++表達(dá)式的內(nèi)聯(lián)匯編

    GCC允許你通過C/C++表達(dá)式指定內(nèi)聯(lián)匯編中"Instrcuction List"中指令的輸入和輸出,你甚至可以不關(guān)心到底使用哪個(gè)寄存器被使用,完全靠GCC來安排和指定。這一點(diǎn)可以讓程序員避免去考慮有限的寄存器的使用,也可以提高目標(biāo)代碼的效率。

    我們先來看幾個(gè)例子:

    __asm__ (" " : : : "memory" ); // 前面提到的

    __asm__ ("mov %%eax, %%ebx" : "=b"(rv) : "a"(foo) : "eax", "ebx");

    __asm__ __volatile__("lidt %0": "=m" (idt_descr));

    __asm__("subl %2,%0\n\t"
    "sbbl %3,%1"
    : "=a" (endlow), "=d" (endhigh)
    : "g" (startlow), "g" (starthigh), "0" (endlow), "1" (endhigh));

    怎么樣,有點(diǎn)印象了吧,是不是也有點(diǎn)暈?沒關(guān)系,下面討論完之后你就不會再暈了。(當(dāng)然,也有可能更暈^_^)。討論開始——

    帶有C/C++表達(dá)式的內(nèi)聯(lián)匯編格式為:

    __asm__ __volatile__("Instruction List" : Output : Input : Clobber/Modify);

    從中我們可以看出它和基本內(nèi)聯(lián)匯編的不同之處在于:它多了3個(gè)部分(Input,Output,Clobber/Modify)。在括號中的4個(gè)部分通過冒號(:)分開。

    這4個(gè)部分都不是必須的,任何一個(gè)部分都可以為空,其規(guī)則為:

    如 果Clobber/Modify為空,則其前面的冒號(:)必須省略。比如__asm__("mov %%eax, %%ebx" : "=b"(foo) : "a"(inp) : )就是非法的寫法;而__asm__("mov %%eax, %%ebx" : "=b"(foo) : "a"(inp) )則是正確的。
    如果Instruction List為空,則Input,Output,Clobber/Modify可以不為空,也可以為空。比如__asm__ ( " " : : : "memory" );和__asm__(" " : : );都是合法的寫法。
    如 果Output,Input,Clobber/Modify都為空,Output,Input之前的冒號(:)既可以省略,也可以不省略。如果都省略,則 此匯編退化為一個(gè)基本內(nèi)聯(lián)匯編,否則,仍然是一個(gè)帶有C/C++表達(dá)式的內(nèi)聯(lián)匯編,此時(shí)"Instruction List"中的寄存器寫法要遵守相關(guān)規(guī)定,比如寄存器前必須使用兩個(gè)百分號(%%),而不是像基本匯編格式一樣在寄存器前只使用一個(gè)百分號(%)。比如 __asm__( " mov %%eax, %%ebx" : : );__asm__( " mov %%eax, %%ebx" : )和__asm__( " mov %eax, %ebx" )都是正確的寫法,而__asm__( " mov %eax, %ebx" : : );__asm__( " mov %eax, %ebx" : )和__asm__( " mov %%eax, %%ebx" )都是錯(cuò)誤的寫法。
    如果Input,Clobber/Modify為空,但Output不為空,Input前的冒號(:)既可以省略,也可以不省略。比如 __asm__( " mov %%eax, %%ebx" : "=b"(foo) : );__asm__( " mov %%eax, %%ebx" : "=b"(foo) )都是正確的。
    如果后面的部分不為空,而前面的部分為空,則前面的冒號(:)都必須保留,否則無法說 明不為空的部分究竟是第幾部分。比如, Clobber/Modify,Output為空,而Input不為空,則Clobber/Modify前的冒號必須省略(前面的規(guī)則),而Output 前的冒號必須為保留。如果Clobber/Modify不為空,而Input和Output都為空,則Input和Output前的冒號都必須保留。比如 __asm__( " mov %%eax, %%ebx" : : "a"(foo) )和__asm__( " mov %%eax, %%ebx" : : : "ebx" )。
    從上面的規(guī)則可以看到另外一個(gè)事實(shí),區(qū)分一個(gè)內(nèi)聯(lián)匯編是基本格式的還是帶有C/C++表達(dá)式格式的,其規(guī)則在于在"Instruction List"后是否有冒號(:)的存在,如果沒有則是基本格式的,否則,則是帶有C/C++表達(dá)式格式的。

    兩種格式對寄存器語法的要求不同:基本格式要求寄存器前只能使用一個(gè)百分號(%),這一點(diǎn)和非內(nèi)聯(lián)匯編相同;而帶有C/C++表達(dá)式格式則要求寄存器前必須使用兩個(gè)百分號(%%),其原因我們會在后面討論。

    1. Output

    Output用來指定當(dāng)前內(nèi)聯(lián)匯編語句的輸出。我們看一看這個(gè)例子:

    __asm__("movl %%cr0, %0": "=a" (cr0));

    這 個(gè)內(nèi)聯(lián)匯編語句的輸出部分為"=r"(cr0),它是一個(gè)“操作表達(dá)式”,指定了一個(gè)輸出操作。我們可以很清楚得看到這個(gè)輸出操作由兩部分組成:括號括住 的部分(cr0)和引號引住的部分"=a"。這兩部分都是每一個(gè)輸出操作必不可少的。括號括住的部分是一個(gè)C/C++表達(dá)式,用來保存內(nèi)聯(lián)匯編的一個(gè)輸出 值,其操作就等于C/C++的相等賦值cr0 = output_value,因此,括號中的輸出表達(dá)式只能是C/C++的左值表達(dá)式,也就是說它只能是一個(gè)可以合法的放在C/C++賦值操作中等號(=) 左邊的表達(dá)式。那么右值output_value從何而來呢?

    答案是引號中的內(nèi)容,被稱作“操作約束”(Operation Constraint),在這個(gè)例子中操作約束為"=a",它包含兩個(gè)約束:等號(=)和字母a,其中等號(=)說明括號中左值表達(dá)式cr0是一個(gè) Write-Only的,只能夠被作為當(dāng)前內(nèi)聯(lián)匯編的輸入,而不能作為輸入。而字母a是寄存器EAX / AX / AL的簡寫,說明cr0的值要從eax寄存器中獲取,也就是說cr0 = eax,最終這一點(diǎn)被轉(zhuǎn)化成匯編指令就是movl %eax, address_of_cr0?,F(xiàn)在你應(yīng)該清楚了吧,操作約束中會給出:到底從哪個(gè)寄存器傳遞值給cr0。

    另外,需要特別說明的是,很多 文檔都聲明,所有輸出操作的操作約束必須包含一個(gè)等號(=),但GCC的文檔中卻很清楚的聲明,并非如此。因?yàn)榈忍?=)約束說明當(dāng)前的表達(dá)式是一個(gè) Write-Only的,但另外還有一個(gè)符號——加號(+)用來說明當(dāng)前表達(dá)式是一個(gè)Read-Write的,如果一個(gè)操作約束中沒有給出這兩個(gè)符號中的 任何一個(gè),則說明當(dāng)前表達(dá)式是Read-Only的。因?yàn)閷τ谳敵霾僮鱽碚f,肯定是必須是可寫的,而等號(=)和加號(+)都表示可寫,只不過加號(+) 同時(shí)也表示是可讀的。所以對于一個(gè)輸出操作來說,其操作約束只需要有等號(=)或加號(+)中的任意一個(gè)就可以了。

    二者的區(qū)別是:等號(=)表示當(dāng)前操作表達(dá)式指定了一個(gè)純粹的輸出操作,而加號(+)則表示當(dāng)前操作表達(dá)式不僅僅只是一個(gè)輸出操作還是一個(gè)輸入操作。但無論是等號(=)約束還是加號(+)約束所約束的操作表達(dá)式都只能放在Output域中,而不能被用在Input域中。

    另外,有些文檔聲明:盡管GCC文檔中提供了加號(+)約束,但在實(shí)際的編譯中通不過;我不知道老版本會怎么樣,我在GCC 2.96中對加號(+)約束的使用非常正常。

    我們通過一個(gè)例子看一下,在一個(gè)輸出操作中使用等號(=)約束和加號(+)約束的不同。

    $ cat example2.c

    int main(int __argc, char* __argv[])
    {
    int cr0 = 5;

    __asm__ __volatile__("movl %%cr0, %0":"=a" (cr0));

    return 0;
    }

    $ gcc -S example2.c

    $ cat example2.s

    main:
    pushl %ebp
    movl %esp, %ebp
    subl $4, %esp
    movl $5, -4(%ebp) # cr0 = 5
    #APP
    movl %cr0, %eax
    #NO_APP
    movl %eax, %eax
    movl %eax, -4(%ebp) # cr0 = %eax
    movl $0, %eax
    leave
    ret


    這個(gè)例子是使用等號(=)約束的情況,變量cr0被放在內(nèi)存-4(%ebp)的位置,所以指令mov %eax, -4(%ebp)即表示將%eax的內(nèi)容輸出到變量cr0中。

    下面是使用加號(+)約束的情況:

    $ cat example3.c

    int main(int __argc, char* __argv[])
    {
    int cr0 = 5;

    __asm__ __volatile__("movl %%cr0, %0" : "+a" (cr0));

    return 0;
    }

    $ gcc -S example3.c

    $ cat example3.s

    main:
    pushl %ebp
    movl %esp, %ebp
    subl $4, %esp
    movl $5, -4(%ebp) # cr0 = 5
    movl -4(%ebp), %eax # input ( %eax = cr0 )
    #APP
    movl %cr0, %eax
    #NO_APP
    movl %eax, -4(%ebp) # output (cr0 = %eax )
    movl $0, %eax
    leave
    ret


    從編譯的結(jié)果可以看出,當(dāng)使用加號(+)約束的時(shí)候,cr0不僅作為輸出,還作為輸入,所使用寄存器都是寄存器約束(字母a,表示使用eax寄存器)指定的。關(guān)于寄存器約束我們后面討論。

    在Output域中可以有多個(gè)輸出操作表達(dá)式,多個(gè)操作表達(dá)式中間必須用逗號(,)分開。例如:

    __asm__(
    "movl %%eax, %0 \n\t"
    "pushl %%ebx \n\t"
    "popl %1 \n\t"
    "movl %1, %2"
    : "+a"(cr0), "=b"(cr1), "=c"(cr2));



    2、Input

    Input域的內(nèi)容用來指定當(dāng)前內(nèi)聯(lián)匯編語句的輸入。我們看一看這個(gè)例子:

    __asm__("movl %0, %%db7" : : "a" (cpu->db7));

    例中Input域的內(nèi)容為一個(gè)表達(dá)式"a"[cpu->db7),被稱作“輸入表達(dá)式”,用來表示一個(gè)對當(dāng)前內(nèi)聯(lián)匯編的輸入。

    像輸出表達(dá)式一樣,一個(gè)輸入表達(dá)式也分為兩部分:帶括號的部分(cpu->db7)和帶引號的部分"a"。這兩部分對于一個(gè)內(nèi)聯(lián)匯編輸入表達(dá)式來說也是必不可少的。

    括 號中的表達(dá)式cpu->db7是一個(gè)C/C++語言的表達(dá)式,它不必是一個(gè)左值表達(dá)式,也就是說它不僅可以是放在C/C++賦值操作左邊的表達(dá)式, 還可以是放在C/C++賦值操作右邊的表達(dá)式。所以它可以是一個(gè)變量,一個(gè)數(shù)字,還可以是一個(gè)復(fù)雜的表達(dá)式(比如a+b/c*d)。比如上例可以改為: __asm__("movl %0, %%db7" : : "a" (foo)),__asm__("movl %0, %%db7" : : "a" (0x1000))或__asm__("movl %0, %%db7" : : "a" (va*vb/vc))。

    引號號中的 部分是約束部分,和輸出表達(dá)式約束不同的是,它不允許指定加號(+)約束和等號(=)約束,也就是說它只能是默認(rèn)的Read-Only的。約束中必須指定 一個(gè)寄存器約束,例中的字母a表示當(dāng)前輸入變量cpu->db7要通過寄存器eax輸入到當(dāng)前內(nèi)聯(lián)匯編中。

    我們看一個(gè)例子:

    $ cat example4.c

    int main(int __argc, char* __argv[])
    {
    int cr0 = 5;

    __asm__ __volatile__("movl %0, %%cr0"::"a" (cr0));

    return 0;
    }

    $ gcc -S example4.c

    $ cat example4.s

    main:
    pushl %ebp
    movl %esp, %ebp
    subl $4, %esp
    movl $5, -4(%ebp) # cr0 = 5
    movl -4(%ebp), %eax # %eax = cr0
    #APP
    movl %eax, %cr0
    #NO_APP
    movl $0, %eax
    leave
    ret


    我們從編譯出的匯編代碼可以看到,在"Instruction List"之前,GCC按照我們的輸入約束"a",將變量cr0的內(nèi)容裝入了eax寄存器。

    3. Operation Constraint

    每一個(gè)Input和Output表達(dá)式都必須指定自己的操作約束Operation Constraint,我們這里來討論在80386平臺上所可能使用的操作約束。

    1、寄存器約束

    當(dāng)你當(dāng)前的輸入或輸入需要借助一個(gè)寄存器時(shí),你需要為其指定一個(gè)寄存器約束。你可以直接指定一個(gè)寄存器的名字,比如:

    __asm__ __volatile__("movl %0, %%cr0"::"eax" (cr0));

    也可以指定一個(gè)縮寫,比如:

    __asm__ __volatile__("movl %0, %%cr0"::"a" (cr0));

    如果你指定一個(gè)縮寫,比如字母a,則GCC將會根據(jù)當(dāng)前操作表達(dá)式中C/C++表達(dá)式的寬度決定使用%eax,還是%ax或%al。比如:

    unsigned short __shrt;

    __asm__ ("mov %0,%%bx" : : "a"(__shrt));

    由于變量__shrt是16-bit short類型,則編譯出來的匯編代碼中,則會讓此變量使用%ex寄存器。編譯結(jié)果為:

    movw -2(%ebp), %ax # %ax = __shrt
    #APP
    movl %ax, %bx
    #NO_APP

    無論是Input,還是Output操作表達(dá)式約束,都可以使用寄存器約束。

    下表中列出了常用的寄存器約束的縮寫。

    約束 Input/Output 意義
    r I,O 表示使用一個(gè)通用寄存器,由GCC在%eax/%ax/%al, %ebx/%bx/%bl, %ecx/%cx/%cl, %edx/%dx/%dl中選取一個(gè)GCC認(rèn)為合適的。
    q I,O 表示使用一個(gè)通用寄存器,和r的意義相同。
    a I,O 表示使用%eax / %ax / %al
    b I,O 表示使用%ebx / %bx / %bl
    c I,O 表示使用%ecx / %cx / %cl
    d I,O 表示使用%edx / %dx / %dl
    D I,O 表示使用%edi / %di
    S I,O 表示使用%esi / %si
    f I,O 表示使用浮點(diǎn)寄存器
    t I,O 表示使用第一個(gè)浮點(diǎn)寄存器
    u I,O 表示使用第二個(gè)浮點(diǎn)寄存器


    2、內(nèi)存約束
    如果一個(gè)Input/Output操作表達(dá)式的C/C++表達(dá)式表現(xiàn)為一個(gè)內(nèi)存地址,不想借助于任何寄存器,則可以使用內(nèi)存約束。比如:

    __asm__ ("lidt %0" : "=m"(__idt_addr)); 或 __asm__ ("lidt %0" : :"m"(__idt_addr));

    我們看一下它們分別被放在一個(gè)C源文件中,然后被GCC編譯后的結(jié)果:

    $ cat example5.c

    // 本例中,變量sh被作為一個(gè)內(nèi)存輸入

    int main(int __argc, char* __argv[])
    {
    char* sh = (char*)&__argc;

    __asm__ __volatile__("lidt %0" : : "m" (sh));

    return 0;
    }

    $ gcc -S example5.c

    $ cat example5.s

    main:
    pushl %ebp
    movl %esp, %ebp
    subl $4, %esp
    leal 8(%ebp), %eax
    movl %eax, -4(%ebp) # sh = (char*) &__argc
    #APP
    lidt -4(%ebp)
    #NO_APP
    movl $0, %eax
    leave
    ret


    $ cat example6.c

    // 本例中,變量sh被作為一個(gè)內(nèi)存輸出

    int main(int __argc, char* __argv[])
    {
    char* sh = (char*)&__argc;

    __asm__ __volatile__("lidt %0" : "=m" (sh));

    return 0;
    }

    $ gcc -S example6.c

    $ cat example6.s

    main:
    pushl %ebp
    movl %esp, %ebp
    subl $4, %esp
    leal 8(%ebp), %eax
    movl %eax, -4(%ebp) # sh = (char*) &__argc
    #APP
    lidt -4(%ebp)
    #NO_APP
    movl $0, %eax
    leave
    ret
    首先,你會注意到,在這兩個(gè)例子中,變量sh沒有借助任何寄存器,而是直接參與了指令lidt的操作。

    其次,通過仔細(xì)觀察,你會發(fā)現(xiàn)一個(gè)驚人的事實(shí),兩個(gè)例子編譯出來的匯編代碼是一樣的!雖然,一個(gè)例子中變量sh作為輸入,而另一個(gè)例子中變量sh作為輸出。這是怎么回事?

    原來,使用內(nèi)存方式進(jìn)行輸入輸出時(shí),由于不借助寄存器,所以GCC不會按照你的聲明對其作任何的輸入輸出處理。GCC只會直接拿來用,究竟對這個(gè)C/C++表達(dá)式而言是輸入還是輸出,完全依賴與你寫在"Instruction List"中的指令對其操作的指令。

    由 于上例中,對其操作的指令為lidt,lidt指令的操作數(shù)是一個(gè)輸入型的操作數(shù),所以事實(shí)上對變量sh的操作是一個(gè)輸入操作,即使你把它放在 Output域也不會改變這一點(diǎn)。所以,對此例而言,完全符合語意的寫法應(yīng)該是將sh放在Input域,盡管放在Output域也會有正確的執(zhí)行結(jié)果。

    所 以,對于內(nèi)存約束類型的操作表達(dá)式而言,放在Input域還是放在Output域,對編譯結(jié)果是沒有任何影響的,因?yàn)楸緛砦覀儗⒁粋€(gè)操作表達(dá)式放在 Input域或放在Output域是希望GCC能為我們自動通過寄存器將表達(dá)式的值輸入或輸出。既然對于內(nèi)存約束類型的操作表達(dá)式來說,GCC不會自動為 它做任何事情,那么放在哪兒也就無所謂了。但從程序員的角度而言,為了增強(qiáng)代碼的可讀性,最好能夠把它放在符合實(shí)際情況的地方。

    約束 Input/Output 意義
    m I,O 表示使用系統(tǒng)所支持的任何一種內(nèi)存方式,不需要借助寄存器



    [Linux]__asm__ __volatile__ GCC的內(nèi)嵌匯編語法 AT&T匯編語言語法(二)
    2010-03-17 11:35
    http://hi.baidu.com/hilyjiang/blog/item/2254e62afd6db42cd42af180.html

    3、立即數(shù)約束

    如果一個(gè)Input/Output操作表達(dá)式的C/C++表達(dá)式是一個(gè)數(shù)字常數(shù),不想借助于任何寄存器,則可以使用立即數(shù)約束。

    由于立即數(shù)在C/C++中只能作為右值,所以對于使用立即數(shù)約束的表達(dá)式而言,只能放在Input域。

    比如:__asm__ __volatile__("movl %0, %%eax" : : "i" (100) );

    立即數(shù)約束很簡單,也很容易理解,我們在這里就不再贅述。

    約束 Input/Output 意義
    i I 表示輸入表達(dá)式是一個(gè)立即數(shù)(整數(shù)),不需要借助任何寄存器
    F I 表示輸入表達(dá)式是一個(gè)立即數(shù)(浮點(diǎn)數(shù)),不需要借助任何寄存器


    4、通用約束

    約束 Input/Output 意義
    g I,O 表示可以使用通用寄存器,內(nèi)存,立即數(shù)等任何一種處理方式。
    0,1,2,3,4,5,6,7,8,9 I 表示和第n個(gè)操作表達(dá)式使用相同的寄存器/內(nèi)存。


    通 用約束g是一個(gè)非常靈活的約束,當(dāng)程序員認(rèn)為一個(gè)C/C++表達(dá)式在實(shí)際的操作中,究竟使用寄存器方式,還是使用內(nèi)存方式或立即數(shù)方式并無所謂時(shí),或者程 序員想實(shí)現(xiàn)一個(gè)靈活的模板,讓GCC可以根據(jù)不同的C/C++表達(dá)式生成不同的訪問方式時(shí),就可以使用通用約束g。比如:

    #define JUST_MOV(foo) __asm__ ("movl %0, %%eax" : : "g"(foo))

    JUST_MOV(100)和JUST_MOV(var)則會讓編譯器產(chǎn)生不同的代碼。

    int main(int __argc, char* __argv[])
    {
    JUST_MOV(100);

    return 0;
    }

    編譯后生成的代碼為:

    main:
    pushl %ebp
    movl %esp, %ebp
    #APP
    movl $100, %eax
    #NO_APP
    movl $0, %eax
    popl %ebp
    ret

    很明顯這是立即數(shù)方式。而下一個(gè)例子:

    int main(int __argc, char* __argv[])
    {
    JUST_MOV(__argc);

    return 0;
    }

    經(jīng)編譯后生成的代碼為:

    main:
    pushl %ebp
    movl %esp, %ebp
    #APP
    movl 8(%ebp), %eax
    #NO_APP
    movl $0, %eax
    popl %ebp
    ret

    這個(gè)例子是使用內(nèi)存方式。

    一個(gè)帶有C/C++表達(dá)式的內(nèi)聯(lián)匯編,其操作表達(dá)式被按照被列出的順序編號,第一個(gè)是0,第2個(gè)是1,依次類推,GCC最多允許有10個(gè)操作表達(dá)式。比如:

    __asm__ ("popl %0 \n\t"
    "movl %1, %%esi \n\t"
    "movl %2, %%edi \n\t"
    : "=a"(__out)
    : "r" (__in1), "r" (__in2));

    此例中,__out所在的Output操作表達(dá)式被編號為0,"r"(__in1)被編號為1,"r"(__in2)被編號為2。

    再如:

    __asm__ ("movl %%eax, %%ebx" : : "a"(__in1), "b"(__in2));

    此例中,"a"(__in1)被編號為0,"b"(__in2)被編號為1。

    如 果某個(gè)Input操作表達(dá)式使用數(shù)字0到9中的一個(gè)數(shù)字(假設(shè)為1)作為它的操作約束,則等于向GCC聲明:“我要使用和編號為1的Output操作表達(dá) 式相同的寄存器(如果Output操作表達(dá)式1使用的是寄存器),或相同的內(nèi)存地址(如果Output操作表達(dá)式1使用的是內(nèi)存)”。上面的描述包含兩個(gè) 限定:數(shù)字0到數(shù)字9作為操作約束只能用在Input操作表達(dá)式中,被指定的操作表達(dá)式(比如某個(gè)Input操作表達(dá)式使用數(shù)字1作為約束,那么被指定的 就是編號為1的操作表達(dá)式)只能是Output操作表達(dá)式。

    由于GCC規(guī)定最多只能有10個(gè)Input/Output操作表達(dá)式,所以事 實(shí)上數(shù)字9作為操作約束永遠(yuǎn)也用不到,因?yàn)镺utput操作表達(dá)式排在Input操作表達(dá)式的前面,那么如果有一個(gè)Input操作表達(dá)式指定了數(shù)字9作為 操作約束的話,那么說明Output操作表達(dá)式的數(shù)量已經(jīng)至少為10個(gè)了,那么再加上這個(gè)Input操作表達(dá)式,則至少為11個(gè)了,以及超出GCC的限 制。

    5、Modifier Characters(修飾符)

    等號(=)和加號(+)用于對Output操作表達(dá)式的修 飾,一個(gè)Output操作表達(dá)式要么被等號(=)修飾,要么被加號(+)修飾,二者必居其一。使用等號(=)說明此Output操作表達(dá)式是Write- Only的,使用加號(+)說明此Output操作表達(dá)式是Read-Write的。它們必須被放在約束字符串的第一個(gè)字母。比如"a="(foo)是非 法的,而"+g"(foo)則是合法的。

    當(dāng)使用加號(+)的時(shí)候,此Output表達(dá)式等價(jià)于使用等號(=)約束加上一個(gè)Input表達(dá)式。比如

    __asm__ ("movl %0, %%eax; addl %%eax, %0" : "+b"(foo)) 等價(jià)于

    __asm__ ("movl %1, %%eax; addl %%eax, %0" : "=b"(foo) : "b"(foo))

    但如果使用后一種寫法,"Instruction List"中的別名也要相應(yīng)的改動。關(guān)于別名,我們后面會討論。

    像 等號(=)和加號(+)修飾符一樣,符號(&)也只能用于對Output操作表達(dá)式的修飾。當(dāng)使用它進(jìn)行修飾時(shí),等于向GCC聲明:"GCC不得 為任何Input操作表達(dá)式分配與此Output操作表達(dá)式相同的寄存器"。其原因是&修飾符意味著被其修飾的Output操作表達(dá)式要在所有的 Input操作表達(dá)式被輸入前輸出。我們看下面這個(gè)例子:

    int main(int __argc, char* __argv[])
    {
    int __in1 = 8, __in2 = 4, __out = 3;

    __asm__ ("popl %0 \n\t"
    "movl %1, %%esi \n\t"
    "movl %2, %%edi \n\t"
    : "=a"(__out)
    : "r" (__in1), "r" (__in2));

    return 0;
    }
    此 例中,%0對應(yīng)的就是Output操作表達(dá)式,它被指定的寄存器是%eax,整個(gè)Instruction List的第一條指令popl %0,編譯后就成為popl %eax,這時(shí)%eax的內(nèi)容已經(jīng)被修改,隨后在Instruction List后,GCC會通過movl %eax, address_of_out這條指令將%eax的內(nèi)容放置到Output變量__out中。對于本例中的兩個(gè)Input操作表達(dá)式而言,它們的寄存器約 束為"r",即要求GCC為其指定合適的寄存器,然后在Instruction List之前將__in1和__in2的內(nèi)容放入被選出的寄存器中,如果它們中的一個(gè)選擇了已經(jīng)被__out指定的寄存器%eax,假如是__in1,那 么GCC在Instruction List之前會插入指令movl address_of_in1, %eax,那么隨后popl %eax指令就修改了%eax的值,此時(shí)%eax中存放的已經(jīng)不是Input變量__in1的值了,那么隨后的movl %1, %%esi指令,將不會按照我們的本意——即將__in1的值放入%esi中——而是將__out的值放入%esi中了。
    下面就是本例的編譯結(jié)果,很明顯,GCC為__in2選擇了和__out相同的寄存器%eax,這與我們的初衷不符。

    main:
    pushl %ebp
    movl %esp, %ebp
    subl $12, %esp
    movl $8, -4(%ebp)
    movl $4, -8(%ebp)
    movl $3, -12(%ebp)
    movl -4(%ebp), %edx # __in1使用寄存器%edx
    movl -8(%ebp), %eax # __in2使用寄存器%eax
    #APP
    popl %eax
    movl %edx, %esi
    movl %eax, %edi

    #NO_APP
    movl %eax, %eax
    movl %eax, -12(%ebp) # __out使用寄存器%eax
    movl $0, %eax
    leave
    ret

    為 了避免這種情況,我們必須向GCC聲明這一點(diǎn),要求GCC為所有的Input操作表達(dá)式指定別的寄存器,方法就是在Output操作表達(dá)式"=a" (__out)的操作約束中加入&約束,由于GCC規(guī)定等號(=)約束必須放在第一個(gè),所以我們寫作"=&a"(__out)。
    下面是我們將&約束加入之后編譯的結(jié)果:
    main:
    pushl %ebp
    movl %esp, %ebp
    subl $12, %esp
    movl $8, -4(%ebp)
    movl $4, -8(%ebp)
    movl $3, -12(%ebp)
    movl -4(%ebp), %edx #__in1使用寄存器%edx
    movl -8(%ebp), %eax
    movl %eax, %ecx # __in2使用寄存器%ecx
    #APP
    popl %eax
    movl %edx, %esi
    movl %ecx, %edi

    #NO_APP
    movl %eax, %eax
    movl %eax, -12(%ebp) #__out使用寄存器%eax
    movl $0, %eax
    leave
    ret

    OK!這下好了,完全與我們的意圖吻合。
    如 果一個(gè)Output操作表達(dá)式的寄存器約束被指定為某個(gè)寄存器,只有當(dāng)至少存在一個(gè)Input操作表達(dá)式的寄存器約束為可選約束時(shí),(可選約束的意思是可 以從多個(gè)寄存器中選取一個(gè),或使用非寄存器方式),比如"r"或"g"時(shí),此Output操作表達(dá)式使用&修飾才有意義。如果你為所有的 Input操作表達(dá)式指定了固定的寄存器,或使用內(nèi)存/立即數(shù)約束,則此Output操作表達(dá)式使用&修飾沒有任何意義。比如:

    __asm__ ("popl %0 \n\t"
    "movl %1, %%esi \n\t"
    "movl %2, %%edi \n\t"
    : "=&a"(__out)
    : "m" (__in1), "c" (__in2));

    此例中的Output操作表達(dá)式完全沒有必要使用&來修飾,因?yàn)開_in1和__in2都被指定了固定的寄存器,或使用了內(nèi)存方式,GCC無從選擇。

    但如果你已經(jīng)為某個(gè)Output操作表達(dá)式指定了&修飾,并指定了某個(gè)固定的寄存器,你就不能再為任何Input操作表達(dá)式指定這個(gè)寄存器,否則會出現(xiàn)編譯錯(cuò)誤。比如:

    __asm__ ("popl %0 \n\t"
    "movl %1, %%esi \n\t"
    "movl %2, %%edi \n\t"
    : "=&a"(__out)
    : "a" (__in1), "c" (__in2));

    本例中,由于__out已經(jīng)指定了寄存器%eax,同時(shí)使用了符號&修飾,則再為__in1指定寄存器%eax就是非法的。


    反過來,你也可以為Output指定可選約束,比如"r","g"等,讓GCC為其選擇到底使用哪個(gè)寄存器,還是使用內(nèi)存方式,GCC在選擇的時(shí)候,會首先排除掉已經(jīng)被Input操作表達(dá)式使用的所有寄存器,然后在剩下的寄存器中選擇,或干脆使用內(nèi)存方式。比如:

    __asm__ ("popl %0 \n\t"
    "movl %1, %%esi \n\t"
    "movl %2, %%edi \n\t"
    : "=&r"(__out)
    : "a" (__in1), "c" (__in2));

    本例中,由于__out指定了約束"r",即讓GCC為其決定使用哪一格寄存器,而寄存器%eax和%ecx已經(jīng)被__in1和__in2使用,那么GCC在為__out選擇的時(shí)候,只會在%ebx和%edx中選擇。

    前3 個(gè)修飾符只能用在Output操作表達(dá)式中,而百分號[%]修飾符恰恰相反,只能用在Input操作表達(dá)式中,用于向GCC聲明:“當(dāng)前Input操作表 達(dá)式中的C/C++表達(dá)式可以和下一個(gè)Input操作表達(dá)式中的C/C++表達(dá)式互換”。這個(gè)修飾符號一般用于符合交換律運(yùn)算,比如加(+),乘(*), 與(&),或(|)等等。我們看一個(gè)例子:

    int main(int __argc, char* __argv[])
    {
    int __in1 = 8, __in2 = 4, __out = 3;

    __asm__ ("addl %1, %0\n\t"
    : "=r"(__out)
    : "%r" (__in1), "0" (__in2));

    return 0;
    }
    在 此例中,由于指令是一個(gè)加法運(yùn)算,相當(dāng)于等式__out = __in1 + __in2,而它與等式__out = __in2 + __in1沒有什么不同。所以使用百分號修飾,讓GCC知道__in1和__in2可以互換,也就是說GCC可以自動將本例的內(nèi)聯(lián)匯編改變?yōu)椋?br />
    __asm__ ("addl %1, %0\n\t"
    : "=r"(__out)
    : "%r" (__in2), "0" (__in1));

    修飾符 Input/Output 意義
    = O 表示此Output操作表達(dá)式是Write-Only的
    + O 表示此Output操作表達(dá)式是Read-Write的
    & O 表示此Output操作表達(dá)式獨(dú)占為其指定的寄存器
    % I 表示此Input操作表達(dá)式中的C/C++表達(dá)式可以和下一個(gè)Input操作表達(dá)式中的C/C++表達(dá)式互換


    4. 占位符

    什么叫占位符?我們看一看下面這個(gè)例子:

    __asm__ ("addl %1, %0\n\t"
    : "=a"(__out)
    : "m" (__in1), "a" (__in2));

    這 個(gè)例子中的%0和%1就是占位符。每一個(gè)占位符對應(yīng)一個(gè)Input/Output操作表達(dá)式。我們在之前已經(jīng)提到,GCC規(guī)定一個(gè)內(nèi)聯(lián)匯編語句最多可以有 10個(gè)Input/Output操作表達(dá)式,然后按照它們被列出的順序依次賦予編號0到9。對于占位符中的數(shù)字而言,和這些編號是對應(yīng)的。

    由于占位符前面使用一個(gè)百分號(%),為了區(qū)別占位符和寄存器,GCC規(guī)定在帶有C/C++表達(dá)式的內(nèi)聯(lián)匯編中,"Instruction List"中直接寫出的寄存器前必須使用兩個(gè)百分號(%%)。

    GCC 對其進(jìn)行編譯的時(shí)候,會將每一個(gè)占位符替換為對應(yīng)的Input/Output操作表達(dá)式所指定的寄存器/內(nèi)存地址/立即數(shù)。比如在上例中,占位符%0對應(yīng) Output操作表達(dá)式"=a"(__out),而"=a"(__out)指定的寄存器為%eax,所以把占位符%0替換為%eax,占位符%1對應(yīng) Input操作表達(dá)式"m"(__in1),而"m"(__in1)被指定為內(nèi)存操作,所以把占位符%1替換為變量__in1的內(nèi)存地址。

    也許有人認(rèn)為,在上面這個(gè)例子中,完全可以不使用%0,而是直接寫%%eax,就像這樣:

    __asm__ ("addl %1, %%eax\n\t"
    : "=a"(__out)
    : "m" (__in1), "a" (__in2));

    和 上面使用占位符%0沒有什么不同,那么使用占位符%0就沒有什么意義。確實(shí),兩者生成的代碼完全相同,但這并不意味著這種情況下占位符沒有意義。因?yàn)槿绻?不使用占位符,那么當(dāng)有一天你想把變量__out的寄存器約束由a改為b時(shí),那么你也必須將addl指令中的%%eax改為%%ebx,也就是說你需要同 時(shí)修改兩個(gè)地方,而如果你使用占位符,你只需要修改一次就夠了。另外,如果你不使用占位符,將不利于代碼的清晰性。在上例中,如果你使用占位符,那么你一 眼就可以得知,addl指令的第二個(gè)操作數(shù)內(nèi)容最終會輸出到變量__out中;否則,如果你不用占位符,而是直接將addl指令的第2個(gè)操作數(shù)寫為%% eax,那么你需要考慮一下才知道它最終需要輸出到變量__out中。這是占位符最粗淺的意義。畢竟在這種情況下,你完全可以不用。

    但對于這些情況來說,不用占位符就完全不行了:

    首 先,我們看一看上例中的第1個(gè)Input操作表達(dá)式"m"(__in1),它被GCC替換之后,表現(xiàn)為addl address_of_in1, %%eax,__in1的地址是什么?編譯時(shí)才知道。所以我們完全無法直接在指令中去寫出__in1的地址,這時(shí)使用占位符,交給GCC在編譯時(shí)進(jìn)行替 代,就可以解決這個(gè)問題。所以這種情況下,我們必須使用占位符。

    其次,如果上例中的Output操作表達(dá)式"=a"(__out)改為" =r"(__out),那么__out在究竟使用那么寄存器只有到編譯時(shí)才能通過GCC來決定,既然在我們寫代碼的時(shí)候,我們不知道究竟哪個(gè)寄存器被選 擇,我們也就不能直接在指令中寫出寄存器的名稱,而只能通過占位符替代來解決。

    5. Clobber/Modify

    有時(shí)候,你想通知GCC當(dāng)前內(nèi)聯(lián)匯編語句可能會對某些寄存器或內(nèi)存進(jìn)行修改,希望GCC在編譯時(shí)能夠?qū)⑦@一點(diǎn)考慮進(jìn)去。那么你就可以在Clobber/Modify域聲明這些寄存器或內(nèi)存。

    這 種情況一般發(fā)生在一個(gè)寄存器出現(xiàn)在"Instruction List",但卻不是由Input/Output操作表達(dá)式所指定的,也不是在一些Input/Output操作表達(dá)式使用"r","g"約束時(shí)由GCC 為其選擇的,同時(shí)此寄存器被"Instruction List"中的指令修改,而這個(gè)寄存器只是供當(dāng)前內(nèi)聯(lián)匯編臨時(shí)使用的情況。比如:

    __asm__ ("movl %0, %%ebx" : : "a"(__foo) : "bx");

    寄存器%ebx出現(xiàn)在"Instruction List中",并且被movl指令修改,但卻未被任何Input/Output操作表達(dá)式指定,所以你需要在Clobber/Modify域指定"bx",以讓GCC知道這一點(diǎn)。

    因 為你在Input/Output操作表達(dá)式所指定的寄存器,或當(dāng)你為一些Input/Output操作表達(dá)式使用"r","g"約束,讓GCC為你選擇一 個(gè)寄存器時(shí),GCC對這些寄存器是非常清楚的——它知道這些寄存器是被修改的,你根本不需要在Clobber/Modify域再聲明它們。但除此之外, GCC對剩下的寄存器中哪些會被當(dāng)前的內(nèi)聯(lián)匯編修改一無所知。所以如果你真的在當(dāng)前內(nèi)聯(lián)匯編指令中修改了它們,那么就最好在Clobber/Modify 中聲明它們,讓GCC針對這些寄存器做相應(yīng)的處理。否則有可能會造成寄存器的不一致,從而造成程序執(zhí)行錯(cuò)誤。

    在Clobber/Modify域中指定這些寄存器的方法很簡單,你只需要將寄存器的名字使用雙引號(" ")引起來。如果有多個(gè)寄存器需要聲明,你需要在任意兩個(gè)聲明之間用逗號隔開。比如:

    __asm__ ("movl %0, %%ebx; popl %%ecx" : : "a"(__foo) : "bx", "cx" );

    這些串包括:

    聲明的串 代表的寄存器
    "al","ax","eax" %eax
    "bl","bx","ebx" %ebx
    "cl","cx","ecx" %ecx
    "dl","dx","edx" %edx
    "si","esi" %esi
    "di", "edi" %edi


    由上表可以看出,你只需要使用"ax","bx","cx","dx","si","di"就可以了,因?yàn)槠渌亩己退鼈冎械囊粋€(gè)是等價(jià)的。

    如 果你在一個(gè)內(nèi)聯(lián)匯編語句的Clobber/Modify域向GCC聲明某個(gè)寄存器內(nèi)容發(fā)生了改變,GCC在編譯時(shí),如果發(fā)現(xiàn)這個(gè)被聲明的寄存器的內(nèi)容在此 內(nèi)聯(lián)匯編語句之后還要繼續(xù)使用,那么GCC會首先將此寄存器的內(nèi)容保存起來,然后在此內(nèi)聯(lián)匯編語句的相關(guān)生成代碼之后,再將其內(nèi)容恢復(fù)。我們來看兩個(gè)例 子,然后對比一下它們之間的區(qū)別。

    這個(gè)例子中聲明了寄存器%ebx內(nèi)容發(fā)生了改變:

    $ cat example7.c

    int main(int __argc, char* __argv[])
    {
    int in = 8;

    __asm__ ("addl %0, %%ebx"
    : /* no output */
    : "a" (in) : "bx");

    return 0;
    }

    $ gcc -O -S example7.c

    $ cat example7.s

    main:
    pushl %ebp
    movl %esp, %ebp
    pushl %ebx # %ebx內(nèi)容被保存
    movl $8, %eax
    #APP
    addl %eax, %ebx
    #NO_APP
    movl $0, %eax
    movl (%esp), %ebx # %ebx內(nèi)容被恢復(fù)
    leave
    ret

    下面這個(gè)例子的C源碼與上一個(gè)例子除了沒有聲明%ebx寄存器發(fā)生了改變之外,其它都相同。

    $ cat example8.c

    int main(int __argc, char* __argv[])
    {
    int in = 8;

    __asm__ ("addl %0, %%ebx"
    : /* no output */
    : "a" (in) );

    return 0;
    }

    $ gcc -O -S example8.c

    $ cat example8.s

    main:
    pushl %ebp
    movl %esp, %ebp
    movl $8, %eax
    #APP
    addl %eax, %ebx
    #NO_APP
    movl $0, %eax
    popl %ebp
    ret

    仔細(xì)對比一下example7.s和example8.s,你就會明白在Clobber/Modify域聲明一個(gè)寄存器的意義。

    另 外需要注意的是,如果你在Clobber/Modify域聲明了一個(gè)寄存器,那么這個(gè)寄存器將不能再被用做當(dāng)前內(nèi)聯(lián)匯編語句的Input/Output操 作表達(dá)式的寄存器約束,如果Input/Output操作表達(dá)式的寄存器約束被指定為"r"或"g",GCC也不會選擇已經(jīng)被聲明在 Clobber/Modify中的寄存器。比如:

    __asm__ ("movl %0, %%ebx" : : "a"(__foo) : "ax", "bx");

    此例中,由于Output操作表達(dá)式"a"(__foo)的寄存器約束已經(jīng)指定了%eax寄存器,那么再在Clobber/Modify域中指定"ax"就是非法的。編譯時(shí),GCC會給出編譯錯(cuò)誤。

    除 了寄存器的內(nèi)容會被改變,內(nèi)存的內(nèi)容也可以被修改。如果一個(gè)內(nèi)聯(lián)匯編語句"Instruction List"中的指令對內(nèi)存進(jìn)行了修改,或者在此內(nèi)聯(lián)匯編出現(xiàn)的地方內(nèi)存內(nèi)容可能發(fā)生改變,而被改變的內(nèi)存地址你沒有在其Output操作表達(dá)式使用"m" 約束,這種情況下你需要使用在Clobber/Modify域使用字符串"memory"向GCC聲明:“在這里,內(nèi)存發(fā)生了,或可能發(fā)生了改變”。例 如:

    void * memset(void * s, char c, size_t count)
    {
    __asm__("cld\n\t"
    "rep\n\t"
    "stosb"
    : /* no output */
    : "a" (c),"D" (s),"c" (count)
    : "cx","di","memory");
    return s;
    }

    此 例實(shí)現(xiàn)了標(biāo)準(zhǔn)函數(shù)庫memset,其內(nèi)聯(lián)匯編中的stosb對內(nèi)存進(jìn)行了改動,而其被修改的內(nèi)存地址s被指定裝入%edi,沒有任何Output操作表達(dá) 式使用了"m"約束,以指定內(nèi)存地址s處的內(nèi)容發(fā)生了改變。所以在其Clobber/Modify域使用"memory"向GCC聲明:內(nèi)存內(nèi)容發(fā)生了變 動。

    如果一個(gè)內(nèi)聯(lián)匯編語句的Clobber/Modify域存在"memory",那么GCC會保證在此內(nèi)聯(lián)匯編之前,如果某個(gè)內(nèi)存的內(nèi) 容被裝入了寄存器,那么在這個(gè)內(nèi)聯(lián)匯編之后,如果需要使用這個(gè)內(nèi)存處的內(nèi)容,就會直接到這個(gè)內(nèi)存處重新讀取,而不是使用被存放在寄存器中的拷貝。因?yàn)檫@個(gè) 時(shí)候寄存器中的拷貝已經(jīng)很可能和內(nèi)存處的內(nèi)容不一致了。

    這只是使用"memory"時(shí),GCC會保證做到的一點(diǎn),但這并不是全部。因?yàn)槭褂?memory"是向GCC聲明內(nèi)存發(fā)生了變化,而內(nèi)存發(fā)生變化帶來的影響并不止這一點(diǎn)。比如我們在前面講到的例子:

    int main(int __argc, char* __argv[])
    {
    int* __p = (int*)__argc;

    (*__p) = 9999;

    __asm__("":::"memory");

    if((*__p) == 9999)
    return 5;

    return (*__p);
    }

    本 例中,如果沒有那條內(nèi)聯(lián)匯編語句,那個(gè)if語句的判斷條件就完全是一句廢話。GCC在優(yōu)化時(shí)會意識到這一點(diǎn),而直接只生成return 5的匯編代碼,而不會再生成if語句的相關(guān)代碼,而不會生成return (*__p)的相關(guān)代碼。但你加上了這條內(nèi)聯(lián)匯編語句,它除了聲明內(nèi)存變化之外,什么都沒有做。但GCC此時(shí)就不能簡單的認(rèn)為它不需要判斷都知道 (*__p)一定與9999相等,它只有老老實(shí)實(shí)生成這條if語句的匯編代碼,一起相關(guān)的兩個(gè)return語句相關(guān)代碼。

    當(dāng)一個(gè)內(nèi)聯(lián)匯編 指令中包含影響eflags寄存器中的條件標(biāo)志(也就是那些Jxx等跳轉(zhuǎn)指令要參考的標(biāo)志位,比如,進(jìn)位標(biāo)志,0標(biāo)志等),那么需要在 Clobber/Modify域中使用"cc"來聲明這一點(diǎn)。這些指令包括adc, div,popfl,btr,bts等等,另外,當(dāng)包含call指令時(shí),由于你不知道你所call的函數(shù)是否會修改條件標(biāo)志,為了穩(wěn)妥起見,最好也使用 "cc"。

    我很少在相關(guān)資料中看到有關(guān)"cc"的確切用法,只有一份文檔提到了它,但還不是i386平臺的,只是說"cc"是處理器平臺 相關(guān)的,并非所有的平臺都支持它,但即使在不支持它的平臺上,使用它也不會造成編譯錯(cuò)誤。我做了一些實(shí)驗(yàn),但發(fā)現(xiàn)使用"cc"和不使用"cc"所生成的代 碼沒有任何不同。但Linux 2.4的相關(guān)代碼中用到了它。如果誰知道在i386平臺上"cc"的細(xì)節(jié),請和我聯(lián)系。

    另外,還可以在 Clobber/Modify域指定數(shù)字0到9,以聲明第n個(gè)Input/Output操作表達(dá)式所使用的寄存器發(fā)生了變化,但正如我們在前面所提到的, 如果你為某個(gè)Input/Output操作表達(dá)式指定了寄存器,或使用"g","r"等約束讓GCC為其選擇寄存器,GCC已經(jīng)知道哪個(gè)寄存器內(nèi)容發(fā)生了 變化,所以這么做沒有什么意義;我也作了相關(guān)的試驗(yàn),沒有發(fā)現(xiàn)使用它會對GCC生成的匯編代碼有任何影響,至少在i386平臺上是這樣。Linux 2.4的所有i386平臺相關(guān)內(nèi)聯(lián)匯編代碼中都沒有使用這一點(diǎn),但S390平臺相關(guān)代碼中有用到,但由于我對S390匯編沒有任何概念,所以,也不知道這么做的意義何在。

    posted on 2012-05-01 12:35 so true 閱讀(9968) 評論(1)  編輯  收藏 所屬分類: Linux

    評論

    # re: __asm__ __volatile__ GCC的內(nèi)嵌匯編語法  回復(fù)  更多評論   

    謝謝樓主,樓主真的寫的很詳細(xì),買的書上的我都沒看明白,看了這篇文章,感覺清晰了好多,樓主有沒有考慮出書嘞,到時(shí)我肯定買本。。。
    2014-08-27 09:24 | Bug
    主站蜘蛛池模板: 久久爰www免费人成| 两个人看www免费视频| 午夜性色一区二区三区免费不卡视频| 国产成A人亚洲精V品无码性色 | 亚洲色欲色欲www| 99国产精品永久免费视频| 91亚洲精品自在在线观看| 波多野结衣免费在线| 色噜噜亚洲男人的天堂| 好吊妞在线成人免费| 看亚洲a级一级毛片| 久久99亚洲综合精品首页| baoyu777永久免费视频| 亚洲黄网站wwwwww| 成年性午夜免费视频网站不卡| 亚洲精品无码久久久久秋霞| 亚洲AV无码一区二区三区国产| 亚洲国产免费综合| 日韩亚洲人成在线综合日本| 91嫩草免费国产永久入口| 亚洲中文字幕AV在天堂| 免费v片在线观看品善网| 国产日韩一区二区三免费高清| 久久精品亚洲中文字幕无码麻豆| 午夜宅男在线永久免费观看网| 国产AV日韩A∨亚洲AV电影| 亚洲乱码国产一区三区| 无码国产精品一区二区免费式影视| 亚洲欧美第一成人网站7777| 亚洲日本中文字幕天堂网| 99re6热视频精品免费观看| 中文字幕亚洲精品无码| 国产亚洲精久久久久久无码77777 国产亚洲精品成人AA片新蒲金 | 亚洲国产精品无码AAA片| 国产羞羞的视频在线观看免费| 亚洲大片免费观看| 亚洲国产成人a精品不卡在线| 久久久久国产精品免费看| 亚洲中文字幕精品久久| 亚洲自偷自偷在线制服| 在线天堂免费观看.WWW|