找回密碼
 立即注冊

QQ登錄

只需一步,快速開始

搜索
查看: 2330|回復: 0
收起左側

X86匯編語言學習手記

[復制鏈接]
ID:107189 發(fā)表于 2016-3-6 00:15 | 顯示全部樓層 |閱讀模式
最近發(fā)現(xiàn)了幾個錯誤,更新一下,需要的話,我的blog有參考:

抱歉,文中的一些鏈接參考文檔在轉帖中丟失,另外,中間的棧的插圖也亂了,文章排版也有些混亂,如果需要參考可以看我blog上的原文:



版權所有: 轉載時請務必以超鏈接形式標明文章原始出處、作者信息及本聲明


這是作者在學習X86匯編過程中的學習筆記,難免有錯誤和疏漏之處,歡迎指正。
作者將隨時修改錯誤并將新的版本發(fā)布在自己的Blog站點上。
嚴格說來,本篇文檔更側重于C語言和C編譯器方面的知識,如果涉及到具體匯編語言
的內容,可以參考相關文檔。


1. 編譯環(huán)境

   OS: Solaris 9 X86
   Compiler: gcc 3.3.2
   Linker: Solaris Link Editors 5.x
   Debug Tool: mdb
   Editor: vi

   注:關于編譯環(huán)境的安裝和設置,可以參考文章:Solaris 上的開發(fā)環(huán)境安裝及設置。
       mdb是Solaris提供的kernel debug工具,這里用它做反匯編和匯編語言調試工具。
       如果在Linux平臺可以用gdb進行反匯編和調試。

2. 最簡C代碼分析

    為簡化問題,來分析一下最簡的c代碼生成的匯編代碼:
    # vi test1.c
      
    int main()
    {
        return 0;
    }   
     
    編譯該程序,產(chǎn)生二進制文件:
    # gcc test1.c -o test1
    # file test1   
    test1: ELF 32-bit LSB executable 80386 Version 1, dynamically linked, not stripped  

    test1是一個ELF格式32位小端(Little Endian)的可執(zhí)行文件,動態(tài)鏈接并且符號表沒有去除。
    這正是Unix/Linux平臺典型的可執(zhí)行文件格式。
    用mdb反匯編可以觀察生成的匯編代碼:

    # mdb test1
    Loading modules: [ libc.so.1 ]
    >; main::dis                       ; 反匯編main函數(shù),mdb的命令一般格式為  <地址>;::dis
    main:          pushl   %ebp       ; ebp寄存器內容壓棧,即保存main函數(shù)的上級調用函數(shù)的;刂
    main+1:        movl    %esp,%ebp  ; esp值賦給ebp,設置main函數(shù)的;
    main+3:          subl    $8,%esp
    main+6:          andl    $0xf0,%esp
    main+9:          movl    $0,%eax
    main+0xe:        subl    %eax,%esp
    main+0x10:     movl    $0,%eax    ; 設置函數(shù)返回值0
    main+0x15:     leave              ; 將ebp值賦給esp,pop先前棧內的上級函數(shù)棧的基地址給ebp,恢復原;
    main+0x16:     ret                ; main函數(shù)返回,回到上級調用
    >;  

    注:這里得到的匯編語言語法格式與Intel的手冊有很大不同,Unix/Linux采用AT&T匯編格式作為匯編語言的語法格式
         如果想了解AT&T匯編可以參考文章:Linux AT&T 匯編語言開發(fā)指南  

    問題:誰調用了 main函數(shù)?
      
     在C語言的層面來看,main函數(shù)是一個程序的起始入口點,而實際上,ELF可執(zhí)行文件的入口點并不是main而是_start。
     mdb也可以反匯編_start:
        
    >; _start::dis                       ;從_start 的地址開始反匯編
    _start:              pushl   $0
    _start+2:            pushl   $0
    _start+4:            movl    %esp,%ebp
    _start+6:            pushl   %edx
    _start+7:            movl    $0x80504b0,%eax
    _start+0xc:          testl   %eax,%eax
    _start+0xe:          je      +0xf            <_start+0x1d>;
    _start+0x10:         pushl   $0x80504b0
    _start+0x15:         call    -0x75           <atexit>;
    _start+0x1a:         addl    $4,%esp
    _start+0x1d:         movl    $0x8060710,%eax
    _start+0x22:         testl   %eax,%eax
    _start+0x24:         je      +7              <_start+0x2b>;
    _start+0x26:         call    -0x86           <atexit>;
    _start+0x2b:         pushl   $0x80506cd
    _start+0x30:         call    -0x90           <atexit>;
    _start+0x35:         movl    +8(%ebp),%eax
    _start+0x38:         leal    +0x10(%ebp,%eax,4),%edx
    _start+0x3c:         movl    %edx,0x8060804
    _start+0x42:         andl    $0xf0,%esp
    _start+0x45:         subl    $4,%esp
    _start+0x48:         pushl   %edx
    _start+0x49:         leal    +0xc(%ebp),%edx
    _start+0x4c:         pushl   %edx
    _start+0x4d:         pushl   %eax
    _start+0x4e:         call    +0x152          <_init>;
    _start+0x53:         call    -0xa3           <__fpstart>;
    _start+0x58:        call    +0xfb        <main>;              ;在這里調用了main函數(shù)
    _start+0x5d:         addl    $0xc,%esp
    _start+0x60:         pushl   %eax
    _start+0x61:         call    -0xa1           <exit>;
    _start+0x66:         pushl   $0
    _start+0x68:         movl    $1,%eax
    _start+0x6d:         lcall   $7,$0
    _start+0x74:         hlt
    >;  

    問題:為什么用EAX寄存器保存函數(shù)返回值?
    實際上IA32并沒有規(guī)定用哪個寄存器來保存返回值。但如果反匯編Solaris/Linux的二進制文件,就會發(fā)現(xiàn),都用EAX保存函數(shù)返回值。
    這不是偶然現(xiàn)象,是操作系統(tǒng)的ABI(Application Binary Interface)來決定的。
    Solaris/Linux操作系統(tǒng)的ABI就是Sytem V ABI。


    概念:SFP (Stack Frame Pointer) ?蚣苤羔  

    正確理解SFP必須了解:
        IA32 的棧的概念
        CPU 中32位寄存器ESP/EBP的作用
        PUSH/POP 指令是如何影響棧的
        CALL/RET/LEAVE 等指令是如何影響棧的

    如我們所知:
    1)IA32的棧是用來存放臨時數(shù)據(jù),而且是LIFO,即后進先出的。棧的增長方向是從高地址向低地址增長,按字節(jié)為單位編址。
    2) EBP是;返闹羔槪肋h指向棧底(高地址),ESP是棧指針,永遠指向棧頂(低地址)。
    3) PUSH一個long型數(shù)據(jù)時,以字節(jié)為單位將數(shù)據(jù)壓入棧,從高到低按字節(jié)依次將數(shù)據(jù)存入ESP-1、ESP-2、ESP-3、ESP-4的地址單元。
    4) POP一個long型數(shù)據(jù),過程與PUSH相反,依次將ESP-4、ESP-3、ESP-2、ESP-1從棧內彈出,放入一個32位寄存器。
    5) CALL指令用來調用一個函數(shù)或過程,此時,下一條指令地址會被壓入堆棧,以備返回時能恢復執(zhí)行下條指令。
    6) RET指令用來從一個函數(shù)或過程返回,之前CALL保存的下條指令地址會從棧內彈出到EIP寄存器中,程序轉到CALL之前下條指令處執(zhí)行
    7) ENTER是建立當前函數(shù)的?蚣,即相當于以下兩條指令:
        pushl   %ebp
        movl    %esp,%ebp
    8) LEAVE是釋放當前函數(shù)或者過程的棧框架,即相當于以下兩條指令:
        movl ebp esp
        popl  ebp

    如果反匯編一個函數(shù),很多時候會在函數(shù)進入和返回處,發(fā)現(xiàn)有類似如下形式的匯編語句:  
         
        pushl   %ebp            ; ebp寄存器內容壓棧,即保存main函數(shù)的上級調用函數(shù)的;刂
        movl    %esp,%ebp       ; esp值賦給ebp,設置 main函數(shù)的;
        ...........             ; 以上兩條指令相當于 enter 0,0
        ...........
        leave                   ; 將ebp值賦給esp,pop先前棧內的上級函數(shù)棧的基地址給ebp,恢復原棧基址
        ret                     ; main函數(shù)返回,回到上級調用

    這些語句就是用來創(chuàng)建和釋放一個函數(shù)或者過程的棧框架的。
    原來編譯器會自動在函數(shù)入口和出口處插入創(chuàng)建和釋放?蚣艿恼Z句。
    函數(shù)被調用時:
    1) EIP/EBP成為新函數(shù)棧的邊界
    函數(shù)被調用時,返回時的EIP首先被壓入堆棧;創(chuàng)建?蚣軙r,上級函數(shù)棧的EBP被壓入堆棧,與EIP一道行成新函數(shù)?蚣艿倪吔
    2) EBP成為?蚣苤羔楽FP,用來指示新函數(shù)棧的邊界
    棧框架建立后,EBP指向的棧的內容就是上一級函數(shù)棧的EBP,可以想象,通過EBP就可以把層層調用函數(shù)的棧都回朔遍歷一遍,調試器就是利用這個特性實現(xiàn) backtrace功能的
    3) ESP總是作為棧指針指向棧頂,用來分配?臻g
    棧分配空間給函數(shù)局部變量時的語句通常就是給ESP減去一個常數(shù)值,例如,分配一個整型數(shù)據(jù)就是 ESP-4
    4) 函數(shù)的參數(shù)傳遞和局部變量訪問可以通過SFP即EBP來實現(xiàn)  
    由于?蚣苤羔樣肋h指向當前函數(shù)的;刂,參數(shù)和局部變量訪問通常為如下形式:
        +8+xx(%ebp)         ; 函數(shù)入口參數(shù)的的訪問
        -xx(%ebp)           ; 函數(shù)局部變量訪問
            
    假如函數(shù)A調用函數(shù)B,函數(shù)B調用函數(shù)C ,則函數(shù)?蚣芗罢{用關系如下圖所示:

下圖有點亂,因此刪去部分內容,要看原圖可參考我的blog
+----------------------------+---->; 高地址
| EIP (上級函數(shù)返回地址)  |     
+----------------------------+   
| EBP (上級函數(shù)的EBP)     |  
+----------------------------+
| Local Variables            |   
| ..........                          |  
+-----------------------------+   
| Arg n(函數(shù)B的第n個參數(shù)) |   
+-----------------------------+
| Arg .(函數(shù)B的第.個參數(shù))   |  
+-----------------------------+  
| Arg 1(函數(shù)B的第1個參數(shù)) |  
+-----------------------------+   
| Arg 0(函數(shù)B的第0個參數(shù)) |  
+-----------------------------+  
EIP (A函數(shù)的返回地址)      |
+-----------------------------+  
| EBP (A函數(shù)的EBP)          |
+-----------------------------+   
| Local Variables             |   
| ..........                           |   
+-----------------------------+  
| Arg n(函數(shù)C的第n個參數(shù)) |   
+-----------------------------+   
| Arg .(函數(shù)C的第.個參數(shù))   |   
+-----------------------------+   
| Arg 1(函數(shù)C的第1個參數(shù)) |  
+-----------------------------+   
| Arg 0(函數(shù)C的第0個參數(shù)) |   
+-----------------------------+   
| EIP (B函數(shù)的返回地址)     |  
+-----------------------------+  
| EBP (B函數(shù)的EBP)          |  
+-----------------------------+
| Local Variables             |
| ..........                           |  
+-----------------------------+--->; 低地址

   圖 1-1  
        
    再分析test1反匯編結果中剩余部分語句的含義:
         
    # mdb test1
    Loading modules: [ libc.so.1 ]
    >; main::dis                        ; 反匯編main函數(shù)
    main:          pushl   %ebp                             
    main+1:        movl    %esp,%ebp        ; 創(chuàng)建Stack Frame(?蚣)
    main+3:       subl    $8,%esp       ; 通過ESP-8來分配8字節(jié)堆棧空間
    main+6:       andl    $0xf0,%esp    ; 使棧地址16字節(jié)對齊
    main+9:       movl    $0,%eax       ; 無意義
    main+0xe:     subl    %eax,%esp     ; 無意義
    main+0x10:     movl    $0,%eax          ; 設置main函數(shù)返回值
    main+0x15:     leave                    ; 撤銷Stack Frame(?蚣)
    main+0x16:     ret                      ; main 函數(shù)返回
    >;

    以下兩句似乎是沒有意義的,果真是這樣嗎?
        movl    $0,%eax  
        subl     %eax,%esp
        
    用gcc的O2級優(yōu)化來重新編譯test1.c:
    # gcc -O2 test1.c -o test1
    # mdb test1
    >; main::dis
    main:         pushl   %ebp
    main+1:       movl    %esp,%ebp
    main+3:       subl    $8,%esp
    main+6:       andl    $0xf0,%esp
    main+9:       xorl    %eax,%eax      ; 設置main返回值,使用xorl異或指令來使eax為0
    main+0xb:     leave
    main+0xc:     ret
    >;  
    新的反匯編結果比最初的結果要簡潔一些,果然之前被認為無用的語句被優(yōu)化掉了,進一步驗證了之前的猜測。
    提示:編譯器產(chǎn)生的某些語句可能在程序實際語義上沒有用處,可以用優(yōu)化選項去掉這些語句。

    問題:為什么用xorl來設置eax的值?
    注意到優(yōu)化后的代碼中,eax返回值的設置由 movl $0,%eax 變?yōu)?xorl %eax,%eax ,這是因為IA32指令中,xorl比movl有更高的運行速度。

    概念:Stack aligned 棧對齊
    那么,以下語句到底是和作用呢?
        subl    $8,%esp
       andl    $0xf0,%esp     ; 通過andl使低4位為0,保證棧地址16字節(jié)對齊
        
    表面來看,這條語句最直接的后果是使ESP的地址后4位為0,即16字節(jié)對齊,那么為什么這么做呢?
    原來,IA32 系列CPU的一些指令分別在4、8、16字節(jié)對齊時會有更快的運行速度,因此gcc編譯器為提高生成代碼在IA32上的運行速度,默認對產(chǎn)生的代碼進行16字節(jié)對齊

        andl $0xf0,%esp 的意義很明顯,那么 subl $8,%esp 呢,是必須的嗎?
    這里假設在進入main函數(shù)之前,棧是16字節(jié)對齊的話,那么,進入main函數(shù)后,EIP和EBP被壓入堆棧后,棧地址最末4位二進制位必定是 1000,esp -8則恰好使后4位地址二進制位為0000?磥,這也是為保證棧16字節(jié)對齊的。

    如果查一下gcc的手冊,就會發(fā)現(xiàn)關于棧對齊的參數(shù)設置:
    -mpreferred-stack-boundary=n    ; 希望棧按照2的n次的字節(jié)邊界對齊, n的取值范圍是2-12

    默認情況下,n是等于4的,也就是說,默認情況下,gcc是16字節(jié)對齊,以適應IA32大多數(shù)指令的要求。

    讓我們利用-mpreferred-stack-boundary=2來去除棧對齊指令:
      
    # gcc -mpreferred-stack-boundary=2 test1.c -o test1
        
    >; main::dis
    main:       pushl   %ebp
    main+1:     movl    %esp,%ebp
    main+3:     movl    $0,%eax
    main+8:     leave
    main+9:     ret
    >;  

    可以看到,棧對齊指令沒有了,因為,IA32的棧本身就是4字節(jié)對齊的,不需要用額外指令進行對齊。
    那么,?蚣苤羔楽FP是不是必須的呢?
    # gcc -mpreferred-stack-boundary=2 -fomit-frame-pointer test1.c -o test
    >; main::dis
    main:       movl    $0,%eax
    main+5:     ret
    >;  

    由此可知,-fomit-frame-pointer 可以去除SFP。
        
    問題:去除SFP后有什么缺點呢?
        
    1)增加調式難度
        由于SFP在調試器backtrace的指令中被使用到,因此沒有SFP該調試指令就無法使用。
    2)降低匯編代碼可讀性
        函數(shù)參數(shù)和局部變量的訪問,在沒有ebp的情況下,都只能通過+xx(esp)的方式訪問,而很難區(qū)分兩種方式,降低了程序的可讀性。
        
    問題:去除SFP有什么優(yōu)點呢?
        
    1)節(jié)省?臻g
    2)減少建立和撤銷棧框架的指令后,簡化了代碼
    3)使ebp空閑出來,使之作為通用寄存器使用,增加通用寄存器的數(shù)量
    4)以上3點使得程序運行速度更快

    概念:Calling Convention  調用約定和 ABI (Application Binary Interface) 應用程序二進制接口
         
        函數(shù)如何找到它的參數(shù)?
        函數(shù)如何返回結果?
        函數(shù)在哪里存放局部變量?
        那一個硬件寄存器是起始空間?
        那一個硬件寄存器必須預先保留?

    Calling Convention  調用約定對以上問題作出了規(guī)定。Calling Convention也是ABI的一部分。
    因此,遵守相同ABI規(guī)范的操作系統(tǒng),使其相互間實現(xiàn)二進制代碼的互操作成為了可能。
    例如:由于Solaris、Linux都遵守System V的ABI,Solaris 10就提供了直接運行Linux二進制程序的功能。
    詳見文章:關注: Solaris 10的10大新變化  
              
3. 小結
    本文通過最簡的C程序,引入以下概念:
        SFP ?蚣苤羔
        Stack aligned 棧對齊
        Calling Convention  調用約定 和 ABI (Application Binary Interface) 應用程序二進制接口
    今后,將通過進一步的實驗,來深入了解這些概念。通過掌握這些概念,使在匯編級調試程序產(chǎn)生的core dump、掌握C語言高級調試技巧成為了可能。
回復

使用道具 舉報

您需要登錄后才可以回帖 登錄 | 立即注冊

本版積分規(guī)則

小黑屋|51黑電子論壇 |51黑電子論壇6群 QQ 管理員QQ:125739409;技術交流QQ群281945664

Powered by 單片機教程網(wǎng)

快速回復 返回頂部 返回列表