汇编技术内幕(2)

发布者:大橙子5511最新更新时间:2015-12-22 来源: eefocus关键字:汇编技术  内幕 手机看文章 扫描二维码
随时随地手机看文章
问题:为什么用EAX寄存器保存函数返回值?

    实际上IA32并没有规定用哪个寄存器来保存返回值。但如果反汇编Solaris/Linux的二进制文件,就会发现,都用EAX保存函数返回值。这不是偶然现象,是操作系统的ABI(Application Binary Interface)来决定的。Solaris/Linux操作系统的ABI就是Sytem V ABI。


    概念:SFP (Stack Frame Pointer) 栈框架指针
    正确理解SFP必须了解:
    IA32 的栈的概念
    CPU 中32位寄存器ESP/EBP的作用
    PUSH/POP 指令是如何影响栈的
    CALL/RET/LEAVE 等指令是如何影响栈的


    如我们所知:
    1)IA32的栈是用来存放临时数据,而且是LIFO,即后进先出的。栈的增长方向是从高地址向低地址增长,按字节为单位编址。
    2) EBP是栈基址的指针,永远指向栈底(高地址),ESP是栈指针,永远指向栈顶(低地址)。
    3) PUSH一个long型数据时,以字节为单位将数据压入栈,从高到低按字节依次将数据存入ESP-1、ESP-2、ESP-3、ESP-4的地址单元。
    4) POP一个long型数据,过程与PUSH相反,依次将ESP-4、ESP-3、ESP-2、ESP-1从栈内弹出,放入一个32位寄存器。
    5) CALL指令用来调用一个函数或过程,此时,下一条指令地址会被压入堆栈,以备返回时能恢复执行下条指令。
    6) RET指令用来从一个函数或过程返回,之前CALL保存的下条指令地址会从栈内弹出到EIP寄存器中,程序转到CALL之前下条指令处执行
    7) ENTER是建立当前函数的栈框架,即相当于以下两条指令:
        pushl   %ebp
        movl    %esp,%ebp
    8) LEAVE是释放当前函数或者过程的栈框架,即相当于以下两条指令:
        movl ebp esp
        popl  ebp


    如果反汇编一个函数,很多时候会在函数进入和返回处,发现有类似如下形式的汇编语句:
              pushl   %ebp            ; ebp寄存器内容压栈,即保存main函数的上级调用函数的栈基地址
        movl    %esp,%ebp       ; esp值赋给ebp,设置 main函数的栈基址
        ...........             ; 以上两条指令相当于 enter 0,0
        ...........
        leave                   ; 将ebp值赋给esp,pop先前栈内的上级函数栈的基地址给ebp,恢复原栈基址
        ret                     ; main函数返回,回到上级调用
    这些语句就是用来创建和释放一个函数或者过程的栈框架的。
    原来编译器会自动在函数入口和出口处插入创建和释放栈框架的语句。


    函数被调用时:
    1) EIP/EBP成为新函数栈的边界
    函数被调用时,返回时的EIP首先被压入堆栈;创建栈框架时,上级函数栈的EBP被压入堆栈,与EIP一道行成新函数栈框架的边界
    2) EBP成为栈框架指针SFP,用来指示新函数栈的边界
    栈框架建立后,EBP指向的栈的内容就是上一级函数栈的EBP,可以想象,通过EBP就可以把层层调用函数的栈都回朔遍历一遍,调试器就是利用这个特性实现 backtrace功能的
    3) ESP总是作为栈指针指向栈顶,用来分配栈空间
    栈分配空间给函数局部变量时的语句通常就是给ESP减去一个常数值,例如,分配一个整型数据就是 ESP-4
    4) 函数的参数传递和局部变量访问可以通过SFP即EBP来实现
   由于栈框架指针永远指向当前函数的栈基地址,参数和局部变量访问通常为如下形式:
        +8+xx(%ebp)         ; 函数入口参数的的访问
        -xx(%ebp)           ; 函数局部变量访问


 假如函数A调用函数B,函数B调用函数C ,则函数栈框架及调用关系如下图所示:
    +-------------------------+----> 高地址
    | EIP (上级函数返回地址)    |
    +-------------------------+
 +-->   | EBP (上级函数的EBP)      | --+ <------当前函数A的EBP (即SFP框架指针)
  +-------------------------+   +-->偏移量A
  | Local Variables          |
  | ..........              | --+  <------ESP指向函数A新分配的局部变量,局部变量可以通过A的ebp-偏移量A访问
 | f  +-------------------------+
 | r  | Arg n(函数B的第n个参数)   |
 | a  +-------------------------+
 | m  | Arg .(函数B的第.个参数)   |
 | e  +-------------------------+
  | Arg 1(函数B的第1个参数)   |
 | o  +-------------------------+
 | f  | Arg 0(函数B的第0个参数)   | --+ <------ B函数的参数可以由B的ebp+偏移量B访问
  +-------------------------+   +--> 偏移量B
 | A  | EIP (A函数的返回地址)      |
  +-------------------------+ --+
 +---  | EBP (A函数的EBP)         |<--+ <------ 当前函数B的EBP (即SFP框架指针)
    +-------------------------+   |
    | Local Variables          |
    | ..........               | <------ ESP指向函数B新分配的局部变量
    +-------------------------+   |
    | Arg n(函数C的第n个参数)    |
    +-------------------------+   |
    | Arg .(函数C的第.个参数)    |
    +-------------------------+   +--> frame of B
    | Arg 1(函数C的第1个参数)    |
    +-------------------------+   |
    | Arg 0(函数C的第0个参数)    |
    +-------------------------+   |
    | EIP (B函数的返回地址)      |
    +-------------------------+   |
 +-->   | EBP (B函数的EBP)         | --+ <------ 当前函数C的EBP (即SFP框架指针)
      +-------------------------+
  | Local Variables         |
  | ..........              | <------ ESP指向函数C新分配的局部变量
  +-------------------------+----> 低地址
frame of C
 
  图 1-1
      
    再分析test1反汇编结果中剩余部分语句的含义:
       
    # mdb test1
    Loading modules: [ libc.so.1 ]
    > main::dis                        ; 反汇编main函数
    main:          pushl   %ebp                           
    main+1:        movl    %esp,%ebp        ; 创建Stack Frame(栈框架)
    main+3:       subl    $8,%esp       ; 通过ESP-8来分配8字节堆栈空间
    main+6:       andl    $0xf0,%esp    ; 使栈地址16字节对齐
    main+9:       movl    $0,%eax       ; 无意义
    main+0xe:     subl    %eax,%esp     ; 无意义
    main+0x10:     movl    $0,%eax          ; 设置main函数返回值
    main+0x15:     leave                    ; 撤销Stack Frame(栈框架)
    main+0x16:     ret                      ; main 函数返回
    >
    以下两句似乎是没有意义的,果真是这样吗?
        movl    $0,%eax
        subl     %eax,%esp
    用gcc的O2级优化来重新编译test1.c:
    # gcc -O2 test1.c -o test1
    # mdb test1
    > main::dis
    main:         pushl   %ebp
    main+1:       movl    %esp,%ebp
    main+3:       subl    $8,%esp
    main+6:       andl    $0xf0,%esp
    main+9:       xorl    %eax,%eax      ; 设置main返回值,使用xorl异或指令来使eax为0
    main+0xb:     leave
    main+0xc:     ret
    >
    新的反汇编结果比最初的结果要简洁一些,果然之前被认为无用的语句被优化掉了,进一步验证了之前的猜测。
    提示:编译器产生的某些语句可能在程序实际语义上没有用处,可以用优化选项去掉这些语句。


    问题:为什么用xorl来设置eax的值?
    注意到优化后的代码中,eax返回值的设置由 movl $0,%eax 变为 xorl %eax,%eax ,这是因为IA32指令中,xorl比movl有更高的运行速度。


    概念:Stack aligned 栈对齐
    那么,以下语句到底是和作用呢?
        subl    $8,%esp
       andl    $0xf0,%esp     ; 通过andl使低4位为0,保证栈地址16字节对齐
      
    表面来看,这条语句最直接的后果是使ESP的地址后4位为0,即16字节对齐,那么为什么这么做呢?
    原来,IA32 系列CPU的一些指令分别在4、8、16字节对齐时会有更快的运行速度,因此gcc编译器为提高生成代码在IA32上的运行速度,默认对产生的代码进行16字节对齐
    andl $0xf0,%esp 的意义很明显,那么 subl $8,%esp 呢,是必须的吗?
    这里假设在进入main函数之前,栈是16字节对齐的话,那么,进入main函数后,EIP和EBP被压入堆栈后,栈地址最末4位二进制位必定是1000,esp -8则恰好使后4位地址二进制位为0000。看来,这也是为保证栈16字节对齐的。
    如果查一下gcc的手册,就会发现关于栈对齐的参数设置:
    -mpreferred-stack-boundary=n    ; 希望栈按照2的n次的字节边界对齐, n的取值范围是2-12
    默认情况下,n是等于4的,也就是说,默认情况下,gcc是16字节对齐,以适应IA32大多数指令的要求。
    让我们利用-mpreferred-stack-boundary=2来去除栈对齐指令:
       # gcc -mpreferred-stack-boundary=2 test1.c -o test1
           > main::dis
    main:       pushl   %ebp
    main+1:     movl    %esp,%ebp
    main+3:     movl    $0,%eax
    main+8:     leave
    main+9:     ret
    >
    可以看到,栈对齐指令没有了,因为,IA32的栈本身就是4字节对齐的,不需要用额外指令进行对齐。
    那么,栈框架指针SFP是不是必须的呢?
    # gcc -mpreferred-stack-boundary=2 -fomit-frame-pointer test1.c -o test
    > main::dis
    main:       movl    $0,%eax
    main+5:     ret
    >
    由此可知,-fomit-frame-pointer 可以去除SFP。
          问题:去除SFP后有什么缺点呢?
          1)增加调式难度
        由于SFP在调试器backtrace的指令中被使用到,因此没有SFP该调试指令就无法使用。
    2)降低汇编代码可读性
        函数参数和局部变量的访问,在没有ebp的情况下,都只能通过+xx(esp)的方式访问,而很难区分两种方式,降低了程序的可读性。  

    
    问题:去除SFP有什么优点呢?      
    1)节省栈空间
    2)减少建立和撤销栈框架的指令后,简化了代码
    3)使ebp空闲出来,使之作为通用寄存器使用,增加通用寄存器的数量
    4)以上3点使得程序运行速度更快


    概念:Calling Convention  调用约定和 ABI (Application Binary Interface) 应用程序二进制接口        
    函数如何找到它的参数?
    函数如何返回结果?
    函数在哪里存放局部变量?
    那一个硬件寄存器是起始空间?
    那一个硬件寄存器必须预先保留?
    Calling Convention  调用约定对以上问题作出了规定。Calling Convention也是ABI的一部分。
    因此,遵守相同ABI规范的操作系统,使其相互间实现二进制代码的互操作成为了可能。例如:由于Solaris、Linux都遵守System V的ABI,Solaris 10就提供了直接运行Linux二进制程序的功能。

关键字:汇编技术  内幕 引用地址:汇编技术内幕(2)

上一篇:汇编技术内幕(1)
下一篇:汇编技术内幕(3)

推荐阅读最新更新时间:2024-03-16 14:41

三星9名高管涉嫌内幕交易遭监管部门调查
    据悉,韩国监管部门怀疑这些高管在三星旗下两企业第一毛织公司(Cheil Industries)和三星物产(Samsung C&T)合并之前,利用内部消息购买了大量第一毛织公司股票。     新浪科技讯 北京时间12月4日晚间消息,《华尔街日报》今日报道称,三星集团9名高管因涉嫌“内幕交易”而遭到韩国监管部门的调查。     据悉,韩国监管部门怀疑这些高管在三星旗下两企业第一毛织公司(Cheil Industries)和三星物产(Samsung C&T)合并之前,利用内部消息购买了大量第一毛织公司股票。     韩国金融服务委员会(Financial Services Commission,以下简称“F
[手机便携]
解析超高分辨率的内幕
  分辨率的竞争还没有停止,虽然 4K 的显示器已经足够细腻,并且超出了目前的硬件配套水平,但是行业内还是在开发 8K 显示器。日本还要在未来试播 8K 分辨率的节目,这样的道路真的是正确的吗?其实从显示技术的更迭来看,一味的在分辨率上做文章是没有太多的必要的,特别是当前的分辨率发展水平已经满足甚至超出大多数人的需求的时候。下面就随手机便携小编一起来了解一下相关内容吧。 4K之路还有多远?解析超高分辨率的内幕   现在高分显示器很多,很多人在选择显示器的时候,也锁定了高分显示器。不过对于很多小白用户来说,对于高分显示器的了解还不够深。首先我们得说一下高分显示器的使用前提。购买高分显示器只是一个环节,用户的PC主机性能需要支
[手机便携]
最全法律证据首次曝光, 有关贾跃亭恒大决裂的所有内幕
为了让Faraday&Future(下称“FF”)成为“第二个特斯拉”,2018年7月26日,FF创始人贾跃亭妥协了。 他正式辞去在Smart King、FF,以及旗下所有子公司的董事职位,仅留任CEO,后将自己价值14.8亿美元的FF股份,转让到一位朋友名下。         此前的7月18日,贾跃亭与恒大控制下的时颖有限公司等各方达成《修改补充协议》(《Amendment and Consent》)——         恒大承诺提前支付5亿美元,用于推进样车FF91在2018年12月量产、2019年上市的计划,付款条件之一即贾跃亭“不再是FF控股公司的实际控制人”。         贾跃亭的辞职和转股,均是
[手机便携]
外媒揭美入侵华为网络内幕:代号“击杀巨人”
    :2014年3月26日 06:32    资料图片:2013年7月12日,在俄罗斯首都莫斯科,一名俄罗斯新闻工作者打开网页浏览斯诺登最新讯息。新华社记者姜克红摄   参考消息网3月25日报道 新加坡媒体称,美国“棱镜门”揭露者斯诺登日前再爆猛料,揭露美国国家安全局(NSA)自2007年以来对中国境内目标进行网络监控活动,包括中国政府部门、军事单位、银行和通信设备公司。   据新加坡《联合早报》网站3月25日,斯诺登的上述爆料揭开了一直以来中国通信公司在美国投资受阻的内幕——美国政府不仅在台前对中国公司设置政治壁垒,且在幕后一直试图寻找企业系统“后门”,并对其实施黑客式监控。   中国外交部发言人洪磊24日对此事件发表评
[手机便携]
小广播
添点儿料...
无论热点新闻、行业分析、技术干货……
设计资源 培训 开发板 精华推荐

最新单片机文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved