ARM处理器Linux下浮点运算单元运用

发布者:心愿实现最新更新时间:2016-03-31 来源: eefocus关键字:ARM  处理器  Linux  浮点运算单元 手机看文章 扫描二维码
随时随地手机看文章
1). 浮点运算单元(FPU)简介

Float Point Unit,浮点运算单元是专用于浮点运算的协处理器,在计算领域,例如三角函数以及时域频域变换通常会用到浮点运算。当CPU执行一个需要浮点数运算的程序时,有三种方式可以执行:软件仿真器(浮点运算函数库)、附加浮点运算器和集成浮点运算单元。区别于以往的ARM9处理器,目前基于Cortex构架的ARM处理均集成了浮点运算单元。如Nvidia Tegra 2, Tegra 3和 NXP/Freescale i.MX 6集成了VFPv3浮点运算单元,NXP/Freescale i.MX 7 则集成了VFPv4浮点运算单元。ARM 浮点架构 (VFP) 为半精度、单精度和双精度浮点运算中的浮点操作提供硬件支持。它完全符合 IEEE 754 标准,并提供完全软件库支持,与 NEONTM 多媒体处理功能结合使用时,可增强图像应用程序的性能(如缩放、2D 和 3D 转换、字体生成和数字过滤)。

 

2). 浮点调用约定(Calling Convention)

调用约定由应用二进制接口(Application Binary Interface, ABI)来定义参数是如何在调用过程中传递以及如何获取返回值,对于ARM CPU常用的ABI为EABI,提供了两种互相不兼容的方式来传递浮点数:

调用约定

描述

GCC flag

EABI soft-float

Floats are passed in normal (integer) registers.

-mfloat-abi=soft or -mfloat-abi=softfp

EABI hard-float

Floats are passed in floating point registers (VFP).

-mfloat-abi=hard

 

通常交叉编译ToolChain已经配置好所需的ABI而无需在命令行重新设置,并且ToolChain提供的库也已经自动配置为对应的数据格式。

两个二进制文件(如可执行文件和C库文件)使用不同的调用约定,相互之间是不兼容的。所有的程序和库必须遵循同一个调用约定进行编译,要么软浮点,要么硬浮点。如果你试图在一个基于硬浮点编译的平台上运行一个基于软浮点的程序时,会出现 " No such file or directory " 错误,尽管这这个文件是存在的并且可以执行。

另外,硬浮点调用约定需要使用浮点运算单元(FPU)的寄存器,因此在不带有浮点运算单元寄存器的处理器上则无法实现。

下面列出Toradex Colibri Tegra ARM 计算机模块 BSP 上所采用的调用约定

BSP Version

Calling Convention

BSP V1.x

EABI soft-float

BSP V2.x and later

EABI hard-float

 

3). 协处理器/硬件引擎

如本文开篇所述,目前基于Cortex架构的ARM处理器都内置了浮点运算单元(FPU)来加速浮点数据操作,通常浮点运算单元会添加额外的指令到现有的指令集中。于此相关的NEON指令集添加了单指令多数据操作(single instruction act on multiple data ,SIMD),它实现的是NEON 媒体处理器引擎,提供了基于VFPv3指令集的浮点运算单元功能。

更多介绍请参考:

- en.wikipedia.org/wiki/ARM_architecture

- wiki.debian.org/ArmHardFloatPort/VfpComparison

./ Toradex Colibri产品系列所提供的协处理器/硬件引擎

Module/CPU family

VFP Unit

NEON unit

Colibri PXA(1)

-

-

Colibri/Apalis iMX6

VFPv3

Yes

Colibri T20

VFPv3-D16

-

Colibri/Apalis T30

VFPv3

Yes

Colibri VFxx

VFPv3

Yes

  1. 注:PXA 系列核心板没有硬件浮点运算单元,但是GCC编译器提供了经过优化的基于Intel Integer SIMD extension(iWMMXt)的软浮点运算仿真功能。

 

4). 编译器选项

相关介绍请见如下,下面同样以Toradex产品为例:

gcc.gnu.org/onlinedocs/gcc-4.7.3/gcc/ARM-Options.html#ARM-Options

./ Toradex Colibri Tegra 系列 BSP 编译器选项

BSP Version

GCC flag

BSP V1.x

-march=armv7-a -mfloat-abi=softfp -mfpu=vfpv3-d16

BSP V2.x and later

-march=armv7-a -mfloat-abi=hard -mfpu=vfpv3-d16

 

./ Toradex Colibri PXA编译器选项

使用软浮点调用约定编译器,同时编译器选项不能包含FPU相关,产生的代码中不包含由FPU来执行的指令,而是依赖于CPU整数指令集基于相关库进行运算。

----------------------------------------------------------------------------------------

-march=armv5te -mtune=xscale -O3

----------------------------------------------------------------------------------------

./ Toradex Colibri T20编译器选项

产生的代码兼容于含NEON 协处理器的CPU 。取决于在mfloat-abi 选项所配置的调用约定为"softfp" 还是"hard"

----------------------------------------------------------------------------------------

-march=armv7-a -mfloat-abi=xxx -mfpu=vfpv3-d16 -mtune=cortex-a9 -O3

----------------------------------------------------------------------------------------

./ Toradex Colibri/Apalis i.MX6/T30编译器选项

取决于在mfloat-abi选项所配置的调用约定为"softfp" 还是"hard"

----------------------------------------------------------------------------------------

-march=armv7-a -mfloat-abi=xxx -mfpu=neon -mtune=cortex-a9 -O3

----------------------------------------------------------------------------------------

./ Toradex Colibri VFxx编译器选项

取决于在mfloat-abi选项所配置的调用约定为"softfp" 还是"hard",未来可以通过更多的mfpu 选项来优化NEON的实现。

----------------------------------------------------------------------------------------

-march=armv7-a -mfloat-abi=xxx -mfpu=neon -mtune=cortex-a5 -O3

----------------------------------------------------------------------------------------

 

5). 检测一个二进制文件的浮点调用约定

同样以Toradex产品为例,其所发布的Linux Images 所有的object 目标文件都使用ELF,详细介绍请参考:

en.wikipedia.org/wiki/Executable_and_Linkable_Format

首先架构信息(如i686 或者ARM)可以通过" file 'afile' "程序来获取,架构相关属性信息可以通过" readelf –A 'afile' "程序来获取 (原生或者交叉编译ToolChain都可以使用readelf)

如果readelf命令输出信息里面包含"Tag_ABI_VFP_args: VFP registers",则调用约定为硬浮点;如没有,则为软浮点。

./ 以Colibri T20 编译的共享目标文件为例

•使用 VFPv3-D16 指令和寄存器

•不使用 SIMD extensions

•硬调用约定

---------------------------------------------------------------------------------------------------------------------------------------------------

$ file colibri-t20/usr/lib/libcurl.so.5.3.0

colibri-t20/usr/lib/libcurl.so.5.3.0: ELF 32-bit LSB shared object, ARM, version 1 (SYSV), dynamically linked, not stripped

$ readelf -A colibri-t20/usr/lib/libcurl.so.5.3.0

Attribute Section: aeabi

File Attributes

Tag_CPU_name: "7-A"

Tag_CPU_arch: v7

Tag_CPU_arch_profile: Application

Tag_ARM_ISA_use: Yes

Tag_THUMB_ISA_use: Thumb-2

Tag_FP_arch: VFPv3-D16

Tag_ABI_PCS_wchar_t: 4

Tag_ABI_FP_denormal: Needed

Tag_ABI_FP_exceptions: Needed

Tag_ABI_FP_number_model: IEEE 754

Tag_ABI_align_needed: 8-byte

Tag_ABI_align_preserved: 8-byte, except leaf SP

Tag_ABI_enum_size: int

Tag_ABI_HardFP_use: SP and DP

Tag_ABI_VFP_args: VFP registers

Tag_CPU_unaligned_access: v6

---------------------------------------------------------------------------------------------------------------------------------------------------

./ 以NXP/Freescale Vybrid 编译的共享目标文件为例

•使用 VFPv3 指令和寄存器

•使用用 NEON SIMD extensions

•软调用约定

---------------------------------------------------------------------------------------------------------------------------------------------------

$ file twr-vf65gs10/usr/lib/libcurl.so.5.3.0

twr-vf65gs10/usr/lib/libcurl.so.5.3.0: ELF 32-bit LSB shared object, ARM, version 1 (SYSV), dynamically linked, not stripped

$ readelf -A twr-vf65gs10/usr/lib/libcurl.so.5.3.0

Attribute Section: aeabi

File Attributes

Tag_CPU_name: "7-A"

Tag_CPU_arch: v7

Tag_CPU_arch_profile: Application

Tag_ARM_ISA_use: Yes

Tag_THUMB_ISA_use: Thumb-2

Tag_FP_arch: VFPv3

Tag_Advanced_SIMD_arch: NEONv1

Tag_ABI_PCS_wchar_t: 4

Tag_ABI_FP_denormal: Needed

Tag_ABI_FP_exceptions: Needed

Tag_ABI_FP_number_model: IEEE 754

Tag_ABI_align_needed: 8-byte

Tag_ABI_align_preserved: 8-byte, except leaf SP

Tag_ABI_enum_size: int

Tag_ABI_HardFP_use: SP and DP

Tag_CPU_unaligned_access: v6

---------------------------------------------------------------------------------------------------------------------------------------------------

./ 以Colibri PXA 编译的共享目标文件为例

•不使用浮点运算单元

•不使用SIMD extensions

•软调用约定

---------------------------------------------------------------------------------------------------------------------------------------------------

$ file colibri-pxa/usr/lib/libcurl.so.5.3.0

colibri-pxa/usr/lib/libcurl.so.5.3.0: ELF 32-bit LSB shared object, ARM, version 1 (SYSV), dynamically linked, not stripped

$ readelf -A colibri-pxa/usr/lib/libcurl.so.5.3.0

Attribute Section: aeabi

File Attributes

Tag_CPU_name: "5TE"

Tag_CPU_arch: v5TE

Tag_ARM_ISA_use: Yes

Tag_THUMB_ISA_use: Thumb-1

Tag_ABI_PCS_wchar_t: 4

Tag_ABI_FP_denormal: Needed

Tag_ABI_FP_exceptions: Needed

Tag_ABI_FP_number_model: IEEE 754

Tag_ABI_align8_neededU: Yes

Tag_ABI_align8_preserved: Yes, except leaf SP

Tag_ABI_enum_size: int

 

------------------------------------------------------------------------------------------------------------------------------------------------------

关键字:ARM  处理器  Linux  浮点运算单元 引用地址:ARM处理器Linux下浮点运算单元运用

上一篇:ARM处理器的浮点运算单元(FPU)
下一篇:ARM嵌入式Linux设备树简介及应用示例

推荐阅读最新更新时间:2024-03-16 14:48

基于ARM处理器的十回路智能配电监控单元的设计
   O 引言   配电自动化技术正朝着数字化、智能化、网络化、多功能的方向飞速发展。本文以内含ARM7TDMI—STM CPU的微控制器LPC2132芯片作为系统主控制器,针对电力系统数据信号的采集和数据通信,以及电力系统状态监测为研究主题,研究设计出了一种具备智能配电,并可同时监控十个用户回路的终端控制单元,其具备测量各回路中有功功率、无功功率、能量、电压、电流、功率因数等电力参数功能。    1 电力参量的测量原理   对称三相电源通常由三个频率相同、幅值相等和初相角为1200的正弦电压源按一定方式连接而成,三相信号可依次称为A、B、C相,记为uA、uB、uC,它们的瞬时表达式如下:   在交流电路中,
[电源管理]
ARM推出第二代Mali-600图形处理器Mali T624、T628、T678
21ic讯 ARM日前宣布推出第二代ARM® Mali™-T600 图形处理器(GPU)系列产品,将为平板电脑、智能手机和智能电视提供非凡的用户体验。第二代ARM Mali-T600 GPU 全线产品不仅性能提升50%,而且是首次加入全调适纹理压缩技术(Adaptive Scalable Texture Compression,ASTC)的GPU系列产品。ASTC是源自ARM的纹理压缩技术,能显著地优化GPU性能和提升终端设备的电池续航能力,带来“永远连线、持续运作(always-on, always connected)”的体验。这项技术已被业界致力于开放标准发展的重要协会—Khronos™ 集团所采用。 基于Mali Mi
[单片机]
英特尔新Xeon处理器芯片架构大翻新
   英特尔 揭露下半年采用Skylake架构即将推出的新一代 Xeon 处理器,在芯片设计架构将采全新的网格(Mesh)互连架构,以改善现有CPU存取延迟,以及支持更高内存带宽的需求,这也是 英特尔 近年来最大一次的 Xeon 核心架构大翻新。下面就随嵌入式小编一起来了解一下相关内容吧。 英特尔新Xeon处理器芯片架构大翻新    英特尔 采用Skylake架构的新一代 Xeon 处理器,在芯片设计架构上将开始采用全新的网格(Mesh)互连架构设计,来取代传统的环形(Ring)互连设计方式,以改善CPU存取延迟和支持更高内存带宽需求。 英特尔新Xeon处理器芯片架构大翻新   英特尔前不久才预告采用Skylake
[嵌入式]
凌阳携手CEVA开发便携式多媒体处理器
硅产品知识产权 (SIP) 平台解决方案和数字信号处理器 (DSP) 内核授权厂商CEVA公司宣布,凌阳多媒体股份有限公司 (Sunplus mMedia) 已获授权采用CEVA完全可编程的MM2000 便携式多媒体解决方案,为功耗敏感的应用如便携式多媒体播放器 (PMP) 等,开发低成本及高性能的系统级芯片 (SoC)。 凌阳多媒体是为数码相机、手持式游戏机、移动电话和PMP产品开发高集成度高质量IC的领导厂商。这些器件需要高功效解决方案来完成处理器密集型的多标准视频/音频处理任务。CEVA的MM2000解决方案采用单DSP引擎来支持所有视频和音频编解码处理任务,无需额外的加速器或硬件,可大幅降低凌阳多媒体针对最
[嵌入式]
程序状态寄存器和操作指令
在ARM中有个极其重要的寄存器,就是程序状态寄存器 在ARM Architecture Reference Manual手册中,ProgrammersModel的目录下,有Registers子目录 我们介绍CPSR和SPSR CPSR:Current Program Status Register SPSR:Saved Program Status Register CPSR:cpsr在用户级 编程 时用于存储条件码;CPSR包含条件码标志,中断禁止位,当前处理器模式以及其他状态和控制信息。 SPSR:程序状态保存寄存器,用于保存 CPSR 的状态,以便异常返回后恢复异常发生时的工作状态。 对于CPSR只有1
[单片机]
基于ARM9的智能车载系统设计
引 言 随着社会经济的发展,汽车已成为人们工作、生活中不可缺少的一种交通工具。在当前的汽车产业中,出于对安全性、舒适性、方便性、低公害、低成本的要求,开发了各种各样的电子控制系统。本文设计一种基于ARM9 S3C2410A的智能车载系统,它能够通过GPS全球定位系统和GPRS无线通信技术,实现车辆定位以及车辆与控制中心之间的数据通信,构建CAN总线控制模块用于采集车辆主要部分的工作状态,实时监控汽车的主要技术参数,并通过LCD模块显示车载信息的综合信息。 1 智能车载系统的功能 车载智能导航终端应具有如下功能: 车辆定位 它指通过GPS全球定位系统获取车辆的当前所处位置,包括经度、纬度、运动速度、标准时间以及海拔高度
[单片机]
基于<font color='red'>ARM</font>9的智能车载系统设计
ARM处理器中断处理的编程实现
ARM处理器中断处理的编程实现arm编程特别是系统初始化代码的编写中通常需要实现中断的响应、解析跳转和返回等操作,以便支持上层应用程序的开发,而这往往是困扰初学者的一个难题。中断处理的编程实现需要深入了解arm内核和处理器本身的中断特征,从而设计一种快速简便的中断处理机制。需要说明的是,具体的上层高级语言编写的中断服务函数不在本文的讨论范围之内。 arm处理器异常中断处理概述 当异常中断发生时,系统执行完当前指令后,将跳转到相应的异常中断处理程序处执行。当异常中断处理程序执行完成后,程序返回到发生中断的指令的下一条指令处执行。在进入异常中断处理程序时,要保存被中断的程序的执行现场。从异常中断处理程序退出时,要恢复被中断的程序的
[单片机]
<font color='red'>ARM</font><font color='red'>处理器</font>中断处理的编程实现
奥地利微电子推低电压/低门限值微处理器监控电路 可监测0.9V至1.5V供电电压
AS1925和AS1926可监测0.9V至1.5V供电电压,是监测低电压内核电源或单节电池应用的理想方案 中国—— 全球领先的通信、工业、医疗和汽车应用的模拟集成电路设计者和制造商奥地利微电子公司(SWX股票代码:AMS),今天推出单路、超低电压微处理器监控电路AS1925 和 AS1926,进一步扩展了监控电路产品系列。 AS1925用于监测μP和数字系统中的0.9V至1.5V电源,无需外部元件。如果被监测的电源电压低于复位门限时,AS1925会触发强制复位。 为监测0.9V、1.2V和1.5V供电电源,可提供0.81V至1.425V的多种工厂设置电压门限,容限为5%或10%。无需外部元件即可监测电源电压。 AS192
[新品]
小广播
添点儿料...
无论热点新闻、行业分析、技术干货……
设计资源 培训 开发板 精华推荐

最新单片机文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved