XScale PXA270在Linux下的FPGA设备驱动-电子工程世界

分享到: 微博; QQ; 微信; LinkedIn

引言

Intel公司推出的XScale采用ARM V5TE结构，是Strong ARM的升级换代产品。XScale PXA270处理器最高主频可达624 MHz，加入了Wireless MMX、Intel SpeedStep等新技术，以其高性能、低功耗、多功能等特点在信息家电、工业控制等领域得到了广泛的应用。在嵌入式控制中，“微处理器+FPGA”是一种常用的解决方案。FPGA（现场可编程门阵列）有编程方便、集成度高、速度快等特点，电子设计人员可以通过硬件编程的方法来实现FPGA芯片各种功能的开发。在我们的一个数控平台的研究项目中，采用XScale PXA270作为主CPU,并对其进行FPGA扩展，使其具有插补、电机驱动、信号处理、I/O口扩展的功能。Linux以其内核精练、高效，源代码开放且免费等优势，在嵌入式领域得到了广泛的应用。下面以Intel XScale PXA270上的Altera FLEX/ACEX的应用为例，详细介绍Linux下FPGA设备驱动的实现。

1 Altera FLEX/ACEX芯片结构

Altera FLEX/ACEX芯片是基于查找表LUT（LookUpTable）原理而实现的。LUT本质上就是一个RAM。目前FPGA中多使用4输入的 LUT，所以每个LUT可以看成一个有4位地址线的16×1的RAM。当用户通过原理图或HDL语言描述一个逻辑电路以后，FPGA开发软件会自动计算逻辑电路的所有可能的结果，并把结果事先写入RAM。这样，每输入一个信号进行逻辑运算就等于输入一个地址进行查表，找出地址对应的内容，然后输出即可。由于LUT主要适合SRAM工艺生产，所以目前大部分FPGA都是基于SRAM工艺的，而SRAM工艺的芯片在掉电后信息就会丢失，一定要外加1片专用配置芯片（本实验电路使用Altera EPC2LC20）。在上电时，由这个专用配置芯片把数据加载到FPGA中，然后FPGA即可正常工作。由于配置时间很短，因此不会影响系统正常工作。在使用ACEX1K50之前，应对其进行设计编程，实现相应寄存器及I/O口的功能。有关FPGA的详细内容请参阅相关资料。

2 Intel XScale PXA270处理器的系统存储器接口

PXA270处理器的可编程静态存储体系结构如图1所示。

图1 PXA270静态存储体系结构

在系统上， ACEX1K50位于nCS<2>上，物理地址0x8000000～0x8001000共4K的静态地址空间。图2表示了Intel XScale PXA270与ACEX1K50的硬件连接关系。

图2 Intel XScale PXA270与ACEX1K50的硬件连接

3 Linux下ACEX1K50设备驱动的实现

3.1 Linux下设备驱动基本原理

设备驱动程序是应用程序与硬件之间的一个中间软件层，设备驱动程序为应用程序屏蔽了硬件的细节。这样在应用程序看来，硬件设备只是一个设备文件，应用程序可以像操作普通文件一样对硬件设备进行操作。设备驱动程序是内核的一部分，它主要实现的功能有：对设备进行初始化和释放；把数据从内核传送到硬件和从硬件读取数据；读取应用程序传送给设备文件的数据，回送应用程序请求的数据以及检测和处理设备出现的错误。

Linux将设备分为最基本的两大类：一类是字符设备；另一类是块设备。字符设备和块设备的主要区别在于是否使用了缓冲技术。字符设备以单个字节为单位进行顺序读/写操作，通常不使用缓冲技术；块设备为了提高效率，利用一块系统内存作为读/写操作的缓冲区，由于涉及缓冲区管理、调度和同步等问题，实现起来比字符设备复杂得多。[page]

Linux通过设备文件系统对设备进行管理，各种设备都以文件的形式存放在/dev目录下，称为“设备文件”。应用程序可以像普通文件一样打开、关闭和读/写这些设备文件。为了管理这些设备，系统为设备编了号，每个设备号又分为主设备号和次设备号。主设备号用来区分不同种类的设备，而次设备号用来区分同一类型的多个设备。Linux为所有的设备文件都提供了统一的操作函数接口，方法是使用数据结构struct file_operations。这个数据结构中包括许多操作函数的指针，如open()、close()、read()和write()等，但由于外设的种类较多，操作方式各不相同。struct file_operations结构体中的成员为一系列的接口函数，如用于读/写的read/write函数和用于控制的ioctl等。打开一个文件就是调用这个文件file_operations中的open操作。不同类型的文件（如普通的磁盘数据文件）有不同的file_operations成员函数，接口函数完成磁盘数据块读/写操作；而对于各种设备文件，则最终调用各自驱动程序中的I/O函数进行具体设备的操作。这样，应用程序根本不必考虑操作的是设备还是普通文件，可一律当作文件处理，具有非常清晰、统一的I/O接口，所以file_operations是文件层次的I/O接口。

3.2 ACEX1K50在Linux下设备驱动的实现

在驱动程序中使用内存映射可以提供给用户程序直接访问设备内存的能力。使用内存映射的好处是处理大文件时速度明显快于标准文件I/O，无论读/写，都少了一次用户空间与内核空间之间的复制。在用户空间对ACEX1K50 FPGA设备的访问是通过内存映射来实现的。

ACEX1K50可以看作是硬件连接在PXA270微处理器的nCS<2>上的一段物理地址来寻址。因为有虚拟内存管理单元，所以如果在Linux下，必须先把物理地址映射到虚拟地址空间，然后才能对该段地址进行读/写。

在内核驱动程序的初始化阶段，通过ioremap（）将ACEX1K50的这段物理地址映射到内核虚拟空间；在驱动程序的mmap系统调用中，使用remap_page_range（）将该块ROM映射到用户虚拟空间。这样内核空间和用户空间都能访问ACEX1K50的这段被映射后的虚拟地址。

由于ACEX1K50位于nCS<2>上，参照PXA270静态存储体系结构映射表，其物理起始地址为0x08000000。另外，其设备名称及主次设备号定义如下：

　　#define FPGA_PHY_START0x08000000
　　　　　　// nCS<2>: PAX270平台
　　#define FPGA_PHY_SIZESZ_4K
　　　　　　// nCS<2>: Slot FPGA物理基大小为4K
　　#define DEVICE_NAME"PXA270 FPGA"
　　#define FPGARAW_MINOR 1
　　#define FPGA_Devfs_path"fpga/0"
　　static int fpgaMajor = 0;

其中FPGA主设备号定义为零，使得操作系统可以随机为该设备分配主设备号。

ioremap()的作用是把一个物理内存地址点映射为一个内核指针，被映射数据的长度由size参数设定。该函数的实质是把一块物理区域二次映射到一个可以从驱动程序里访问的虚拟地址上去。以下是该函数的定义：

　　void *ioremap(unsigned long phys_addr, unsigned long size);

设备驱动通过fpga_init()函数初始化FPGA设备，最终通过init_module(fpga_init)在内核启动时初始化FPGA设备。

fpga_init()函数的流程如图3所示。

图3 fpga_init()流程

　　ioremap（）调用的语句如下：
pxa270_fpga_base= (unsigned long) ioremap(FPGA_PHY_START, SZ_4K);

可以通过ioremap（）调用的返回值pxa270_fpga_base来判断FPGA物理地址到内核虚拟空间是否映射成功。

　　if(!pxa270_fpga_base) {
　　printk("ioremap pxa270 fpga failedn");
　　return -EINVAL;
}

向设备文件系统注销FPGA设备通过调用cleanup_module（）函数来实现。其代码如下：

　　void __exit fpga_exit(void) {
　　　　#ifdef CONFIG_DEVFS_FS
　　　　devfs_remove(FPGA_Devfs_path);
　　　　#endif
　　　　unregister_chrdev(fpgaMajor, DEVICE_NAME);
　　}
　　cleanup_module (fpga_exit);

在向内核设备文件系统注册该FPGA驱动后，还须实现设备驱动的file_operations结构。ACEX1K50的设备驱动定义了如下file_operations成员函数：

　　static struct file_operations pxa270_fops = {
　　owner:THIS_MODULE,
　　open:fpga_open,
　　mmap:fpga_mmap,
　　ioctl:fpga_ioctl,
　　release:fpga_release,
　　};[page]

其中fpga_open和fpga_release系统调用的功能只简单地实现了FPGA设备使用计数器的递增与递减，fpga_ioctl系统调用也只是简单的打印一条没有ioctl控制的信息提示。这里不再分析实现的具体代码。下面具体分析fpga_mmap的实现过程：

　　static int fpga_mmap(struct file *filp, struct vm_area_struct *vma) {
　　unsigned long off = vma->vm_pgoff << PAGE_SHIFT;
　　unsigned long physical = FPGA_PHY_START + off;
　　unsigned long vsize = vma->vm_end - vma->vm_start;
　　unsigned long psize = FPGA_PHY_SIZE- off;
　　　　if (vsize > psize)
　　　　　　return -EINVAL; //spans too high
　　　　vma->vm_flags |= VM_IO|VM_RESERVED;
　　　　vma->vm_page_prot=pgprot_noncached(vma->vm_page_prot);
　　　　remap_page_range(vma, vma->vm_start, physical, vsize, vma->vm_page_prot);
　　　　return 0;
　　}

fpga_mmap(struct file *filp, struct vm_area_struct *vma)系统调用允许直接将FPGA设备内存线性地映射到用户进程的地址空间中。fpga_mmap系统调用是通过调用 remap_page_range（）函数来实现一段线性物理地址的映射，调用remap_page_range（）函数需要填写 vm_area_struct结构的几个关键字段。

　　int remap_page_range(struct vm_area_struct *vma, unsigned long from, unsigned long to, unsigned long size, pgprot_t prot)函数每个参数的意义说明如下：

　　vm_area_struct *//虚拟内存区域（VMA）指针
　　unsigned long from//需要映射的用户虚拟地址的起始位置
　　unsigned long to//虚拟地址所映射到的物理地址
　　unsigned long size//被重映射区域的大小，以字节为单位

4 ACEX1K50设备驱动在用户程序中的使用

当设备驱动实现后，就可以在用户空间使用该设备了。在用户空间主要是通过调用mmap（）函数来实现对FPGA设备的访问。以下是用户空间应用程序的一个示例：

　　……………………………………………………………………
　　fd = open("/dev/fpga/0",O_RDWR);//打开设备文件
　　if(fd < 0){
　　　　printf("####fpgadevice open fail####n");
　　　　return (-1);//判断打开设备文件是否成功
　　　　}
　　iobase = (unsigned char *)mmap(0, 4096,PROT_READ | PROT_WRITE, MAP_SHARED,fd,0);//经过地址映射后，可对FPGA的寄存器进行一系列操作
　　……………………………………………………………………
　　close(fd);//关闭设备文件

结语

本文通过介绍ACEX1K50在Linux操作系统下设备驱动的实现过程，为FPGA在嵌入式领域的应用提供了一种方法。在实际应用中，通过用户程序能够很好地实现对FPGA硬件编程后的各种功能的控制。

参考文献

[1] Alessandro Rubini, Jonathan Corbet. Linux设备驱动程序.魏永明，等译.第2版.北京：中国电力出版社，2004.
[2] Intel Company. Intel PXA270 Processor Family Developers Manual. 200410.
[3] 倪继利. Linux内核分析及编程.北京：电子工业出版社,2005.
[4] 林容益. CPU/SOC及外围电路应用设计——基于FPGA/CPLD. 北京：北京航空航天大学出版社，2004.

关键字：XScale PXA270 FPGA Linux 引用地址：XScale PXA270在Linux下的FPGA设备驱动

上一篇：基于Xscale便携式视频终端硬件设备设计
下一篇：Xscale PXA255处理器与CF卡的接口设计

推荐阅读最新更新时间：2024-03-16 13:07

ARM嵌入式Linux设备树简介及应用示例

1). 简介设备树（Device Tree）是一种用来描述系统硬件的数据结构，一些硬件设备设计机制就是可被系统发现的（如PCI Express或者USB总线），而有一些则不是（尤其是内存映射外设）。对于后一种情况，不同于X86架构系统采用BIOS和操作系统沟通硬件拓扑信息，ARM Linux通常情况是将硬件设备描述硬编码到系统内核（Linux Kernel）中，但由于ARM嵌入式设备的多样和离散性，即便如此也不能保证覆盖到所有设备，而且长久以来给ARM Linux内核代码维护造成了很大负担；基于这种情况，设备树的概念就被提出，将ARM SOC和板卡硬件平台描述信息从内核独立出来成为设备树文件，通过bootloader传递给内核来识

[单片机]

ARM嵌入式<font color='red'>Linux</font>设备树简介及应用示例

ARM-Linux驱动--Watch Dog Timer(看门狗)驱动分析

硬件平台：FL2440 内核版本：2.6.28 主机平台：Ubuntu 11,04 内核版本：2.6.39 1、看门狗驱动的原理下图是看门狗驱动的原理图可以看出，PCLK是系统时钟，经过8位的预分频，然后再被分频（16、32、64、128）然后产生计数脉冲，进行计数，当计数器WTCNT加到0或减到0，然后产生中断，或引起系统复位。所以要隔一段时间，重置WTCNT的值，防止WTCNT减到0，称之喂狗。 2、驱动分析下面是自己的驱动分析，如有理解错误，请指正注，为了尽量是驱动容易理解，这个驱动暂时将有关电源管理的功能删除了，等理解透彻再完善 #include linux/module.h #in

[单片机]

ARM-<font color='red'>Linux</font>驱动--Watch Dog Timer(看门狗)驱动分析

基于FPGA的二次群分接器的结构分析及实现

　　 1．引言　　为了提高传输速率，扩大通信容量，减少信道数量，通常把多路信号复用成一路信号进行传输。在多种复用方式中，时分复用是一种常用的方式。时分复用是多路信号按照时间间隔共享一路信道进行传输。复接是把多路速率相对较低的数字信号通过某种协议复合成一路信号进行传输；而分接正好相反，是把一路速率相比高的信号按照对应的协议分割成发送端对应的速率相对较低的信号。为了规范复接与分接协议，ITU(国际电信联盟)根据传输速率的不同等级，将复接的数字信号为基群、二次群、三次群、四次群等，以我国实际应用为例，速率分别：2．048MHz、8．4．48MHz、34．368MHz、139．264MHz。本文介绍基于FPGA实现二次群数字信号的分接

[嵌入式]

基于<font color='red'>FPGA</font>的二次群分接器的结构分析及实现

FPGA、可编程HPC—未来就靠你们了！

技术名词：FPGA、HPC、触发器过滤器、Github、HLS、hls4ml、Project Catapult、HWMS、ML、DNN、GEMM、Statix FPGA为高性能计算和机器学习提供了一种早期的架构专门化选项。体系结构专门化是继续改进性能的一种选择，以克服摩尔定律中减缓技术步伐所带来的限制。无论是在功耗还是性能方面，使用特定于应用程序的硬件来加速应用程序或其中一部分，并允许使用更高效的硬件作为支撑。考虑到为单个应用程序或工作流构建计算硬件的固有成本，这种策略不能用于所有应用程序。然而，通过将挑战组合成组，或者识别能够从加速中获益的关键工作负载或代码，很可能成为提高应用程序性能的一个重要部分。

[嵌入式]

<font color='red'>FPGA</font>、可编程HPC—未来就靠你们了！

Linux之父炮轰英特尔Spectre修补是全然的垃圾

电子网消息，Spectre漏洞阴影余波荡漾，Linux操作系统机器安装修补程序后频频出包。 Linux之父Linux Torvalds周一在Linux群组论坛公开炮轰，英特尔提供给Linux的Spectre修补程序是全然的垃圾（complete and utter garbage）。 Linux Torvalds认为英特尔在修补Spectre上的做法相当糟，采用间接分支限制推测会造成系统效能大幅下滑，因此英特尔不默认启用这项功能，却将责任推诿至他人身上，等于试图将垃圾推给他人。 Torvalds指出，从推测执行控制CPU ID这件事显示，英特尔在Meltdown上做了对的事，但这也不令人意外，因为修补并不是太难，而且也是比较明

[半导体设计/制造]

基于ARM的嵌入式处理器和FPGA之间通信的实现

1　前言在ARM＋FPGA系统结构中，实现基于ARM的嵌入式处理器和FPGA之间通信最简单的方法就是通过异步串行接口EIARS232C。考虑选用集成有UART(Universal Asynchronous Receiver / TraNSmitter )控制器的嵌入式处理器(例如，EP7312)，那么嵌入式处理器一侧就具有了利用异步串行接口收、发通信的能力。然而，FPGA内部并不拥有CPU控制单元，无法处理由UART控制器产生的中断，所以FPGA一侧不能利用现成的UART控制器构成异步串行接口，必须将UART控制器的功能集成到FPGA内部。同一个系统中的ARM与FPGA之间属于短距离通信连接，他们之间的异步串

[单片机]

TQ2440学习笔记——Linux上I2C驱动的两种实现方法(1)

内核版本：Linux-3.14 u-boot版本：U-Boot 2015.04 硬件：TQ2440 （NorFlash：2M NandFlash：256M 内存：64M）摘要这里并不深入分析Linux下I2C驱动的实现，只是以TQ2440硬件平台为例分析I2C驱动的两种方法。第一种方法：使用S3C2440自带的I2C控制器实现，这个kernel已经支持，我们只需要配置即可。第二种方法：使用GPIO模拟，这个在kernel中已经集成，实现代码在drivers/i2c/busses/i2c-gpio.c。在TQ2440平台上有一个EEPROM，型号是：AT24C02C。我们就以驱动at24c02c为例。硬件原理

[单片机]

TQ2440学习笔记——<font color='red'>Linux</font>上I2C驱动的两种实现方法(1)

用FPGA构建PCI Express端点器件最佳平台

　　PCI Express是一种使用时钟数据恢复(CDR)技术的高速串行I/O互连机制。PCI Express第一代规范规定的线速率为每通道2.5Gbps，可以让您建立具备单通道(x1)链路2Gbps(经8B/10B编码)直至32通道64Gbps吞吐量的应用。这样就能在保持或改进吞吐量的同时，显著减少引脚数量。另外，还可以减小PCB的尺寸、降低印制线和层的数量，并简化布局和设计。引脚数量减少，也就意味着噪声和电磁干扰(EMI)降低。CDR消除了宽并行总线中普遍存在的时钟-数据歪斜问题，简化了互连实现。　　PCI Express互连架构主要针对基于PC的系统，但就像PCI一样，PCI Express也很快转移到其他系统类型，如嵌

[嵌入式]