松耦合式可编程复杂SoC的设计实现

发布者:hzx312895379最新更新时间:2011-06-10 来源: elecfans关键字:SOC  松耦合 手机看文章 扫描二维码
随时随地手机看文章
    随着科技的发展,信号处理系统不仅要求多功能、高性能,而且要求信号处理系统的开发、生产周期短,可编程式专用处理器无疑是实现此目的的最好途径。可编程专用处理器可分为松耦合式(协处理器方式,即MCU+协处理器)和紧耦合式(专用指令方式,即ASIP),前者较后者易于实现,应用较广。本文就是介绍一款松耦合式可编程专用复杂SoC设计实现,选用LEON3处理器作为MCU,Speed处理器作为CoProcessor。

  LEON3及Speed

  LEON3是由欧洲航天总局旗下的Gaisler Research开发、维护,目的是摆脱欧空局对美国航天级处理器的依赖。目前LEON3有三个版本(如表1),其中LEON3FT(LEON3 Fault-tolerant)只有欧空局内部成员可以使用。LEON3 (basic version)是遵循GNC GPL License的开源处理器,和SPARC V8兼容,采用7级Pipeline,硬件实现乘法、除法和乘累加功能,详细特性请参考相关技术文档[1]。

  表1 LEON3的不同版本

  

LEON3的不同版本

 

  目前,LEON3处理器因为开源、高性能、采用AMBA总线易扩展及软件工具完备等因素,在国内外大学(如UCB、UCLA、Princeton University等)及科研院所的科研活动中得到广泛应用。

  Speed(又名GA3816)是一款我国自主研发、处于同时代国际先进水平、可重构、可扩展的面向FFT、IFFT、FIR及匹配滤波应用的信号处理器,其内部结构如图1所示,具有以下特点[2~4]:

  1)Speed在追求运算速度的同时兼顾通用性,通过设置64位控制字,器件内部资源可根据不同应用进行重组;

  2)可以实现FFT、IFFT、FFT-IFFT、FIR、滑窗卷积等运算,峰值运算能力达256亿次浮点乘累加/秒;3)由160个实数浮点乘法累加运算器组成40个复数乘法累加器阵列,1Mbit的双口SRAM,8个512×32bit系数ROM,两个直角到极坐标转换电路,两个对数变换电路及其它辅助电路和控制电路。

  

Speed的内部模块结构

 

  图1 Speed的内部模块结构

  Speed传统的工作方式是通过片外FPGA输入控制信号和待处理数据,这不仅增大了PCB板级布线、调试的工作量,而且FPGA不能用C等高级语言编程,算法改动起来不灵活。另一方面,随着半导体工艺、微电子技术的发展,大规模的复杂SoC实现技术逐渐成熟,因此有必要将板级FPGA + Speed改进为芯片级MCU + Speed,这样既能实现真正的可编程增大灵活性,又能加快用户开发信号处理系统的速度。利用AHB实现通信

  为了实现可编程,需要将C/C++程序表达的信息经过编译器、LEON3处理器、AHB总线、DMA控制器和必要的HDL代码,转化成Speed能够识别的信息,进入Speed模块中,如图2。其中AHB总线是LEON3 Core和Speed Core结合的关键。

  

实现软件可编程的过程

 

  图2 实现软件可编程的过程

   

[page]

AHB总线及AHB控制器

  AMBA总线是一种应用广泛的层次化总线结构,有高速的AHB和低速APB之分,其中AHB是一种流水式高速总线结构,地址和数据总线相互独立,可挂载16个Master和Slaver设备,常用来组织和连接高性能模块,如处理器、DMA控制器、协处理器等[5~7]。AHB总线的核心是AHB控制器,主要包括仲裁器,译码器和多路复用器,其中仲裁器选择AHB Master,而译码器选择AHB Slave,实现写数据WDATA和读数据RDATA分开,如图3所示。

  

AHB总线

 

  DMA控制器

  DMA是指设备直接对计算机存储器进行读写操作的方式。这种方式下数据的读写无需CPU执行指令,也不经过CPU内部寄存器,而是利用系统的数据总线直接在源地址和目的地址之间传送数据,达到极高的传输速率。DMA控制器一方面可以接管总线,即可以像CPU一样视为总线的主设备,这是DMA与其它外设最根本的区别;另一方面,作为一个I/O器件,其DMA控制功能正式通过初始化编程来设置。当CPU对其写入或读出时,它又和其它的外设一样成为总线的从属设备。本文中为了实现DMA和AHB密切配合,即启动DMA后大量原始数据通过AHB总线从数据存储器进入Speed模块,需要DMA控制器内部包含AHB Master模块,如图4所示。另外需要说明的是,LEON3为了实现AHB上设备的plug&play需要在0xFFFFF000-0xFFFFF800地址空间添加设备信息[8~9],所以DMA 控制器和Speed协处理器亦要如此,以便LEON3的软硬件协调一致。在C语言实现DMA时,向DMA的控制寄存器写入相应的信息,即可启动DMA传输,如图5所示。

  

DMA与AHB Master的关系

 

  图4 DMA与AHB Master的关系

  

启动DMA的C代码示意

 

  图5 启动DMA的C代码示意

  Speed的AHB接口

  为了使Speed可以顺利接收LEON3传送过来的控制字或DMA传送过来的原始数据,需要在原有的Speed core模块顶层添加AHB Slaver协议来接收AHB上传送的数据,以及产生相应波形的HDL代码来将C程序的信息生成Speed所能识别的信号波形进入Speed模块内部,即从图6中的控制字,转化成图7中的时序。

  

C语言描述的Speed控制字

 

  图6 C语言描述的Speed控制字

  

Speed core所需的配置时序

 

  图7 Speed core所需的配置时序

  同理于控制字,滤波系数和原始数据的输入亦需要一定的HDL代码来实现指令或数据向时序图的转化,其本质相当于译码,实现起来难度不大,此处就不再累述。Speed处理后数据通过状态信号(zero_flag)下降沿触发LEON3的中断响应,实现向外部存储器的输出,此过程和数据输入类似。

   [page]

 

    编程、编译及仿真

  用户在C编程时,只需要按照Speed所需的启动方式,先设置控制字、再输入滤波系数、然后启动DMA输入原始数据。值得注意的地方是,为了实现Speed的运算与DMA中原始数据输入同步,需要在C代码的不同指令间插入一定的延迟指令,此延迟间隔可根据软硬件的响应速度来计算。

  Gaisler Research公司提供完整的LEON3开发套件,包括C代码编译器sparc-elf-gcc,大大方便了软硬件开发和联合调试。 将LEON3和Speed的SoC硬件HDL描述,及编译后的二进制指令调入Modelsim进行软件仿真,再利用FPGA进行硬件仿真,其结果如图8、9、10所示。

  

从C语言控制字产生的配置时序

 

  图8 从C语言控制字产生的配置时序

  

触发中断响应的zero

 

  图9 触发中断响应的zero_flag信号

  

在Altera StratixII 2S180中的仿真结果

 

  图10 在Altera StratixII 2S180中的仿真结果

  结语

  本项目利用LEON3的高性能、易编程、开源等优点,开发了AHB总线接口和DMA控制器,实现了Speed专用信号处理器的软件可编程,大大简化了Speed用户的开发过程。有待改进之处是,1)当前Speed可处理40bit数据,而Leon3是32bit,没有最大限度发挥Speed的运算能力;2)如果在LEON3上运行RTEMS (Real Time Executive for MultiProcessor Systems) 操作系统,将进一步方便用户扩展LEON3的利用价值。

关键字:SOC  松耦合 引用地址:松耦合式可编程复杂SoC的设计实现

上一篇:基于FPGA的SPI总线在软件接收机上的应用
下一篇:2011赛灵思DSP研讨会将在三地开展

推荐阅读最新更新时间:2024-05-02 21:26

紫光展锐确认2020年推出5G芯片组SoC
据日经报道称,中国第二大移动芯片开发商紫光展锐已准备在2020年推出5G芯片组,远早于此前计划。从而可以最快速度赶上全球领先的5G芯片供应商高通和联发科技,满足希望结束对美国供应商依赖的众多本土公司需求。 紫光展锐的时间表与竞争对手大致相同,不过在今年早些时候与英特尔合作解体后,其发展趋势开始显着加速。 该计划提出后,中国政府也给与了大力支持,尤其是在特朗普对华为采取科技禁运之后,中国希望减少对国外芯片制造商的依赖,同时也在加速推动5G移动网络的建设。目前该公司的主要客户来自小规模的智能手机制造商,以及其他担心成为美国下一个打击目标的群体。 目前紫光展锐挖来了部分华为和高通的人才,并投入约两亿美元研发,进行改进制程和提高产品性能。
[手机便携]
瑞萨科技与松下开发新SRAM制造技术 可实现45nm工艺传统下CMOS稳定工作
-新设计方法可保持温度和工艺变化条件下的SRAM稳定性,同时实现全球最小的0.245μm2的存储单元面积- 2007年2月13日,瑞萨科技(Renesas Technology Corp.)与松下电器产业有限公司宣布,共同开发出一种新技术,可以使45nm工艺传统CMOS的SRAM(静态随机存取存储器)稳定工作。这种SRAM可嵌入在SoC(系统(集成)芯片)器件和微处理器(MPU)当中。经测试证实,采用该技术的512Kb SRAM的实验芯片,可以在宽泛的温度条件下(-40℃-125℃)稳定工作,而且在工艺发生变化时具有较大的工作电压范围裕量。用于实验的SRAM芯片采用45nm CMOS工艺生产,集成了两种不同的存储单元设计,一个元
[焦点新闻]
采用ARM的电子系统设计
一、引言 作为SOC(System On Chip)的典型应用,和持电话、机顶盒、数码像机、GPS、个为数字助理以及因特网设备等产品的市场需求越来越大。目前,基于arm的处理器以其高速度、低功耗等诸多优异的性能而成为上述各类产品中选用较多的处理器。 二、arm内核 ARM内核分为ARM7、ARM9、ARM10以及Strongarm等几类。其中每一类又根据其各自包含的功能模块而分成多种构成 在arm内核中有四个功能模块可供生产厂商根据不同用户的不同要求来配置生产。这四个模块分别用T、D、M和I来表示。 T:表示Thumb,该内核可从16位指令集扩充到32位arm指令集。 D:表示Debug,该内核中放置了用于
[单片机]
飞思卡尔推出精密阀门控制器SoC,打造强大安全的液压连接
该解决方案高度集成,配备了基于物联网技术的预防性维护联网诊断,可降低成本、简化设计并加快产品上市 飞思卡尔半导体日前已推出两种高度集成的阀门控制器片上系统(SoC),具有高精度电流测量、SPI连接及精密的功能性安全管理功能,可对液压和气动系统进行控制。 飞思卡尔的新型SB0410/SB0800 SoC是单芯片模拟控制器,专为同时管理八个阀门而设计,可调节电流并运行电机。这些器件适用于带高浪涌电流的负载,允许驱动至高频(高达5 kHz)。目标应用包括:液压和气动系统、制氧机、医疗设备、3D打印机、饮料自动售货机、农业和工厂设备以及灌溉用水控制。 与网络连接时,通过支持专为严苛环境设计的预测性维护和诊
[工业控制]
德州仪器为工业以太网提供更加低成本策略SoC
日前,德州仪器(TI)推出全新Sitara AMIC系列SoC,可以更低的成本为工业通信提供更巨性价比的单芯片解决方案。德州仪器处理器营销总监Adrian Valenzuela表示,AMIC110 SoC是一种多协议工业通信处理器,提供支持包括EtherCAT、Profibus、Profinet等10多种工业以太网和现场总线通信标准,可取代传统的ASIC+MCU或FPGA+MCU的工业现场总线解决方案。 德州仪器处理器营销总监Adrian Valenzuela Sitara AMIC 110详解 如图所示,Sitara AMIC110 和AM335X、AM437X以及AM57X最大的区别主要在通用处理器及
[工业控制]
德州仪器为工业以太网提供更加低成本策略<font color='red'>SoC</font>
FMI:2018-2028年车用级片上系统(SoC)市场发展预期报告
据外媒报道,随着汽车电气化转型、政府的政策出台及技术的发展,自动驾驶车辆的发展将如火如荼。在未来十年内,车用级片上系统(系统级芯片,SoC)需求将大幅提升。 2017年,全球车用级片上系统市场的市值达到了120亿美元。据估计,全球片上系统市场的年复合增长率(CAGR)将达到7.7%,预计2028年该市场的市值将达到268亿美元。 按应用分类,车载信息娱乐系统将占据车用级片上系统市场的主导地位,其市场份额占比将高达63%。2018-2028年间,先进驾驶辅助系统(ADAS)细分市场的年复合增长率最高。据估计,车用级片上系统在乘用车的配置率将保持高位。 2018-2028:车用级片上系统市场将处于显著增长阶段 未来市场洞察(F
[汽车电子]
SoC芯片方案,或将加速行泊一体方案规模化量产应用
引言 在电子电气架构从分布式向域集中式演进的过程中,行泊一体域控方案应运而生。据不完全统计,到现在为止,国内至少已经有十几家厂商发布了行泊一体域控的解决方案。 整体来讲,行泊一体技术方案可以划分为中低算力(轻量级)行泊一体域控方案和大算力行泊一体域控方案。关于两者的区别,感兴趣的读者可以查阅笔者之前的文章:《关于智能驾驶域控制器的一些观察 》和 《行泊一体 - 打通智能驾驶的“任督二脉”》—— 分别从市场维度和技术维度展开了详细说明,此处便不再具体展开。 无论是轻量级行泊一体域控,还是大算力行泊一体域控,都会有单SoC芯片配置和多SoC芯片配置之分。在当前阶段,多SoC芯片配置是一种比较常见的行泊一体硬件架构方案。
[汽车电子]
单<font color='red'>SoC</font>芯片方案,或将加速行泊一体方案规模化量产应用
Xilinx宣布Zynq-7000 All Programmable SoC 系列全线量产
拥有业经验证的高性能、最低功耗和无与伦比生产力的最智能的解决方案 2013年2月26日,中国北京- All Programmable技术和器件的全球领先企业赛灵思公司(Xilinx, Inc. (NASDAQ:XLNX) )今天宣布其Zynq™-7000 All Programmable片上系统(SoC)器件系列全线量产,实现了又一个重大里程碑。Zynq-7000 All Programmable SoC的市场需求非常强劲,目前已有350家不同客户采用该产品进行设计开发,自2011年12月以来赛灵思和安富利(Avnet)已经发货20,000多个器件和4000多个开发板。各项设计方案广泛应用于包括汽车、工业、通信、数
[嵌入式]
Xilinx宣布Zynq-7000 All Programmable <font color='red'>SoC</font> 系列全线量产
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

更多每日新闻
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved