Tensilica今天骄傲地宣布以其面向密集计算数据平面和
DSP(数据信号处理器)如成像、视频、网络和有线/无线基带通信的处理器IP巩固了其在IP内核领域的领导者地位,任何需要庞大数据处理的应用都将极大都受益于这些突破性功能――通过内建
Tensilica面向SOC的Xtensa® LX4数据平面处理器(DPU)可以将这些应用数据带宽提高4倍!
新的Xtensa LX4 DPU支持更高的本地数据存储位宽,最高到每周期1024比特,支持更宽的128位VLIW(超长指令字)指令,从而提高指令并行度。新增的高速缓存预取功能,可以在片外存储器延时很高的情况下帮助提升系统性能,Tensilica已经将这些技术应用到最新发布的用于LTE通信的ConnX BBE64 DSP上。
“Tensilica DPU的优势在于同时具备控制和信号处理能力,与一个标准的RISC或者DSP内核相比,可以将性能优化提升10倍到100倍!” Tensilica 营销与业务拓展副总裁Steve Roddy指出,“现在,有了Xtensa LX4后,Tensilica可以提供的IP内核包括从微型可编程DPU(采用28nm工艺在0.01mm2提供1GigaMAC DSP能力)到业界最高性能的可授权DSP内核ConnX BBE 64-128,它每秒处理能力超过100 GigaMAC!”
针对高带宽应用有更宽的数据存取能力
与Tensilica的Xtensa LX3 DPU相比,Xtensa LX4 DPU有4倍本地存储器带宽,每个周期最多可以完成2个512位的存取操作,设计师现在可以轻易实现超宽SIMD(单指令多数据)DSP,它可以将更多数据同时送给MAC(乘加运算),使每个时钟周期性能大大提升,这使得Xtensa LX4 DPU特别适合于有线和无线基带处理、视频前处理和后处理、图像信号处理和各种网络包处理应用。
除了上述本地存储器带宽的增强,Tensilica 已有的可定制本地端口和队列可以提供近乎无限的点对点数据和控制信号带宽。Tensilica现在既可以提供在Xtensa DPU和其他系统模块如RTL 模块之间建立内部互连的端口和队列,也可以提供新的超高带宽本地存储器接口。
提供更宽的指令增强并行处理能力
有了Xtensa LX4,Tensilica可以让其FLIX(灵活长度指令扩展)指令的指令长度翻番,从64位扩展到128位,这使得每个时钟周期可以完成的操作数量翻番,FLIX指令可以和Xtensa基本指令集无缝混合,所以在用到FLIX的时候不用很麻烦地去切换模式。
Xtensa LX4 DPU的FLIX指令与传统的VLIW DSP相比,可以在提供超高性能的同时减小代码体积,Tensilica的Xtensa C/C++编译器可以从源代码中推断出并行性,并自动将多个不同操作并行化为一条FLIX指令。一个带有FLIX指令的Xtensa LX4 DPU能以很低的时钟频率运行并行操作,它提供的性能可以与时钟频率更高体积更大的非VLIW 内核相媲美,而在完成相同任务时它的功耗更低!
预存取减少周期数
新的数据预取操作因在数据使用前就提前取到了数据,所以可以减少高延迟系统中执行周期的数量,这样一来,当应用代码需要的时候,数据已经准备好了,在DPU必须等待数据时,可以减少时钟周期的浪费。当数据流是来自相邻存储地址的时候这样的好处就更突出,相比增加一个独立的DMA(直接存储器访问)引擎来说,这是一种更为简易的优化存储器访问的方法。它不需要额外的软件编程和应用代码调整。
成功的关键:自动化
利用Tensilica的开发工具,不仅可以自动生成DPU硬件,还可以生成相匹配的复杂软件工具链,因为所有的Xtensa处理器都包括了一套相同的基本指令集,所以基于这套基本指令集的的第三方应用软件可以运行在所有Xtensa处理器上,甚至是深度定制后的Xtensa DPU。
可定制Xtensa DPU与主流操作系统、DEBUG和ICE(在线仿真器)方案都兼容,每个XtensaDPU都有自动生成的完整的软件工具链,包括一个基于Eclipse框架的高级集成开发环境,一个世界级编译器,一个周期精确且兼容SystemC的指令集仿真器以及完整的工业标准GNU工具链。
随同发布的还有Tensilica的矢量化辅助工具,这是一个首创的工具,它给开发者提供建议来改善他们运行于SIMD(单指令多数据)DSP上的C代码的编程风格,这个矢量化辅助工具可以指出哪些代码妨碍了编译器进行矢量化,所以软件可发者能改善C源代码,从而发挥DPU并行执行的优势。
供货和性能
Tensilica 现就可以提供Xtensa LX4 DPU IP,在45nm工艺下基本型Xtensa LX4 DPU时钟频率可以超过1 GHz,而大小只有0.044 mm2。
关键字:Tensilica 数据平面 信号处理
引用地址:
Tensilica 新处理器IP主打数据平面和信号处理
推荐阅读最新更新时间:2024-05-02 21:19
Tensilica授权MediaPhy使用Diamond 108Mini
2008年5月26日,Tensilica公司和Mediaphy公司共同宣布,位于加州San Jose的MediaPhy公司获得Tensilica公司业界最低功耗的32位处理器内核-Diamond 108Mini的授权。MediaPhy利用Diamond Standard 108Mini进行手机电视产品的开发。 MediaPhy公司的创始人兼工程执行副总裁Mohammad Moradi表示:“MediaPhy的主要目标应用领域之一是使用电池的移动便携设备,在该领域,功耗是至关重要的一个因素。因此MediaPhy选择了Tensilica的Diamond Standard 108Mini处理器内核,以受益于其小面积/低功耗的
[新品]
天津大学DSP实验室和Tensilica建立可配置处理器联合实验室
中国北京 2006 年 6 月 14 日讯 -天津大学联合美国 Tensilica 公司,于今日宣布签署共建 “天津大学 - Tensilica 可配置处理器联 合实验室” , Tensilica 公司自此正式启动中国大学计划。根据该项协议, Tensilica 公司将向天津大学 DSP 实验室捐赠价值 100 万美金的可配置处理器开发软 件,作为该联 合实验室和 DSP 实验室教学 、培训、研究和开发的工具和资源。 中国天津大学自上世纪 70 年代中期即开始研究集成电路设计,拥有强大的专业技术队伍,其信号与信息处理专业拥有领先中国的 DSP 专业研究生教学和科研基地,承担国家多项重点
[焦点新闻]
高效信号处理架构为AR/VR普及应用铺路
2016年7月推出的《Pokemon Go》游戏堪称扩增实境(AR)发展的关键时刻。该游戏向大众展现AR技术重塑游戏的潜力,此后开发商绞尽脑汁为更广泛的应用开路。而针对AR机器学习和环境感知演算法做优化的高效信号处理架构,将有助于打造出更高品质的AR应用。 据Sensors Magazine报导,Google发表ARCore框架,将AR和虚拟实境(VR)功能带到比Project Tango更多的Android装置。苹果(Apple)则推出ARKit,并将其部署到新一代iPhone中。 事实上,移动App若要将虚拟动作叠加到现实世界,不仅需要高效能的绘图处理,还需要与判读不同传感器检测到的动作和其他环境讯号的软件一起运行。
[手机便携]
Tensilica 新处理器IP主打数据平面和信号处理
Tensilica 今天骄傲地宣布以其面向密集计算数据平面和 DSP (数据信号处理器)如成像、视频、网络和有线/无线基带通信的处理器IP巩固了其在IP内核领域的领导者地位,任何需要庞大数据处理的应用都将极大都受益于这些突破性功能――通过内建 Tensilica 面向SOC的Xtensa® LX4数据平面处理器(DPU)可以将这些应用数据带宽提高4倍!
新的Xtensa LX4 DPU支持更高的本地数据存储位宽,最高到每周期1024比特,支持更宽的128位VLIW(超长指令字)指令,从而提高指令并行度。新增的高速缓存预取功能,可以在片外存储器延时很高的情况下帮助提升系统性能, Tensilica 已经将这些技术应用到
[嵌入式]
芯原图像信号处理器IP获得汽车功能安全标准ISO 26262认证
通过该认证将加速芯原在电动汽车和自动驾驶等汽车领域的战略布局 2021年11月24日,中国上海 - 领先的芯片设计平台即服务(Silicon Platform as a Service,SiPaaS®)企业芯原股份(股票代码:688521.SH )今日宣布其图像信号处理器IP(Vivante ISP)ISP8000L-FS V5.0.0作为独立安全单元(Safety Element out of Context;SEooC),获颁ISO 26262 ASIL B功能安全产品认证证书。该图像信号处理器IP专为先进且高性能的摄像头应用而设计。认证证书由领先的功能安全咨询公司ResilTech颁发。 该图像信号处理器IP获
[汽车电子]
En Verv应用Tensilica技术于智能电网的电力线通信中
加利福尼亚州圣克拉拉市2011年10月25日讯–Tensilica今日宣布, EnVerv已授权使用Tensilica ConnX DSP(数字信号处理器),该产品将用于智能电网的电力线通讯(PLC)片上系统(SOC)芯片设计。Tensilica的ConnX DSP是低功耗的可定制处理器,提供出色的C语言编译器,通常客户不需要进行汇编代码优化。 “我们之所以选择Tensilica的ConnX DSP是由于其灵活的架构和卓越的处理性能,Farrokhi博士,EnVerv公司的工程副总裁表示,“利用ConnX DSP的定制指令功能,我们为信号处理算法定制了专用指令,从而在保持架构灵活性的同时,让我们享有定制DSP设计带来的诸多益处”
[嵌入式]
Tensilica多内核IP方案成功应用于NetEffect 10G以太网适配器
美国加州SANTA CLARA 2006年11月13日讯 –Tensilica公司日前宣布,NetEffect公司新近引入市场的10Gb iWARP以太网通道适配器(ECA)- NE010是首款可完全实现iWARP以太网标准的适配器,它可以让数据中心的管理者利用现有的以太网的硬件和软件实现真正的10Gbps吞吐量。NetEffect在这款针对适配器的定制芯片设计中采用了Tensilica公司的多颗Xtensa可配置处理器内核。 NetEffect首席执行官 Rick Maule表示,“我们之所以选择Tensilica公司Xtensa处理器内核是因为采用能够容易地对特定的功能进行优化,从而满足我们高速、高难度的以太网通路适配器的
[新品]
充分利用数字信号处理器上的片内FIR和IIR硬件加速器
有限脉冲响应(FIR)和无限脉冲响应(IIR)滤波器都是常用的数字信号处理算法---尤其适用于音频处理应用。因此,在典型的音频系统中,处理器内核的很大一部分时间用于FIR和IIR滤波。数字信号处理器上的片内FIR和IIR硬件加速器也分别称为FIRA和IIRA,我们可以利用这些硬件加速器来分担FIR和IIR处理任务,让内核去执行其他处理任务。在本文中,我们将借助不同的使用模型以及实时测试示例来探讨如何在实践中利用这些加速器。 简介 图1.FIRA和IIRA系统方框图 图1显示了FIRA和IIRA的简化方框图,以及它们与其余处理器系统和资源的交互方式。 FIRA和IIRA模块均主要包含一个计算引擎(乘累加(MAC)单元)以及
[嵌入式]