聊聊TDA4芯片异构芯片设计、启动及工作原理

发布者:Blissful5最新更新时间:2023-06-29 关键字:启动 手机看文章 扫描二维码
随时随地手机看文章

超异构芯片是具有高水平的系统集成,以实现先进汽车的可扩展性和更低成本的支持集中式 ECU。关键核心包括具有标量和矢量内核的下一代 DSP,专用深度学习的NN计算核和传统算法加速器,用于通用计算的最新 ARM 和 GPU 处理器,集成的下一代生成成像子系统 (ISP),视频编解码器,以太网集线器和隔离的 MCU 功能安全岛,所有受保护汽车级安全和安保硬件加速器等。

图片

一般情况下,除了芯片选型外,设计超异构芯片时需还要满足如下设计规则:

  • 片上存储器应设计 ECC 保护并互连

  • 内置自检 (BIST) 、故障注入CPU 和片上RAM

  • 对于引脚错误设置故障信号模式

  • 运行时安全诊断、电压、温度和时钟监控,窗口化看门狗定时器,用于存储器的 CRC 引擎完整性检查

  • 可用于应用的功能安全需要满足 ISO26262 要求的ASIL D

  • 启用需要大量数据的系统带宽、PCIe 集线器和千兆以太网交换机以及 CSI-2 端口以支持许多传感器输入的吞吐量。

1.超异构芯片内核解析

对于超异构芯片而言,一般是基于异构、可扩展的架构开发,多核异构的优点是各核充分发挥其处理效能的优点,再加上专用硬件加速器也可处理特定任务,从而在性能、功耗和成本上达到最佳平衡。

当前被各厂家广泛使用比较成熟的超异构芯片当属TI的Jacinto™ 7 家族的处理器了,当然这也只是初级超异构芯片。不同厂家对其使用方式不完全一致,有将其完全作为SOC芯片使用的,充分使用了其上的AI算力,有些厂家在不太考虑其安全等级要求的情况下也可能将其当做MCU来使用。

本文将以TI的这块TDA4的芯片为例进行详细介绍,说明相应的内部架构。

图片

其中主要的几个异构模块包括如下:

1)处理器及加速器

①MCU域:

相当于异构芯片域控的MCU芯片单元所起的作用,用于启动底层硬件驱动、同步时间,启动操作系统及顶层应用软件中控制执行类部分逻辑运算。这里MCU域主要是指MCU Island中用于锁步功能的Arm Cortex-R5F充当;TI这类超异构芯片而言,CPU模块(Cortex R5F)用于对SOC域核周边对应的模块需要单独进行电压和时钟设计,同时,采用专用内存和接口确保其能够与更大的 SoC 隔离。

②SOC域:

此类模块通常使用高度定制化的NN加速器来实现。在环境感知模块中都会涉及大量的典型神经网络(NN)的运算,过程中深度学习算力主要被消耗掉。包括常见的各类图像、激光点云检测算法,比如物体检测、车道线检测、红绿灯识别等。

以TI为例设计的异构芯片中,微处理器系统端包括:Arm® Cortex®-A72和Arm® Cortex®-R5F、C71、C66几大模块。

其中,在各家域控Tier1开发过程中一般会考虑在A72上运行HLOS(如Linux或QNX),其余核则运行RTOS,整个运行核均可支持AutoSar。使用A72独立双核集群配置有助于多操作系统应用对软件管理程序的最低需求。

R5F子系统支持低级时序关键处理任务,用于实时性要求比较高的硬件驱动。使用C71(MMA)进行深度学习神经网络NN和模型运算,所以说MMA主要计算单位主要是以Tops为计算单位。

DSP处理器(C66)功能包含前端和后端视觉处理两方面。前端视觉主要是NV12转BGR、环视拼图,后端进行浮点运算用以充当AI加速器的CNN后处理。

如上这种结构是一种典型的AI运算模块(又称为AI-DSA),适用于对AI运算性能要求高,算法相对稳定的情况。由于AI-DSA模块在整个智能驾驶场景运算上使用更为普遍,性能更加敏感,对于云端、边缘计算及自动驾驶几段场景的工程化落地更加具有可使用性。

③GPU域:

用于图像处理加速单元,包含大量浮点运算和实现动态 3D 渲染以增强观看效果应用程序。同时GPU域也可以认为是高效率的AI运算平台,对于异形场景CornerCase的适配计算效率是最高的。

如上如果兼顾执行效率和执行性能上,可以做自适应的AI算力分配,普通场景的AI运算可以采用常规CPU+DSA方式进行,而特殊边缘场景可以采用GPU加速核方式进行高效能计算。

④其他处理模块:

VENC/ VDEC用于视频编解码单元,通常高性能的超异构芯片需要适配H.265/HEVC这类高清视频编码器。对于下一代自动驾驶系统来说可以提供更高清的视频编码能力,实现高清视频压缩传输。

VPAC(Vision Processing Accelerator)用于对图像进行去畸变、下裁剪(Crop)、重整型(Resides)。其目的是确保输入给神经网络单元进行处理的图像已经被初步处理过了,这样可以提升图像网络处理速度和性能。

如下图是以简单的图像传输和处理可以讲清楚在这一类超异构芯片上如何进行数据链路的传输和处理。

图片

2)存储单元

下图是大多数开发板所有的一个存储单元框架,接下来以此图为基础描述ARM芯片的上电启动流程。

图片

ROM: 芯片内部固化存储代码的存储器,其中固化在芯片iROM中的启动代码为BL0。

RAM: 在ROM启动运行的时候,只有RAM是可用的,因此必须要自动从外扩存储器(nand/sd/usb)中拷贝的uboot.bin二进制文件的头最大16K(一般是4K或8K)代码(BL1)。

SDROM: 芯片外部的运行内存,由运行在RAM上的BL1进行初始化,用于运行BL2与应用程序。

Nand Flash : 芯片外部非易失闪存技术的存储器,没有地址总线,不能直接运行代码,需要将代码加载到RAM上面才能运行。

就举例的TDA4芯片而言,BL1 和 BL2 没有被集成(Jacinto7集成 了 DMSC&MCU R5 取代了 BL1 和BL2 的功能), BL31 执行 ATF,BL32 执行 OP-TEE,BL33 是SPL/U-boot。

相应的存储单元涉及Main域和MCU域的管理,且两域分别单独用于片上共享存储单元,他们分别通过多核共享存储控制器MSMC实现相应的存储管理。TDA4内部还存在LPDDR4 w/ECC模块,即使未使用 DDR 接口,其VDDS_DDR均需要使用 LPDDR4 电压范围进行供电。

2.超异构芯片的启动说明

对于超异构芯片而言,由于采用了多核异构的架构,因系统需求的差异,其相应的启动流程也有一定的差异性,并且由于集成多核制会导致其启动流程比单核和多核同构的处理器会复杂些。

Bootloader 是在操作系统运行之前执行的一段小程序。通过这段小程序,我们可以初始化硬件设备、建立内存空间的映射表,从而建立适当的系统软硬件环境,为最终调用操作系统内核做好准备。两种bootloader 可以选择 SPL (Secondary Program Loader)或 SBL(Secondary bootloader)两种驱动加载。

SPL表示程序加载,分为两级加载程序过程。第一级Bootloader是指从ROM 里面的程序中根据启动方式的选择引导并加载 SPL。第二级Bootloader是指对硬件的初始化过程,引导下一级的 bootloader 核或加载并运行应用程序。

SBL表示驱动加载。可以实现对外围设备进行配置,比如 DDR,可以加载并启动其它核。为了满足快速启动 MCU 执行相关的应用,MCU可以先启动,然后使用BOOT APP 进而引导其它应用程序。在 SBL 启动流程中,SBL 可以直接加载 Linux内核和 DTB。

如下图显示了完整的异构芯片TDA4的程序加载过程。

图片

对于如上超异构芯片而言,用的最广的要数ARM Cortex-A72核了,因为其在整数、浮点、内存等性能皆有不同程度的提升,虽然还缺少一些细节,不过IPC性能上相对于之前的产品提升了16-30%左右。如下图表示了芯片A72的具体启动原理。

图片

整个代码启动运行过程包括首先把BL1加载到RAM中运行,然后由BL1对SDRAM进行初始化。最后,代码重定向完成后在内存中执行的uboot的完整代码BL2。

从应用层面的系统需求来讲,不同的应用可以部署在不同的核,不同核的启动时序影响着系统需求是否能实现。总体来讲,针对系统的应用需求,可能有如下的额外要求:提前Can信息响应、提前启动画面、提前启动摄像头、 提前分配Linux使用空间、提前显示视频动画等。我们应设计合理的 Soc 启动流程来满足系统的需求。


3.总结

超异构芯片Super SOC作为ADAS系统普遍应用的处理器,在面向 ADAS 和自动驾驶车辆 (AV) 应用过程中起着举足轻重的作用。智驾领域中,SOC需要深度学习算法中会比传统芯片提供提供高性能计算能力,同时可以有效优化其功耗和系统集成度。最终实现支持集中式ECU 或多种传感器的高级汽车平台实现可扩展性和更低的成本。


关键字:启动 引用地址:聊聊TDA4芯片异构芯片设计、启动及工作原理

上一篇:车载存储芯片介绍
下一篇:自动驾驶领域的SOA软件架构设计应用分析

推荐阅读最新更新时间:2024-11-12 13:57

小米正式启动上市:估值达1000亿美元
  据财新网独家报道,据多位接近 小米 的市场人士透露, 小米 已于今天(1月19日)召开上市启动会,并将选择在香港上市。下面就随手机便携小编一起来了解一下相关内容吧。   一位投行人士称:“ 小米 正在争取成为港交所新政策后首家登陆H股的互联网巨头。”   此前有多个消息源确定,小米将在2018年下半年上市,估值已经达到1000亿美元,还有说法称小米估值可能高达到2000亿美元,但都无从证实。 小米正式启动上市:估值达1000亿美元   小米内部人士指出,小米从未和投行或任何人提出小米估值2000亿美元。   而小米投资人称,1000亿美元估值相对更合理。   对于小米来说,港交所无疑是一个巨大的机会——香港恒生指
[手机便携]
解析卡儿酷应急启动电源的十大核心技术
随着汽车智能化的发展,车上的用电设备如GPS、 行车记录仪 、 空气净化器 等也越来越多,满足乘车人多方面需求的同时,大大提高了驾驶感受,而额外的用电设备加大了蓄电池的负担,容易造成电瓶亏电无法启动汽车,给车主带来了很大的困扰。     当人们还在苦于天气寒冷或者汽车蓄电池亏电而无法启动汽车时,发明应急启动电源这个点子无疑是十分具有创意的。     应急启动电源产品在短短几年经历了飞速的发展,从最初的单一汽车应急启动,到如今成为集移动电源、车载气泵、户外照明等于一身的“神器”,越来越多的驾友们习惯了在汽车后备箱里备上一台以防应急之需。随着科技的发展,应急启动电源逐渐向着多功能、安全环保、轻便及体积小等方向发展,应用不仅局限在汽车
[嵌入式]
联电斥资6.3亿美元启动扩产 厦门28nm一年扩增至2.5万片/月
  台湾晶圆代工厂 联电 董事会于12月13日正式通过新台币189.9亿元(约6.3亿美元)资本预算执行案,间接增资厦门联芯集成电路制造有限公司,从事经营12寸晶圆生产等业务,同步扩增台湾与大陆两岸晶圆厂产能。下面就随嵌入式小编一起来了解一下相关内容吧。   厦门联芯是由 联电 、厦门市政府,以及福建省电子信息集团三方共同合资兴建的12寸晶圆代工厂,初期资本额20.5亿美元,其中, 联电 出资13.5亿美元,其余由厦门市政府、以及福建省电子信息集团出资,联电过去已投入7.5亿美元,投审会通过联电申请导出的6.3亿美元后,预定的资本额也已全数到位。   台湾经济部投审会执行秘书张铭斌在受访时表示,该笔资金将用于原先预留的厦门厂二期
[嵌入式]
中国电信启动首轮4G终端招标
    在受中国移动4G影响、3G月净增用户数出现大幅下滑之后,中国电信(46.5, -0.44, -0.94%)也开始加快上马4G。昨日,中国电信启动了首次4G终端招标,将集中采购30万部数据类终端,要求必须支持TD-LTE制式。   据了解,中国电信此次招标的数据类终端,包括数据卡、MiFi(便携式无线上网热点)、CPE(WiFi信号接收器)三类,这些设备将在今年一季度批量上市。   知情人士透露,中国电信集采的30万部终端既支持TD-LTE,也支持LTE FDD。TD-LTE与LTE FDD是国际认可并通用的两种4G标准,前者是由我国参与并主导的标准。此前工信部已向三大运营商颁发TD-LTE牌照,但LTEFDD牌照颁发的具体
[手机便携]
浅谈西门子暖启动、热启动、冷启动
西门子的OB100,OB101,OB102分别代表暖启动,热启动,冷启动。 我们对这几种方式进行讲解一下。 01 暖启动(完全再启动) 完全再启动的启动类型,启动时过程映像和不保持的标志存储器、定时器及计数器被清除,保持的标志存储器、定时器和计数器以及数据块的当前值保持(仅当有后备电池,如果使用EPROM 并且CPU的保持特性已赋参数时S7-300甚至没有后备电池)。CPU会自动调用OB100一次,然后循环程序OB1开始执行。 02 热启动(再启动) 只有S7-400才能用,再启动的启动类型,在启动时所有数据(标志存储器、定时器、计数器、过程映像及数据块的当前值)被保持。CPU会自动调用OB101一次,然后程序从断点处(断电, C
[嵌入式]
MSP430 大型数组 上电不启动
现象:程序烧录板子后,单片机不启动,卡死。注释掉部分字节数组后,才能运行。 分析: 这是IAR编译的方法,导致看门狗溢出了。MSP430单片机一上电看门狗就已经启动,但是在进入main()函数之前,软件会先初始化用到的一些数据,比如数组。如果数定义的比较大,初始化时间比较长,那就有可能导致看门狗溢出了,单片机复位,然后重启,再初始化,再溢出,再复位..程序永远也进不去主函数。 解决方法: 使用低级初始化函数:int __low_level_init(void) 。该函数会自动把低级初始化函数放在程序的最开始处,在此可以关闭看门狗,等低级初始化函数执行完之后,才会进行数据初始化,最后再进入main()函数。 vo
[单片机]
电机启动时对电网的影响与危害
电机在工业场合无处不在,尤其大功率的电动机在启动的瞬间会产生较大的电流冲击,这样就是对稳定的电网造成相应的影响,工程实践中常常采用一定的控制措施来改进、限制电机启动过程中产生的对电网不利现象。 一、电机直接启动危害及避免方式 目前在工矿企业中使用着大量的交流异步电机,大部分电机均采用直接启动的方式,这种启动方式非常简单,但是会带来很大的危害。 1.电网冲击:过大的启动电流(空载启动电流可达额定电流的4~7倍,带载启动时可达8~10倍或更大),会造成电网电压下降,影响其它用电设备的正常运行,还可能使欠压保护动作,造成设备的有害跳闸。同时过大的启动电流会使电机绕组发热,从而加速绝缘老化,影响电机寿命。 图1 2.机械
[工业控制]
电机<font color='red'>启动</font>时对电网的影响与危害
北京启动全球首个自动驾驶接驳线路,4家企业获准运营
2月23日,北京大兴国际机场至北京亦庄的“机场线”自动驾驶载人示范正式开启,这标志着世界首个首都城市机场自动驾驶接驳载人示范场景正式开放。 2月28日,北京亦庄官微发文宣布,北京市高级别自动驾驶示范区为百度、小马智行、AutoX安途和文远知行颁发高速道路载人示范应用通知书,4家自动驾驶相关企业获得相应牌照,分别是百度、小马智行、AutoX安途和文远知行。 本次执行自动驾驶的出租车被称为 机器人 出租车(Robotaxi),执行的路线是从黄亦路至京台高速至大兴机场北线至机场高速至大兴国际机场,全程约40公里。由于是全新开放的示范场景,驾驶位上仍有安全员,但机器人出租车可以全程无需人工干预,如同一个老司机般将客户安全送达。 目前,乘客
[机器人]
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved