为了不断满足人工智能和机器学习需求的迅速增长,算力在快速增长,数据量也在快速增长。
现在ChatGPT等人工智能相关的应用程序,它的增长速度以及对数据的需求更是非常庞大,而且ChatGPT-3是以1750 亿个参数进行训练的。这些人工智能应用的快速发展,也对处理器及带宽提出了更高的要求和标准。
“市面上越来越多的客户和公司都开始专注于开发自己个性化、定制化的处理器产品,以更好地满足神经网络以及专属应用的需求。”Rambus IP核产品营销高级总监Frank Ferro说道。
此时,内存墙问题越来越成为制约算力的重要问题。Frank表示:“尽管算力的增长非常显著,但是带宽上的进步却无法改善,也就是造成两者间的不匹配,很多计算资源并没有被充分利用到。”
正是由于对带宽需求更加进一步的增加,以及对需求的上涨,驱动了像Rambus公司一样不断打造新一代的产品,提高内存带宽以及接口带宽。实际上,根据Rambus 5月初刚刚公布的2023年一季度业绩公告,在内存接口芯片的推动下,季度产品收入达到 6380 万美元,同比增长 33%,总营收达到了1亿1400万,均创出新高。
HBM还是GDDR
人工智能的应用场景可划分为训练和推理两部分,其中训练是指通过大数据训练出一个复杂的神经网络模型,通过大量标记过的数据来训练相应的系统,使其能够适应特定的功能。而推理则是利用训练好的模型,使用新数据推理出各种结论。借助神经网络模型进行运算,利用输入的新数据来一次性获得正确结论的过程。
训练和推理在算力和存储上的需求并不完全相同,训练需要更大的数据进行分析,而推理则更注重成本。也正因此,产业界诞生了包括HBM与GDDR两种存储解决方案,以适应不同的场景要求。
AI推理场景带宽大概需要400-500Gb/s的带宽,如果用HBM3,带宽可以提高至800Gb/s,但却是大材小用,同时成本会增加3-4倍之多。
HBM(高带宽内存)于 2013 年推出,是一种高性能 3D 堆叠 SDRAM架构。如其名称所述,HBM最重要的是带宽更高,尽管HBM的内存都以相对较低的数据速率运行,但其通道数更多。例如,以3.6 Gbps运行的HBM2E在存储和处理器间的通道数达到了1024条,这无法在PCB上实现,因此硅中阶层(interposal)被用来连接内存和处理器。
GDDR的历史
随着AI的推理越来越多地向边缘设备上进行集成和转移,GDDR越来越成为边缘AI处理所需。比起HBM,GDDR的历史则更为悠久。GDDR可以追溯到PC和游戏机时代,早期的GPU使用SDRAM和DDR,这与CPU相同。随着对GPU性能追求增强,推动了GDDR专用图形显示的需求增长。
2003 年 10 月,英伟达推出了 GeForce FX 5700 Ultra,搭配了256 MB GDDR2 DRAM,当时5000系列大部分仍使用DDR DRAM。直到 2018 年底 GeForce 16 和 20 系列,GDDR被用于整个产品线。如今,GDDR6 是最先进的显存解决方案。
相比于LPDDR和DDR,GDDR在带宽关键参数上具有绝对优势,在24Gb/s传输速率和32位总线的时候,GDDR6可以提供最多96GB/s的带宽,在速度、带宽和延迟方面显著优于其他产品。
Rambus GDDR6方案
Rambus提供业内鲜有的全面内存IP产品组合,包括DDR、LPDDR、GDDR以及HBM,此外还有连接类Serdes,诸如PCIe和CXL,均达到了业界领先水平。并且Rambus的解决方案大多是提供包括控制器和PHY在内的全套方案。
为了应对边缘AI对于GDDR的需求,Rambus日前推出的GDDR6 PHY,提供市场领先的数据传输速率,最高可达24 Gb/s,能够为每个GDDR6内存设备带来96 GB/s的带宽,达到了行业标杆水平。此前GDDR6的传输率为16Gb/s,总带宽64GB/s,全新的GDDR6使带宽增加了50%,从而为人工智能/机器学习(AI/ML)、图形和网络应用提供更高成本效益、高带宽的内存。并凭借与Foundry的密切合作,支持先进的工艺节点。
除了业界领先的24Gb/s性能外,Rambus GDDR6 PHY还经过了全方位的优化,可满足AI/ML及其他需要高带宽、低延迟内存解决方案的先进应用的需求。Rambus能够实现24Gb/s的数据传输速率,依靠的是其在信号完整性和电源完整性(SI/PI)方面享誉世界的专业知识,这些知识可用于设计PHY、芯片封装和印刷电路板(PCB)。
此外,Frank还强调Rambus的工程师会和客户在设计初期就紧密合作,并提供封装参考设计,以确保系统达到最优性能。
总而言之,Rambus的GDDR6方案在性能、功耗管理、集成、完整性、以及支持等方面都具有明显优势,是提升边缘计算能力的理想合作伙伴。
上一篇:使用专家验证服务管理ASIC和SoC设计风险
下一篇:Cadence全面支持Arm TCS23产品线
推荐帖子
- 关于中断和信号量的问题
- 我想在中断中发送信号量在别的地方接受信号量以保持同步通信,但发现总是中断过了几十个毫秒才能收到信号量,请问大牛们,有什么办法能解决这个问题么?或者信号量本来就是释放获取操作相对较慢?关于中断和信号量的问题中断的优先级最高,相比其他的任务所以确保你在进中断一开始就发信号,并且在中断里面尽量少地进行费时的操作中断结束了才释放信号量,而且我测过中断时间,很快的,中断回调函数里没有多少操作,几句话就return了根据你的描述应该是你接收的那个task的优先级比较低,同时别的ta
- colorcharge 嵌入式系统
- 同步设计的FPGA程序关于时钟约束的问题
- 同步设计的FPGA程序关于时钟约束的问题?在设计过程需呀关注几个问题,要求整个设计要跑到多少时钟?问题是,这个规则怎么设计?简单的说比如,系统最大要求时钟是50MHZ,那么我们做的程序约束要求是系统最大时钟的多少倍,2或3或N?大家有这方面的经验,讨论之第二。Quartus关于时序设置界面如下;上面Delayrequirements中几个参数怎样设置,标准是什么?同步设计的FPGA程序关于时钟约束的问题建议用timequest做
- eeleader FPGA/CPLD
- STM32的USART发送数据时如何使用TXE和TC标志
- 在USART的发送端有2个寄存器,一个是程序可以看到的USART_DR寄存器(下图中阴影部分的TDR),另一个是程序看不到的移位寄存器(下图中阴影部分TransmitShiftRegister)。对应USART数据发送有两个标志,一个是TXE=发送数据寄存器空,另一个是TC=发送结束;对照下图,当TDR中的数据传送到移位寄存器后,TXE被设置,此时移位寄存器开始向TX信号线按位传输数据,但因为TDR已经变空,程序可以把下一个要发送的字节(操作USART_DR)写入TDR中,而不必等到移位寄
- fish001 stm32/stm8
- launchPad 上移植 os
- 今天遇到asm(\"pop.wR3\")报错pop.wR2没报错想问一下,1.我们的程序里能用到那些寄存器?2.那些寄存器是我们可以操作的?3.移植OS需要操作R0到R15吗?4。为什么msp430需要常数发生器?5.常数发生器作用过程是怎样子的???launchPad上移植os对msp430不熟,另外msp430f2211能否支持16.384m支持?比16m大0.381m,如果支持,怎样配置这个晶振的?谢谢!!在launchPad上面移植
- heicnhei 微控制器 MCU
- 开关电源变压器与设计资料包
- 开关电源EMI滤波器原理与设计研究.doc开关电源保护电路_电源技术概要.doc开关电源变压器磁设计系列(一).doc开关电源变压器设计.doc开关电源EMI滤波器的正确选择与使用.doc30kHz半桥高频开关电源变压器的设计.docAPFC电感值计算的小工具.xlsEC35变压器的设计.xlsEC53变压器的设计.xlsEC53变压器的设计1.xlsRCC变压器参数计算.docRCC变压器设计.xlsRCC电路参数及变压器设计工具.xlsR
- arui1999 下载中心专版
- BQ25120电池管理IC问题解决分享
- BQ2512x700nA适用于可穿戴设备和物联网的低IQ高度集成式电池充电管理解决方案,集成了线性充电器、稳压输出、负载开关、通过计时器手动复位以及电池电压监测。使用过程中会遇见很多问题,分享一些网友解决的一些问题:一.BQ25120如何进入运输模式??我们选购了TI的BQ25120EVM-731的板子,想进入运输模式(shipmode),我也按照测试步骤进行了,得到的电压不是100nA以内,而是415uA左右。ShipMode
- qwqwqw2088 模拟与混合信号
- 创实技术electronica 2024首秀:加速国内分销商海外拓展之路
- 欧洲三大芯片巨头,重新审视供应链
- 一场IC设计业盛宴!10场论坛 200位演讲嘉宾,300+展商亮相2万平米专业展会!
- 富昌电子于杭州举办技术日活动,聚焦新能源“芯”机遇
- 消息称铠侠最快明天获上市批准,市值有望达 7500 亿日元
- 美国政府敲定对格芯 15 亿美元《CHIPS》法案补贴,支持后者提升在美产能
- SK 海力士宣布量产全球最高的 321 层 1Tb TLC 4D NAND 闪存,计划 2025 上半年对外出货
- 三星电子 NRD-K 半导体研发综合体进机,将导入 ASML High NA EUV 光刻设备
- 芯片大混战将启:高通、联发科涉足笔记本,AMD 被曝入局手机
- AM2F-0515SZ 15V 2 瓦 DC-DC 转换器的典型应用
- NCP45780IMNGEVB:NCP45780IMN24RTWG 评估套件
- 单端输入的典型应用 IS31AP2145 2W @ 4.2V 单声道无削波和无滤波器 D 类音频功率放大器
- 使用 Microchip Technology 的 LM385BCOA-1.2 的参考设计
- L7824A 功率 AM 调制器的典型应用(单位电压增益,IO = 0.5)
- SG1842交直流开关转换器典型应用电路
- AD9520-1/PCBZ,用于评估 AD9520-1 PLL 时钟合成器的评估板
- 【天工生科】CARD 纪念板
- SC431A 用于恒流吸收的可编程精密基准的典型应用
- 使用 ROHM Semiconductor 的 BAJ0BC0WT 的参考设计
- 非常见问题解答第223期:如何在没有软启动方程的情况下测量和确定软启动时序?
- 兆易创新GD25/55全系列车规级SPI NOR Flash荣获ISO 26262 ASIL D功能安全认证证书
- 新型IsoVu™ 隔离电流探头:为电流测量带来全新维度
- 英飞凌推出简化电机控制开发的ModusToolbox™电机套件
- 意法半导体IO-Link执行器电路板为工业监控和设备厂商带来一站式参考设计
- Melexis采用无磁芯技术缩小电流感测装置尺寸
- 千丘智能侍淳博:用数字疗法,点亮“孤独症”儿童的光
- 数药智能冯尚:ADHD数字疗法正为儿童“多动症”提供更有效便捷服务
- Vicor高性能电源模块助力低空航空电子设备和 EVTOL的发展
- 创实技术electronica 2024首秀:加速国内分销商海外拓展之路