在加州圣何塞的赛灵思开发者论坛上,我们的CEO Victor Peng与AMD CTO Mark Papermaster共同迎来了“吉尼斯”。不要误会,这不是装在瓶里的啤酒,而是写在本上的世界纪录。
AMD和赛灵思披露,二者将AMD霄龙处理器和全新赛灵思Alveo加速卡结合,以实现高性能实时AI推理。同时,他们揭晓了一项世界纪录:每秒30,000张图片的推理吞吐量。
这个令人惊艳的系统将出现在今天论坛的Alveo生态系统阵营中,它采用了具有行业领先PCIe连接性的2个AMD霄龙7551处理器,以及8个全新发布的赛灵思Alveo U250加速卡。推理过程由赛灵思机器学习套件驱动,该套件让开发者能优化部署加速的推理,并支持包括TensorFlow在内的多种机器学习架构。此次测试结果在GoogLeNet上得出(在Int8精度下运行了1个数据集),这是目前广泛使用的卷积神经网络(缩写为CNN或ConvNet)。
AMD和赛灵思在计算演进和异构系统架构上怀有共同的愿景,并且有长期的技术合作。双方针对AMD霄龙处理器和赛灵思FPGA共同优化驱动,调试互操作性。同时,双方也与行业内的其它合作伙伴在加速器的缓存一致性和互连方面进行合作(CCIX联盟专注于多处理器间的缓存一致性和存储共享)。
AMD霄龙处理器是加速处理人工智能和高性能计算工作负载的完美平台。霄龙处理器拥有32核心、64线程、8个存储通道、每插槽高达2TB的存储,128个PCIe通道,以及业内首创的x86服务器底层硬件级的嵌入式数据安全性,出色的存储能力、带宽和多核心能有效地处理在AI和高性能计算中常见的存储密集型工作负载。有了霄龙处理器,客户能更快速地收集和分析大量的数据集,帮助他们显著加快复杂问题的处理速度。
赛灵思和AMD十分看好双方技术合作的未来。双方的产品路线图相互匹配,高性能的AMD霄龙处理器及图形处理器与赛灵思加速平台,包括Alveo加速卡和即将到来的Versal产品组合能完美配合。
因此,让我们举起吉尼斯啤酒,祝福AI推理和异构计算平台创新的美好未来。
关键字:AMD 赛灵思
引用地址:
AMD与赛灵思创造了一项新的AI推理世界纪录
推荐阅读最新更新时间:2024-03-30 23:55
2012 暑期大学教师培训研讨会Xilinx Workshop 天津
尊敬的老师: 您好! 为在天津地区推广最新 Xilinx 7 系列FPGA器件与Xilinx DSP design flow,配合高校教学改革,XILINX大学计划部与依元素科技在天津大学为天津地区的教授讲师举办为期1天的workshop课程培训。本次讲师为清华大学孟宪元教授与依元素科技工程师。 本课程培训将结合实验设备和手册完成实验的讲授和辅导,通过培训,您可以了解最新的Xilinx 7 系列FPGA器件,掌握基于FPGA的DSP系统设计流程,熟悉相关实验步骤;可以胜任对大学相关课程的教学、课件的开发与科研项目的开发工作;同时也为后续课程打下很好的基础,并在此基础继续深造。 本次培训配备硬件实验平台,参加者可
[嵌入式]
AMD锐龙9 3990X处理器无人能挡 未来一两年内都不太可能有同级
多核在手,天下我有。 2019年,在 AMD 的7nm Zen2带领下,多核处理器又上了一个新台阶,主流处理器市场上有了16核锐龙9 3950X,HEDT发烧平台发了新一代32核64线程处理器,明年还有64核128线程的锐龙Threadripper 3990X处理器。 在这场核战中,友商因为坚持使用原生多核,核心数上没法硬刚的,服务器最多28核56线程,桌面最多18核32线程。现在的问题不止是友商发愁竞争,AMD的营销人员也要发愁做报告了,因为他们对标竞品的时候没法选择标的产品了。 从最新流传出来的AMD营销材料来看,AMD给24核、32核的锐龙TR 3960X及TR 3970X指定的对手是酷睿i9-10980XE、酷睿
[手机便携]
Altera、Lattice、Xilinx力图角逐低成本FPGA市场
据报道,Altera、Lattice、Xilinx等可编程逻辑供应商又掀起一波低成本FPGA的竞争,都力图角逐低成本FPGA市场,在未来的等离子显示器和触摸屏中都将出现廉价FPGA的身影。
Altera公司日前推出FPGA家庭的新成员Cyclone 2,该芯片将在2005年面市,面向低成本应用市场,采用台积电的90纳米工艺制造。
Lattice公司正试图冲破Xilinx和Altera公司对市场的垄断,该公司推出低价的ECP系列FPGA。在经历了初期的挫折后,Lattice公司主席兼首席执行官Cyrus Tsui表示,“我们现在已打开了市场,希望能夺取10%的FPGA市场。”04年第三季度,Lattice将会销售
[嵌入式]
AMD新危机:现金准备萎缩 裁员转型完成前可能就没有钱了
超微半导体 (AMD)(AMD-US) 面临一新危机-现金现金准备萎缩,当季现金减少 2.79 亿美元,报 15 亿美元。 AMD 于美东时间 18 日盘后发布 3 季财报,亏损达 1.57 亿美元,折合每股 21 美分,逊于分析师预期以及去年同期表现。同时宣布计划在今年底前将裁员总员工数的 15%,料可节省人事成本约 1.9 亿美元。 AMD 将本季表现差,归咎于来自平板电脑及行动设备的强势竞争,令个人电脑(PC)需求低迷,加上微软(MSFT-US)新作业系统 Windows 8 需求不如预期所致。 然而据《彭博社》报导,如果依照这个速度发展下去,明年此时该公司现金水平将只剩下 6 亿美元,但是不用等到那时候危机就来临了
[手机便携]
中国X86 CPU同主频能超越AMD?这才是真相
日前,由北京市网信办、北京市公安局主办的北京国际互联网科技博览会暨世界网络安全大会在北京展览馆开幕。上海兆芯(VIA Alliance Semiconductor)以“自主安全可靠的国产x86解决方案”为主题,携公司自主设计研发的国产x86通用处理器,以及PC、服务器等参展。“首次公开亮相的兆芯ZX-D系列处理器及国产整机VR体验,更成为现场瞩目的焦点”——这种报道更是出现在一些媒体的稿件中。下面就随嵌入式小编一起来了解一下相关内容吧。 中国X86 CPU同主频能超越AMD?这才是真相 而且根据现场的一块展板,兆芯ZX-D的SPEC2006定点成绩达到20分,考虑到ZX-D只有2G主频,也就是2G主频下实现了20
[嵌入式]
龙芯三号能否狙击酷睿系列
龙芯,在中国人心中是一个巨大的IP。我们这一代人对于龙芯的期待,不亚于我们的父辈期待第一颗原子弹的爆炸。作为国产芯片的“代言人”,龙芯身上承担了太多的期待。只不过国产芯片的路,显然比想象中更为艰险和漫长。2017年4月,龙芯带来了一个好消息:推出新一代代表着国产最高水平的芯片。 龙芯推出新一代代表着国产最高水平的芯片。 其中,最为亮眼的莫过于龙芯 3A3000 和 3B3000。从实测数据来看,这款芯片的综合性能已经超越了 Intel Atom 系列和 ARM 系列 CPU。这个性能,用中国工程院院士倪光南的话来说,已经达到了可用的水平。日常的使用、办公、出差都没有任何问题。 很多童鞋都好奇,龙芯的芯片究竟有多
[半导体设计/制造]
如何解决嵌入式视觉系统所面临的挑战?
嵌入式视觉系统应用到很多领域,比如工业自动化、无人机、交通监控、移动设备、汽车等,凭借其强悍的处理性能和多样化的功能取代传统的人工来提高生产效率。随着科技的发展和更多业务需求的增长,嵌入式视觉系统也迎来了更多的挑战,比如功耗、复杂的算法、处理器的性能、更高的图像分辨率等,人们需要的是更加智能化的系统,嵌入式视觉系统是实现智能化系统重要的组成部分。 作为系统的输入CMOS和CCD是目前图像采集采用的两种领先技术,CCD能够提供更高的图像质量,但是经过过去10年的发展CMOS与其的差距也越来越小了,在功耗、成本和功耗方面大有超过CCD之势。此外很多应用都需要高效的并行处理系统,因此需要采用专用的硬件处理器比如GPU、DSP、FPG
[工业控制]
AMD 扩展市场领先的 FPGA 产品组合,推出专为成本敏感型边缘应用打造的AMD Spartan UltraScale+
2024 年 3 月 5 日,加利福尼亚 州 圣克拉拉 —— AMD(超威,纳斯达克股票代码:AMD)今日宣布推出 AMD Spartan™ UltraScale+™ FPGA 系列 ,这是广泛的 AMD 成本优化型 FPGA 和自适应 SoC 产品组合的最新成员。Spartan UltraScale+ 器件能为边缘端各种 I/O 密集型应用提供成本效益与高能效性能,在基于 28 纳米及以下制程技术的 FPGA 领域带来业界极高的 I/O 逻辑单元比,较之前代产品可带来高达 30% 的总功耗下降 1 ,同时还涵盖 AMD 成本优化型产品组合 中最为强大的安全功能集 2 。 AMD 自适应和嵌入式 计算事
[嵌入式]