近日的特斯拉AI日活动上,特斯拉公布了最新的AI训练芯片“D1”,规模庞大,令人称奇。
该芯片采用台积电7nm工艺制造,核心面积达645平方毫米,仅次于NVIDIA Ampere架构的超级计算核心A100(826平方毫米)、AMD CDNA2架构的下代计算核心Arcturus(750平方毫米左右),集成了多达500亿个晶体管,相当于Intel Ponte Vecchio计算芯片的一半。
其内部走线,长度超过11英里,也就是大约18公里。
它集成了四个64位超标量CPU核心,拥有多达354个训练节点,特别用于8×8乘法,支持FP32、BFP64、CFP8、INT16、INT8等各种数据指令格式,都是AI训练相关的。
特斯拉称,D1芯片的FP32单精度浮点计算性能达22.6TFlops(每秒22.6万亿次),BF16/CFP8计算性能则可达362TFlops(每秒362万亿次)。
为了支撑AI训练的扩展性,它的互连带宽非常惊人,最高可达10TB/s,由多达576个通道组成,每个通道的带宽都有112Gbps。
而实现这一切,热设计功耗仅为400W。
特斯拉D1芯片可通过DIP(Dojo接口处理器)进行互连,25颗组成一个训练单元(Training Tile),而且多个训练单元可以继续互连,单个对外带宽高达36TB/s,每个方向都是9TB/s。
如此庞然大物,耗电量和发热都是相当可怕的,电流达18000A,覆盖一个长方体散热方案,散热能力高达15kW。
特斯拉展示了实验室内部的一个训练单元,运行频率2GHz,计算性能最高9PFlops(每秒9千万亿次)。
特斯拉还用D1芯片,打造了一台AI超级计算机“ExaPOD”,配备120个训练单元、3000颗D1芯片、1062000个训练节点,FP16/CFP8训练性能峰值1.1EFlops(每秒110亿亿次计算)。
建成后,它将是世界上最快的AI超算,对比特斯拉现在基于NVIDIA方案的超算,成本差不多,但拥有4倍的性能、1.3倍的能效比、1/5的体积。
关键字:特斯拉 AI
引用地址:
特斯拉发布D1 AI芯片:500亿晶体管、400W热设计功耗
推荐阅读最新更新时间:2024-11-02 17:15
十九大提到的“人工智能”到底有多重要?
10月18日,中国共产党第十九次全国代表大会在人民大会堂开幕,习近平总书记代表第十八届中央委员会在大会上作报告。下面就随网络通信小编一起来了解一下相关内容吧。 总书记的报告时长约3个半小时,3万余字,举世瞩目。人民大会堂里,热烈的掌声响起70余次。 习近平总书记说道:“深化供给侧结构性改革。建设现代化经济体系,必须把发展经济的着力点放在实体经济上,把提高供给体系质量作为主攻方向,显着增强我国经济质量优势。加快建设制造强国,加快发展先进制造业,推动互联网、大数据、 人工智能 和实体经济深度融合,在中高端消费、创新引领、绿色低碳、共享经济、现代供应链、人力资本服务等领域培育新增长点、形成新动能。支持传统产业优化升级,加快
[网络通信]
NI Connect2024 全面释放AI之力,测试测量行业迎来新拐点
NI Connect2024刚刚落下帷幕,这不仅是NI正式加入艾默生后的首场全球性行业会议,也是充满了测试测量行业对未来发展趋势的判断与创新探索的揭示。 艾默生首席运营官Ram Krishnan表示了首次参加NI Connect让他感到振奋,双方将携手为行业带来技术与商业价值的多维度突破。 会议可被概括为技术创新介绍以及合作伙伴互动两大板块。其中创新产品环节,AI作为核心关键词,贯穿了几乎由始至终的所有内容,覆盖了本年度技术创新的几乎所有亮点,这也揭示了未来几年测试测量行业转型的最显著的方向。 AI将与现有的NI品牌的产品与技术实现紧密结合,为用户的测试测量运营工作提供效率和价值。 艾默生测试与测
[测试测量]
华为苹果在手机AI发展上已遥遥领先其他对手
进入2018年最后一个季度,手机AI芯片进入一个全新时代。 恰好就在今天,苏黎世联邦理工学院公布了超过10000部安卓手机和芯片的AI Benchmark深度学习处理性能分数。结果不出意料,搭载专用AI处理器的华为麒麟970芯片得到了最高的AI-Score分数——超过6000分,几乎是第二名的三倍。 随着手机芯片AI化的两个主流玩家新品的亮相,即华为麒麟980和苹果的A12处理器的推出,已经为手机端AI芯片2019年的竞争格局定下了基调。 AI芯片在智能手机中的应用,已经从在拍照中的物体识别、场景识别(如华为P20 Pro中AI摄影大师),发展到针对视频中人体姿态、动作进行实时AI分析的全新功能(如今年IF
[物联网]
马斯克欲盖弥彰?特斯拉压根没承诺实现完全自动驾驶
6月11日, 特斯拉 CEO马斯克的推特又更新了:“公司8月份将发布全新v9.0车载系统,开始开启全 自动驾驶 功能。” 据网友反应,当时是一位 特斯拉 车主在推特上吐槽Autopilot某个路况下体验不好。马斯克回复说,这类问题将会在下一次重大系统升级中完全解决, 特斯拉 会在8月OTA v9.0系统升级。至于原因,这位CEO解释称,目前Autopilot的所有资源都集中在安全功能上,而新系统将开始提供全 自动驾驶 的(部分)功能。 显然,在成功留任公司董事长之后,硅谷钢铁侠终于“学乖”了,他此番措辞相当严谨。 说回Autopilot,2016年10月以后生产的特斯拉汽车均已装有支持无人驾驶的全部硬件,只
[汽车电子]
人工智能受热捧 芯片市场格局因此改变
10月31日消息,据国外媒体报道,目前,谷歌、facebook、微软、亚马逊和百度等互联网巨头在探索多种能推动人工智能发展的芯片技术,它们的选择将改变英特尔、英伟达等芯片厂商的命运。但目前,即使这些互联网巨头的计算机科学家,也不清楚未来的发展方向。 互联网巨头依赖安装有数以千计服务器的数据中心对外提供服务,每台服务器的引擎都是cpu(中央处理器)。但是,随着采用一种被称作深度神经网络的人工智能技术,这些公司开始采用cpu之外的其他类型处理器。通过分析海量数据,神经网络能学会完成包括从识别照片中人脸和物体到语言翻译在内的任务,它们需要cpu之外的其他类型处理器。 因此谷歌开发了tensor processing unit
[机器人]
门头沟138亿元建人工智能园区 中国打响AI人才争夺战
“中国政府近日宣布,将斥资138亿元人民币,在北京市门头沟建设一个 人工智能 (AI)工业园区,这是中国政府计划在2030年前成为该领域世界领导者的首笔重大投资。”《自然》杂志官网1月16日(北京时间)发表综述文章《中国打响AI人才争夺战》,对中国AI人才短缺问题予以关注。下面就随网络通信小编一起来了解一下相关内容吧。 文章援引微软研究院驻北京首席研究员戴维·威夫的观点:“AI的未来将是数据和人才的较量。”“要成为全球AI领导者,中国将需要庞大的、高水平的AI人才队伍做支撑。” 文章指出,中国AI公司正以令人目眩的步伐前进,至少有5家公司正在开发面部识别技术,包括Sence Time和Face++。这两家公司都在北京
[网络通信]
人工智能组队击败顶级的人类Dota 2战队
近日,一个人工智能团队彼此协作,在视频游戏Dota 2的多玩家在线战斗竞技场(MOBA)中成功击败了五名半职业人类玩家。 这个人工智能团队被称为OpenAI Five,它们由OpenAI开发,OpenAI是伊隆·马斯克和Y Combinator的总裁Sam Altman创立的人工智能研究实验室。 OpenAI的代理之前在一对一的比赛中击败了一些顶级人类玩家,但这是第一次由代理团队击败Dota 2排名超过99.95%玩家的人类玩家。团队模式更难,因为这种模式需要更多协作和长期规划。 OpenAI的联合创始人兼首席技术官Greg Brockman在推特上将这一天的游戏称为“情感搭车”。 像Dota 2这样的游戏是挑战人工智能系统并测试
[机器人]
消息称特斯拉与SK海力士正洽谈1万亿韩元的企业固态硬盘订单
10 月 25 日消息,据韩国经济日报报道,消息人士昨日透露,特斯拉正在与 SK 海力士进行谈判,特斯拉可能会下达 1 万亿韩元(当前约 51.59 亿元人民币)的企业固态硬盘(eSSD)订单。 随着业界对 AI 芯片的需求爆炸性增长,能够快速处理海量数据的 eSSD 的需求也在飙升,成为与 HBM(高带宽内存)芯片并列的 AI 芯片核心部分。 据IT之家报道,今年 7 月,特斯拉首席执行官埃隆・马斯克表示,由于现在过度依赖英伟达,而来自英伟达的 GPU 价格昂贵,特斯拉将努力开发其 Dojo 超级计算机。 为了快速推进人工智能,Dojo 需要高性能的存储设备,如能够存储、读取和写入海量数据的 eSSD。 根据 Solidigm(
[半导体设计/制造]