春节也没有阻挡AI跨越的脚步,2月16日凌晨,美国OpenAI公司的视频生成模型Sora再次冲击AI界,成为继ChatGPT后又一现象级应用。Sora的问世令世人惊呼:现实不存在了。
短短几日,AI又掀起新一轮浪潮,而作为其核心动力的AI芯片,也迎来巨变。
打倒英伟达
看着英伟达赚钱,市场玩家分外眼红。为了抢占市场,巨头不惜砸大钱布局市场。
先是OpenAI首席执行官山姆·奥特曼(Sam Altman)万亿美元造芯片,再是自嘲为“秃头骗子”的孙正义1000亿美元造AI芯片。
山姆·奥特曼因为万亿美元而登上头条新闻,他曾表示半导体行业需要他,而建立庞大的芯片制造网络需要通过向全球投资者寻求大量资金,他则需要集高达5万亿~7万亿美元才能实现自己的雄心壮志。
这个数字本身很荒唐,从字面上看,这意味着将英伟达的市值合并了八倍。而去年,全球芯片的销售额达到了5270亿美元,到2030年,预计还会增至每年1万亿美元。根据行业组织SEMI的估计,去年全球半导体制造设备的销售额为1000亿美元。
更难的是,如果山姆·奥特曼要向中东投资者寻求融资,或者和现在台积电、三星合作,没有美国政府绿灯,事情很难推动。
著名的芯片设计专家吉姆·凯勒(Jim Keller)称OpenAI首席执行官萨姆·奥特曼(Sam Altman)的“人工智能野心”是不必要的,声称他可以他可以用不到一万亿美元来完成山姆·奥特曼的工作,重点应该放在架构改进上。同时还不忘补刀一句:“考虑到山姆·奥特曼是这个行业的新手,我想知道他从哪里得到这个想法。”
孙正义则也在打AI芯片市场的主意。据称,他正寻求高达1000亿美元的资金,来创建一家芯片合资企业,以便和英伟达竞争。该项目名为Izanagi(伊邪那岐),成为与Arm互补的芯片公司,希望能扩大Arm在AI市场的影响力,同时探索不同类型的下一代芯片。
知情人士称,Izanagi项目的形式与山姆·奥特曼的野心截然不同,一种可能的情况是软银将提供300亿美元资金,剩余700亿则来自中东的机构。一旦成功,该项目将成为自ChatGPT问世以来,在AI领域规模最大的投资之一。此外,孙正义曾试图投资另一家开发基础AI 模型的公司,并请求该公司协助其开展芯片业务,但遭到拒绝。除了追求AI相关投资以外,软银也持续探索安谋芯片设计技术的应用方法。
这一消息让孙正义风光一时,开始翻山。春节期间,Arm的市值在三个交易日就大涨超过了一倍,而持有Arm股份约90%的软银股价亦大幅飙升近20%。
AI芯片的生意就这么香?那是当然。最近,英伟达首席执行官黄仁勋(Jensen Huang)预测,在未来五年内,AI支持的数据中心市场将扩大到2万亿美元
有人撒钱,也有人“卖身”
AI芯片的钱,可没那么好挣。
曾经AI芯片领域的佼佼者,英国芯片公司Graphcore,由于未能如期从AI的快速发展中获得收益,目前正准备通过与大型科技公司讨论可能的交易,从而筹集新的资金来填补巨大的亏损。
与此同时,公司的主要投资者也大幅提高对公司股份的估值,这可能预示着交易额将超过5亿美元(约合4亿英镑)。传闻潜在买家包括英国Arm、日本SoftBank及OpenAI。一位投资者估计,Graphcore估值定在了5.28亿美元。
当初的Graphcore专攻AI领域,挑战英伟达等巨头。但实际情况却是,公司收入去年下降了46%,亏损还在持续扩大,筹集资金还遇到了困难。而现在,为了降低成本,Graphcore不仅进行了裁员,还关闭了国际办公室。
Graphcore表示,其2022年亏损增加了11%,达2.046亿美元,收入则从500万美元下降到270万美元。此外,公司在年末时,手头只有1.57亿美元现金。
鸡生蛋,蛋生鸡
用AI芯片,我们炼出了AI大模型。而现在,AI又反被用在造芯片。
日前,消息称英伟达已经开发了一个名为ChipNeMo的人工智能系统,旨在加快其GPU的生产速度。
设计GPU通常需要大量人力。英伟达应用深度学习研究副总裁Bryan Catanzaro表示,通常需要近1000人来构建一枚芯片,每个人都需要了解设计过程的不同部分如何协同工作。而hipNeMo的聊天机器人功能能够回答与芯片设计相关的查询,例如有关GPU架构和芯片设计代码生成的问题。
用AI帮忙造芯片,英伟达并非独一家。
去年七月,谷歌的DeepMind开发了一款AI系统,可以加速设计最新一代自定义芯片的过程;几个月后,软件巨头Synopsys推出了一款旨在提高芯片工程师生产力的AI工具;纽约大学等大学也在研究如何利用生成式人工智能来更快地设计芯片。
可以说,有了AI,人类的想象力都不够用了。
追着大模型跑
AI芯片够用吗?那一定是远远不够。
据OpenAI测算,自2012年以来,AI模型训练算力需求每3~4个月就翻一番,每年训练AI模型所需算力增长幅度高达10倍。而这种需求,就连摩尔定律,都追不上AI的进化速度了。
根据摩尔定律,芯片计算性能约每18~24个月翻一番。目前,尽管H100比A100性能有明显提升,但并没有像模型训练算力需求那样有明显数量级的增长。
这种情况下,专家也预测,未来几年OpenAI仅训练模型⾄少还需要200~300亿美元的硬件,Google需要200-300亿美元,Anthropic需要100-200亿美元,未来几年至少投入1000亿美元纯粹用到训练⼤模型。
据市调机构Gartner的数据,用于执行AI工作负载的芯片市场,正以每年20%以上的速度增长。分析师预测,2023年AI芯片市场规模将达534亿美元,比2022年增长20.9%,2024年将增长25.6%至671亿美元。预计2027年AI芯片营收将是2023年市场规模的两倍以上,达1194亿美元。
AI芯片,必然是一个好生意,不过这个领域太卷了,Intel、Qualcomm、Google、Meta、Microsoft……每个巨头都想分一杯羹,这种胜景,恐怕未来市场的洗牌更加剧烈。
国产自研AI芯片发展如何了?
去年10月,美国千方百计阻止英伟达向中国出售尖端AI芯片,不想放弃中国市场的英伟达,迅速推出中国特供版,但对国内来说,却不香了。
所谓中国特供芯片,性能砍了25%,但减量不减价,国产厂商则纷纷点名华为,尤其是华为升腾910B芯片。
那么,除了华为,我国还有哪些AI芯片企业值得关注?
寒武纪
成立于2016年3月,产品布局全面覆盖云端、边缘端和终端场景。
2022年寒武纪的云端产品线思元290、思元370 等产品成功导入了阿里云等多家头部客户。云端训练新品思元590芯片快速迭代中,该芯片浮点运算能力较上一代290产品有较大提升,云端 产品线有望更进一步。
沐曦科技
2020年9月成立于上海,致力于为异构计算提供全栈 GPU 芯片及解决方案,均采用完全自主研发的GPU IP,拥有完全自主知识产权的指令集和架构,配以兼容主流GPU生态的完整软件栈(MXMACA),具备高能效和高通用性的天然优势。
沐曦MXN系列GPU(曦思) 用于AI推理,MXC 系列 GPU(曦云)用于AI训练及通用计算,以及MXG 系列 GPU (曦彩)用于图形渲染,满足数据中心对“高能效”和“高通用性”的算力需求。
燧原科技
正式注册成立于2018年,专注人工智能领域云端算力产品,提供全栈自研、具备完全自主知识产权的通用人工智能训练和推理产品。
燧原科技的产品被广泛应用于互联网、金融、交通、能源及新基建等多个行业和场景。对于不同使用场景,燧原科技拥有多个与之对应的产品线。云燧T2X、T1X 系列是人工智能训练加速卡,具有强大性能和可拓展性,面向数据中心的多种场景;云燧 i2X,i1X 系列则是人工智能推理加速卡,其模型覆盖面广,可广泛应用于计算机视觉、语音识别与合成、自然语言处理等场景。
壁仞科技
创立于2019年,致力于开发原创性的通用计算体系,建立高效的软硬件平台,同时在智能计算领域提供一体化的解决方案。
壁仞科技主要产品是BR100系列通用GPU芯片。BR100针对人工智能(AI)训练、推理,及科学计算等更广泛的通用计算场景开发,主要部署在大型数据中心,依托“壁立仞”原创架构,可提供高能效、高通用性的加速计算算力。
摩尔线程
成立于2020年,是一家以全功能GPU芯片设计为主的集成电路高科技公司。其致力于创新面向元计算应用的新一代GPU,构建融合视觉计算、3D图形计算、科学计算及人工智能计算的综合计算平台,建立基于云原生GPU计算的生态系统。
全志科技
成立于2007年,是卓越的智能应用处理器SoC、高性能模拟器件和无线互联芯片设计厂商。
其V853集成新一代星光级画质引擎,可为客户提供专业图像质量。其采用全志自研的全新一代全通路线压缩架构技术,可在典型64M低内存情况下实现多路图像编码同时具备高实时性,高准确率的人形/人脸检测及识别。
全志科技多目异构AI视觉芯片V853
云天励飞
成立于2014年8月,是拥有算法、芯片和大数据全栈式能力的人工智能企业。在AI芯片领域,公司是业内少数基于对人工智能算法技术特点的深度分解及对行业场景计算需求的深刻理解,通过自定义指令集、处理器架构及工具链的协同设计,自主研发芯片并已实现流片、量产及市场化销售的公司之一。
DeepEdge10采用国内先进工艺、支持多芯粒扩展的Chiplet技术,支持大模型推理运算。其采取8核CPU设计,包含CV硬件加速单元,满足SLAM、路径规划的算力要求,计划支持各类方案厂商基于该芯片研发相关场景的解决方案,可广泛应用于AIoT边缘视频、移动机器人等场景。
DeepEdge10
超星未来
成立于2019年,由清华大学车辆与运载学院、电子工程系跨学科联合成立,拥有行业领先的计算架构设计能力和算法优化能力。公司以软硬件协同优化为核心思想,主要面向智能驾驶前装量产场景和边缘侧AI场景,提供以AI计算芯片为核心、软硬件协同的高能效计算方案。
目前,超星未来已发布智能驾驶计算芯片“惊蛰R1”、智能计算平台开发套件“NE100”、边缘计算模组“NM10”等产品,并配套提供智能驾驶参考方案“NOVA-ADCU”、高能效AI处理架构“平湖”以及全流程开发工具链“鲁班”。
惊蛰R1
清微智能
该公司是可重构计算(CGRA)领导企业,全球首家也是出货量最大的可重构计算芯片商用企业。核心团队来自于清华大学以及海思、英伟达、苹果、AMD等知名企业。
2019年,清微智能量产全球第一款可重构智能语音芯片TX210。TX536则是一款行业专用的智能高清IP摄像机SoC,集成功能强大的可重构计算(CGRA)架构ISP、业界最新的H.265视频压缩编解码器,3D计算加速单元。
智能高清IP摄像机SOC TX536
亿智电子
是一家以AI机器视觉算法和SoC芯片设计为核心的系统方案供应商。2019年,发布了首款基于自研NPU的边缘侧/端侧推理AI SoC芯片,至今已完成三代自研AI芯片的规模量产,打造了覆盖边缘/端侧AI全场景的芯片产品矩阵。
SV822和SV820系列芯片是亿智电子2022年推出的AI SoC芯片,可广泛应用于智能安防场景。
SV822/SV820系列芯片
SynSense时识科技
创立于2017年,是全球领先的类脑智能与应用解决方案提供商。该公司提供全栈式解决方案,包括硬件设计与开发、软件配置、算法开发、解决方案开发与优化等定制化服务。基于全新一代的全并行架构和算法,在功耗、实时性、隐私性、成本等方面较传统解决方案具有很大优势,可广泛应用在智能玩具、可穿戴设备、无人机、AR/VR等边缘计算场景。
Speck是全球首款基于类脑计算的可商用“感算一体”动态视觉智能SoC,实现了基于异步逻辑范式的大规模脉冲卷积神经网络芯片架构。作为融合“类脑+类眼”的新型轻量级AI系统,Speck支持各类动态IoT视觉场景,保证低功耗运行的同时,可进行低延迟、高时间分辨率的视觉事件信息数据捕捉和高速实时运算,可广泛应用于移动设备、物联网、智能家居、智能玩具、智能安防、无人机等领域。
“感算一体”动态视觉智能SoC:Speck
视海芯图
成立于2020年12月,定位于多模态AI芯片,致力于打造数据流和计算阵列自适应的多态神经网络处理器PTPU,为Transformer、Bert和GNN等不断发展新兴AI模型提供有效算力,也可以有效支持3D点云、视频和语音等多模态融合、语义分割和理解。
SH1210芯片是一款高性能、低功耗的专业3D视觉AI芯片。SH1580则是一款高性能多模态AI芯片,自主设计了多态神经网络处理器(PTPU)和3D视觉ISP。
低功耗3D视觉AI芯片SH1210
星辰起源
成立于2020年,是一家专注于高性能、高品质的数字集成电路芯片设计(Fabless)及系统级方案服务提供商。
天璇SA101采用高性能自研混合现实空间计算架构MPU,专门针对XR(VR/AR/MR)应用设计而研发。结合算法芯片化及可重构计算两项技术,全数字化技术路径,在算力层实现突破,同等功耗下算法提升数倍于传统架构芯片,可重构数字存算一体架构,突破冯诺依曼瓶颈,提高芯片能效。可应用于混合现实终端、AIOT、消费电子、辅助驾驶、无人机、XR、机器人等新兴行业。
天璇SA101
虽然国内涌现了大量AI芯片企业,但从整体算力来看,仍与国外存在差距,同时缺乏制造能力与生态,未来这方面将会是国产AI芯片争夺市场的关键。
上一篇:电力行业,米尔STM32MP135开发板IEC61850协议移植笔记
下一篇:三星宣布与 Arm 合作,以 GAA 代工技术优化下一代 Cortex-X CPU 内核
- 使用 ROHM Semiconductor 的 BD46352 的参考设计
- LTC7149EFE 12V 输入至 -5V 输出、1MHz 降压稳压器的典型应用电路
- 具有双输入的 LTC3126HFE 5V、750kHz 降压转换器的典型应用电路
- TS1084 5A 低压降正压稳压器的固定输出电压典型应用
- KITFS4508CAEEVM: FS4508, 系统基础芯片, ASIL B, 线性0.5 A Vcore, FS1b, LDT, CAN
- LTC2946HDE 双电源、电荷和能量监视器的典型应用,使用单个光耦合器进行电流隔离,并在任一电源出现故障时使用阻塞二极管来保持数据
- 使用 LTC3639HMSE 低输出电压纹波 100mA 稳压器和 75ms 软启动的典型应用
- 使用 ON Semiconductor 的 NCP1216A 的参考设计
- 具有目标数据输出的汽车级 77GHz 雷达模块参考设计
- 用于完整 3V、12 位、1MHz 模数转换系统的 AD8604DRUZ-REEL 运算放大器的典型应用