中国新超算彻底告别进口CPU 国产芯片已可与国外抗衡-电子工程世界

分享到: 微博; QQ; 微信; LinkedIn

　　来源：观察者网

　　日前，飞腾已经完成FT-2000plus服务器CPU的研制工作，飞腾公司的合作伙伴正在积极研发相应的整机产品。FT-2000plus这款芯片是以FT2000为基础的改进版本，虽然在单核性能上和Intel还存在一定差距，但在多核性能上，已经达到Intel服务器CPU E5 主流产品的水平。

　　据传，国防科大正在研发的1000P超算天河3号（性能指标是神威太湖之光的8倍），其原型机的CPU或将采用FT-2000或其后继产品作为主控CPU。考虑到在天河2A上，国防科大已经用自主研发的加速器矩阵2000取代Intel的Xeon Phi计算卡。从今往后，天河系列超算也将和神威系列超算一样，彻底告别国外CPU或加速器，实现芯片的全国产化。

　　（网传天河3号原型机计算节点，板上有2片FT-2000，业内专家告诉笔者，这是误传）

　　FT-2000系列芯片是厚积薄发的结果

　　近年来，国内某些企业热衷于“走捷径”，先后与Intel、IBM、ARM、高通等国外芯片巨头技术合作或合资，有的公司把国外的CPU IP授权买回来做集成，就宣传是自主知识产权，甚至还有公司将国外的芯片包装一下变成国产芯片。

　　虽然这种走捷径的做法可以在短时间内拿出性能不错的芯片，但由于国外公司始终怀有“教会徒弟、饿死师傅”心理，不会将最先进的技术授权给中国，而且国内单位在拿到国外技术授权后，容易陷入知其然，不知其所以然的困境，不具备技术发展的可持续性，在国外公司开发出下一代产品之后，只能再次引进国外技术。

　　相比之下，飞腾选择了较为困难的自主研发道路，虽然发展会慢一些，但更具后劲。早在十多年前，飞腾就基于IA-64指令集设计CPU，之后又以Sparc开源代码为基础设计了FT-1000和FT-1500两款CPU，FT-1000被用于天河1号超算，FT-1500被用于天河2号超算。在2012年前后，飞腾选择了ARM阵营，获得了ARM指令集授权，可以基于ARM 64指令集设计自己的CPU。并在数年时间里先后开发出了FTC660、FTC661两款CPU核，以及FT-1500A/4、FT-1500A/16、FT-2000、FT-2000plus等CPU。

　　FT-1500A/4被用于PC和笔记本，采用28nm制造工艺。集成了4个FTC660 CPU核，主频1.5GHz—2.0GHz，集成了2MB二级cache和8MB三级cache，集成了2个DDR3-1600存储控制器，可提供25.6GB/s访存带宽，最大功耗为15W。

　　FT-1500A/16被用于服务器，采用28nm制造工艺。集成了16个FTC660 CPU核，主频1.5GHz，集成了8MB二级cache和8MB三级cache，集成了4个DDR3-1600存储控制器，可提供51.2GB/s访存带宽，最大功耗为35W。

　　FT-2000采用28nm制造工艺，可被用于超算计算节点和高性能服务器。集成了64个FTC661处理器核。工作主频1.5GHz—2.0GHz。集成了32MB二级cache，扩展支持128MB三级cache。支持16个DDR3-1600存储控制器，可提供204.8GB/s访存带宽。

　　最新的FT-2000Plus采用了台积电16nm制造工艺，主频为2.0GHz—2.4GHz，集成了64个FTC661处理器核。为了提高集成度，抛弃了L3cache，将DDR4内存控制器集成到了片内。目前，飞腾系列CPU已经形成了一个家族，可满足党政军多个领域的实际需求。

　　足以和Intel主流服务器抗衡 CPU 在国内ARM服务器CPU中处于领跑位置

　　根据实际测试FT-2000在2GHz主频下，采用GCC4.8编译器，SPEC2006的测试成绩分别为SPECint_rate2006：570、 SPECfp_rate2006：482，与Intel Xeon E5-2695v3相当。

　　而最新的FT-2000Plus因为删除了L3导致在SPEC测试中某些子项分数下降，把集成DDR4等改进带来的提升抹平了，使FT-2000Plus在同主频下与FT-2000的性能相差不大。那飞腾公司为何要这么做呢？原因应该是为了商业化，提高FT-2000plus的集成度可以方便主机厂，降低开发FT-2000plus整机产品的成本。不过，在使用了更好的台积电16nm制造工艺之后主频可以最高稳定到2.4G，使FT-2000plus相对于FT-2000还是有不小的性能提升，能够满足高端服务器和超算主控CPU的性能要求。

　　近年来，不少厂家都开始着手开发ARM服务器CPU。在国内，华为和华芯通也在着手开发ARM服务器CPU。不过，就目前而言，飞腾的ARM服务器CPU在性能上处于绝对领先地位。

　　华芯通是中国大陆与高通成立的合资公司，从高通手中获得了源码并基于该源码设计自己的CPU。不过，由于华芯通北京研发中心启用时日尚短，正式商用产品问世尚需时日。

　　相比之下，华为研发ARM服务器CPU的时间要早得多，而且在北京和美国都有研发中心，已经有产品Hi1612问世。虽然在宣传上，华为声称Hi1612是“自主研发”，“除存储单元外均具有完整知识产品”，但其实上，这款服务器CPU采用台积电16nm制造工艺，其内核是ARM Cortex A57。

　　而且Hi1612的性能也比较一般，也许是因为华为缺乏服务器CPU设计经验，这款服务器CPU的性能相对有限，以飞腾的FT2000作参照，华为的这款服务器CPU在制造工艺领先2代的情况下，以FT2000一半的功耗实现了不足FT2000一半的性能。

　　不过，据小道消息，华为的下一款ARM服务器正在研发中，而且位于龙芯公司斜对门的华为北京研发中心已经拿ARM Cortex A72修改了至少2个版本（华为有钱，买了ARM的“大礼包”），加上位于美国的研发中心可以提供技术支持，在有ARM Cortex A72为基础的情况下，华为的下一款ARM服务器CPU的性能值得期待。

　　结语

　　诚然，FT-2000/FT-2000plus还是存在一些短板的，比如单线程性能偏弱。无论是FT2000，还是FT-2000plus，虽然在多线程性能上达到了Intel中高端服务器CPU的性能，但在单线程性能上，还是有不小的差距——即便主频控制在2.5GHz，Intel的服务器CPU的SPECint_base2006的成绩也在25以上，而FT2000的SPECint_base2006只有12.4（@2.0GHz），FT-2000plus预计也只有14+分（@2.4GHz）。

　　软件生态也是一个问题，由于飞腾选择了跟随ARM生态的道路，使飞腾的商业化推广很大程度上取决于ARM生态的完善情况。而在服务器生态上，ARM和X86相比差距较大，这也非常不利于FT-2000/FT-2000plus的商业化。

　　不过，万事开头难，迄今为止，湖南长城银河公司、湘计海盾公司、航天706所已经推出了基于新一代飞腾微处理器的自主可控产品。

　　（飞腾CPU整机产品）

　　长城银河公司就开发出了EF111系列计算服务器、智恒AF21B一体机、致翔NF15N笔记本电脑和世恒KF510系列桌面型台式计算机等整机产品。其中，EF111系列计算服务器基于全新一代国产FT2000 Plus 处理器的高性能服务器，可应用于ERP、高性能数据库、虚拟化和商业智能、大数据分析等领域。航天科工二院 706所也推出天玥64核高端机架式服务器。

　　根据公开资料显示，天河3号的原型机已经选定FT-2000系列芯片作为其计算节点上使用的CPU。这不仅对天河超算摆脱进口芯片掣肘是一个好消息，对于FT-2000来说，也是一个非常好的广告。

关键字：CPU 引用地址：中国新超算彻底告别进口CPU 国产芯片已可与国外抗衡

上一篇：大联大世平集团推出基于TI多参数生物信号监测系统参考设计
下一篇：英特尔宣布与Facebook合作开发AI芯片

推荐阅读最新更新时间：2024-05-03 01:48

Windows操作系统多核CPU内核线程管理方法

1 引言本文分析了Windows 系统的进程调度机制,并设计了一种基于Windows 操作系统内核驱动的多核CPU 线程管理方法,实现了一个基于Windows 内核驱动的线程管理服务系统，它能让用户根据每一个任务线程对CPU 资源的需要程度和对实时性的要求，在多核CPU上合理为线程分配CPU 核。 Windows 内核调度结构体关系图图1 Windows 内核调度结构体关系图 2 Windows 系统的进程调度方法分析 Windows NT 中的每一个进程都是EPROCESS 结构体。此结构体中除了进程的属性之外还引用了其它一些与实现进程紧密相关的结构体。例如，每个进程都有一个或几个线程,线程在系统中就是ETHREAD 结构体

[嵌入式]

AMD总裁苏姿丰：重返高端CPU HBM显存将成黑马

6月3日消息，AMD公司在台北电脑展期间发布了旗下最新的第六代APU Carrizo，成为首款使用片上系统（Soc）设计的笔记本电脑处理器，支持HEVC硬件解码、4K高清流畅运行，支持 DirectX 12，兼具长续航等特性。同时，在此次发布会上，AMD还透露了搭载HBM高频宽显存技术的GPU。发布会后，AMD总裁兼CEO 苏姿丰接受了网易科技的采访，详细阐述了AMD基于这两款新产品的战略规划。运算和绘图是核心优势第六代APU基于挖掘机核心和第三代次世代图形核心（GCN）架构设计，提供多达12个计算核心（4个CPU + 8个GPU），在系统运算能力上有很大提升。在追求移动便携的今天，不管是办公用笔记本还是游戏本

[手机便携]

S7-1200 CPU与S7-200 SMART S7通信

S7-1200 CPU 与 S7-200 SMART S7通信（S7-1200 作为服务器） S7-200 SMART CPU 固件版本 V2.0 及其以上，本体集成的 PROFINET 通信接口支持 S7 通信，可以通过向导或使用 GET/PUT 指令两种方式实现，最多可以建立 16 个 S7 连接，其中包括：8 个客户端，8 个服务器。 S7-1200 CPU 本体集成的 PROFINET 通信接口可以做 S7 通信的服务器。S7-1200 仅支持 S7 单边通信，做客户端仅需单边组态连接和编程，而做服务器端则只需准备好通信的数据即可。S7-1200 作为S7服务器，可以使用 6 个动态连接资源。本文以 S7-200

[嵌入式]

S7-1200 <font color='red'>CPU</font>与S7-200 SMART S7通信

英特尔低端酷睿CPU上市海尔电脑再当首发先锋

6月2日，英特尔酷睿架构的中低端E21XX奔腾双核系列以及4XX赛扬系列在东莞隆重首发，并于6月3日与全球正式同步发行销售。本次产品发布活动，标志着英特尔公司在不到一年的时间内，彻底完成了全线产品的“酷睿”转型。据了解，为了配合酷睿新产品的发布，包括海尔、富士康等多个合作伙伴一起举行系列促销和推广活动。同时，在活动现场，各方还联合启动了2007东莞电子竞技“酷睿挑战赛”。据介绍，能够成为英特尔本次活动“左膀右臂”的海尔电脑毫无疑问地成为了英特尔新款中低端处理器台式机首发系统商。英特尔中国区技术总监靳光辉也明确表示，海尔在这次切换中对英特尔的支持最为坚决，因此英特尔也坚决支持海尔在本次英特尔全线酷睿架构处理器“出海”中领跑。而富

[焦点新闻]

GPS设计技术难点与解决方案

　　车载GPS的信号漂移问题成因及对策　　目前的GPS语音导航产品在进行路测的时候，当时速超过40千米的时候，信号接收或多或少会出现“漂移”。对此，周扬认为很正常，因为现有GPS静止状态下定位精度仅为5到20米，使得开车过程中出现漂移现象，车速较快时更为明显，而时间、地点、气候等都会影响GPS的定位精度。但最主要的原因还在于硬件的处理能力（特别是CPU的处理速度和GPS算法）和导航软件的便捷性方面。　　对此，有网友指出，在解决该问题之前，首先要区别是软件还是硬件的问题。天气晴好时，将汽车高速行驶时检测的GPS输出信号同停止时的数据相比较，可得出“漂移”的实际数据。在问题的解决方面，他认为，GPS定位精度在现有条件下基本

[嵌入式]

君正刘强：做大做强国产CPU

北京君正董事长刘强 “我的想法很简单，就是想让国产的 CPU 能赚钱！”这是北京君正集成电路股份有限公司董事长刘强参加 LAOYAOBA TOP 10 CLUB （即移动互联 CEO 俱乐部）时，在会议上发言的第一句话，一句铿锵有力的话语，显示出刘强想要将国产 CPU 做好做强的决心，也正是这句话，激励着刘强和君正人 7 年来不断前进。从两年前开始，北京君正转向以手机、平板为代表的智能终端处理器领域。这是一个充满机会的巨大市场，有一组数据足以说明这个市场的火热：今年第二季度全球的智能手机出货量是 1.58 亿部，中国智能手机的出货量是 4200 万部，增幅速度是全球的 4 倍。智能终端增

[手机便携]

解析80C51单片机中的cpu、存储器配置以及并行输入/输出口

单片机按存储结构可分为二类：一类是哈佛结构，另一类是普林斯顿结构。 ①哈佛结构所谓哈佛结构是指程序存储器地址空间与数据存储器地址空间分开的单片机结构，如80C51单片机采用哈佛结构，所以80C51单片机的程序存储器地址空间与数据存储器地址空间是分开的，各有64K存储空间。 ②普林斯顿结构所谓普林斯顿结构是指程序存储器地址空间与数据存储器地址空间合并的单片机结构，如MCS-96单片机采用普林斯顿结构，所以MCS-96单片机的程序存储器地址空间与数据存储器地址空间是合并的，共有64K存储空间。 1．单片机的CPU 图1是80C51单片机的内部结构框图。若除去图中的存储器电路和I/O部件，剩下的便是CPU。它可以分为运算器和控制

[单片机]

扬智科技最新H.265机顶盒芯片配备MIPS CPU

Imagination Technologies今日宣布扬智科技新一代支持H.265视讯标准的机顶盒芯片配备MIPS 处理器，目标瞄准有线、卫星、地面、IP及混合型机顶盒市场，MIPS CPU核心不仅在机顶盒市场具举足轻重地位，亦广泛运用于许多常见的电子产品。扬智芯片整合最先进技术，提供服务运营商及硬件制造商具备绝佳效能表现与成本效益的新一代机顶盒解决方案，最新配备MIPS处理器的芯片方案，整合高容量L2高速缓存，可提升针对HTML-5应用的运作表现；另亦配备扬智最新高级安全引擎，支持CAS及DRM技术，保护影音内容安全无虞；此外，扬智芯片提供全新用户接口，协助内容开发商在各种操作系统下开发多元丰富的数字电视与机顶盒应用服务。

[家用电子]

热门资源推荐
热门放大器推荐

小广播

热门活动

换一批

■2024 瑞萨电子MCU/MPU工业技术研讨会——深圳、上海站，火热报名中

■罗姆有奖直播 | 重点解析双极型晶体管的实用选型方法和使用方法

■STM32N6终于要发布了，ST首款带有NPU的MCU到底怎么样，欢迎小伙们来STM32全球线上峰会寻找答案！

■免费下载 | 安森美电动汽车充电白皮书，看碳化硅如何缓解“里程焦虑”！