英特尔架构日发布全新架构和技术记住这六点-电子工程世界

分享到: 微博; QQ; 微信; LinkedIn

在近日举行的英特尔架构日活动上，英特尔公司处理器核心与视觉计算高级副总裁Raja Koduri介绍了英特尔在设计与工程模式方面的战略性转变。这种转变整合了一系列基础构建模块，包含英特尔公司领先的技术和IP（知识产权）组合。这一方法旨在让英特尔加快创新步伐，并将扎根于六大战略支柱：

图片.png
英特尔公司处理器核心与视觉计算高级副总裁Raja Koduri

制程——拥有领先的制程技术，仍是建构领先的产品之关键。先进的封装解决方案在三维空间中扩展晶体管密度，将赋予英特尔指数级提升计算密度的能力。

架构——未来，英特尔会通过先进的封装和系统集成技术，把多样化的标量（scalar）、矢量（vector）、矩阵（matrix）和空间（spatial）计算架构组合部署到CPU、GPU、加速器和FPGA芯片中，并通过可扩展的软件堆栈释放强大的能力。

内存——大容量、高速度的存储对于下一代计算工作负载至关重要。英特尔拥有独特的优势，能将内封存储芯片和英特尔傲腾技术结合在一起，填补内存层级中的空白，从而在更靠近硅芯片的地方提供带宽。

超微互连——通信技术大到面向5G基础设施的无线连接，小到芯片级封装和裸片互连。只有提供全面的领先互连产品，才能实现大规模的异构计算格局。

安全——随着安全威胁的不断涌现，使用英特尔的各种组件，可以建立更加可靠的安全策略。英特尔拥有独特优势以提供安全技术，帮助实现端到端的全面提升，并让安全性成为关键的差异化因素。

软件——对于全新硬件架构的每一个数量级的性能提升潜力，软件能带来两个数量级的性能提升。对于开发者来说，拥有一套利用好英特尔芯片的通用工具集，对于获得性能的指数级扩展至关重要。

针对一些大家关心的问题， Raja Koduri做出了回答。

1) 在新的计算时代，为什么英特尔的产品和技术战略应当基于这六大支柱？

计算的格局在过去十年发生了重大变化。我们所在的世界，数据产生的速度超出了我们分析、理解和帮助保护这些数据的能力。我们看到，这对计算架构提出了巨大需求，这些架构快速演进并呈指数级扩展。面向未来五年，我们有一个大胆的工程愿景，那就是在10毫秒内，向世界上每个人提供每秒万万亿次浮点运算的计算能力和10PB数据。我们认为，这六大技术支柱是我们驱动所需产品创新以实现这一目标的关键推动力。

2) 六大支柱领域的知识产权和资源如何让英特尔在竞争中处于最有利的位置并提供差异化的产品？

在我加入英特尔时，我们可用的知识产权的绝对数量及其广度令人震撼。我在这个行业工作了近30年，从未见过这样的情况。当我们在客户端、边缘和云计算环境中推动一波又一波创新时，这些庞大的资源在每个支柱领域都为我们提供了差异化的技术组合。我相信，在所有六大领域我们都拥有独特的领先优势，为持续创新奠定了基础。

3) 创新模式为什么必须改变？

世界在变，我们的业务也已经改变；我们面对的是一个价值3000亿美元的潜在市场规模*。对计算需求的不断增长，让英特尔有机会以前所未有的方式来寻求改变、重塑和扩展。不仅是对于我们自己，为了那些把业务、关键数据和计算需求托付给我们的客户来说，我们有责任重塑我们的产品和战略，为接下来十年以及更远的未来开发技术。

4) 英特尔当下和未来如何运用这个模式？

我们现在正把这个模式（六大战略支柱）运用于我们的整个工程部门，落实在我们将在明年和未来推出的全新创新产品与技术规划。不管是通过“Foveros”逻辑堆叠实现的先进封装创新，还是面向软件开发者的“One API”方案，我们正在采取行动，推动可持续的新一轮创新。

5) 计算工作负载格局的转变，对于英特尔开发下一代产品有何影响？

与上述计算环境相关的工作负载正在发生变化。消费者或企业客户不再拥有可以只通过直接的标量架构就能解决的简单应用。相反，我们看到通过集成额外架构而更快速解决问题的程序，这些额外架构包括图形处理器、人工智能加速器、图像处理器、甚至是基于全新内存技术的FPGA等自适应设计。我们将整合计算和架构创新，通过高速互连以及新的软件开发模式，为开发者简化API，并从英特尔计算架构释放出更高的性能和效率。

6) 英特尔在这六大支柱领域的投入，如何在用户体验方面推动类似于摩尔定律的飞跃？

在前几代产品中，答案一直是晶体管密度，并且摩尔定律将在解决计算问题方面发挥主导作用。但随着制程节点发展速度相较于过去几十年呈现出减缓的态势，摩尔定律的本质将是继续提供全新的技术和能力，以满足现代计算的需求。摩尔定律的含义，不仅仅涉及晶体管，而是包括晶体管、架构研究、连接性提升、更快速的内存系统和软件的结合，共同推动其向前发展。

在英特尔“架构日”活动中，英特尔高管、架构师和院士们展示了下一代技术，并介绍了英特尔在驱动不断扩展的数据密集型工作负载方面的战略进展，从而为PC和其他智能消费设备、高速网络、无处不在的人工智能（AI）、云数据中心和自动驾驶汽车提供支持。

同时，英特尔展示了一系列处于研发中的基于10纳米的系统，将用于PC、数据中心和网络设备；并预览了其他针对更广泛工作负载的技术。

图片.png
英特尔公司高级副总裁兼硅工程事业部总经理JimKeller

英特尔还分享了聚焦于六个工程领域的技术战略，对这些领域的重大投资和技术创新，将推动技术和用户体验的飞跃。这六大工程领域包括：先进的制造工艺和封装；可加速人工智能和图形等专门任务的新架构；超高速内存；超微互连；嵌入式安全功能；以及为开发者统一和简化基于英特尔计算路线图进行编程的通用软件。

图片.png
英特尔公司处理器核心与视觉计算高级副总裁RajaKoduri

这些技术共同为更加多元化的计算时代奠定了基石，到2022年，潜在市场规模将超过3000亿美元。

英特尔架构日上发布的重点内容包括：

业界首创的逻辑芯片3D堆叠

英特尔展示了名为“Foveros”的全新3D封装技术，该技术首次引入了3D堆叠的优势，可实现在逻辑芯片上堆叠逻辑芯片。

Foveros为整合高性能、高密度和低功耗硅工艺技术的器件和系统铺平了道路。Foveros有望首次将晶片的堆叠从传统的无源中间互连层和堆叠存储芯片扩展到高性能逻辑芯片，如CPU、图形和人工智能处理器。

该技术提供了极大的灵活性，因为设计人员可在新的产品形态中“混搭”不同的技术专利模块与各种存储芯片和I/O配置。并使得产品能够分解成更小的“芯片组合”，其中I/O、SRAM和电源传输电路可以集成在基础晶片中，而高性能逻辑“芯片组合”则堆叠在顶部。

英特尔预计将从2019年下半年开始推出一系列采用Foveros技术的产品。首款Foveros产品将整合高性能10nm计算堆叠“芯片组合”和低功耗22FFL基础晶片。它将在小巧的产品形态中实现世界一流的性能与功耗效率。

继2018年英特尔推出突破性的嵌入式多芯片互连桥接（EMIB）2D封装技术之后， Foveros将成为下一个技术飞跃。

全新Sunny Cove CPU架构

英特尔推出了下一代CPU微架构Sunny Cove，旨在提高通用计算任务下每时钟计算性能和降低功耗，并包含了可加速人工智能和加密等专用计算任务的新功能。明年晚些时候，Sunny Cove将成为英特尔下一代服务器（英特尔®至强®）和客户端（英特尔®酷睿™）处理器的基础架构。Sunny Cove的功能特性包括：

增强的微架构，可并行执行更多操作。

可降低延迟的新算法。

增加关键缓冲区和缓存的大小，可优化以数据为中心的工作负载。

针对特定用例和算法的架构扩展。例如，提升加密性能的新指令，如矢量AES和SHA-NI，以及压缩/解压缩等其它关键用例。

Sunny Cove能够减少延迟、提高吞吐量，并提供更高的并行计算能力，有望改善从游戏到多媒体到以数据为中心的应用体验。

下一代图形卡

英特尔推出全新的第11代集成图形卡，配备64个增强型执行单元，比此前的英特尔第9代图形卡（24个EU）多出一倍，旨在打破每秒1万亿浮点运算次数（1 TFLOPS）的壁垒。从2019年开始，新的集成图形卡将与10纳米处理器一起交付。

与英特尔第9代图形卡相比，新的集成图形卡架构有望将每时钟计算性能提高一倍。凭借高于每秒1万亿浮点运算次数的性能，该架构旨在提高游戏的可玩性。与英特尔第9代图形卡相比，英特尔在此次活动上展示的第11代图形卡几乎将一款流行的照片识别应用程序的性能提高了一倍。第11代图形卡预计还将采用业界领先的媒体编码器和解码器，在有限的功耗配额下支持4K视频流和8K内容创作。第11代图形卡还将采用英特尔®自适应同步技术，为游戏提供流畅的帧速率。

英特尔还重申了在2020年推出独立图形处理器的计划。

“One API”软件

英特尔宣布推出“One API”项目，以简化跨CPU、GPU、FPGA、人工智能和其它加速器的各种计算引擎的编程。该项目包括一个全面、统一的开发工具组合，以将软件匹配到能最大程度加速软件代码的硬件上。公开发行版本预计将于2019年发布。

内存和存储

英特尔介绍了英特尔®傲腾™技术以及相关产品的最新情况。英特尔®傲腾™数据中心级持久内存作为一款新产品，集成了内存般的性能以及数据的持久性和存储的大容量。这项革命性的技术通过将更多数据放到更接近CPU的位置，使应用在人工智能和大型数据库中的更大量的数据集能够获得更快的处理速度。其大容量和数据的持久性减少了对存储进行访问时的时延损失，从而提高工作负载的性能。英特尔傲腾数据中心级持久内存为CPU提供缓存行（64B）读取。一般来说，当应用把读取操作定向到傲腾持久内存或请求的数据不在DRAM中缓存时，傲腾持久内存的平均空闲读取延迟大约为350纳秒。如果实现规模化，傲腾数据中心级固态盘的平均空闲读取延迟约为10,000纳秒（10微秒），这将是显著的改进2。在一些情况下，当请求的数据在DRAM中时，不管是通过CPU的内存控制器进行缓存还是由应用所引导，内存子系统的响应速度预计与DRAM相同（小于100纳秒）。

英特尔还展示了基于英特尔1 TB QLC NAND裸片的固态盘如何把更多海量数据从硬盘迁移到固态硬盘，从而可以更快访问这些数据。

英特尔傲腾固态盘与QLC NAND固态盘相结合，将降低对最常用数据的访问延迟。总体来说，这些对平台和内存的改进重塑了内存和存储层次结构，从而为系统和应用提供了完善的选择组合。

深度学习参考堆栈（Deep Learning Reference Stack）

英特尔宣布推出深度学习参考堆栈（Deep Learning Reference Stack），这是一个集成、高性能的开源堆栈，基于英特尔®至强®可扩展平台进行了优化。该开源社区版本旨在确保人工智能开发者可以轻松访问英特尔平台的所有特性和功能。深度学习参考堆栈经过高度调优，专为云原生环境而构建。该版本可以降低集成多个软件组件所带来的复杂性，帮助开发人员快速进行原型开发，同时让用户有足够的灵活度打造定制化的解决方案。

操作系统：Clear Linux * 操作系统可根据个人开发需求进行定制，针对英特尔平台以及深度学习等特定用例进行了调优；

编排：Kubernetes*可基于对英特尔平台的感知，管理和编排面向多节点集群的容器化应用；

容器：Docker*容器和Kata*容器利用英特尔®虚拟化技术来帮助保护容器；

函数库：英特尔® 深度神经网络数学核心函数库（MKL DNN）是英特尔高度优化、面向数学函数性能的数学库；

运行时：Python*针对英特尔架构进行了高度调优和优化，提供应用和服务执行运行时支持；

框架：TensorFlow*是一个领先的深度学习和机器学习框架；

部署：KubeFlow*是一个开源、行业驱动型部署工具，在英特尔架构上提供快速体验，易于安装和使用。

关键字：英特尔架构摩尔定律编辑：冀凯引用地址：英特尔架构日发布全新架构和技术记住这六点

上一篇：赛普拉斯CEO：未来不可预测，只有靠创新改造现在
下一篇：国科委：减轻科研人员不必要的负担

推荐阅读最新更新时间：2023-10-13 10:40

英特尔助力全球首个虚拟化5G端到端数据通信部署成功

近日，美国主要电信运营商之一的Verizon与英特尔、三星和风河合作，在商业网络中部署了全球首个完全虚拟化的5G端到端数据通信，这强调了虚拟化无线接入网络（vRAN）技术已经准备就绪。为了能够扩大vRAN的规模，英特尔已经与社区合作推动标准化，并培育一个强大的全球生态系统。全球多家领先的运营商正在基于英特尔®技术进行vRAN市场试验，并开始商业部署。 “完全虚拟化的5G网络只能通过强有力的行业合作来实现交付，而最近的这一成就是Verizon、英特尔、三星和风河多年合作的成果。”英特尔公司副总裁兼网络平台事业部总经理Dan Rodriguez表示：“随着我们的客户部署虚拟化无线接入网络架构，英特尔正在整合产品、生态系统和

[网络通信]

<font color='red'>英特尔</font>助力全球首个虚拟化5G端到端数据通信部署成功

英特尔CPU被曝存在安全漏洞修复后的补丁将降低PC速度

近日，英特尔被曝出他们的处理器存在一个安全漏洞，这一漏洞能够导致不良之徒访问到个人电脑内核访问的内存数据，其中包括用户账号密码、应用程序文件，文件缓存等。比较彻底的解决办法是从硬件层面上修复。目前，英特尔这一漏洞获得了一个“保护期”，即漏洞信息尚未在网络上被公开，英特尔、微软、苹果等公司正在加班加点研究解决办法。安全漏洞最终会被修复，但是补丁会让PC(和Mac)的芯片速度变慢。我们不知道速度会降低到什么程度，但一名开发人员表示，Linux内核中进行的修补将会影响所有的操作系统工作，大部分软件运行将会出现“一位数下滑”(10%以下)，典型的性能下降幅度为5%。而在联网功能方面，最糟糕的性能下降幅度为30%。据悉，修

[嵌入式]

英特尔收购阿尔特拉的真正目的是什么？

“收购FPGA（field programmable gate array）业务与英特尔公司的成长战略相符合。这是因为，将阿尔特拉公司的产品与英特尔公司的IP相组合，可以提供合乎数据中心、IoT（Internet of Things）市场客户需求的新门类产品”。美国英特尔公司的经营高管，就收购美国阿尔特拉公司发表了这样的评论。图1：英特尔发展数据中心用半导体的目的（点击放大）正如这番评论所说，英特尔公司通过收购阿尔特拉公司，大致可以强化两个细分市场。一个是数据中心市场，另一个是IoT市场。关于前者数据中心，为达成处理的数据量激增的大数据分析等所要求的性能，英特尔公司希望提高微处理器与F

[手机便携]

英特尔全新全互联PC首次亮相2018 CES

在日益互联的移动世界中，我们期望自己的 PC 能够始终联网在线。在本周的 2018 年国际消费电子产品展上，我们的合作伙伴推出了一系列搭载英特尔® 酷睿TM 处理器和英特尔® XMMTM 上网模块的全互联 PC，其中包括：宏碁* 推出了搭载英特尔® 酷睿™ i7 处理器的 Swift 7 *。这款笔记本电脑的厚度仅有 8.98 毫米，可为完美主义者和差旅人士提供出色的便携性、工作效率、全天候电池续航时间和随时4G LTE 连接。宏碁* Swift 7 惠普* 推出了全新 Envy X2 *，这是一款性能强大的全互联 PC，支持随时随地进行创作、工作和娱乐。它采用性能强劲的英特尔® 酷睿™ 处理器，电池续

[半导体设计/制造]

<font color='red'>英特尔</font>全新全互联PC首次亮相2018 CES

AMD Epyc任何一小步都是英特尔受威胁更大一步

英特尔(Intel)在全球PC及服务器芯片领域占有绝对优势，但有鉴于全球PC市场趋于成熟，市场投资人因而视数据中心为英特尔最佳的成长引擎，市场也对英特尔数据中心业务表现有高度期望，虽然英特尔目前仍是大到不受竞争对手威胁的地步，不过从超微(AMD)最新发布第3季财报却嗅得出超微的成长，虽然仍不成显著威胁英特尔的气候，不过在全球芯片产业中，任何竞争对手的小得分都不能忽视其潜在影响性。根据华尔街日报(WSJ)报导，这一切要从超微在2017年夏季推出全新服务器处理器芯片“Epyc”说起，虽然Epyc产品线没有为超微创造突出的销售成绩，不过超微第3季财报中企业、嵌入式及半客制化部门营收表现，却优于华尔街预测值10%以上。超微认为

[半导体设计/制造]

Tensilica：填补摩尔定律和效率间的鸿沟

　　有人说SoC是历史必然？有人说SoC是其项目努力方向？有人说手机里已经随处可见SoC? 还有人说SoC是这样一种令人着迷的技术：既有着每年1000亿美元市场，也是仍然在探索实现其最初承诺的处女地。　　然而，正当SoC在手机中大行其道、为相关产业带来丰厚利润的同时，我们不禁会问：SoC是否已足够完美？　　诚然，SoC的发展在世界范围内呈健康发展态势，国内SoC设计的发展也令人欣喜。我们可以看到很多国内公司的设计复杂度和设计能力已经可以媲美国际大公司，而且工程师的经验也在逐步增长。　　但是，以摩尔定律发展的IC工艺技术已经踏上了不归路，在这条路上没有最低、最新，只有更低、更新。随着单位面积上硅密度的增加，SoC设计规模

[焦点新闻]

微控制器（MCU）架构分析

微控制器(MICroController)又可简称MCU或μC，也有人称为单芯片微控制器(Single Chip Microcontroller)，将ROM、RAM、CPU、I/O集合在同一个芯片中,为不同的应用场合做不同组合控制。微控制器在经过这几年不断地研究、发展，历经4位、8位，到现在的16位及32位，甚至64位。产品的成熟度，以及投入厂商之多、应用范围之广，真可谓之空前。目前在国外大厂因开发较早、产品线广，所以技术领先，而本土厂商则以多功能为产品导向取胜。但不可讳言的，本土厂商的价格战是对外商造成威胁的关键因素。由于制程的改进，8位MCU与4位MCU价差相去无几，8位已渐成为市场主流;针对4位MCU，大部份供

[单片机]

最新MLCommons结果公布英特尔展现强大AI推理性能

英特尔产品在全新MLCommons AI推理性能测试中尽显优势今日， MLCommons公布针对 60 亿参数大语言模型及计算机视觉与自然语言处理模型GPT-J的 MLPerf推理v3.1 性能基准测试结果，其中包括英特尔所提交的基于Habana® Gaudi®2 加速器、第四代英特尔®至强®可扩展处理器，以及英特尔®至强® CPU Max 系列的测试结果。该结果显示了英特尔在AI推理方面极具竞争力的表现，并进一步加强了其对加速从云到网络到边缘再到端的工作负载中大规模部署AI的承诺。英特尔执行副总裁兼数据中心与人工智能事业部总经理Sandra Rivera表示：“正如最新的 MLCommons结果显示，我们拥有强大的

[嵌入式]