在深度学习的领域里,最重要的是数据和运算。谁的数据更多,谁的运算更快,谁就会占据优势。因此,在处理器的选择上,可以用于通用基础计算且运算速率更快的GPU迅速成为人工智能计算的主流芯片。下面就随网络通信小编一起来了解一下相关内容吧。
2017年度GTC技术大会上,英伟达推出了他们公司最新研发的GPU——Volta。该芯片的核心是一款称为“TensorCore(张量处理器)”的人工智能加速器,这是开发下一阶段AI应用的硬件保障。然而,我们需要升级软件,更新AI算法,其原因有两点:一是现有的AI算法不能充分利用这个加速器的性能,二是为了获得AI开发中另外的突破。
如果我们能充分利用这种新代芯片,不仅将大大推进AI应用的进展,甚至可能会创建新的AI应用。比如说,AI算法可以利用该种芯片的高速运行速度,来更好地理解和综合分析人类语言。语音识别系统将极大地完善,音频的转录将更加准确,计算机将会有能表现出语言风格和情感的语音系统。
有许多公司已经认识到了AI所具有的巨大潜力,还研发出了强大的芯片,以期获得AI的广泛应用。例如,英伟达开发的GPU以及谷歌研发出的TPU。
这些芯片有一个共同点,就是它们都根据程序局部性原理来不断优化算法。为了获得局部性优势,需要AI芯片和AI算法的共同支持。目前,新兴的AI芯片已经可以为此提供基础框架(例如Volta的“TensorCore”),但是更多的AI算法还没有获得与这种芯片的相应升级。通俗地说,当下通行的算法不能充分利用到该芯片的高速运行速度。
AI芯片的第一阶段是并行驱动,即同时执行多种任务。
在海量数据集上训练大型神经网络可以充分展示其易被现有并行芯片利用的显著并行性。然而,目前来看,内存提取性能的发展远远不能满足人们的需求。最终这些新芯片会面临“内存墙”的困境,即内存性能会严重限制芯片性能的发挥。
为了进入到下一阶段,AI芯片仍要在局部性上下功夫。局部性可以体现为重复引用同一个变量。打个比方,您在杂货店里购物,您要按照购物清单买东西,清单一共列有10件商品,您如果想加快寻获商品的速度的话,可以请10个朋友,让他们分别找到1件清单上商品。这种方法虽然是并行驱动的,但效率也非常低下,因为清单上不同的物品可能摆在一起,这就会产生让不同的朋友来找寻相邻物品的情况,从而降低了效率。一个更好的办法是让每个朋友去一个不同的过道,并只找那个过道的物品。这就是局部性解决目前“内存墙”困境的方式。
新代AI芯片需要具有显著局部性特点的算法相适应。目前,并不是所有的AI算法都能胜任这一任务,因为它们不具备显著的局部性。计算机视觉算法由于其大量使用卷积神经网络而在局部性上显有优势,但语言和语言应用中所使用的复现神经网络则需要稍加变动(尤其要对其推理能力进行优化),以改善其局部性。
在百度的硅谷AI实验室,研究人员尝试了几种完善算法的方式,来挖掘局部性的潜力。早期的实验显示出了我们非常可能克服这一困难的迹象。例如,研究人员发展了RNN网络,让其在低批量大小下达到了30倍速的提升。这开了一个好头,但未来AI芯片的性能还要有更大的提升。另一个研究方向是整合了来自卷积和复发神经网络的想法得来的,但这个方向的最优解还在后头。
深度学习的AI算法计算有限,迄今为止的突破都是得益于运算速度更快的计算机的出现。然而,当下的算法已经取得了突破性进展,而且已经在语音识别,机器翻译和人类语音综合方面得到了成果。目前,进行下一阶段AI算法研发的硬件已经到位。早期实验中的种种迹象表明——我们正处于下一代算法开发的前端。预计下一代算法能充分利用目前AI芯片的性能,并且可以引领我们得到其他方面的突破。
以上是关于网络通信中-AI芯片飞速发展 算法也需不断优化的相关介绍,如果想要了解更多相关信息,请多多关注eeworld,eeworld电子工程将给大家提供更全、更详细、更新的资讯信息。
关键字:AI 深度学习
引用地址:
AI芯片飞速发展 算法也需不断优化
推荐阅读最新更新时间:2024-05-07 17:33
武汉大学生采用深度学习研发了一款机器人 除了基本动作还会打太极
1月8日,在武昌理工学院第九届大学生成功素质展示节成果展上,摇头晃脑、肢体灵活的机器人NAO一出场就吸引了所有人的目光。据了解,它除了能完成基本的动作外,还会打太极等各种“舞技”。
这个机器人是由该校机器人协会几名大学生历时2个月自主完成的,采用了的方法。“这使它能像人类婴儿一般拥有学习能力,并且能够和人亲切地互动。”协会会长、科学与技术1703班的孙新同学介绍说,“NAO机器人可以通过学习肢体语言和具体表情来推断出人的情感变化,随着时间的推移和长期的训练‘记住’更多的人,并且能够分辨这些人不同的行为及面孔。” 机器人NAO通体由黑白两色组成,两只“耳朵”又大又圆,手是根据人类模型仿制的,表情呆萌,在声音的指示下做出
[机器人]
人工智能处理器技术盘点
1492年哥伦布从西班牙巴罗斯港出发,一路西行发现了美洲。葡萄牙人达伽马南下非洲,绕过好望角到达了印度。不久之后,麦哲伦用了整整三年时间,完成了人类史上第一次环球航行,开启了人类历史上的大航海时代。大航海时代的到来,拉近了人类社会各文明之间的距离,对人类社会产生了深远的影响。 人工智能进入“大航海时代” 从深蓝到Alpha Go,人工智能逐渐走进人们的生活。人工智能也从一场技术革命,逐渐走向了产业落地。智能手机、智能家居设备、智能音箱……等设备,已经完全进入到人们的生活中。指纹识别、人脸识别、画面增强等实用人工智能的技术,也成为了人们日常使用电子设备必不可少的技术。 基于面部识别的em
[嵌入式]
壁仞科技对标国际前沿的人工智能芯片
近日,壁仞科技的首款通用GPU—BR100正式交付开始流片,搭载该芯片的系列通用计算产品,主要聚焦于人工智能训练和推理、通用运算等众多计算应用场景,将弥补人工智能应用的高速发展带来的巨大算力缺口。 在当前的多芯片集群并行计算领域,工业界普遍使用集合通信方案来实现多个节点间共享数据和传输数据的操作。当前的集合通信中,“节点1的芯片A发送数据给节点2的芯片B”的过程分为四个步骤。首先节点1上的芯片A把数据发送到节点1的系统内存。然后向网卡发送网络请求,网卡从系统内存读入数据,并发送到节点2的网卡。之后节点2的网卡收到数据并存储到系统内存中。最后芯片B从系统内存中读入数据。对集合通信的性能进一步优化,是本领域的诸多技术课题之一。 为此,
[手机便携]
2017CES你要关注自动驾驶、人工智能、VR这些领域
每年年初科技行业会雷打不动地迎来两次盛宴:先是在美国拉斯维加斯举行的全球消费展(CES),然后是在西班牙巴塞罗那举行的移动通信世界大会(MWC)。2017CES马上就要到来了,它是世界上最大、影响最为广泛的消费类电子技术年展,也是全球最大的消费技术产业盛会。 历年的CES展会云集了当前最优秀的传统消费类电子厂商和IT核心厂商,他们会带去最先进的技术理念和产品,吸引众多的高新技术设备者、使用者及业界观众。那么2017CES将会有什么看点? 回顾2016年的科技热点话题,可以推测,技术、人工智能和很有可能成为CES 2017最大热点。 全球最大的汽车零部件制造商之一麦格纳国际已确认参展CES 2017,并
[机器人]
人工智能:燃烧你的卡路里,我可忙坏了
你今天燃烧卡路里了吗? 近年来,随着我们生活水平的提高和日常习惯的改变,肥胖渐渐成为了令无数人困扰的难题。为了实现减肥的目标,人们曾使出十八般武艺,动感单车、瑜伽、针灸、减肥药、轻断食……但对大多数人而言,减肥永远是将来时。三天打鱼两天晒网,到最后体重还是一点也未减下去。 最近,许多从事人工智能研究的科学家和大公司们开始利用 AI 涉足减肥这个领域,试图通过人工智能的帮助来让我们燃烧更多的卡路里。 要逆天!美国科学家用AI从太空中识别肥胖社区 肥胖是个复杂的健康问题,造成肥胖的因素有很多,其中之一就是我们生活的环境。据研究表明,人们周围超重的朋友越多,自身肥胖的概率也会越高。另外城市环境的绿化、基础设施等因
[嵌入式]
NVIDIA、台科技部打造AI供应链
绘图晶片大厂英文大(NVIDIA)昨(26)日在台北举行GPU技术大会(GTC Taiwan),创办人暨执行长黄仁勋宣布,将与科技部携手合作打造台湾第一部人工智能(AI)超级电脑,运算速度将可望是全球前25名的超级电脑,以及培育本土AI人才,打造台湾AI产业供应链。 英文大昨日举行年度GTC Taiwan盛会,吸引各大技嘉、华硕及丽台等合作厂商到场参与,同时国内各大媒体及分析师也齐聚一堂,希望能吸取英文大AI技术对于人类发展的计划蓝图。 黄仁勋也宣布,将与科技部合作AI计算,协助培植本土AI产业。英文大深度学习机构将与科技部在未来4年培训3,000位开发人员,协助他们将深度学习技术运用在智能制造、物联网、智能城市以及医疗等
[半导体设计/制造]
瞄准AI商机,晶心从汽车电子切入进攻64位CPU IP
人工智能(AI)、智能汽车世代将在不久后到来,各大半导体厂纷纷开始抢进市场,期盼透过提前卡位,借此夺得市场先机,晶心科也不落人后,预计将从先进驾驶辅助系统(ADAS)抢进车电市场,再以网通、云端产品进军物联网及人工智能产业。 晶心科总经理林志明认为,人工智能未来将是一大市场,特别是应用在物联网产品上,由于万物皆可联网,因此产品自然是多样性,如此一来单一产品需求量就会较少,届时所需要的物联网相关硅智财(IP)也就相当庞大,对于CPU IP授权公司将是一大利多。 由于看好人工智能市场,晶心科总经理林志明指出,今年将全力进攻64位CPU IP,目标瞄准物联网、高端服务器及数据中心市场上,借此切入人工智能、云端运算(Cloud C
[半导体设计/制造]
Esperanto展示基于RISC-V芯片的AI加速Demo
本文编译自Forbes Esperanto 多年来一直在谈论他们的边缘 AI 芯片,现在该公司展示了用于图像、语言和推荐处理的AI加速Demo。我有机会观看了该平台的演示,并对基于 RISC-V 的平台的性能和能效印象深刻。我也很高兴地看到,Esperanto展示了 Resnet50、DLRM 和 BERT 底层的 Transformer 网络。 就目前而言,该芯片仅作为单个加速器运行。额外的调整和工程应该会显着提高频率,并将架构扩展到其他芯片,以实现更大的网络和更高的吞吐量。我目前还不能分享基准测试结果,但所有三种类型的性能都很好,功耗也大概在20W左右。 我们在此介绍的 Esperanto 芯片具有近 1100 个
[嵌入式]