近日,在一年一度的GTC上,NVIDIA创始人兼CEO黄仁勋先生进行了主题演讲,同时接受了EEWorld记者的采访,就计算及图形、高性能计算以及人工智能方面的创新,进行了分享。
本次GTC CHINA 2019有6100位参与者,三年增长了250%。关注的话题包括:人工智能、推理、云、工具、数据科学、边缘计算、汽车、自主机器、游戏、5G、设计、金融、高性能计算、医疗、生命科学、图像、虚拟化、人工智能框架、工业应用等等,计算正在革新各行各业。
保持统一架构进行高性能计算
加速计算在不断前行。随着摩尔定律终结,黄仁勋先生认为需要寻找新的方式。他表示:“加速计算是我们领先了20年的领域,我们并不是要去替代CPU,而是把一些应用加速。加速计算首先要有一个好的芯片,有一个革命性的处理器也就是GPU,而这仅仅是一个开始。加速计算是一个全堆栈的技术,为了可以充分利用该技术,我们必须要重新做各种各样的工程,从设计、算法一直到系统软件、工具、应用。”
NVIDIA将生态系统打通之后,将世界上最重要的一些应用做了更新,并且实现了10倍、25倍、500倍的加速,这种性能提升不仅体现在处理器层面,还包括系统层面。所以NVIDIA一直是一个系统架构公司,具备统一、开放、可靠的架构,可以让开发者在此基础上去开发软件。
NVIDIA一直致力于打造统一的CUDA并且将其应用到很多地方。无论是游戏、自动驾驶、云、超级计算、台式机、笔记本、嵌入式系统,都是用统一的架构,兼容性非常强。开发者可以自己优化软件堆栈。
在此之上,NVIDIA还有非常强大的算法和库。今年已经发布了500多个库,无需改变硬件,通过在软件和库上的完善就可以让计算机整体性能提升4倍。在推理方面,也无需改变GPU,整个堆栈的软件就可以使性能提升2倍。
针对当前世界上最重要的高性能计算应用TensorFlow,扩展其性能是一个巨大的 HPC 挑战。几个月前刚刚发布的TensorFlow 2.0,现在已经可以在CUDA和ARM上使用了,而且大部分的性能已经达到了最先进的水平。
AGX软件定义平台发布
2012年有几个因素推动了现代AI的发展——大数据、深度学习和NVIDIA GPU。之后几年的时间,我们看到了已经超过人类能力的图像识别、语音识别、自然语言理解方面的突破。去年,另一项技术也推动了AI进步。BERT是自然语言的训练模型,是基于大量的信息进行预训练的模型,它可以通过各种各样的数据去了解语言结构。BERT解锁了人类知识传输的方式,也就是通过自然语言处理。
这里的核心就是学习引擎,在5年当中,NVIDIA也在加快深度学习,使得学习速度加快了300倍。深度学习使计算速度发生了变化,并且计算机可以自己演进,自己基于大数据进行学习,计算机速度大幅度提升,计算机工作负载快速增加。AI是关于计算机软件的,软件可以自己学习,所以就需要世界上最快的计算机跑最快的软件。
随后,黄仁勋先生发布了用于自动驾驶和机器人的高度先进的软件定义平台——NVIDIA DRIVE AGX Orin。该平台内置全新Orin系统级芯片,集成了NVIDIA新一代GPU架构和Arm Hercules CPU内核以及全新深度学习和计算机视觉加速器,几乎是NVIDIA上一代Xavier系统级芯片性能的7倍。
黄仁勋表示:“打造安全的自动驾驶汽车,也许是当今社会所面临的最大计算挑战。实现自动驾驶汽车所需的投入呈指数级增长,面对复杂的开发任务,像Orin这样的可扩展、可编程、软件定义的AI平台不可或缺。”
TensorRT 7实现更智能的AI人机交互
紧接着,黄仁勋先生又发布了一款突破性的推理软件—— TensorRT 7。借助于该软件,全球各地的开发者都可以实现会话式AI应用,大幅减少推理延迟。而此前,巨大的推理延迟一直都是实现真正交互式互动的一大阻碍。
TensorRT 7作为NVIDIA第七代推理软件开发套件,为实现更加智能的AI人机交互打开了新大门,从而能够实现与语音代理、聊天机器人和推荐引擎等应用进行实时互动。TensorRT 7内置新型深度学习编译器。该编译器能够自动优化和加速递归神经网络与基于转换器的神经网络。这些日益复杂的神经网络是AI语音应用所必需的。与在CPU上运行时相比,会话式AI组件速度提高了10倍以上,从而将延迟降低到实时交互所需的300毫秒阈值以下。
黄仁勋表示:“我们已进入了一个机器可以实时理解人类语言的AI新时代。TensorRT 7使这成为可能,为世界各地的开发者提供工具,使他们能够构建和部署更快、更智能的会话式AI服务,从而实现更自然的AI人机交互。”
机器人技术大提升
黄仁勋先生发布了全新版本Isaac软件开发套件(SDK),为机器人提供更新的AI感知和仿真功能。在建立统一的机器人开发平台以实现AI、仿真和操控功能方面,Isaac SDK迈出了重要的里程碑。Isaac SDK包括Isaac Robotics Engine(提供应用程序框架),Isaac GEM(预先构建的深度神经网络模型、算法、库、驱动程序和API),用于室内物流的参考应用程序以及Isaac Sim的第一个版本(提供导航功能)。
全新Isaac SDK可以大大加快研究人员、开发人员、初创企业和制造商开发和测试机器人的速度。它使机器人能够通过仿真获得由人工智能技术驱动的感知和训练功能,从而可以在各种环境和情况下对机器人进行测试和验证。
新版本引入了一项重要功能——使用Isaac Sim训练机器人,并将所生成的软件部署到在现实世界中运行的真实机器人中。这有望大大加快机器人的开发速度,从而实现综合数据的训练。通过仿真,开发人员可以在极端情况下(即困难或异常情况下)对机器人进行测试,以进一步加强对它的训练。将这些结果输入训练管道,使神经网络可以基于真实和模拟数据来提高准确性。
GTC CHINA 2019为世界带来许多惊喜,NVIDIA一系列新技术的突破,包括与中国品牌的战略合作,加速了中国AI的发展。让我们期待更多高性能计算以及AI领域的发展,同时开始憧憬GTC CHINA 2020的盛况。
上一篇:MYIR推出采用NXP i.MX 8M Mini的CPU单板电脑
下一篇:Jetson布局已成型 打造自主机器的AI边缘计算平台家族
推荐阅读最新更新时间:2024-11-11 01:08
- NCV33074ADTBR2G 有源高 Q 陷波滤波器运算放大器的典型应用
- AD8350-EVAL,评估板经过精心布局和测试,以展示 AD8350 的指定高速性能
- AD8316ACP-EVALZ,AD8316 评估板,0.1GHz 至 2.5GHz,70dB 对数检波器/控制器
- MC9S08RG60演示板
- 用于仪表的 16 位 4 通道 DAC
- LT6654AHS6-3.3 升压输出电流电压基准的典型应用
- 【物联网类】基于ESP8266的AIOT开发板
- 【毕业设计】履带四足复合机器人
- 12V转5V_BUCK降压电路模块
- LTC3808 的典型应用 - 无 RSENSE、低 EMI、具有输出跟踪功能的同步 DC/DC 控制器