△ 百度解释了FPGA上AI和数据分析工作负载的情况
刚刚在加州Hot Chips大会上,百度发布XPU,这是一款256核、基于FPGA的云计算加速芯片。合作伙伴是赛思灵(Xilinx)。百度也在这次的大会上,透露了关于这款芯片的更多架构方面的细节。
过去几年,百度在深度学习领域,尤其是基于GPU的深度学习领域取得了不错的进展。而且,百度也在开发被称作XPU的新处理器。
百度研究员欧阳剑表示,百度设计的芯片架构突出多样性,着重于计算密集型、基于规则的任务,同时确保效率、性能和灵活性的最大化。今天,他在Hot Chips大会上与来自FPGA厂商Xilinx的人士一同发布了XPU。
△ 百度去年宣布采用Xilinx Kintex UltraScale FPGA加速数据中心的额机器学习应用
XPU的目标是在性能和效率之间实现平衡,并处理多样化的计算任务。FPGA加速器本身很擅长处理某些计算任务,但随着许多小内核交织在一起,多样性程度将会上升。
欧阳剑表示:“FPGA是高效的,可以专注于特定计算任务,但缺乏可编程能力。传统CPU擅长通用计算任务,尤其是基于规则的计算任务,同时非常灵活。GPU瞄准了并行计算,因此有很强大的性能。XPU则关注计算密集型、基于规则的多样化计算任务,希望提高效率和性能,并带来类似CPU的灵活性。”
目前XPU有所欠缺的仍是可编程能力,而这也是涉及FPGA时普遍存在的问题。到目前为止,XPU尚未提供编译器。不过欧阳剑表示,该团队将会很快开发一款编译器。
欧阳剑还表示
为了支持矩阵、卷积,以及其他大大小小的内核,我们需要一个配备高带宽低延时内存,以及高带宽I/O接口的大型数学阵列。FPGA中XPU的DSP单元提供了并行处理能力,片外DDR4和HBM接口优化了数据传输,而片上SRAM则提供了必要的存储特性。
在Micro Benchmark测试中,对于计算密集型、常规内存访问的计算任务,XPU的效率与x86内核类似。对于数据同步的计算任务,XPU的可扩展性应当可以进一步优化。而对于没有数据同步的计算任务,XPU的可扩展性与核心数量呈线性关系。
这就是问题所在。如前所述,XPU仍然没有配备编译器。这款处理器在FPGA上实现,通过订制的逻辑电路提供指令。这些小核心类似于CPU,开发者只能使用汇编语言,而所有的执行都由主机来控制。整个流程包括拆分计算任务,编写XPU代码,调用专用的逻辑函数,从而在Linux平台上进行编译和运行。
△ XPU具有256个内核,集成了一个共享内存用于数据同步。所有内核都运行在600MHz。
欧阳剑称:“在百度,我们使用FPGA已有多年时间。我们的数据中心、云计算平台和自动驾驶项目中有大量FPGA。我们非常了解FPGA的优缺点,以及如何优化。凭借XPU的大型核心,我们专注于多样化的计算任务。”
去年有媒体报道了基于百度深度学习SDA的SQL加速器。当时的数据流基于SA架构。根据欧阳剑的描述,这也是XPU内存带宽和延时优势的核心。
欧阳剑同时展示了今年完成的一些benchmark测试,但信息非常粗略。不过,这只是百度第一次公开展示XPU。
如果XPU被证明可以用于AI、数据分析、云计算和无人驾驶,那么百度可能需要用ASIC技术去开发XPU。
关键字:百度
引用地址:
百度发布XPU:AI云计算加速芯片(基于FPGA,256核心)
推荐阅读最新更新时间:2024-05-03 01:31
北京全无人驾驶呼之欲出,百度率先获准开启测试
12月30日,百度“萝卜快跑”首批获准在京开展全无人自动驾驶测试,这是萝卜快跑继武汉、重庆全无人自动驾驶商业化运营规模扩充后,再次迅速扩张全无人驾驶版图。至此,百度旗下自动驾驶出行服务平台萝卜快跑的全无人自动驾驶车队已驶入北京、武汉、重庆三城,是首家在全国多个城市开展全无人自动驾驶运营及测试的企业,覆盖总面积超百平方公里。 行业专家表示,无人化是全球自动驾驶技术的制高点,是各地发展智能网联汽车产业的必争之地,期待北京市能够加快全无人自动驾驶商业模式的探索,为规范行业创新和商业运营做好指引。 据悉,此次百度“萝卜快跑”共投入10辆全无人自动驾驶车,在北京开发区划定时间与路线内开展全无人自动驾驶测试。2023年,百度Apoll
[汽车电子]
2014:六大IT趋势和三大硬件创新
从“LSI加速技术创新亚洲峰会”看数据时代的IT变革:大型数据中心引发的硬件创新;云和大数据正在重新改写产业格局; 以及传统企业用户开始转变思维尝试全新方案等等。 2014年是IT大转型中关键的一年。在以数据为中心的今天,整个业界都在寻求通过全新方式释放数据价值。大型互联网公司,正通过非传统方式组建超大规模数据中心,这将迫使硬件领域做出哪些创新?在云和大数据引发的变革中,将对产业链各方带来哪些颠覆式影响?3月26日,我们从LSI加速技术创新亚洲峰会上找到了些许答案。 大型数据中心引发三大硬件创新 百度首席架构师林仕鼎在大会演讲中表示,“大数据需要全新的硬件体系结构”。与Google和Facebook一样,中国的互
[网络通信]
百度地图推出定制语音包 可AR导航 还能帮车主找充电桩
车东西12月10日消息,今日,百度地图在北京召开面向合作伙伴的大会,会上,百度呼吁更多的合作伙伴和开发者一起研发智能出行新方式。 目前百度依托于百度大脑、百度智能云建立了百度地图全景生态,在打车、物流、金融、旅游、通讯服务方面都能提供帮助。 百度地图事业部总经理李莹表示,百度地图可以提供语音定制系统,用户可以录制自己的导航语音包,百度地图还会提供城市街景AR导航功能。 目前百度已经和多个网约车平台建立了合作关系,百度地图将能够提供更加合适的打车平台和出行路线。 除此之外,百度地图还和部分景区实现了深度结合,用户可以在百度地图上制定旅行攻略,在合作的景区,百度地图还能够进行AR讲解。 会上,百度还成立了百度地图
[汽车电子]
百度高级副总裁王劲:一朵花的大数据之旅
百度正在传统的搜索技术之外,利用“大数据+云计算”打造另一个驱动公司发展的新引擎——百度高级副总裁王劲接受21世纪经济报道记者采访时如是说。 百度大脑是“云计算+大数据”的载体:其由硬件和软件两部分组成,硬件部分是由云计算中心和服务器组成,软件部分是由大数据和人工智能算法组成。无论百度推荐引擎、BaiduEye,还是百度面对商家的直达号,均依赖百度大脑作为技术基础,是一切前端应用的backoffice。 王劲认为,百度的核心竞争力在于人工智能和大数据的结合。可能的场景是:用手机拍一朵花的照片,上传给百度,百度大脑把它转化成“0101”的数字流,然后输入到深度神经网络里,经过层层的分析、复杂的学习算法和大数据比对,最后还原并
[手机便携]
百度打造全球最大自动驾驶研发中心
日经亚洲评论报道,百度在北京建立了一个新的自动驾驶技术研发基地。 据百度介绍,该基地位于北京亦庄经济开发区的Apollo Park,是同类设施中最大的一个。基地拥有200辆自动驾驶汽车原型,以及带有内置传感器的测试道路。 百度从2013年开始研究自动驾驶技术,今年4月,百度在长沙推出一项无人驾驶出租车服务。百度的阿波罗开源平台得到了中国政府的支持,吸引了丰田汽车、本田汽车、大众汽车、福特汽车等合作伙伴,以及美国芯片公司英特尔和英伟达。 在搜索引擎广告收入下滑之际,百度试图实现利润结构多元化。该公司报告称,今年第一季度的总收入较上年同期下降了7%,这主要是由于冠状病毒大流行促使企业削减广告支出。
[手机便携]
正部署于百度阿波罗实现目标检测任务,启明920芯片发布
9月15日,2020西安全球硬科技创新大会分论坛——“下一代AI 芯片产业发布暨Chiplet产业联盟启动成立圆桌会议”上,“启明920”AI加速芯片正式发布。 8月20日,“启明920”由清华大学交叉信息研究院马恺声教授领衔的西安交叉核心院芯片中心研发成功并完成测试。 “启明920”AI加速芯片可面向高能效的低速无人车、AGV、计算机视觉加速等AI应用场景,目前正部署于百度阿波罗无人车系统上实现目标检测任务。 2019年12月,“启明910”人工智能加速芯片在西安研发成功。据当时中国青年网报道,作为交叉核心院芯片中心团队设计的第一款人工智能芯片,“启明910”可以基本完成面向神经网络计算的专门优化,创造了交叉核心院芯片中心人工
[手机便携]
Velodyne与百度签订3年供货协议 为阿波罗项目供应激光雷达传感器
据外媒报道,当地时间10月12日,激光雷达制造商Velodyne宣布与百度达成一项为期三年的供货协议,将为百度提供用于自动驾驶应用的Alpha Prime激光雷达传感器。Velodyne的传感器成本低、量产规模大,因而为百度以及Apollo(阿波罗)项目提供了有吸引力的价格。 (图片来源:Velodyne) 百度在中国推出了名为Apollo Go的自动驾驶出租车服务,作为百度开源自动驾驶车辆软件平台——阿波罗的一部分,此类自动驾驶汽车选择了Alpha Prime激光雷达传感器是因为该传感器的探测距离远、分辨率高且视场宽广,可以满足自动驾驶车辆的高性能要求,毕竟高质量的3D激光雷达传感器是自动驾驶车辆准确感知周围环境的重要
[汽车电子]
挖角百度无人驾驶负责人,乐视汽车到底要玩多大
今天, 乐视 举办了 “乐视车联战略发布会”,在会上,乐视车联宣布与北汽、比亚迪和东风签署 ecolink 合作协议;并与深圳航盛电子、惠州华阳通用和惠州德赛西威三家国内车机厂商也达成合作。乐视车联还发布了两款后装车联网产品,一款乐视行车记录仪和乐视轻车机套装。
乐视还宣布,曾是 百度 无人驾驶 项目技术负责人的倪凯正式加盟乐视汽车,出任乐视超级汽车(中国)智能驾驶副总裁,将主要负责乐视在智能驾驶和无人驾驶领域的研发工作。
乐视车联 CEO 何毅表示,目前乐视车联在全球已经拥有了接近 300 人的团队,其中海外员工 50 余人,在公司架构上,乐视车联以北京为总部、硅谷为创新中心、洛杉矶为集成中心、上海和成都为研发中心。团队成
[嵌入式]