Leiphone雷锋网

文章数:10134 被阅读:31465356

账号入驻

达摩院发布业界首款语音合成算法专用AI FPGA芯片设计Ouroboros,效率提高百倍

2019-08-21
    阅读数:

▲点击上方 雷锋网 关注


这是业界首款专用于语音合成算法的 AI FPGA芯片结构设计,能将语音生成算法的计算效率提高百倍以上。

 文 | 包永刚 

雷锋网消息,Hot chips 31(2019)正在美国旧金山举行,峰会第二天阿里巴巴带来了《Ouroboros: A WaveNet Inference Engine for TTS Applications on Embedded Devices》的演讲,并发布了新一代AI语音FPGA芯片技术Ouroboros。

阿里巴巴称,这是业界首款专用于语音合成算法的 AI FPGA芯片结构设计,能将语音生成算法的计算效率提高百倍以上。

根据阿里达摩院扫地僧的说法,用AI语音合成算法WaveNet生成1秒语音,CPU和GPU需要50秒的计算时间,但Ouroboros在FPGA环境下只要 0.3秒。Ouroboros的一大突破,是用端上定制硬件加速技术替代云端服务器,避免了对网络连接和云端服务的强依赖性。

针对 ASIC 实现的性能仿真预估表明,Ouroboros 的设计可以实时运行 WaveNet 等业界先进的文字转语音(TTS,Text-to-Speech)算法 ,实现实时语音合成。

另据了解,Ouroboros 技术同样适用于达摩院于今年 7 月发布的新一代的语音合成算法KAN-TTS。该算法将商用系统里的合成语音与原始语音的相似度提高到97%以上。

还有消息指出,Ouroboros 技术,同样适用于达摩院于今年 7 月发布的新一代的语音合成算法KAN-TTS。该算法将商用系统里的合成语音与原始语音的相似度提高到97%以上。Ouroboros芯片技术除了语音合成之外,还将支持AI语音识别。基于Ouroboros研发完整的语音AI芯片,有望率先在天猫精灵上落地。

雷锋网注意到,与阿里近来发布的其它芯片产品一样,这个产品的命名也很有特色。Ouroboros中文是衔尾蛇,是一个古代流传下来的符号,形象为一条蛇(或龙)吞食自己的尾巴,结果形成一个圆环(有时亦会展示成扭纹形,即“∞”),其名字涵义为“自我吞食者”。这个符号一直都有很多不同的象征意义,而当中最为人接受的是“无限大”、“循环”等。



推荐阅读


三大运营商否认4G降速;华为对临时通用许可证发布声明;新 iPhone 将支持触控笔

「AI投研邦」将在近期上线CCF GAIR 2019峰会完整视频与各大主题专场白皮书,包括机器人前沿专场、智能交通专场、智慧城市专场、AI芯片专场、AI金融专场、AI医疗专场、智慧教育专场等。「AI投研邦」会员们可免费观看全年峰会视频与研报内容,扫码进入会员页面了解更多,或私信助教小慕(微信:moocmm)咨询。

你还在看吗?

最新有关leiphone-sz的文章

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: TI培训

北京市海淀区知春路23号集成电路设计园量子银座1305 电话:(010)82350740 邮编:100191

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号 电信业务审批[2006]字第258号函 京公海网安备110108001534 Copyright © 2005-2018 EEWORLD.com.cn, Inc. All rights reserved