傲硕科技:前装语音方案提供商的路,无声且无情

发布者:平凡幸福最新更新时间:2017-12-07 来源: eefocus关键字:傲硕科技  语音方案 手机看文章 扫描二维码
随时随地手机看文章

    让我们想象一下这样的场景:

    数十年后,人们随心所欲的勾搭无人驾驶车辆,畅通无阻的与这些行走的交通工具们聊天拼段子。倘若给这群早已习惯车载智能语音交互的未来人类放映一部时下公路片,他们一定会困惑为何车内如此静默。

    “专注于开车”这件事,正随着技术的更迭变得无趣。同样,那些因为无法解放双手与大脑的时间也正在被智能化的演进推着走,更为实用性、灵活度、个性化。

    我们今天要讲的,就是一家试图打破沉默的智能语音技术提供商——傲硕科技。

    傲硕科技成立于2012年,这家从事智能语音应用技术研发的公司,从创立之初就敲定了前装路线,一个猛子扎了几年。从最开始专心服务于上汽通用的几代平台,到去年逐步与一级供应商们一并深入更紧密的前装合作,傲硕走的太低调。

    车载语音交互再升级

    作为智能汽车的最终端也是最直接的效果展现,车载语音体系正以越来越不可辩驳的交互入口验证着各家产品的真实实力。产品好不好,对上两句。

    傲硕科技总经理郑天堂在傲硕科技总经理郑天堂来看,能听清、能听懂是初代语音交互产品的检验标准了,说人话、“见人下菜”的说人话才是版本进化的核心竞争力。

    “要能做到跟你说的是人话,并且和别人的车内对话不一样,关键要看相关数据能否用好。”好比今日头条“你喜欢的”智能内容推荐,或者是淘宝首页商品展示的“千人千面”,二代语音交互体系也要做到根据用户行车数据来预判、测算,以用户画像来形成个性化的互动内容。

    基于此,傲硕科技将车载语音的功能细分为通讯、娱乐、车身、资讯、出行以及个性化服务这6个功能板块。郑天堂介绍道,“目前在不断提高基础引擎基础能力的同时,傲硕也将会发布新一版的软件应用架构,与合作伙伴一起实现基于用户数据的、更加个性化的自然语言方案。”

    前装供应商VS互联网企业,孰胜孰劣?

    对前装供应商来说,要做的资源协作难以想象的多,从一级供应商到各方内容提供商,运营之复杂、工期之长度都考验着傲硕科技的技术性、稳定性。仅内容和服务合作层面,傲硕科技就达成了包括高德地图,飞常准,爱听美达,喜马拉雅,考拉FM,墨迹天气,东方财富,ZAKER资讯等常用场景类、功能类供应商在内的深度内容整合。

    成为前装供应商,更是整车企业从技术、成本、稳定性等多方考察判断的结果。郑天堂向车云菌介绍说,“签约后,开发两年、供货三到五年、售后支持还要有五年。基本你为车厂服务的周期是十年抗战。”

    别克GL6内饰图,其所搭载的语音解决方案由傲硕科技提供创始团队来自Nuance,现有团队骨干来自上海贝尔、四维图新、泰为等企业的傲硕科技显然在技术层面是过硬的,郑天堂介绍道,目前傲硕科技已经通过ISO9001以及CMMI3.0认证,拥有自主研发的从语音识别到语义理解再到语音合成等核心引擎,包括本地识别引擎、云端识别引擎、自然语言理解引擎、语音合成TTS引擎以及声纹识别引擎等。

    同时,“本地+云端”Hyrbird智能语音整体解决方案,支持场景和功能定制,支持WinCE、Android、Linux、QNX等主流车载操作系统。

    除了强调技术,傲硕科技自信前装供应商能赢的点还在于角色定位。在郑天堂看来,互联网平台的短板在于业务合作的冲突性。车厂希望加装的,只能是也必须是用户体验最好、基数最多的供应商,这决定了QQ音乐之于音乐、高德之于导航的专属性,存在着像百度这样的平台无法规避的利益冲突。

    而对开放云平台来说,垂直合作使得此类企业的产品并不集中,也不能通过一个核心的、有记忆点的、有着落地场景的产品来达成深度整合。

    但不可否认的是,技术的快速更迭只会让先发优势的差距越来越小,大数据的智能化和深度学习也会突破资源层级,依靠科技的强壁垒重塑产业关系。

    统一的输入输出逻辑、开放的数据后台、系统性的多元化训练等也能帮助车载智能迭代的更快、进步的更一致,大玩家们只可能是“手拉手、心连心”的走。

    这种由商业进化带来的无情,市场拼杀的人会领教更多。而对于傲硕科技来讲,技术赋能和深度协作也只是防御姿势的开始。


关键字:傲硕科技  语音方案 引用地址:傲硕科技:前装语音方案提供商的路,无声且无情

上一篇:日产明年开始测试自动驾驶出租车 乘客免费体验
下一篇:现有的4S店模式必须革新 互联网玩法不一定适合汽车

推荐阅读最新更新时间:2024-05-03 02:06

大联大品佳集团推出基于MediaTek产品的Wi-Fi 6 AIoT边缘计算语音识别方案
2022年3月16日,致力于亚太地区市场的领先半导体元器件分销商---大联大控股宣布,其旗下品佳推出基于联发科(MediaTek)Filogic 130A(MT7933)的Wi-Fi 6 AIoT边缘计算语音识别方案。 图示1-大联大品佳基于MediaTek产品的Wi-Fi 6 AIoT边缘计算语音识别方案的展示板图 全球疫情的爆发加速了数字转型、智能物联网的发展进程。为有效对抗疫情,减少人们在日常生活中的直接触碰,非接触式技术被广泛使用在各大场景中。其中,语音识别技术作为非接触式技术的一种,其通过语音或语音命令与装置设备进行互动,在后疫情时代备受关注。基于此背景,大联大品佳推出了基于MediaTek Filogic 1
[模拟电子]
大联大品佳集团推出基于MediaTek产品的Wi-Fi 6 AIoT边缘计算<font color='red'>语音</font>识别<font color='red'>方案</font>
CEVA音频前端软件解决方案通过Alexa语音服务(AVS)认证
CEVA音频前端软件解决方案通过Alexa语音服务(AVS)认证 这款解决方案结合了ClearVox™远场降噪软件与WhisPro™基于神经网络的 关键词识别(KWS)软件,可整合至支持Alexa语音服务的设备 全球领先的无线连接和智能感知技术及共创解决方案的授权许可厂商CEVA, Inc.(宣布其音频前端(AFE)软件解决方案已经通过Alexa语音服务(AVS)认证。 该解决方案结合了CEVA的ClearVox™远场降噪和语音处理软件与WhisPro™基于语音用户接口神经网络的关键词识别(KWS)软件,是功能强大的超低功耗软件包,可与支持AVS的设备(如智能扬声器、音响棒等)集成。 AVS是亚马逊基于云的服务
[模拟电子]
CEVA音频前端软件解决<font color='red'>方案</font>通过Alexa<font color='red'>语音</font>服务(AVS)认证
煤矿井下数字语音通信解决方案
  中国作为产煤大国,煤矿安全一直都是重中之重。如何保证井下和井上之间可靠的实时语音通信,越来越受到关注和重视。目前煤矿通信系统主要分为两种:一种是调度电话,包括有线和无线电话;另一种是井下局部扩音电话系统。对于数字通信方式,目前许多公司仍采用模拟信号来实现煤矿语音系统,与数字语音通信系统相比,其存在不稳定、不灵活等缺点,而现阶段模拟通信系统已逐渐被代替。目前,现场总线已发展成为集计算机网络、现场控制、生产管理等内容为一体的现场总线控制系统。由于现场总线分布在自动化应用的各个角落,给设计者和使用者提供了方便,但这些应用均被限制于数据传输。本设计基于CAN总线构建井下对讲系统,与其他通信方式相比,其具有较好的实时性、可靠性和灵活性。
[单片机]
煤矿井下数字<font color='red'>语音</font>通信解决<font color='red'>方案</font>
语音应用需求增 半导体业者竞推新方案抢市
语音识别市场夯,根据市调机构Strategy Analytics研究指出,到2022年,预估全球消费市场将有超过六千两百万个装置具备个人语音助理。 为插旗此一市场,半导体业纷纷推出新一代解决方案。 例如英飞凌(Infineon)结合雷达、MEMS麦克风和音频处理器,进一步提升MESM麦克风语音识别效能;而意法半导体(ST)则是携手语音接口和关键词检测算法开发商--Sensory,以及通讯无线芯片组解决方案供货商DSP Group,共同开发高效语音检测处理麦克风技术。 工研院IEK电子与系统研究组分析师吕佩如表示,语音助理目前相关服务虽仍处于起步阶段,但随着市场需求快速增长,未来将会渗透到智能家电、车载系统,甚至更多物联网设备中的应
[手机便携]
安森美半导体音频方案可实现超低功耗语音交互应用
音频/语音用户接口(VUI)是未来人机交互的一个重要的新兴趋势,将越来越多地用于智能家居控制、楼宇自动化、智能零售、联接的汽车、医疗等物联网垂直领域,这涉及语音触发、识别、处理技术,同时设计人员还面临如何提高能效的挑战。针对本地和云端,安森美半导体都有相应的VUI方案,提供先进的语音触发、识别、处理、控制等功能,具备出色的计算能力和能效,确保卓越的用户体验。 VUI架构及分类 图1是基于麦克风阵列的高级语音接口架构,本地处理需要进行说话人跟踪、语音增强,其中涉及波束成形、唤醒词检测、声源定位、降噪、语音检测等技术,云端方案则涉及自然语言处理。其后,指令还需通过音频播放功能播放出来,同时需进行回声消除。 图1:
[物联网]
安森美半导体音频<font color='red'>方案</font>可实现超低功耗<font color='red'>语音</font>交互应用
语音辨识方案引领未来平板电脑趋势
  SRS 实验室宣布,东芝(Toshiba)全新平板电脑THRiVE™采用SRS PrmiumVoic Pro™音频解决方案,提供明澈清晰的语音通讯,并为多媒体内容提供令人赞叹的音频娱乐体验。   SRS实验室市场营销部副总裁Alln H. Gharaptian表示:“平板电脑现在炙手可热,迅速成为消费电子产品市场中最热门的类型。东芝的全新平板电脑THriVE搭载SRS PrmiumVoic Pro音频解决方案,进一步证实了SRS作为全球平板市场音频解决方案提供商的领导地位。平板电脑不仅很适合浏览上网,同时也可以用来观赏电影、玩游戏及进行网络通话。我们相信东芝的用户会十分喜爱SRS PrmiumVoic Pro所带来的更精致
[家用电子]
瑞萨电子推出通过电力线进行语音通信的PLC解决方案
电子网消息,全球领先的半导体解决方案供应商瑞萨电子株式会社,今日宣布推出新型语音电力线通信(PLC)解决方案,支持在现有电力网络中进行数据通信和语音通信。PLC解决方案可减少建筑物内部布线的数量,从而降低公共广播(PA)系统和安全系统的实施和维护成本。 新解决方案由管理PLC通信的瑞萨电子PLC软件调制解调器(R9A06G037)和控制音频编解码器处理的RX651微控制器(MCU)组成。新解决方案以低成本将语音功能集成到现有装置中,能够让系统制造商增强安全系统。对包括各种传感器和语音通信的新装置而言,布线成本可以减少约60%,而安装和维护成本可以降低达40%。 办公楼等设施安装了各种管理系统,包括气候控制系统、照明、各种传
[半导体设计/制造]
瑞萨电子与Syntiant共同开发语音控制多模态AI解决方案
瑞萨电子与Syntiant共同开发结合先进视觉与语音技术的语音控制多模态AI解决方案 全新方案在物联网和边缘应用中实现对嵌入式视觉AI系统的低功耗语音控制操作 2021 年 7 月 28 日,日本东京和美国加州尔湾讯 - 全球半导体解决方案供应商瑞萨电子集团,和致力在边缘设备领域推动低功耗智能语音及传感器处理技术的深度学习芯片技术供应商Syntiant今日宣布,共同开发出一款语音控制的多模态AI解决方案,在基于视觉AI的物联网和边缘系统(如自助收银机、安全摄像头和视频会议系统)以及智能家电(如扫地机器人等)中实现低功耗、非接触式的图像处理。 全新解决方案结合了瑞萨RZ/V系列视觉AI微处理器(MPU)和低功耗多模态
[物联网]
瑞萨电子与Syntiant共同开发<font color='red'>语音</font>控制多模态AI解决<font color='red'>方案</font>
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved