EchoSpeech眼镜。图片来源:康奈尔大学
美国康奈尔大学研究人员开发了一款声呐眼镜,它通过声学感应和人工智能跟踪嘴唇和嘴巴的动作,可连续识别多达31条无声的命令,该系统可为那些暂时不方便说话或无法发声的人提供帮助。相关论文将在本月于德国汉堡举行的计算机协会计算系统人为因素会议上发表。
这款眼镜是一种名为EchoSpeech的无声语音识别接口。该眼镜配备了一对麦克风和比铅笔橡皮擦还小的扬声器,成为一个可穿戴的人工智能驱动的声呐系统,在面部发送和接收声波,并感知嘴巴的运动。然后,深度学习算法实时分析这些回声轮廓,准确率约为95%。这款低功耗、可穿戴的眼镜只需要几分钟的用户训练数据,即可识别命令并可在智能手机上运行。
EchoSpeech可用于在说话不方便或不合适的地方通过智能手机与他人交流,比如在嘈杂的餐厅或安静的图书馆里。无声语音界面还可与触笔配对,并与CAD等设计软件一起使用,几乎不需要键盘和鼠标。
研究人员表示,他们正在将声呐技术“搬”到人体上。它体积小、功耗低、对隐私敏感,这些都是在现实世界中部署新的可穿戴技术的重要功能。无声语音识别中的大多数技术都局限于一组选定的预定命令,需要用户面部或佩戴摄像头,这既不实用也不可行。可穿戴式摄像头也存在重大的隐私问题,对用户和与之互动的人来说都是如此。而像EchoSpeech这样的声学传感技术消除了对可穿戴式摄像机的需求。
此外,由于音频数据比图像或视频数据小得多,因此EchoSpeech只需更小的带宽,通过蓝牙实时传输到智能手机上,且数据在本地,不在云端,确保了敏感隐私信息安全。
今年以来,人工智能再次引发极大关注。几年前,专家们还在探讨如何让人工智能更加准确地理解人的意图,并与人进行多轮对话。曾经,让人工智能读懂唇语,还只是科幻电影中的桥段。如今,这些都在快速变为现实。面对人工智能带来的超乎预期的变化,不能停留在“看热闹”阶段,人们需要真正去思考,如何更好地主宰人工智能,利用它为人类造福,并尽量规避它可能带来的麻烦。
关键字:人工智能
引用地址:
人工智能声呐眼镜可识别唇语,准确率约为百分之九十五
推荐阅读最新更新时间:2024-10-17 11:32
字节豆包发布AI智能耳机Ola Friend
字节跳动旗下的豆包正式推出了其首款AI智能体耳机——Ola Friend。这款开放式耳机单耳重量仅为6.6克,实现了近乎无感的佩戴体验。它深度融合了豆包大模型,并与豆包APP紧密连接,使用户无需掏出手机,仅凭语音指令就能与豆包进行对话。 在官方宣传视频中,豆包展示了Ola Friend在信息查询、旅游导航、英语学习以及情感交流等多个场景中的实用性。豆包的相关负责人表示,这款耳机是豆包在AI应用领域的一次创新和尝试,他们希望Ola Friend能成为用户日常生活中的得力助手,并随着后续的技术迭代,为用户提供更多场景化的帮助。 目前,Ola Friend已在各大电商平台开启预售,并将于10月17日正式发货,售价为1199元。
[嵌入式]
AI加持、智能戒指火爆!设备升级带来技术难题,蓝牙芯片解锁低功耗潜力
2024年,全球可穿戴设备市场随着消费电子市场的复苏迎来增长,智能戒指等新品类的出现成为带动该市场持续增长的新动力。蓝牙芯片作为可穿戴设备的关键半导体器件,随着可穿戴设备的不断升级和发展,蓝牙芯片既迎来了巨大的机遇,也面临着诸多挑战。 智能手环/手表AI加持,蓝牙芯片突破功耗新难题 智能手表、智能手环等品类依旧是可穿戴设备的主流产品,也是出货量最大的品类之一。针对这两大类产品,功耗一直是主控芯片不断追求的方向。Nordic Semiconductor 亚太区销售与营销副总裁 Bjørn Åge “Bob” Brandal在接受电子发烧友网采访时表示,功耗始终是最关键的设计考虑因素,因为它决定了产品的可用性。 Bjørn Åge “
[嵌入式]
Adobe发布人工智能视频创作工具:Firefly Video Model
Adobe公司于10月15日正式揭晓了其最新研发的人工智能视频创作工具——Firefly Video Model。这一创新解决方案旨在借助AI技术,赋能视频内容创作者拓宽创意边界,提升制作效率,并紧跟市场对高品质、快速产出视频内容的需求步伐。 Firefly Video Model的核心优势在于能够依据用户的文本输入,自动生成全新的视频内容。尤为值得一提的是,该技术的训练基础是完全获得授权的内容,确保了内容的合法性和可靠性。 在技术架构上,Firefly Video Model融合了深度学习算法、生成对抗网络(GAN)、变分自编码器(VAE),并巧妙结合自然语言处理(NLP)与计算机视觉技术,实现了对文本语义的深刻理解,并
[嵌入式]
联想与英伟达扩大合作,联合发布全新液冷 AI 服务器
10 月 16 日消息,在今天的联想 2024 年度全球创新活动 Tech World 上,联想集团推出了第六代垂直液冷产品 ThinkSystem N1380 Neptune,为生成式 AI 的计算提供动力。 大会上,联想集团宣布与英伟达合作推出联想混合式 AI 全面优势集,并推出 ThinkSystem SC777 V4 Neptune,进一步扩大了与英伟达的长期合作。这个新系统利用新的 ThinkSystem N1380 Neptune,号称在紧凑的设计中实现万亿参数的 AI 模型。 据介绍,ThinkSystem N1380 Neptune 垂直液冷机箱专为行业标准 19 英寸机架而设计,可实现 100% 直接温水
[家用电子]
Arteris 的片上网络瓦格化创新加速面向 人工智能应用的半导体设计
可扩展性能: 在FlexNoC 和 Ncore 互连 IP 产品中,网状拓扑功能支持以瓦格化(tiling)方式扩展片上网络,使带有人工智能的系统级芯片能够在不改变基本设计的情况下轻松扩展 10 倍以上,从而满足人工智能对更快速、更强大计算能力的巨大需求。 降低功耗: 片上网络瓦格(tile)可动态关闭,平均可降低 20% 的功耗,这对于实现更节能、更可持续、运营成本更低的人工智能应用至关重要。 设计重用: 经过预先测试的片上网络瓦格(tile)可重复使用,将 SoC 集成时间最多缩短 50% ,从而加快了人工智能创新产品的上市时间。 加利福尼亚州 坎贝尔,2024年10月15日(GLOBE NEWSWIRE
[半导体设计/制造]
凌华智能携手SimProBot,推出Tallgeese AI本地化工作站方案,结合生成式AI全面提升企业生产力
生态合作伙伴携手: 凌华智能与SimProBot签订合作意向书(MOU),共同打造为企业提供本地化的AI工作站方案。 适合企业本地化应用: 高效、安全隐私保护并容易上手。供企业客户内部使用,并同时保护其行业专业知识及营业机密。 端到端完整解决方案与快速交付: 加速企业完整软硬整合的工业自动化数字转型方案。 中国上海 – 2024 年 10月 16日 边缘运算解决方案全球领导品牌凌华智能宣布携手美国SimProBot公司, 推出企业专属本地化生成式AI解决方案,结合凌华智能AI GPU服务器与Tallgeese AI软件,为企业提供强大的AI运算能力 。 自2022年12月OpenAI ChatGPT问世后
[工业控制]
工业物联网AI转型革命下,恩智浦MCU/MPU如何帮助中国客户更“AI”
我们身处于一个激动人心的时代,因为智能设备正在以惊人的速度增加,无论是汽车、工厂还是居家、楼宇领域,都让AI技术变得“看得见,摸得着”。同时,这些设备也通过蓝牙、Wi-Fi、5G而互相连接,形成一个万物智能的网络。 数据显示,到2030年智能互联设备数量将超过500亿台,到2030年约50%的汽车将实现电气化和L2辅助驾驶,到2025年AI半导体收入将达到750亿美元,到2026年5G将覆盖全球60%的地区,2021到2025年智能家居市场复合年增长率达20%。 在AI革命中,随着边缘AI重要性愈发凸显,MCU、跨界MCU、MPU作为边缘设备的核心也在不断增强其AI处理能力。日前,恩智浦就分享了其在边缘处理业务上的理解和布
[嵌入式]
Hailo以先进AI处理器推进边缘人工智能革命
Hailo革新边缘人工智能 Hailo作为前沿的边缘AI芯片制造商,正凭借其创新的AI处理器与加速器,重塑边缘计算的全新版图。其核心产品Hailo-8,是一款针对边缘设备定制的革新性AI处理器,以其出色的性能著称,专为深度加速边缘设备上的深度学习应用打造。作为一家初创企业,Hailo已在AI领域占据重要地位,尤其在汽车制造与工业4.0等应用领域展现出实力。 边缘AI是Hailo创新战略的核心,代表着数据处理与分析领域的一次深刻飞跃。Hailo的处理器通过赋能设备在本地执行复杂的深度学习算法,实现了低延迟,这对于依赖实时分析的应用场景——诸如视频分析与计算机视觉——而言,至关重要。向边缘计算的转型不仅标志着AI部署策略的根本性转变,
[嵌入式]