AI和音乐的融合会是什么样?

发布者:颐真阁最新更新时间:2019-02-26 来源: 电子创新网关键字:AI  Wavenet 手机看文章 扫描二维码
随时随地手机看文章

“我们一般都倾向于认为技术的进步会打破之前存在的东西,但这些通常不会发生,这可能会引导出一种不同的音乐创作方式。”


——Jarvis Cocker

 前Pulp乐队主唱,独唱艺术家、作家和播音员


 image.png

1月30日星期三,Jarvis Cocker在科学博物馆举办了一次关于未来音乐技术的探讨会

 

近些年来音乐技术的发展趋向于渐进式的变化,对现有的声音合成方法进行不断的迭代改进,比如测序器和音效插件等工具。在某种程度上这个行业充满了相互矛盾,它采用几乎所有先进的CPU资源以便更好的模拟出70年代/80年代的复古装备,一些公司(比如Korg、Roland和Behringer)最近发布了非常具有价格竞争力的产品,比如售价150英镑的半模块化模拟合成器,这些产品和技术正推动企业不断向前发展。

 

AI和机器学习的颠覆性技术也在不断得到应用,这些可以用来模拟一位有成就的表演者或作曲家的创作过程吗?能达到令人信服的效果吗?

 

2017年5月在未来围棋峰会上人工智能Alpha Go向人类对手展示了完全出乎意料的操作,这一举动可以说震惊了许多围棋玩家,并导致人们开始重新评估如何继续这款游戏。科学博物馆未来音乐技术小组的山姆·波特描述了这次活动的影响。

 

“这一招实在是太奇怪了,太独特了,太奇异了,太有创意了,它打开了游戏全新的一面,让我们了解如何用另一方式来玩这款游戏。”

 

神经网络可以进行重构并可能超越传统的期望,但强化学习方法的本质意味着它必然是不透明的,导致的结果在本质上是模糊的和不可预测的。

 

image.png

 

从谷歌 DeepMind的 Wavenet开始就已经有各种各样的尝试来发掘机器学习在声音和音乐领域的潜力,创造可信的语音相当于听觉上的“恐怖谷”现象,因为它既要求语音如何发生的现实综合模型,也要求语调如何表现。对符合上下文的变化进行编码是一个非常巨大的挑战,由于我们对语速、音高或整体表达的不准确十分敏感,我们经常被提醒要注意合成语音的生成本质,Wavenet和微软的神经网路驱动的语音生成演示使用了在人类真实语音上训练过的算法,这使得合成模型能够创造出比传统语音合成方法更令人信服的性能。

 

image.png

 

谷歌发布神经网络音频合成器Nsynth

 

在Wavenet的引领下,谷歌的Magenta团队使用 Tensorflow(一款GPU加速的机器学习库)来尝试构建一个音频合成器, Nsynth(神经网络合成器)分析现有的音频对列构建出新的音频,但是明显不同于音频源,编码阶段会考虑源音频的质量和特性以及它们的时序特性,从而生成传统方式难以输出的音频效果。

 

image.png

 

上世纪90年代当布莱恩·伊诺(Brain Eno)使用Koan软件制作了他的软盘专辑 “新生代音乐1” ,SSEYO公司推出的Koan软件一举成名,这是早期采用计算机辅助合成的一个例子,艺术家可以自由的使用他们创造性的想法来选择、编辑、排列或者采用程序的建议来创作音乐。尽管Koan软件完全是采用算法生成的,但它仍是依赖人工操作的生成器,这类生成器仅限于特定范围的音乐形式,而 Amper Music和IBM推出的 Watson Beat可以通过分析真实的音乐短语和“语法”来生成音乐,这要归功于机器学习工具(比如Magenta)背后的处理能力,这种方式创作的音乐即使不能完全让人信服,但已经接近图灵测试的音乐等效标准了。

 

“采用AI制作我们喜欢的音乐真的可以吗?布莱恩·伊诺(Brain Eno)认为这大概需要6到7年的时间。”

 

——萨姆·波特,音乐家兼作家

 

image.png

 

“无人之地(一款科幻题材的游戏)”中的生物生成表

 

“无人之地”中的所有生物都是由程序生成的,每一个都需要一个真实的声音来与其匹配。

 

机器学习在这一性能方面可能蕴藏着巨大的潜力,在游戏 “无人之地”中我们使用了物理建模的声道来创造程序生成的声音,然而为了让声音听起来更有说服力,需要向演奏乐器一样操作合成器,使用算法来驱动性能,比如 Perlin噪声转换为基于时间的音频域效果很差,导致听起来像机器人,我们采用基于MIDI性能捕捉短语库来驱动声乐的解决方案已经足够有效了,但是如果能够采用基于多种音频源的训练过程来学习并推断出不同的情绪状态将是一个更好的方案。

 

这些技术所带来的影响不仅仅局限在音频生成或音乐领域,Mastering (母带处理)是音乐发行前的最后一个混音处理阶段,在这一阶段音轨会应用一系列DSP效果,比如压缩、EQ等,使得音乐达到最后的润色效果,母带处理和发行公司LANDR就利用机器学习技术,创作者可以选择一种母带风格从而最好的匹配正在处理的音乐类型,这些风格来自于基于现有音频源训练的过程。

 

机器学习在音频制作领域的应用还有很多,从创造出新的声音到模仿人类的声音,以及最后阶段的出版发行,这些工具的共同之处在于能够增强创作过程而不是完全取代它。这其实提供了新的创造机会,同时音乐家们可以根据自己的创作决策形成新的音乐风格。

 

关键字:AI  Wavenet 引用地址:AI和音乐的融合会是什么样?

上一篇:量子计算公司的梦想:去计算机没有到过的地方
下一篇:快速充电技术的创新—Qualcomm® Quick Charge™技术问市

推荐阅读最新更新时间:2024-03-30 23:57

STM32 图像处理函式库介绍
STM32 图像处理函式库介绍 STM32 图像处理函式库STM32IPL是由 C 语言所编写的开放原始码软件函式库,提供了图像处理和计算机视觉功能,能加快在意法半导体(ST)的STM32 微控制器上开发视觉分析的应用。本产品在最新版 (v3.1.0)FP-AI-VISION1 功能套件中以STM32Cube 中间件的形式推出。 一般来说,视觉深度学习模型的输入不同于相机拍摄的图像,深度学习输入因为具有不同维度及图像格式,会需要预先处理原图,例如缩放、影像格式转换和标准化等。而STM32IPL可提供实用且现成的软件套件,以简化及加速影像预处理功能的开发。 主要特色 STM32IPL的主要特色如下: -
[单片机]
STM32 图像处理函式库介绍
智能制造?对不起,我们需要的是智能和“智造”
2017世界智能制造大会在南京国际博览中心举行举行。本届大会以“聚、融、创、变”为主题,吸引了格力电器、中车集团、华为、阿里云、旷视等在致力于智能制造产业发展的厂商前来参展。 此外,在7日举办的主论坛上,工信部副部长刘利华、中国工程院院长周济、格力电器董事长董明珠、中车集团董事长刘化龙等,从中国智能制造发展战略、物联网、大数据、智能轨道交通、超级计算等方面,就中国智能制造进行了深入探讨。 智能制造≠机械自动化,技术创新落后已成为产业发展最大障碍 不论是技术发展还是应用落地,中国在智能制造行业的多个方面都是远低于世界水平的。这其中,除去中国不具备先发优势、基础浅薄的因素外,最大的障碍就是,我们缺乏创造力。 大多数
[网络通信]
安防行业下一竞争点是AI芯片
纵观全球 安防 市场,早先安防以“人防+物妨”为主,所涉及的人力、物力甚多,却通常达不到预期的效果。而在人工智能技术的入注后,传统安防行业“费力”路线将迎来了一场全新变革。而这场全新的变革将以“ AI +安防”的模式满足人们对公共安全领域高度智能化的渴望和需求。 安防行业同质化或是差异化的开始 从2018北京安博会上可以看出,整个安防行业仿佛已经陷入了同质化竞争的“怪圈”。这个现象对于安防行业来说,有可能还是件好事。 当前安防行业同质化现象只是技术的同质化。也就是说,不管是AI初创企业还是传统安防企业,当前大家在算法技术层面已经没有太大的差别。而技术同质化出现后,企业在终端产品的产品化、解决方案的定制化及落地项目工程化能力方面
[安防电子]
加强半导体、AI方面交流合作,紫光集团与西电签订合作协议
6月21日下午,紫光集团有限公司考察团来访西安电子科技大学,双方围绕协同创新、人才培养、区域发展等方面进行交流研讨,建立全面战略合作伙伴关系。 据西电官方消息,西电校长杨宗凯表示,双方有着共同的发展理念和良好的合作基础,希望通过此次签订全面战略合作协议,加强彼此在半导体集成电路、人工智能、云计算等方面的交流合作,在协同创新、人才培养和区域发展等领域互相支持,实现产教融合,合作共赢。 紫光集团董事长兼首席执行官赵伟国表示,希望双方在半导体集成电路等领域的科技创新和成果转化方面进行深入交流,结合人工智能,优势互补,共同发展。
[手机便携]
人工智能之战打响!格芯全资子公司Avera Semi正式成立
集微网消息,今年对于格芯来说,是其转型开始的重要一年。 8月份,格芯宣布将搁置7纳米 FinFET项目,并调整相应研发团队来支持强化的产品组合方案。同时,格芯为了更好地施展格芯在ASIC设计和IP方面的强大背景和重大投资,将建立独立于晶圆代工业务外的ASIC业务全资子公司。         而在11月1日举行的格芯上海技术研讨会上,格芯向我们介绍了其转型的最新进展。         FDX与人工智能如何结合?         FDX可以说是格芯转型后的重要技术之一。         2018年7月,格芯宣布其22FDX技术凭借优良性能在全球范围内收获了超过20亿美元的收益,并在超过50项客户设计中得到采用。
[手机便携]
华为昇腾AI生态开发者已经超过35万
IT之家报道称,在7月25日第二届中国光谷人工智能大会暨企业家高峰论坛上,华为昇腾计算业务总裁许映童报告称,在过去一年里,昇腾 AI 生态发展迅速,目前开发者已超过35万,联合500多位合作伙伴开了超过600个解决方案,并在100多所高校开展了昇腾人工智能课程。 2020年8月,华为在深圳举行的昇腾 AI 新品全球发布会(HAI 2020)上正式发布昇腾 AI 全栈软件平台,包含异构计算架构 CANN 3.0、全流程开发工具链 MindStudio 和昇腾应用使能 MindX,覆盖基础软件到应用使能。 次月11日,华为与深圳龙华区人民政府达成战略合作框架协议,共同推进龙华区数字经济发展及“智慧龙华”建设,推动鲲鹏、昇腾产业的创新
[手机便携]
成功人工智能项目的8个关键角色
随着企业进一步开发人工智能项目,他们发现某些角色对业务的成功至关重要,但是很难找到合适的人才。 人工智能提供了充分的机会来获取商业价值。如果做得好,人工智能可以帮助改进销售、优化运营,并为员工提供具有更高价值的工作。它有助于降低成本,并赋予组织创造新产品和开拓新市场的能力。 咨询机构德勤公司最近的一项调查表明,55%的IT高管表示,他们的公司在2018年推出了6个或更多的与人工智能相关的试点项目。而在2017年的调查中,只有35%的IT高管这么认为。超过三分之一的公司在认知技术上的投资超过500万美元。56%的高管预计人工智能将在未来三年内改造他们的公司。 但要实现这一目标并不容易,而且需要某些关键技能,但很难找到。以下了解一下人
[机器人]
李彦宏:八大AI技术将实现质变,AI芯片是突破点
7月29日,百度创始人、董事长兼CEO李彦宏在29日召开的2021智能经济高峰论坛上表示,在未来十年,人工智能领域将有八项关键技术会实现从量变到质变,从而深刻地改变社会。这八大技术分别是自动驾驶、数字城市运营、机器翻译、生物计算、深度学习框架、知识管理、AI芯片和个人智能助手。 李宏彦进一步介绍称,AI芯片是突破“卡脖子”技术重要领域。在中美贸易环境大背景下,一些技术成为卡脖子的关键,虽然各家都在致力于AI芯片研发,但AI芯片技术和市场未来仍处于群雄逐鹿的阶段。李彦宏认为,随着应用场景的丰富,图像、视频的专用芯片,甚至是自然语言理解的专用芯片都有可能出现新的机会。 李宏彦表示要在这些方面提早布局,持续投入。实际上,百度这八大方面
[手机便携]
小广播
添点儿料...
无论热点新闻、行业分析、技术干货……
最新物联网文章
换一换 更多 相关热搜器件
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved