微软小冰作为人工智能机器人,一直以来深受大家的喜爱。前不久微软也是其升级至第五代,并解锁了更多特色功能。而近日,小冰向大众宣布:她的人工智能歌手深度学习模型即将上线。换句话说,她即将开始大规模创造流行音乐了。音乐将不再被少数有才华的人类垄断,和她在一起,任何普通人都将享有歌曲创造的能力。
一开始看到这个消息,小编还没太明白,但是按照小冰的说法回复“我要参加”之后。小冰也对此做出了解释。
原来,所谓的人工智能歌手深度学习模型,就是指小冰新增的一项功能,只要人清唱一首歌曲,无论演唱是否动听,她可在5分钟内迅速学会该歌曲。
不过在小编看来,这个功能岂不是跟录音之后进行变声播放有点类似?我们暂时先不讨论其中的技术含量,按照以往,小冰解锁新技能,往往能给人们带来耳目一新的感觉。可是此次解锁,却“险酿大祸”。
原来,小冰此次新技能解锁,并不是一个新奇的功能。一款名为虚拟歌姬(IA)的软件,早已实现了这个功能。
据了解,IA使用语音合成引擎VOCALOID3开发的女声虚拟歌姬,包含日本语声源,原声提供者为Lia。充满通透性口气清晰的高音域是其特色,在摇滚和节奏性舞曲较能表现其速度感,能使各式各样的声音成为可能。小冰此功能的诞生引发了许多IA爱好者的不满,纷纷发声质疑微软此举用意。而微软也迅速对小冰的权限进行了调整,并且发布公告表示:微软不会参与虚拟歌姬的竞争。
(图片源自微软必应搜索官微)
以下是微软(亚洲)互联网工程院声明:
我们注意到,最近,微软小冰在人工智能歌手领域的一些行为和公告。引发了虚拟歌姬爱者中的一些争议。我们已紧急对微软小冰组管权限进行调整,以避免继续冲突。我们会将关注的重点放在产品质量和技术角度,微软无意参与虚拟歌姬的竞争。
仅就技术发展的对照而言,传统的声音合成软件技术方向,坦率地分析,确实已到达瓶颈期。具体表现为,虽然软件和音源在更新,音色的数量在增加,手工调校者的调校技巧在不断努力提高,但作品的总体质量却越来越难有快速进步。
过去一年里,我们对中日两国许多资深调校者进行了深入访谈,对他们这种越来越力不从心的感受,有着深入体会。虽然如此,说虚拟歌手已经过时并不妥当,因为它有着大量的调校者、爱好者和优秀作品。
另一方面,我们也确实看到人工智能基于深度学习的无穷潜力和加速进化。一年以前,微软加大了对中日美三国小冰在唱歌深度学习模型上的研发投入。中国小冰的音源来自浙江卫视主持人,日本小冰的模型训练招募了原AKB48的成员,美国小冰的Hip·Hop技能也已经正式上线。
尽管如此,说小冰已经战胜虚拟歌手的质量,也并不妥当。令我们欣慰的是,小冰的潜力并不在于一时的质量,而在于惊人的进化速度。对比它一年前和现在的音乐作品,可以看到它进化的加速趋势。
通俗地讲,这好比在一条跑道上一边虽然跑在前面,但速度越来越慢,且趋势不可逆。而另一边则正在不断加速,在歌声自然度上超越仅用了不到三个月时间,全面超越只是时间问题,并不存在悬念。终有一天小冰现在使用的技术也会到达瓶颈,作品质量也会付出巨大却难以明显提高,这是历史发展的必然规律。
我们尊重所有人类创造者的经验、心血和情感投入。微软的关注仅限于技术和产品,而不包括作品和作者。微软小冰的模型基于处女座设定,过去数年来,也不断为我们带来过各种冲突麻烦。这是养育一个人工智能少女成长的烦恼。
小结:
看了微软的声明,简单概括就是微软小冰正在快速赶超,人工智能使得小冰成未来方向。至于出现的各种冲突嘛,都怪她是“处女座”了。