这个饭碗永远不会被AI取代

发布者:幸福微风最新更新时间:2017-11-24 来源: eefocus关键字:漫画家  AI  LSTM  元素 手机看文章 扫描二维码
随时随地手机看文章

作为一个AI垂直自媒体的作者,我工作中的很大一部分就是替AI“带路”,然后告诉人类读者们,你们的这项和那项工作都要被AI替代了。

 

一直以来,人类似乎都站在一个毫无还手之力的弱势地位,或许未来真的像一些悲观者想象中那样,我们有AI司机、AI售货员、AI诗人,但人类自己却成了可怜的乞讨者。

 

直到今天,我第一次发现有一项工作AI在一段时间以内都无法超越人类,而这次胜利属于二次元——不会被AI代替的工作,是漫画家

 

 

连漫画都看不懂,谈什么毁灭世界?

漫画家不会AI代替的原因很简单,因为马里兰大学的一位教授进行了一项研究,最终发现AI根本看不懂漫画。

 

 

以上是一则非常简单的四格漫画,对于人类来说理解起来非常容易:小猫在思考创作素材,然后发现了小狗,要求小狗讲个笑话,小狗说“你很漂亮”导致小猫非常愤怒。

 

实际上,在最后一个画面中,小狗没有入镜,而“你很漂亮”本来是表扬,要和上一个画面中的“笑话”连接起来,才能解释出小猫的情绪。

 

对于AI来说,要理解这些呈现在画面之外的信息,简直太困难了。

 

在马里兰大学的实验中,研究者搭建了一个由120万张漫画画格组成的数据集,并提取出了每个画格中的文本,利用LSTM模型,希望AI能对漫画进行一个连贯的了解。

 

关于LSTM(长短期记忆网络)此前已经介绍过很多,这一模型的特点就是加入了记忆的概念,可以处理和预测时间序列较长元素。虽然在长文本、机器翻译等等方面表现的都不错,但在看漫画这件事上,LSTM彻底败了。

 

 

在经过大量训练后,研究人员给了AI一组以前没见过的漫画,要求AI理解并预测下一个画面中的文字信息或画面内容,结果AI的成绩一塌糊涂。而人类的预测正确程度,通常能达到80%的正确率。

 

视觉叙事?何必强人工智能所难

严格来说,漫画属于“视觉叙事”——把信息隐藏于图像之中。同样是视觉叙事,AI理解电影就比理解漫画容易的多,电影的主角是人,而人脸长的都是一个样子,想要训练AI读出人脸表情、识别情绪是件很简单的事,更何况电影还会有详细的剧本。

 

但漫画最大的特点,就是视觉上不具有连贯性。就像上文的四格漫画一样,第三张图小狗还在画面中,第四张图就不在了。人类可以很快的理解到,名为淡定狗的小狗扔下一句话就淡定的离开。可对于AI来说,读出这种在画面和文字之外的信息实在是强人工智能所难。

 

 

其次,不同漫画的绘画、叙事风格迥异,对于AI的训练来说也是个难点。简单的四格漫画中,每一格的场景都是相同的,可在其他漫画中,可能这一格是打斗的场景,下一格就是一张愤怒的人脸。能看懂四格漫画AI,再去看那种有镜头切换感的漫画,也是一头雾水。至于画风方面,不同漫画家对于人脸描绘方式都有很大差异,换成AI来理解,难度又会加大了。

 

还有一点,视觉叙事是建立在“逻辑”和“常识”两个概念基础之上的。比如小猫说讲个笑话,小狗说“你好漂亮”,理解这个情节就需要“你说我漂亮是笑话=你说我丑”这一基础的逻辑。又比如《哆啦A梦》中常见的老鼠梗也需要“猫通常不怕老鼠”这一基础常识。

 

这些东西对于人类来说都很简单,可是AI是不具备这些常识和逻辑概念的,我们也不能像编百科全书那样,把这些概念灌输到AI的大脑之中。

 

围棋界的大手,到了《甄嬛传》里也是一集死

结合AI在围棋领域的胜利和在漫画上的失败,我们可以看出,AI在完全信息信息领域中的表现和不完全信息领域中的表现完全不同。

 

完全信息本来是经济学中的一个属于,意思是参与者可以理解整个市场的所有信息。在这里,我们可以看做一项工作的数据集。在围棋这项工作中,所有的信息都可以归纳为数据集:游戏的规则、每一步的打法。可在漫画中,我们最多能把画面中做上详细的标注,把文本信息都提取出来。可隐藏在图片文字之外的逻辑关系、常识等等只可意会不可言传的东西,是无法向AI提供的。

 

而AI做的最差的,就是read between the lines。

以此类推,AI在戏剧、歇后语、四国军棋的暗棋(一种包含了欺骗的军棋玩法)包括谈恋爱等等一切充满了不完全信息、欺骗与反欺骗、解读意象、常识和逻辑的游戏中表现都不会太好。

 

这么看来,AI有点像《三体》里初期的智子,不会隐藏自己的想法,也不能明白隐瞒、欺骗这种概念。

 

所以,我们真的不必对AI的胜利感到恐惧,它会是办公室里人缘最差的那位同事和后宫剧里一集死的路人,某一项能力的突出并不能弥补它在不完全信息方面的短板。更何况意象、类比、反讽、隐喻这种东西,是人类最擅长的手段。

 

 

我相信,未来世界最好的样子一定是人类和AI各司其职,做各自最擅长的事情。在视觉叙事这类AI特别不擅长的事情上,它们依然能给人类提供很多帮助。

 

比如用生成对抗神经网络创造人物形象、用监督学习+卷积网络来为线稿上色、甚至开发一款会自动放大文字的漫画阅读App。这些并不是幻想,而是正在发生的现实。当这些繁复的机械劳动被AI代劳后,我们也就能更多的投入到自己擅长的事情中来:利用不完全信息环境讲好更多故事,让这个世界保持应有的趣味。


关键字:漫画家  AI  LSTM  元素 引用地址:这个饭碗永远不会被AI取代

上一篇:新飞电器的苦恼,三次停产后的失控
下一篇:当色情事业遇到AI,是更好还是更坏?

推荐阅读最新更新时间:2024-05-03 02:01

贝尔科教新品发布 二三线城市对AI科教的兴趣被激发
“优宝,妈妈什么时候才能回来陪我玩儿啊?” “优宝也能陪你呀。” “那你给我出道脑筋急转弯吧。” ”什么动物被打死了,流的却是你的血?” “是蚊子!” 一款粉白相间、外形有点像大白那般柔润体态的“蛋型”机器人优宝Ubao和小男孩进行临睡前对话,这个画面定格在贝尔科教春季新品发布会的屏幕上,而这段温馨的谈话,来源于真实生活场景。 根据国家统计局调查,截至2016年底,我国0—14岁的儿童人口总数达2.3亿。现代社会,父母常常因为工作无法陪伴孩子,巨大的潜在客户基数和市场痛点,催生了一批情感陪护型机器人。贝尔科教集团品牌部总监吴小明说:“我们都希望父母能够多多陪伴孩子,但这是一个充满矛盾的社会问题。” 陪伴型机器人补充科教市场,场
[机器人]
AI机器人革命,谁将成为最大赢家?
英国借助第一次工业革命崛起,成为了世界工业强国。而美国利用第二次工业革命,成为全球经济的霸主。每一次变革都会重新定义世界竞争格局,科技的进步在推动社会向前,如今,我们正在迎接智能化时代,机器人产业快速扩张,人工智能成为了热门的投资方向。 由于传统制造业依赖于人力劳动,而今天人力结构已经发生了变化,像日本等一些国家已经出现老龄化问题,年轻一代也不愿意从事低端的工作,导致了劳动力萎缩,从而人力成本持续上涨。因此,世界各国都在推动机器换人,转型智能制造。 此外,人工智能技术技术开始兴起,其给现代生活带来的好处已被人们认可,该技术开始广泛应用到世界各地,走进人们生活的场景中,例如语音识别、人脸识别、自动驾驶汽车等等,帮助人们提供工作效率和
[机器人]
情感在人工智能当中的应用和发展
目前机器智能领域的成功主要依赖于计算能力,为了做出最佳决策可能搜索数十亿次。如果决策成功的话,往往表明计算能力已经赶上甚至超过人类的智力。人类智能是高度概括的、自适应的和健壮的,即使当前最先进的机器智能系统也无法产生这些特性。例如,即使存在许多未知的变量,人类也能够根据预期的结果提前进行重要的计划。人类的智慧还具有同情心、同理心、善良、有教养,而且重要的是,它能够为了更大的使命而放弃和重新定义一些目标。几乎所有的机器智能研究都集中在“如何”上,但人类智能的特点是能够问“什么”和“为什么”。 假设情商是开启智能机器的关键,他们不仅更普遍、更强大、更高效,而且还符合人类的价值观。人类的情感机制使我们能够完成目前机器无法编程或
[嵌入式]
情感在<font color='red'>人工智能</font>当中的应用和发展
一汽解放与华为全面深化合作,涵盖AI大模型、自动驾驶和智能座舱
10月24日,一汽解放汽车有限公司(以下简称“一汽解放”)宣布与华为技术有限公司(以下简称“华为”)签署全面深化合作协议-AI、智能驾驶及智能座舱专项合作备忘录。 一汽解放表示,此次合作将一汽解放与华为的合作推向新的高度,双方将进一步整合各自优势资源,在AI大模型技术创新、智能驾驶、智能驾舱等方面深化战略合作伙伴关系,引领行业发展。 图片来源:一汽解放 具体来看,在AI大模型方面,基于华为云盘古大模型,一汽解放与华为联手已开展了多个场景的验证测试,充分展示华为云盘古大模型技术在汽车行业的巨大潜力和价值。 今年以来,大模型的爆火给各行各业都带来了全新的变革。针对汽车行业而言,自动驾驶的训练难以遍历各种复杂场景,
[汽车电子]
一汽解放与华为全面深化合作,涵盖<font color='red'>AI</font>大模型、自动驾驶和智能座舱
华为发布2025十大趋势预测:5G、AI、智能技术大量普及
华为发布“面向2025十大趋势”。到2025年,智能技术将渗透到每个人、每个家庭、每个组织,全球58%的人口将能享有5G网络,14%的家庭拥有“机器人管家”,97%的大企业采用AI。 这是华为第二年推出全球产业展望报告,今年华为基于对交通、零售、金融、制造、航空等17个重点行业的案例研究,并结合定量数据预测,进一步提出了面向2025的十大趋势,包括: 1、全球14%的家庭将拥有自己的机器人管家。 2、采用VR/AR技术的企业将增长到10%。 3、智能个人终端助理将覆盖90%的人口。 4、C-V2X(Cellular Vehicle-to-Everything)蜂窝车联网技术将嵌入到全球15%的车辆。 5、每万名制造业员工将与
[嵌入式]
华为发布2025十大趋势预测:5G、<font color='red'>AI</font>、智能技术大量普及
拜登签署对华投资限制令,涉量子计算、半导体和人工智能,中方回应
美国总统拜登9日发布行政命令,禁止美国风险投资和私募股权公司对中国量子计算、半导体和某些人工智能领域进行投资。白宫强调,这不是一项经济行为,而是捍卫美国国家安全的行动,奉行针对中国“去风险”政策,而非经济“脱钩”。 拜登签署行政令,禁止对华敏感技术投资 这项行政命令旨在阻止美国资本和专业知识用以开发可能支持中国军事现代化,并损害美国国家安全技术,主要针对私募股权、风险投资、合资企业以及绿地投资。 该行政命令还指示财政部长(部长)颁布法规:(1) 禁止美国人从事涉及对美国构成特别严重国家安全威胁的某些技术和产品的某些交易,以及 (2) 要求美国人士应向财政部通报涉及某些可能对美国国家安全构成威胁的某些技术和产品的某些其他交易。
[半导体设计/制造]
拜登签署对华投资限制令,涉量子计算、半导体和<font color='red'>人工智能</font>,中方回应
打破AI芯片存储墙、支撑5G宏基站、BLE,芯力量·芯创接地气
通过爱集微APP和集微网在各大平台的入口,关注半导体投融资的行业人士们观看了这场路演的直播。这次芯创路演第三期继续由集微网和中关村集成电路设计园、芯创集成电路产业基金、启航投资、芯创空间孵化器共同合作。这也是集微网云路演平台向第三方开放,实时直播的第二场活动。 ICPARK芯创路演系列活动精选了来自中关村集成电路设计园和北京市的优质半导体项目。整个活动将举办4-5期,每期3个项目,采取投资机构专业化运作的模式进行。 本期的路演聚焦了AI语音识别、5G基站用GaN PA和BLE+LPWAN三个赛道。 点击此处进入直播回看! 项目一是AI芯片及整体解决方案,来自北京探境科技有限公司。 随着语音交互成为AIoT时代人机交互的主
[手机便携]
打破<font color='red'>AI</font>芯片存储墙、支撑5G宏基站、BLE,芯力量·芯创接地气
欧盟率先通过人工智能法案
欧洲议会周三通过了一项具有里程碑意义的人工智能法案,标志着欧盟在监管关键技术方面再次超越了美国,为人工智能的未来设立了明确的界限与规范。这项法案将在欧洲企业和组织如何应用人工智能技术方面发挥关键作用,全面禁止一些不可接受的应用,并对其他被视为高风险的应用设置严格的护栏。 规定人工智能应用红线 欧盟的人工智能法案禁止了一系列不可接受的应用,涵盖了多个领域。其中包括禁止使用人工智能驱动的社会评分系统,以及任何基于生物识别技术用于猜测个人种族、政治倾向或性取向的工具。此外,禁止了在学校和工作场所中使用人工智能解读个人情绪的行为,以及某些类型的预测个人犯罪可能性的自动分析。 除了禁止不可接受的应用之外,法案还为被视为高风险的人工智能应
[机器人]
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
随便看看
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved