人工智能会替代多少人力劳动？-电子工程世界

分享到: 微博; QQ; 微信; LinkedIn

一双眼睛的局部细节图出现在电脑屏幕上，小慧对着放大的眼睛，一步步地做好标记点。

一眼望过去，一排排的电脑屏幕上，都是类似的画面。也许是因为窗帘的遮光效果太好，略显昏暗的办公环境加上电脑屏幕上被放大的各种物体细节，颇为惊悚。

在某人工智能研究院看到这一幕，不觉惊叹即使是头部的AI创业公司，最关键的一环依然是从数据标注员开始的。

而这是一群被称作第一批被AI累死的人。

AI的老师：画框的这些人

伴随着AI兴起的最关键的技术莫过于深度学习，作为深度学习的基础，神经网络是一种以输入为导向的算法，其结果的准确性取决于接近“无穷”量级的数据。

所以摒除那些复杂的中间环节，深度学习最关键的就是需要大量的数据训练，这也是为什么在互联网大数据的时代，AI可以崛起。而在数据训练之前，又必须先对大量的数据进行标注，作为机器学习的先导经验。

因此，催生了大量数据标注员的产生。

简单的说，数据标注员类似于AI的老师，举个形象的例子，我们要教机器认识一个苹果，你直接给它一张苹果的图片，它是完全不理解的。我们得先有苹果的图片，然后在上面标注着“苹果”两个字，机器通过学习了大量的图片中的特征，这时候再给它任意一张苹果的图片，它就能认出来了。

据了解，目前标注员的工作内容常见的有拉框标点、打标签、分割、批注等等。其中分类就是最常见的打标签，比如标注画面上动物毛发颜色、动物耳朵等等；框选是将画面中相对应的对象标框标注；还有一种是描点标注，一般用于更细致的人脸标注：需要在眉毛、眼睛、鼻子、嘴巴等关键点做二十多个标记点。

从他们的基本工作内容就可以看出来，数据标注是个非常枯燥而又考验人耐力的工作，并且相比较AI所代表的高科技，标注看起来毫无技术含量。

一条产业链的开始

但巧妇难为无米之炊，AI算法的训练离不开这些大量的数据标注，与之相伴生的数据标注外包业务也成了热门的产业。

在IT桔子的大数据标注公司专辑中，一共收纳了6家，其中，有5家都在2017年到2018年这个时间周期内获得千万的融资：

2017年7月，BasicFinder完成1000万人民币Pre－A轮融资；

2017年11月，龙猫数据获得A轮3370万人民币融资；

2018年1月，星尘数据获得1000万人民币Pre－A轮融资；

2018年3月，爱数智慧获得A轮融资；

2018年5月，周同科技完成2000万人民币A轮融资。

同时，他们业务方向也有一定细分区别，有的以处理图像见长，有的数据标注公司更擅长做一些视频标注。而这些公司的服务企业有百度、小米、京东、今日头条这样的互联网公司，也有出门问问、云从、深鉴等AI公司。

另外，像京东、百度、腾讯、阿里其实都有自己的标注平台和工具。

而在国外方面，亚马逊有推出众包数据平台Amazon Mechanical Turk，初创公司方面则有CrowdFlower、Mighty AI等。

这些已经算是这个领域的佼佼者了，在他们的下面，还有成百上千的小的数据标注公司。

据悉，数据标注行业实行这样一套分工流程：上游的科技巨头把任务交给中游的数据标注公司，再由中游众包给下游的小公司、小作坊，有的小作坊还会进一步众包给“散兵游勇”，比如学生或家庭主妇。

这条产业链上，分包现象越严重，最终落到最底层的数据服务公司的价格就越低，一层层的“数据黄牛”压缩了利润空间，所以一些任务经过数手转包，酬劳已低得惊人。

目前的数据标注工作主要是集中在河北、河南、山东、山西等劳动力密集的地区，这样的选址也因为能够以更加低廉的劳动力成本去完成大量的数据标注工作。

在很多数据标注的报道中，出现频率最高的都是那些毕业于职业技术学校的学生，他们在三四线城市，只需要会操作电脑，就能做数据标注的工作。然而枯燥而又乏味的重复性工作，导致数据标注人员的流动性非常之大。此前，在澎湃新闻的一篇视频采访中，某数据标注公司创始人表示他们有500名左右的在职人员，但是全职的只有11、12个。

在一些大的数据服务公司，他们宣称平台用户（数据标注人员）超过20万人，其中很多都是兼职人员。

不过，快速的人口流动也依然阻挡不了低门槛数据标注生意的红火。

有多少智能，就有多少人工

即使现在有一些数据服务平台开发了AI工具来辅助人工标注，但依然需要数据标注员去检查和修正其中的错误。在一些专业数据标注公司，机器占30％，而人工标注占比达到70％左右。

梳理数据标注员的工作逻辑，就像一个悖论，AI能否进化的更为智能某种程度上取决于这些标注工作的人，而这个工作却是最不智能、最没有技术含量的。

记得在一篇采访中，管理标注员的负责人用特斯拉（Tesla）的自动驾驶事故给员工“打鸡血”，他提到2016年，一辆自动驾驶模式下的特斯拉发生车祸事故。事后特斯拉公司发表声明称：白色卡车在蓝天背景下识别不出来，特斯拉因此没有启动刹车。

“我一直跟他们说：‘你们打磨的每一个数据都会为人工智能做出巨大贡献，将来的无人驾驶车能够识别出蓝天下的白色卡车，就是因为你当年把它标出来了。’”

这种看似无意义的低效率工作应该由AI去做才符合我们对技术的认知，因为我们发展人工智能的初衷，就是为了解放生产力、提高生产效率。

最需要AI去做的事情，AI反而无能无力，而我们为了能让AI取代劳动密集型的工作，得先为AI服务，付出密集、辛勤的劳动，这让数据标注工作看上去有点赛博朋克、反乌托邦的“魔幻”感觉。

然而更令人觉得沮丧的是，人工去训练AI依然存在很多问题。

此前，清华大学人工智能学院院长张钹院士就提到纯数据驱动的系统也存在很大问题——鲁棒性很差，易受到很大的干扰。即便训练出的系统模型准确率高达99％，但在实际应用中，仍然会犯很多“弱智”的错误。

这就陷入了死循环，人不可能像AI一样，在工作中严格按照数据程序毫无瑕疵地完成工作，纰漏或者技术本身的问题，会导致人工智能的不准确性。最终，就在这个无限循环中不停地优化。

而且考虑到数据的隐私和公司的商业利益，同类型的数据是无法相互打通的，就像一位数据标注资深从业者所说， “以自动驾驶领域的数据标注为例，我用A公司的数据模型放到 B公司的设备上跑不通，甚至摄像头换了一个角度、位置或分辨率，都跑不通。”

“有多少智能，就有多少人工。”这似乎是AI进化必须经历的过程。

结语：

当然，最完美的情况应该是：AI能够自己消化大量的数据自学成才。目前无需标注数据的无监督学习已经从实验室走向应用，而类似的迁移学习算法也能减少一定的数据标注工作量。

Facebook人工智能研究部门负责人Yann LeCun曾经说过，AI的核心在于预测，AI的下一个变革是无监督学习、常识学习。研究人员正努力让 AI 不依赖人类训练，自己去观察世界是如何运转的，并学会预测。

所以理想环境下，可能我们探讨的悖论过几年或者十几年就能完美解决了，这批为AI服务最终会被AI取代的人，也“功成身退”了。

关键字：人工智能机器学习引用地址：人工智能会替代多少人力劳动？

上一篇：还在萌芽期的AI，该如何成长？
下一篇：苹果推出3亿美元“首创”清洁能源基金，释放什么信号？

推荐阅读最新更新时间：2024-05-03 03:06

为工程师和科学家提供更多 AI 功能，MATLAB新版问市

MathWorks今天推出了R2020a 版本，扩展了深度学习方面的 AI 功能。工程师们现在可以在更新的 Deep Network Designer 应用程序中训练神经网络，在全新的 Experiment Manager 应用程序中管理多个深度学习试验，从更多网络选项中选择生成深度学习代码的方法。R2020a 不仅为所有 MATLAB 和 Simulink 用户推出了数百个全新和更新的功能，还推出了专门面向汽车和无线电工程师的新功能。如需更多详情，请观看R2020a 视频。 AI 和深度学习 “MathWorks 为构建 AI 驱动的系统提供了一个综合平台。”MATLAB 营销总监 David Rich 说

[物联网]

为工程师和科学家提供更多 <font color='red'>AI</font> 功能，MATLAB新版问市

人工智能能耗遇挑战，高通有话说

当下，人工智能已经深入到经济和产业的每个细分领域，很多产品也已经具备了人工智能的能力，这是积极的一面。但同时，也给我们带来一些严峻的问题和挑战。随着人工智能的发展，能源消耗的越来越严重，有数据预测到2025年，全球的数据中心将消耗全球所有可用电力的20％。此外，深度神经网络的能耗与其规模大小也成正比。资料显示，到2025年，神经网络的继续发展有望将其规模扩大至100万亿个参数，相当于人类大脑的容量，这样规模的神经网络将消耗大量能源。人类大脑的能效比当前最优秀硬件的能效要高100倍，因此我们应该从大脑得到启发，发展能效更高的人工智能技术。人工智能的能耗问题具备两大挑战在Qualcomm技术副总裁韦灵思看来，人工智能

[嵌入式]

深度学习：人工智能的“神奇魔杖”（一）

　　1.解密深度学习　　 1.1.人工智能的发展一直随同人工神经网络研究的进展而起伏　　整个人工智能发展历史，几乎一直随同人工神经网络研究的进展而起起伏伏。近期引发人工智能新一轮热潮的深度学习，其名称中的“深度”某种意义上就是指人工神经网络的层数，深度学习本质上是基于多层人工神经网络的机器学习算法。　　1.2.什么是人工神经网络　　人类大脑神经的信息活动与目前的计算机相比有三个不同的特性：　　第一，巨量并行和容错特性。人脑约有1000亿个神经元，神经元之间约有上万亿的突触连接，形成了迷宫般的网络连接，大量的神经元信息活动是同时进行的，而非目前计算机按照指令一条条执行。此外人脑的这种巨量并行特性也使得其具有极好的容

[机器人]

“2018数博会人工智能全球大赛”总决赛群雄争霸

“2018中国国际大数据融合创新·人工智能全球大赛”总决赛于5月25日在贵阳顺利落幕。本次大赛由中国国际大数据产业博览会组委会主办，英特尔、中国人工智能产业创新联盟、贵阳块数据城市建设有限公司、贵阳优特云科技有限公司共同承办。此次大赛是英特尔与中国合作伙伴深度合作、共推智能应用落地的又一重大进展，集合了政、产、学、研等多方之力，联动全球创新生态合作伙伴，挖掘优质项目与加速融合创新并举，真正解决实际问题，充分体现了融合创新的优势，推动人工智能与产业深度融合。此次2018数博会人工智能全球大赛历时4个多月，面向全球开放，惠及万余创新开发者，横跨美国硅谷、以色列特拉维夫和北京三大国际赛区以及华东、华中、华南三大国内赛区；共吸引了

[嵌入式]

中国AI产业/技术与美国差距在哪里？

美国的AI产业布局非常完善，基础层、技术层和应用层都有涉及，尤其是在算法、芯片和数据等产业核心领域，积累了强大的技术创新优势，各层级企业数量全面领先中国。相比较而言，中国在基础元器件、基础工艺等方面差距较大。近日，腾讯研究院出台《中美两国人工智能产业发展报告》。从全球范围来看，人工智能领先的国家主要有美国和中国。了解和熟悉产业当中有哪些成熟和短板非常重要。以下是部分内容。美国的AI产业布局非常完善，基础层、技术层和应用层都有涉及，尤其是在算法、芯片和数据等产业核心领域，积累了强大的技术创新优势，各层级企业数量全面领先中国。相比较而言，中国在基础元器件、基础工艺等方面差距较大。中美巨头的产业布局美国巨头呈现出全产业布局的特征

[安防电子]

再发AI新品傅盛这次盯上的是翻译

猎豹移动董事长兼CEO傅盛表示，AI不是高高在上的黑科技，而是通过场景落地，解决用户的在特定场景中的需求的真正有用的技术。小豹AI翻译棒是可以让消费者轻松追寻“诗和远方”的 AI新品。与市场上现有的AI翻译产品相比，有四个方面的特点。一键翻译破除使用门槛小豹AI翻译棒只设计了一个按键，语言选择以及翻译操作都是通过这个按键实现。音量调节则是在按键左侧进行上下滑动即可完成，可谓简单至极。此外，配备了双麦克风阵列以及采用了降噪软件解决方案的小豹AI翻译棒，可以最大程度提高收音准确性，而超线性多磁扬声器则能清晰地将翻译语句传达给沟通双方，确保了语义的清晰表达。一款可以“忘带”充电器的AI产品据介绍，小豹AI翻译棒可以实现180天

[嵌入式]

小米全能扫拖机器人，毛发切割与AI识别双升级

日前，小米宣布旗下米家品牌的新一代全能扫拖机器人 M30 Pro正式上市销售。此次产品升级主打“毛发切割”与AI算法提升两大卖点，分别针对长毛缠绕和环境识别两大用户痛点进行了创新。通过新技术与新功能的加持，M30 Pro在扫拖一体化的基础上，更上了一个台阶. 一站式解决毛发缠绕难题对于拥有宠物的家庭来说，地板与家具表面粘附的宠物毛发是最头疼的问题。它们容易缠在扫拖机器人的滚刷与齿轮上，严重影响清洁效果并缩短设备寿命。M30 Pro基座端集成了高强度不锈钢切割模块，可对缠绕的毛发进行主动“割断”，并用强力气流吸走，一站式解决毛发缠绕难题。具体来说，M30 Pro的切割模块包括高速旋转的滚刀与线性往复运动的抛物线刀。两种刀

[机器人]

世界第一AI芯片升级4万亿晶体管、90万核心

3月14日消息，Cerebras Systems发布了他们的第三代晶圆级AI加速芯片“WSE-3”(Wafer Scale Engine 3)，规格参数更加疯狂，而且在功耗、价格不变的前提下性能翻了一番。 2019年的第一代WSE-1基于台积电16nm工艺，面积46225平方毫米，晶体管1.2万亿个，拥有40万个AI核心、18GB SRAM缓存，支持9PB/s内存带宽、100Pb/s互连带宽，功耗高达15千瓦。 2021年的第二代WSE-2升级台积电7nm工艺，面积不变还是46225平方毫米，晶体管增至2.6万亿个，核心数增至85万个，缓存扩至40GB，内存带宽20PB/s，互连带宽220Pb/s。如今的第三代WSE-3

[半导体设计/制造]

热门资源推荐
热门放大器推荐

小广播

热门活动

换一批

■30套RV1106 Linux开发板（带摄像头），邀您动手挑战边缘AI~

■安世半导体理想二极管与负载开关，保障物联网应用的稳健高效运行

■免费申请 | 上百份MPS MIE模块，免费试用还有礼！

■PI 电源小课堂|无 DC-DC 变换实现多路高精度输出反激电源