性别偏见只存在人类之中吗?机器学习中也存在

发布者:Coboro最新更新时间:2017-08-28 来源: 21IC中国电子网关键字:机器学习  数据集  性别偏见 手机看文章 扫描二维码
随时随地手机看文章

大约五年前,在机器学习实现了突破之后,科技公司开始严重依赖从成堆数据中学习的软件。最近,研究人员开始向世人揭露机器学习的冷酷无情。去年夏天,来自波士顿大学和微软的研究人员表示,根据谷歌新闻进行学习的软件再现了人类的性别偏见。下面就随手机便携小编一起来了解一下相关内容吧。

去年秋天,弗吉尼亚大学计算机科学专业的教授文森特·欧多尼兹注意到,他所设计的图像识别软件出现了一些猜想模式。当软件识别一张厨房照片时,往往会将其和女性联系起来而非男性。这让欧多尼兹怀疑,自己和其他研究人员是否无意识地在他们的软件中掺进了偏见。因此,他与同事合作,测试了两大组用于训练图像识别软件的图片集。结果令人深思。在烹饪和体育活动方面,微软和 Facebook 所收集的照片反映出了明显的偏见。例如,购物和洗涤的图像与女性相关,而训练和射击的图像则与男性相关。

采用数据集进行训练的机器学习软件非但反映了这些偏见,更是放大了偏见。如果用来学习的图片集都将妇女与烹饪关联在一起,那么软件通过学习则会强化这种联系。人工智能研究所的研究员马克·雅斯卡表示,这种现象也会放大数据中的其他偏见,例如种族偏见。雅斯卡曾经在华盛顿大学与欧多尼兹和其他人共事过,他表示,“这不但会加重现有的社会偏见,甚至会让偏见恶化下去。”

大量复杂的机器学习程序不断出现,这种偏见也日益凸显起来。在研究人员的测试中,身处厨房的人更可能被贴上“女性”标签,而不能反映出实际的学习结果。在研究人员的一篇论文中,一位身处炉子旁的男性则被判定为“女性”。如果这些判定方法进入到科技公司中,很可能会影响到照片存储服务和家庭助手,比如亚马逊的摄像头或是使用社交媒体照片来辨别消费者偏好的工具。2015年,谷歌偶然展示了不当图像软件的危险性,当时,它的照片服务竟将黑人判定为大猩猩。

人工智能系统正承担起越加复杂的任务,风险也越发地不可估量。雅斯卡描述了这样一个场景,当机器人无法确定某人在厨房里做什么时,它会递给男性一杯啤酒,而帮助女性洗盘子。他表示:“如果一个系统的行为能通过性别明确划分,这个系统就无法有效地发挥其效用。”

大约五年前,在机器学习实现了突破之后,科技公司开始严重依赖从成堆数据中学习的软件。最近,研究人员开始向世人揭露机器学习的冷酷无情。去年夏天,来自波士顿大学和微软的研究人员表示,根据谷歌新闻进行学习的软件再现了人类的性别偏见。当对软件进行提问,“男性是程序员那么女性是?”它的回答是“家庭主妇”。新的研究表明,性别偏见根植于两组图片集中,而这原本是用来帮助软件更好地理解图像内容。研究人员观察了华盛顿大学的 ImSitu 和微软的 COCO,每个图片集都包含了 10 万多个来自网络的复杂场景,并配有说明。

两个数据集所包含的男性图像都要多于女性的,而不同性别对应的事物、活动则反映了研究人员所说的显著的性别偏见。在 COCO 中,勺子和叉子等厨房物品都与女性高度相关,而类似滑雪板和网球拍等户外运动设备则更多地与男性相关。当图像识别软件通过这些数据集进行训练时,这种偏差就会放大。COCO 数据集训练出来的系统可能会把鼠标、键盘和男性更为紧密地联系在一起。研究人员设计了一种方法来抵消这种偏见放大现象,即有效使软件反映其学习数据。但它首先要求研究人员找出偏见所在,并明确指出需要修改的内容。修正后的软件仍然会反映原始数据中的性别偏见。

微软研究部主任埃里克·霍维茨说,他希望其他人采用这种方式,因为他们是通过机器学习来设计软件的。公司内部有一个道德委员会,该委员会致力于保持人工智能在公司产品线中的协调性。霍维茨表示: “我和微软作为一个整体,非常希望能够找到同时解决在数据集和系统中产生的偏见和差距。”借用 COCO 和其他数据集的研究人员和工程师们,应该从自己的工作和其他方面寻找偏见产生的迹象。不要从面向儿童的计算机、书籍和其他教育材料中寻找,因为这部分内容往往都被调整过,所呈现的是一个男女均等的理想化世界。霍维茨认为,在某些情况下,可以用类似的方法来训练软件。

其他在机器学习中产生的偏见并不显著。普林斯顿大学的研究员艾琳·卡利斯坎表示,如果男性建筑工人更多,图像识别程序也应该学习到一点。之后,可以采取相应方法来衡量和调整偏见。她说:“为了避免偏见,我们正冒着失去基本信息的风险,数据集需要反映出世界上真实的统计数据。”在这个领域有一项共识,那就是使用机器学习来解决问题比许多人想象的要复杂得多。犹他州大学教授苏雷什·文卡塔萨布拉曼尼亚说:“有人认为算法可以解决一切问题,而纠正偏见同时也可以纠正这种错觉。”

以上是关于手机便携中-性别偏见只存在人类之中吗?机器学习中也存在的相关介绍,如果想要了解更多相关信息,请多多关注eeworld,eeworld电子工程将给大家提供更全、更详细、更新的资讯信息。

关键字:机器学习  数据集  性别偏见 引用地址:性别偏见只存在人类之中吗?机器学习中也存在

上一篇:一周投融资大总结:智能硬件行业成为“焦点行业”
下一篇:苹果下一个大目标,AR智能眼镜

推荐阅读最新更新时间:2024-05-03 17:07

10个关于人工智能和机器学习的TED演讲
人工智能将如何重塑人们的职业生涯?会让人们更健康?如何提高分辨真假视频的能力?最近的TED演讲探讨了一些有趣的人工智能问题。 人工智能一直是一个既有魅力又有幻想的话题,通常出现在计算机科学和好莱坞电影的领域。随着人工智能和机器学习等相关的子学科在人们的日常生活中成为现实,这种吸引力也在增长。 但是现在,人们越来越关注人工智能带来的实际影响,从企业IT应用到对工作就业、全球经济、医疗保健、政府运营等更广泛的影响。 最近的一系列TED演讲表明了人工智能从投机到实际应用的转变:人类和无所不在的人工智能将如何共存?人工智能在现在和以后会带来什么好处?人工智能将如何改造行业? 以下汇总了10个TED演讲,将以发人深省的方式探讨这些和类似的问
[机器人]
回斯坦福之后研究成果曝光 李飞飞团队用机器学习教机械臂做动作
自从李飞飞离开谷歌回到斯坦福之后,她的研究方向及成果就备受业界关注。近日,其领导的团队在瑞士苏黎世召开的机器人学习大会上展示了他们的最新成果——机械臂。 和通常所见的机械臂只能按照既定程序运行不同,李飞飞团队研发的机械臂拥有机器学习功能,可以学习人类向其展示的各种动作,如拾取物体等。除此之外,机器人还可以同时学习多种动作。 该团队成员介绍称,基于RoboTurk和SURREAL两个框架,他们让机械臂拥有了快速学习基础技能的能力。其中,RoboTurk用于引导机械臂完成动作,可通过智能手机或浏览器实现,如挥动手机指导机械臂于周围环境进行交互等;SURREAL则可以在同时运行多种动作时加速机械臂的学习进程,让其能够“一心多用”,如像
[机器人]
出版商使用机器学习生成研究书籍,内容读起来并不轻松
据科技媒体The verge报道,学术出版商Springer Nature公布了它声称的第一本使用机器学习生成的研究书籍。 这本名为《Lithium-Ion Batteries: A Machine-Generated Summary of Current Research》的书读起来并不轻松。相反,正如它的名字所暗示的,它是对相关主题发表的同行评议论文的总结。它包括引用作品及其超链接和自动生成的参考内容。如果你晚上难以入睡,也可以免费下载和阅读。 虽然这本书的内容令人昏昏欲睡,但它的存在却令人兴奋。Springer Nature的Henning Schoenenberger在序言中写道,无需用人力去完成这样乏味的
[嵌入式]
出版商使用<font color='red'>机器学习</font>生成研究书籍,内容读起来并不轻松
人工智能真的很火吗?投资界告诉你实情
风险投资对机器学习和人工智能的热情已经开始趋于平静,至少在美国是这样。但这可能并不是一件坏事。   尽管人工智能和机器学习成为学术研究的热点领域已经有数十年了,但是尚未成为风险投资的主流。由于计算硬件、商品化和其他开源软件框架的发展,以及数据爆炸式增长,近十年投资机器学习和人工智能成为企业的首要事项,而投资者也开始纷纷效仿。   下图显示了该行业投资交易和投资规模的发展速度 投资数据呈明显的S曲线,这与Everett Rogers在20世纪60年代 “创新的扩散”(Diffusion of Innovation)中首次描述的技术采用曲线非常相似。     事实上,AI和ML作为一个行业已经相对成熟,2017年是十年来该行业种子
[嵌入式]
智能电视将引领风潮,2020年渗透率达9成
告别遥控器,动动嘴就能和荧幕轻松“对话”,甚至不必发出“指令”,电视就“心有灵犀”点开想看的节目……随着人工智能深度应用,家电领域正刮起“智慧”风潮。记者日前从工信部获悉,工信部将重点支持人工智能在家电等领域应用。到2020年,智能电视市场渗透率将达到90%以上。   在人工智能诸多技术中,语音交互技术率先进入应用阶段,展现出强大的市场潜力。建立在该技术基础上的智能电视被视为下一个“风口”,诸多家电企业纷纷布局于此。有预测显示,到2020年,全球人工智能系统将为家电企业带来超过470亿美元的收入。   “如果说几十年前,遥控器改变了人与电视的交互方式,那么现在,人工智能将让电视更懂用户。它不仅能听懂你的话,更能在说话之前就知道你想
[嵌入式]
Waymo开放无人驾驶汽车传感器收集的数据
Waymo公开了其最新的自动驾驶汽车数据集,邀请无人驾驶汽车研究人员根据其无人驾驶车队收集的大量数据参加一系列挑战赛。 从Google分离出来的Waymo为其多传感器数据集增加了800个新的细分。 数据集本身是一堆高分辨率传感器数据,Waymo的车辆在不同位置的道路上漫游时已收集了这些数据。它包括各种不同的地理位置和条件,以及来自大量传感器的信息。从汽车前侧和侧面安装的摄像头到中短距离激光雷达,以及两者之间的同步数据,一切都应有尽有。 Waymo还标记了其中一些数据,例如车辆,行人,骑自行车的人和道路标志的数据。 该数据集不能反映Waymo传感器系统的全部功能,仅是Waymo自动驾驶系统所训练的数据一小部分,但是母公司 A
[汽车电子]
Waymo开放无人驾驶汽车传感器收集的<font color='red'>数据</font><font color='red'>集</font>
深度学习对机器学习有什么样的影响?AI大佬给你答案
深度学习 对机器学习有什么样的影响 PartyLikeLizLemon:   现在机器学习有很多研究看起来似乎转向了深度学习。请问您认为这现象会对机器学习研究的多样性有什么负面影响吗?是否应该彻底放弃其他范式的研究,如概率图模型、支持向量机等来支持深度学习研究呢?要知道这些模型在当下的表现可能不是很好,但也不排除在未来会出现突破,就像深度学习在上世纪90年代的那样。   Yann LeCun:   当AI技术继续发展时,我感觉,深度学习只是其中的一部分。你可以在复杂的(可能是动态的)图中集成参数化模块,并根据数据进行优化参数,这种想法并没有过时。从这个意义上,只要我们还没有找到不需使用梯度优化参数的高效方法,深度学习就不会过时。也
[嵌入式]
莱迪思半导体为网络边缘智能应用提供机器学习方案
iCE40 UltraPlus™参考设计支持LoRa通信、ECC安全算法、信号聚合、机器学习和图形加速 iCE40 UltraPlus加速了智能手机、可穿戴设备、无人机、360度摄像头、人机界面(HMI)、工业自动化和物联网安全领域的创新 全新的参考设计能够为客户提供更多资源,助力开发具备差异化特性的创新产品,同时满足快速上市的要求 该参考设计充分发挥了iCE40 UltraPlus高效并行处理架构的能力,适用于传感器聚合以及重复的数据计算 莱迪思半导体公司(NASDAQ: LSCC),客制化智能互连解决方案市场的供应商,今日宣布推出基于iCE40 UltraPlus FPGA器件的全新参考设计,
[嵌入式]
莱迪思半导体为网络边缘智能应用提供<font color='red'>机器学习</font>方案
小广播
热门活动
换一批
更多
最新手机便携文章
更多每日新闻
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved