“情绪识别机器”来了！200亿美元的“生意经”如何形成？-电子工程世界

分享到: 微博; QQ; 微信; LinkedIn

是否有一个程序可以通过读取潜在的恐怖分子的面部表情和行为来发现他们？

这是美国交通安全管理局（TSA）于2003年提出的一个假设，当时它开始测试一个新的监控程序，称为“通过观察技术筛查乘客”，简称SPOT。

在制定该计划时，他们咨询了旧金山加利福尼亚大学心理学荣誉教授Paul Ekman。几十年前，Ekman开发了一种识别微小面部表情并将其映射到相应情绪的方法。这种方法被用来训练“行为检测人员”，以扫描面部是否有欺骗迹象。

但是当该计划于2007年推出时，却遇到了问题。官员们或多或少地随意运用该技术对人进行审讯，而且少数逮捕行动是与恐怖主义无关。更令人担忧的是，该计划据称被用来证明种族相貌的合理性。

Ekman试图将自己与Spot保持距离，声称他的方法被误用了。但其他人认为，该计划的失败是由于过时的科学理论支撑了Ekman的方法。

近年来，科技公司已经开始使用Ekman的方法来训练从面部表情中检测情绪的算法。一些开发人员声称，自动情绪检测系统不仅比人类更好地通过分析面部表情来发现真实的情绪，而且这些算法将适应我们内心的感受，极大地改善了与设备的交互。

但是，许多研究情绪科学的专家担心这些算法根据错误的科学理论会做出高风险的决定，也将可能再次失败。

识别你的脸：一个200亿美元的行业

情绪检测需要两种技术：

计算机视觉，精确识别面部表情；

机器学习算法，分析和解释这些面部特征的情绪内容。

通常，第二步采用一种称为监督学习的技术，通过这种技术，一个算法被训练来识别它以前见过的东西。基本的想法是，如果你在看到一张新的快乐脸谱图时，用标签“快乐”来显示成千上万张快乐脸谱图的算法，它会再次将其识别为“快乐”。

研究生Rana el Kaliouby是第一批开始尝试这种方法的人之一。2001年，在从埃及搬到剑桥大学攻读计算机科学博士学位后，她发现自己花在计算机上的时间比其他人更多。她认为，如果她能教电脑识别情绪并对她的情绪状态做出反应，那么她远离家人和朋友的时间就不会那么孤独。

Kaliouby致力于这项研究，并最终开发出一种辅助阿斯伯格综合症儿童阅读和回应面部表情的设备。她称之为“情绪助听器”。

2006年，Kaliouby加入麻省理工学院的情绪计算实验室，与实验室主任Rosalind Picard一起继续改进和完善该技术。然后，在2009年，他们共同创办了一家名为Affectiva的创业公司，这是第一家营销“人工情绪智能”的公司。

起初，Affectiva将他们的情绪检测技术作为市场研究产品出售，为广告和产品提供实时的情绪反应。他们找到了客户，如Mars、凯洛格和哥伦比亚广播公司等客户。Picard于2013年离开了Affectiva，并加入了一家不同的生物识别创业公司，业务继续增长，围绕它的行业也是如此。

亚马逊、微软和IBM一直将“情绪分析”作为他们面部识别产品的主要功能进行宣传，并且许多小公司，如Kairos和Eyeris已经出现，为Affectiva提供类似的服务。

除了市场研究，情绪检测技术现在被用于监测和检测驾驶员损伤，测试视频游戏的用户体验以及帮助医疗专业人员评估患者的健康状况。

Kaliouby看到情绪检测从一个研究项目发展成为一个价值200亿美元的行业，她对这种增长的持续性充满信心。她预测，在不久的将来，当这项技术无处不在并融入我们所有的设备中时，能够“利用我们的内心、潜意识做出瞬间的反应”。

来自87个国家的750万个面孔数据

与大多数机器学习应用程序一样，情绪检测的进展取决于访问更高质量的数据。

根据Affectiva的网站，他们拥有世界上最大的情绪数据存储库，来自87个国家的面孔，数量超过750万，其中大部分是从人们收看电视或开车每天上下班的选择性录像中收集的。

这些视频由位于开罗的Affectiva办公室的35名贴标人进行分类，他们观看镜头并将面部表情转化为相应的情绪。例如，如果他们看到低垂的眉毛、紧绷的嘴唇和凸出的眼睛，他们会附上标签“愤怒”。这个被标记的人类情绪数据集然后将用于训练Affectiva的算法，该算法学习如何将愤怒的脸、笑脸与幸福等联系在一起。

这种标记方法，被情绪检测行业的许多人认为是测量情绪的黄金标准，它由Paul Ekman和Wallace V Friesen在20世纪80年代开发的一种叫“情绪面部动作编码系统（Emfacs）”衍生而来。

这个系统的科学根源可以追溯到20世纪60年代，当时Ekman和两位同事假设有六种普遍的情绪——愤怒、厌恶、恐惧、快乐、悲伤和惊讶——这些情绪与我们有着紧密的联系，并且可以通过分析面部肌肉的运动在所有文化中被发现。

为了验证这一假设，他们向全世界不同的人群展示了面部照片，要求他们辨别他们所看到的情绪。他们发现，尽管存在巨大的文化差异，人类还是会将相同的面部表情与相同的情绪相匹配。一张眉毛低垂、嘴唇紧闭、眼睛凸出的脸对美国的银行家和巴布亚新几内亚的半游牧猎人来说都意味着“愤怒”。

在接下来的二十年里，Ekman利用他的发现开发了一种识别面部特征并将其映射到情绪的方法。潜在的前提是，如果一个人的普遍情绪被触发，那么一个相关的面部动作就会自动出现在脸上。即使那个人试图掩饰他们的情绪，真实的本能的感觉也会“泄露”。

整个20世纪后半叶，这一理论被称为“经典情绪理论”，开始主导着情绪科学。Ekman将他的情绪检测方法作为专利，并开始将其作为培训项目出售给CIA、FBI、海关和边境保护局以及TSA。真实情绪在脸上可读的观念甚至渗透到大众文化中，形成了“Lie to me”节目的基础。

然而，许多研究情绪本质的科学家和心理学家质疑经典理论和Ekman的相关情绪检测方法。

情绪检测理论备受质疑

近年来，心理学教授Barret提出了一个特别强烈而持久的批评。

Barret作为研究生首先遇到了古典理论。她需要一种客观地测量情绪的方法，并且遇到了Ekman的方法。在回顾文献时，她开始担心潜在的研究方法有缺陷——特别是，她认为通过为人们提供与照片匹配的预选情绪标签，Ekman无意中“准备”了他们给出的某些答案。

她和一组同事通过重演Ekman的测试来检验这个假设，而不提供标签，让受试者可以自由地描述他们所看到的图像中的情绪。具体的面部表情和具体的情绪之间的关系直线下降。

从那时起，Barret发展了她自己的情绪理论，这在她的书《情绪是如何产生的：大脑的秘密生活》中有所阐述。她认为，大脑中没有由外部刺激触发的普遍情绪。相反，每一次情绪体验都是由更基本的部分构成的。

她写道：

“它们是你身体物理特性的结合，是一个灵活的大脑，它将自己连接到它所处的任何环境中，以及你的文化和成长环境中。”

“情绪是真实的，但在客观意义上不是分子或神经元是真实的。它们的真实性与金钱的真实性是相同的，也就是说，这不是幻觉，而是人类一致同意的产物。”

Barret解释说，把面部表情直接映射到所有文化和环境中的情绪是没有意义的。当一个人生气时可能会皱眉，而另一个人可能会在策划敌人倒台时礼貌地微笑。因此，评估情绪最好理解为一种动态实践，包括自动认知过程、人与人的互动、具体经验和文化能力。她说：“这听起来像是很多工作，但确实如此。”

“情绪是复杂的。”

Kaliouby也同意情绪是复杂的，这就是为什么她和她在Affectiva的团队一直在努力提高他们数据的丰富性和复杂性的原因。除了使用视频而不是静止图像来训练算法外，他们还尝试着捕捉更多的上下文数据，比如声音、步态以及人类感知之外的面部细微变化。她相信更好的数据将意味着更准确的结果。一些研究甚至声称机器在情绪检测方面已经优于人类。

但据Barret说，这不仅与数据有关，而且与数据如何被标记有关。情绪检测公司和其他情绪检测公司用来训练算法的标记过程，只能识别Barret所说的“情绪刻板印象”，就像表情符号一样，这些符号符合我们文化中熟悉的情绪主题。

纽约大学人工智能研究所的联合主任Whittaker认为，基于Ekman过时的科学构建机器学习应用程序不仅仅是一种糟糕的实践，它还转化为真正的社会危害。

“你已经看到招聘公司使用这些技术来衡量应聘者是否是一个好员工。”

她说：“在学校环境中，你也可以看到一些实验性的技术被提出，以观察学生在课堂上是积极的、无聊的还是愤怒的。”“这些信息可以用来阻止人们获得工作或改变他们在学校的待遇和评估方式，如果分析不十分准确，那将是一种具体的物质伤害。”

Kaliouby说，她意识到情绪检测可能被滥用的方式，并将认真对待她的工作道德。“与公众就这一切的运作方式——在哪里应用以及在哪里不应用进行对话至关重要。”

Kaliouby过去戴过头巾，她也敏锐地意识到建立不同数据集的重要性。她说：“我们确保当我们训练这些算法时，训练数据是多样的。”“我们需要代表白种人、亚洲人、肤色较深的人，甚至是戴头巾的人。”

这就是为什么Affectiva从87个国家收集数据的原因。通过这个过程，他们注意到在不同的国家，情绪表达似乎呈现出不同的强度和细微差别。例如，巴西人用宽而长的微笑来表达幸福，而在日本，微笑并不表示幸福，而是表示礼貌。

Affectiva通过在系统中添加另一层分析来解释这种文化差异。汇编了Kaliouby所说的“基于种族的基准”，或编纂了关于不同种族文化中如何表达情绪的假设。

但正是这种基于种族等标记的算法判断，让Whittaker最担心情绪检测技术暗示了自动化“相面”的未来。事实上，已经有公司对某人成为恐怖分子或恋童癖者的可能性进行了预测，同时也有研究人员声称，他们拥有的算法能够单独从脸上检测到性行为。

最近几项研究还表明，面部识别技术会产生更可能伤害少数族裔群体的偏见。去年12月发表的一篇文章显示，与白人相比，情绪检测技术给黑人脸上的负面情绪更多。

Kaliouby表示，情绪系统确实有一个“种族分类器”，但是他们现在没有使用它。相反，他们使用地理位置作为确定某人来自哪里的基准。这意味着他们将巴西的微笑与巴西的微笑进行比较，而日本的微笑与日本的微笑进行比较。

“如果巴西有一个日本人呢？难道系统能识别出礼貌微笑和幸福微笑的细微差别吗？“

Kaliouby承认，在这个阶段，这项技术并不是百分之百的万无一失。

关键字：面部算法引用地址：“情绪识别机器”来了！200亿美元的“生意经”如何形成？

上一篇：告别繁琐密码：无密码认证协议解决你的“健忘”
下一篇：新型漏洞thunderclap 允许黑客用数据线攻击PC

推荐阅读最新更新时间：2024-03-16 11:32

视频跟踪算法在Davinci SOC上的实现与优化

　　引言　　目标跟踪作为计算机视觉的一个极具挑战性的研究任务，已被广泛的应用在人机交互、智能监控、医学图像处理等领域中。目标跟踪的本质是在图像序列中识别出目标的同时对其进行精确定位。为了克服噪声、遮挡、背景的改变等对目标识别带来的困难，出现了很多的跟踪算法。　　因为目标跟踪算法需要处理的数据量大、运算复杂，需要性能强大的处理器才能实时处理。我们选用TI推出的最新产品TMS320DM6446实现算法。TMS320DM6446是一款高度集成的片上系统，集成了可以运行频率高达594MHz的C64x+ DSP核和297MHz的ARM926处理器核。另外它还集成了数字视频所需的许多外部组件，如视频加速器，网络外设及高速外部存储接口

[工业控制]

视频跟踪<font color='red'>算法</font>在Davinci SOC上的实现与优化

微弱GPS信号差分快速捕获算法

当前GPS作为全球性卫星导航系统在各领域的应用受到普遍关注，尤其是在弱信号环境下的接收定位技术研究，受到紧急救援和军事作战需求的刺激已经成为研究热点，其中的高灵敏度接收技术，由于不受环境和条件的限制尤为受到重视。在高灵敏度GPS接收机中，由于信号的捕获处在基带处理的最前端，因此高效的微弱GPS信号捕获算法是提高高灵敏度GPS接收机性能的关键。通常的弱GPS信号比室外信号强度低约20～30 dB，或在载噪比小于28 dB-Hz则被视为弱信号，普通GPS接收机在这种情况下无法工作，高灵敏度GPS接收机主要通过信号处理算法来获得高的信号处理增益。针对高灵敏度接收机在弱信号的捕获过程中耗费大量时间的问题，文章分析了主要信号累积技

[嵌入式]

先别急着吹捧，自动驾驶最大挑战居然是“横行”的小车？

配备“千里眼”和“最强大脑”，自动驾驶汽车毫无疑问已经初具无障碍行驶的能力了。据了解，目前，主流自动驾驶汽车对车辆、行人或是动物的识别准确率日渐提升，这得益于它们装备的不同的传感设备和算法系统。但多数人没想到的是，道路上那些最轻、最安静、最灵活的小车，可能成为自动驾驶在未来的最大挑战。背景：“小”麻烦 “自行车可能成为自动驾驶系统面临的，最艰难的检测难题”，来自加州大学伯克利分校的研究工程师Steven Shladover如是说。加州大学的视觉计算专家Nuno Vasconcelos也表达了类似的观点，他认为自行车正因相对小巧、灵活并且结构特殊，可能会使自动驾驶汽车面临一种复杂的计算难题。“汽车就像一

[嵌入式]

一种用于FPGA的改进算法弱化了方波重影

　　0 引言　　DDS(Direct Digital Frequency Synthesis)频率合成器能够很方便地输出任意波形 ,方波作为最常用波形之一，具有其特殊性。但输出的方波存在明显的重影现象直接影响了方波的质量。　　1 方波重影出现的原因　　假设系统时钟频率为200 MHz,以输出3 MHz方波为例，从模拟示波器观察到的结果如图1所示。　　　　图1中存在明显的双边沿现象，且两条上升沿的间距为5 ns,刚好等于系统时钟的周期。这种现象可称为方波重影。　　根据DDS的工作原理可知，相位序列具有周期性 . 　　在相位序列的一个周期内，相位累加器会溢出若干次，并且每次溢出后的残留量都不一样。当残留量足够大时，再

[电源管理]

一种用于FPGA的改进<font color='red'>算法</font>弱化了方波重影

单片机系统中常用的滤波算法

//在单片机系统中常用的滤波算法 //（1）程序判断法 #define A char data; // 上一次的数据 char fi LTE r_1() { char datanew; // 新数据变量 datanew = get_data(); // 获得新数据 if ( (datanew – data A ) || ( data – datanew A ) // 滤波算法 return data; return datanew; } //（2）中值滤波法 #define N 11 char filter_2() { c

[单片机]

尽管苹果招News编辑但决定你读什么的还是算法

　　当你已经习惯决定你阅读的不再是媒体，而是手机应用和社交网络时，苹果却打算为即将在 iOS9 上推出的 News 应用招一个编辑。　　继 Facebook 推出 Instant Articles，运营商 Verizon 收购 AOL 之后，在不久前的 WWDC 上，苹果公司宣布在 iOS9 的更新会搭载一款叫做 News 的新闻阅读应用，加入了科技界这场逐渐白热化的内容战争。新闻出版商可以向苹果提供 RSS 源，也可以使用苹果提供的工具，打造出包括图片、视频等在内的多媒体的阅读体验，从呈现上来看与 Facebook Instant Articles 十分类似。　　不过与 Facebook 不同的是，苹果看

[手机便携]

Honda开发fMRI磁振造影技术，监测驾驶员状态来调整智能驾驶算法

现阶段的智能驾驶技术，即使是用到激光雷达，其判断的逻辑主要是依靠车载传感器来获知路面情况——当存在危险风险的时候，系统会主动介入部分或全部接管驾驶权但这些系统都没有把人的因素考虑进去，系统假设驾驶员都是千篇一律的。但事实上，驾驶员的精神状态在不在线，有时候驾驶安全起决定性的。甚至智能驾驶系统没有考虑到人的状态，只是粗暴地接管车辆控制权，有时候可能会起来适得其反的作用。本田最近向全球首次公开了，目前研发中的“未来安全技术”。这套“未来安全技术”，它与现在的智能驾驶系统有两方面的不同：一方面除了传感器+算法外，还能根据驾驶员的精神状态来决定辅助驾驶的算法。第二个技术就是加入了V2X车联网。

[汽车电子]

Honda开发fMRI磁振造影技术，监测驾驶员状态来调整智能驾驶<font color='red'>算法</font>

创新发明：智能笔向盲人学生“口述”课文

创新与发明的结合，已经使盲人学生能够在平等的基础上参加大学工程课程的学习。一种最新发明的智能笔让学生们能够利用实时音频来评注他们的注释，然而，点击那些注释来听演讲。Vanderbilt大学以及Smith-Kettlewell眼睛研究所(旧金山)的使命就是，通过把智能笔与Sewell Raised Line Drawing Kit结合起来，配合盲人使用这种智能笔，这个项目是在美国国家科学基金资助下进行的。这个为期三年的项目包括三个阶段，第一阶段将探索利用现有的技术来增大基于音频的触觉信息；第二阶段利用具有画图板的智能笔，以最有效的方式进行量化测试；第三阶段，研究人员将观察盲人学生，以消除算法中的错误。这种智能笔采用运行Jav

[焦点新闻]

热门资源推荐
热门放大器推荐

小广播

添点儿料...

无论热点新闻、行业分析、技术干货……

发布文章

热门活动

换一批

■30套RV1106 Linux开发板（带摄像头），邀您动手挑战边缘AI~

■安世半导体理想二极管与负载开关，保障物联网应用的稳健高效运行

■免费申请 | 上百份MPS MIE模块，免费试用还有礼！

■PI 电源小课堂|无 DC-DC 变换实现多路高精度输出反激电源