对于机器人来说,像人一样从语句中获取信息是很难的。因而在训练机器人之前,通常会有筛选培训的过程,方便机器人在被喂入数据后,比较容易在大量资料中找到的信息。
这种培训方式,对于技术比较合适,只需要时间累积,但对于人们常用的语言来说,却是个麻烦。
这跟人们的表达方式有关系。宾夕法尼亚大学计算机和信息科学的助理教授 Chris Callison-Burch 称:“自然语言的诸多难点之一在于,你可以用很多不同的方式来表达同样的信息,而抓住所有的这些变化,就是建立一个复杂模型过程中面临的挑战之一。”
说的直白点,就是人类所用的语言比较复杂,不能直接用作机器人的。
但 Regina Barzilay 等 3 位麻省理工学院研究人员最近想到了一个新角度,他们想让机器人自己从网上寻找信息,像人一样找更多资料做信息的补充。对于研究来说,这样做的好处最直接的是可以减少前期的人力成本。
简单来说,他们使用了人工智能的一种技术——强化学习,做了两个应用场景的。其一是在美国枪击案的新闻中找资料,包括枪击地点、伤亡人数;另外一个则是搜集食品造假事件的相似性,包括食品种类、食品造假的类型和地点。
每个测试都只使用 300 份新闻。但在测试中,麻省理工学院培训的机器人每分析 1 篇文章,它都会从网上找 9、10 篇新闻作为相关资料进行分析,以补充原本资料的不足。其中的困难之处在于,让机器人判断两篇新闻描述了同一件事,并且从多份资料中提取数据。
论文中举了一个谋杀案的案例,下面是 3 个新闻中摘出来的片段:
警官在周一公布称,一对夫妇和四个小孩死在他们位于南达科他州的家里,他们的家发生了火灾,他们显然是死于入室谋杀......一份官方声明称,Scott Wesrhuis 的死因是“疑似自杀性质的猎枪枪击”。
官方称,一个南达科他州家庭的 6 名成员被发现死在了火灾烧毁的家中,他们死于枪击,其中有一例死亡怀疑是自杀。
AG Jackle 称,所有的证据都支持他基于 9 月份的初步发现做的推理:Scott Westerhuis 用一把猎枪枪杀了他的妻子和孩子,点燃了他的房子,然后用猎枪自杀。
最终,他们培训的机器人需要在网上找到类似下面 2 篇那样的新闻,并且挖出这两个信息:开抢的人是 Scott Westerhuis,以及死亡人数是 6 人。
在两项测试中,麻省理工学院开发的系统能根据那些与目标信息相关的词汇进行搜索,例如枪击案的凶手通常会跟“警方(police)”、“(idenfied)“ 、”逮捕(arrested)“ 等词汇有关系,从而判断具体的人。
麻省理工学院的研究员称,他们用这种新技术做数据整理,准确率要比以往的筛选方式高出 10%。不过,对于普通人来说,这种新技术看起来有趣的一点是,它让机器人的工作方式更接近于人类的思考方式:获取一个信息后,用更多的信息补充它。
上一篇:国内工业机器人发展现状:外企加快内地投资 中企“并购风”趋向白热化
下一篇:亚马逊智能物流放大招 打响跨境电商争夺战
- wdnmd
- EB5510,使用 SPT5510、16 位、高速数模转换器的评估板
- LTM8052IY ±5A、2.5V、2 象限稳压器的典型应用
- 具有 400mA 突发钳位、fSW = 1MHz 同步降压型稳压器的 LTC3621IMS8E-2 2.5V Vout 的典型应用
- 使用 Analog Devices 的 LTC1147 的参考设计
- 使用 Analog Devices 的 LT3420EDD 的参考设计
- 使用 Cypress Semiconductor 的 MB3841 的参考设计
- EVAL-AD7124-4SDZ,用于 AD7124-4、4 通道、低噪声、低功耗、24 位 Sigma-Delta ADC 的评估板,带仪表放大器和基准
- LT1171IT、5V/2.5A 升压转换器的典型应用
- 使用 ROHM Semiconductor 的 BD46242 的参考设计