“刷脸”窥见遗传病深度学习算法有助疾病诊断-电子工程世界

分享到: 微博; QQ; 微信; LinkedIn

　图片来源：FDNA

　　去年8月的一天，美国特拉华州威尔明顿市内穆尔/阿尔法雷德爱杜邦儿童医院医学遗传学家Karen Gripp接待了一位年仅4岁的患者。

　　这个小女孩虽比同龄孩子稍矮，且已经失去了大部分乳牙和几颗已经长出来的成年牙齿，但并没有其他明显的罕见病指征。

　　Gripp曾阅读过描述Wiedemann-Steiner综合征患儿牙齿过早生长的病例报告。该疾病是由KMT2A基因突变引起的一种极为罕见的疾病。但Gripp并不确定。

　　于是，Gripp将这个女孩的照片上传到一个智能手机应用中，Wiedemann-Steiner综合征出现在该软件的提示中。

　　Gripp后来通过有针对性的DNA测试确定了女孩的病情。Gripp表示，人工智能方法帮助她缩小了疾病的潜在范围，并节省了昂贵的多基因面板测试的成本。

　　近日，研究人员在《自然—医学》上撰文描述了这种诊断辅助手段（一个叫做Face2Gene智能手机应用）的技术特点。

　　它依靠机器学习算法和类脑神经网络对先天性和神经发育障碍患者照片中的面部特征进行分类。利用从图片中推断出的“经验”，对可能的诊断进行定位，并提供可能的选项列表。

　　该研究负责人、马萨诸塞州波士顿数字健康公司FDNA首席技术官Yaron Gurovich告诉《中国科学报》，以标准化方式描述显型能力的增强，为未来的研究和应用，以及识别新的遗传综合征打开了大门。“它展示了如何将先进的算法，比如深度学习，应用到一个具有挑战性的领域。”

　　看“脸”识病

　　目前，人工智能蓬勃发展，甚至能“达到或超越人类表现”。在医疗健康领域，人工智能开始成为医生的“小助手”。

　　例如，各种遗传综合征会表现出独特的面部特征，然而，综合征数量巨大，要正确识别并非易事。利用人工智能或能帮助诊断遗传综合征。

　　但是早期此类人工智能研究采用的训练数据集规模不大，仅能识别少量综合征。而Face2Gene正是人工智能辅助诊断的再进一步。

　　FDNA研究人员首先训练了人工智能系统，以区分狄兰吉氏症候群和天使人综合征（这是两种面部特征截然不同的病症）与其他类似病症。他们还教会该模型对努南综合征的不同基因形式进行分类。

　　他们在算法中输入了涵盖216种不同综合征的17000多张确诊病例的图像。所有患者被确诊的遗传综合征总计达几百种。

　　研究人员利用两个独立的测试数据集测试人工智能的表现，每一个数据集都包含数百张之前经过临床专家分析的患者面部图像。对于每一张测试图像，Face2Gene按照一定顺序列出各种潜在的综合征。

　　在两组测试中，在约90%的情况下，Face2Gene提出的前10条建议中都包括了正确的综合征。当看到面孔新图像时，该应用程序的最佳诊断率约为65%。

　　“这是人们期待已久的医学遗传学领域突破。”Gripp说，“通过这项研究，我们已经证明，在临床工作中添加自动面部分析框架，如DeepGestalt，可以帮助实现更早地诊断和治疗，并改善生活质量。”

　　此外，澳大利亚和巴西联合研究团队于近日基于人工智能技术开发出一种图像处理算法，通过分析眼底相机拍摄的视网膜图像，可以瞬时自动识别出糖尿病视网膜病变的关键特征，即眼球内由于视网膜毛细血管破裂而渗漏出来的液体，准确率达98%。

　　“打败”专家

　　FDNA希望不断改善Face2Gene，以帮助其他公司在DNA分析过程中筛选、优先排序和解释未知基因变异等。但是为了训练它，FDNA需要大量数据。

　　Face2Gene目前对医疗专业人士是免费的。而且，许多医生已经开始将该系统作为诊断罕见遗传病的第二选择。它还可以为医生不知道如何判断病人症状的情况提供一个起点。“这就像谷歌搜索。”Gripp说。

　　随着越来越多的医疗保健专业人员将患者照片上传到应用程序，该应用的准确性略有提高。现在它的数据库中有大约150000张图像。

　　去年8月，Face2Gene和临床医生在出生缺陷研讨会上进行了一次非官方的“较量”。结果显示，该应用的表现优于人类。

　　南卡罗莱纳州格林伍德遗传中心遗传学家Charles Schwartz分发了10名儿童的面部照片，这些照片具有“相当可识别的”综合征特征，并要求与会者提出正确的诊断。

　　在49名参与研究的临床遗传学家中，只有一半人对两个病例选择正确。Face2Gene在其中7张图片上做出了正确的选择。

　　“我们惨遭失败，Face2Gene完胜。”马里兰州贝塞斯达美国国家人类基因组研究所的临床遗传学家Paul Kruszka说，“我认为每个儿科医生和遗传学家很快都会有这样的应用程序，并将像用听诊器一样使用它。”

　　“目前的挑战仍在于数据，如果有更多且更多样化的数据，我们就能够提供更好的结果。”Gurovich说。

　　存在风险

　　但是，该算法的好坏取决于它的训练数据集，而且存在风险，尤其是在那些只影响全球少数人的罕见疾病开始受到关注的情况下，该公司和研究人员将对数据集进行存储和商品化。

　　医生可以把这项技术当作一种辅助手段，尽管它并不能提供明确的诊断。但研究人员表示，这也引发了一些伦理和法律方面的担忧，例如培训数据集的种族偏见和数据库的商业碎片化。这两种情况都可能限制诊断工具的使用。

　　英国牛津大学计算生物学家Christoffer Nellaker表示：“这威胁到了这项技术的主要潜在好处。”Nellaker一直在推动该领域的数据共享。

　　一直以来，在训练数据集中的种族偏见都是一个问题。

　　2017年对智障儿童进行的一项研究发现，在比利时白人儿童中，Face2Gene对唐氏综合征的识别率为80%，而在刚果黑人儿童中这一比例仅为37%。

　　然而，随着训练数据集多样化，该算法对非洲面部识别的准确性得到改善，表明更公平地代表不同人群是可以实现的。

　　“正因为如此，我们成功地开发和培训了一种可以被认为是种族平等的人工智能解决方案。我们计划继续扩大和开发人工智能解决方案，帮助减少医疗保健领域的种族差异。”Gurovich告诉《中国科学报》，“随着我们向前发展，技术偏见会越来越少。”

关键字：综合征数据集算法遗传病遗传学家引用地址：“刷脸”窥见遗传病深度学习算法有助疾病诊断

上一篇：人工智能拥抱医疗要迈过几道坎？
下一篇：英伟达入局AI医疗医疗将成为人工智能最大的应用场景之一

推荐阅读最新更新时间：2024-03-16 12:16

现场总线FF的PID控制算法应用研究

　　1 引言　　现场总线技术的发展使得控制系统在由封闭走向开放的进程中迈进了一大步。以现场总线为基础的开放式控制系统开始进入封闭的DCS系统，成为过程控制的发展方向。FF(基金会现场总线)现场总线是一种全数字、串行、双向通信网络，同时也是一种专门针对过程自动化领域的应用而设计的现场总线，所以其在设计之初就充分考虑了过程自动化领域的一些特点，比如总线、供电、本质安全，以及较高的实时性要求等。我国在FF总线技术研究以及符合FF协议的现场设备产品开发方面己经取得了长足的进步，如中科院沈阳自动化研究所研制出了各种基金会现场总线产品，例如压力变送器、温度变送器，以及主机接口卡和通信栈软件等。在DCS时代，先进控制已被证明可以为企业获得巨大的

[嵌入式]

面部识别隐私安全问题爆发，IBM拿面部数据集赚钱？

近些年来，面部识别技术得到了长足发展，除了帮你解锁 iPhone，还能让执法机关在人山人海中“一眼”就认出犯罪分子，商店甚至用它来识别自己的“死忠”客户。不过，法律专家却警告称，大量未经允许滥用网络照片最终会画地为牢，反过来成为监控你的“帮凶”。现在的面部识别技术还不完美，它工作时靠的是算法，目标则很简单——认出那张独一无二的脸。想把这个任务完成好，技术人员就必须提前“喂给”算法“养料”，即天量的面部照片。那么这些照片从哪来呢？当然是互联网。起初，算法学习的照片都会按照不同的标准进行分类，比如年龄、性别、肤色等，但经过一段时间的学习后，它的能力开始变得有些吓人了，于是法律和人权专家开始大声疾呼，他们担心技术人员对普通人照片的

[安防电子]

面部识别隐私安全问题爆发，IBM拿面部<font color='red'>数据</font><font color='red'>集</font>赚钱？

基于混合最优算法的高精度数控直流电源设计

设计并制作数控直流电流源。输入交流200～240V，50Hz；输出直流电压≤10V。要求：输出电流范围：200mA～2000mA；可设置并显示输出电流给定值，要求输出电流与给定值偏差的绝对值≤给定值的1％+10mA；具有步进调整功能，步进≤10mA；纹波电流≤2mA；改变负载电阻，输出电压在10V以内变化时，要求输出电流变化的绝对值≤输出电流值的1％+10mA。 2 系统设计方案鉴于目前数控直流源一般采取运放构成的电流-电压转换电路与单片机结合，设计方案大多为开环系统，主控制器仅用于数字给定及显示，没有对输出电流进行检测和控制。本文在传统电路设计的基础上，利用控制系统中反馈与控制原理，引入电流负反

[模拟电子]

一种基于比特表的实时多任务新调度算法

摘要：主要讨论常见的几种多任务实时性处理算法的优缺点，提出一种更能满足多任务实时性处理的算法——基于比特表的时间片算法。这种算法主要是把常规的比特表中的任务按照时间片进行分配，以很好地完成实时性要求高且任务时间较长的任务，而不影响其它实时性要求更高的任务的完成。关键词：比特表时间片实时处理引言在微机控制领域中，许多单片机应用系统是实时控制系统RTCS（Real Time Control System）。在实时控制系统中，为了很好地完成外界信息的实时测量、计算和相应的多种实时控制操作，必须达到两个设计目标；实时性和并行性。即既要保证系统对外界信息以足够快的速度进行相应处理，又要同时完成多种任务操作。在这里，多种任务

[嵌入式]

安霸收购雷达AI算法供应商Oculii

人工智能视觉芯片公司Ambarella宣布已达成最终协议，收购雷达感知AI算法公司傲酷雷达（Oculii）。总部位于俄亥俄州的傲酷雷达拥有自适应AI软件算法，旨在使用当前生产的雷达芯片实现雷达感知，改善分辨率（提高约100倍），并实现更长的测距和更高的精度。通过改进，可减少对专用高分辨率雷达芯片的需求。而与传统雷达解决方案相比，这些专用芯片的功耗和成本更高。傲酷雷达的软件可部署在Ambarella的现有CVflow® SoC上，与领先的雷达射频解决方案一起运行，大大提高安全性和可靠性。 Ambarella的现有边缘AI CV感知SoC适用于汽车和其他物联网端点应用，如移动机器人和安全。而此次收购将Ambarella的目标市场扩

[汽车电子]

什么是电机控制算法

电机控制算法和是电机控制领域的两个核心方面，下面将对它进行解释。电机控制算法：电机控制算法是指利用各种控制技术对电机进行控制的算法，其目的是让电机在不同负载和速度下实现高精度、高效率、高可靠性的运行。常见的电机控制算法包括以下几种： (1) 位置控制算法：控制电机按照预设位置运行，常用于步进电机、伺服电机等的控制。 (2) 速度控制算法：控制电机按照预设速度运行，常用于直流电机、无刷电机等的控制。 (3) 扭矩控制算法：控制电机输出的扭矩大小，常用于交流电机、直流电机等的控制。 (4) 矢量控制算法：控制电机的磁场方向和大小，实现高精度、高效率的运行，常用于交流电机、无刷电机等的控制。电机控制算法的选择需要根据具体的应用场景

[嵌入式]

51单片机-温度PID算法(C程序)

#include reg51.h #include intrins.h #include math.h #include string.h struct PID { unsigned int SetPoint; // 设定目标 Desired Value unsigned int Proportion; // 比例常数 Proportional Const unsigned int Integral; // 积分常数 Integral Const unsigned int Derivative; // 微分常数 Derivative Const unsigned int LastError; // Error

[单片机]

利用率达到100%的SVPWM控制算法介绍

1.概述：在Part4中得到SPWM在理想情况下调制比为1，直流电压利用率为0.866即86.6%，电压利用率也不高，还有13.4%的母线电压没有利用到。本文学习介绍利用率达到100%的SVPWM控制算法。 2.SVPWM原理： SVPWM全称空间电压矢量PWM，是控制电压矢量使电机获得圆形旋转磁场。理想情况下调制比可以达到1.15。输出线电压就是母线电压。故直流利用率为1，即100%。更容易数字化控制，直流利用率比SPWM提高15%。在新能源行业有着广泛应用。三相全桥拓扑有6个开关器件构成，对于每个桥臂上下管互补，因此有八种基本开关组合。构成了SVPWM的8个基本电压矢量。其中上管全开，和下管全开输出线电压为0，故有

[嵌入式]