近两年来,无论是在语音识别、图像识别还是文本理解,深度学习在医疗领域都有超乎想象的突破。
在语音识别领域,梅奥诊所与以色列语音分析公司Beyond Verbal合作的研究发现13个语音特征和冠心病存在相关性,其中一个语音特征与冠心病存在强相关。
在自然语言处理领域,IBM的沃森机器人能够在17秒内,阅读3469本医学专著,248000篇论文,69种治疗方案,61540次实验数据,106000份临床报告,并根据医生输入的病人指标信息,最终提出优选的个性化治疗方案。
与此同时,伴随着计算机视觉的技术进步,深度学习技术在医疗影像领域频频取得重大突破,人工智能除了教会机器如何“听懂”和“读懂”,更能教会机器“看懂”我们的世界,并在此基础上协助医生诊断疾病。医疗数据中有超过90%的数据来自医疗影像,医疗影像领域拥有孕育深度学习的海量数据,也存在着借助深度学习提高医生“看片子”诊断的效率的需求。因此,在医疗影像领域,深度学习可能率先进入临床阶段。
13万张图像的训练下,深度学习识别皮肤癌的准确率媲美人类医生
皮肤癌是人类最常见的恶性肿瘤,虽然它们出现在皮肤表面,但人们往往将其误认为是自然生长的“痣”,耽误病情,确诊后已为时过晚。奇点糕还记得,电影《非诚勿扰2》里面,孙红雷饰演的李香山从小就长出来的一颗黑痣转变成了恶性的黑色素瘤,最终不堪绝症折磨的他选择跳海自杀。
早期检测到的黑色素瘤的 5 年生存率在 97% 左右,如果晚期查出 5 年生存率将会下降 14%,皮肤癌的早期发现可能会对其结果产生巨大的影响。对于皮肤癌的筛查,主要是通过视觉诊断。一般先进行临床筛查,之后可能进行皮肤镜分析、活检和组织病理学研究。那么有没有一种更简单地方法筛查皮肤癌呢?或者说,能不能利用智能手机筛查皮肤癌?
借助深度卷积神经网络(CNN)技术,斯坦福大学的研究者让这个设想更进一步:研究者们在谷歌用于识别猫和狗算法的基础上,经过13万张皮肤病变的图像训练后,可用于识别皮肤癌。该系统与21位皮肤科医生进行的2轮的对比测试:角质细胞癌与良性脂溢性角化病,以及恶性黑色素瘤和普通的痣。第一轮代表最常见的癌症识别,第二轮代表了最致命的皮肤癌识别。深度卷积神经网络在这两个任务上的表现都达到了所有接受测试的专家的水平,证明了这一人工智能系统的皮肤癌鉴定水平与皮肤科医生相当。这一研究成果发表在2017年1月份的Nature期刊上。【1】
研究者并不止步于此,他们希望在智能手机上也应用该系统。论文的主要作者之一、Thrun 实验室的研究生Andre Esteva说:“现在每个人口袋中都有一个超级计算机,上面有大量、包括摄像头传在内的感器。如果我们把它用来筛查皮肤癌会怎么样?或者筛查其他疾病?”
Google利用深度学习诊断糖尿病视网膜病变
糖尿病视网膜病变是目前越来越被人们重视的致盲病因,目前全球范围内有 4.15 亿糖尿病患者面临视网膜病变的风险。若是发现及时,该病是可以被治愈的,但若是未能及时诊断,则可能导致不可逆转的失明。
糖尿病视网膜病变患者视网膜基底造影示例。左侧图片采自眼部正常的糖尿病患者;右侧图片采自患有视网膜病变的糖尿病患者,图中显示出该病人眼底有出血现象
一般来说,医生要通过糖尿病患者的眼底造影图像来判断是否视网膜发生了病变,并通过眼底病变来判断严重程度,例如是否出现了微动脉瘤、眼底出血、硬性渗出等,主要参考出血、液体渗出等病况。这就对医生个人水平提出了较高的要求,如果缺乏临床经验,那么很容易误诊或漏诊。
2016年,Google的研究者Varun Gulshan和他的同事利用深度学习创建了一种能够检测糖尿病视网膜病变和黄斑水肿的算法,它能够通过眼部扫描图像判断患者的视网膜是否发生了病变,辅助医生在有限的医疗条件下进行诊断。该研究发表在2016年11月30日的《美国医学会杂志》期刊上。【2】
为了训练该算法,研究者从EyePACs数据库搜集了128 175例注释图片,每张图片都记录了 3-7 名眼科医师的评估结果。与该团队合作的眼科医师一共 54 名。为了验证算法的准确度,研究者使用两个独立的数据集进行验证,一个9963例图像一个1748例图像。与8名眼科医生诊断结果对比,谷歌的这款算法甚至超过人类医师:算法获得0.95的F分数(结合敏感性和特异性指标,取max = 1),相比八位眼科专家的中位数 0.91分。
本次眼影所用的图像为2D图像,谷歌Deepmind已经开始将更为精确、全面的3D图像技术(光学相干断层扫描(OCT))应用于深度学习中。
中国科学家利用深度学习筛查先天性白内障
先天性白内障是一种罕见病,集合了慢性和急性疾病的特点。它导致失明和视力损伤,多在出生前后即已存在,或在儿童期内罹患,在我国发病率为0.05%。
受到2015年谷歌DeepMind发表论文的启发,中国中山大学中山眼科中心的80后眼科医生林浩添和他的同事萌生出想要创建一个人工智能平台来挖掘他们在先天性白内障的临床数据,进而达到筛查和辅助诊断的目的。他们联合西安电子科技大学刘西洋教授利用ILSVRC 2014(ImageNet Large Scale Visual Recognition Challenge of 2014)的冠军模型来建立识别先天性白内障的深度学习模型(该模型被认为在图像识别领域占主导地位,可用于训练和分类),取名为CC-Cruiser。本次研究成果于2017年1月30日发表在Nature Biomedical Engineering期刊上【3】。
训练CC-Cruiser的图片集,研究者采用了来自中国卫生部儿童白内障计划(CCPMOH)例行检查的一部分图片,包括410幅不同严重程度的先天性白内障儿童患者的眼部图像,476幅正常儿童眼睛图像。所有图片均由两名有经验的眼科医师独立地进行分类和描述,第三名眼科医师对分歧案例提供咨询。这三名人类医师是没有接触过CC-Cruiser的。
图为CC-Cruiser与人类医师的比较测试
研究者对CC-Cruiser的性能进行了5次测试,结果都非常出色。在和人类眼科医师的50例图像比较测试中, CC-Cruiser找出了所有先天性白内障患者。而三名眼科医师在第3例图片上都犯了错误——误将图片的高光区域诊断为先天性白内障。在危险评估和辅助决策中,CC-Cruiser表现也不错,对所有需要进行手术的患者都给予了正确的治疗建议。因此,研究者认为CC-Cruiser可以称得上是一个“合格的眼科医生”。
Atrerys成为首个FDA批准的深度学习临床应用平台
4D心脏MRI
2017年,GE健康联手旧金山初创公司Arterys颠覆现有的心血管磁共振成像(俗称心脏MRI),将3D的MRI引入新的时间维度,使其MRI扩展为4D,不仅能够全方位地展示心脏结构,还能够显示血液流动的速度、方向以及流量。
与此同时,Arterys还推出了基于云计算和深度学习技术的Arterys Cardio DL应用,它是第一个获得FDA批准的深度学习应用,此举意味着深度学习和云技术将进一步落地在日常医疗服务。
Arterys Cardio DL可用于治疗多种心血管疾病,包括先天性心脏病、主动脉或心脏瓣膜疾病等。它能够自动采集心室的内外轮廓的数据,并提供心室功能的准确计算,耗时短,精度高,一份图像的分析10秒即可完成,远远快于临床医生。因此,称之为基于深度学习的人工智能医学影像分析系统,它已经进行了数以千计的心脏案例的数据验证,实验证实,该算法产生的结果与经验丰富的临床医生的分析结果结果是不相上下的。
作为GE健康的合作伙伴,Arterys Cardio DL的功能将整合在GE推出创新成像技术ViosWorks,它可以从7个维度呈现心脏:包括3个空间维度,1个时间维度,3个速度维度。
诚然,深度学习能够帮助医生更加高效、准确的“看片子”,但目前深度学习在医疗影像领域也存在许多阻碍和缺陷。
首先,就是数据量的问题。训练深度学习需要优质的数据和大量的数据,斯坦福大学的研究者开发的算法之所以能够如此准确地诊断皮肤癌,原因之一就在于他们使用的训练数据集比此前公布的任何同类方法都要大100倍左右。林浩添和同事们因为所做的训练图集较小,有读者质疑是否经过拟合才获得如此高的准确率。在数据量的缺乏是阻碍深度学习发展的一大障碍,医疗数据被分割在不同的医院、部门里,难以发挥真正的力量。除此之外,数据的维度仍然是一大问题。目前,深度学习主要用于2D图像、3D图像、4D图像难以应用。
其次,深度学习是一个“黑箱”,大多数研究者难以接触到最底层的算法结构,只是将数据喂给深度学习,不可能也没必要解释“深度学习”到底怎样做出判断的。因此,这个“黑箱”存在欺骗的问题,也就是说在输入的数据中加入小小的改变,就很容易误导深度学习。
在上图中,所有左列的图经过中间的变换成右列的图。对我们人类来说,变换前后图片几乎没有变化,判对左列图片的深度学习模型却将右列图片都判错了。这说明人类和深度学习模型之间的区别还有很多。
虽然目前深度学习仍处于“辅助诊断”的阶段,真正的决定权仍然在医生手中。但特斯拉的自动驾驶已出现致死事件,深度学习在医疗影像也难以达到100%的准确率。一旦医生听信了深度学习的建议,最终却导致了误诊或漏诊,真正应该负责的到底是医生还是机器?深度学习给医疗领域带来的,不仅是技术问题,还有人文关怀问题。医生和患者之间的互动将是人类智慧的最后一个堡垒。
上一篇:绍兴一医疗企业挺进全球CT市场“塔尖”
下一篇:让医生“走入”人体,GE的工程师们将VR技术应用在术前准备和手术评估
推荐阅读最新更新时间:2024-03-16 12:06