百万倍加速:加速计算助力基因测序突破极限

最新更新时间:2023-01-18来源: EEWORLD关键字:NVIDIA  加速计算  基因测序 手机看文章 扫描二维码
随时随地手机看文章

百万倍加速:加速计算助力基因测序突破极限


自从生命的“密码”—基因组被科学家破解以来,人类追求速度更快、成本更低的基因测序技术的脚步一直都在继续。


 image.png


在1月13日刚刚结束的摩根大通医疗健康大会上,NVIDIA发布了与初创公司 InstaDeep、慕尼黑工业大学(TUM)在基因组学大型语言模型方面的联合研究成果。研究团队使用NVIDIA超级计算机 Cambridge-1,在各种基因组数据集上,训练了参数规模从500M到2.5B不等的各种大型语言模型(LLM),经过基因组学训练的大型语言模型可将应用扩展到大量基因组学任务, 这些任务有助于了解DNA如何转录生成RNA和蛋白质,从而开启新的临床应用。


基因测序 梦想照进现实


作为人类医疗技术发展的重要一步,基因测序可通过提取人体血液或唾液,对人类的DNA、RNA、蛋白质及代谢物进行分析,从而锁定个人病变基因,以诊断、预测或预防遗传性疾病的发生。基因蕴含了人类诸多病症的秘密,使人类有机会尽早预防疾病,并多元化治疗疾病。


2001年,被誉为生命科学“登月计划”的“人类基因组计划”(HGP)历时13年,耗资近30亿美元,发布了首张人类基因组草图。此后二十年中,以数字生物学为基础的基因组测序技术取得巨大进步,将全基因组测序的成本逐步降低至不到1000美元。一时间,全球对基因测序与分析的需求量出现暴涨。


加速计算突破基因分析算力瓶颈


随着基因组测序和分析需求的激增,由此产生的数据也迎来爆发式增长。过去十年间,基因测序的数据量平均每七个月就会翻一倍, 2025年全球测序能力预计将达到Zb级别,其中,仅人类全基因组存储的数据量就将达到每年2-40Eb。


要实现精准医疗,就需要对大量基因数据做出精确的计算和分析,这意味着巨大的计算成本和时间。因此,必须有创新的技术,打破全基因组测序数据医疗应用的主要瓶颈,推动行业进一步向前发展。


基因组测序与分析属于标准的计算密集型任务,而GPU擅长并行计算,可以将复杂计算问题分解为很多小任务,在多个CUDA内核上同时运行,从而大幅减少处理计算任务的时间,让基因组测序分析的速度获得大幅提升。NVIDIA以GPU为核心构建出“全栈加速计算平台”,与人工智能相结合,在全球包括基因测序在内的多个领域掀起一场加速革命。


除了具有全球领先的硬件加速计算平台,NVIDIA还推出了基于GPU的基因测序分析加速软件—— NVIDIA Clara Parabricks。Clara Parabricks是一款GPU加速的计算基因组学工具包,可提供多种生物信息学工具和功能,如序列比对、预处理和质量指标、变异检测、UMI以及用于胚系、体细胞和RNA分析的端到端工作流程。与仅使用CPU的解决方案相比,Parabricks速度提升高达80倍,计算成本降低高达50%。借助Clara Parabricks和GPU,将深度学习的强大功能应用到基因组分析,可为测序中心、临床团队、基因组学研究人员以及新一代测序仪器开发者提供快速准确的分析,进而助力更快速、更准确的基因组学分析。


此外,为了更好地帮助科学家了解疾病,为患者找到治疗方法,NVIDIA还推出了BioNeMo框架,用于训练和部署超算规模的大型生物分子语言模型。该大型语言模型框架可支持化学、蛋白质、DNA和RNA数据格式,还可提供云API服务,用于未来支持越来越多的预训练AI模型。


基因测序领域降本增效创造新记录


在NVIDIA加速计算平台、人工智能与基因测序专业软件的赋能下,来自全球的学研机构、政府组织以及相关企业,正在不断突破基因测序与分析领域的速度与成本极限,创造出一项项新的记录:


  • 斯坦福大学、NVIDIA、牛津纳米孔科技公司、谷歌、贝勒医学院和加州大学圣克鲁兹分校的研究人员共同合作推出DNA测序技术,实现了创纪录的测序速度。该方案使用NVIDIA Clara Parabricks计算基因组学应用框架,以及GPU加速版本的PEPPER-Margin-DeepVariant流程,在谷歌云上使用NVIDIA GPU加速碱基判定和变体识别,将基因诊断时间从数周缩短到5.2小时,使医生能够快速判断如何治疗危重病人。


  • 麻省理工学院与哈佛大学旗下的博德研究所与NVIDIA合作,为拥有超过2.5万用户的Terra云平台提供快速分析海量医疗数据所需的AI能力和加速工具。通过GPU加速的NVIDIA Clara Parabricks工作流,可助力从事各种基因组数据分析的研究人员降本增效。在博德研究所的GATK最佳实践——生殖细胞突变检测分析流中,Parabricks在GPU上进行分析的速度提高了24倍,而成本减半。


  • 阿里云与NVIDIA达成合作,成为国内首家在基因分析平台集成和部署NVIDIA Clara Parabricks的公有云厂商。Clara Parabricks为阿里云基因分析平台的行业标准基因组分析工具包以及基因调用器等工具带来了GPU加速,据测算用户可以在30分钟内完成一个30x测序深度的全基因组分析,且与GATK的最佳实践结果 99.99% 一致,而在过去基于 CPU环境中这项工作需要20多个小时才能完成,并且计算成本可降低40%-80%。


  • 普渡大学首席研究员Carpi博士和团队将Clara Parabricks的表现和疟疾学界使用的鉴定变体和跟踪疟疾传播的现有方法进行了对比,并使用1000个疟疾基因组监测抗疟药物的耐药性。与只使用CPU的传统方式相比,基于GPU加速的Clara Parabricks分析速度提高了27倍,成本降低了5倍,同时准确率达到 99.9%。


  • 圣路易斯华盛顿大学的Tychele Turner博士与团队使用基于GPU加速的Clara Parabricks开发出一种快速基因组学工作流,用于在自闭症患者中发现de novo 变异(DNVs)。通过将三重分析整合到 NVIDIA Clara Parabricks中,Turner博士将生成DNV初始分析的时间从原来的800 小时(在CPU上进行)缩短至8.5小时(在GPU 上使用只有4个GPU的服务器),加快了100 倍。


  • 为推广基因组医学计划,泰国国家生物库采用NVIDIA DGX A100系统和NVIDIA Clara Parabricks来打造IT基础设施,以加速基因组测序。加速方案将全基因组测序的数据处理时间缩短了4个月,每位用户的处理时间也从30多个小时缩短到1到2小时。


  • 生物技术领军企业Regeneron高通量测序中心与大规模的生物医学数据库和研究资源平台英国生物样本库合作,在DNAnexus平台上使用NVIDIA Clara Parabricks运行分析对超过50万名生物库参与者的外显子组进行了测序和分析,5分钟内完成了在32-vCPU机器上需要花费一小时计算的全外显子组分析,同时成本降低约40%。


凭借加速计算领域的全栈能力以及深耕行业所积累的专业知识,NVIDIA现在已经推出了智能计算平台NVIDIA Clara,全面布局医疗健康行业。该平台涵盖了用于医学影像的Clara Holoscan、基因组学的Clara Parabricks、患者监控的Clara Guardian以及药物研发的Clara Discovery,并可端到端部署至本地、嵌入式系统、边缘以及云端等任何地方,助力行业实现无缝创新,加快实现精准医疗的目标。


无论是尖端医学研究、大规模基因组分析还是日常应用检测,NVIDIA Million-X百万倍计算性能飞跃的愿景已经在基因测序的各个领域结出累累硕果,并将持续为人类消除疾病、促进健康做出贡献。


关键字:NVIDIA  加速计算  基因测序 编辑:张工 引用地址:百万倍加速:加速计算助力基因测序突破极限

上一篇:科研人员创新前沿脑机接口技术 为脑疾病诊疗提供新思路
下一篇:人工智能从头开始设计出灭菌蛋白,同样的方法有望用于新药研制

推荐阅读

NVIDIA 和戴尔科技扩展 AI 产品组合
NVIDIA 和戴尔科技扩展 AI 产品组合NVIDIA 全栈式AI方案现已登陆15款全新戴尔 PowerEdge 服务器,助力企业更快、更高效地构建和部署 AI 工作负载2023 年 1 月 17 日 —— NVIDIA 和戴尔科技今日发布了由 NVIDIA 提供加速的多款戴尔 PowerEdge 系统,助力企业通过 AI,高效地实现业务转型,这是双方有史以来在AI 方面最大规模的合作。15 款下一代戴尔 PowerEdge 系统可利用 NVIDIA 全栈 AI 解决方案(包括 GPU、DPU 和 NVIDIA AI Enterprise 软件套件),为企业构建各类 AI 应用程序奠定了基础,包括语音识别、网络安全、推荐系统、以及
发表于 2023-01-18
<font color='red'>NVIDIA</font> 和戴尔科技扩展 AI 产品组合
百万倍加速加速计算助力基因测序突破极限
百万倍加速:加速计算助力基因测序突破极限自从生命的“密码”—基因组被科学家破解以来,人类追求速度更快、成本更低的基因测序技术的脚步一直都在继续。在1月13日刚刚结束的摩根大通医疗健康大会上,NVIDIA发布了与初创公司 InstaDeep、慕尼黑工业大学(TUM)在基因组学大型语言模型方面的联合研究成果。研究团队使用NVIDIA超级计算机 Cambridge-1,在各种基因组数据集上,训练了参数规模从500M到2.5B不等的各种大型语言模型(LLM),经过基因组学训练的大型语言模型可将应用扩展到大量基因组学任务, 这些任务有助于了解DNA如何转录生成RNA和蛋白质,从而开启新的临床应用。基因测序 梦想照进现实作为人类医疗技术发展的重
发表于 2023-01-18
百万倍<font color='red'>加速</font>:<font color='red'>加速</font><font color='red'>计算</font>助力<font color='red'>基因</font><font color='red'>测序</font>突破极限
华为自产智能驾驶芯片即将量产,特斯拉被英伟达打败了?
前几天我们盘点了2022年新能源汽车行业的变化,主要是电池格局的变化与智能座舱技术的发展。本来想一鼓作气写完智能驾驶技术的发展,但突然从朋友处得到了一个重磅消息,那就是华为自研自产的智能驾驶芯片即将量产。这件事一旦完成,无疑将颠覆整个智能汽车行业。求证这件事花了一些时间,于是这篇文章就滞后了一些。智能驾驶技术到底发展到了什么水平?哪一家的技术最打动人?让功夫汽车带大家一起看一下。(1)“踩雷”纯视觉,特斯拉被英伟达超车往前推两年,提起智能驾驶的代表性企业,很多人的第一反应还是特斯拉。哪怕是在2021年,已经有小鹏P7(参数|询价)这样的车对特斯拉发起挑战,这个判断也未能被动摇。但从2022年开始,特斯拉却突然落后了。2013年,马斯
发表于 2023-01-17
华为自产智能驾驶芯片即将量产,特斯拉被<font color='red'>英伟达</font>打败了?
NVIDIA DGX SuperPOD 助力京东探索研究院 Vega-MT 模型大赛夺魁!
模型训练任务缩短到两周内完成,且在算力和扩展性上都有倍数提升。图片来源于京东借助 NVIDIA DGX SuperPOD,京东探索研究院训练了参数量近五十亿的 Vega-MT 模型,在 2022 年第 17 届国际机器翻译大赛(WMT)上大放异彩。Vega-MT 在中文-英语(BLEU 33.5, chrF 0.611)、英文-中文(BLEU 49.7, chrF 0.446)、德语-英语(BLEU 33.7, chrF 0.585)、英语-德语(BLEU 37.8, chrF 0.643)、捷克语-英语(BLEU 54.9, chrF 0.744)、英语-捷克语(BLEU 41.4, chrF 0.651)和英语-俄罗斯语(BLE
发表于 2023-01-17
<font color='red'>NVIDIA</font> DGX SuperPOD 助力京东探索研究院 Vega-MT 模型大赛夺魁!
从智驾到座舱,再到制造,NVIDIA全面发力汽车赛道
NVIDIA(英伟达)在智能汽车市场要的不是暂时领先,而是“一骑绝尘”,就像此前在人工智领域一样。近日,CES 2023科技展会上,NVIDIA发布会如期而至,依然分为显卡、机器人、汽车等多个板块,其中汽车业务尤为吸睛:先是明确2025年量产的Thor(雷神)芯片支持完整的“舱驾一体”,深度切入智能座舱赛道;后又更新了“元宇宙”在汽车赛道应用消息,陆续牵手奔驰、富士康……伴随着NVIDIA在汽车领域的持续扩张,已经逐步构建出成以芯片为基石,涵盖零部件供应商、自动驾驶技术公司、主机厂等全产业链的生态朋友圈。NVIDIA正在全面发力汽车业务。01云游戏服务走向汽车,发力智能座舱业务NVIDIA在汽车领域布局起于2015年推出的NVIDI
发表于 2023-01-13
从智驾到座舱,再到制造,<font color='red'>NVIDIA</font>全面发力汽车赛道
NVIDIA 助力零售业解决价值 1000 亿美元的库存 “损耗” 难题
开发者可使用全新 NVIDIA 零售 AI 工作流,快速构建防损应用程序。该工作流基于云原生微服务而构建,包括针对数百种容易被盗的产品进行预训练的模型。2023 年 1 月 12 日 - 美国零售联合会会议 - 全球零售业面临着一个价值 1000 亿美元的难题 —— 库存 “损耗”,即由于盗窃、损坏和错放而造成的货物损失,会在极大程度上削弱零售商的利润。根据美国零售联合会(National Retail Federation)与零售防损委员会(Loss Prevention Research Council)合作开展的 《2022 年零售业安全调查》,估计 65% 的商品损耗是由于盗窃造成的。多家零售商表示,由于食品和其他必需品价格
发表于 2023-01-13
<font color='red'>NVIDIA</font> 助力零售业解决价值 1000 亿美元的库存 “损耗” 难题
小广播
换一换 更多 相关热搜器件

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: 医学成像 家庭消费 监护/遥测 植入式器材 临床设备 通用技术/产品 其他技术 综合资讯

词云: 1 2 3 4 5 6 7 8 9 10

北京市海淀区知春路23号集成电路设计园量子银座1305 电话:(010)82350740 邮编:100191

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2023 EEWORLD.com.cn, Inc. All rights reserved