研究人员开发了多任务人工智能工具可以在创纪录的时间内提取癌症数据
作为美国第二大死亡原因,癌症是一种公共卫生危机,一生中有将近二分之一的人罹患癌症。癌症也是一种令人难以忍受的复杂疾病。该国的癌症登记处已记录了影响70多个器官的数百种癌症类型,这是有关个别癌症病例信息的数据库,可为医生,研究人员和政策制定者提供重要的统计数据。
“人口级癌症监测对于监测旨在预防,检测和治疗癌症的公共卫生计划的有效性至关重要,”美国能源部健康数据科学研究所和国家计算科学中心主任吉娜·图拉西(Gina Tourassi)说。橡树岭国家实验室。“与国家癌症研究所合作,我的团队正在开发先进的人工智能解决方案,以通过自动化耗时的数据捕获工作并提供近乎实时的癌症报告来使国家癌症监测计划现代化。”
通过数字癌症登记处,科学家可以确定癌症诊断和治疗反应的趋势,从而有助于指导研究经费和公共资源。但是,就像他们追踪的疾病一样,癌症病理报告也很复杂。符号和语言的变化必须由经过培训以分析报告的人类癌症注册商进行解释。
为了更好地利用癌症数据进行研究,ORNL的科学家正在开发一种基于人工智能的自然语言处理工具,以改善从文本病理报告中提取信息的能力。该项目是美国能源部与美国国家癌症研究所(DOE)合作的一部分,该合作被称为癌症高级计算解决方案联合设计(JDACS4C),该项目通过将癌症数据与高级数据分析和高性能计算相结合来加速研究。
作为DOE最大的科学办公室实验室,ORNL拥有独特的计算资源来应对这一挑战-包括世界上功能最强大的AI超级计算机和用于处理受保护信息(例如健康数据)的安全数据环境。通过其监视,流行病学和最终结果(SEER)计划,NCI从癌症登记处(例如路易斯安那州肿瘤登记处)接收数据,其中包括针对个别癌症病例的诊断和病理信息。
“手动提取信息的成本高,耗时且容易出错,因此我们正在开发基于AI的工具,” ORNL计算与计算科学部研究科学家Mohammed Alawad说,该论文的主要作者 发表 在《美国国家 科学》杂志上美国医学信息学协会(American Medical Informatics Association) 就该团队的AI工具的结果。
在针对癌症病理报告的第一篇文章中,该团队开发了一个多任务卷积神经网络或CNN(一种深度学习模型),该模型通过将语言作为二维数值进行处理来学习执行任务,例如识别文本主体中的关键词。数据集。
“我们使用一种称为单词嵌入的通用技术,该技术将每个单词表示为一连串的数值,” Alawad说。
具有语义关系或共同传达含义的词在维空间中彼此接近,作为向量(具有大小和方向的值)。该文本数据被输入到神经网络中,并根据在数据中找到连接的参数通过网络层进行过滤。然后,随着越来越多的数据被处理,这些参数会越来越多地被修改。
尽管某些单任务CNN模型已经用于梳理病理报告,但是每种模型只能从报告中的信息范围中提取一个特征。例如,可以训练单任务CNN仅提取原发癌部位,输出检测到癌症的器官,例如肺,前列腺,膀胱等。但是要提取有关组织学等级或癌细胞生长的信息,将需要训练一个单独的深度学习模型。
研究团队通过开发一个网络来扩展效率,该网络可以在与单任务CNN大致相同的时间内完成多个任务。该小组的神经网络同时提取五个特征的信息:主要部位(身体器官),侧卧(右侧或左侧器官,如果适用),行为,组织学类型(细胞类型)和组织学等级(癌细胞生长的速度如何)或传播)。
团队的多任务CNN在相同的时间内完成了所有五个任务,并且胜过了单任务CNN,从而使其速度提高了五倍。但是,阿拉瓦德说:“速度不比速度快五倍。这是 n倍的速度。如果我们有 ñ 不同的任务,那么将采取单ň日的每个任务的时间“。
团队成功的关键是开发CNN架构,该架构使各层可以跨任务共享信息,而不会降低效率或降低性能。
“这是计算效率和性能效率,” Alawad说。“如果我们使用单任务模型,那么我们需要为每个任务开发一个单独的模型。但是,通过多任务学习,我们只需要开发一个模型即可,但是开发这个模型并弄清楚体系结构在计算上非常耗时。我们需要一台超级计算机来进行模型开发。”
为了构建高效的多任务CNN,他们呼吁使用世界上最强大,最智能的超级计算机– ORNL的200 petflop峰会超级计算机,该计算机具有超过27,600个经过深度学习优化的GPU。
该团队首先开发了两种类型的多任务CNN架构-一种称为“硬参数共享”的常见机器学习方法,另一种被称为“十字绣”的图像分类方法已经显示出一定的成功。硬参数共享在所有任务中使用相同的几个参数,而十字绣使用多个任务之间分散的参数,从而导致必须将“输出”在一起。
为了用真实的健康数据训练和测试多任务CNN,该团队使用了ORNL的安全数据环境和路易斯安那州肿瘤登记处的95,000份病理报告。他们将其CNN与其他三个已建立的AI模型(包括单任务CNN)进行了比较。
“除了提供HPC和科学计算资源外,ORNL还可以训练和存储安全数据-所有这些都很重要,” Alawad说。
在测试过程中,他们发现硬参数共享多任务模型优于其他四个模型(包括十字绣多任务模型),并且通过减少计算时间和能耗来提高效率。与单任务CNN和常规AI模型相比,硬共享参数多任务CNN在短时间内完成了挑战,并最准确地对五个癌症特征中的每一个进行了分类。
“下一步是启动一项大规模的用户研究,该技术将在癌症注册机构中部署,以确定在注册机构工作流程中最有效的集成方式。目标不是取代人类,而是扩大人类。”图拉西说。
免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!
-
安徽淮南长安猎手K50作为一款备受关注的皮卡车型,其2025款在配置和性能上都有所升级。对于想要购买这款车的消...浏览全文>>
-
安徽阜阳的大众高尔夫GTI作为一款备受年轻消费者喜爱的性能车型,其价格和配置一直是大家关注的重点。高尔夫GT...浏览全文>>
-
近年来,新能源汽车市场发展迅猛,大众品牌凭借其深厚的技术积累和可靠的产品品质,在国内市场上占据了重要地...浏览全文>>
-
QQ多米作为一款备受关注的小型车,凭借其时尚的外观设计和实用的配置,吸引了众多消费者的关注。为了帮助大家...浏览全文>>
-
随着新能源汽车市场的持续升温,上汽大众ID 6 X凭借其宽敞的7座空间和出色的续航能力,成为不少家庭用户的关...浏览全文>>
-
淮南途锐新能源2024款车型以其卓越的性能和环保特性吸引了众多消费者的关注。作为一款高端插电式混合动力SUV,...浏览全文>>
-
近年来,随着新能源汽车的普及和政策支持的不断加大,越来越多消费者将目光投向了插电混动车型。作为一款备受...浏览全文>>
-
2025款生活家PHEV作为一款备受关注的新能源车型,凭借其出色的性能和环保特性,吸引了众多消费者的目光。在购...浏览全文>>
-
长安汽车旗下高端新能源品牌——启源,在2024款新车的推出中再次吸引了广泛关注。作为该品牌的旗舰车型之一,...浏览全文>>
-
近年来,新能源汽车市场持续火热,各大品牌纷纷推出新款车型以满足消费者需求。在众多选择中,2025款安徽池州I...浏览全文>>
- iPhone用户现在可以通过iOS18.1更新更改其Apple帐户的主要电子邮件地址
- 当你看到T-Mobile用户赢得手机手表和耳机时你会羡慕不已
- Ubuntu24.10OracularOriole推出最新内核工具链GNOME47和增强的安全性
- 搭载M4的MacBookPro在Cinebench上击败了CoreUltra9288V和Ryzen9AI370HX
- EarFun推出功能强大的159美元UBoomX便携式扬声器
- iPhone16Pro iPhone16ProMax表现优于基本机型扭转了之前的趋势
- Waze迎来魔兽世界改版
- SquareEnix将心爱的RPG移植到MetaQuest3
- 苹果正在设计全新操作系统瞄准新类别的产品
- 小米RedmiA27U显示器采用4K面板和90WUSBC端口
- 苹果将为iPhone17系列采用新电池技术
- Adobe推出PhotoshopElements和PremiereElements2025取消Elements软件的永久许可
- AppleiPhoneSE4将配备更新的OLED显示屏
- InfinixZeroFlip首次亮相作为新款可折叠Android智能手机其价格低于摩托罗拉Razr2024
- OnePlus13型号 充电规格在最新泄漏中被登记
- Insta360AcePro2主要规格终于泄露GoPro和DJI运动相机竞争对手将配备50MP传感器5nm和2倍数码变焦
- XboxElite无线控制器系列2通过Xbox设计实验室获得透明面板
- 索尼INZONEM10S华硕ROGSwiftOLEDPG27AQDP新品上市但售价更高
- 谷歌终止PixelBuds的点击通知功能
- 谷歌正在努力完善iOS中缺少的RCS支持重要功能
- 对AppleIntelligence功能的评价从一般到还可以
- GalaxyS25Plus看起来很时髦但三星是否选择像iPhone一样的通用设计
- 优质48英寸三星S90DOLED电视在亚马逊上降至历史最低价同时赠送100美元Xbox礼品卡和1年保护计划
- AOC推出四款新型游戏显示器具有快速刷新率和低价格
- Valve出售部分SteamDeck型号-GBLCD型号售价296.65美元512GBLCD型号售价336.75美元
- Beats在其产品线中增加了手机保护壳推出适用于iPhone16系列的MagSafe保护壳
- 三星在IFA2024上展示AI产品
- 新的AIPlaygroundDesign工具你可以简单地与之交谈就像ChatGPT一样
- 极简主义Linux发行版Peropesis2.7附带存档和ISO管理工具
- GAMEBABY控制器和外壳混合套装现已接受预订