安卓

首页 » 常识 » 问答 » 诊疗好助手用AI识别癌症靠谱吗
TUhjnbcbe - 2021/5/24 20:26:00

(图源:medischcontact)

符征编译

病理学家们的工作有点像侦探,他们努力寻找病因和证据。病理学家首要的工作是对病变照片进行识读,区分哪些是正常组织,哪些是病变组织。因为病变图像太复杂,识读一直以来都是由病理学专家手动完成。但事实上,病理学家没有足够的资金和精力,来识读所有巨量的照片。

根据7月15日《自然》杂志报道,美国斯隆-凯特琳癌症中心和康奈尔医学研究学院的研究小组开发了一项计算机自动识读系统,将病理学家彻底从这项繁重工作中拯救出来。未来,病理学家、医生与人工智能联手诊断有望成为一种常态。

(图源:大科技)

人工手动标注分类

对于切片诊断,有效的标注和分类是识别疾病的基础。病理学家最头疼的问题之一是,组织切片过于复杂。一块病理切片通常有已病变组织,也有未病变组织,还有即将发生病变的组织,当然还有无关组织。研究的第一步是把这些自然组织,按照规定的类别和格式,分类标注清楚。将自然图像转换为便于高效利用的表达形式。专业的说法叫作“特征表达”。

这个工作好比别人拍摄一张自然风光照片,要你将它转换为*事地图。这种转换工作显然是相当细致和严格的,不仅是要耗费大量的物质和精力,关键你本人的知识素养一定要过硬。这项工作现在已经成为一门学科,叫作“地理信息系统”。

但是病理学还未建立成熟的信息系统来,因为组织切片比自然风光的复杂度要上升几个等级。首先组织切片是高分子级的;失之毫厘谬以千里。其次,之所以要研究是因为病理学家对病理并不清楚,所以标注中总是会遇到无法下手的新情况。再次,病理变化是历时的,必须进行系统比较才能得出初步结论。

像这样的工作,过去通常由研究人员手动完成,将病理切片的局部尽量放大到像素级,然后由训练有素的研究人员在照片上逐像素手动标注。手动标注费时费力费钱。每个切片都有几万或几十万个组织单元,标注一个切片往往需要一周或数周的时间。

训练有素的研究人员往往达到或接近专家级别,让他们来标注要白白浪费大量的时间和精力;实习生虽然有充分的时间且廉价,但往往缺乏足够的经验,甚至会出现不同人员做出不同标注的现象。对病理学研究来说,手动标注是一个很大的发展瓶颈。

AI自动化标注分类

近年来,随着切片电子记录容量和清晰度快速发展,加上用于分析大型数据集的强大的新计算方法,创造了在病理学和实验室内建立新学科的机会。自动特征表达就成为一个新热点。

所谓的自动特征表达,就是让计算机经过学习,能够自动的处理病理切片的信息。国际上近年来有大量工作投入在这一方面,但整体来说,研究总是局部化的,而且离临床应用还有较大差距。

以GabrieleCampanella为首的这个研究小组,使用弱监督深度学习技术,共同开发了一项自动特征表达系统。该系统仅使用已经报告的诊断作为训练标签,然后在图像集上评估了该系统框架。该图集共有张照片,分别来自15,名患者。这些图像是关于前列腺癌、基底细胞癌和乳腺癌等症状的组织切片电子照片,但是没有任何形式的数据管理标注。

GabrieleCampanella

根据报告,AI系统对以上所有癌症类型的标注成功率高于98%,并且在临床应用中将允许病理学家排除65~75%的载玻片,同时保持%的灵敏度。各个测试数据集的性能以AUC衡量。

图a显示了对前列腺数据集的分类结果(样本数1,),在20倍放大率下最佳,准确率为0.。图b显示了对基底细胞癌的分类结果(样本数1,),在5倍放大率下最佳,准确率达到0.。图c:模型在乳腺转移检测任务中的表现最差(样本数1,),在20倍放大率下准确率为0.。腋窝淋巴结数据集是三个数据集中最小的一个,这与假设一致,即需要更大的数据集才能在实际临床数据上实现更低的错误率。

不同癌症数据集的MIL模型分类性能

结果表明,该系统能够以前所未有的规模训练和准确的分类模型,为临床实践中计算决策支持系统的部署奠定基础。该报告同时提供了工作的源代码下载,供其他人验证该系统的有效性。如果对前列腺癌、基底细胞癌和乳腺癌等识别率超过98%,意味着病理学将彻底走进自动化分析时代。

参考文献

闫雯等,人工智能时代的病理组学,《临床与实验病理学杂志》,年06期。

GabrieleCampanellaetc.,Clinical-grade

1
查看完整版本: 诊疗好助手用AI识别癌症靠谱吗