全切片数字化图像(whole slide images,WSI)的出现不但使病理切片的获取更加方便,更重要的是改变了传统的阅片方式。随着数字病理切片在病理诊断中的应用,大量定量分析算法应运而生,包括传统机器学习算法和深度学习算法。近年来,高质量数字病理切片的大量积累为病理切片的分析提供了大数据背景,深度学习算法对大数据样本分析能力普遍强于其他算法,在病理切片分析中表现出巨大潜力。计算机辅助算法在病理分析中的广泛应用,不但能减轻病理医师的工作负担,同时可以提升病理诊断的准确率。我们有理由相信病理诊断的智能机器人的出现是可以期待的。 阿尔法狗和病理狗 2016年3月,"阿尔法狗(AlphaGo)" 战胜韩国九段棋手李世石,在人工智能领域引起了轩然大波。"阿尔法狗"将深度学习和蒙特卡洛树状搜索相结合,通过自我对弈不断进化,攻克了30年来围棋这一人工智能领域的头号强敌。深度学习是一种基于人工神经网络、对数据进行特征学习的算法的泛称,包含多层隐层的人工神经网络模型都可以叫做深度学习。该算法的多层堆叠式结构能够组合数据的低层特征得到数据的高层特征表达,对于大数据样本、复杂函数模型具有强大的处理能力,是人工智能领域的热门研究。 人工智能在病理界也有十分广泛而深入的应用。2016年有文献报道,通过人工智能技术对肺癌样本进行分析,可以为患者预后分析提供指标,为此国内有人将其与"阿尔法狗"相比拟,我们将其定名为"病理狗(PatholGo)"。 病理诊断是疾病诊断的金标准,病理切片分析为病理诊断提供了依据。因此,自病理切片技术出现至今,科学家不断将新的技术手段应用于病理切片的分析中,其中数字病理切片的出现为病理切片定量分析提供了支持。WSI是一种高分辨率的数字病理切片,其所包含的巨大信息为数字病理切片的定量分析任务提供了可靠的基础。结合计算机视觉领域技术的飞速发展,病理切片的自动分析能够提高医师的诊断准确性和工作效率,为患者提供个性化的病理诊断和疾病预后判断。 病理狗组织学基础和诊断技术 传统的病理切片分析方法,需要经过专门训练的病理医师在显微镜下逐个寻找感兴趣区域,而后根据专业知识分析诊断。一张病理切片通常包含数百万个细胞,一个病理医师一天需要分析许多病理切片,这给医师带来很大的工作负担,疲劳阅片现象时有发生。临床病理诊断的正确与否,与病理医师的经验有直接的关系。这种经验除了平时学习和研究外,与阅片数量也有很大的关系,"熟能生巧"在病理诊断经验积累上得到很好的体现。因此基于病理医师主观意见的分析结果很难复制,这种主观差异性及疲劳阅片等因素势必带来一定的误诊率,误诊必然导致误治。学术界越来越认识到计算机辅助的病理切片定量分析在临床和科研中具有重要意义。 病理切片图像可以分为组织学图像和细胞学图像。由于细胞病理学图像和组织病理学图像是两个层次的形态学特征。细胞学图像通常只包含细胞本身的信息,而组织病理学图像包含更复杂的空间和不同成分相互关系等信息,因此二者对分析算法有不同的要求。 杭州健澜科技有限公司 目前,健澜科技病理诊断深蓝医生使用人工智能手段分析病理切片主要分为3个方面: (1)对细胞的检测分割; (2)图像相关特征的提取; (3)病理图像的分类和分级。病理医师根据计算机辅助算法的分析结果可以对疾病做出进一步诊断。 数字病理切片的分析方法 随着计算机视觉领域的飞速发展,数字病理图像自动分析技术的性能也大大提升,改善了病理切片分析的现状。WSI常包含大量复杂、冗余的信息,因此病理分析算法通常先将图片转化为可挖掘的特征数据,而后根据特征提取的结果进一步做出病理诊断。在本文中,我们将病理图像分析算法主要分为传统机器学习算法和深度学习算法两种,用于解决以下三方面任务。 1特征提取: 指从图像中挑选并简化出最能有效表达图像内容的低维矢量的过程,是数字病理切片分析中的重要步骤,只有在正确反映图像特征的基础上,才能正确分析切片的信息并做出病理诊断。目前病理图像特征提取工作主要集中于物体层面特征、空间相关特征以及多尺度特征这3个方面。 (1)物体层面特征用来描述细胞、细胞核、腺体等结构的物体性特征,关注于物体大小、形状、纹理、染色细节这几个方面; (2)空间相关特征通常用来描述一个细胞集群诸如密度、分布、连通性等信息,利用这些特征可以给不同的组织结构建模; (3)多尺度特征旨在描述多尺度下不同的图像特征。由低到高的不同比例尺度能够表达从笼统到细节的图像特征。特征的提取可以分为人工设计特征与自动学习特征。人工设计特征包括灰度直方图、形状特征、纹理结构特征以及细胞与周围组织的关系等,传统机器学习算法通常需要人工特征作为基础。自动学习特征是指使用深度学习等算法自动学习图像的特征表达,通过组合低层特征形成更加抽象的高层特征(或属性类别)。有研究证实,自动学习的特征比人工设计的特征表达效果更好,更适合于病理切片分析。深度学习是一种自动特征提取算法,能够将病理切片图像转化为可发掘的数据信息,从中提取并分析大量高级、定量的病理学特征,然后予以量化,在大数据处理方面显得更具优势。 2检测和分割: 细胞或组织结构特征在细胞病理学和组织病理学中扮演着重要的角色。在某些疾病的诊断中,只有在细胞正确检测和分割的基础上,才能结合病理学知识提取有效反映切片信息的特征参数,进而做出正确的病理诊断。因此,对基于不同人工智能算法的病理图像分析工作,有很大一部分致力于自动检测细胞和组织结构,并且将这些结构分割出来。腺体是形状结构不规则的团状体,并且其特征受到病理切片的厚度、切割均匀度、杂质的存在、染色深浅以及数字图像的噪声等因素造成的切片图像异质性的影响,是此类组织结构分割的难点所在。传统机器学习算法的特征展示能力有限,导致分割效果不够理想。而深度学习的优势在于自动提取图像特征,对病理切片的异质性和噪声有更强的去除能力。在腺体分割中,深度学习有以下应用:先使用卷积神经网络对图块做有无腺体的分类,随后在分类基础上,再使用分割算法分割腺体个体;也有算法直接使用"端到端"的深度神经网络完成腺体的分割。随着标记数据集在数量上不断增多、在质量上不断提高以及自动分割和检测算法逐渐优化,病理切片的自动分割和检测将在一定程度上赶超人工结果,节省人力物力并提高医师工作效率。 3分类和分级: 病理分类和病理分级任务是病理切片分析中重要任务之一。目前该方面的算法主要有支持向量机(SVM)、AdaBoost和深度卷积神经网络等。SVM作为广泛使用的分类器,能够通过映射在高维特征空间中实现分类。 在已有的研究中有如下工作:区分结肠是否癌变、脑膜瘤的分型、前列腺癌的分级等。AdaBoost算法通过结合多个弱分类器构成强分类器实现病理切片分类。目前的研究有:前列腺癌的分类和分级、红斑鳞屑病的分类、乳腺癌的分类等。在特征提取方面,上述SVM以及AdaBoost算法都需要人工提取特征为前提,作为分类器的输入,而人工提取特征的质量将直接影响分类结果。随着深度卷积神经网络的引入,算法可以绕过繁琐的特征设计过程,直接将图像作为算法的输入。深度卷积神经网络能够自动进行特征学习和癌症分类任务,直接输出组织分类和癌症分级结果,有效提高了准确率。在乳腺癌、脑瘤、前列腺癌等分类分级问题上都达到了90.0%左右的准确率。 值得一提的是目前机器学习尤其是深度学习在前列腺癌的Gleason分级工作中应用已较为成熟,人工智能在该领域很有可能取得实用性的突破。 展望 综上所述,深度学习等人工智能算法大大推动了病理图像自动诊断的发展,目前已经有许多上述工作都已经达到了临床应用的水平,例如宫颈细胞学的计算机辅助诊断已使用多年,但依然还有提升的空间。皮肤癌以及前列腺癌的诊断,其效果也近乎于病理医师水平。 然而计算机辅助诊断现阶段大多都未能真正走出实验室进入临床应用。由于医疗数据的限制以及临床高准确率的要求,病理狗依然存在一些局限性。计算机辅助病理医师诊断依然是现阶段主流趋势。大量的研究证明,制造出一个可以临床使用的产品需要多学科科学家的通力合作,没有病理学家的深度参与不可能有真正实用的病理狗出现。人工智能与人类智慧的结合将使得临床诊疗更具可靠性与实用性。 以深度学习为代表的人工智能在一定程度上减少了病理医师经验性误判导致的误诊情况,提高了工作效率。结合强大的客观分析能力,计算机还能发现人眼不易察觉的细节,学习到病理切片分子层面上的特征,从而不断完善病理医师和数字病理诊断的知识体系。 杭州健澜科技有限公司人工智能不仅用于病理形态数据的分析,还可以整合免疫组织化学、分子检测数据和临床信息,得出一个整合相关信息的最后病理诊断报告,为患者提供预后信息和精准的药物治疗指导。医学结合人工智能必将提高诊断的精准水平,造福病患。