打开主菜单

求真百科

病灶区域自动分割系统

来自 搜狐网 的图片

病灶区域自动分割系统基于UNet的COVID-19病灶区域自动分割系统,新型冠状病毒肺炎(novel coronavirus pneumonia,COVID-19)是一种由严重急性呼吸综合征冠状病毒(SARS-CoV-2)引起的疾病,具有较高的传染性和致病性,近年来已成为了一种世界范围内流行的疾病。截至2021年第18周,全球约有1.59亿例确诊病例,超过329.56万例死亡病例。从中可以发现,新型冠状病毒肺炎令人震惊的传染率给我们的社会和医疗带来了沉重的负担,正严重危害人类的生命健康

目录

简介

新冠肺炎的早期阶段,对其准确的检测是至关重要的。目前已经提出了多种方法用于诊断新冠肺炎,包括医学成像技术[1]、血液检测和聚合酶链反应。根据世界卫生组织的规定,所有冠状疾病的诊断都必须通过逆转录聚合酶链式反应(RT-PCR)确认。然而,使用RT-PCR进行检测非常耗时,这将很难及时的发现COVID-19的携带者。因此,首先对新冠肺炎进行初步的医学成像检测,然后进行RT-PCR检测的方法,可以帮助医生做出更加快速准确的诊断。X射线和计算机断层扫描成像技术(CT)被广泛的应用于COVID-19快速而准确的早期诊断,其中CT成像因为更好的通用性以及可以显示肺部的三维信息,是COVID-19早期筛查的首选方法。若能实现对新冠肺炎的自动识别,不但可以加快对其诊断,还将加快治疗前后的检查对比,提升治疗效率。

通常来说,COVID-19 患者肺部存在典型的影像学特征,包括毛玻璃影结节(ground-glass opacities,GGO)、肺硬化、肺纤维化和多发性病变等。然而基于CT 图像的人工分析和诊断过程对专业知识依赖性很高,对CT 图像特征的分析比较耗时,早期难以观察到隐匿病变,且与其他病毒性肺炎、细菌性肺炎难以区分。近年来,随着人工智能[2](Artificial Intelligence, AI)的发展,可将视觉影像信息转化为深层次特征信息,且这些信息是可量化的,其有助于减少人工操作、提高精准定量分析的效率。

因此,为了避免当下过度依赖核酸检测进行COVID-19 诊断的局限性,许多学者设计了基于深度学习的COVID-19分割诊断模型。这些模型不仅能够实现诊断方式的多元化,而且使得诊断过程更加快速高效。更重要的是,其准确率可以媲美核酸检测理想情况下高达95%以上的准确率。

1.1 国内外的研究现状

到目前为止,已经有几个研究集中在基于深度学习的新冠肺炎诊断模型上。一些研究表明,新冠肺炎可以很好地与其他类型的肺炎区分开来。与分类模型相比,CT图像样本的标注对于完整的肺部和COVID-19感染区域的分割模型的训练具有重要意义。Shane等人[16]采用人在环策略对其训练样本的标注进行迭代更新。Liu等人使用生成性对抗网络(GAN)合成了他们的部分训练和测试数据集,并在分割感染区域时取得了0.706的平均骰子相似系数(m-Dice),在用来衡量受疾病影响的肺实质的总体积的皮尔逊相关系数达到了0.961。Ma等人标注了20组新冠肺炎CT图像,并利用肺癌等先前可用的肺部数据集来辅助分割。Yan等人邀请了一个由六名具有深厚放射学背景和熟练的注释技能的专家组成的团队,来标记完好的肺部和新冠肺炎感染区域的区域和边界。他们在感染区域分割中引入了特征变异模块,能够更好地区分病变区域和肺部。此外,在特征提取阶段,他们还使用了空洞空间池化金字塔结构(Atrous spatial pyramid pooling,ASPP)[20]。在他们的研究中,对全肺和感染区域的最佳m-DICE分别为0.987和0.726。这些研究受累于标记训练样本需求量大,以及m-Dice测量的相对较低的准确性。

1.2 研究意义

由于肺部有感染区域,其病变区域的Hu值很难与健康组织区分开来,对于专业放射科医生或内科医生来说,将这些病变区域与健康的肺实质分开是非常耗费时间与精力的。此外,一组CT图像通常由数十张或数百张肺部图像组成,这使得几乎不可能人工对图像上的病变区域进行定量分析。寻找一种从胸部CT图像中自动判断新冠肺炎感染区域的方法,可以快速准确的进行早期诊断,同时也可以对患者的患病的严重程度进行定量分析。

2. 项目研究目标及主要内容

2.1 项目研究目标

本项目主要研究基于深度学习的CT图像COVID-19病灶区域自动分割模型,采用以U-Net模型为主体的Auto-Encoder结构框架,在广泛收集到的医学数据的基础上,通过充分的模型训练,实现对CT图像COVID-19病灶区域的自动分割。以达到专家标注水平为目的,从而辅助临床医生完成繁琐的读片工作。

2.2 研究内容

我们以UNet架构为基础,并设计了一些新的模块作为改进点。提出了全新的改进的U型网络模型,我们将通过大量的实验证明模型的改进的有效性。

二、技术方案与指标

3. 项目创新特色概述

3.1选择U-Net作为基线网络(baseline)

传统的CNN网络通过多层卷积以及全连接层解决的是分类问题,FCN[21]首次提出来了一种编解码器结构网络,实现了像素级别的分类问题,是分割网络的经典之作。U-Net在FCN的基础上进行改进,其主要创新点是跳跃连接部分,其结构图如图1所示。这种跳跃连接结构通过将来自解码器部分的高级语义信息和来自解码器部分的低级语义信息结合的方法,使得模型不仅可以学习到各像素点的位置信息,而且提升了模型在上采样过程中对位置信息的还原能力。众所周知,医学影像通常具有如下特点:1)图像分辨率、复杂度低,语义信息较为简单,结构相对固定;2)数据量少,较复杂的网络反而容易导致模型的过拟合;3)3D数据、多模态,图像的层与层之间或不同模态之间往往存在着一定的关联性。U-Net网络对医学图像的这些特点具有良好的适应性,因此在医学图像中具有很好的分割表现。同领域中,有许多网络均选择U-Net作为baseline。

U-Net包括左边的收缩路径和右边的扩张路径。收缩路径,即编码器部分,由几个3×3卷积、ReLU激活层和步长为2的2×2最大池化层结构组成,特别需要注意的是,下采样的每一步特征通道数都增加一倍。扩张路径,即解码器部分,每一步包括2×2反卷积上采样和3×3卷积,且每进行一次上采样,通道数减少一半,并且扩张路径的特征图还会与相应的收缩路径中经过剪切过的特征图融合之后,再经过两个3×3卷积层和ReLU激活层。在扩张路径的最后一层,使用了一个1×1卷积把最后的64通道特征图映射到对应的种类数。

3.2使用Efficient替换主干网络

EfficientNet[25]是由谷歌在2019年提出的模型,是目前世界上最先进的神经网络算法之一。该算法具有复杂网络的量化调整能力,通过对网络深度(depth),宽度(width)和输入图片分辨率(resolution)的综合调整,获得对特定需求的最优网络参数,使网络同时具备了网络大小与识别准确率的双重优势。

参考文献