病灶區域自動分割系統
病灶區域自動分割系統基於UNet的COVID-19病灶區域自動分割系統,新型冠狀病毒肺炎(novel coronavirus pneumonia,COVID-19)是一種由嚴重急性呼吸綜合徵冠狀病毒(SARS-CoV-2)引起的疾病,具有較高的傳染性和致病性,近年來已成為了一種世界範圍內流行的疾病。截至2021年第18周,全球約有1.59億例確診病例,超過329.56萬例死亡病例。從中可以發現,新型冠狀病毒肺炎令人震驚的傳染率給我們的社會和醫療帶來了沉重的負擔,正嚴重危害人類的生命健康。
目錄
簡介
在新冠肺炎的早期階段,對其準確的檢測是至關重要的。目前已經提出了多種方法用於診斷新冠肺炎,包括醫學成像技術[1]、血液檢測和聚合酶鏈反應。根據世界衛生組織的規定,所有冠狀疾病的診斷都必須通過逆轉錄聚合酶鏈式反應(RT-PCR)確認。然而,使用RT-PCR進行檢測非常耗時,這將很難及時的發現COVID-19的攜帶者。因此,首先對新冠肺炎進行初步的醫學成像檢測,然後進行RT-PCR檢測的方法,可以幫助醫生做出更加快速準確的診斷。X射線和計算機斷層掃描成像技術(CT)被廣泛的應用於COVID-19快速而準確的早期診斷,其中CT成像因為更好的通用性以及可以顯示肺部的三維信息,是COVID-19早期篩查的首選方法。若能實現對新冠肺炎的自動識別,不但可以加快對其診斷,還將加快治療前後的檢查對比,提升治療效率。
通常來說,COVID-19 患者肺部存在典型的影像學特徵,包括毛玻璃影結節(ground-glass opacities,GGO)、肺硬化、肺纖維化和多發性病變等。然而基於CT 圖像的人工分析和診斷過程對專業知識依賴性很高,對CT 圖像特徵的分析比較耗時,早期難以觀察到隱匿病變,且與其他病毒性肺炎、細菌性肺炎難以區分。近年來,隨着人工智能[2](Artificial Intelligence, AI)的發展,可將視覺影像信息轉化為深層次特徵信息,且這些信息是可量化的,其有助於減少人工操作、提高精準定量分析的效率。
因此,為了避免當下過度依賴核酸檢測進行COVID-19 診斷的局限性,許多學者設計了基於深度學習的COVID-19分割診斷模型。這些模型不僅能夠實現診斷方式的多元化,而且使得診斷過程更加快速高效。更重要的是,其準確率可以媲美核酸檢測理想情況下高達95%以上的準確率。
1.1 國內外的研究現狀
到目前為止,已經有幾個研究集中在基於深度學習的新冠肺炎診斷模型上。一些研究表明,新冠肺炎可以很好地與其他類型的肺炎區分開來。與分類模型相比,CT圖像樣本的標註對於完整的肺部和COVID-19感染區域的分割模型的訓練具有重要意義。Shane等人[16]採用人在環策略對其訓練樣本的標註進行迭代更新。Liu等人使用生成性對抗網絡(GAN)合成了他們的部分訓練和測試數據集,並在分割感染區域時取得了0.706的平均骰子相似係數(m-Dice),在用來衡量受疾病影響的肺實質的總體積的皮爾遜相關係數達到了0.961。Ma等人標註了20組新冠肺炎CT圖像,並利用肺癌等先前可用的肺部數據集來輔助分割。Yan等人邀請了一個由六名具有深厚放射學背景和熟練的注釋技能的專家組成的團隊,來標記完好的肺部和新冠肺炎感染區域的區域和邊界。他們在感染區域分割中引入了特徵變異模塊,能夠更好地區分病變區域和肺部。此外,在特徵提取階段,他們還使用了空洞空間池化金字塔結構(Atrous spatial pyramid pooling,ASPP)[20]。在他們的研究中,對全肺和感染區域的最佳m-DICE分別為0.987和0.726。這些研究受累於標記訓練樣本需求量大,以及m-Dice測量的相對較低的準確性。
1.2 研究意義
由於肺部有感染區域,其病變區域的Hu值很難與健康組織區分開來,對於專業放射科醫生或內科醫生來說,將這些病變區域與健康的肺實質分開是非常耗費時間與精力的。此外,一組CT圖像通常由數十張或數百張肺部圖像組成,這使得幾乎不可能人工對圖像上的病變區域進行定量分析。尋找一種從胸部CT圖像中自動判斷新冠肺炎感染區域的方法,可以快速準確的進行早期診斷,同時也可以對患者的患病的嚴重程度進行定量分析。
2. 項目研究目標及主要內容
2.1 項目研究目標
本項目主要研究基於深度學習的CT圖像COVID-19病灶區域自動分割模型,採用以U-Net模型為主體的Auto-Encoder結構框架,在廣泛收集到的醫學數據的基礎上,通過充分的模型訓練,實現對CT圖像COVID-19病灶區域的自動分割。以達到專家標註水平為目的,從而輔助臨床醫生完成繁瑣的讀片工作。
2.2 研究內容
我們以UNet架構為基礎,並設計了一些新的模塊作為改進點。提出了全新的改進的U型網絡模型,我們將通過大量的實驗證明模型的改進的有效性。
二、技術方案與指標
3. 項目創新特色概述
3.1選擇U-Net作為基線網絡(baseline)
傳統的CNN網絡通過多層卷積以及全連接層解決的是分類問題,FCN[21]首次提出來了一種編解碼器結構網絡,實現了像素級別的分類問題,是分割網絡的經典之作。U-Net在FCN的基礎上進行改進,其主要創新點是跳躍連接部分,其結構圖如圖1所示。這種跳躍連接結構通過將來自解碼器部分的高級語義信息和來自解碼器部分的低級語義信息結合的方法,使得模型不僅可以學習到各像素點的位置信息,而且提升了模型在上採樣過程中對位置信息的還原能力。眾所周知,醫學影像通常具有如下特點:1)圖像分辨率、複雜度低,語義信息較為簡單,結構相對固定;2)數據量少,較複雜的網絡反而容易導致模型的過擬合;3)3D數據、多模態,圖像的層與層之間或不同模態之間往往存在着一定的關聯性。U-Net網絡對醫學圖像的這些特點具有良好的適應性,因此在醫學圖像中具有很好的分割表現。同領域中,有許多網絡均選擇U-Net作為baseline。
U-Net包括左邊的收縮路徑和右邊的擴張路徑。收縮路徑,即編碼器部分,由幾個3×3卷積、ReLU激活層和步長為2的2×2最大池化層結構組成,特別需要注意的是,下採樣的每一步特徵通道數都增加一倍。擴張路徑,即解碼器部分,每一步包括2×2反卷積上採樣和3×3卷積,且每進行一次上採樣,通道數減少一半,並且擴張路徑的特徵圖還會與相應的收縮路徑中經過剪切過的特徵圖融合之後,再經過兩個3×3卷積層和ReLU激活層。在擴張路徑的最後一層,使用了一個1×1卷積把最後的64通道特徵圖映射到對應的種類數。
3.2使用Efficient替換主幹網絡
EfficientNet[25]是由谷歌在2019年提出的模型,是目前世界上最先進的神經網絡算法之一。該算法具有複雜網絡的量化調整能力,通過對網絡深度(depth),寬度(width)和輸入圖片分辨率(resolution)的綜合調整,獲得對特定需求的最優網絡參數,使網絡同時具備了網絡大小與識別準確率的雙重優勢。
參考文獻
- ↑ 【解析】核醫學成像技術有多重要?,搜狐,2018-02-12
- ↑ 人工智能是什麼?人工智能的概念簡介 ,搜狐,2018-08-01