基于條件生成對抗網絡的三維肝臟及腫瘤區域自動分割_《生物醫學工程學雜志》

作者：

張澤林 , 李寶明 ,  徐軍

南京信息工程大學江蘇省大數據分析技術重點實驗室（南京 210044）;

關鍵詞：

肝臟和腫瘤區域三維自動分割條件生成對抗網絡深度學習計算機斷層掃描成像

DOI：

10.7507/1001-5515.201912077

視頻：

導出 下載 收藏 掃碼 引用

摘要 全文 圖表 視頻 參考文獻 施引文獻 補充材料

肝臟計算機斷層掃描成像（CT）的三維（3D）肝臟和腫瘤分割對于輔助醫生的診斷及預后具有非常重要的臨床價值。為了準確快速地分割肝臟及腫瘤區域，本文提出了一種基于條件生成對抗網絡（cGAN）的腫瘤 3D 條件生成對抗分割網絡（T3scGAN），同時采用了一個由粗到細的 3D 自動分割框架對肝臟及腫瘤區域實施精準分割。本文采用 2017 年肝臟和腫瘤分割挑戰賽（LiTS）公開數據集中的 130 個病例進行訓練、驗證和測試 T3scGAN 模型。最終 3D 肝臟區域分割的驗證集和測試集的平均戴斯（Dice）系數分別為 0.963 和 0.961，而 3D 腫瘤區域分割的驗證集和測試集的平均 Dice 系數分別為 0.819 和 0.796。實驗結果表明，提出的 T3scGAN 模型能夠有效地分割 3D 肝臟及其腫瘤區域，因此能夠更好地輔助醫生進行肝臟腫瘤的精準診斷和治療。

引用本文： 張澤林, 李寶明, 徐軍. 基于條件生成對抗網絡的三維肝臟及腫瘤區域自動分割. 生物醫學工程學雜志, 2021, 38(1): 80-88. doi: 10.7507/1001-5515.201912077 復制

引言

肝臟是承擔人體代謝功能的重要器官，肝臟一旦出現惡性腫瘤病變將會嚴重威脅人體生命健康。計算機斷層掃描成像（computed tomography，CT）是目前在肝臟病變診斷中普遍采用的常規診斷方式。CT 圖像可以反映出肝臟腫瘤的形態、數目、部位、邊界等信息，因此基于 CT 影像技術對肝臟腫瘤區域實施有效的分割具有重要的臨床價值。但是由于 CT 圖像中肝臟與周邊臟器的灰度值非常接近，且不同患者個體差異大等原因，導致肝臟與肝臟腫瘤的三維（three dimensional，3D）分割非常困難。傳統的肝臟分割方法，有利用形狀先驗、灰度分布以及邊界和區域信息來描述肝臟特征并劃定其邊界的統計變形模型，也有基于紋理和灰度等級的方法。這些分割方法的效率很低，魯棒性比較差，而且需要根據經驗調節大量的參數。例如，Stawiaski 等^[1]使用最小曲面和馬爾科夫隨機場對肝臟腫瘤進行分割。Smeets 等^[2]提出了一種基于水平集的半自動分割方法，并使用該方法對 CT 影像中的肝臟腫瘤及肝臟轉移區域進行分割。Li 等^[3]提出了一種新的統一水平集模型，該模型通過整合圖像的梯度、圖像的區域競爭及先驗信息對 CT 圖像中的肝臟腫瘤進行分割。Li 等^[4]提出了一種水平集模型，該模型將似然能量和邊緣能量結合在一起對 CT 圖像中的肝臟腫瘤區域進行分割。Zhang 等^[5]提出了一種交互式的半自動分割方法來分割 CT 圖像中的肝臟及腫瘤區域，該方法首先對輸入的 CT 圖像進行預處理，粗略地分割出肝臟區域，然后在肝臟腫瘤區域設置一些種子點，最后用這些種子點位置的灰度值訓練一個支持向量機（support vector machine，SVM）^[6]，并用一些形態學的后處理方式對 SVM 的分類結果粗略地勾畫出肝臟腫瘤區域的邊界。近年來，隨著深度學習技術的發展，研究人員開發了一系列基于深度學習的分割算法來分割肝臟及腫瘤區域。例如，Li^[7]提出了一種卷積分類網絡模型，該模型對二維（two dimensional，2D）CT 圖像中 17 × 17 大小的圖像塊進行逐塊預測，判斷該圖像塊究竟為病變區域還是其他區域，最終可以分割出肝臟腫瘤。Li 等^[8]提出了一種混合密集連接 U 型網絡（hybrid densely connected Unet，H-DenseUNet）分割模型，該模型先對肝臟 2D CT 圖像中的肝臟及腫瘤區域進行分割，然后將學習到的 2D 圖像高維特征用一個 3D 的卷積網絡進行融合，最終得到肝臟和腫瘤的 3D 分割結果。Bi 等^[9]提出了一種基于卷積殘差網絡（residual network，Resnet）^[10]的多尺度模型，該模型可以在多個尺度上對 CT 圖像中的肝臟腫瘤進行識別，從而提高了識別的精度。Gruber 等^[11]比較研究了兩種肝臟腫瘤分割方案，第一種是直接采用了 1 個 2D U 型網絡（Unet）^[12]對肝臟腫瘤進行端到端分割；第二種方案則使用了 2 個 2D Unet，其中第一個 Unet 用于分割肝臟區域，然后把分割的肝臟感興趣區域（region of interest，ROI）乘以輸入 CT 圖像提取肝臟區域，之后用提取的肝臟區域圖像又訓練了一個 2D Unet 對肝臟腫瘤進行 2D 分割。通過對比發現，級聯的分割網絡可以達到更好的肝臟腫瘤分割性能。Dey 等^[13]設計了一種級聯的肝臟腫瘤分割模型，該模型先用一個 2D 深度卷積分割網絡分割出肝臟及較大的腫瘤區域，然后再用一個 3D 深度卷積分割網絡檢測分割出小腫瘤區域，從而提高了 CT 圖像中肝臟腫瘤的分割準確率。Deng 等^[14]先用 1 個 3D 密集連接卷積分類網絡檢測肝臟腫瘤的邊緣，然后用 3D 密集連接卷積分類網絡輸出的腫瘤邊緣概率動態調節水平集分割參數，同時根據分類網絡檢測的腫瘤區域位置初始化水平集腫瘤分割局部窗口的大小，最后分割出肝臟腫瘤；Lu 等^[15]先構建了 1 個 3D 卷積網絡對肝臟區域進行分割并輸出概率圖，然后基于概率圖用圖切法得到最終的肝臟分割結果。

與傳統的肝臟腫瘤分割方法相比，基于深度學習的分割方法在分割效率和準確率上都有很大提升，但是也普遍存在以下幾個問題：① 直接進行 3D 分割的模型計算量太大，因此大部分 3D 分割模型都是基于將 2D 分割結果拼接成 3D 的分割結果。基于 2D 分割結果再拼接成 3D 分割結果的分割方法雖然可以減少模型的運算量，但是分割的結果卻不如直接以 3D 分割模型進行分割的結果。因為 2D 分割模型的優化目標是 ROI 邊界曲線，而 3D 分割模型可以優化 ROI 的整個曲面；② 需要大量的預處理和后處理操作。在肝臟腫瘤的 2D 切面中，由于肝臟腫瘤的大小、位置、紋理等信息在不同的病例中差異較大，如果使用端到端的網絡很難直接定位到腫瘤區域；③ 需要很多標記數據進行模型的訓練。因為腫瘤的分割檢測比較困難，提升模型的性能就需要增加模型的復雜度和可訓練參數量，如果訓練集的數量過少就會導致模型分割性能不足或者過擬合。

本文基于條件對抗生成網絡（conditional generative adversarial networks，cGAN）^[16]構建了一個新型的腫瘤 3D 分割條件對抗生成網絡（tumor 3D segmentation conditional generative adversarial networks，T3scGAN）作為主要的分割模型對 3D 肝臟區域和 3D 肝臟腫瘤區域進行分割，同時使用了一個由粗到細的 3D 分割框架來精確地分割肝臟腫瘤，從而輔助醫生實現對肝臟病變及肝臟腫瘤的快速定位與識別，達到精準診療的目的。

1 由粗到細的肝臟腫瘤分割框架

在 CT 影像中，肝臟腫瘤的全自動精準分割對分割算法具有較大的挑戰性，主要原因是不同病例的肝臟腫瘤之間位置、形態和紋理特征差異性很大。因此，本文采用了一個由粗到細的 3D 分割框架來精確分割肝臟腫瘤。分割框架流程圖如圖 1 所示，當輸入一個 3D 的 CT 測試病例時，整個分割框架首先進行自動數據預處理，然后用訓練好的肝臟分割 T3scGAN 模型對肝臟區域進行自動 3D 分割，得到肝臟區域 3D 分割結果。之后基于肝臟分割的結果結合預處理后的 CT 圖像進行自動肝臟 3D ROI 提取，最后用訓練好的肝臟腫瘤分割 T3scGAN 模型對肝臟腫瘤區域進行自動 3D 分割。

圖1 由粗到細的肝臟腫瘤 3D 分割框架 Figure1. 3D coarse-to-fine liver tumors segmentation framework

圖選項

模型	參數量/k
T3scGAN	肝臟區域：71.5	腫瘤區域：279.5
3D Unet	16 300
Vnet	19 400

分割區域	測試樣本數量/例	平均 Dice 系數
分割區域	測試樣本數量/例	T3scGAN	3D Unet	Vnet
肝臟 3D 分割	20	0.961	0.849	0.908
肝臟腫瘤 3D 分割	12	0.796	0.595	0.616

1.	Stawiaski J, Decenciere E, Bidault F. Interactive liver tumor segmentation using graph-cuts and watershed//11th International Conference on Medical Image Computing and Computer Assisted Intervention (MICCAI 2008), New York: Springer, 2008.
2.	Smeets D, Loeckx D, Stijnen B, et al. Semi-automatic level set segmentation of liver tumors combining a spiral-scanning technique with supervised fuzzy pixel classification. Med Image Anal, 2010, 14(1): 13-20.
3.	Li Bingnan, Chui C K, Chang S, et al. A new unified level set method for semi-automatic liver tumor segmentation on contrast-enhanced CT images. Expert Syst Appl, 2012, 39(10): 9661-9668.
4.	Li C, Wang X, Eberl S, et al. A likelihood and local constraint level set model for liver tumor segmentation from CT volumes. IEEE Trans Biomed Eng, 2013, 60(10): 2967-2977.
5.	Zhang Xing, Tian Jie, Xiang Dehui, et al. Interactive liver tumor segmentation from CT scans using support vector classification with watershed//2011 Annual International Conference of the IEEE Engineering in Medicine and Biology Society, Boston: IEEE, 2011: 6005-6008.
6.	Evgeniou T, Pontil M. Support vector machines: theory and applications//Proceedings of the 1999 Advanced Course on Artificial Intelligence, Berlin: Springer, 1999: 249-257.
7.	Li W. Automatic segmentation of liver tumor in CT images with deep convolutional neural networks. Journal of Computer and Communications, 2015, 3(11): 146.
8.	Li X, Chen H, Qi X, et al. H-DenseUNet: hybrid densely connected UNet for liver and tumor segmentation from CT volumes. IEEE Trans Med Imaging, 2018, 37(12): 2663-2674.
9.	Bi L, Kim J, Kumar A, et al. Automatic liver lesion detection using cascaded deep residual networks, arXiv preprint, 2017. arXiv: 1704.02703.
10.	He Kaiming, Zhang Xiangyu, Ren Shaoqing, et al. Deep residual learning for image recognition//2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Las Vegas: IEEE, 2016: 770-778.
11.	Gruber N, Antholzer S, Jaschke W, et al. A joint deep learning approach for automated liver and tumor segmentation, arXiv preprint, 2019. arXiv: 1902.07971.
12.	Ronneberger O, Fischer P, Brox T. U-net: Convolutional networks for biomedical image segmentation//International Conference on Medical image computing and computer-assisted intervention, Munich: Springer, 2015: 234-241.
13.	Dey R, Hong Y. Hybrid cascaded neural network for liver lesion segmentation, arXiv preprint, 2019. arXiv: 1909.04797.
14.	Deng Z, Guo Q, Zhu Z. Dynamic regulation of level set parameters using 3D convolutional neural network for liver tumor segmentation. J Healthc Eng, 2019: 4321645.
15.	Lu Fang, Wu Fa, Hu Peijun, et al. Automatic 3D liver location and segmentation via convolutional neural network and graph cut. Int J Comput Assist Radiol Surg, 2017, 12(2): 171-182.
16.	Goodfellow I, Pouget-Abadie J, Mirza M, et al. Generative adversarial nets//Advances in neural information processing systems, Montreal: NIPS, 2014: 2672-2680.
17.	Gauthier J. Conditional generative adversarial nets for convolutional face generation. Class Project for Stanford CS231N: Convolutional Neural Networks for Visual Recognition, Winter Semester, 2014, 2014(5): 2.
18.	Isola P, Zhu Junyan, Zhou Tinghui, et al. Image-to-Image translation with conditional adversarial networks//2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Hawaii: IEEE, 2017: 5967-5976.
19.	Long J, Shelhamer E, Darrell T. Fully convolutional networks for semantic segmentation//2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Boston: IEEE, 2015: 3431-3440.
20.	?i?ek ?, Abdulkadir A, Lienkamp S S, et al. 3D U-Net: learning dense volumetric segmentation from sparse annotation//International Conference on Medical Image Computing and Computer-Assisted Intervention, Greece: Springer, 2016: 424-432.
21.	Zhou Zongwei, Siddiquee M M R, Tajbakhsh N, et al. Unet++: a nested u-net architecture for medical image segmentation// Stoyanov D. et al. Deep Learning in Medical Image Analysis and Multimodal Learning for Clinical Decision Support (DLMIA). Springer, 2018: 3-11.
22.	Ioffe S, Szegedy C. Batch normalization: accelerating deep network training by reducing internal covariate shift, arXiv preprint, 2015. arXiv: 1502.03167.
23.	Wu Y, He K. Group normalization//Proceedings of the European Conference on Computer Vision(ECCV), Munich: IEEE, 2018: 3-19.
24.	Moore R C, DeNero J. L1 and L2 regularization for multiclass hinge loss models//Symposium on Machine Learning in Speech and Language Processing, Bellevue: ISCA, 2013. CiteSeerX. psu: 10.1. 1.296. 5923.
25.	Tustison N J, Gee J C. Introducing dice, jaccard, and other label overlap measures to ITK, Insight J, 2009. http://hdl.handle.net/10380/3141.
26.	Yushkevich P A, GAO Yang, Gerig G. ITK-SNAP: an interactive tool for semi-automatic segmentation of multi-modality biomedical images//2016 38th Annual International Conference of the IEEE Engineering in Medicine and Biology Society (EMBC), Florida: IEEE, 2016: 3342-3345.
27.	Yushkevich P A, Gerig G. ITK-SNAP: an intractive medical image segmentation tool to meet the need for expert-guided segmentation of complex medical images. IEEE Pulse, 2017, 8(4): 54-57.
28.	Kingma D P, Ba J. Adam: a method for stochastic optimization, arXiv preprint, 2014. arXiv: 1412.6980.
29.	LeCun Y, Bengio Y, Hinton G. Deep learning. nature, 2015, 521(7553): 436-444.
30.	Milletari F, Navab N, Ahmadi S A. V-net: fully convolutional neural networks for volumetric medical image segmentation//2016 Fourth International Conference on 3D Vision (3DV), Stanford: IEEE, 2016: 565-571.

《生物醫學工程學雜志》

基于條件生成對抗網絡的三維肝臟及腫瘤區域自動分割

摘要 全文 圖表 視頻 參考文獻 施引文獻 補充材料

引言

1 由粗到細的肝臟腫瘤分割框架

1.1 數據預處理

1.2 T3scGAN

1.2.1 生成器結構

1.2.2 判別器結構

1.2.3 損失函數

2 實驗及評估

2.1 實驗數據

2.2 肝臟及腫瘤 3D 分割實驗評估

3 總結與討論

引言

1 由粗到細的肝臟腫瘤分割框架

1.1 數據預處理

1.2 T3scGAN

1.2.1 生成器結構

1.2.2 判別器結構

1.2.3 損失函數

2 實驗及評估

2.1 實驗數據

2.2 肝臟及腫瘤 3D 分割實驗評估

3 總結與討論

上一篇

下一篇

Format

Content

摘要全文圖表視頻參考文獻施引文獻補充材料