基于協同學習特征融合和轉換器的乳腺癌病灶分割方法_《生物醫學工程學雜志》

作者：

翟悅淞 ¹ ,  陳智麗 ¹ ,  邵丹 ²

1. 沈陽建筑大學計算機科學與工程學院（沈陽 110168）;
2. 廣東省人民醫院廣東省醫學科學院核醫學科（廣州 519041）;

關鍵詞：

正電子發射斷層掃描和計算機斷層掃描乳腺癌病灶分割雙路U型網絡協同學習特征融合轉換器

DOI：

10.7507/1001-5515.202306063

視頻：

導出 下載 收藏 掃碼 引用

摘要 全文 圖表 視頻 參考文獻 施引文獻 補充材料

結合正電子發射斷層掃描（PET）和計算機斷層掃描（CT）的PET/CT成像技術是目前較先進的影像學檢查手段，主要用于腫瘤篩查、良惡性鑒別診斷和分期分級。本文提出了一種基于PET/CT雙模態圖像的乳腺癌病灶分割方法，設計了一種雙路U型網絡框架，主要包括編碼器模塊、特征融合模塊和解碼器模塊三個組成部分。其中，編碼器模塊使用傳統的卷積進行單模態圖像特征提取；特征融合模塊采用協同學習特征融合技術，并使用轉換器（Transformer）提取融合圖的全局特征；解碼器模塊主要采用多層感知機以實現病灶分割。本文實驗使用實際臨床PET/CT數據評估算法的有效性，實驗結果表明乳腺癌病灶分割的精確率、召回率和準確率分別達到95.67%、97.58%和96.16%，均優于基線算法。研究結果證明了本文實驗設計的卷積與Transformer相結合的單、雙模態特征提取方式的合理性，為多模態醫學圖像分割或分類等任務的特征提取方法提供參考。

引用本文： 翟悅淞, 陳智麗, 邵丹. 基于協同學習特征融合和轉換器的乳腺癌病灶分割方法. 生物醫學工程學雜志, 2024, 41(2): 237-245. doi: 10.7507/1001-5515.202306063 復制

0 引言

乳腺癌發病率高，已嚴重威脅女性健康，根據2020年全球乳腺癌分析登記數據顯示，新發乳腺癌患者超過226萬人，死亡約68.5萬人，在所有癌癥患者中占比已高達11.7%^[1]。在我國，女性乳腺癌發病死亡人數每年持續上升，預計到2030年發病數和死亡數將分別增加36.27%和54.01%^[2-3]。盡管隨著醫療診斷與治療手段的不斷進步，我國乳腺癌患者生存率已有所提升，但每年依然有眾多患者深受乳腺癌折磨^[4]。

結合正電子發射斷層掃描（positron emission tomography，PET）和計算機斷層掃描（computed tomography，CT）的PET/CT技術，是一種解剖結構顯像和功能顯像結合的成像手段，其不僅可以顯示病變的形態學特征，還可以報告病變的代謝信息。醫生可根據PET/CT的結果調整乳腺癌患者的治療方案進而提高患者生存率^[5]。PET成像需要給患者注射用正電子核素標記的葡萄糖類似物作為示蹤劑，根據腫瘤的代謝特點，PET圖像會顯示出高代謝病變區域；但除腫瘤外，人體的高代謝器官也會大量吸收示蹤劑，從而造成病灶區分困難。此外，PET圖像分辨率較低，導致病灶邊界模糊，也會影響醫生的判斷^[6]。CT是一種具有高分辨率的結構成像，但由于CT圖像中各區域強度分布相似，難以區分病變組織與周圍正常軟組織。因此，結合PET功能代謝成像特點以及CT清晰的結構成像特點可以幫助醫生對病患作出準確的診斷^[7-8]。

為了更好地利用PET/CT技術幫助醫生診治病患以減少人工識別影像可能產生的誤差，目前已有大量研究將圖像分割技術用于醫學影像病灶分割任務。由于存在目標邊界模糊和易受噪聲干擾等局限，到目前為止，尚不存在一種普適完美的圖像分割方法。近年來，隨著圖形處理器（graphics processing unit，GPU）算力的增長以及數據集的完善，基于深度學習的語義分割算法飛速發展，圖像分割技術水平大幅提高，目標分割完整度和分割精度得到顯著提升。Cruz-Roa等^[9]使用卷積神經網絡（convolutional neural network，CNN）替代人工提取特征方法，使乳腺X線影像的病灶分類準確度明顯提高。趙旭^[10]采用全卷積網絡（fully convolutional network，FCN）對全視野的乳腺數據進行特征提取，減少了數據采樣對小腫塊檢測結果的影響，提高了檢測精確度。徐勝舟等^[11]設計的基于FCN遷移學習的乳腺腫塊分割方法進一步驗證了該算法的分割效果明顯優于傳統分割算法的結論。Al-antari等^[12]提出了一種深度網絡模型——全分辨率CNN，它對大數據量乳腺X線影像進行分割，結果表明該模型在腫塊分割方面優于傳統的深度學習方法，可用來協助放射科醫師診斷乳腺腫塊。Ronneberger等^[13]提出的U型網絡（U-Net），是使用FCN進行語義分割的主流算法之一，其設計的初衷是為了解決醫學圖像分割的問題，并在國際生物醫學圖像研討會（International Symposium on Biomedical Imaging，ISBI）細胞跟蹤挑戰賽中獲得多個第一名。之后，U-Net憑借其突出的分割效果而廣泛應用于語義分割領域。Chen等^[14]提出的深度試驗模型三加版本，作為該系列最后一版將原深度試驗第三版模型當作編碼器，再通過添加解碼器得到全新的模型，并將空間特征金字塔結構與編碼器、解碼器結構相結合實現多尺度分割。Zhuang^[15]提出了一種多路徑U-Net，以實現多模態數據的輸入，為多模態分割任務提供參考。Kumar等^[16]提出了一種多模態特征融合算法用于實時分割PET/CT影像中的肺部結構、胸腔縱膈以及腫瘤，結果顯示該算法最終戴斯（Dice）系數為0.82，真陽性率為0.84。Xiao等^[17]在U-Net中加入殘差結構，設計出殘差U-Net，用于視網膜血管分割任務。Guan等^[18]將密集連接加入到U-Net中，提出全連接密集U-Net，用于去除圖像中的偽影。Isensee等^[19]提出的精簡U-Net，不在U-Net基礎上添加新的結構，而是在激活函數、批量正則化、數據處理等技術層面中進行改進，在很多任務中取得了不錯的成績。Chen等^[20]將轉換器（Transformer）引入U-Net，提出了結合Transformer和U-Net的復合網絡（Transformer+U-Net，TransUNet），在多器官分割和心臟分割等醫學任務中表現出更好的分割效果。Jain等^[21]提出Transformer通用模型，這是第一個基于Transformer的多任務通用圖像分割框架，在全景、語義以及實例分割上的聯合訓練效果優于其他單獨訓練的模型。

在自然語言任務上取得了前所未有的成功后，Transformer已成功地應用于各種計算機視覺問題并取得了可觀的成果。隨著Transformer的廣泛應用，醫學影像領域也開始關注并逐步嘗試使用Transformer。與作用于局部感受野的CNN相比，Transformer的全局上下文建模能力對于醫學圖像的精準分割至關重要，因為通過構建空間像素之間的關系，可以對分布在大感受野上的器官進行有效的特征提取。近年來，在醫學影像界基于Transformer的技術快速發展，尤其是視覺Transformer，其在醫學圖像分割、檢測、分類、重建、合成、配準、臨床報告生成和其他很多任務中都取得了不錯的效果^[22]。

綜上，為解決乳腺癌病灶精準分割的問題，本文綜合考慮PET/CT雙模態影像的成像特點，利用雙模態數據的優勢，使用實際臨床PET/CT雙模態影像數據，參考Kumar等^[16]提出的協同學習（collaborative learning，Co-learning）特征融合方法，同時參考Xie等^[23]提出的Transformer分割模型，提出一種融合PET/CT雙模態影像特征的乳腺癌病灶分割方法。此方法在以CNN為特征提取核心的“編碼器?特征融合?解碼器”結構的基礎上引入了Transformer。其目的在于結合了CNN的局部特征提取能力和Transformer的全局特征提取能力，在保留單模態圖像病灶細節的同時獲取融合特征的全局信息，能夠更好地區分病灶與非病灶區域，解決單一使用CNN作為特征提取器所出現的感受野不足、全局特征關聯性差而導致的誤分割問題，進而提升乳腺癌病灶分割精度。

1 本文算法

1.1 網絡結構

本文采用編碼器、特征融合和解碼器的網絡結構，借鑒多路徑U-Net的網絡設計實現雙模態數據的輸入以及各自的特征提取功能^[15]，整體網絡結構如圖1所示。首先編碼器模塊分為兩個分支，其一是PET編碼器模塊分支，另一個為CT編碼器模塊分支，每個分支以四個編碼器塊（encoder blcok）作為單模態圖像特征提取器，圖1中分別為encoder block1～4。隨后每個encoder blcok提取的特征信息輸入到特征融合模塊進行雙模態特征信息融合；特征融合模塊由四個融合塊（fusion block）和四個Transformer塊（transformer block）組成，圖1中分別為fusion block1～4和transformer block1～4；特征融合模塊提取到的特征輸入到由多層感知機（multi-layer perceptron，MLP）、1 × 1卷積、歸一化指數函數（softmax）構成的解碼器模塊當中，實現從特征圖到預測圖的轉換并得到最終的分割預測結果。其中MLP實現上采樣（upsample）和特征圖組合功能，1 × 1卷積實現降通道數功能，softmax預測屬于病灶的概率。

圖1 本文基于Co-learning特征融合和Transformer的雙路U-Net網絡結構 Figure1. The dual-path U-Net network structure based on Co-learning feature fusion and transformer in this article

圖選項

五折交叉驗證	本文算法			基線算法
五折交叉驗證	Pre	Rec	Acc	Pre	Rec	Acc
第一折	0.956 7	0.975 8	0.961 6	0.934 9	0.963 6	0.949 8
第二折	0.959 0	0.976 6	0.968 0	0.948 6	0.966 1	0.957 7
第三折	0.942 2	0.954 9	0.944 1	0.921 3	0.943 9	0.933 3
第四折	0.956 3	0.972 7	0.969 9	0.938 5	0.964 6	0.952 0
第五折	0.952 1	0.961 8	0.962 3	0.936 1	0.955 6	0.946 3

模塊組合		評價指標
Transformer	MLP	Pre	Rec	Acc
—	—	0.934 9	0.963 6	0.949 8
—	√	0.920 3	0.948 6	0.935 2
√	—	0.931 0	0.959 6	0.945 9
√	√	0.956 7	0.975 8	0.961 6

算法	數據組成	Pre	Rec	Acc
U-Net	CT	0.865 6	0.765 6	0.795 4
	PET	0.847 5	0.820 0	0.743 3
	CT+PET	0.895 2	0.929 7	0.861 1
TransUNet	CT	0.915 6	0.856 2	0.821 9
	PET	0.881 9	0.873 2	0.856 8
	CT+PET	0.925 2	0.944 7	0.901 1
基線算法	CT+PET	0.934 9	0.963 6	0.949 8
本文算法	CT+PET	0.956 7	0.975 8	0.961 6

1.	Sung H, Ferlay J, Siegel R L, et al. Global Cancer Statistics 2020: GLOBOCAN estimates of incidence and mortality worldwide for 36 cancers in 185 countries. CA Cancer J Clin, 2021, 71(3): 209-249.
2.	Lei S, Zheng R, Zhang S, et al. Breast cancer incidence and mortality in women in China: temporal trends and projections to 2030. Cancer Biol Med, 2021, 18(3): 900-909.
3.	Shi Z, Lin J, Wu Y, et al. Burden of cancer and changing cancer spectrum among older adults in China: Trends and projections to 2030. Cancer Epidemiol, 2022, 76: 102068.
4.	Zeng H, Chen W, Zheng R, et al. Changing cancer survival in China during 2003-15: a pooled analysis of 17 population-based cancer registries. Lancet Glob Health, 2018, 6(5): e555-e567.
5.	Hildebrandt M G, Naghavi-Behzad M, Vogsen M. A role of FDG-PET/CT for response evaluation in metastatic breast cancer?. Semin Nucl Med, 2022, 52(5): 520-530.
6.	Chen W. Clinical application of PET in pediatric brain tumors. PET Clin, 2008, 3(4): 517-529.
7.	辛陽. CT成像技術的發展及技術特點. 科技創新導報, 2018, 15(4): 132-133.
8.	Li Y, Dai Y, Guo Y, et al. Correlation analysis of sup18/sup F-FDG PET/CT for the staging and treatment effect assessment of breast cancer. Journal of X-Ray Science and Technology, 2019, 27(6): 1131-1144.
9.	Cruz-Roa A, Arevalo J, Judkins A, et al. A method for medulloblastoma tumor differentiation based on convolutional neural networks and transfer learning//International Symposium on Medical Information Processing and Analysis. International Society for Optics and Photonics, 2015, DOI: 10.1117/12.2208825.
10.	趙旭. 基于醫學先驗的多尺度乳腺超聲腫瘤實例分割方法. 哈爾濱: 哈爾濱工業大學, 2019.
11.	徐勝舟, 程時宇. 基于全卷積神經網絡遷移學習的乳腺腫塊圖像分割. 中南民族大學學報: 自然科學版, 2019, 38(2): 278-284.
12.	Al-Antari M A, Al-Masni M A, Choi M T, et al. A fully integrated computer-aided diagnosis system for digital X-ray mammograms via deep learning detection, segmentation, and classification. Int J Med Inform, 2018, 117: 44-54.
13.	Ronneberger O, Fischer P, Brox T. U-Net: convolutional networks for biomedical image segmentation//International Conference on Medical Image Computing and Computer-Assisted Intervention. Springer, Cham, 2015: 234–241.
14.	Chen L C, Zhu Y, Papandreou G, et al. Encoder-decoder with atrous separable convolution for semantic image segmentation//European Conference on Computer Vision. Springer, Cham, 2018: 833-851.
15.	Zhuang J. LadderNet: multi-path networks based on U-Net for medical image segmentation. arXiv preprint, 2018, DOI: 10.48550/arXiv.1810.07810.
16.	Kumar A, Fulham M, Feng D, et al. Co-learning feature fusion maps from PET-CT images of lung cancer. IEEE Trans Med Imaging, 2019, 39(1): 204-217.
17.	Xiao X, Lian S, Luo Z, et al. Weighted Res-UNet for high-quality retina vessel segmentation//2018 9th International Conference on Information Technology in Medicine and Education (ITME). IEEE Computer Society, 2018: 327-331.
18.	Guan S, Khan A A, Sikdar S, et al. Fully dense UNet for 2-D sparse photoacoustic tomography artifact removal. IEEE J Biomed Health Inform, 2020, 24(2): 568-576.
19.	Isensee F, J?ger P F, Kohl S A A, et al. Automated design of deep learning methods for biomedical image segmentation. arXiv preprint, 2019, arXiv: 1904.08128.
20.	Chen J, Lu Y, Yu Q, et al. TransUNet: Transformers make strong encoders for medical image segmentation. arXiv preprint, 2021, DOI: 10.48550/arXiv.2102.04306.
21.	Jain J, Li J, Chiu M T, et al. OneFormer: one transformer to rule universal image segmentation. arXiv preprint, 2022, DOI: 10.48550/arXiv.2211.06220.
22.	Dosovitskiy A, Beyer L, Kolesnikov A, et al. An image is worth 16×16 words: Transformers for image recognition at scale. arXiv preprint, 2020, DOI: 10.48550/arXiv.2010.11929.
23.	Xie E, Wang W, Yu Z, et al. SegFormer: simple and efficient design for semantic segmentation with transformers. arXiv preprint, 2021, DOI: 10.48550/arXiv.2105.15203.
24.	Liu Z, Lin Y, Cao Y, et al. Swin Transformer: hierarchical vision Transformer using shifted windows. arXiv preprint, 2021. DOI: 10.48550/arXiv.2103.14030.
25.	Ji S, Yang M, Yu K. 3D convolutional neural networks for human action recognition. IEEE Trans Pattern Anal Mach Intell, 2013, 35(1): 221-231.
26.	Vaswani A, Shazeer N, Parmar N, et al. Attention Is All You Need. arXiv preprint, 2017. DOI: 10.48550/arXiv.1706.03762.
27.	余輝, 張書旭. 4DCT圖像二維配準與三維配準的區別. 醫療裝備, 2011, 24(7): 6-8.
28.	胡德文, 陳廣學, 朱劍銘, 等. 基于ROI的醫學圖像預處理技術研究. 醫學影像學雜志, 2018, 28(4): 585-589.
29.	Fukuda T, Fernandez R, Rosenberg A, et al. Data augmentation improves recognition of foreign accented speech. Interspeech, 2018, 18(9): 2409-2413.
30.	侯向丹, 李紫宇, 牛敬鈺, 等. 結合注意力機制和多路徑U-Net的視網膜血管分割. 計算機輔助設計與圖形學學報, 2023, 35(1): 55-65.

《生物醫學工程學雜志》

基于協同學習特征融合和轉換器的乳腺癌病灶分割方法

摘要 全文 圖表 視頻 參考文獻 施引文獻 補充材料

0 引言

1 本文算法

1.1 網絡結構

1.2 模塊結構

1.2.1 編碼器模塊

1.2.2 特征融合模塊

1.2.3 解碼器模塊

2 實驗結果和分析

2.1 實驗準備

2.1.1 數據集

2.1.2 數據預處理

2.2 實驗設置

2.3 評價指標

2.4 實驗結果分析

2.4.1 結果分析

3 結語

0 引言

1 本文算法

1.1 網絡結構

1.2 模塊結構

1.2.1 編碼器模塊

1.2.2 特征融合模塊

1.2.3 解碼器模塊

2 實驗結果和分析

2.1 實驗準備

2.1.1 數據集

2.1.2 數據預處理

2.2 實驗設置

2.3 評價指標

2.4 實驗結果分析

2.4.1 結果分析

3 結語

上一篇

下一篇

Format

Content

摘要全文圖表視頻參考文獻施引文獻補充材料