基于深度學習的磁共振液體衰減反轉恢復序列圖像合成方法_《生物醫學工程學雜志》

作者：

周家檸 ¹ ,  郭紅宇 ^1,2 , 陳紅 ¹

1. 沈陽工業大學電氣工程學院（沈陽 110870）;
2. 東軟醫療系統股份有限公司（沈陽 110167）;

關鍵詞：

磁共振成像深度學習多模態特征融合

DOI：

10.7507/1001-5515.202302012

視頻：

導出 下載 收藏 掃碼 引用

摘要 全文 圖表 視頻 參考文獻 施引文獻 補充材料

磁共振能夠獲得不同對比度的多模態圖像，為臨床診斷提供了豐富的信息。但是常常由于患者難以配合或掃描條件限制造成某些對比度圖像沒有被掃描或者獲得的圖像質量不能達到診斷要求。圖像合成技術是彌補這種圖像缺失的一種方法。近年來，深度學習在磁共振圖像合成領域得到了廣泛應用。本文提出了一種基于多模態融合的合成網絡，首先利用特征編碼器將多個單模態圖像分別進行特征編碼后，再通過特征融合模塊將不同模態圖像特征進行融合，最終生成目標模態圖像。通過引入基于圖像域和K空間域的動態加權組合損失函數，改進了網絡中目標圖像與預測圖像的相似性度量方法。經實驗驗證并定量比較，本文提出的多模態融合深度學習網絡可以有效合成高質量的磁共振液體衰減反轉恢復（FLAIR）序列圖像。綜上，本文提出的方法可以減少患者的磁共振掃描時間，以及解決FLAIR圖像缺失或圖像質量難以滿足診斷要求的臨床問題。

引用本文： 周家檸, 郭紅宇, 陳紅. 基于深度學習的磁共振液體衰減反轉恢復序列圖像合成方法. 生物醫學工程學雜志, 2023, 40(5): 903-911. doi: 10.7507/1001-5515.202302012 復制

0 引言

磁共振成像（magnetic resonance imaging，MRI）是一種應用廣泛的前沿醫學成像技術，能夠提供同一解剖結構的多種不同對比度的圖像。在MRI的成像過程中，只需要改變掃描序列的各種參數，就可以生成多個不同對比度的參數圖像，也稱為不同模態的圖像，這些圖像具有相似的解剖結構，但突出了不同的組織，豐富了臨床應用和研究的診斷信息^[1-2]。但是在實際掃描中，過長的掃描時間使得患者難以全程配合或者會增加掃描成本，因此很難保證每個患者都能采集到所有模態的圖像，從而導致缺少一些非常重要的模態圖像。圖像合成技術是彌補這種缺憾的一種有效方式，即通過已采集獲得的模態圖像，合成新的模態圖像。傳統的基于信號模型的多模態圖像合成方法，通常需要提前獲取定量參數和復雜的參數調優過程，適用范圍有限。

近年來，深度學習憑借強大的非線性映射能力，逐漸應用于醫學圖像合成領域^[3]。為了挖掘多模態圖像特征的互補作用，目前許多研究的策略是提取多種模態圖像特征作為網絡輸入，通過融合模塊進行特征融合，并生成目標模態圖像。早期基于深度學習的MRI圖像合成方法大多使用單模態數據^[4-5]。為了應用更多模態數據以提供更多圖像特征信息，許多研究人員開始致力于制定研發更有效的多模態數據特征融合策略^[6]。例如，Yang等^[7]提出了一種基于順序的生成對抗網絡（generative adversarial networks，GAN）和半監督學習的雙模醫學圖像合成方法。Kim等^[8]提出了一種基于深度神經網絡并使用三種不同對比度MRI圖像生成短時反轉恢復（short time inversion recovery，STIR）圖像的方法。將多模態數據作為輸入以合成醫學圖像的方法中，需解決的關鍵問題是，不僅需要有效提取各種輸入數據特征，還要使用合適的融合策略，才能實現多模態數據特征的有效融合^[9]。比如，Havaei等^[10]使用統計特征（均值和方差）作為圖像的嵌入表達進行特征融合。Zhou等^[3]提出了一種多模態新型混合融合網絡(hybrid fusion network，Hi-net），該網絡學習從多種源模態圖像（已有模態）到目標圖像（缺失模態）的映射，通過混合融合模塊（mixed fusion block，MFB）將各模態圖像特征緊密結合，最終生成目標圖像。Fei等^[11]為了利用不同模態提供的互補信息，將多模態MRI圖像作為輸入，提出了一個多模態網絡模型，將特征分離策略應用于合成MRI圖像中。此外，生成對抗網絡也被廣泛用于跨模態圖像合成領域，并取得了巨大成功^[12]。

液體衰減反轉恢復（fluid-attenuated inversion recovery，FLAIR）序列，通過施加反轉恢復脈沖后間隔一個較長的恢復時間再進行信號激發和采集，能夠有效抑制腦脊液信號，提高組織對比度，在腦卒中、腦腫瘤等疾病診斷中具有非常高的檢出敏感性。基于此，本文提出了一個基于多模態結構圖像融合策略的MRI圖像合成網絡，用于合成FLAIR對比度圖像。本文主要貢獻有：

（1）提出多模態特征融合策略：利用單模態特征提取器提取每個源模態的圖像特征，并通過異模態特征融合策略將各類特征有效融合，生成目標模態圖像。

（2）提出K空間損失：為了更多地挖掘圖像間的相似性，使合成圖像在K空間域也能更加逼近真實圖像，在本網絡中提出使用聯合圖像域和K空間域的動態加權損失函數。

1 數據與預處理

本文使用了2018年多模態腦腫瘤分割（brain tumor segmentation，BraTS）挑戰賽的官方數據集^[13-15]。該數據集為公開數據集，包含了285個病例，每個病例有四種模態的MRI圖像，包括T1、T1對比增強（T1 contrast enhanced，T1 CE）、T2和FLAIR，每種模態圖像大小相同，都為155 × 240 × 240。數據預處理對于網絡訓練非常重要，本文的數據預處理分為以下幾個步驟：

（1）沿著圖像的軸向方向進行切片，將每個腦體積切割成240 × 240的軸向平面切片。為了能將全腦所有層面圖像都輸入網絡，節省算力和內存空間，加快訓練速度，本文將每個切片圖像的大小統一重采樣調整為192 × 192。

（2）去除對網絡訓練沒有意義的一些層面的圖像，例如空圖像。

（3）每個模態的圖像分別歸一化到[0，1]范圍內。

2 方法

2.1 理論分析

MRI是利用磁共振原理，通過給處于一定靜磁場下的成像組織施加特定頻率的射頻信號后，激勵組織中的氫原子核發生共振，進而獲取組織相關特性的一種成像方式。在MRI掃描中，針對同一組織使用不同掃描序列，并調節掃描參數可以得到反映該組織不同參數的圖像，這些不同參數的圖像通常也稱為不同模態的圖像^[16]，它們表現為具有不同圖像對比度。MRI圖像合成技術可行性在于：同一解剖結構的不同模態圖像，組織結構上是相同的，只是以不同對比形式表現這個結構^[17]；各模態圖像在信號表達式上存在著一定的依賴關系和信息相關性，比如FLAIR圖像的信號表達式中就含有T1與T2的相關信息，如式(1)所示：

其中，S為FLAIR圖像的信號強度，S₀為質子密度信號強度，序列反轉時間（inversion time，TI）的參數符號以TI表示，序列重復時間（repetition time，TR）的參數符號以TR表示，序列回波時間（echo time，TE）的參數符號以TE表示，T₁、T₂分別為組織的縱向弛豫時間常數和橫向弛豫時間常數。

2.2 網絡設計

2.2.1 單模態特征編碼器

本文首先設計了一個單模態特征編碼器（mono-modal feature encoder，MFE），用于提取每種源模態圖像的特征。MFE由一個大卷積核U型網絡（U-net）構成。左邊網絡使用卷積層與最大池化層作為編碼器，提取多尺度特征；右邊網絡使用卷積層與上采樣層作為解碼器，進行特征融合，網絡框架如圖1所示。考慮算力情況，且要保持批大小在合理范圍，所以選擇可計算的最大卷積核大小作為卷積層的實際卷積核大小，本文將其設置為13 × 13。網絡參數通過預訓練得到。

圖1 單模態特征編碼器應用到的U-net網絡架構 Figure1. U-net architecture applied to momo-modal feature encoder

圖選項

合成方法(輸入→輸出模態)	PSNR	NRMSE	SSIM
Pix2pix(T2→FLAIR)	30.370 ± 2.031	0.282 0 ± 0.029 0	0.919 1 ± 0.021 0
MM-Syns(T1 + T2→FLAIR)	28.930 ± 0.831	0.262 0 ± 0.020 0	0.890 9 ± 0.030 0
Hi-net(T1 + T2→FLAIR)	30.420 ± 1.379	0.220 9 ± 0.017 0	0.935 2 ± 0.028 0
本文方法(T1 + T2→FLAIR)	34.010 ± 1.457	0.144 9 ± 0.010 0	0.985 1 ± 0.036 0

輸入→輸出模態	PSNR	NRMSE	SSIM
T1 + T2→FLAIR	34.01 ± 1.457	0.144 9 ± 0.045	0.985 1 ± 0.036
T1 + T2 + T1 CE→FLAIR	34.12 ± 0.902	0.152 0 ± 0.038	0.972 4 ± 0.055

卷積核尺寸	PSNR	NRMSE	SSIM
3 × 3	30.01 ± 1.013	0.230 1 ± 0.021	0.916 6 ± 0.021
7 × 7	30.98 ± 1.069	0.212 0 ± 0.025	0.920 1 ± 0.024
13 × 13	31.83 ± 1.252	0.176 3 ± 0.027	0.942 4 ± 0.033

1.	Iglesias J E, Konukoglu E, Zikic D, et al. Is synthesizing MRI contrast useful for inter-modality analysis?. Med Image Comput Comput Assist Interv, 2013, 16(Pt 1): 631-638.
2.	Lustig M, Donoho D, Pauly J M. Sparse MRI: the application of compressed sensing for rapid MR imaging. Magnetic Resonance in Medicine, 2007, 58(6): 1182-1195.
3.	Zhou T, Fu H, Chen G, et al. Hi-Net: hybrid-fusion network for multi-modal MR image synthesis. IEEE Transactions on Medical Imaging, 2022, 39(9): 2772-2781.
4.	Zhu J Y, Park T, Isola P, et al. Unpaired image-to-image translation using cycle-consistent adversarial networks//2017 IEEE International Conference on Computer Vision(ICCV). Venice: University of Venice, 2017: 2242-2251.
5.	Galbusera F, Bassani T, Casaroli G, et al. Generative models: an upcoming innovation in musculoskeletal radiology? A preliminary test in spine imaging. European Radiology Experimental, 2018, 2(1): 29-33.
6.	樓鑫杰. 基于深度學習與多模態融合的快速MRI重建研究. 浙江: 浙江工業大學, 2021.
7.	Yang X, Lin Y, Wang Z, et al. Bi-modality medical image synthesis using semi-supervised sequential generative adversarial networks. IEEE Journal of Biomedical and Health Informatics, 2020, 24(3): 855-865.
8.	Kim S, Jang H, Jang J, et al. Deep-learned short tau inversion recovery imaging using multi-contrast MR images. Magnetic Resonance in Medicine, 2020, 84(6): 2994-3008.
9.	Torrado-Carvajal A, Herraiz J L, Alcain E, et al. Fast patch-based pseudo-CT synthesis from T1-weighted MR images for PET/MR attenuation correction in brain studies. The Journal of Nuclear Medicine, 2016, 57(1): 136-143.
10.	Havaei M, Guizard N, Chapados N, et al. HeMIS: hetero-modal image segmentation //Medical Image Computing and Computer-Assisted Intervention (MICCAI). Athens: Imagia Inc, 2016: 469-477.
11.	Fei Y, Zhan B, Hong M, et al. Deep learning-based multi-modal computing with feature disentanglement for MRI image synthesis. Medical Physics, 2021, 48(7): 3378-3789.
12.	Goodfellow I, Pouget-Abadie J, Mirza M, et al. Generative adversarial nets//The International Conference on Neural Information Processing Systems. Montreal: NIPS, 2014: 2672-2680.
13.	Baid U, Ghodasara S, Mohan S, et al. The RSNA-ASNR-MICCAI BraTS 2021 Benchmark on brain tumor segmentation and radiogenomic classification. arXiv preprint, 2021, arXiv: 2107.02314.
14.	Menze B H, Jakab A, Bauer S, et al. The multimodal brain tumor image segmentation benchmark (BRATS). IEEE Transactions on Medical Imaging, 2015, 34(10): 1993-2024.
15.	Bakas S, Reyes M, Jakab A, et al. Identifying the best machine learning algorithms for brain tumor segmentation, progression assessment, and overall survival prediction in the BRATS challenge. arXiv preprint, 2021, arXiv: 1811.02629.
16.	Feng C M, Yan Y, Liu C, et al. Exploring separable attention for multi-contrast MR image super-resolution. arXiv preprint, 2021, arXiv: 2109.01664.
17.	李英. 基于結構相似性和低秩稀疏的磁共振圖像去噪算法研究. 計算機應用, 2017, 37(5): 1375-1379.
18.	Dvorák P, Menze B. Structured prediction with convolutional neural networks for multimodal brain tumor segmentation// MICCAI Multimodal Brain Tumor Segmentation Challenge (BraTS). Brisbane: The University of Queensland, 2015: 13-24.
19.	Ding X, Zhang X, Zhou Y, et al. Scaling up your kernels to 31×31: revisiting large kernel design in CNNs. arXiv preprint, 2022, arXiv: 1708.04231.
20.	Liu S, Chen T, Chen X, et al. More ConvNets in the 2020s: scaling up kernels beyond 51×51 using sparsity. arXiv preprint, 2023, arXiv: 2011.06641.
21.	Vaswani A, Shazeer N, Parmar N, et al. Attention is all you need//Proceedings of the 31st International Conference on Neural Information Processing Systems (NIPS’17). Long Beach: Neural Inf Process Syst, 2017: 6000-6010.
22.	Ding X, Zhang X, Ma N, et al. RepVGG: making VGG-style ConvNets great again// IEEE/CVF Conference on Computer Vision and Pattern Recognition, Nashville: IEEE, 2021: 13728-13737.
23.	Chen C, Dou Q, Jin Y, et al. Robust multimodal brain tumor segmentation via feature disentanglement and gated fusion//Medical Image Computing and Computer-Assisted Intervention. Cham: Springer, 2020: 447-456.
24.	Isola P, Zhu J Y, Zhou T, et al. Image-to-image translation with conditional adversarial networks//IEEE Conference on Computer Vision and Pattern Recognition. Honolulu: Berkeley AI Res, 2016: 5967-5976.
25.	Chartsias A, Joyce T, Giuffrida M. V. , et al. Multimodal MR synthesis via modality-invariant latent representation. IEEE Trans Med Imaging, 2018, 37(3): 803-814.
26.	Osman A F I, Tamam N M. Deep learning-based convolutional neural network for intra-modality brain MRI synthesis. Journal of Applied Clinical Medical Physics, 2022, 23(4): e13530.
27.	Nie D, Trullo R, Lian J, et al. Medical image synthesis with context-aware generative adversarial networks//The International Conference on Medical Image Computing and Computer Assisted Intervention. Cham: Springer, 2017: 417-425.

《生物醫學工程學雜志》

基于深度學習的磁共振液體衰減反轉恢復序列圖像合成方法

摘要 全文 圖表 視頻 參考文獻 施引文獻 補充材料

0 引言

1 數據與預處理

2 方法

2.1 理論分析

2.2 網絡設計

2.2.1 單模態特征編碼器

2.2.2 多模態融合網絡

2.3 雙域組合損失函數

2.4 訓練過程

2.5 結果與分析

3 結論和展望

0 引言

1 數據與預處理

2 方法

2.1 理論分析

2.2 網絡設計

2.2.1 單模態特征編碼器

2.2.2 多模態融合網絡

2.3 雙域組合損失函數

2.4 訓練過程

2.5 結果與分析

3 結論和展望

上一篇

下一篇

Format

Content

摘要全文圖表視頻參考文獻施引文獻補充材料