面向兒科超聲心動圖雙側心室分割的注意力引導網絡_《生物醫學工程學雜志》

作者：

龐俊 ¹ ,  王永雄 ¹ , 陳麗君 ² , 張佳鵬 ¹ , 劉金龍 ^3,4 , 裴剛 ¹

1. 上海理工大學光電信息與計算機工程學院（上海 200093）;
2. 上海交通大學醫學院上海兒童醫學中心兒科心內科（上海 200120）;
3. 上海交通大學醫學院上海兒童醫學中心心胸外科（上海 200120）;
4. 上海結構性心臟病虛擬現實工程技術研究中心（上海 200120）;

關鍵詞：

兒科超聲心動圖雙側心室分割注意力機制深監督多尺度

DOI：

10.7507/1001-5515.202304038

視頻：

導出 下載 收藏 掃碼 引用

摘要 全文 圖表 視頻 參考文獻 施引文獻 補充材料

由于兒童心臟大小隨年齡變化顯著，且兒童心率較快，超聲心動圖心臟邊界相較成人更模糊，因此兒科超聲心動圖的準確分割是一項具有挑戰性的任務。針對上述問題，本文提出了一種結合通道注意力和尺度注意力的雙解碼器網絡模型。首先，利用結合深監督策略的注意力引導解碼器，獲取心室區域的注意力圖；然后，將產生的心室注意力通過跳躍連接返回到網絡的多個層，調整編碼器生成的特征權重，突出左右心室區域；最后，通過尺度注意力模塊和通道注意力模塊強化左右心室邊緣特征。實驗結果表明，本文所提方法在所采集的雙側心室分割數據集中，平均戴斯系數（DSC）達到90.63%，優于醫學圖像分割領域一些常規和最新方法，尤其在心室邊緣處分割更清晰。本文的研究可為兒科超聲心動圖雙側心室分割以及后續先天性心臟病輔助診斷提供新的解決方案。

引用本文： 龐俊, 王永雄, 陳麗君, 張佳鵬, 劉金龍, 裴剛. 面向兒科超聲心動圖雙側心室分割的注意力引導網絡. 生物醫學工程學雜志, 2023, 40(5): 928-937. doi: 10.7507/1001-5515.202304038 復制

0 引言

先天性心臟病（congenital heart disease，CHD）在全國多地均位居新生兒出生缺陷首位，也是心血管外科治療患者數排行第二位的病種^[1]。超聲心動圖儀是目前臨床常規心臟檢查中使用最廣泛的心臟成像設備，對心血管疾病的診斷和評估起著至關重要的作用。臨床評價指標，如心臟舒張期末期容積（end-diastolic volume，ED）、收縮期末期容積（end-systolic volume，ES）和射血分數（ejection fractions，EF）的計算十分重要，這些參數的獲取需要對超聲心動圖中的心室進行準確分割。然而，要實現超聲心動圖心室的精確分割還存在諸多困難，如心肌和血池之間的對比度低、超聲圖像中含有的偽影，以及不同病患心臟結構的形狀、質地和運動變異性等差異較大，均會影響最終的分割結果^[2-3]。尤其對于嬰幼兒等兒科患者來說，患者間心臟大小樣本方差較大、心率較快，超聲心動圖心臟邊界相較成人更加模糊^[4]，因此對兒科超聲心動圖進行分割更加困難。

根據已有文獻顯示，現有的超聲心動圖分割主要集中在左心室分割^[5-9]。Carneiro等^[5]提出了一種左心室心內膜跟蹤方法，采用多個動態分割模型和深度學習方法實現了精確的左心室分割。Leclerc等^[6]在超聲心動圖像分割任務中對比了常用的深度學習方法、結構化的隨機森林方法以及B樣條顯性活動表面模型，發現基于U型網絡（U-net）模型^[7]的準確率和效率最高。Moradi等^[8]結合特征金字塔和擴張卷積模型，利用解碼器所有尺度的特征預測分割，得到了更準確的左心室內膜分割邊緣。Leclerc等^[9]提出一種多階段的方法，包括用于定位的區域生成網絡（region proposal network，RPN）和用于分割的U-net，有效提高了左心室分割的準確性。另一方面，隨著心臟病學的發展，右心室的分割在提高心血管疾病診斷效率上扮演著越來越重要的角色，并且它可以為左心室的分割提供有價值的信息以作參考。然而，目前尚缺乏同時分割左右心室的方法，為此本文旨在探索一種實現左右心室同時分割的有效方法。

針對超聲心動圖邊界模糊、分割困難等問題，現有方法大多采用級聯網絡，遵循由粗到細的分割策略^[10-12]。例如，Bullock等^[10]提出了X射線圖像分割級聯網絡（X-Net）以加強邊界分割。Du等^[11]在級聯網絡中采用膨脹卷積和多層池化模塊代替普通卷積，提取多尺度特征分割右心室。Leclerc等^[12]設計了一種多級注意力網絡，其一級分割網絡生成心室和心肌部分的總體二值映射，所得結果和輸入圖像相乘作為二級分割網絡輸入，分別分割心室和心肌部分。該方法有效地減少了邊界的錯誤分割，但整體精度沒有明顯提高。在上述使用級聯策略的網絡中，各個網絡相對獨立，訓練過程困難，容易導致欠擬合，導致此類方法無法顯著提高分割精度。針對這一問題，本文設計了一種雙解碼器的網絡模型，產生心室區域注意力和最終分割結果，在粗分割和細分割任務中僅使用同一個編碼器，在單個網絡中實現了傳統級聯網絡的兩個步驟，緩解了欠擬合的問題。

受人類知覺和視覺認知的啟發，Itti等^[13]提出了注意力機制，它可以明顯提高網絡性能，并且已廣泛用于突出感興趣區域（region of interest，ROI）和抑制無關信息^[14-16]。超聲心臟圖像中存在大量噪聲，這可能導致分割精度降低，為此，在現有心臟圖像分析中也大量使用注意力機制以強化心室區域^[17-18]。Song等^[17]設計了多尺度注意力機制和雙邊注意力模塊提高心臟7個子結構區域的分割精度。Guo等^[18]在超聲心動圖分割任務中提出了一個雙路徑特征提取模塊（dual-path feature extraction module，DP-FEM），通過通道注意力機制強化判別性的特征。同時，他們還設計了基于空間注意力的高低特征融合模塊（high-and-low-level feature fusion module，HL-FFM），將來自高層特征的豐富語義信息與低層特征的空間信息進行選擇性融合。這些基于注意力的方法，有效改善了模型在心臟邊界處的預測結果。受此啟發，本文嘗試在網絡層面以及模塊層面分別使用多種不同的注意力策略。具體而言，即在網絡層面，通過注意力預測圖，引導兩個解碼器。同時，針對注意力圖生成過程中可能缺乏解釋性的問題，引入深監督策略，以提升注意力引導的可解釋性和有效性。在模塊層面，本文針對小兒心臟大小隨年齡增長變化顯著以及心室邊界模糊的特性，采用了尺度注意力模塊（scale attention module，SAM）和通道注意力模塊（channel attention module，CAM）以強化邊緣并保留更多的上下文信息。

綜上所述，本文提出了一種新的用于兒科超聲心動圖雙側心室分割的雙解碼器網絡模型。該模型重點關注心室邊緣分割精度的提升，以提高兒科CHD的診斷、預后和治療的效率。主要創新包括：① 本研究設計了雙解碼器網絡模型，將注意力引導解碼器（attention-guided decoder，AGD）集成到網絡的參數化跳躍連接中，用于生成空間注意力，進而改善編碼器產生的特征圖，從而加強心室區域的全局信息；再利用預測解碼器對左右兩心室區域細分；最終期望該模型能改善傳統級聯網絡的欠擬合問題，有效提升心室和邊緣的分割精度。② 在AGD中引入深監督策略，以期提升注意力引導的可解釋性和有效性。③ 為了解決小兒心室大小隨年齡增長變化顯著、超聲心動圖心室邊界模糊等客觀因素所引起的心室邊界分割不準確的問題，本文提出采用SAM為不同尺度特征圖分配注意力權重，同時使用帶有全局平均池化和全局最大池化的CAM加權重要特征通道，以求保留更多全局上下文信息。本研究期望實現雙側心室分割，同時有效提升心室分割網絡模型的性能，使得需要借助精確分割結果來進行定量評估的心臟血流動力學參數更具有臨床意義。

1 注意力引導的雙側心室分割模型

本文設計的網絡模型由AGD、參數化跳躍連接、帶有CAM和SAM的預測解碼器組成。網絡模型的骨干網絡采用強魯棒性的U-net，具體表現為：在編碼特征提取階段，卷積層采用3 × 3卷積核，每一層輸出的通道維數依次為64、128、256、512、512；X₃、X₄、X₅為網絡編碼器第3、4、5層分別提取的特征圖；在解碼特征融合階段，卷積層同樣采用3×3卷積核，每一層輸出的通道維數依次為512、256、128、64；同時在編碼器和解碼器之間采用含參數a_i（i = 1, 2, ···, 5）的跳躍連接，詳細結構如圖1所示。

圖1 網絡結構圖 Figure1. Network structure diagram

圖選項

網絡結構	DSC	L-pre	R-pre	L-recall	R-recall
U-net	87.54%	83.24%	80.41%	84.91%	84.04%
AGD(1)	89.31%	83.47%	81.19%	85.98%	85.25%
AGD(1～2)	89.36%	86.99%	82.13%	82.77%	85.13%
AGD(1～3)	89.46%	85.59%	82.35%	83.88%	84.63%
AGD(1～4)	89.60%	87.34%	85.75%	84.15%	82.63%
AGD(1～5, X₃ + X₄)	88.51%	83.18%	79.33%	82.94%	83.62%
AGD(1～5, X₄ + X₅)	89.43%	85.64%	81.72%	84.39%	84.58%
AGD(1～5) (本文)	89.97%	87.17%	82.84%	86.54%	86.48%

分割算法	DSC	L-pre	R-pre	L-recall	R-recall
U-net	87.54%	83.24%	80.41%	84.91%	84.04%
attention U-net	89.40%	83.82%	82.47%	85.32%	84.15%
U-net++	89.44%	85.81%	80.14%	82.76%	85.94%
Deeplabv3+	88.99%	84.71%	77.57%	85.26%	84.91%
PAnet	87.60%	87.47%	82.90%	80.07%	83.22%
RU-net	89.34%	85.83%	83.80%	83.98%	83.56%
ResDUnet	89.46%	88.05%	84.96%	83.98%	83.40%
本文	90.63%	87.74%	84.31%	87.90%	86.29%

1.	中國心血管健康與疾病報告編寫組. 中國心血管健康與疾病報告2021概要. 中國循環雜志, 2022, 37(6): 553-578.
2.	Painchaud N, Skandarani Y, Judge T, et al. Cardiac segmentation with strong anatomical guarantees. IEEE Transactions on Medical Imaging, 2020, 39(11): 3703-3713.
3.	Zhang J P, Wang Y X, Chen L J, et al. Dual-branch TransV-Net for 3D echocardiography segmentation. IEEE Transactions on Industrial Informatics, 2023, DOI: 10.1109/TII.2023.3249904.
4.	Gahungu N, Trueick R, Bhat S, et al. Current challenges and recent updates in artificial intelligence and echocardiography. Current Cardiovascular Imaging Reports, 2020, 13: 5.
5.	Carneiro G, Nascimento J C. Combining multiple dynamic models and deep learning architectures for tracking the left ventricle endocardium in ultrasound data. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2013, 35(11): 2592-2607.
6.	Leclerc S, Smistad E, Pedrosa J, et al. Deep learning for segmentation using an open large-scale dataset in 2D echocardiography. IEEE Transactions on Medical Imaging, 2019, 38(9): 2198-2210.
7.	Ronneberger O, Fischer P, Brox T. U-net: convolutional networks for biomedical image segmentation//International Conference on Medical Image Computing and Computer-Assisted Intervention. Cham: Springer, 2015: 234-241.
8.	Moradi S, Oghli M G, Alizadehasl A, et al. MFP-Unet: a novel deep learning based approach for left ventricle segmentation in echocardiography. Physica Medica, 2019, 67: 58-69.
9.	Leclerc S, Smistad E, ?stvik A, et al. LU-Net: a multistage attention network to improve the robustness of segmentation of left ventricular structures in 2-D echocardiography. IEEE Transactions on Ultrasonics, Ferroelectrics, and Frequency Control, 2020, 67(12): 2519-2530.
10.	Bullock J, Cuesta-Lázaro C, Quera-Bofarull A. XNet: a convolutional neural network (CNN) implementation for medical x-ray image segmentation suitable for small datasets//Medical Imaging 2019: Biomedical Applications in Molecular, Structural, and Functional Imaging. SPIE, 2019. DOI: 10.1117/12.2512451.
11.	Du X, Xu X, Liu H, et al. TSU-net: two-stage multi-scale cascade and multi-field fusion U-net for right ventricular segmentation. Computerized Medical Imaging and Graphics, 2021, 93: 101971.
12.	Leclerc S, Smistad E, Grenier T, et al. RU-Net: a refining segmentation network for 2D echocardiography//2019 IEEE International Ultrasonics Symposium (IUS). Glasgow: IEEE, 2019: 1160-1163.
13.	Itti L, Koch C, Niebur E. A model of saliency-based visual attention for rapid scene analysis. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1998, 20(11): 1254-1259.
14.	姚慶安,張鑫,劉力鳴,等. 融合注意力機制和多尺度特征的圖像語義分割. 吉林大學學報(理學版), 2022, 60(6): 1383-1390.
15.	Hu J, Shen L, Sun G, et al. Squeeze-and-excitation networks. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2020, 42(8): 2011-2023.
16.	Woo S, Park J, Lee J Y, et al. CBAM: convolutional block attention module// Proceedings of the European conference on computer vision (ECCV). 2018: 3-19. DOI: 10.1007/978-3-030-01234-2_1.
17.	Song Y, Du X, Zhang Y, et al. Two-stage segmentation network with feature aggregation and multi-level attention mechanism for multi-modality heart images. Computerized Medical Imaging and Graphics, 2022, 97: 102054.
18.	Guo L, Lei B, Chen W, et al. Dual attention enhancement feature fusion network for segmentation and quantitative analysis of paediatric echocardiography. Medical Image Analysis, 2021, 71: 102042.
19.	Zhao X, Zhang P, Song F, et al. Prior attention network for multi-lesion segmentation in medical images. IEEE Transactions on Medical Imaging, 2022, 41(12): 3812-3823.
20.	Gu R, Wang G, Song T, et al. CA-Net: Comprehensive attention convolutional neural networks for explainable medical image segmentation. IEEE Transactions on Medical Imaging, 2021, 40(2): 699-711.
21.	Oktay O, Schlemper J, Folgoc L L, et al. Attention U-net: learning where to look for the pancreas//International Conference on Medical Image Computing and Computer-assisted Intervention. Cham: Springer, 2018: 369-377.
22.	Zhou Z, Rahman Siddiquee M M, Tajbakhsh N, et al. UNet++: a nested U-Net architecture for medical image segmentation//Deep Learning in Medical Image Analysis and Multimodal Learning for Clinical Decision Support (DLMIA 2018), Cham: Springer, 2018, 11045: 3-11.
23.	Chen L C, Zhu Y, Papandreou G, et al. Encoder-decoder with atrous separable convolution for semantic image segmentation//Proceedings of the European conference on computer vision (ECCV). 2018: 801-818.
24.	Amer A, Ye X, Janan F. ResDUnet: a deep learning-based left ventricle segmentation method for echocardiography. IEEE Access, 2021, 9: 159755-159763.

網絡結構	DSC	L-pre	R-pre	L-recall	R-recall
U-net	87.54%	83.24%	80.41%	84.91%	84.04%
SAM (1～2)	88.74%	82.28%	78.64%	85.21%	86.90%
SAM (1～3)	89.18%	84.19%	80.16%	86.07%	85.54%
SAM (1～4)	89.44%	83.05%	81.06%	86.47%	85.85%
SAM (1～5)	88.83%	85.52%	80.16%	82.48%	84.76%

《生物醫學工程學雜志》

面向兒科超聲心動圖雙側心室分割的注意力引導網絡

摘要 全文 圖表 視頻 參考文獻 施引文獻 補充材料

0 引言

1 注意力引導的雙側心室分割模型

1.1 結合深監督策略的AGD

1.2 帶有參數的跳躍連接

1.3 CAM

1.4 SAM

2 實驗和結果分析

2.1 實驗數據

2.2 實驗環境及設置

2.3 評估指標

2.4 消融實驗

2.4.1 AGD對分割結果的影響

2.4.2 SAM對分割結果的影響

2.5 各類分割算法分割左右心室效果的對比

3 結論

0 引言

1 注意力引導的雙側心室分割模型

1.1 結合深監督策略的AGD

1.2 帶有參數的跳躍連接

1.3 CAM

1.4 SAM

2 實驗和結果分析

2.1 實驗數據

2.2 實驗環境及設置

2.3 評估指標

2.4 消融實驗

2.4.1 AGD對分割結果的影響

2.4.2 SAM對分割結果的影響

2.5 各類分割算法分割左右心室效果的對比

3 結論

上一篇

下一篇

Format

Content

摘要全文圖表視頻參考文獻施引文獻補充材料