基于卷積神經網絡的先心病心音信號分類算法_《生物醫學工程學雜志》

作者：

譚朝文 ¹ ,  王威廉 ¹ , 宗容 ¹ , 潘家華 ² , 楊宏波 ²

1. 云南大學信息學院（昆明 650504）;
2. 云南省阜外心血管病醫院（昆明 650102）;

關鍵詞：

先心病分類機器輔助聽診梅爾系數卷積神經網絡

DOI：

10.7507/1001-5515.201806031

視頻：

導出 下載 收藏 掃碼 引用

摘要 全文 圖表 視頻 參考文獻 施引文獻 補充材料

心臟聽診是先天性心臟病（簡稱：先心病，CHD）初診和篩查的主要手段。本文對先心病心音信號進行分析和分類識別研究，提出了一種基于卷積神經網絡的先心病分類算法。本文算法基于臨床采集的已確診先心病心音信號，首先采用心音信號預處理算法提取并組織一維時間域上心音信號的梅爾系數轉變成二維特征樣本。其次，以 1 000 個特征樣本用于訓練和優化卷積神經網絡，使用自適應矩估計（Adam）優化器，獲得了準確率 0.896、損失值 0.25 的訓練結果。最后，用卷積神經網絡對 200 個心音信號樣本進行測試，實驗結果表明準確率達 0.895，靈敏度為 0.910，特異度為 0.880。同其它算法相比，本文算法在準確率和特異度上有明顯提高，證實了本文方法有效地提高了心音信號分類的魯棒性和準確性，有望應用于機器輔助聽診。

引用本文： 譚朝文, 王威廉, 宗容, 潘家華, 楊宏波. 基于卷積神經網絡的先心病心音信號分類算法. 生物醫學工程學雜志, 2019, 36(5): 728-736, 744. doi: 10.7507/1001-5515.201806031 復制

引言

心音（heart sounds，HS）信號是由于血流使心臟瓣膜打開或關閉時振動產生的聲音信號，是人體重要的生物信號^[1]。心音信號包含了大量的心臟生理、病理性信息，臨床醫生可以通過聽診識別出心音信號是否異常，從而輔助診斷心血管疾病^[2]。目前，電子聽診器和心音信號數據采集設備日趨成熟，可以通過數字化分析手段，提取心音信號的病理特征，達到對心音信號分類識別的目的。這項工作對實現遠程心臟疾病的診斷和監測具有重要意義。因此對心音信號的有效去噪、分析和識別是實現遠程醫療和計算機輔助聽診的前提。

心音信號在國內外生物醫學信號實驗室一直備受關注，Abbas 等^[3]首先提出了心音信號預處理的基本步驟：去噪、包絡提取、分段定位以及特征提取。近年來，研究人員重點關注的是心音信號的分類研究。心音信號的分類算法主要有：① 傳統模式識別的方法，例如：文獻[4]使用小波包分解對 59 個心音信號提取特征輸入支持向量機（support vector machine，SVM）分類器準確率可達 0.95；文獻[5]對心音信號使用梅爾頻率倒譜系數（mel frequency cepstrum coefficient，MFCC）提取特征后使用隱馬爾可夫模型（hidden markov model，HMM）進行分類，準確率超過了 0.8；文獻[6]對 392 個心音信號樣本使用 MFCC-SVM 的方法獲得了 0.86 的準確率。② 深度學習的方法，例如：Maknickas 等^[7]直接將心音信號分成 4 ms 片段輸入卷積神經網絡（convolutional neural network，CNN）進行訓練并驗證，在 1 391 個心音信號樣本上驗證獲得了 0.841 的準確率。③ 人工神經網絡（artificial neural network，ANN）的方法，例如：文獻[8]采用 ANN 法進行研究，實驗樣本最小的只有 5 個，最多的只有 215 個，準確率從 0.92～0.99 不等；④ 綜合幾種不同模式識別的方法，例如 Papadaniil 等^[9]采用經驗模態分解算法和 ANN 方法對心音信號進行特征提取和分類識別，準確率達到了 0.845；文獻[10]使用K最近鄰（K-nearest neighbor，KNN）算法和 HMM 算法進行心音信號的分類識別，準確率可達 0.825。

上述研究中，部分文獻報道的算法準確率較高，有的準確率高達 0.99，但離應用在遠程醫療或機器智能輔助聽診領域還有一定差距，原因是：① 預處理步驟復雜，傳統模式識別的方法需人工干預挑選有效的特征，例如文獻[4]和文獻[6]利用小波分解提取特征，但心音信號成分復雜，能否提取到有效的特征尚需探索；② 訓練樣本量過小，例如文獻[8]的 ANN 心音信號分類算法樣本數最大僅 215 個，傳統模式識別分類的文獻[6]也僅 392 個樣本，盡管這些算法準確率較高，但是無法保證心音信號分類算法的普適性和魯棒性；③ 準確率低，文獻[7]訓練樣本數達 1 391 個，但其準確率僅為 0.841，還不足以達到實際應用的要求，尚需進一步的提升。這些不足之處都極大地制約了心音信號分類算法將來的推廣實用和實時化輔助診斷決策。

基于已有算法的不足之處，本文提出了一種基于 CNN 心音信號分類算法，算法流程如圖 1 所示。該算法主要有兩個核心步驟組成：一是構建一種適于 CNN 的心音信號預處理模型，重點需闡述如何將一維（one dimension，1D）心音信號組織成二維（two dimension，2D）特征圖；二是利用預處理得到的“特征圖”，訓練優化 CNN 網絡結構，尋找最適合心音信號的 CNN 結構和參數。本文期望通過基于 CNN 的深度學習方法，有效提取心音信號的特征，從而解決以往分類算法過程復雜、分類準確率不高、普適性差的問題。

圖1 本文心音分類識別算法流程圖 Figure1. Heart sound classification recognition algorithm flowchart in this study

圖選項

各分類算法	心音信號
各分類算法	acc	se	sp
SVM^[4]	0.820	0.880	0.760
MFCC+SVM^[6]	0.850	0.860	0.840
MFCC+KNN^[18]	0.840	0.820	0.860
MFCC+CNN^[7]	0.860	0.811	0.872
MFSC+CNN	0.895	0.910	0.880

1.	Tang Hong, Li Ting, Park Y, et al. Separation of heart sound signal from noise in joint cycle frequency-time-frequency domains based on fuzzy detection. IEEE Trans Biomed Eng, 2010, 57(10): 2438-2447.
2.	Gavrovska A, Bogdanovic V, Reljin I, et al. Automatic heart sound detection in pediatric patients without electrocardiogram reference via pseudo-affine Wigner-Ville distribution and Haar wavelet lifting. Comput Methods Programs Biomed, 2014, 113(2): 515-528.
3.	Abbas A, Bassam R. Phonocardiography signal processing. New York: Morgan and Claypool, 2009: 29-37.
4.	Safara F, Doraisamy S, Azman A, et al. Multi-level basis selection of wavelet packet de-composition tree for heart sound classification. Comput Biol Med, 2013, 43(10): 1407-1414.
5.	Ortiz P M, Drugalski C, Miranda V E, et al. Modelos acústicos HMM multimodales para sonidos cardiacos y pulmonares. Revista mexicana de ingeniería biomédica, 2014, 35(3): 197-209.
6.	Ortiz J J G, Phoo C P, Wiens J. Heart sound classification based on temporal alignment techniques// Computing in Cardiology Conference (CINC). Vancouver: IEEE, 2016, 43: 589-592.
7.	Maknickas V, Maknickas A. Recognition of normal-abnormal phonocardiographic signals using deep convolutional neural networks and mel-frequency spectral coefficients. Physiol Meas, 2017, 38(8): 1671-1684.
8.	Nabih-Ali M. El-Dahshan E A. Yahia A S. A review of intelligent systems for heart sound signal analysis. J Med Eng Technol, 2017, 41(7): 553-563.
9.	Papadaniil C D, Hadjileontiadis L J. Efficient heart sound segmentation and extraction using ensemble empirical mode decomposition and kurtosis features. IEEE J Biomed Health Inform, 2014, 18(4): 1138-1152.
10.	Sh-Hussain H, Mohamad M M, Zahilah R, et al. Classification of heart sound signals using autoregressive model and hidden markov model. Journal of Medical Imaging and Health Informatics, 2017, 7(4): 755-763.
11.	馬莉. 基于小波包分解的復雜心音信號分段定位與特征提取研究. 昆明: 云南大學, 2015.
12.	Krizhevsky A, Sutskever I, Hinton G E. ImageNet classification with deep convolutional neural networks. Commun ACM, 2017, 60(6): 84-90.
13.	Frigieri E P, Brito T G, Ynoguti C A, et al. Pattern recognition in audible sound energy emissions of AISI 52100 hardened steel turning: a MFCC-based approach. International Journal of Advanced Manufacturing Technology, 2017, 88(5-8): 1383-1392.
14.	Mohamed A. Deep neural network acoustic models for asr. Toronto: University of Toronto, 2014.
15.	Hu Zheng, Li Yongping, Yang Zhiyong. Improving convolutional neural network using pseudo derivative ReLU//5th International Conference On Systems And Informatics (ICSAI), Nanjing: IEEE, 2018: 283-287.
16.	Poernomo A, Kang D K. Biased dropout and crossmap dropout: learning towards effective dropout regularization in convolutional neural network. Neural Networks, 2018, 104: 60-67.
17.	Kingma D P, Ba J. Adam: a method for stochastic optimization// 3rd International Conference for Learning Representations, San Diego, 2015. arXiv: 1412.6980.
18.	Bobillo I J D. A tensor approach to heart sound classification//2016 Computing in Cardiology Conference (CinC), IEEE, 2016: 629-632.

《生物醫學工程學雜志》

基于卷積神經網絡的先心病心音信號分類算法

摘要 全文 圖表 視頻 參考文獻 施引文獻 補充材料

引言

1 預處理方法

1.1 數據來源

1.2 去噪

1.3 數據截取

1.4 維度變換

1.4.1 梅爾頻率系數

1.4.2 特征數據的組織

2 CNN 分類識別模型

2.1 數據準備

2.2 訓練環境

2.3 CNN 結構

3 CNN 訓練及結果

4 實驗結果及討論

5 結論

引言