下壁心肌梗死的早期檢測是降低下壁心肌梗死死亡率的重要手段。針對現有的下壁心肌梗死檢測存在模型結構復雜、特征冗余的問題,本文提出一種下壁心肌梗死檢測算法。該方法與臨床病理信息相結合,提取心電信號Ⅱ、Ⅲ和 aVF 三個導聯中的 QRS 波段和 ST-T 波段的峰值、面積以及 ST 的斜率等特征,并由遺傳算法依據單個特征以及特征之間的離散度進行判斷,選擇區分度較大的特征送入支持向量機(SVM),實現下壁心肌梗死檢測。本文采用德國國家計量學研究所(PTB)診斷心電數據庫對該方法進行驗證,準確率為 98.33%。本文方法有效地利用心電信號形態學特征實現了下壁心肌梗死的檢測,符合臨床醫生診斷以及下壁心肌梗死心電信號特異性改變的特點,適合臨床廣泛推廣以及便攜式設備應用的實現。
引用本文: 熊鵬, 齊明銳, 張杰爍, 劉明, 侯增廣, 王洪瑞, 劉秀玲. 基于形態學特征的下壁心肌梗死檢測. 生物醫學工程學雜志, 2021, 38(1): 65-71. doi: 10.7507/1001-5515.202001027 復制
版權信息: ?四川大學華西醫院華西期刊社《生物醫學工程學雜志》版權所有,未經授權不得轉載、改編
引言
據《中國心血管病報告 2018》統計,我國心血管疾病患病人數達 2.9 億,其中急性心肌梗死患者占比為 3.8%。下壁心肌梗死在急性心肌梗死中最為廣泛,具有發病率高、死亡率高的特點[1]。阿司匹林作為預防心血管疾病的廣泛使用的藥物,其收益往往被服藥帶來的其他風險抵消,因此可能不適用于心血管疾病的一級預防[2]。《急性心肌梗死的早期治療與臨床研究》中指出在發病 12 h 內進行心電圖檢查并且開通閉塞冠狀動脈、恢復血流,可控制心肌梗死面積[3]。越早采用經皮冠狀動脈介入治療使得冠狀動脈再通,患者獲益就越多[4],因此下壁心肌梗死的早期診斷至關重要。臨床中心電圖(electrocardiogram,ECG)反映了心臟不同部位生理性能變化,是早期診斷下壁心肌梗死最簡單有效的方式[5-7]。因此,基于心電圖的下壁心肌梗死早期診斷受到越來越多的學者關注。
目前,在下壁心肌梗死檢測研究中,Liu 等[8]基于 12 導聯的心電信號提出了多特征分支卷積神經網絡(Multiple-Feature-Branch Convolutional Neural Network,MFB-CNN)檢測模型,每個導聯對應一個分支學習,每個特征分支包含獨立的卷積層和池化層,通過 softmax 全局連通對所有特征進行匯總,完成下壁心肌梗死的檢測。這種通過深度學習進行超細化特征提取的方式增加了計算的復雜度,依靠大量的數據作為支撐,需要消耗過多的運算時間。Reasat 等[9]將原始的心電信號進行了降采樣處理,由原始的 1 000 Hz 降采樣為 64 Hz,放入搭建好的淺層卷積神經網絡自動檢測下壁心肌梗死,最終的準確率、敏感度和特異性在 80% 以上,該算法利用降采樣的方法減少了輸入信號的維度從而降低了模型的復雜度,但是信號降采樣的同時會導致信息丟失,使得算法精度下降。在這一領域,本研究團隊[10]也利用密集連接卷積網絡做出了有效嘗試,雖然取得了不錯的實驗精度,但由于網絡特性需將研究對象集中到單心拍數據以減少冗余度,與此同時需要大量的數據對有效特征自動提取,從而導致計算量的增加,使得該方法在便攜式智能終端應用實現中存在一定局限性。
人工設計并提取有效特征避免了神經網絡時間復雜度較高的問題。Sharma 等[11]依據多尺度小波變換下的心電信號協方差矩陣特征值不同的特性,提取 72 個特征對下壁心肌梗死進行檢測,準確率達到 96%。該方法采用小波變換對信號進行時頻域轉換,提取不同的特征完成檢測,然而過多維數特征中存在相關性較小的特征,對最終檢測結果產生過了擬合的影響。Acharya 等[12]對十二導聯心電信號中每個導聯使用小波變換,對變換后的每層小波系數提取小波熵、能量熵等十二種特征熵值,經過t檢驗篩選至 47 個特征時得到了較好的準確率。但是該方法的篩選過程中沒有考慮特征之間的相互關系,從而導致篩選結果不充分。Sharma 等[13]使用平穩小波變換將Ⅱ、Ⅲ和 aVF 三個導聯心電信號予以分解,提取樣本熵等特征,采用 GainRatio 方法對特征進行篩選,利用支持向量機(support vector machine,SVM)和 K 近鄰算法(K-nearest neighbor,KNN)進行分類,結果正確率僅有 81.71%,算法所得分類精度較低。
基于上述問題,本文提出了基于形態學的下壁心肌梗死檢測算法。該算法直接使用數據庫中連續時長的心電信號,避免了心電信號降采樣過程中信息丟失的問題,更加貼近臨床中直接獲取的心電數據,根據下壁心肌梗死心電信號發生的特異性改變,提取心電信號中Ⅱ、Ⅲ和 aVF 三個導聯的面積、斜率、均值、方差、峰度、偏斜度、斜率等 13 個特征,利用遺傳算法篩選出區分度比較大的特征組合,解決了特征維數較多的問題,最后利用 SVM 對篩選特征進行分類,以實現對下壁心肌梗死的自動診斷。
1 方法
本文提出的下壁心肌梗死的檢測算法主要由三部分組成:心電信號的預處理、形態特征的提取和特征的篩選及分類。原始十二導聯的信號通過小波變換去除基線漂移等噪聲;選取下壁心肌梗死對應導聯提取特征;采用遺傳算法對冗余特征進行篩選,導入 SVM 分類器完成對下壁心肌梗死的檢測。
1.1 數據及預處理
本文采用德國國家計量署提供的數字化心電數據庫(Physikalisch-Technische Bundesanstalt,PTB)收錄的心電數據[14],該數據包括 90 條下壁心肌梗死患者心電信號記錄以及 80 條正常心電信號記錄,每條記錄包含常規 12 導聯和 3 條 Frank 導聯(網址為:https://physionet.org/physiobank/database/ptbdb/)。本文讀取了 PTB 診斷心電數據庫中的 60 條健康受試者數據和 60 條下壁心肌梗死患者數據作為比較試驗的驗證集。每條數據取 10 s 時長的信號作為本文的實驗數據集,隨機選取 30 條健康心電信號與 30 條下壁心肌梗死的心電信號作為訓練集,其余的心電信號作為本文測試集。本文采用基于 DB6 小波基的離散小波變換去除原始信號中的噪聲,得到干凈信號[15]。
1.2 特征提取
在心電信號中,不同的導聯對應心臟不同部位,不同部位心肌梗死對應不同罪犯血管,因此對罪犯血管的判斷具有一定的挑戰性。在臨床中,下壁心肌梗死在心電信號中表現為壞死區存在病理性 Q 波、ST 段壓低以及 T 波直立并增高等變化,損傷區 ST 段弓背性抬高,缺血區 T 波倒置等特征,因此形態特征是下壁心肌梗死檢測的重要依據。
1.2.1 導聯信息的提取
心臟是一個立體結構,如圖 1 所示,在不同位置放置電極片組成心電圖中不同的導聯,心臟每個部位的電位變換都可以由多個導聯共同表示。下壁心肌梗死對應的罪犯血管多來自于右冠狀動脈、左回旋支以及前降支心血管,該部位血管對應導聯為Ⅱ、Ⅲ和 aVF 三個導聯[16-17],Ⅱ、Ⅲ和 aVF 三個導聯對于下壁心肌梗死的檢測更加具有指向性,因此本文選擇Ⅱ、Ⅲ和 aVF 三個導聯進行特征提取,對冗余導聯進行剔除。
 圖1
				心臟部位與導聯對應圖
			
												
				Figure1.
				Correspondence map of heart part and lead
						
				圖1
				心臟部位與導聯對應圖
			
												
				Figure1.
				Correspondence map of heart part and lead
			
								1.2.2 形態特征的提取
完整的心動周期是由 P、QRS、ST 段和 T 波組成,其中 ST 段和 T 波并稱為 ST-T 波段,ST-T 從 QRS 終點開始,到 T 波結束而結束。下壁心肌梗死和正常的心電信號在不同導聯的形態如圖 2 所示,正常心電信號以及下壁心肌梗死的心電信號形態有顯著的差別。與正常心電信號相比,下壁心肌梗死多出現病理性 Q 波、ST 波段抬高和 T 波倒置等表現。
 圖2
				Ⅱ、Ⅲ和 aVF 導聯正常與心肌梗死心拍波形圖
			
												
				Figure2.
				Heartbeat waveform of Ⅱ,Ⅲ and aVF leads of normal ECG and myocardial infarction ECG
						
				圖2
				Ⅱ、Ⅲ和 aVF 導聯正常與心肌梗死心拍波形圖
			
												
				Figure2.
				Heartbeat waveform of Ⅱ,Ⅲ and aVF leads of normal ECG and myocardial infarction ECG
			
								在特征提取的過程中,心電信號記為 ,使用 Pan-Tompkins 算法對信號的 QRS 波段進行標注[18],其中 QRS 波段的起始點為
,使用 Pan-Tompkins 算法對信號的 QRS 波段進行標注[18],其中 QRS 波段的起始點為 ,終點為
,終點為 ,QRS 峰值大小即 R 峰為
,QRS 峰值大小即 R 峰為 。根據一個心電信號的完整心動周期以及和數據庫采樣頻率的對應關系進行 ST-T 波段的標注。該數據庫中所選實驗數據采樣頻率為 1 000 Hz,在一個完整的心動周期中 ST 波段占時為 0~0.15 s,T 波時長為 0.1~0.15 s[19],因此取 R 峰后的 400 個樣本點選為 T 波的終點,記為
。根據一個心電信號的完整心動周期以及和數據庫采樣頻率的對應關系進行 ST-T 波段的標注。該數據庫中所選實驗數據采樣頻率為 1 000 Hz,在一個完整的心動周期中 ST 波段占時為 0~0.15 s,T 波時長為 0.1~0.15 s[19],因此取 R 峰后的 400 個樣本點選為 T 波的終點,記為 ,在 ST-T 段取波段中最值為 T 波峰值,峰值大小記為
,在 ST-T 段取波段中最值為 T 波峰值,峰值大小記為 ,對應點為
,對應點為 。信號各波段的標注如圖 3 所示。
。信號各波段的標注如圖 3 所示。
 圖3
				心電信號各個波段標注
			
												
				Figure3.
				Each band label of ECG signal
						
				圖3
				心電信號各個波段標注
			
												
				Figure3.
				Each band label of ECG signal
			
								下壁心肌梗死在心電圖上的表現主要為 ST 段弓背性上升、T 波倒置以及病理性 Q 波等,特征變化主要集中在 QRS 復合波以及 ST-T 波段。本文提取 QRS 復合波以及 ST-T 波段的峰值、面積、均值以及斜率以表征心電信號形態,反映形態學的變化以及心肌細胞和心臟的狀態。其中 QRS 復合波段面積和均值分別如式(1)、(2)所示,峰值取 R 峰以及 T 波最值點。斜率取 QRS 波終點與 ST-T 波段峰值兩點的比值如式(3)所示:
|  | 
|  | 
|  | 
標準差反映了數據分散程度,表現了整個波段的形態改變。以 為起始點,
為起始點, 為終止點,QRS 復合波段每個幅值的標準差取值如式(4)所示:
為終止點,QRS 復合波段每個幅值的標準差取值如式(4)所示:
|  | 
偏斜度以及峰度根據波段中偏態值的大小以及該波段尖度的大小反映兩個波段峰值的形態變化,可表現出病理性 Q 波以及異常 ST 段的改變。以 為起始點,
為起始點, 為終止點,QRS 復合波段偏斜度以及峰度的取值如式(5)、(6)所示:
為終止點,QRS 復合波段偏斜度以及峰度的取值如式(5)、(6)所示:
|  | 
|  | 
同理依照上述方法將取值區間更替為以 為起始點、以
為起始點、以 為終止點的 ST-T 數據段即可得到 ST-T 波段的各個特征,針對每條心電數據的Ⅱ、Ⅲ和 aVF 三個導聯分別提取以上特征,完成對所有特征的提取。
為終止點的 ST-T 數據段即可得到 ST-T 波段的各個特征,針對每條心電數據的Ⅱ、Ⅲ和 aVF 三個導聯分別提取以上特征,完成對所有特征的提取。
1.3 特征篩選
不同導聯中對同一波段的病理性特征表現存在一定差異,在下壁心肌梗死的檢測過程中,如圖 2 所示,不同導聯的 ST 段發生病變的形態變化幅度也不同,因此需要從所有的特征中篩選出對于分類有益比例高的特征。本文使用遺傳算法對下壁導聯中提取的Ⅱ、Ⅲ和 aVF 三個導聯的 ST 的斜率以及 QRS、ST-T 兩個波段的標準差、均值、面積、偏斜度、峰度和峰值共 39 個形態學特征進行篩選,將區分度較低的特征剔除,保留區分度較大的特征,從而提高下壁心肌梗死的檢測精度。
遺傳算法把提取的特征編碼為一條染色體[20],在本文中所有特征描述為一條由 39 個 0/1 字符組成的字符串,0 代表該特征沒有被選中,1 代表該特征被選中。當篩選 d 個特征時,這樣的染色體共有  種。優化的目標被描述成適應度函數,每一條染色體對應一個適應度值
 種。優化的目標被描述成適應度函數,每一條染色體對應一個適應度值  ,選擇最大適應度值對應的特征作為本文特征篩選結果。為保證篩選后特征的魯棒性,實驗在 120 條提取特征后的數據中選取 30 條正常數據以及 30 條下壁心肌梗死數據,共 60 條數據作為訓練集進行特征篩選。
,選擇最大適應度值對應的特征作為本文特征篩選結果。為保證篩選后特征的魯棒性,實驗在 120 條提取特征后的數據中選取 30 條正常數據以及 30 條下壁心肌梗死數據,共 60 條數據作為訓練集進行特征篩選。
本文取類間的離散度以及類內離散度的比值作為本文的適應函數。取下壁心肌梗死信號離散度  以及正常心電信號的離散度
 以及正常心電信號的離散度  的平均值作為類內離散度取值
 的平均值作為類內離散度取值  。其中
。其中  分別如式(7)~(9)所示:
 分別如式(7)~(9)所示:
|  | 
|  | 
|  | 
其中  在式(7)和式(8)中分別為下壁心肌梗死和正常心電信號的 30 條數據,
 在式(7)和式(8)中分別為下壁心肌梗死和正常心電信號的 30 條數據, 為 30 條下壁心肌梗死心電信號每個特征的均值向量,
 為 30 條下壁心肌梗死心電信號每個特征的均值向量, 為 30 條正常心電信號每個特征的均值向量,
 為 30 條正常心電信號每個特征的均值向量, 的取值分別如式(10)、(11)所示:
 的取值分別如式(10)、(11)所示:
|  | 
|  | 
全局每個特征的均值向量 及類間離散度大小分別如式(12)、(13)所示:
及類間離散度大小分別如式(12)、(13)所示:
|  | 
|  | 
當且僅當類內離散度取最小值且類間離散度取得最大值時對特征的篩選才達到最優值,故本文適應度  取值如式(14)所示:
 取值如式(14)所示:
|  | 
對于本文中的 39 個形態學特征,染色體中隨機初始化選擇一定量特征,重復多次試驗,在試驗中得到多條染色體的初代種群 M,每條染色體都互不相同。計算種群 M 種的適應度  ,經過比較計算之后,得到每條染色體的最大適應度值。通過初代種群的交叉、變異和重復迭代最終獲得全局最優的適應度
,經過比較計算之后,得到每條染色體的最大適應度值。通過初代種群的交叉、變異和重復迭代最終獲得全局最優的適應度  ,進而完成特征篩選。
,進而完成特征篩選。
1.4 SVM 分類器
SVM 是一種基于統計學習原理的單層高度非線性網絡。它能夠正確地對潛在的或不清晰的可觀察模式進行分類。與其他分類器不同的是,SVM 可以將結構風險最小化。在 SVM 的訓練過程中,最大限度地提高了模式到超平面的距離。一般情況下,模式是不可線性分離的,因此需要進行非線性核變換。本文采用徑向基核函數將數據映射為高維函數,SVM 的性能受超參數(懲罰參數和核參數)的影響,這些參數決定了 SVM 的支持向量個數和最大裕度。對于 SVM,設( ,
, )為樣本,決策函數
)為樣本,決策函數  為:
 為:
|  | 
其中  是核函數,
 是核函數, 表示拉格朗日乘子,b 是 SVM 的偏置函數。
 表示拉格朗日乘子,b 是 SVM 的偏置函數。
|  | 
對于核函數,g 代表核函數的超參數。
在參數調優運算過程中,先在大范圍內粗略尋找最優參數,再根據指定的范圍進行細致的尋優來得到最優的參數值,從而快速和精準地定位到最優參數,實現對提取特征的檢測,完成對正常心電信號和下壁心肌梗死信號的分類。
2 結果和討論
2.1 評價指標
本文采用準確率(Accuracy)、敏感度(Sensitivity)和特異性(Specificity)三個參數對檢測結果進行評估。三個參數具體定義式如式(17)~(19)所示:
|  | 
|  | 
|  | 
其中 TP(true positive)代表了實際為下壁心肌梗死且被分類器劃分為下壁心肌梗死的樣本數;TN(true negative)為代表了實際為正常心電信號且被分類器劃分為正常心電信號的樣本數;FN(false negative)代表了實際為下壁心肌梗死但被分類器劃分為正常心電信號的樣本數;FP(false positive)為代表了實際為正常心電信號但被分類器劃分為下壁心肌梗死的樣本數。
2.2 特征篩選分類結果
本文采用遺傳算法對特征進行篩選,根據適應度  選取區分度較大的特征組合進行實驗。實驗分別對每個維度的特征進行篩選,不同維度特征下的適應度以及分類結果如表 1 所示,在特征總數為 26 的時候取得最大適應值 0.545,此時檢測的準確率、敏感度以及特異性分別為 98.33%、100% 以及 96.67%。在 60 條待測數據中對 59 條數據實現了正確的檢測,其中敏感度更是達到 100%,達到較好的檢測結果。
 選取區分度較大的特征組合進行實驗。實驗分別對每個維度的特征進行篩選,不同維度特征下的適應度以及分類結果如表 1 所示,在特征總數為 26 的時候取得最大適應值 0.545,此時檢測的準確率、敏感度以及特異性分別為 98.33%、100% 以及 96.67%。在 60 條待測數據中對 59 條數據實現了正確的檢測,其中敏感度更是達到 100%,達到較好的檢測結果。
 表1
                不同特征數的下壁心肌梗死檢測
		 	
		 			 				Table1.
    			Detection of inferior myocardial infarction with diffe  rent characteristics
			
						表1
                不同特征數的下壁心肌梗死檢測
		 	
		 			 				Table1.
    			Detection of inferior myocardial infarction with diffe  rent characteristics
       		
       				為證明存在一定冗余特征以及特征篩選的必要性,本文與未經過篩選的結果進行對比。未經過特征篩選的實驗組,其準確率、敏感度以及特異性分別為 96.67%、96.67% 和 96.67%。在 60 條檢測的結果中,對 58 條數據實現了正確的檢測,但仍然存在一定的冗余特征,對正檢率造成影響。
下壁心肌梗死導致Ⅱ、Ⅲ和 aVF 三個導聯心電信號發生病理性變化,但每個導聯之間的變化程度并不相同。經過遺傳算法對特征進行篩選,篩選出的特征如表 2 所示,包括Ⅱ導聯篩選出的 9 個特征、Ⅲ導聯篩選出的 8 個特征以及 aVF 導聯篩選出的 9 個特征。由表 2 可以看出心電信號中的標準差、偏斜度以及峰度在正常心電信號與下壁心肌梗死信號存在較大差異。在面積、均值以及峰值中,ST-T 峰值變化在檢測過程中差異比較明顯,這是下壁心肌梗死心電信號 ST-T 波段中 T 波倒置所導致。均值和面積在不同導聯的兩個波段的變化程度也存在一定的差異性。大部分的下壁心肌梗死為右冠狀動脈堵塞所致[21],表現為下壁心肌梗死心電信號在Ⅱ導聯 ST-T 波段變化幅度相比于Ⅲ導聯更為明顯,本文在Ⅱ導聯的 ST-T 波段篩選出的特征數目上也略高于Ⅲ導聯,與文獻[21]中病變信號特征表征一致。
 表2
                篩選后的有效特征
		 	
		 			 				Table2.
    			Effective feature after screening
			
						表2
                篩選后的有效特征
		 	
		 			 				Table2.
    			Effective feature after screening
       		
       				2.3 與其他方法檢測精度的比較
將本文提出的基于形態學特征檢測的方法與現有的下壁心肌梗死檢測方法的結果進行對比,如表 3 所示。與基于深度學習模型實現檢測的算法比較,本文的實驗結果明顯優于文獻[8-9],但是略低于文獻[10]中 99.95% 的正確率。文獻[10]構建密集卷積神經網絡檢測下壁心肌梗死,依靠大量單心拍標記樣本提取深層次特征信息,不可避免地增加了計算的復雜度。文獻[9]在對數據進行下采樣后,采用淺層 CNN 網絡,但依然依賴大量標記數據實現特征提取。相比于此類算法,本文的方法無需通過大量的數據進行訓練,并且沒有進行下采樣處理,保留了完整的原始信息。
 表3
                下壁心肌梗死檢測結果對比
		 	
		 			 				Table3.
    			Comparison of detection results of inferior myocardial   infarction
			
						表3
                下壁心肌梗死檢測結果對比
		 	
		 			 				Table3.
    			Comparison of detection results of inferior myocardial   infarction
       		
       				與依據心電特性提取特征的檢測算法比較,本文在準確率、敏感度和特異性方面均明顯優于文獻[11-13]的下壁心肌梗死檢測結果。與文獻[11-13]中經過時頻域轉換提取特征的方法相比,形態學特征更加具有醫學指征性,能夠較為直觀地反映心電信號的差異,因此能夠更好地滿足下壁心肌梗死檢測的臨床要求,實現下壁心肌梗死的準確檢測。
2.4 與其他方法時間復雜度的比較
本文采用時間復雜度衡量不同實驗方法,算法中語句執行次數多,花費時間就越長。將一個算法中語句執行的次數記為  ,其中 n 為語句規模的大小,引入輔助函數
,其中 n 為語句規模的大小,引入輔助函數  使得
 使得  的極限值為非零常數,且
 的極限值為非零常數,且  的系數項為 1,則時間復雜度如式(20)所示:
 的系數項為 1,則時間復雜度如式(20)所示:
|  | 
在本文算法中,只需對每個輸入的樣本提取經過特征篩選后的 26 個特征,不存在高階運算,因此 為 26,
為 26, 為 1,時間復雜度為
為 1,時間復雜度為 。
。
在深度學習檢測的算法中,卷積神經網絡在下壁心肌梗死的檢測中取得較好的結果。文獻[6-8]中也均是基于卷積神經網絡進行改進從而實現對下壁心肌梗死的檢測。對于卷積神經網絡,每個卷積層的時間復雜度為  ,其中M為卷積核輸出特征的邊長,K 為每個卷積核的邊長,
,其中M為卷積核輸出特征的邊長,K 為每個卷積核的邊長, 為輸入通道個數,
 為輸入通道個數, 為輸出通道個數[22]。因此整個卷積神經網絡的時間復雜度為
 為輸出通道個數[22]。因此整個卷積神經網絡的時間復雜度為  ,其中 D 為卷積層的個數。通過比較可以看出本文算法在時間復雜度的計算中遠小于卷積神經網絡的運算,從而具有更好的時效性。
,其中 D 為卷積層的個數。通過比較可以看出本文算法在時間復雜度的計算中遠小于卷積神經網絡的運算,從而具有更好的時效性。
3 結論
本文選用下壁心肌梗死醫學指征的Ⅱ、Ⅲ和 aVF 三個導聯原始心電信號,避免了在信號降采樣中信息丟失的問題,根據臨床檢測依據進行形態學特征提取。在提取的特征中,針對相同波段在不同導聯中對病理性特征表現程度不同的問題,采用遺傳算法對模型檢測貢獻最大的特征組合進行篩選,最后使用 SVM 對篩選后的特征進行分類并得到較好的結果。該方法運算簡單,準確率較高,無論在臨床環境中或者是便攜式設備中引入該方法,都可以幫助醫生快速診斷下壁心肌梗死,使患者盡快得到治療。
利益沖突聲明:本文全體作者均聲明不存在利益沖突。
引言
據《中國心血管病報告 2018》統計,我國心血管疾病患病人數達 2.9 億,其中急性心肌梗死患者占比為 3.8%。下壁心肌梗死在急性心肌梗死中最為廣泛,具有發病率高、死亡率高的特點[1]。阿司匹林作為預防心血管疾病的廣泛使用的藥物,其收益往往被服藥帶來的其他風險抵消,因此可能不適用于心血管疾病的一級預防[2]。《急性心肌梗死的早期治療與臨床研究》中指出在發病 12 h 內進行心電圖檢查并且開通閉塞冠狀動脈、恢復血流,可控制心肌梗死面積[3]。越早采用經皮冠狀動脈介入治療使得冠狀動脈再通,患者獲益就越多[4],因此下壁心肌梗死的早期診斷至關重要。臨床中心電圖(electrocardiogram,ECG)反映了心臟不同部位生理性能變化,是早期診斷下壁心肌梗死最簡單有效的方式[5-7]。因此,基于心電圖的下壁心肌梗死早期診斷受到越來越多的學者關注。
目前,在下壁心肌梗死檢測研究中,Liu 等[8]基于 12 導聯的心電信號提出了多特征分支卷積神經網絡(Multiple-Feature-Branch Convolutional Neural Network,MFB-CNN)檢測模型,每個導聯對應一個分支學習,每個特征分支包含獨立的卷積層和池化層,通過 softmax 全局連通對所有特征進行匯總,完成下壁心肌梗死的檢測。這種通過深度學習進行超細化特征提取的方式增加了計算的復雜度,依靠大量的數據作為支撐,需要消耗過多的運算時間。Reasat 等[9]將原始的心電信號進行了降采樣處理,由原始的 1 000 Hz 降采樣為 64 Hz,放入搭建好的淺層卷積神經網絡自動檢測下壁心肌梗死,最終的準確率、敏感度和特異性在 80% 以上,該算法利用降采樣的方法減少了輸入信號的維度從而降低了模型的復雜度,但是信號降采樣的同時會導致信息丟失,使得算法精度下降。在這一領域,本研究團隊[10]也利用密集連接卷積網絡做出了有效嘗試,雖然取得了不錯的實驗精度,但由于網絡特性需將研究對象集中到單心拍數據以減少冗余度,與此同時需要大量的數據對有效特征自動提取,從而導致計算量的增加,使得該方法在便攜式智能終端應用實現中存在一定局限性。
人工設計并提取有效特征避免了神經網絡時間復雜度較高的問題。Sharma 等[11]依據多尺度小波變換下的心電信號協方差矩陣特征值不同的特性,提取 72 個特征對下壁心肌梗死進行檢測,準確率達到 96%。該方法采用小波變換對信號進行時頻域轉換,提取不同的特征完成檢測,然而過多維數特征中存在相關性較小的特征,對最終檢測結果產生過了擬合的影響。Acharya 等[12]對十二導聯心電信號中每個導聯使用小波變換,對變換后的每層小波系數提取小波熵、能量熵等十二種特征熵值,經過t檢驗篩選至 47 個特征時得到了較好的準確率。但是該方法的篩選過程中沒有考慮特征之間的相互關系,從而導致篩選結果不充分。Sharma 等[13]使用平穩小波變換將Ⅱ、Ⅲ和 aVF 三個導聯心電信號予以分解,提取樣本熵等特征,采用 GainRatio 方法對特征進行篩選,利用支持向量機(support vector machine,SVM)和 K 近鄰算法(K-nearest neighbor,KNN)進行分類,結果正確率僅有 81.71%,算法所得分類精度較低。
基于上述問題,本文提出了基于形態學的下壁心肌梗死檢測算法。該算法直接使用數據庫中連續時長的心電信號,避免了心電信號降采樣過程中信息丟失的問題,更加貼近臨床中直接獲取的心電數據,根據下壁心肌梗死心電信號發生的特異性改變,提取心電信號中Ⅱ、Ⅲ和 aVF 三個導聯的面積、斜率、均值、方差、峰度、偏斜度、斜率等 13 個特征,利用遺傳算法篩選出區分度比較大的特征組合,解決了特征維數較多的問題,最后利用 SVM 對篩選特征進行分類,以實現對下壁心肌梗死的自動診斷。
1 方法
本文提出的下壁心肌梗死的檢測算法主要由三部分組成:心電信號的預處理、形態特征的提取和特征的篩選及分類。原始十二導聯的信號通過小波變換去除基線漂移等噪聲;選取下壁心肌梗死對應導聯提取特征;采用遺傳算法對冗余特征進行篩選,導入 SVM 分類器完成對下壁心肌梗死的檢測。
1.1 數據及預處理
本文采用德國國家計量署提供的數字化心電數據庫(Physikalisch-Technische Bundesanstalt,PTB)收錄的心電數據[14],該數據包括 90 條下壁心肌梗死患者心電信號記錄以及 80 條正常心電信號記錄,每條記錄包含常規 12 導聯和 3 條 Frank 導聯(網址為:https://physionet.org/physiobank/database/ptbdb/)。本文讀取了 PTB 診斷心電數據庫中的 60 條健康受試者數據和 60 條下壁心肌梗死患者數據作為比較試驗的驗證集。每條數據取 10 s 時長的信號作為本文的實驗數據集,隨機選取 30 條健康心電信號與 30 條下壁心肌梗死的心電信號作為訓練集,其余的心電信號作為本文測試集。本文采用基于 DB6 小波基的離散小波變換去除原始信號中的噪聲,得到干凈信號[15]。
1.2 特征提取
在心電信號中,不同的導聯對應心臟不同部位,不同部位心肌梗死對應不同罪犯血管,因此對罪犯血管的判斷具有一定的挑戰性。在臨床中,下壁心肌梗死在心電信號中表現為壞死區存在病理性 Q 波、ST 段壓低以及 T 波直立并增高等變化,損傷區 ST 段弓背性抬高,缺血區 T 波倒置等特征,因此形態特征是下壁心肌梗死檢測的重要依據。
1.2.1 導聯信息的提取
心臟是一個立體結構,如圖 1 所示,在不同位置放置電極片組成心電圖中不同的導聯,心臟每個部位的電位變換都可以由多個導聯共同表示。下壁心肌梗死對應的罪犯血管多來自于右冠狀動脈、左回旋支以及前降支心血管,該部位血管對應導聯為Ⅱ、Ⅲ和 aVF 三個導聯[16-17],Ⅱ、Ⅲ和 aVF 三個導聯對于下壁心肌梗死的檢測更加具有指向性,因此本文選擇Ⅱ、Ⅲ和 aVF 三個導聯進行特征提取,對冗余導聯進行剔除。
 圖1
				心臟部位與導聯對應圖
			
												
				Figure1.
				Correspondence map of heart part and lead
						
				圖1
				心臟部位與導聯對應圖
			
												
				Figure1.
				Correspondence map of heart part and lead
			
								1.2.2 形態特征的提取
完整的心動周期是由 P、QRS、ST 段和 T 波組成,其中 ST 段和 T 波并稱為 ST-T 波段,ST-T 從 QRS 終點開始,到 T 波結束而結束。下壁心肌梗死和正常的心電信號在不同導聯的形態如圖 2 所示,正常心電信號以及下壁心肌梗死的心電信號形態有顯著的差別。與正常心電信號相比,下壁心肌梗死多出現病理性 Q 波、ST 波段抬高和 T 波倒置等表現。
 圖2
				Ⅱ、Ⅲ和 aVF 導聯正常與心肌梗死心拍波形圖
			
												
				Figure2.
				Heartbeat waveform of Ⅱ,Ⅲ and aVF leads of normal ECG and myocardial infarction ECG
						
				圖2
				Ⅱ、Ⅲ和 aVF 導聯正常與心肌梗死心拍波形圖
			
												
				Figure2.
				Heartbeat waveform of Ⅱ,Ⅲ and aVF leads of normal ECG and myocardial infarction ECG
			
								在特征提取的過程中,心電信號記為 ,使用 Pan-Tompkins 算法對信號的 QRS 波段進行標注[18],其中 QRS 波段的起始點為
,使用 Pan-Tompkins 算法對信號的 QRS 波段進行標注[18],其中 QRS 波段的起始點為 ,終點為
,終點為 ,QRS 峰值大小即 R 峰為
,QRS 峰值大小即 R 峰為 。根據一個心電信號的完整心動周期以及和數據庫采樣頻率的對應關系進行 ST-T 波段的標注。該數據庫中所選實驗數據采樣頻率為 1 000 Hz,在一個完整的心動周期中 ST 波段占時為 0~0.15 s,T 波時長為 0.1~0.15 s[19],因此取 R 峰后的 400 個樣本點選為 T 波的終點,記為
。根據一個心電信號的完整心動周期以及和數據庫采樣頻率的對應關系進行 ST-T 波段的標注。該數據庫中所選實驗數據采樣頻率為 1 000 Hz,在一個完整的心動周期中 ST 波段占時為 0~0.15 s,T 波時長為 0.1~0.15 s[19],因此取 R 峰后的 400 個樣本點選為 T 波的終點,記為 ,在 ST-T 段取波段中最值為 T 波峰值,峰值大小記為
,在 ST-T 段取波段中最值為 T 波峰值,峰值大小記為 ,對應點為
,對應點為 。信號各波段的標注如圖 3 所示。
。信號各波段的標注如圖 3 所示。
 圖3
				心電信號各個波段標注
			
												
				Figure3.
				Each band label of ECG signal
						
				圖3
				心電信號各個波段標注
			
												
				Figure3.
				Each band label of ECG signal
			
								下壁心肌梗死在心電圖上的表現主要為 ST 段弓背性上升、T 波倒置以及病理性 Q 波等,特征變化主要集中在 QRS 復合波以及 ST-T 波段。本文提取 QRS 復合波以及 ST-T 波段的峰值、面積、均值以及斜率以表征心電信號形態,反映形態學的變化以及心肌細胞和心臟的狀態。其中 QRS 復合波段面積和均值分別如式(1)、(2)所示,峰值取 R 峰以及 T 波最值點。斜率取 QRS 波終點與 ST-T 波段峰值兩點的比值如式(3)所示:
|  | 
|  | 
|  | 
標準差反映了數據分散程度,表現了整個波段的形態改變。以 為起始點,
為起始點, 為終止點,QRS 復合波段每個幅值的標準差取值如式(4)所示:
為終止點,QRS 復合波段每個幅值的標準差取值如式(4)所示:
|  | 
偏斜度以及峰度根據波段中偏態值的大小以及該波段尖度的大小反映兩個波段峰值的形態變化,可表現出病理性 Q 波以及異常 ST 段的改變。以 為起始點,
為起始點, 為終止點,QRS 復合波段偏斜度以及峰度的取值如式(5)、(6)所示:
為終止點,QRS 復合波段偏斜度以及峰度的取值如式(5)、(6)所示:
|  | 
|  | 
同理依照上述方法將取值區間更替為以 為起始點、以
為起始點、以 為終止點的 ST-T 數據段即可得到 ST-T 波段的各個特征,針對每條心電數據的Ⅱ、Ⅲ和 aVF 三個導聯分別提取以上特征,完成對所有特征的提取。
為終止點的 ST-T 數據段即可得到 ST-T 波段的各個特征,針對每條心電數據的Ⅱ、Ⅲ和 aVF 三個導聯分別提取以上特征,完成對所有特征的提取。
1.3 特征篩選
不同導聯中對同一波段的病理性特征表現存在一定差異,在下壁心肌梗死的檢測過程中,如圖 2 所示,不同導聯的 ST 段發生病變的形態變化幅度也不同,因此需要從所有的特征中篩選出對于分類有益比例高的特征。本文使用遺傳算法對下壁導聯中提取的Ⅱ、Ⅲ和 aVF 三個導聯的 ST 的斜率以及 QRS、ST-T 兩個波段的標準差、均值、面積、偏斜度、峰度和峰值共 39 個形態學特征進行篩選,將區分度較低的特征剔除,保留區分度較大的特征,從而提高下壁心肌梗死的檢測精度。
遺傳算法把提取的特征編碼為一條染色體[20],在本文中所有特征描述為一條由 39 個 0/1 字符組成的字符串,0 代表該特征沒有被選中,1 代表該特征被選中。當篩選 d 個特征時,這樣的染色體共有  種。優化的目標被描述成適應度函數,每一條染色體對應一個適應度值
 種。優化的目標被描述成適應度函數,每一條染色體對應一個適應度值  ,選擇最大適應度值對應的特征作為本文特征篩選結果。為保證篩選后特征的魯棒性,實驗在 120 條提取特征后的數據中選取 30 條正常數據以及 30 條下壁心肌梗死數據,共 60 條數據作為訓練集進行特征篩選。
,選擇最大適應度值對應的特征作為本文特征篩選結果。為保證篩選后特征的魯棒性,實驗在 120 條提取特征后的數據中選取 30 條正常數據以及 30 條下壁心肌梗死數據,共 60 條數據作為訓練集進行特征篩選。
本文取類間的離散度以及類內離散度的比值作為本文的適應函數。取下壁心肌梗死信號離散度  以及正常心電信號的離散度
 以及正常心電信號的離散度  的平均值作為類內離散度取值
 的平均值作為類內離散度取值  。其中
。其中  分別如式(7)~(9)所示:
 分別如式(7)~(9)所示:
|  | 
|  | 
|  | 
其中  在式(7)和式(8)中分別為下壁心肌梗死和正常心電信號的 30 條數據,
 在式(7)和式(8)中分別為下壁心肌梗死和正常心電信號的 30 條數據, 為 30 條下壁心肌梗死心電信號每個特征的均值向量,
 為 30 條下壁心肌梗死心電信號每個特征的均值向量, 為 30 條正常心電信號每個特征的均值向量,
 為 30 條正常心電信號每個特征的均值向量, 的取值分別如式(10)、(11)所示:
 的取值分別如式(10)、(11)所示:
|  | 
|  | 
全局每個特征的均值向量 及類間離散度大小分別如式(12)、(13)所示:
及類間離散度大小分別如式(12)、(13)所示:
|  | 
|  | 
當且僅當類內離散度取最小值且類間離散度取得最大值時對特征的篩選才達到最優值,故本文適應度  取值如式(14)所示:
 取值如式(14)所示:
|  | 
對于本文中的 39 個形態學特征,染色體中隨機初始化選擇一定量特征,重復多次試驗,在試驗中得到多條染色體的初代種群 M,每條染色體都互不相同。計算種群 M 種的適應度  ,經過比較計算之后,得到每條染色體的最大適應度值。通過初代種群的交叉、變異和重復迭代最終獲得全局最優的適應度
,經過比較計算之后,得到每條染色體的最大適應度值。通過初代種群的交叉、變異和重復迭代最終獲得全局最優的適應度  ,進而完成特征篩選。
,進而完成特征篩選。
1.4 SVM 分類器
SVM 是一種基于統計學習原理的單層高度非線性網絡。它能夠正確地對潛在的或不清晰的可觀察模式進行分類。與其他分類器不同的是,SVM 可以將結構風險最小化。在 SVM 的訓練過程中,最大限度地提高了模式到超平面的距離。一般情況下,模式是不可線性分離的,因此需要進行非線性核變換。本文采用徑向基核函數將數據映射為高維函數,SVM 的性能受超參數(懲罰參數和核參數)的影響,這些參數決定了 SVM 的支持向量個數和最大裕度。對于 SVM,設( ,
, )為樣本,決策函數
)為樣本,決策函數  為:
 為:
|  | 
其中  是核函數,
 是核函數, 表示拉格朗日乘子,b 是 SVM 的偏置函數。
 表示拉格朗日乘子,b 是 SVM 的偏置函數。
|  | 
對于核函數,g 代表核函數的超參數。
在參數調優運算過程中,先在大范圍內粗略尋找最優參數,再根據指定的范圍進行細致的尋優來得到最優的參數值,從而快速和精準地定位到最優參數,實現對提取特征的檢測,完成對正常心電信號和下壁心肌梗死信號的分類。
2 結果和討論
2.1 評價指標
本文采用準確率(Accuracy)、敏感度(Sensitivity)和特異性(Specificity)三個參數對檢測結果進行評估。三個參數具體定義式如式(17)~(19)所示:
|  | 
|  | 
|  | 
其中 TP(true positive)代表了實際為下壁心肌梗死且被分類器劃分為下壁心肌梗死的樣本數;TN(true negative)為代表了實際為正常心電信號且被分類器劃分為正常心電信號的樣本數;FN(false negative)代表了實際為下壁心肌梗死但被分類器劃分為正常心電信號的樣本數;FP(false positive)為代表了實際為正常心電信號但被分類器劃分為下壁心肌梗死的樣本數。
2.2 特征篩選分類結果
本文采用遺傳算法對特征進行篩選,根據適應度  選取區分度較大的特征組合進行實驗。實驗分別對每個維度的特征進行篩選,不同維度特征下的適應度以及分類結果如表 1 所示,在特征總數為 26 的時候取得最大適應值 0.545,此時檢測的準確率、敏感度以及特異性分別為 98.33%、100% 以及 96.67%。在 60 條待測數據中對 59 條數據實現了正確的檢測,其中敏感度更是達到 100%,達到較好的檢測結果。
 選取區分度較大的特征組合進行實驗。實驗分別對每個維度的特征進行篩選,不同維度特征下的適應度以及分類結果如表 1 所示,在特征總數為 26 的時候取得最大適應值 0.545,此時檢測的準確率、敏感度以及特異性分別為 98.33%、100% 以及 96.67%。在 60 條待測數據中對 59 條數據實現了正確的檢測,其中敏感度更是達到 100%,達到較好的檢測結果。
 表1
                不同特征數的下壁心肌梗死檢測
		 	
		 			 				Table1.
    			Detection of inferior myocardial infarction with diffe  rent characteristics
			
						表1
                不同特征數的下壁心肌梗死檢測
		 	
		 			 				Table1.
    			Detection of inferior myocardial infarction with diffe  rent characteristics
       		
       				為證明存在一定冗余特征以及特征篩選的必要性,本文與未經過篩選的結果進行對比。未經過特征篩選的實驗組,其準確率、敏感度以及特異性分別為 96.67%、96.67% 和 96.67%。在 60 條檢測的結果中,對 58 條數據實現了正確的檢測,但仍然存在一定的冗余特征,對正檢率造成影響。
下壁心肌梗死導致Ⅱ、Ⅲ和 aVF 三個導聯心電信號發生病理性變化,但每個導聯之間的變化程度并不相同。經過遺傳算法對特征進行篩選,篩選出的特征如表 2 所示,包括Ⅱ導聯篩選出的 9 個特征、Ⅲ導聯篩選出的 8 個特征以及 aVF 導聯篩選出的 9 個特征。由表 2 可以看出心電信號中的標準差、偏斜度以及峰度在正常心電信號與下壁心肌梗死信號存在較大差異。在面積、均值以及峰值中,ST-T 峰值變化在檢測過程中差異比較明顯,這是下壁心肌梗死心電信號 ST-T 波段中 T 波倒置所導致。均值和面積在不同導聯的兩個波段的變化程度也存在一定的差異性。大部分的下壁心肌梗死為右冠狀動脈堵塞所致[21],表現為下壁心肌梗死心電信號在Ⅱ導聯 ST-T 波段變化幅度相比于Ⅲ導聯更為明顯,本文在Ⅱ導聯的 ST-T 波段篩選出的特征數目上也略高于Ⅲ導聯,與文獻[21]中病變信號特征表征一致。
 表2
                篩選后的有效特征
		 	
		 			 				Table2.
    			Effective feature after screening
			
						表2
                篩選后的有效特征
		 	
		 			 				Table2.
    			Effective feature after screening
       		
       				2.3 與其他方法檢測精度的比較
將本文提出的基于形態學特征檢測的方法與現有的下壁心肌梗死檢測方法的結果進行對比,如表 3 所示。與基于深度學習模型實現檢測的算法比較,本文的實驗結果明顯優于文獻[8-9],但是略低于文獻[10]中 99.95% 的正確率。文獻[10]構建密集卷積神經網絡檢測下壁心肌梗死,依靠大量單心拍標記樣本提取深層次特征信息,不可避免地增加了計算的復雜度。文獻[9]在對數據進行下采樣后,采用淺層 CNN 網絡,但依然依賴大量標記數據實現特征提取。相比于此類算法,本文的方法無需通過大量的數據進行訓練,并且沒有進行下采樣處理,保留了完整的原始信息。
 表3
                下壁心肌梗死檢測結果對比
		 	
		 			 				Table3.
    			Comparison of detection results of inferior myocardial   infarction
			
						表3
                下壁心肌梗死檢測結果對比
		 	
		 			 				Table3.
    			Comparison of detection results of inferior myocardial   infarction
       		
       				與依據心電特性提取特征的檢測算法比較,本文在準確率、敏感度和特異性方面均明顯優于文獻[11-13]的下壁心肌梗死檢測結果。與文獻[11-13]中經過時頻域轉換提取特征的方法相比,形態學特征更加具有醫學指征性,能夠較為直觀地反映心電信號的差異,因此能夠更好地滿足下壁心肌梗死檢測的臨床要求,實現下壁心肌梗死的準確檢測。
2.4 與其他方法時間復雜度的比較
本文采用時間復雜度衡量不同實驗方法,算法中語句執行次數多,花費時間就越長。將一個算法中語句執行的次數記為  ,其中 n 為語句規模的大小,引入輔助函數
,其中 n 為語句規模的大小,引入輔助函數  使得
 使得  的極限值為非零常數,且
 的極限值為非零常數,且  的系數項為 1,則時間復雜度如式(20)所示:
 的系數項為 1,則時間復雜度如式(20)所示:
|  | 
在本文算法中,只需對每個輸入的樣本提取經過特征篩選后的 26 個特征,不存在高階運算,因此 為 26,
為 26, 為 1,時間復雜度為
為 1,時間復雜度為 。
。
在深度學習檢測的算法中,卷積神經網絡在下壁心肌梗死的檢測中取得較好的結果。文獻[6-8]中也均是基于卷積神經網絡進行改進從而實現對下壁心肌梗死的檢測。對于卷積神經網絡,每個卷積層的時間復雜度為  ,其中M為卷積核輸出特征的邊長,K 為每個卷積核的邊長,
,其中M為卷積核輸出特征的邊長,K 為每個卷積核的邊長, 為輸入通道個數,
 為輸入通道個數, 為輸出通道個數[22]。因此整個卷積神經網絡的時間復雜度為
 為輸出通道個數[22]。因此整個卷積神經網絡的時間復雜度為  ,其中 D 為卷積層的個數。通過比較可以看出本文算法在時間復雜度的計算中遠小于卷積神經網絡的運算,從而具有更好的時效性。
,其中 D 為卷積層的個數。通過比較可以看出本文算法在時間復雜度的計算中遠小于卷積神經網絡的運算,從而具有更好的時效性。
3 結論
本文選用下壁心肌梗死醫學指征的Ⅱ、Ⅲ和 aVF 三個導聯原始心電信號,避免了在信號降采樣中信息丟失的問題,根據臨床檢測依據進行形態學特征提取。在提取的特征中,針對相同波段在不同導聯中對病理性特征表現程度不同的問題,采用遺傳算法對模型檢測貢獻最大的特征組合進行篩選,最后使用 SVM 對篩選后的特征進行分類并得到較好的結果。該方法運算簡單,準確率較高,無論在臨床環境中或者是便攜式設備中引入該方法,都可以幫助醫生快速診斷下壁心肌梗死,使患者盡快得到治療。
利益沖突聲明:本文全體作者均聲明不存在利益沖突。
 
        

 
                 
				 
																   	
                                                                    
                                                                    
																	 
																   	
                                                                    
                                                                    
																	 
																   	
                                                                    
                                                                    
																	