為了充分挖掘輕度認知障礙(MCI)患者的神經振蕩耦合特征,本文分析對比了28名MCI患者(MCI組)與21名正常人(正常對照組)在六種異頻組合下的耦合特征強度。結果表明,與正常對照組相比,MCI組在δ-θ節律組合下交叉頻率耦合的全局相位同步指數差異具有統計學意義(P = 0.025,d = 0.398)。為了進一步驗證此耦合特征,本文提出一種優化的卷積神經網絡模型,該模型融入了時頻數據增強模塊與批歸一化層,在防止過擬合的同時增強了模型的魯棒性。基于此優化模型,以δ-θ節律組合下的鎖相值矩陣作為模型輸入的單一特征,對MCI患者的診斷正確率達(95.49±4.15)%,敏感性與特異性分別為(93.71 ± 7.21)%和(97.50 ± 5.34)%。本文研究結果表明,δ-θ節律組合下的鎖相值矩陣特征能夠充分反映MCI患者的認知狀態,有利于輔助MCI診斷。
引用本文: 李昕, 王凱, 景軍, 尹立勇, 張瑩, 謝平. 神經振蕩交叉頻率耦合特征在輕度認知障礙診斷中的應用研究. 生物醫學工程學雜志, 2023, 40(5): 843-851. doi: 10.7507/1001-5515.202210020 復制
版權信息: ?四川大學華西醫院華西期刊社《生物醫學工程學雜志》版權所有,未經授權不得轉載、改編
0 引言
輕度認知障礙(mild cognitive impairment,MCI)是阿爾茲海默病病程發展的關鍵階段,挖掘MCI診斷標記特征,以較小的特征代價實現早期診斷具有臨床研究意義[1-4]。現有研究表明,不同腦區之間的信息交流是以神經振蕩節律之間有序的神經編碼機制完成的,交叉頻率耦合(cross-frequency coupling,CFC)作為不同節律局部和整體之間相互作用的載體機制,與分布式的信息整合有直接的聯系[5-7]。尤其對于患有認知障礙的人群,由于大腦神經細胞發生病變,導致大腦的功能連接受損,其靜息態腦電信號常表現出快振蕩減弱、慢振蕩增強的現象[8]。
大腦節律間的耦合特征與多重認知和行為相關[9-10]。Schack等[11]通過對實驗數據進行雙譜分析,發現當大腦處于感知和記憶任務當中時,θ節律的相位可以調制γ節律的幅值,即存在相幅耦合現象。Palva等[12]通過分析受試者在連續心算任務中的腦磁圖(magnetoencephalography,MEG)發現,大腦皮層中存在明顯的跨頻相位耦合現象,且γ節律和α節律的相位耦合強度隨著任務難度上升而增強。Yanagisawa等[13]分析感覺運動皮層的腦電數據時,發現α節律與γ節律、β節律與γ節律的相幅耦合強度會隨著受試者感知和認知狀態的改變而改變。
認知水平下降會導致神經振蕩耦合特征異常,如Ahnaou等[14]在阿爾茲海默病小鼠模型中發現了阿爾茲海默病小鼠腦電數據中的θ振蕩和相干活動減弱,并且θ-γ振蕩的相幅耦合強度明顯降低。閆彥等[15]使用非線性相互依賴性的方法觀察腦電數據在相同節律下通道間的耦合強度,發現MCI患者(MCI組)腦電數據的θ節律和α節律在不同通道間耦合強度的平均值低于正常人[正常對照(normal controls,NC)組],且其差異具有統計學意義。Liu等[16]在同一節律下不同通道間,采用互信息(mutual information,MI)分析方法量化與任務相關的腦電信號的耦合強度,發現NC組與MCI組的θ節律耦合強度區別明顯。
本文基于多層次的相位—幅值耦合方法分析腦電數據,研究MCI組和NC組在不同節律組合下,各通道低頻節律相位與高頻節律幅值之間的耦合關系。為了進一步挖掘認知下降初期的特征標記,本文以δ-θ節律相幅耦合特征為單一特征,采用批歸一化(batch normalization,BN)層優化的卷積神經網絡(convolutional neural networks,CNN)模型實現對MCI患者的自動診斷[17]。針對臨床數據的小樣本問題,本文采用時頻數據增強技術,實現樣本擴充[18-19]。基于此優化模型,本文驗證了所提出的特征作為區分MCI患者和正常人的生物標志的可行性,期望為MCI患者的臨床診斷提供理論依據。
1 方法
1.1 數據采集與預處理
本文采用的數據樣本來自河北省人民醫院,共招募49名受試者參與本研究,其中MCI患者入組28人,平均年齡為(65.2 ± 5.4)歲;NC組21人,平均年齡為(67.1 ± 6.3)歲,均身體健康,沒有相關的神經性病癥,大腦功能狀態正常;所有受試者均自愿參與本文研究并簽署了知情同意書。所有受試者均通過磁共振成像(magnetic resonance imaging,MRI)或者計算機斷層掃描檢查,排除了腦部局灶性病變,并接受了視覺、聽覺測試,以及認知測試。其中,認知測試包括簡易精神狀態檢查(mini-mental state examination,MMSE)、蒙特利爾認知評估量表(Montreal cognitive assessment,MoCA)和日常生活活動量表(activities of daily living,ADL)[20]。受試者基本信息如表1所示,數據以均值 ± 標準差顯示,并采用獨立樣本t檢驗方法比較了MCI組與NC組樣本間的差異,檢驗水準為0.05。
 表1
                受試者基本信息
		 	
		 			 				Table1.
    			Basic information of subjects
			
						表1
                受試者基本信息
		 	
		 			 				Table1.
    			Basic information of subjects
       		
       				本文試驗依據《世界醫學協會赫爾辛基宣言》進行,通過了河北省人民醫院倫理審查委員會的批準(批文編號:UY202201)。
本文腦電信號采集采用16導通道數字腦電圖儀(NT9200,北京中科新拓儀器有限公司,中國)完成,其電極位置符合國際標準10/20系統的規格,采樣率為1 024 Hz。采集數據時,受試者均處于清醒、無干擾的狀態,試驗人員記錄受試者在閉眼放松狀態下5 min的腦電信號。
本文采用科學計算軟件Matlab(2017a,MathWorks,美國)的EEGLAB工具箱基于獨立成分分析(independent components analysis,ICA),完成剔除眼電、心電、肌電等干擾信號的預處理工作[21]。為了使每個樣本的腦電信號長度相等,本文將所采集的腦電信號進行分段截取,截取位置為采集開始后的32~64 s,共計32 768個數據點。最終,采用帶通濾波進行節律分解。
1.2 時頻數據增強
針對個體性差異問題,在保持腦電信號原有特性的情況下,本文從時域和頻域上實現了數據增強[22]。數據增強步驟如下:
(1)信號分割:將原始腦電信號數據在時域上分割,每段長度為8 192個數據點。
(2)時域重組:隨機選擇四段腦電信號重新組合,生成人工時域腦電信號。本文共生成400個人工時域腦電信號,其中MCI組與NC組各200個。
(3)頻域交換:將人工時域腦電信號進行快速傅里葉變換﹐然后對相同類別腦電信號的同一頻段進行隨機交換,重新組合成人工時頻腦電信號。人工時頻腦電信號就是經過數據增強后得到的新樣本。本文從200個MCI組人工時域腦電信號和200個NC組人工時域腦電信號中各生成了200個新樣本。
1.3 鎖相值
本文基于鎖相值(phase locking value,PLV)(以符號PLV表示)的相位—幅值耦合方法分析各個通道信號之間的相互調制作用關系[23]。假設2個不同的信號x(n)和y(n),則其對應的PLV如式(1)所示:
|  | 
其中, ,φy(n)為y(n)瞬時幅值序列的瞬時相位,φx(n)為x(n)的瞬時相位,N為信號x(n)和y(n)的序列長度,e代表自然常數,i代表虛數單位,符號“Σ”代表求和運算,|·|代表取絕對值運算。
,φy(n)為y(n)瞬時幅值序列的瞬時相位,φx(n)為x(n)的瞬時相位,N為信號x(n)和y(n)的序列長度,e代表自然常數,i代表虛數單位,符號“Σ”代表求和運算,|·|代表取絕對值運算。
1.4 批歸一化層
BN層利用權重伸縮不變性原理有效地避免了反向傳播時因為權重過大或過小導致的梯度消失或梯度爆炸問題,并加快神經網絡梯度下降訓練過程的收斂速度。把BN層作為神經網絡的一部分,可以使每一層的輸入具有相同且穩定的分布,并且BN層可以起到正則化的作用,來代替隨機失活(dropout)層[24-25]。
為了加速神經網絡模型的訓練過程,提高其泛化性能,使其更加容易學習到數據之中的規律,本文在每一個卷積層和全連接層之后都加入了BN層。
1.5 優化的卷積神經網絡結構
基于局部感受野及權重共享的理念,CNN可以有效地降低網絡架構的復雜程度和權重參數數目,并且因為樣本在原始特征空間上的值可以直接用來作為網絡的輸入層,CNN可以通過卷積核和前饋神經網絡來對特征提取和分類的過程進行優化[26]。
本文設計的CNN主干結構如圖1所示,由2個卷積層、2個最大池化層和2個全連接層組成,其中,卷積層采用整流線性單元(rectified linear unit,ReLU)作為激活函數,全連接層采用雙曲正切函數作為激活函數[27]。
 圖1
				優化的CNN結構
			
												
				Figure1.
				Optimized CNN structure
						
				圖1
				優化的CNN結構
			
												
				Figure1.
				Optimized CNN structure
			
								2 實驗結果及分析
2.1 鎖相值矩陣分析
MCI組和NC組的腦電信號在不同節律組合下,各通道間低頻節律相位和高頻節律幅值的PLV平均值矩陣如圖2、圖3所示,其中橫軸和縱軸代表16導通道的編號,矩陣中的元素為指定兩通道下PLV的樣本均值。從全腦區域來看,NC組的PLV明顯高于MCI組,特別是δ-θ、θ-α和α-β節律組合,區別更加明顯。
 圖2
				MCI組各節律組合下的PLV平均值矩陣
			
												
				Figure2.
				PLV mean matrix under each rhythm combination in MCI group
						
				圖2
				MCI組各節律組合下的PLV平均值矩陣
			
												
				Figure2.
				PLV mean matrix under each rhythm combination in MCI group
			
								 圖3
				NC組各節律組合下的PLV平均值矩陣
			
												
				Figure3.
				PLV mean matrix under each rhythm combination in NC group
						
				圖3
				NC組各節律組合下的PLV平均值矩陣
			
												
				Figure3.
				PLV mean matrix under each rhythm combination in NC group
			
								六種節律組合下PLV平均值矩陣的數值分布箱形圖如圖4所示。結果顯示,MCI組和NC組的PLV平均值矩陣,在六種節律組合下的數值分布均有明顯不同,其中δ-θ節律組合下,MCI組和NC組PLV平均值矩陣的中位數分別為0.587 2和0.591 8,差值為0.004 6,是六種節律組合中的最大值。
 圖4
				各節律組合下的PLV平均值矩陣的數值分布箱形圖
			
												
				Figure4.
				Box-plot of the value distribution of the PLV mean matrix under each rhythm combination
						
				圖4
				各節律組合下的PLV平均值矩陣的數值分布箱形圖
			
												
				Figure4.
				Box-plot of the value distribution of the PLV mean matrix under each rhythm combination
			
								為了更加直觀地分析MCI組和NC組之間PLV的差異,本文設各樣本PLV矩陣的矩陣均值為其全局相位同步指數,統計了MCI組與NC組在各節律組合下全局相位同步指數的平均值和標準差,并采用獨立樣本t檢驗方法比較MCI組與NC組樣本間的差異,檢驗水準為0.05,比較結果如圖5所示。
 圖5
				各節律組合下的全局相位同步指數
			
												
				Figure5.
				Global phase synchronization index of each rhythm combination
						
				圖5
				各節律組合下的全局相位同步指數
			
												
				Figure5.
				Global phase synchronization index of each rhythm combination
			
								結果顯示,在δ-θ節律組合下,MCI組和NC組的全局相位同步指數平均值的差異最為明顯,其差值為0.005,且樣本間差異具有統計學意義(P = 0.025,d = 0.398),故本文選取δ-θ節律組合下的PLV矩陣作為分類器輸入特征。
2.2 基于優化卷積神經網絡的診斷分類
本文采用10倍交叉驗證的方式將數據集分成十份,輪流將其中9份作為訓練集,1份作為測試集,對基于數據增強后的400個樣本訓練的模型進行了診斷性能驗證。模型訓練時采用的優化器為適應性矩估計(adaptive moment estimation,Adam),學習率設為0.001,每一次訓練的批大小為60,訓練輪次數為200。在基于δ-θ節律組合耦合特征的10倍交叉驗證中,本文抽取其中一次完整訓練過程,觀察測試集損失值和準確率的表現,結果如圖6所示。根據觀察,測試集的準確率隨著訓練輪次的增加而上升,并在大約100輪左右趨于穩定,這說明模型在訓練過程中逐漸學習到更準確的預測能力。同時,測試集的損失值隨著訓練輪次的增加而下降,并在大約60輪后下降幅度逐漸變小,這表明模型逐漸減小了預測誤差,但可能存在一定的上限,無法進一步降低損失值。
 圖6
				損失值和準確率的表現
			
												
				Figure6.
				Performance of loss value and accuracy
						
				圖6
				損失值和準確率的表現
			
												
				Figure6.
				Performance of loss value and accuracy
			
								為了驗證本文提出的CNN模型和δ-θ節律組合下耦合特征的有效性,本文提取了δ-θ節律組合下各樣本PLV矩陣的最大值、平均值、最大值低頻通道編號和最大值高頻通道編號,然后以此為特征訓練采用高斯核函數(radial basis function kernel,RBF)的支持向量機(support vector machine,SVM)模型,并最終使用網格搜索法(grid search,GS)對SVM模型的懲罰系數C與RBF的系數γ進行優化得到局部最優解[28-29]。此外本文還采用優化后的CNN模型對另外五種節律組合下的耦合特征進行了訓練,對比結果如表2所示。表2中,δ-θ表示基于δ-θ節律組合下的耦合特征訓練模型,數據均以均值±標準差的形式展示。
 表2
                不同條件下的分類性能對比
		 	
		 			 				Table2.
    			Comparison of classification performance under different conditions
			
						表2
                不同條件下的分類性能對比
		 	
		 			 				Table2.
    			Comparison of classification performance under different conditions
       		
       				由以上結果可以看出,本文采用的優化的CNN模型相較于傳統的SVM模型在性能上有了較大提升,在除基于θ-β節律組合下耦合特征的訓練結果外,基于其余五種節律組合下耦合特征的CNN模型分類準確率都達到了90%以上,證明其可以更好地完成對MCI患者的診斷任務,并且該CNN模型在δ-θ節律組合下的表現最為優異。
進一步,本文進行了不添加BN層的CNN模型訓練實驗,如圖7所示,其為一輪訓練中測試集損失值的表現,可以發現不添加BN層的CNN模型在相同學習率和訓練輪次的條件下,發生了梯度消失現象,導致模型不能學習到特征信息,無法擬合出一個有效的分類函數,其證明了BN層對于緩解深層網絡梯度消失的問題具有重要意義。
 圖7
				不添加BN層的CNN模型在訓練中測試集的損失值表現
			
												
				Figure7.
				Performance of CNN model without added BN layer on loss value of test set in training
						
				圖7
				不添加BN層的CNN模型在訓練中測試集的損失值表現
			
												
				Figure7.
				Performance of CNN model without added BN layer on loss value of test set in training
			
								3 討論與分析
CFC具有多種模式,例如相幅耦合、相位耦合和幅值耦合等[30-31]。其中,相幅耦合中的低頻與高頻之間的耦合已被深入地研究,并已證明與認知任務中神經元之間的信息交流整合有關[6, 32-33]。Kendrick等[34]在動物實驗的研究中發現,隨著學習任務的增加,θ-γ節律組合的相位—幅值耦合強度增加,并且這種變化與辨別行為能力呈現相關性。Friese等[35]發現﹐人類短時記憶編碼的成功與額葉低頻θ和枕葉高頻γ的相位—幅值耦合相關,形成一段新記憶的同時,θ-γ節律組合的相位—幅值耦合強度也在增加。這些研究結果表明了低頻和高頻之間的相位—幅值耦合與學習任務、辨別行為和短時記憶編碼有關,但目前的研究大多集中于對γ節律進行探討,本文以PLV方法分析了除γ節律外其余六種低頻與高頻節律組合下,腦電樣本中各通道間的耦合強度。
結果表明,MCI組和NC組在六種節律組合下各通道間的耦合強度都有明顯區別,從全腦區域來看,MCI組通道間的耦合強度相較于NC組明顯降低,且在δ-θ節律組合下的耦合強度特征差異具有統計學意義,故本文以δ-θ節律組合下的PLV矩陣作為本文所提出優化模型的輸入特征,驗證該耦合特征是否可以作為臨床診斷的輔助工具。分類結果顯示,優化后的CNN模型相較于傳統的機器學習模型,在性能上有了較大的提升,并且模型在基于δ-θ節律組合下的耦合特征訓練時,分類性能最為優異。
由于醫療信息系統雜亂分散,數據聚合性差,導致臨床腦電數據的獲取難度較大,難以在另一個數據集上進行交叉驗證,本文基于現有的數據集使用10倍交叉驗證的方式來評估模型的泛化能力,驗證了模型的可靠性。觀察表1的數據可以發現,MCI組和NC組在男女比例特征、年齡特征與受教育年限特征中,兩組間差異無統計學意義,證明采集的數據具有代表性,不會受這些因素所影響。除此之外,本研究還對受試者進行了ADL、MoCA和MMSE三項認知測試,但未考慮認知測試得分對MCI診斷的影響,之后的研究中會將這三種認知測試的得分作為控制變量來進一步驗證MCI組與NC組低頻相位與高頻幅值間的耦合特征差異。
4 結論
本文分析了MCI組和NC組腦電數據在六種低高頻節律組合下各通道間的PLV矩陣差異。結果表明,MCI組和NC組在δ-θ節律組合下全局相位同步指數的差異具有統計學意義(P = 0.025,d = 0.398),δ-θ節律組合下的耦合特征是可以輔助MCI患者早期診斷的有意義特征。除此之外,本文提出了一種優化的CNN模型,模型采用時頻數據增強技術來避免訓練時出現過擬合問題的同時,通過添加BN層提高了CNN模型的性能。最終,本文通過基于δ-θ節律組合下的耦合特征訓練優化后CNN模型的方式,驗證了所提出的模型和δ-θ節律組合下耦合特征的有效性,結果顯示其分類準確度達(95.49 ± 4.15)%,相較于傳統的分類模型和其它節律組合下的耦合特征,其能更好地完成對MCI患者的診斷識別任務。
重要聲明
利益沖突聲明:本文全體作者均聲明不存在利益沖突。
作者貢獻聲明:所有作者都參與了本研究的構思和設計。基礎理論研究、編寫模型代碼由王凱完成,論文初稿的撰寫由王凱和景軍完成,數據收集和分析由尹立勇完成,李昕完成了文章的審閱及校對,張瑩和謝平對數據的提取處理提供了指導意見。所有作者都閱讀并批準了最終稿件。
倫理聲明:本研究通過了河北省人民醫院倫理審查委員會的審批(批文編號:UY202201)。
0 引言
輕度認知障礙(mild cognitive impairment,MCI)是阿爾茲海默病病程發展的關鍵階段,挖掘MCI診斷標記特征,以較小的特征代價實現早期診斷具有臨床研究意義[1-4]。現有研究表明,不同腦區之間的信息交流是以神經振蕩節律之間有序的神經編碼機制完成的,交叉頻率耦合(cross-frequency coupling,CFC)作為不同節律局部和整體之間相互作用的載體機制,與分布式的信息整合有直接的聯系[5-7]。尤其對于患有認知障礙的人群,由于大腦神經細胞發生病變,導致大腦的功能連接受損,其靜息態腦電信號常表現出快振蕩減弱、慢振蕩增強的現象[8]。
大腦節律間的耦合特征與多重認知和行為相關[9-10]。Schack等[11]通過對實驗數據進行雙譜分析,發現當大腦處于感知和記憶任務當中時,θ節律的相位可以調制γ節律的幅值,即存在相幅耦合現象。Palva等[12]通過分析受試者在連續心算任務中的腦磁圖(magnetoencephalography,MEG)發現,大腦皮層中存在明顯的跨頻相位耦合現象,且γ節律和α節律的相位耦合強度隨著任務難度上升而增強。Yanagisawa等[13]分析感覺運動皮層的腦電數據時,發現α節律與γ節律、β節律與γ節律的相幅耦合強度會隨著受試者感知和認知狀態的改變而改變。
認知水平下降會導致神經振蕩耦合特征異常,如Ahnaou等[14]在阿爾茲海默病小鼠模型中發現了阿爾茲海默病小鼠腦電數據中的θ振蕩和相干活動減弱,并且θ-γ振蕩的相幅耦合強度明顯降低。閆彥等[15]使用非線性相互依賴性的方法觀察腦電數據在相同節律下通道間的耦合強度,發現MCI患者(MCI組)腦電數據的θ節律和α節律在不同通道間耦合強度的平均值低于正常人[正常對照(normal controls,NC)組],且其差異具有統計學意義。Liu等[16]在同一節律下不同通道間,采用互信息(mutual information,MI)分析方法量化與任務相關的腦電信號的耦合強度,發現NC組與MCI組的θ節律耦合強度區別明顯。
本文基于多層次的相位—幅值耦合方法分析腦電數據,研究MCI組和NC組在不同節律組合下,各通道低頻節律相位與高頻節律幅值之間的耦合關系。為了進一步挖掘認知下降初期的特征標記,本文以δ-θ節律相幅耦合特征為單一特征,采用批歸一化(batch normalization,BN)層優化的卷積神經網絡(convolutional neural networks,CNN)模型實現對MCI患者的自動診斷[17]。針對臨床數據的小樣本問題,本文采用時頻數據增強技術,實現樣本擴充[18-19]。基于此優化模型,本文驗證了所提出的特征作為區分MCI患者和正常人的生物標志的可行性,期望為MCI患者的臨床診斷提供理論依據。
1 方法
1.1 數據采集與預處理
本文采用的數據樣本來自河北省人民醫院,共招募49名受試者參與本研究,其中MCI患者入組28人,平均年齡為(65.2 ± 5.4)歲;NC組21人,平均年齡為(67.1 ± 6.3)歲,均身體健康,沒有相關的神經性病癥,大腦功能狀態正常;所有受試者均自愿參與本文研究并簽署了知情同意書。所有受試者均通過磁共振成像(magnetic resonance imaging,MRI)或者計算機斷層掃描檢查,排除了腦部局灶性病變,并接受了視覺、聽覺測試,以及認知測試。其中,認知測試包括簡易精神狀態檢查(mini-mental state examination,MMSE)、蒙特利爾認知評估量表(Montreal cognitive assessment,MoCA)和日常生活活動量表(activities of daily living,ADL)[20]。受試者基本信息如表1所示,數據以均值 ± 標準差顯示,并采用獨立樣本t檢驗方法比較了MCI組與NC組樣本間的差異,檢驗水準為0.05。
 表1
                受試者基本信息
		 	
		 			 				Table1.
    			Basic information of subjects
			
						表1
                受試者基本信息
		 	
		 			 				Table1.
    			Basic information of subjects
       		
       				本文試驗依據《世界醫學協會赫爾辛基宣言》進行,通過了河北省人民醫院倫理審查委員會的批準(批文編號:UY202201)。
本文腦電信號采集采用16導通道數字腦電圖儀(NT9200,北京中科新拓儀器有限公司,中國)完成,其電極位置符合國際標準10/20系統的規格,采樣率為1 024 Hz。采集數據時,受試者均處于清醒、無干擾的狀態,試驗人員記錄受試者在閉眼放松狀態下5 min的腦電信號。
本文采用科學計算軟件Matlab(2017a,MathWorks,美國)的EEGLAB工具箱基于獨立成分分析(independent components analysis,ICA),完成剔除眼電、心電、肌電等干擾信號的預處理工作[21]。為了使每個樣本的腦電信號長度相等,本文將所采集的腦電信號進行分段截取,截取位置為采集開始后的32~64 s,共計32 768個數據點。最終,采用帶通濾波進行節律分解。
1.2 時頻數據增強
針對個體性差異問題,在保持腦電信號原有特性的情況下,本文從時域和頻域上實現了數據增強[22]。數據增強步驟如下:
(1)信號分割:將原始腦電信號數據在時域上分割,每段長度為8 192個數據點。
(2)時域重組:隨機選擇四段腦電信號重新組合,生成人工時域腦電信號。本文共生成400個人工時域腦電信號,其中MCI組與NC組各200個。
(3)頻域交換:將人工時域腦電信號進行快速傅里葉變換﹐然后對相同類別腦電信號的同一頻段進行隨機交換,重新組合成人工時頻腦電信號。人工時頻腦電信號就是經過數據增強后得到的新樣本。本文從200個MCI組人工時域腦電信號和200個NC組人工時域腦電信號中各生成了200個新樣本。
1.3 鎖相值
本文基于鎖相值(phase locking value,PLV)(以符號PLV表示)的相位—幅值耦合方法分析各個通道信號之間的相互調制作用關系[23]。假設2個不同的信號x(n)和y(n),則其對應的PLV如式(1)所示:
|  | 
其中, ,φy(n)為y(n)瞬時幅值序列的瞬時相位,φx(n)為x(n)的瞬時相位,N為信號x(n)和y(n)的序列長度,e代表自然常數,i代表虛數單位,符號“Σ”代表求和運算,|·|代表取絕對值運算。
,φy(n)為y(n)瞬時幅值序列的瞬時相位,φx(n)為x(n)的瞬時相位,N為信號x(n)和y(n)的序列長度,e代表自然常數,i代表虛數單位,符號“Σ”代表求和運算,|·|代表取絕對值運算。
1.4 批歸一化層
BN層利用權重伸縮不變性原理有效地避免了反向傳播時因為權重過大或過小導致的梯度消失或梯度爆炸問題,并加快神經網絡梯度下降訓練過程的收斂速度。把BN層作為神經網絡的一部分,可以使每一層的輸入具有相同且穩定的分布,并且BN層可以起到正則化的作用,來代替隨機失活(dropout)層[24-25]。
為了加速神經網絡模型的訓練過程,提高其泛化性能,使其更加容易學習到數據之中的規律,本文在每一個卷積層和全連接層之后都加入了BN層。
1.5 優化的卷積神經網絡結構
基于局部感受野及權重共享的理念,CNN可以有效地降低網絡架構的復雜程度和權重參數數目,并且因為樣本在原始特征空間上的值可以直接用來作為網絡的輸入層,CNN可以通過卷積核和前饋神經網絡來對特征提取和分類的過程進行優化[26]。
本文設計的CNN主干結構如圖1所示,由2個卷積層、2個最大池化層和2個全連接層組成,其中,卷積層采用整流線性單元(rectified linear unit,ReLU)作為激活函數,全連接層采用雙曲正切函數作為激活函數[27]。
 圖1
				優化的CNN結構
			
												
				Figure1.
				Optimized CNN structure
						
				圖1
				優化的CNN結構
			
												
				Figure1.
				Optimized CNN structure
			
								2 實驗結果及分析
2.1 鎖相值矩陣分析
MCI組和NC組的腦電信號在不同節律組合下,各通道間低頻節律相位和高頻節律幅值的PLV平均值矩陣如圖2、圖3所示,其中橫軸和縱軸代表16導通道的編號,矩陣中的元素為指定兩通道下PLV的樣本均值。從全腦區域來看,NC組的PLV明顯高于MCI組,特別是δ-θ、θ-α和α-β節律組合,區別更加明顯。
 圖2
				MCI組各節律組合下的PLV平均值矩陣
			
												
				Figure2.
				PLV mean matrix under each rhythm combination in MCI group
						
				圖2
				MCI組各節律組合下的PLV平均值矩陣
			
												
				Figure2.
				PLV mean matrix under each rhythm combination in MCI group
			
								 圖3
				NC組各節律組合下的PLV平均值矩陣
			
												
				Figure3.
				PLV mean matrix under each rhythm combination in NC group
						
				圖3
				NC組各節律組合下的PLV平均值矩陣
			
												
				Figure3.
				PLV mean matrix under each rhythm combination in NC group
			
								六種節律組合下PLV平均值矩陣的數值分布箱形圖如圖4所示。結果顯示,MCI組和NC組的PLV平均值矩陣,在六種節律組合下的數值分布均有明顯不同,其中δ-θ節律組合下,MCI組和NC組PLV平均值矩陣的中位數分別為0.587 2和0.591 8,差值為0.004 6,是六種節律組合中的最大值。
 圖4
				各節律組合下的PLV平均值矩陣的數值分布箱形圖
			
												
				Figure4.
				Box-plot of the value distribution of the PLV mean matrix under each rhythm combination
						
				圖4
				各節律組合下的PLV平均值矩陣的數值分布箱形圖
			
												
				Figure4.
				Box-plot of the value distribution of the PLV mean matrix under each rhythm combination
			
								為了更加直觀地分析MCI組和NC組之間PLV的差異,本文設各樣本PLV矩陣的矩陣均值為其全局相位同步指數,統計了MCI組與NC組在各節律組合下全局相位同步指數的平均值和標準差,并采用獨立樣本t檢驗方法比較MCI組與NC組樣本間的差異,檢驗水準為0.05,比較結果如圖5所示。
 圖5
				各節律組合下的全局相位同步指數
			
												
				Figure5.
				Global phase synchronization index of each rhythm combination
						
				圖5
				各節律組合下的全局相位同步指數
			
												
				Figure5.
				Global phase synchronization index of each rhythm combination
			
								結果顯示,在δ-θ節律組合下,MCI組和NC組的全局相位同步指數平均值的差異最為明顯,其差值為0.005,且樣本間差異具有統計學意義(P = 0.025,d = 0.398),故本文選取δ-θ節律組合下的PLV矩陣作為分類器輸入特征。
2.2 基于優化卷積神經網絡的診斷分類
本文采用10倍交叉驗證的方式將數據集分成十份,輪流將其中9份作為訓練集,1份作為測試集,對基于數據增強后的400個樣本訓練的模型進行了診斷性能驗證。模型訓練時采用的優化器為適應性矩估計(adaptive moment estimation,Adam),學習率設為0.001,每一次訓練的批大小為60,訓練輪次數為200。在基于δ-θ節律組合耦合特征的10倍交叉驗證中,本文抽取其中一次完整訓練過程,觀察測試集損失值和準確率的表現,結果如圖6所示。根據觀察,測試集的準確率隨著訓練輪次的增加而上升,并在大約100輪左右趨于穩定,這說明模型在訓練過程中逐漸學習到更準確的預測能力。同時,測試集的損失值隨著訓練輪次的增加而下降,并在大約60輪后下降幅度逐漸變小,這表明模型逐漸減小了預測誤差,但可能存在一定的上限,無法進一步降低損失值。
 圖6
				損失值和準確率的表現
			
												
				Figure6.
				Performance of loss value and accuracy
						
				圖6
				損失值和準確率的表現
			
												
				Figure6.
				Performance of loss value and accuracy
			
								為了驗證本文提出的CNN模型和δ-θ節律組合下耦合特征的有效性,本文提取了δ-θ節律組合下各樣本PLV矩陣的最大值、平均值、最大值低頻通道編號和最大值高頻通道編號,然后以此為特征訓練采用高斯核函數(radial basis function kernel,RBF)的支持向量機(support vector machine,SVM)模型,并最終使用網格搜索法(grid search,GS)對SVM模型的懲罰系數C與RBF的系數γ進行優化得到局部最優解[28-29]。此外本文還采用優化后的CNN模型對另外五種節律組合下的耦合特征進行了訓練,對比結果如表2所示。表2中,δ-θ表示基于δ-θ節律組合下的耦合特征訓練模型,數據均以均值±標準差的形式展示。
 表2
                不同條件下的分類性能對比
		 	
		 			 				Table2.
    			Comparison of classification performance under different conditions
			
						表2
                不同條件下的分類性能對比
		 	
		 			 				Table2.
    			Comparison of classification performance under different conditions
       		
       				由以上結果可以看出,本文采用的優化的CNN模型相較于傳統的SVM模型在性能上有了較大提升,在除基于θ-β節律組合下耦合特征的訓練結果外,基于其余五種節律組合下耦合特征的CNN模型分類準確率都達到了90%以上,證明其可以更好地完成對MCI患者的診斷任務,并且該CNN模型在δ-θ節律組合下的表現最為優異。
進一步,本文進行了不添加BN層的CNN模型訓練實驗,如圖7所示,其為一輪訓練中測試集損失值的表現,可以發現不添加BN層的CNN模型在相同學習率和訓練輪次的條件下,發生了梯度消失現象,導致模型不能學習到特征信息,無法擬合出一個有效的分類函數,其證明了BN層對于緩解深層網絡梯度消失的問題具有重要意義。
 圖7
				不添加BN層的CNN模型在訓練中測試集的損失值表現
			
												
				Figure7.
				Performance of CNN model without added BN layer on loss value of test set in training
						
				圖7
				不添加BN層的CNN模型在訓練中測試集的損失值表現
			
												
				Figure7.
				Performance of CNN model without added BN layer on loss value of test set in training
			
								3 討論與分析
CFC具有多種模式,例如相幅耦合、相位耦合和幅值耦合等[30-31]。其中,相幅耦合中的低頻與高頻之間的耦合已被深入地研究,并已證明與認知任務中神經元之間的信息交流整合有關[6, 32-33]。Kendrick等[34]在動物實驗的研究中發現,隨著學習任務的增加,θ-γ節律組合的相位—幅值耦合強度增加,并且這種變化與辨別行為能力呈現相關性。Friese等[35]發現﹐人類短時記憶編碼的成功與額葉低頻θ和枕葉高頻γ的相位—幅值耦合相關,形成一段新記憶的同時,θ-γ節律組合的相位—幅值耦合強度也在增加。這些研究結果表明了低頻和高頻之間的相位—幅值耦合與學習任務、辨別行為和短時記憶編碼有關,但目前的研究大多集中于對γ節律進行探討,本文以PLV方法分析了除γ節律外其余六種低頻與高頻節律組合下,腦電樣本中各通道間的耦合強度。
結果表明,MCI組和NC組在六種節律組合下各通道間的耦合強度都有明顯區別,從全腦區域來看,MCI組通道間的耦合強度相較于NC組明顯降低,且在δ-θ節律組合下的耦合強度特征差異具有統計學意義,故本文以δ-θ節律組合下的PLV矩陣作為本文所提出優化模型的輸入特征,驗證該耦合特征是否可以作為臨床診斷的輔助工具。分類結果顯示,優化后的CNN模型相較于傳統的機器學習模型,在性能上有了較大的提升,并且模型在基于δ-θ節律組合下的耦合特征訓練時,分類性能最為優異。
由于醫療信息系統雜亂分散,數據聚合性差,導致臨床腦電數據的獲取難度較大,難以在另一個數據集上進行交叉驗證,本文基于現有的數據集使用10倍交叉驗證的方式來評估模型的泛化能力,驗證了模型的可靠性。觀察表1的數據可以發現,MCI組和NC組在男女比例特征、年齡特征與受教育年限特征中,兩組間差異無統計學意義,證明采集的數據具有代表性,不會受這些因素所影響。除此之外,本研究還對受試者進行了ADL、MoCA和MMSE三項認知測試,但未考慮認知測試得分對MCI診斷的影響,之后的研究中會將這三種認知測試的得分作為控制變量來進一步驗證MCI組與NC組低頻相位與高頻幅值間的耦合特征差異。
4 結論
本文分析了MCI組和NC組腦電數據在六種低高頻節律組合下各通道間的PLV矩陣差異。結果表明,MCI組和NC組在δ-θ節律組合下全局相位同步指數的差異具有統計學意義(P = 0.025,d = 0.398),δ-θ節律組合下的耦合特征是可以輔助MCI患者早期診斷的有意義特征。除此之外,本文提出了一種優化的CNN模型,模型采用時頻數據增強技術來避免訓練時出現過擬合問題的同時,通過添加BN層提高了CNN模型的性能。最終,本文通過基于δ-θ節律組合下的耦合特征訓練優化后CNN模型的方式,驗證了所提出的模型和δ-θ節律組合下耦合特征的有效性,結果顯示其分類準確度達(95.49 ± 4.15)%,相較于傳統的分類模型和其它節律組合下的耦合特征,其能更好地完成對MCI患者的診斷識別任務。
重要聲明
利益沖突聲明:本文全體作者均聲明不存在利益沖突。
作者貢獻聲明:所有作者都參與了本研究的構思和設計。基礎理論研究、編寫模型代碼由王凱完成,論文初稿的撰寫由王凱和景軍完成,數據收集和分析由尹立勇完成,李昕完成了文章的審閱及校對,張瑩和謝平對數據的提取處理提供了指導意見。所有作者都閱讀并批準了最終稿件。
倫理聲明:本研究通過了河北省人民醫院倫理審查委員會的審批(批文編號:UY202201)。
 
        

 
                 
				 
                                                                    
                                                                        
                                                                        
                                                                         
																   	
                                                                    
                                                                    
																	 
																   	
                                                                    
                                                                    
																	 
																   	
                                                                    
                                                                    
																	 
																   	
                                                                    
                                                                    
																	 
																   	
                                                                    
                                                                    
																	 
																   	
                                                                    
                                                                    
																	