基于單通道腦電信號的自動睡眠分期模型研究_《生物醫學工程學雜志》

作者：

章浩偉 ¹ , 許哲 ¹ , 苑成梅 ² , 季曹珺 ² ,  劉穎 ¹

1. 上海理工大學健康科學與工程學院（上海 200093）;
2. 上海市精神衛生中心（上海 200030）;

關鍵詞：

自動睡眠分期單通道腦電信號卷積神經網絡雙向長短期記憶網絡

DOI：

10.7507/1001-5515.202210072

視頻：

導出 下載 收藏 掃碼 引用

摘要 全文 圖表 視頻 參考文獻 施引文獻 補充材料

睡眠分期是解決睡眠問題的基礎。針對現階段單通道腦電（EEG）數據和特征決定自動睡眠分期模型分類精度的上限問題，本文提出一種將深度卷積神經網絡（DCNN）和雙向長短期記憶神經網絡（BiLSTM）混合的自動睡眠分期模型。模型使用DCNN自動學習EEG信號的時頻域特征，使用BiLSTM提取數據之間的時序特征，充分挖掘數據包含的特征信息，以提高自動睡眠分期的準確率。同時，使用降噪技術與自適應合成采樣技術減少信號噪聲和不平衡數據集對模型性能的影響。本文采用歐洲數據格式存儲的睡眠數據集拓展版和上海精神衛生中心收集的睡眠數據集進行實驗，分別取得了86.9%和88.9%的整體準確率。與基礎網絡模型進行對比分析，實驗結果均優于基礎網絡，進一步證明了本文模型的有效性，可為構建基于單通道EEG信號的家庭睡眠監測系統提供借鑒。

引用本文： 章浩偉, 許哲, 苑成梅, 季曹珺, 劉穎. 基于單通道腦電信號的自動睡眠分期模型研究. 生物醫學工程學雜志, 2023, 40(3): 458-464. doi: 10.7507/1001-5515.202210072 復制

0 引言

睡眠在人類的健康中起著至關重要的作用。良好的睡眠質量、充足的睡眠時間和完整的睡眠結構有利于調節機體免疫功能，維持各系統功能處于穩定狀態^[1]。臨床上使用多導睡眠圖（polysomnography，PSG）收集患者整晚腦電（electroencephalogram，EEG）、眼電（electrooculogram，EOG）、肌電（electromyogram，EMG）等生理信號^[2]，根據美國睡眠醫學學會（American Academy of Sleep Medicine，AASM）提供的睡眠評分標準^[3]，由專家依次將每30 s的信號標記為清醒期（wake，W）、快速眼動期（rapid eye moment，REM）和非快速眼動期（non-rapid eye moment，NREM），并將NREM細分為N1、N2和N3階段。每晚PSG記錄時長平均約為8 h，采用人工分期常出現分期效率低、錯誤率高等情況，阻礙了其在較大數據集上的應用，進而限制了該領域的相關研究。因此，怎樣利用計算機技術使睡眠分期更加精確、高效，是一個重要的研究內容。

隨著深度學習技術的不斷發展，卷積神經網絡（convolutional neural network，CNN）^[4-7]、循環神經網絡（recurrent neural network，RNN）^[8-9]相繼被用于構建自動睡眠分期模型。傳統RNN容易產生梯度消失等問題，無法學習長期依賴關系，且訓練效率低下，所以研究者們大多使用RNN變體網絡，如長短期記憶網絡（long short-term memory network，LSTM）和雙向長短期記憶網絡（bi-directional long short-term memory network，BiLSTM）等開展相關研究^[10-11]。但這些網絡模型結構單一，無法同時考慮數據內的時頻域特征和時序特征，存在關鍵特征丟失、準確率不高等問題。因此，為了充分利用CNN在特征選擇、提取方面的良好性能以及RNN在處理具有時序信息數據時的獨特優勢，有研究者提出了將兩者相結合的深度學習模型，以提高自動睡眠分期模型性能，這也是最近研究的熱點^[12-14]。Casciola等^[15]構建了包含三個CNN層和兩個 LSTM 層的深度學習模型，對低質量雙通道EEG數據的驗證準確率為（74±10）%，在黃金標準PSG上實現了（77±10）%的驗證準確率。但該模型卷積層（convolutional layer，Conv）設計較為簡單，不能有效提取EEG數據的時頻域特征，且專家在手動分期過程中，不僅要考慮這一幀的數據信息，還要考慮前后幀對其的影響^[9]，因此僅使用LSTM不能有效地利用數據的前后時間序列信息。

在上述研究的基礎上，本文提出一種基于單通道EEG信號混合神經網絡模型。通過構建三條并行的CNN，依次設置不同大小的卷積核（convolutional kernel，Kernel）充分提取EEG數據的時頻域特征，結合空洞CNN更全面地捕捉特征信息，加快時域和頻域特征融合速度，接著使用三層BiLSTM提取前后時序特征，最后將上述混合特征輸入分類判別網絡實現更高準確率的自動分期。同時，提前對數據進行降噪和增強處理，以降低噪聲和樣本失衡對模型帶來的影響。最終，通過在兩個數據集上與基線模型進行的對比實驗，以驗證本文模型的有效性。綜上所述，期望本文模型能充分挖掘捕捉用于睡眠分期的EEG數據特征，能夠最大程度地貼合專家手動分期結果，實現有效地提高自動分期效率與準確率，今后能對人工智能與睡眠醫學領域的有效結合奠定基礎。

1 混合神經網絡模型

本文模型研究的整體思路為：首先對EEG信號進行數據降噪、增強處理，建立用于實驗的數據集，然后使用深度CNN（deep CNN，DCNN）和時序信息學習網絡提取信號的時頻域特征和時間序列特征，最后通過分類判別網絡實現自動睡眠分期。

1.1 數據預處理

1.1.1 數據降噪處理

為了降低噪聲對EEG信號的干擾，數據降噪是進行特征提取前十分重要的一步^[16]。小波包降噪算法比小波變換更為細化，通過自適應選擇頻帶，將信號高頻分量和低頻分量都進行分解，經小波分解后，有用信號的小波分解系數較大，噪聲的小波分解系數較小。通過設置合適的閾值函數，大于閾值的分解系數保留下來，而小于閾值的分解系數則通過置零操作予以消除，由此達到降低噪聲的影響，從而提高信號的時頻分辨率^[17]。小波包降噪算法包括4個步驟，描述如下:

（1）確定小波基函數(t)，根據輸入信號x(t)的類型選擇合適的(t)；

（2）確定要分解的層數N；

（3）確定分解閾值，對x(t)進行基于(t)小波包N層分解；

（4）信號重構，對低頻系數和經過處理后的高頻系數進行小波包重構，實現降噪。

本文使用多貝西（Daubechies，Db）小波函數族的Db10小波基函數進行3層分解的降噪方案，提高降噪精度。睡眠分期使用的EEG信號的能量主要集中在0~35 Hz，因此本文使用數字濾波器對數據進行濾波處理，將信號頻率降到35 Hz以下。

1.1.2 數據增強處理

為了解決數據集中存在的樣本類失衡問題，本文采用自適應合成采樣（adaptive synthetic sampling，ADASYN）技術對樣本較少的數據進行增強處理^[18-19]。ADASYN最大的優點在于會根據整個數據集的樣本分布自動決定少數樣本的合成樣本數量及分布。該算法生成少量樣本公式如式（1）所示：

'/>

其中，d_i表示第i個少數類樣本；rand(0,1)表示0~1之間的隨機數；d_ki表示從d_i的k個最近鄰樣本中隨機選擇的一個樣本，表示生成的合成樣本。

1.2 深度卷積神經網絡

1.2.1 特征提取模塊

基于深度學習技術的CNN模型，一般會在網絡的第一部分構建多個具有不同大小尺寸Kernel的Conv作為特征提取模塊，如式（2）~式（4）所示。通過不同大小Kernel的結合使用，可以讓Conv更加全面地捕捉EEG信號的時頻域信息，高效利用數據的局部和全局特征^[20]。

其中，代表使用的不同大小的Kernel尺寸；代表樣本中第幀的單通道EEG信號片段；CNN_x(?)代表卷積操作；和分別代表通過Conv之后對提取出的時域特征和頻域特征；代表時域特征和頻域特征的拼接。

本文構建的特征提取模塊結構如圖1所示。應用三個并行的CNN，Kernel大小依次設置為3、5、7。三個并行CNN中的每一個分支由四個 Conv和一個一維自適應平均池化層（one dimensional adaptiveavgpool，Adaptiveavgpool1d）組成。每個Conv顯示了Kernel大小、通道尺寸以及步長。每個Conv都包含一維卷積運算（one dimensional convolution operation，Conv1d）、批量歸一化（batch normalization，BN）、線性整流函數（rectified linear unit，ReLU）和一維最大池化(one dimensional maxpool，Maxpool1d)。將預處理過的EEG數據送入模塊進行特征選擇與提取，最后拼接并行網絡提取的時域和頻域特征，得到輸出向量F∈R^N×1，其中N表示特征向量長度。

圖1 特征提取模塊 Figure1. Feature extraction module

圖選項

數據集	W	N1	N2	N3	REM	總樣本數
Sleep-EDFx	64 444	21 282	67 826	12 673	25 360	191 585
SMHCSD	34 904	16 616	70 065	6 587	15 223	143 395

睡眠分期	預測值					評價指標（%）
睡眠分期	W	N1	N2	N3	REM	PR	RE	F1
W	60 831	2 868	294	14	437	92.1	94.4	93.2
N1	4 038	11 088	5 371	127	658	59.9	52.1	55.7
N2	847	2 896	61 450	1 755	878	87.8	90.6	89.2
N3	11	90	1 534	11 013	25	84.9	86.9	88.6
REM	310	1 557	1 318	61	22 114	91.7	87.2	89.4

數據集	總體性能
數據集	Acc（%）	Kappa	MF1（%）
Sleep-EDFx	86.9	0.82	83.2
SMHCSD	88.9	0.83	84.9

數據集	模型	PR（%）					RE（%）					F1（%）
數據集	模型	W	N1	N2	N3	REM	W	N1	N2	N3	REM	W	N1	N2	N3	REM
Sleep-EDFx	CNN	86.0	35.3	80.3	63.3	85.3	82.1	44.1	80.6	72.9	68.9	84.0	39.2	80.4	67.7	76.2
	BiLSTM	87.3	40.2	81.1	67.6	84.8	87.2	44.8	82.3	75.9	69.1	87.2	42.4	81.7	71.5	76.1
	混合神經網絡	92.1	59.9	87.8	84.9	91.7	94.4	52.1	90.6	86.9	87.2	93.2	55.7	89.2	88.6	89.4
SMHCSD	CNN	89	39.7	89.3	88.2	85.6	86	60	81.8	73.1	83.9	87.5	47.8	85.4	79.9	84.7
	BiLSTM	89.7	43.2	89.1	85.4	86.7	89	60.5	81.5	74.8	69.5	89.3	50.4	85.1	79.7	77.2
	混合神經網絡	94.8	58.6	92.1	89.1	92.6	95.1	57.2	93.5	87.7	88.3	94.9	57.9	92.8	88.4	90.4

1.	Phan H, Andreotti F, Cooray N, et al. Joint classification and prediction CNN framework for automatic sleep stage classification. IEEE Trans Biomed Eng, 2019, 66(5): 1285-1296.
2.	Rundo J V, Downey R. Polysomnography. Handb Clin Neurol, 2019, 160: 381-392.
3.	Berry R B, Budhiraja R, Gottlieb D J, et al. Rules for scoring respiratory events in sleep: update of the 2007 AASM manual for the scoring of sleep and associated events. Deliberations of the sleep apnea definitions task force of the American Academy of Sleep Medicine. J Clin Sleep Med, 2012, 8(5): 597-619.
4.	Li Q, Li Q, Liu C, et al. Deep learning in the cross-time frequency domain for sleep staging from a single-lead electrocardiogram. Physiol Meas, 2018, 39(12): 124005.
5.	Zhu T, Luo W, Yu F. Convolution-and attention-based neural network for automated sleep stage classification. Int J Environ Res Public Health, 2020, 17(11): 4152.
6.	Zhang X, Xu M, Li Y, et al. Automated multi-model deep neural network for sleep stage scoring with unfiltered clinical data[J]. Sleep Breath, 2020, 24(2): 581-590.
7.	Cui Zhihong, Zheng Xiangwei, Shao Xuexiao, et al. Automatic sleep stage classification based on convolutional neural network and fine-grained segments. Complexity, 2018, 2018: 9248410.
8.	Hsu Y L, Yang Y T, Wang J S, et al. Automatic sleep stage recurrent neural classifier using energy features of EEG signals. Neurocomputing, 2013, 104: 105-114.
9.	Michielli N, Acharya U R, Molinari F. Cascaded LSTM recurrent neural network for automated sleep stage classification using single-channel EEG signals. Comput Biol Med, 2019, 106: 71-81.
10.	You Y, Zhong X, Liu G, et al. Automatic sleep stage classification: a light and efficient deep neural network model based on time, frequency and fractional Fourier transform domain features. Artif Intell Med, 2022, 127: 102279.
11.	Fu M, Wang Y, Chen Z, et al. Deep learning in automatic sleep staging with a single channel electroencephalography. Front Psychol, 2021, 12: 628502.
12.	Zhuang L, Dai M, Zhou Y, et al. Intelligent automatic sleep staging model based on CNN and LSTM. Front Public Health, 2022, 10: 946833.
13.	Zhou W, Zhu H, Shen N, et al. A lightweight segmented attention network for sleep staging by fusing local characteristics and adjacent information. IEEE Trans Neural Syst Rehabil Eng, 2023, 31: 238-247.
14.	Chang R B. A journey toward artificial intelligence-assisted automated sleep scoring. Patterns, 2022, 3(1): 100429.
15.	Casciola A A, Carlucci S K, Kent B A, et al. A deep learning strategy for automatic sleep staging based on two-channel EEG headband data. Sensors, 2021, 21(10): 3316.
16.	Özer İ, Efe S B, Özbay H. CNN/Bi-LSTM-based deep learning algorithm for classification of power quality disturbances by using spectrogram images. International Transactions on Electrical Energy Systems, 2021. DOI: 10.1002/2050-7038.13204.
17.	Bairagi R N, Maniruzzaman M, Pervin S, et al. Epileptic seizure identification in EEG signals using DWT, ANN and sequential window algorithm. Soft Computing Letters, 2021, 3: 100026.
18.	Alhudhaif A. A novel multi-class imbalanced EEG signals classification based on the adaptive synthetic sampling (ADASYN) approach. PeerJ Comput Sci, 2021, 7: e523.
19.	Datta D, Mallick P K, Reddy A V N, et al. A hybrid classification of imbalanced hyperspectral images using ADASYN and enhanced deep subsampled multi-grained cascaded forest. Remote Sens, 2022, 14(19): 4853.
20.	Roy A M. An efficient multi-scale CNN model with intrinsic feature integration for motor imagery EEG subject classification in brain-machine interfaces. Biomedical Signal Processing and Control, 2022, 74: 103496.
21.	沈雷, 耿馨佚, 王守. 基于遷移學習和空洞卷積的癲癇狀態識別方法[J]. 中國生物醫學工程學報, 2020, 39(6): 700-710.
22.	Goldberger A L, Amaral L A, Glass L, et al. PhysioBank, PhysioToolkit, and PhysioNet: components of a new research resource for complex physiologic signals. Circulation, 2000, 101(23): e215-e220.
23.	Ji X, Li Y, Wen P. Jumping knowledge based spatial-temporal graph convolutional networks for automatic sleep stage classification. IEEE Trans Neural Syst Rehabil Eng, 2022, 30: 1464-1472.

《生物醫學工程學雜志》

基于單通道腦電信號的自動睡眠分期模型研究

摘要 全文 圖表 視頻 參考文獻 施引文獻 補充材料

0 引言