基于表面肌電信號能量核相圖的卷積神經網絡人體手勢識別算法_《生物醫學工程學雜志》

作者：

許留凱 ^1,2 , 張克勤 ³ , 徐兆紅 ³ ,  楊根科 ^1,2

1. 上海交通大學寧波人工智能研究院（浙江寧波 315000）;
2. 上海交通大學自動化系（上海 200240）;
3. 寧波工業互聯網研究院（浙江寧波 315000）;

關鍵詞：

表面肌電信號手勢識別能量核卷積神經網絡

DOI：

10.7507/1001-5515.202010080

視頻：

導出 下載 收藏 掃碼 引用

摘要 全文 圖表 視頻 參考文獻 施引文獻 補充材料

表面肌電信號（sEMG）是一種不平穩非周期的微弱信號，基于時域和頻域特征提取的 sEMG 信號分類方法識別率低、穩定性差。本文通過對 sEMG 信號能量核特征的建模分析，提出一種利用卷積神經網絡（CNN）對 sEMG 信號能量核相圖進行分類的新架構，來對人體手勢動作進行識別。首先，利用矩陣計數方法將 sEMG 信號能量核相圖處理為灰度圖像；其次，利用移動平均對灰度圖進行預處理；最后，采用 CNN 對手勢 sEMG 信號進行識別。利用手勢 sEMG 信號數據集進行了實驗驗證，結果表明選用 CNN 識別框架的有效性以及 CNN 結合能量核相圖的識別方法相比于能量核面積提取方法，在識別精度和計算效率上具有明顯的優勢。本文算法為 sEMG 信號的建模分析與實時識別問題提供了新的可行方法。

引用本文： 許留凱, 張克勤, 徐兆紅, 楊根科. 基于表面肌電信號能量核相圖的卷積神經網絡人體手勢識別算法. 生物醫學工程學雜志, 2021, 38(4): 621-629. doi: 10.7507/1001-5515.202010080 復制

引言

隨著人口老齡化現象的加劇，老年運動障礙患者也急速增多，輔助康復以及助力助行外骨骼機器人的需求增大。外骨骼機器人是模仿生物界外骨骼而提出的一種新型機電一體化裝置，結合傳感、控制、信息融合、移動計算等技術，不僅可為穿戴者提供支撐與保護，還能輔助人體完成適度動作，執行特定任務等^[1]。通過獲取表面肌電信號（surface electromyography，sEMG）并進一步識別穿戴者的運動意圖是實現外骨骼機器人輔助運動功能的重要基礎，是人機交互研究熱點問題^[2]。當前 sEMG 信號采集技術成熟，蘊含信息豐富，且可以在體表對活動肌肉進行無創檢測，現已廣泛使用^[1]。基于 sEMG 信號的意圖識別主要包含 sEMG 信號特征提取與分類器設計兩大問題。常用的 sEMG 信號特征包括時域、頻域和時頻分析三大類^[3]。時域與頻域特征雖然計算方便，但是 sEMG 信號的不平穩性導致這些特征穩定性較差^[4],時頻特征分析雖然穩定性較好，但是其計算復雜，無法滿足運動意圖識別對實時性的要求^[5]。

由于時域、頻域等特征在 sEMG 信號特征識別中存在不穩定性，一些學者開始對肌肉生物機制建模分析。Chen 等^[5]提出了能量核方法來估計肌肉收縮力及肌肉的一些固有特征，并通過實驗證明該特征的魯棒性和較強的泛化能力。對于 sEMG 信號能量核特征的研究，主要集中在如何更高效地計算能量核相圖橢圓分布面積的方法上，Chen 等^[5]提出的線性圍欄法（linear fencing，LF）利用傾角變化的直線去擬合橢圓邊界，并以此計算面積，但是該方法計算效率較低，無法滿足實時性的要求。為此，Chen 等^[6]又提出了離散盒矩陣計數法（discrete box counting，DBC），利用矩陣覆蓋散點并設定閾值計數的方法來計算橢圓面積，計算效率顯著提高。Zeng 等^[7]通過改進 LF 法，只用四條相互垂直的直線來確定橢圓邊界，可實現與文獻[6]相近的識別準確率，且橢圓面積的計算更方便。石欣等^[8]對 DBC 進行了改進，提出了閾值矩陣計數法（threshold matrix count，TMC）設定兩個閾值來計數，相比于 DBC 考慮了橢圓邊界處的分散點。上述方法都是手動計算能量核橢圓面積，缺乏統一的參數標準，還會遺漏能量核相圖的其它特征，或者對特征的提取不夠充分。

在分類器設計上，人工神經網絡（artificial neural network，ANN）是一種模仿生物神經網絡的數學模型，廣泛應用在圖像處理、語音識別等領域^[9-10]。針對手動提取 sEMG 信號特征帶來的不足，自然引入 ANN 進行訓練與學習，其中卷積神經網絡（convolutional neural network，CNN）、多層感知器（multilayer perceptron，MLP）、循環神經網絡（recurrent neural network，RNN）和長短期記憶網絡（long short-term memory，LSTM）應用較為廣泛^[11-17]。Atzori 等^[12]將一段時間窗覆蓋的多通道 sEMG 信號幅值形成的二維矩陣作為 CNN 輸入，通過設置時間窗的大小與移動步長來提取 sEMG 信號的幅值特征，利用 CNN 對幅值矩陣進行特征提取與分類。Geng 等^[13]利用 8×16 高密度肌電陣列采集手臂 sEMG 信號，將瞬時 sEMG 信號的幅值當作矩陣每個元素值，以此形成 sEMG 信號幅值陣列圖像作為 CNN 網絡輸入。Wei 等^[14]利用多流 CNN 對高密度 sEMG 信號瞬時幅值圖進行訓練，將多通道 sEMG 信號幅值圖分別輸入多個 CNN，后將多流 CNN 學習到的特征進行融合并識別分類。相比于高密度肌電圖，Zhai 等^[15]對稀疏多通道的 sEMG 信號進行快速傅里葉變換（fast Fourier transform，FFT），獲得 sEMG 信號頻譜圖像來進行 CNN 訓練，利用 CNN 進一步提取頻譜特征信息并識別。He 等^[16]分別利用 MLP 與 LSTM 對 sEMG 信號時序及幅值矩陣進行特征提取，再將網絡學習到的特征融合為新的特征向量進行分類識別。Wu 等^[17]利用 LSTM 網絡對 sEMG 信號提取時序特征，后利用 CNN 對 LSTM 的輸出特征進行二次特征提取與識別。上述網絡大多采用 sEMG 信號原始時序數據或頻域信息作為網絡輸入，但是由于 sEMG 信號時域、頻域特征的不穩定性可能會導致運動意圖識別的穩定性下降^[4]。

本文提出一種 sEMG 信號能量核模型的識別框架，該框架通過引入 CNN，對能量核相圖進行網絡學習與特征提取。新框架在處理能量核相圖中，省去計算面積的步驟，直接對能量核相圖進行網絡自動學習與訓練，這相比單純提取能量核相圖的橢圓面積可學習到更全面的特征且速度也更快，同時以能量核相圖作為網絡輸入也避免了 sEMG 信號時域、頻域特征不穩定所帶來的局限。本研究進一步利用公開的多通道手勢 sEMG 數據集進行手勢識別實驗，以驗證本文所提識別框架的有效性和實用性。本文提出的識別算法為人體 sEMG 信號的建模分析提供了新的思路，或可為基于人體生物學的人機交互研究帶來新的啟發。

1 sEMG 信號能量核模型

1.1 數據集來源

本文所有實驗數據來自非侵入自適應假肢肌電 2 號數據集（non-invasive adaptive prosthetics database 2，NinaPro DB2）（網址：http://datadryad.org/stash/dataset/doi:10.5061/dryad.1k84r），該數據集已經公開，可用于科學研究。NinaPro DB2 數據集制作時使用 sEMG 信號采集設備 Delsys（Trigno，Delsys Inc.，美國），采樣頻率是 2 000 Hz，共使用 12 個電極采集健康受試者手勢動作 sEMG 信號，要求受試者每個動作重復 6 次，每兩次動作間隔 3 s，共采集 49 種手勢動作，動作主要包含抓握物體、多類手指動作、手腕翻轉等。

1.2 sEMG 信號能量核相圖

區別于 sEMG 信號時域、頻域和時頻分析等特征，能量核模型是建立在對 sEMG 信號建模基礎之上的新方法。sEMG 信號可以看作是均值為零的統計時序信號，其信號幅值具有往復運動的特征^[18]，這種運動可以描述為振子模型 ^[5-8]，利用振子模型可將其表示為微分方程^[19]。將 sEMG 信號的幅值作為橫坐標，幅值對時間的導數作為縱坐標，在平面直角坐標系下可以將一段 sEMG 信號繪制成一幅相圖。如圖 1 所示為一段兩通道手勢 sEMG 信號與對應能量核相圖，兩通道 sEMG 信號中藍色線條表示通道 1 信號，橙色曲線表示通道 2 信號，將綠色虛線框包圍的 sEMG 數據（400 采樣點）坐標化處理，繪制成能量核相圖，相圖中藍色點與橙色點分別是通道 1 和通道 2 信號對應相圖散點分布，虛線表示對應相圖散點的分布邊界。這些相圖散點在坐標平面近似呈橢圓分布^[5-8]，Zeng 等^[7]利用 LF 法對橢圓邊界進行了定位，經過多次實驗得出了橢圓長軸在大部分時間與橫坐標軸垂直或平行，只有少數采樣點偏離坐標軸的結論。

圖1 兩通道 sEMG 信號與對應能量核相圖 Figure1. Two-channel sEMG signal and corresponding energy kernel phase portrait

圖選項

手勢類別數		平均識別精度	平均識別時間/ms
100 ms 時間窗	2	98.46%	0.34
	4	93.10%	0.26
	8	93.16%	0.26
	16	80.32%	0.67
200 ms 時間窗	2	96.92%	0.28
	4	93.96%	0.22
	8	94.44%	0.24
	16	85.12%	0.29

1.	丁其川, 熊安斌, 趙新剛, 等. 基于表面肌電的運動意圖識別方法研究及應用綜述. 自動化學報, 2016, 42(1): 13-25.
2.	Meng Qingyun, Meng Qiaoling, Yu Hongliu, et al. A survey on sEMG control strategies of wearable hand exoskeleton for rehabilitation//2017 2nd Asia-Pacific Conference on Intelligent Robot Systems (ACIRS), Wuhan: IEEE, 2017: 165-169.
3.	Phukpattaranont P, Thongpanja S, Anam K, et al. Evaluation of feature extraction techniques and classifiers for finger movement recognition using surface electromyography signal. Med Biol Eng Comput, 2018, 56(12): 2259-2271.
4.	丁帥, 王亮. 基于塊稀疏貝葉斯學習的肌電信號特征提取. 儀器儀表學報, 2014, 35(12): 2731-2738.
5.	Chen X, Yin Y, Fan Y. EMG oscillator model-based energy kernel method for haracterizing muscle intrinsic property under isometric contraction. Chin Sci Bull, 2014, 59(14): 1556-1567.
6.	Chen X, Zeng Y, Yin Y. Improving the transparency of an exoskeleton knee joint based on the understanding of motor intent using energy kernel method of EMG. IEEE Trans Neural Syst Rehabil Eng, 2017, 25(6): 577-588.
7.	Zeng Y, Yang J, Peng C, et al. Evolving gaussian process autoregression based learning of human motion intent using improved energy kernel method of EMG. IEEE Trans Biomed Eng, 2019, 66(9): 2556-2565.
8.	石欣, 朱家慶, 秦鵬杰, 等. 基于改進能量核的下肢表面肌電信號特征提取方法. 儀器儀表學報, 2020, 41(1): 121-128.
9.	Yang Kuo, Zhang Zhen. Real-time pattern recognition for hand gesture based on ANN and surface EMG//2019 IEEE 8th Joint International Information Technology and Artificial Intelligence Conference (ITAIC), Chongqing: IEEE, 2019: 799-802.
10.	Abdel-Hamid O, Mohamed A, Jiang H, et al. Convolutional neural networks for speech recognition. IEEE/ACM Trans Audio, Speech, Language Process, 2014, 22(10): 1533-1545.
11.	Pinzón-Arenas J O, Jiménez-Moreno R, Herrera-Benavides J E. Convolutional neural network for hand gesture recognition using 8 different EMG signals//2019 XXII Symposium on Image, Signal Processing and Artificial Vision (STSIVA). Bucaramanga: IEEE, 2019: 1-5.
12.	Atzori M, Cognolato M, Müller H. Deep learning with convolutional neural networks applied to electromyography data: a resource for the classification of movements for prosthetic hands. Front Neurorobot, 2016, 10: 9.
13.	Geng W, Du Y, Jin W, et al. Gesture recognition by instantaneous surface EMG images. Sci Rep, 2016, 6: 36571.
14.	Wei W, Wong Y, Du Y, et al. A multi-stream convolutional neural network for sEMG-based gesture recognition in muscle-computer interface. Pattern Recognit Lett, 2019, 119: 131-138.
15.	Zhai X, Jelfs B, Chan R M, et al. Self-recalibrating surface EMG pattern recognition for neuroprosthesis control based on convolutional neural network. Front Neurosci, 2017, 11: 379.
16.	He Yunan, Fukuda O, Bu Nan, et al. Surface EMG pattern recognition using long short-term memory combined with multilayer perceptron//2018 40th Annual International Conference of the IEEE Engineering in Medicine and Biology Society (EMBC), Honolulu: IEEE, 2018: 5636-5639.
17.	Wu Yuheng, Zheng Bin, Zhao Yongting. Dynamic gesture recognition based on LSTM-CNN//2018 Chinese Automation Congress (CAC), Xi’an: IEEE, 2018: 2446-2450.
18.	Staudenmann D, Roeleveld K, Stegeman D F, et al. Methodological aspects of SEMG recordings for force estimation--a tutorial and review. J Electromyogr Kinesiol, 2010, 20(3): 375-387.
19.	Du Y C, Lin C H, Shyu L Y, et al. Portable hand motion classifier for multi-channel surface electromyography recognition using grey relational analysis. Expert Syst Appl, 2010, 37(6): 4283-4291.
20.	McComas A J, Mrozek K. The electrical properties of muscle fiber membranes in dystrophia myotonica and myotonia congenita. J Neurol Neurosurg Psychiatry, 1968, 31(5): 441-447.
21.	Trajano G S, Nosaka K, Blazevich A J. Neurophysiological mechanisms underpinning stretch-induced force loss. Sports Med, 2017, 47(8): 1531-1541.
22.	李偉, 楊向東, 陳懇. 基于CNN和RNN聯合網絡的心音自動分類. 計算機工程與設計, 2020, 41(1): 46-51.
23.	Krizhevsky A, Sutskever I, Hinton G E. Imagenet classification with deep convolutional neural networks. Commun ACM, 2017, 60(6): 84-90.

《生物醫學工程學雜志》

基于表面肌電信號能量核相圖的卷積神經網絡人體手勢識別算法

摘要 全文 圖表 視頻 參考文獻 施引文獻 補充材料

引言

1 sEMG 信號能量核模型

1.1 數據集來源

1.2 sEMG 信號能量核相圖

1.3 sEMG 信號能量核振子模型

2 基于 sEMG 信號能量核相圖的 CNN 識別算法

2.1 sEMG 信號能量核相圖圖像構造

2.2 CNN 識別 sEMG 信號能量核相圖算法

3 實驗與結果分析

3.1 實驗配置與測試結果

3.2 對比實驗與效果分析

3.2.1 多通道時間窗 sEMG 信號與能量核相圖對比實驗

3.2.2 CNN 與經典分類器識別能量核相圖對比實驗

3.2.3 CNN 與典型神經網絡分類器識別能量核相圖對比實驗

3.2.4 能量核面積特征識別與 CNN 識別能量核相圖對比實驗

4 結語

引言

1 sEMG 信號能量核模型

1.1 數據集來源

1.2 sEMG 信號能量核相圖

1.3 sEMG 信號能量核振子模型

2 基于 sEMG 信號能量核相圖的 CNN 識別算法

2.1 sEMG 信號能量核相圖圖像構造

2.2 CNN 識別 sEMG 信號能量核相圖算法

3 實驗與結果分析

3.1 實驗配置與測試結果

3.2 對比實驗與效果分析

3.2.1 多通道時間窗 sEMG 信號與能量核相圖對比實驗

3.2.2 CNN 與經典分類器識別能量核相圖對比實驗

3.2.3 CNN 與典型神經網絡分類器識別能量核相圖對比實驗

3.2.4 能量核面積特征識別與 CNN 識別能量核相圖對比實驗

4 結語

下一篇

Format

Content

摘要全文圖表視頻參考文獻施引文獻補充材料