電子耳蝸前端雙麥克風語音增強及波束形成算法研究_《生物醫學工程學雜志》

作者：

陳又圣 ,  陳艷

深圳信息職業技術學院（廣東深圳 ?518000）;

關鍵詞：

電子耳蝸語音增強波束形成雙麥克風

DOI：

10.7507/1001-5515.201810025

視頻：

導出 下載 收藏 掃碼 引用

摘要 全文 圖表 視頻 參考文獻 施引文獻 補充材料

麥克風陣列語音增強的方法是通過采用多個麥克風同時進行語音信號采集，從而增加了空間方位的信息，因此有助于提高電子耳蝸在噪聲環境下的言語識別率。鑒于尺寸的限制，電子耳蝸使用的麥克風數量不能太多，從而限制了麥克風陣列形成波束的設計。為了兼顧電子耳蝸尺寸的限制條件并增加信號采集空間方位信息，本文提出了一種采用兩個超薄單指向/全向組合型麥克風（TP）的語音增強和波束形成算法，每個 TP 麥克風均單獨包含兩個聲管用于信號采集，達到了增加整體空間方位信息的目的。本文探討了不同增益向量條件下波束形成的特性和雙麥克風間距對波束的影響，為雙麥克風語音增強技術在電子耳蝸的應用提供有價值的理論分析和工程參數。

引用本文： 陳又圣, 陳艷. 電子耳蝸前端雙麥克風語音增強及波束形成算法研究. 生物醫學工程學雜志, 2019, 36(3): 468-477. doi: 10.7507/1001-5515.201810025 復制

引言

電子耳蝸是一種通過電信號刺激聽覺神經并使耳聾患者產生聽覺感知的電子裝置，是目前治療重度聾和全聾患者的有效方法^[1-3]。美國國立耳聾與其他交流障礙性疾病研究所（National Institute on Deafness and Other Communication Disorders，NIDCD）官網 2017 年 3 月 6 日公布的數據表明：目前全球電子耳蝸植入數已有 32 萬余個。經過近幾十年的發展，電子耳蝸的價格逐漸降低，進一步促進了電子耳蝸的廣泛應用。據 Zeng^[4]的研究報道，2017 年國內外電子耳蝸生產廠商在我國政府招標采購中的投標價格均有了大幅度的下降。從 2011-2016 年，其售價由 25 000 美元/個降到 6 030 美元/個，而到 2017 年時僅為 5 490 美元/個。同時，技術的發展提高了電子耳蝸的性能，使用者已經能夠順暢地進行打電話、面對面說話等日常溝通和交流，但是電子耳蝸在噪聲環境和各種失配場景條件下的言語識別率仍然較低^[5-7]。提高電子耳蝸前端信號采集的質量有助于提升電子耳蝸識別率，目前的研究方法有兩類，分別是單通道的語音增強方法和基于麥克風陣列的語音增強方法。

由于電子耳蝸體積的限制，麥克風陣列中實際能采用的麥克風數量有限，常見的方法是雙麥克風波束形成方法^[8-10]或雙耳模式的語音增強方法^[11-13]。在電子耳蝸前端語音增強應用中，固定波束形成方法是常見的語音增強方法，通過延遲或者增益向量來實現特定的波束指向^[14]，其特點是計算量少，適合電子耳蝸的低功耗要求，缺點是極性圖固定，信噪比提高有限。而對于運動噪聲來說，自適應波束形成方法是另一種常見的語音增強方法，該方法通過對噪聲的方位進行估計可使系統的最小輸出跟隨噪聲方位變化，其優點是適宜于運動噪聲的情形，缺點是僅通過延遲等參數調整極性圖，波束指向簡單并且計算量過大^{[8, 10]}。為了進一步提高噪聲去除的效果，現已將單通道的語音增強技術用于麥克風陣列語音增強算法中，Lockwood 等^[11]采用非因果最優濾波器來設計頻域波束形成器，Kate 等^[15]則把最小方差無畸變響應的自適應波束形成技術用于由 5 個麥克風所組成的信號采集陣列，可較好地適應復雜噪聲的去除，但過多的麥克風數量不能滿足電子耳蝸較小的體積限制要求。本文前期研究工作里提出了一種采用兩個全向性麥克風的基于實時譜估計的雙通道語音增強算法^[16]，該算法可用于去除方向性噪聲和競爭性語音噪聲，具有高信噪比的特點。但是，前期所提出的雙全向性麥克風模式在空間上只有兩個信號采集點，所能獲取的空間方位信息有限，不利于設計復雜的具有多種波束指向的語音增強系統。考慮到電子耳蝸尺寸的限制和復雜波束設計的需求，本文選用具有兩個聲管的超薄單指向/全向組合型麥克風（thin uni-directional/omni-directional microphone pair，TP）來設計雙麥克風信號采集系統，并進一步通過增益向量的選取來設計可滿足使用者特定需求的雙麥克風系統，然后探討了麥克風間距對系統響應的影響，并歸納了本系統的應用條件。本文研究在雙麥克風波束形成算法、小間距條件的波束設計和電子耳蝸語音增強方面進行了理論探索，或對今后的電子耳蝸前端語音增強的研究和工程應用奠定理論基礎并提供技術參數。

1 雙 TP 麥克風陣列結構及信號采集分析

本文選用具有雙聲管的 TP 型麥克風模塊用于電子耳蝸前端信號采集。TP 型麥克風包含兩個聲管，兩個聲管的指向相互垂直。根據尺寸資料可以計算出兩個聲管中心點之間的距離（d）。需注意的是，來自不同方位的聲音信號被同一個 TP 型麥克風的兩個聲管采集到的時間是不同的，存在一個延遲時間，延遲時間與聲音信號的方位角度有關。此外，兩個聲管采集到信號后，TP 型麥克風模塊還會對其中一個聲管采集到的信號進行一個額外的延遲，并由此形成不同方位的波束指向。按照 TP 型麥克風技術說明，該麥克風可以產生兩路輸出信號，既可輸出全向性信號，也可輸出心型極性圖（cardioid beam pattern）的指向性信號。其中，全向性信號為其中一個采集聲管的信號，而心型極性圖的指向性信號所設置的額外延遲時間（τ）是通過 τ = d/c 計算得到的，其中 d 為前面計算得到的兩個聲管中心點之間的距離，本文取 5.24 × 10^?3 m；c 為聲音在空氣中的傳播速度，本文取 340 m/s；因此本文計算得到的 τ 的參數值是 1.54 × 10^?5 s。麥克風兩個聲管之間的距離 d 是固定的，但兩個 TP 型麥克風之間的間距（L）則是可調的。

本文所設計的雙麥克風信號采集模式如圖 1 所示。在圖 1 中，TP 型麥克風 1 包含聲管 1 和聲管 2，麥克風 2 包含聲管 3 和聲管 4。定義聲管 1 和聲管 3 所面向的方位是 0°（正向，對應電子耳蝸使用者所面對的方位），按逆時針定義其他各個方位，左側半圈的角度范圍是 0°～180°，右側半圈的角度范圍是 0°～? 180°，則聲管 2 對應的方位是 90°，聲管 4 對應的方位是 ? 90°。用極坐標方式定義所要采集聲音信號的位置 S，S 點距離兩個麥克風中心點 O 的距離為 R，與 0° 方位所在直線的夾角為 φ。4 個聲管分別采集從 S 處傳輸過來的聲音信號，并分別形成全向性輸出信號［O₁（t）和 O₂（t）］和指向性輸出信號［D₁（t）和 D₂（t）］，然后形成 4 路輸出信號，對信號進行通道選擇和給予增益向量形成總的輸出信號［y（t）］，不同的增益向量可用于設計具有特定波束指向的語音增強系統。

圖1 雙麥克風系統信號采集原理圖 Figure1. Schematicdiagram of signal acquisition principle in dual-microphone system

圖選項

應用場景	增益向量的系數值
應用場景	β₁	β₂	β₃	β₄
增強正向型（高頻感知無損失）	0	1	0	1
增強正向型（高頻感知有損失）	1	1	1	1
增強側向型	1	0	? 1	0

1.	陳又圣, 王健, 薛國偉, 等. 電子耳蝸CIS言語處理策略參數特征研究. 深圳信息職業技術學院學報, 2017, 15(3): 12-18.
2.	Jiang T, Gong Q. Development of the in-vivo system of the cochlear implant debugging platform based on embedded pulse control mode. Chin J Sci Instru, 2015, 36(7): 1673-1680.
3.	Chen Y S, Xue G W, Zhang P, et al. Resarch on least square interpolation based fractional delay and mismatch for cochlear implant. Int J Biomed Eng, 2017, 40(6): 457-464.
4.	Zeng Fangang. Challenges in improving cochlear implant performance and accessibility. IEEE Trans Biomed Eng, 2017, 64(8): 1662-1664.
5.	Chung K, Zeng F G. Using hearing aid adaptive directional microphone to enhance cochlear implant performance. Hear Res, 2009, 250(2): 27-37.
6.	Chen Yousheng, Gong Qin. Broadband beamforming compensation algorithm in CI front-end acquisition. Biomed Eng Online, 2013, 12(1): 18.
7.	Zeng F G. Trends in cochlear implant. Trends Amplif, 2004, 8(1): 1-34.
8.	Li Xingxing, Wang Dangwei, Ma Xiaoyan, et al. Robust adaptive beamforming using iterative variable loaded sample matrix inverse. Electron Lett, 2018, 54(9): 546-548.
9.	Zohourian M, Enzner G, Martin R. Binaural speaker localization integrated into an adaptive beamformer for hearing Aids. IEEE-ACM Transactions on Audio Speech and Language Processing, 2018, 26(3): 515-528.
10.	Xiao Jinjun, Luo Zhiquan, Merks I, et al. A robust adaptive binaural beamformer for hearing devices//51st Asilomar Conference on Signals, Systems, and Computers (ACSSC 2017). Pacific Grove: Institute of Electrical and Electronics Engineers Inc., 2017: 1885-1889.
11.	Lockwood M E, Jones D L, Bilger R C, et al. Performance of time- and frequency-domain binaural beamformers based on recorded signals from real rooms. Journal of the Acoustical Society of America, 2004, 115(1): 379-391.
12.	Ehlers E, Goupell M J, Zheng Yi, et al. Binaural sensitivity in children who use bilateral cochlear implants. Journal of the Acoustical Society of America, 2017, 141(6): 4264-4277.
13.	Lopez-Poveda E A, Eustaquio-Martin A, Stohl J S, et al. Intelligibility in speech maskers with a binaural cochlear implant sound coding strategy inspired by the contralateral medial olivocochlear reflex. Hear Res, 2017, 348: 134-137.
14.	Gong Qin, Chen Yousheng. Parameter selection methods of delay and beamforming for cochlear implant speech enhancement. Acoust Phys, 2011, 57(4): 542-550.
15.	Kates J M, Weiss M R. A comparison of hearing-aid array-processing techniques. J Acoust Soc Amer, 1996, 99: 3138-3148.
16.	Chen Yousheng, Gong Qin. Real-time spectrum estimation-based dual-channel speech-enhancement algorithm for cochlear implant. Biomed Eng Online, 2012, 11: 74.
17.	Nelson P B, Jin S B, Carney A E. Understanding speech in modulated interference: cochlaer implant users and normal-hearing listeners. J Acoust Soc Amer, 2003, 113(2): 961-968.

《生物醫學工程學雜志》

電子耳蝸前端雙麥克風語音增強及波束形成算法研究

摘要 全文 圖表 視頻 參考文獻 施引文獻 補充材料

引言

1 雙 TP 麥克風陣列結構及信號采集分析

2 雙 TP 型麥克風的波束指向設計和特征

3 麥克風佩帶間距的影響及系統指向性特征

4 結論

引言

1 雙 TP 麥克風陣列結構及信號采集分析

2 雙 TP 型麥克風的波束指向設計和特征

3 麥克風佩帶間距的影響及系統指向性特征

4 結論

上一篇

下一篇

Format

Content

摘要全文圖表視頻參考文獻施引文獻補充材料