基于深度學習方法的慢性阻塞性肺疾病危重度分類研究_《生物醫學工程學雜志》

作者：

 應俊 ^1,3 , 楊策源 ² , 李全政 ³ , 薛萬國 ¹ , 黎檀實 ¹ , 曹文哲 ¹

1. 中國人民解放軍總醫院（北京 100853）;
2. 解放軍第四二二醫院（廣東湛江 524005）;
3. 哈佛大學醫學院麻省總醫院（美國馬薩諸塞州波士頓 02114）;

關鍵詞：

慢性阻塞性肺疾病慢性阻塞性肺疾病全球倡議組織分類標準機器學習深度學習深信度網絡

DOI：

10.7507/1001-5515.201604061

視頻：

導出 下載 收藏 掃碼 引用

摘要 全文 圖表 視頻 參考文獻 施引文獻 補充材料

本文提出了一種基于深度學習方法的慢性阻塞性肺疾病危重程度自動分類算法，并以大樣本臨床數據為輸入特征，分析各特征在分類中所占的權重。研究通過特征選擇、模型訓練、參數優化、模型測試，建立了基于深信度網絡架構的分類預測模型，通過對 2007 年、2011 年兩個版本的慢性阻塞性肺疾病全球倡議組織（GOLD）危重程度標準進行自動分類與測試，分類準確率均達到 90% 以上。同時，通過分析模型系數矩陣得出輸入特征的貢獻度排序，并通過該排序發現，貢獻度較大的輸入特征與臨床診斷先驗知識之間存在較好的吻合性，證明了深信度網絡分類模型的有效性。通過本文研究，期望能為深度學習方法在疾病診斷輔助決策中的應用提供有效解決方案。

引用本文： 應俊, 楊策源, 李全政, 薛萬國, 黎檀實, 曹文哲. 基于深度學習方法的慢性阻塞性肺疾病危重度分類研究. 生物醫學工程學雜志, 2017, 34(6): 842-849. doi: 10.7507/1001-5515.201604061 復制

引言

慢性阻塞性肺疾病（chronic obstructive pulmonary disease，COPD）是呼吸系統常見的慢性疾病，主要表現為呼吸道氣流阻塞，是由有害氣體及有害顆粒引起的呼吸道異常炎癥反應，如果不進行及時的干預治療，COPD 將進一步發展為肺心病和呼吸衰竭等危重程度很高的慢性疾病^[1]。該病發病率、致殘率和病死率很高，全球 40 歲以上成人的發病率高達 9%～10%，根據世界衛生組織（World Health Organization，WHO）預測，到 2030 年 COPD 將成為全球第三大高致死率的疾病^[2]。COPD 患者的危重程度分類評估是臨床診療過程中的基礎工作，是疾病治療的關鍵指針。如何有效又準確地對 COPD 的危重程度進行分類評估還存在一定難度，學術界先后推出多個分類標準作為臨床工作的實踐指南。2007 年，慢性阻塞性肺疾病全球倡議組織（The Global Initiative for Chronic Obstructive Lung Disease，GOLD）發布了首個針對該疾病危重程度的分類標準（GOLD2007），該標準主要是以肺功能參數的檢測值—— 一秒用力呼氣容積（forced expiratory volume in one second，FEV1）與用力肺活量（forced vital capacity，FVC）作為危重程度分類的依據。但是通過大量人群的臨床驗證與研究分析表明，僅僅參照肺功能參數無法有效地區分所有 COPD 患者的危重程度，而患者的身體狀況、急性加重程度同樣與 COPD 的危重程度有較大的相關性^[3]。2011 年，英國國家衛生與臨床技術優化研究所（National institute for health and clinical excellence，NICE）重新修改完善了 GOLD 分類標準，將肺功能、急性加重次數和多種臨床評估量表，如改良的醫學研究理事會呼吸困難量表（modified medical study council，mMRC）、COPD 評估量表（COPD assessment test，CAT）、圣喬治呼吸問卷（St George's respiratory questionnaire，SGRQ）等共同納入評估因素，形成多因素、多維度的 GOLD2011 分類標準。醫學研究中，建立 GOLD 的分類標準實質上是尋找與疾病危重程度相關的主要因素，建立起多因素相關的綜合評價方法，以方便在臨床實踐中提供疾病危重程度的量化結果。

在醫療大數據分析領域，應用機器學習分類方法模擬臨床決策規則，對疾病危重程度進行自動判斷一直是研究熱點。深度學習方法（deep learning）是近年來新興的一種復雜的機器學習算法，在語言和圖像識別方面取得的效果遠遠超過以前相關的其他技術^[4-5]。它在搜索技術、數據挖掘、機器學習、機器翻譯、自然語言處理、多媒體學習、語音、推薦和個性化技術，以及其它相關領域都取得了很多成果^[6]。該類算法是一種結構復雜的非線性特征提取器，能夠發現高維度數據結構之間潛在的代表性特征，能夠對高維度向量進行壓縮提煉。深度學習方法能夠構建含有多隱層的機器學習架構模型，通過對大規模數據進行訓練，可以得到大量更具代表性的特征信息。該算法通過對原始信號進行逐層特征變換，將樣本在原空間的特征表示變換到新的特征空間，自動地學習得到層次化的特征表示，并將無監督與監督相結合進行訓練，實現兩種方法優勢互補，解決克服多層神經網絡很難訓練達到最優的問題。

本研究應用深度學習方法按照 GOLD 分類標準的原則對 COPD 的危重程度進行分類，同時研究多種特征因素與 GOLD 分類之間潛在的相關性。研究基于深度學習方法中的深信度網絡（deep belief network，DBN）方法，建立面向疾病危重程度分類評估的數據模型，模擬人腦開展 GOLD 危重程度評估的臨床決策活動過程^[7]。本文希望通過基于深度學習方法的分析以解決以下問題：

（1）按照 GOLD 分類標準原則開展 COPD 危重程度的自動分類，并分析深度學習方法中分類算法的效率；

（2）從全文分析數據對象中尋找到對 GOLD 分類標準的關鍵性影響因素，并研究影響因素對應的臨床意義。

1 材料與方法

1.1 數據

本文研究數據來自美國國家心臟、肺與血液研究機構（National Heart，Lung，and Blood Institute，NHLBI）主持建設的 COPD 臨床數據與基因信息數據庫（COPDGene），包括 10 300 名受試者連續 5 年的健康與醫療數據，其中 2/3 為白人，1/3 為黑人，每位受試者的數據項總計為 362 項，其中包括人口學信息、臨床評估量表、病史、電子病歷、檢驗結果、醫學影像、體格檢查、隨訪等數據，全部數據經過清洗、標準化、數字化、代碼化等預處理，成為完全結構化的數據集（網址為：www.COPDGene.org）^[8]。所有受試者均標明了 GOLD2007 與 GOLD2011 分類后的結果，上述兩個分類結果主要由臨床專家依據國際組織提出的 GOLD 分類標準，結合患者病情診斷給出^[9]。基本原則如下：GOLD2007 基于 FEV1 與 FVC 將受試者分為 1～4 級，其中 1 級為最輕，4 級為最危重。GOLD2011 分類標準是在 GOLD2007 的基礎上，重點考慮 mMRC、CAT、SGRQ 以及急性加重次數等因素，從癥狀與風險的輕重程度分為 A、B、C、D 四個級別，其中 A 級表示癥狀與風險均低；B 級表示癥狀重、風險低；C 級表示癥狀輕、風險高；D 級表示癥狀重、風險高^[10]。同時在此基礎上，對高風險患者進行了進一步細分，如果 C、D 兩類患者只達到 FEV1 的閾值，則被分類為 C1、D1，如果只達到急性加重頻率的閾值，則被分類為 C2、D2，如果達到上述兩個參數的閾值，則被分類為 C3、D3。

1.2 特征選擇

很多機器學習算法的性能在一定程度上受到無關特征和冗余特征的不良影響，選出好的特征子集不但可以減輕后續運算的復雜度，提高后續運算的準確率，也減少了訓練樣本的需求量，利于找出更易理解的算法模型。特征空間的維數不宜過高，這在機器學習領域是一條公認的經驗性準則，依據該準則特征選擇即可以達到降低高維數據維數的目的。為提高算法效能，本研究在模型訓練前先對輸入特征進行優選，特征選擇的算法流程如圖 1 所示。首先去除數據不完整的特征，刪除缺失數據大于總量 50% 的特征，然后采用 Fisher 分類器算法對于特征進行優選。Fisher 分類器算法是一種性能較好的線性特征選擇算法，可以通過衡量特征在兩種類別之間的分辨能力，確定最佳線性分界面，實現最有效的特征選擇。研究表明該方法具有獨立于學習算法、計算代價小和效率高等優點，非常適合對大樣本數據進行特征選擇。Fisher 分類器算法根據數據點的分布特征得出 Fisher 評分（Fisher score，F-score）^[11]。某個特征的 F-score 越高，表明其數據分布具有異類數據點分布越分散，而同類數據點分布越聚集的特征，表明該特征具有最有效的區分程度。因此本研究根據 F-score 值的大小對所有的輸入特征進行排序，選擇適當的閾值，去除 F-score 值較小的特征。在此過程中閾值的選擇是關鍵，直接決定了特征選擇的效果。本研究采用閾值優選的方法以獲得最佳的效果，即從大到小選擇一組閾值，生成一系列的特征子集，分別計算特征子集的分類準確率，從而確定最高準確率下的最優閾值。經過特征選擇過程，從高維的特征數據中篩除一些無關的或冗余的特征分量來達到降維的目的。

圖1 GOLD2007 分類分析的特征選擇流程圖 Figure1. Flow chart describing the feature selection process of GOLD2007 classification analysis

圖選項

序號	特征名稱	描述
1	FEV1/FVC	“一秒用力呼氣量”占“用力肺活量”的比值
2	FEV1%	“一秒用力呼氣量”占“用力肺活量”預計值的百分比
3	FEV1	一秒用力呼氣量
4	pre_FEV1_FVC	支氣管擴張前“一秒用力呼氣量”與“用力肺活量”的比值
5	SF36_PCS_score	SF-36 量表-軀體健康評分
6	FVCpp_utah	“用力肺活量”占其預計值的比值
7	deltaFEV1	支氣管擴張前后“一秒用力呼氣量”的變化率
8	SF36_VT_t_score	SF-36 量表-精力評分（對自身精力和疲勞程度的主觀感受）
9	LtdUphill	急行或上坡時是否有氣短現象
10	SmokStopAge	停止吸煙的年齡

1.	Criner G J, Bourbeau J, Diekemper R L, et al. Prevention of acute exacerbations of COPD: American College of Chest Physicians and Canadian Thoracic Society Guideline. Chest, 2015, 147(4): 894-942.
2.	Torres A, Menéndez R. Mortality in COPD patients with community-acquired pneumonia: Who is the third partner? European Respiratory Journal, 2006, 28(2): 262-263.
3.	O'Reilly J, Jones M M, Parnham J, et al. Management of stable chronic obstructive pulmonary disease in primary and secondary care: summary of updated Nice guidance. BMJ, 2010, 340: c3134.
4.	Gupta, S. Agrawal A, Gopalakrishnan K, Deep learning with limited numerical precision, Computer Science, 2015: 234-241.
5.	Mohamed A, Sainath T N, Dahl G, et al. Deep belief networks using discriminative features for phone recognition, 2011 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). 2011: 5060-5063.
6.	Schmidhuber, J. Deep learning in neural networks: an overview, Neural Networks, 2015, 61: 85.
7.	Glorot X B, Bordes A, Bengio Y. Domain adaptation for large-scale sentiment classification: a deep learning approach//in Proceedings of the 28th International Conference on Machine Learning (ICML-11), 2011: 513-520.
8.	Regan E A, Hokanson J E, Murphy J R, et al. Genetic epidemiology of COPD (COPDGene) study design. COPD, 2010, 7(1): 32-43.
9.	Han M K, Muellerova H, Curran-Everett D, et al. Gold 2011 disease severity classification in COPDGene: a prospective cohort study. Lancet Respir Med, 2013, 1(1): 43-50.
10.	Yusen R D. Evolution of the Gold documents for the diagnosis, management, and prevention of chronic obstructive pulmonary disease. Controversies and questions. Am J Respir Crit Care Med, 2013, 188(1): 4-5.
11.	Duda R O, Hart P E, Stork D G, Pattern Classification. John wiley & Sons, 2012: 273-280.
12.	LeCun Y, Bengio Y, Hinton G. Deep learning. Nature, 2015, 521(7553): 436-444.
13.	Mohamed A, Yu dong, Deng Li. Investigation of full-sequence training of deep belief networks for speech recognition. Interspeech. 2010: 2846-2849.
14.	Kuremoto T, Kimura S, Kobayashi K A. Time series forecasting using a deep belief network with restricted Boltzmann machines. Neurocomputing, 2014, 137(SI): 47-56.
15.	Hinton G E, Osindero S, Teh Y W. A fast learning algorithm for deep belief nets. Neural Comput, 2006, 18(7): 1527-1554.
16.	Bengio Y, Lamblin P, Popovici D, Greedy layer-wise training of deep networks, Advances in neural information processing systems, 2006, 19: 153.
17.	Karakida R O, Okada M, Amari S I. Dynamical analysis of contrastive divergence learning:Restricted Boltzmann machines with Gaussian visible units. Neural Networks, 2016, 79(3): 78-87.
18.	Hinton G E, Salakhutdinov R R. Reducing the dimensionality of data with neural networks. Science, 2006, 313(5786): 504-507.
19.	Semwal V B, Mondal K, Nandi G C. Robust and accurate feature selection for humanoid push recovery and classification: deep learning approach. Neural Comput & Appl, 2017, 28(3): 565-574.
20.	Cai Deng, Zhang Chiyuan, He Xiaofei. Unsupervised feature selection for multi-cluster data//in Proceedings of the 16th ACM SIGKDD international conference on Knowledge discovery and data mining, 2010: 333-342.
21.	Carneiro G, Mateus D, Lo?c P, et al. Deep learning and data labeling for medical applications, 2016: 231-245.
22.	Lange P, Marott J L, Vestbo J, et al. Prediction of the clinical course of chronic obstructive pulmonary disease, using the new GOLD classification: a study of the general population. Am J Respir Crit Care Med, 2012, 186(10): 975-981.
23.	Burholt V, Nash P. Short form 36 (SF-36) health survey questionnaire: normative data for Wales. J Public Health (Oxf), 2011, 33(4): 587-603.
24.	Hurst J R, Vestbo J, Anzueto A, et al. Susceptibility to exacerbation in chronic obstructive pulmonary disease N Engl J Med, 2010, 363(12): 1128-1138.
25.	Balcells E, Gea J, Ferrer J, et al. Factors affecting the relationship between psychological status and quality of Life in COPD patients. Health Qual Life Outcomes, 2010, 8(108): 108.
26.	Rutgers R S, Postma D, ten H, et al. Ongoing airway inflammation in patients with COPD who do not currently smoke. Thorax, 2000, 55(1): 12-18.

序號	特征名稱	描述
1	SGRQ_scoreImpact	SGRQ 評分：影響領域
2	SGRQ_scoreActive	SGRQ 評分：活動領域
3	MedorTreatAttack	胸部出現氣喘聲與哨音時是否采取藥物治療
4	ChstWheezyWhist	胸部是否出現過氣喘聲與哨音
5	LtdUphill	急行或上坡時是否有氣短現象
6	CopdAge	COPD 患病時間
7	SF36_PCS_score	SF-36 量表-軀體健康評分
8	FEV1pp_utah	“一秒用力呼氣量”占“用力肺活量”預計值的比值
9	Exacerbation_Frequency	急性加重頻率
10	SmokCigNow	一個月內是否還在抽煙

序號	特征名稱	描述
1	SGRQ_scoreImpact	SGRQ 評分：影響領域
2	SGRQ_scoreActive	SGRQ 評分：活動領域
3	MedorTreatAttack	胸部出現氣喘聲與哨音時是否采取藥物治療
4	ChstWheezyWhist	胸部是否出現過氣喘聲與哨音
5	LtdUphill	急行或上坡時是否有氣短現象
6	CopdAge	COPD 患病時間
7	SF36_PCS_score	SF-36 量表-軀體健康評分
8	FEV1pp_utah	“一秒用力呼氣量”占“用力肺活量”預計值的比值
9	Exacerbation_Frequency	急性加重頻率
10	SmokCigNow	一個月內是否還在抽煙

序號	特征名稱	描述
1	SGRQ_scoreImpact	SGRQ 評分：影響領域
2	SGRQ_scoreActive	SGRQ 評分：活動領域
3	MedorTreatAttack	胸部出現氣喘聲與哨音時是否采取藥物治療
4	ChstWheezyWhist	胸部是否出現過氣喘聲與哨音
5	LtdUphill	急行或上坡時是否有氣短現象
6	CopdAge	COPD 患病時間
7	SF36_PCS_score	SF-36 量表-軀體健康評分
8	FEV1pp_utah	“一秒用力呼氣量”占“用力肺活量”預計值的比值
9	Exacerbation_Frequency	急性加重頻率
10	SmokCigNow	一個月內是否還在抽煙

《生物醫學工程學雜志》

基于深度學習方法的慢性阻塞性肺疾病危重度分類研究

摘要 全文 圖表 視頻 參考文獻 施引文獻 補充材料

引言

1 材料與方法

1.1 數據

1.2 特征選擇

1.3 DBN 方法

2 結果

2.1 分類效果

2.2 系數矩陣

2.3 特征分析

3 討論

引言

1 材料與方法

1.1 數據

1.2 特征選擇

1.3 DBN 方法

2 結果

2.1 分類效果

2.2 系數矩陣

2.3 特征分析

3 討論

上一篇

下一篇

Format

Content

摘要全文圖表視頻參考文獻施引文獻補充材料