睡眠呼吸暫停會導致患者心跳呼吸驟停、睡眠節律紊亂、夜間低血氧和血壓異常波動,最終導致高血壓患者夜間靶器官損害。阻塞性睡眠呼吸暫停低通氣綜合征(OSAHS)發病率極高,嚴重影響了患者的身心健康。本研究嘗試從24小時動態血壓數據中提取與OSAHS相關的特征,通過機器學習模型識別OSAHS,從而實現該疾病的鑒別診斷。研究數據來自2018年12月至2019年12月解放軍總醫院睡眠門診收集的339例患者的動態血壓檢查數據,其中經多導睡眠監測(PSG)確診的OSAHS患者115例,非OSAHS患者224例。根據OSAHS患者血壓臨床變化特點,定義了特征提取規則并開發算法提取特征,而后使用logistic回歸、lightGBM等模型對疾病進行分類預測。結果表明本研究所訓練的lightGBM模型的識別準確率為80.0%,精確率為82.9%,召回率為72.5%,受試者工作特征曲線下面積(AUC)為0.906,所定義的動態血壓特征能夠有效用于OSAHS檢測。本研究為OSAHS篩查提供了一種新的思路和方法。
引用本文: 張健, 任皎潔, 孫書臣, 張政波. 基于24小時動態血壓數據識別阻塞性睡眠呼吸暫停綜合征研究. 生物醫學工程學雜志, 2022, 39(1): 1-9. doi: 10.7507/1001-5515.202111030 復制
版權信息: ?四川大學華西醫院華西期刊社《生物醫學工程學雜志》版權所有,未經授權不得轉載、改編
引言
阻塞性睡眠呼吸暫停低通氣綜合征(obstructive sleep apnea hypopnea syndrome,OSAHS)是指患者在睡眠過程中反復出現呼吸暫停和低通氣,臨床上可表現為打鼾且鼾聲不規律,患者自覺憋氣甚至反復被憋醒,常伴有夜尿增多、晨起頭痛頭暈和口咽干燥等一系列癥候群。臨床上OSAHS診斷的金標準是整夜多導睡眠監測(polysomnography,PSG),盡管PSG監測已在很多三甲醫院應用,但因其監測的整夜封閉性和診斷的專業復雜性,相當一部分基層醫療機構并不具備監診條件,而24 h動態血壓監測(ambulatory blood pressure monitoring,ABPM)在一般醫院則更為普及。正常人24 h內血壓呈“兩峰一谷”的節律性波動,即于凌晨3~4時降至最低點后逐漸上升,分別于日間上午8~10時和下午16~18時出現峰值,而后繼續緩慢降低直至次日凌晨[1]。血壓的監測數據表明晝夜節律的改變與OSAHS的發生密切相關,異常夜間血壓模式的量化參數可能是人群中篩查OSAHS的有效指標[2],這提示了OSAHS的預測或許可從監測動態血壓中獲益[3]。現已明確高血壓合并OSAHS的患者中非杓型血壓所占比例較高[4],且夜間血壓異常是OSAHS患者的特征性表現之一,一項系統評價表明OSAHS的患病率高達3.93%[5],而OSAHS可使血壓非杓型改變的可能性至少提升1.5倍,這大大增加了患者靶器官損害的風險[6]。綜上,研發出一項基于24小時動態血壓從而便于基層醫院推廣和應用的、可媲美PSG監測效能的OSAHS早期篩查手段具有重要意義。
近年來,有關動態血壓的分析研究通常集中在血壓曲線整體趨勢和晨峰血壓變化上。兩項研究用等效梯形積分的方法分別計算收縮壓(systolic blood pressure,SBP)、舒張壓(diastolic blood pressure,DBP)曲線與時間軸之間的面積,兩者的差值具有比傳統血壓負荷更寬的線性范圍,能更加準確地反映高血壓嚴重程度[7-8]。另兩項研究關注動態血壓變化的晨峰特點,OSAHS患者比其他患者更早出現血壓晨峰[9-10]。一些學者更關注獲取動態血壓曲線整體趨勢信息,如Kelley等[11]提出用余弦變換模型對動態血壓趨勢進行分析;van Rijn-Bikker等[12]利用非線性混合效應模型分析動態血壓趨勢;而Madden等[13]則利用隨機效應多分量余弦模型對動態血壓趨勢和晨峰斜率進行分析。上述研究針對動態血壓整體趨勢信息進行分析,無法有效捕捉和分析OSAHS所引起的血壓變化特征。
一些研究也使用動態血壓特征進行OSAHS的篩查識別,Torres等[14]使用ABPM數據獲得的分類模型為OSAHS的早期篩查提供了一定的手段。由于動態血壓時間序列沒有明顯的趨勢和短暫的季節性[15],目前尚沒有較為統一和成熟的定量分析動態血壓數據的方法,我們發現以往的方法多考慮曲線擬合的規律性,通過擬合趨勢的方法尋找其中隱含的信息,并不能很好地反映OSAHS導致的血壓變化特點。我們認為在動態血壓特征提取方面應充分考慮OSAHS的臨床特點,針對性地提取相應表征變化模式的參數可能有助于OSAHS準確篩查。本研究首先由睡眠醫學專家針對OSAHS的血壓變化模式制定特征提取的規則,再由工程技術人員設計開發算法提取那些真實反映疾病變化的特征,使用統計分析和機器學習模型分析數據,最后在真實世界數據集上驗證模型性能。
1 材料與方法
1.1 數據采集與預處理
本研究所使用的實驗數據集來自2018年12月至2019年12月到解放軍總醫院睡眠門診就診的339例患者,其中經PSG確診的OSAHS患者115例,非OSAHS患者224例。使用的動態血壓數據由動態血壓記錄儀導出,原始數據存儲為十六進制,從儀器導出后經十進制轉換得到動態收縮壓、舒張壓以及心率數據,同時我們基于收縮壓和舒張壓導出了平均動脈壓和脈壓(pulse pressure,PP)。數據的采樣間隔是白天(8:00—22:00)每20 min采集一個值,夜間(22:00—次日6:00)每30 min采集一個值。所有數據均由檢查醫師手動標注剔除異常值。表1給出該數據集的人群基線信息。
 表1
                納入研究的患者基線特征
		 	
		 			 				Table1.
    			Baseline characteristics of patients enrolled in the study
			
						表1
                納入研究的患者基線特征
		 	
		 			 				Table1.
    			Baseline characteristics of patients enrolled in the study
       		
       				1.2 特征提取
1.2.1 動態血壓報告特征
24 h動態血壓是臨床篩查血壓異常疾病的主要手段,已經成為高血壓病診斷體系中不可或缺的一環,由此獲取的標準化動態血壓報告已得到臨床醫生廣泛認可。盡管其在高血壓分級、分型中的作用較為明顯,但在其他疾病篩查中的應用研究較少,本研究擬納入已經用于臨床診斷的報告特征作為模型特征的補充,以提高篩查模型的準確性。
1.2.2 新特征提取規則
為進一步挖掘利用24 h動態血壓數據,本文提出的方法以  表示動態血壓曲線函數,血壓值單位為mm Hg,時間單位為h,入睡時間記作
 表示動態血壓曲線函數,血壓值單位為mm Hg,時間單位為h,入睡時間記作  ,對應血壓值
,對應血壓值  為“夜間血壓基線”;次日晨峰時間記作
 為“夜間血壓基線”;次日晨峰時間記作  ,對應血壓值
,對應血壓值  為“晨峰血壓基線”。血壓上升的有效閾值記作
 為“晨峰血壓基線”。血壓上升的有效閾值記作  ,血壓下降的有效閾值記作
,血壓下降的有效閾值記作  。王琳等[16]研究發現,55歲以上的OSAHS患者夜間血壓會上升(22.33±9.57)mm Hg,而55歲以下的OSAHS患者夜間血壓會上升(16.31 ± 2.96)mm Hg,95%置信區間分別為(3.57,41.09)mm Hg和(10.51,22.11)mm Hg,這里我們設定血壓波動閾值超過10 mm Hg有臨床意義。該方法使用前應先確定入睡(晨醒)時間和基線血壓,推薦的方法是由患者填寫睡眠登記表記錄入睡和晨醒時間;在相應記錄不完整的情況下可由專業醫生判讀ABPM曲線,標定基線值;若上述兩項均未實現,可將ABPM監測設備指定的入睡時間(22:00)、晨醒時間(定為5:00)作為基線時間。區分夜間血壓先上升、夜間血壓先下降和晨峰血壓三類定義特征提取的規則,涵蓋時間、幅度、變化率、面積、波動計數等在內的5種20個指標,實際使用時可按需對收縮壓、舒張壓以及脈壓等分別進行計算。后文中,圖1為血壓上升情形計算指標示意圖;圖2為血壓下降情形計算指標示意圖。
。王琳等[16]研究發現,55歲以上的OSAHS患者夜間血壓會上升(22.33±9.57)mm Hg,而55歲以下的OSAHS患者夜間血壓會上升(16.31 ± 2.96)mm Hg,95%置信區間分別為(3.57,41.09)mm Hg和(10.51,22.11)mm Hg,這里我們設定血壓波動閾值超過10 mm Hg有臨床意義。該方法使用前應先確定入睡(晨醒)時間和基線血壓,推薦的方法是由患者填寫睡眠登記表記錄入睡和晨醒時間;在相應記錄不完整的情況下可由專業醫生判讀ABPM曲線,標定基線值;若上述兩項均未實現,可將ABPM監測設備指定的入睡時間(22:00)、晨醒時間(定為5:00)作為基線時間。區分夜間血壓先上升、夜間血壓先下降和晨峰血壓三類定義特征提取的規則,涵蓋時間、幅度、變化率、面積、波動計數等在內的5種20個指標,實際使用時可按需對收縮壓、舒張壓以及脈壓等分別進行計算。后文中,圖1為血壓上升情形計算指標示意圖;圖2為血壓下降情形計算指標示意圖。
 圖1
				血壓上升情形指標計算示意圖
			
												
				Figure1.
				Diagram for calculating indicators of blood pressure rise
						
				圖1
				血壓上升情形指標計算示意圖
			
												
				Figure1.
				Diagram for calculating indicators of blood pressure rise
			
								 圖2
				血壓下降情形指標計算示意圖
			
												
				Figure2.
				Diagram of calculating indicators of blood pressure drop
						
				圖2
				血壓下降情形指標計算示意圖
			
												
				Figure2.
				Diagram of calculating indicators of blood pressure drop
			
								1.2.3 夜間血壓先上升的情形
(1)夜間血壓上升有效高度 :第1個高于基線血壓的值,圖1中
:第1個高于基線血壓的值,圖1中 表示為:
表示為:
|  | 
有效的  應滿足條件
 應滿足條件  ;其對應的時間點記作
;其對應的時間點記作  。
。
(2)夜間血壓上升最大高度  :夜間血壓超過基線的最大值,即:
:夜間血壓超過基線的最大值,即:
|  | 
(3)夜間血壓上升持續時間  :從基線上升至
:從基線上升至  所用的時間,即:
 所用的時間,即:
|  | 
(4)夜間血壓上升斜率  :上升高度
:上升高度  與上升持續時間
 與上升持續時間  的比值,即:
 的比值,即:
|  | 
(5)夜間血壓波動頻次  :基線以上血壓值個數,即圖1中紫色箭頭所示點的個數。
:基線以上血壓值個數,即圖1中紫色箭頭所示點的個數。
(6)夜間血壓基線上面積  :即圖1中紅色陰影部分面積,表示血壓增高的程度,其值等于血壓曲線
:即圖1中紅色陰影部分面積,表示血壓增高的程度,其值等于血壓曲線  部分在該段時間內的積分,即:
 部分在該段時間內的積分,即:
|  | 
其中  和
 和  需通過插值的方法求得。
 需通過插值的方法求得。
1.2.4 夜間血壓先下降的情形
(1)夜間血壓下降有效高度  :第1個低于基線血壓的值,圖2中
:第1個低于基線血壓的值,圖2中  表示為:
 表示為:
|  | 
有效的  應滿足條件
 應滿足條件  ;其對應的時間點記作
;其對應的時間點記作  。
。
(2)夜間血壓下降最大深度  :夜間血壓低于基線最大值,即:
:夜間血壓低于基線最大值,即:
|  | 
(3)夜間血壓下降持續時間  :從基線下降至
:從基線下降至  所用的時間,即:
 所用的時間,即:
|  | 
(4)夜間血壓下降斜率  :下降高度
:下降高度  與上升持續時間
 與上升持續時間  比值的相反數,即:
 比值的相反數,即:
|  | 
(5)夜間血壓二次上升持續時間  :從
:從  上升至
 上升至  所用的時間,其中
 所用的時間,其中  ,即:
,即:
|  | 
(6)夜間血壓二次上升斜率  :上升高度
:上升高度  或小于
 或小于  的某個
 的某個  與上升持續時間
 與上升持續時間  的比值,即:
 的比值,即:
|  | 
(7)夜間血壓波動頻次  :第1個有效下降
:第1個有效下降  點作為臨時基線,臨時基線以上且高于
 點作為臨時基線,臨時基線以上且高于  血壓值的個數,即圖2中紫色箭頭所示點的個數。
 血壓值的個數,即圖2中紫色箭頭所示點的個數。
(8)夜間血壓基線下面積  :即圖2中綠色陰影部分面積,表示血壓降低的程度,其值等于血壓曲線
:即圖2中綠色陰影部分面積,表示血壓降低的程度,其值等于血壓曲線  部分在該段時間內的積分,即:
 部分在該段時間內的積分,即:
|  | 
其中  和
 和  需通過插值的方法求得。
 需通過插值的方法求得。
		1.2.5   晨峰血壓變化的情況(如圖1 所示)
	
		
			
		(1)晨峰血壓上升最大高度  :晨峰血壓超過基線的最大值,即:
:晨峰血壓超過基線的最大值,即:
|  | 
其對應的時間點記作  。
。
(2)晨峰血壓上升持續時間  :從基線上升至
:從基線上升至  所用的時間,即:
 所用的時間,即:
|  | 
(3)晨峰血壓上升斜率  :上升高度
:上升高度  與上升持續時間
 與上升持續時間  的比值,即:
 的比值,即:
|  | 
(4)晨峰血壓下降持續時間  :從
:從  降至基線或某個
 降至基線或某個  所用的時間,即:
 所用的時間,即:
|  | 
圖2中  ,
, 需插值求得。
 需插值求得。
(5)晨峰血壓下降斜率  :下降高度
:下降高度  與下降持續時間
 與下降持續時間  比值的相反數,即:
 比值的相反數,即:
|  | 
(6)晨峰血壓基線上面積  :圖1中
:圖1中  時間以后紅色陰影部分面積,表示血壓增高的程度,其值等于血壓曲線
 時間以后紅色陰影部分面積,表示血壓增高的程度,其值等于血壓曲線  部分在該段時間內的積分,即:
 部分在該段時間內的積分,即:
|  | 
其中  需通過插值的方法求得。
 需通過插值的方法求得。
1.3 統計分析
統計分析使用SPSS 26.0軟件。正態計量數據使用  表示,非正態數據使用Md(IQR)表示;使用Kolmogorov-Smirnov法對數據進行正態性檢驗,采用Levene法進行方差齊性檢驗;滿足正態方差齊的連續數據比較使用兩獨立樣本t檢驗,偏態連續數據使用曼惠特尼-U檢驗,計數數據使用卡方或費舍爾精確概率法(理論頻數小于5的方格超過總數的20%時)檢驗。
 表示,非正態數據使用Md(IQR)表示;使用Kolmogorov-Smirnov法對數據進行正態性檢驗,采用Levene法進行方差齊性檢驗;滿足正態方差齊的連續數據比較使用兩獨立樣本t檢驗,偏態連續數據使用曼惠特尼-U檢驗,計數數據使用卡方或費舍爾精確概率法(理論頻數小于5的方格超過總數的20%時)檢驗。
1.4 建模分析
以非OSAHS組為負樣本組,OSAHS組為正樣本組,使用二分類邏輯回歸模型(logistic regression,LR)作為基準模型,同時選取支持向量機(support vector machine,SVM)、輕型梯度提升機(light gradient boosting machine,lightGBM)、極限梯度提升機(extreme gradient boosting,XGBoost)等機器學習模型進行研究。數據集按照4∶1的比例劃分訓練集和測試集,即:數據的80%作為訓練集(其中再取25%作驗證集,用于訓練時調整模型的超參數);20%作為測試集,用于測試模型對未知數據的泛化能力。模型訓練時采用5折交叉驗證,采用網格化搜索的方式進行超參數調整;模型的評估采用準確率(accuracy)、精確率(precision)、召回率(recall)、F1-score以及受試者操作特征(receiver operating characteristic,ROC)曲線下面積(area under curve,AUC)、精確率-召回率曲線(PR曲線)下面積(area under precision-recall curve,AP)衡量。
2 結果
如表2所示,現有動態血壓報告特征方面,相比非OSAHS組,OSAHS組的日間平均舒張壓、夜間平均收縮壓和夜間最小收縮壓顯著增加,且24小時收縮壓負荷更大,夜間收縮壓下降率更小,提示OSAHS患者的夜間血壓不下降且收縮壓表現更明顯,OSAHS導致的不利影響可能是白天舒張壓增高的重要原因。本文提出的特征方面,OSAHS組的二次血壓上升斜率更大,其收縮壓晨峰較非OSAHS組更晚且時間分布更分散,平均壓下降持續時間更短,提示OSAHS組血壓波動更為劇烈。
 表2
                動態血壓特征組間差異比較
		 	
		 			 				Table2.
    			Comparison of ambulatory blood pressure features between groups
			
						表2
                動態血壓特征組間差異比較
		 	
		 			 				Table2.
    			Comparison of ambulatory blood pressure features between groups
       		
       				構建二分類logistic回歸模型時,在不包含性別、年齡、患合并癥等條件下將特征進行標準化,使用遞歸特征消除(recursive feature elimination,RFE)的方式選擇特征,分類器選用LR模型,參數采用默認設置;接著使用lightGBM模型進行特征重要性排序,以此選擇最佳特征及其重要性得分,如圖3所示。
 圖3
				lightGBM模型計算的特征重要性排序
			
												
				Figure3.
				Rank of feature importance calculated by lightGBM model
						
				圖3
				lightGBM模型計算的特征重要性排序
			
												
				Figure3.
				Rank of feature importance calculated by lightGBM model
			
								將選擇的特征分別輸入LR、SVM、XGBoost以及light GBM模型中進行訓練和測試,模型評估指標如表3和圖4所示。我們的lightGBM模型依靠單純動態血壓數據在訓練集上對OSAHS識別預測準確率可以達到88.2%,精確率為78.5%,召回率為82.7%,F1得分0.805,AUC為0.945;在測試集上預測準確率可以達到80.0%,精確率為82.9%,召回率為72.5%,F1得分0.773,AUC 0.906,高于以往文獻中包含血壓特征的研究,他們的模型AUC分別為0.747[14]和0.804[17]。
 表3
                四種模型分別在訓練集和測試集上的性能
		 	
		 			 				Table3.
    			Performance of the four models on training set and test   set respectively
			
						表3
                四種模型分別在訓練集和測試集上的性能
		 	
		 			 				Table3.
    			Performance of the four models on training set and test   set respectively
       		
       				 圖4
				四個模型分別在訓練集和測試集上的ROC、PR曲線
			
												
				Figure4.
				ROC and PR curves of the four models on the training set and test set respectively
						
				圖4
				四個模型分別在訓練集和測試集上的ROC、PR曲線
			
												
				Figure4.
				ROC and PR curves of the four models on the training set and test set respectively
			
								3 討論和結論
本研究的結果表明,24小時動態血壓診斷報告中現有的特征如夜間收縮壓[18-19]、夜間舒張壓[20-21]、血壓節律[18,22]、血壓負荷[19,23-24]與以往研究結果一致,而我們提出的夜間血壓上升斜率、夜間血壓波動[25]次數以及晨峰[26]血壓啟動時刻等特征同樣具有統計學意義,夜間收縮壓和24小時舒張壓在OSAHS患者血壓變化中更為突出,我們新定義的斜率、面積、持續時間等特征在表征OSAHS患者時也取得顯著效果。動態血壓數據因其不等間隔和稀疏的原因,除用于高血壓分型的鑒別診斷外,較少用于其他疾病的篩查。盡管如此,本研究依舊認為OSAHS的呼吸暫停導致的血壓變化在臨床上是非常有用的,特別是OSAHS合并高血壓患者,血壓對睡眠呼吸暫停發作的表征有其獨特意義。雖然以前的研究也取得一些好的結果,STOP-Bang問卷引入AMBP變量后可較好地識別中-重度OSAHS患者[27],但該方法對輕度OSAHS的識別較為困難;苗曉東等[28]使用ABPM常規特征篩查了OSAHS,但模型整體性能還有提升空間;Torres等[14]使用ABPM監測的4個變量獲得的模型AUC為0.736,他們的特征僅為報告特征,缺乏針對性。一些作者認為ABPM檢查預測OSAHS時敏感性較低,準確性中等[29],事實上研究的結果還顯示出了較低的特異性[28]。針對上述研究存在的不足,我們研究的思路是針對疾病特點設計和制定特征規則,從而使特征能夠更加準確地反映OSAHS患者血壓變化特點。本研究提取了基于規則的5類20個特征用于建模,所訓練的lightGBM模型在測試集上的識別準確率為80.0%,精確率為82.9%,召回率為72.5%,AUC為0.906,所定義的動態血壓特征和訓練的分類器能夠用于OSAHS的有效檢測。
血壓數據的稀疏性也是它不同于連續生理信號的地方,進而導致了本研究具有一定的局限性。一是不同個體血壓測量的間隔、起始點以及入睡覺醒時間不同都會影響本研究給出的結果,因此,在現實臨床場景中應用時應該要求被檢測的患者記錄入睡、覺醒時間,以便本文算法更準確地評估。二是不同的數據采樣間隔導致我們定義的一些時間參數,如晨峰啟動時刻、晨峰上升時間等會發生誤差,進而由此計算的斜率等參數也會存在一定的誤差。因此,應用本文的算法和模型時應盡可能確保血壓采集的間隔更短,推薦合理的血壓采樣間隔使用20~30 min。三是袖帶機械性充放氣對受試者睡眠質量的影響可能會對模型造成干擾。于佳嵐等[30]認為動態血壓檢查過程可影響老年高血壓患者夜間睡眠質量從而造成患者血壓參數的變化,這可能會導致模型的假陽性率升高;也有研究認為動態血壓監測對患者睡眠質量無明顯影響[31],這時的模型基本上是準確的。
本研究根據OSAHS患者血壓變化特點,定義了針對OSAHS的動態血壓特征提取規則,開發了相應的特征提取算法,使用這些特征訓練了用于OSAHS篩查的機器學習模型,建立了單純運用動態血壓特征的OSAHS早期篩查模型,我們建立的lightGBM模型在訓練集和測試集上分別取得了0.945和0.906的AUC值,測試集上的識別準確率為80.0%。本研究為OSAHS篩查提供了一種新的思路和方法,為OSAHS患者夜間血壓變化提供了量化評估手段,有望在OSAHS篩查中發揮重要作用。未來的研究應著重在動態血壓睡眠監測中建立較為統一的范式,對使用動態血壓監測篩查OSAHS的醫療行為制定科學規范,控制患者個體間差異使其最小化,進一步提高動態血壓篩查的精準度,有利于在臨床診療中的推廣應用。此外,盡管本研究取得了較好的結果,但模型的性能還需進行嚴格的外部驗證,一些新的特征挖掘和模型開發研究仍然很有必要,我們的研究將進一步聚焦臨床問題展開工作。本研究提出的基于24小時動態血壓識別OSAHS的方法具有新穎性,可作為在PSG確診前的初篩手段,提高OSAHS患者的早期診斷率,為疾病的早期干預提供有力支撐。
重要聲明
利益沖突聲明:本文全體作者均聲明不存在利益沖突。
作者貢獻聲明:張健負責本研究算法設計和開發工作,處理分析數據以及撰寫文章;任皎潔博士負責研究設計和數據收集整理、結果解讀解釋相關工作;兩位作者對本文具有同等貢獻。孫書臣指導了研究設計、特征提取規則擬定和結果臨床解釋工作。張政波指導了算法設計開發、數據處理和建模分析工作。
倫理聲明:本研究經解放軍總醫院倫理審查委員會批準(批準編號為:S2018-095-01)。
引言
阻塞性睡眠呼吸暫停低通氣綜合征(obstructive sleep apnea hypopnea syndrome,OSAHS)是指患者在睡眠過程中反復出現呼吸暫停和低通氣,臨床上可表現為打鼾且鼾聲不規律,患者自覺憋氣甚至反復被憋醒,常伴有夜尿增多、晨起頭痛頭暈和口咽干燥等一系列癥候群。臨床上OSAHS診斷的金標準是整夜多導睡眠監測(polysomnography,PSG),盡管PSG監測已在很多三甲醫院應用,但因其監測的整夜封閉性和診斷的專業復雜性,相當一部分基層醫療機構并不具備監診條件,而24 h動態血壓監測(ambulatory blood pressure monitoring,ABPM)在一般醫院則更為普及。正常人24 h內血壓呈“兩峰一谷”的節律性波動,即于凌晨3~4時降至最低點后逐漸上升,分別于日間上午8~10時和下午16~18時出現峰值,而后繼續緩慢降低直至次日凌晨[1]。血壓的監測數據表明晝夜節律的改變與OSAHS的發生密切相關,異常夜間血壓模式的量化參數可能是人群中篩查OSAHS的有效指標[2],這提示了OSAHS的預測或許可從監測動態血壓中獲益[3]。現已明確高血壓合并OSAHS的患者中非杓型血壓所占比例較高[4],且夜間血壓異常是OSAHS患者的特征性表現之一,一項系統評價表明OSAHS的患病率高達3.93%[5],而OSAHS可使血壓非杓型改變的可能性至少提升1.5倍,這大大增加了患者靶器官損害的風險[6]。綜上,研發出一項基于24小時動態血壓從而便于基層醫院推廣和應用的、可媲美PSG監測效能的OSAHS早期篩查手段具有重要意義。
近年來,有關動態血壓的分析研究通常集中在血壓曲線整體趨勢和晨峰血壓變化上。兩項研究用等效梯形積分的方法分別計算收縮壓(systolic blood pressure,SBP)、舒張壓(diastolic blood pressure,DBP)曲線與時間軸之間的面積,兩者的差值具有比傳統血壓負荷更寬的線性范圍,能更加準確地反映高血壓嚴重程度[7-8]。另兩項研究關注動態血壓變化的晨峰特點,OSAHS患者比其他患者更早出現血壓晨峰[9-10]。一些學者更關注獲取動態血壓曲線整體趨勢信息,如Kelley等[11]提出用余弦變換模型對動態血壓趨勢進行分析;van Rijn-Bikker等[12]利用非線性混合效應模型分析動態血壓趨勢;而Madden等[13]則利用隨機效應多分量余弦模型對動態血壓趨勢和晨峰斜率進行分析。上述研究針對動態血壓整體趨勢信息進行分析,無法有效捕捉和分析OSAHS所引起的血壓變化特征。
一些研究也使用動態血壓特征進行OSAHS的篩查識別,Torres等[14]使用ABPM數據獲得的分類模型為OSAHS的早期篩查提供了一定的手段。由于動態血壓時間序列沒有明顯的趨勢和短暫的季節性[15],目前尚沒有較為統一和成熟的定量分析動態血壓數據的方法,我們發現以往的方法多考慮曲線擬合的規律性,通過擬合趨勢的方法尋找其中隱含的信息,并不能很好地反映OSAHS導致的血壓變化特點。我們認為在動態血壓特征提取方面應充分考慮OSAHS的臨床特點,針對性地提取相應表征變化模式的參數可能有助于OSAHS準確篩查。本研究首先由睡眠醫學專家針對OSAHS的血壓變化模式制定特征提取的規則,再由工程技術人員設計開發算法提取那些真實反映疾病變化的特征,使用統計分析和機器學習模型分析數據,最后在真實世界數據集上驗證模型性能。
1 材料與方法
1.1 數據采集與預處理
本研究所使用的實驗數據集來自2018年12月至2019年12月到解放軍總醫院睡眠門診就診的339例患者,其中經PSG確診的OSAHS患者115例,非OSAHS患者224例。使用的動態血壓數據由動態血壓記錄儀導出,原始數據存儲為十六進制,從儀器導出后經十進制轉換得到動態收縮壓、舒張壓以及心率數據,同時我們基于收縮壓和舒張壓導出了平均動脈壓和脈壓(pulse pressure,PP)。數據的采樣間隔是白天(8:00—22:00)每20 min采集一個值,夜間(22:00—次日6:00)每30 min采集一個值。所有數據均由檢查醫師手動標注剔除異常值。表1給出該數據集的人群基線信息。
 表1
                納入研究的患者基線特征
		 	
		 			 				Table1.
    			Baseline characteristics of patients enrolled in the study
			
						表1
                納入研究的患者基線特征
		 	
		 			 				Table1.
    			Baseline characteristics of patients enrolled in the study
       		
       				1.2 特征提取
1.2.1 動態血壓報告特征
24 h動態血壓是臨床篩查血壓異常疾病的主要手段,已經成為高血壓病診斷體系中不可或缺的一環,由此獲取的標準化動態血壓報告已得到臨床醫生廣泛認可。盡管其在高血壓分級、分型中的作用較為明顯,但在其他疾病篩查中的應用研究較少,本研究擬納入已經用于臨床診斷的報告特征作為模型特征的補充,以提高篩查模型的準確性。
1.2.2 新特征提取規則
為進一步挖掘利用24 h動態血壓數據,本文提出的方法以  表示動態血壓曲線函數,血壓值單位為mm Hg,時間單位為h,入睡時間記作
 表示動態血壓曲線函數,血壓值單位為mm Hg,時間單位為h,入睡時間記作  ,對應血壓值
,對應血壓值  為“夜間血壓基線”;次日晨峰時間記作
 為“夜間血壓基線”;次日晨峰時間記作  ,對應血壓值
,對應血壓值  為“晨峰血壓基線”。血壓上升的有效閾值記作
 為“晨峰血壓基線”。血壓上升的有效閾值記作  ,血壓下降的有效閾值記作
,血壓下降的有效閾值記作  。王琳等[16]研究發現,55歲以上的OSAHS患者夜間血壓會上升(22.33±9.57)mm Hg,而55歲以下的OSAHS患者夜間血壓會上升(16.31 ± 2.96)mm Hg,95%置信區間分別為(3.57,41.09)mm Hg和(10.51,22.11)mm Hg,這里我們設定血壓波動閾值超過10 mm Hg有臨床意義。該方法使用前應先確定入睡(晨醒)時間和基線血壓,推薦的方法是由患者填寫睡眠登記表記錄入睡和晨醒時間;在相應記錄不完整的情況下可由專業醫生判讀ABPM曲線,標定基線值;若上述兩項均未實現,可將ABPM監測設備指定的入睡時間(22:00)、晨醒時間(定為5:00)作為基線時間。區分夜間血壓先上升、夜間血壓先下降和晨峰血壓三類定義特征提取的規則,涵蓋時間、幅度、變化率、面積、波動計數等在內的5種20個指標,實際使用時可按需對收縮壓、舒張壓以及脈壓等分別進行計算。后文中,圖1為血壓上升情形計算指標示意圖;圖2為血壓下降情形計算指標示意圖。
。王琳等[16]研究發現,55歲以上的OSAHS患者夜間血壓會上升(22.33±9.57)mm Hg,而55歲以下的OSAHS患者夜間血壓會上升(16.31 ± 2.96)mm Hg,95%置信區間分別為(3.57,41.09)mm Hg和(10.51,22.11)mm Hg,這里我們設定血壓波動閾值超過10 mm Hg有臨床意義。該方法使用前應先確定入睡(晨醒)時間和基線血壓,推薦的方法是由患者填寫睡眠登記表記錄入睡和晨醒時間;在相應記錄不完整的情況下可由專業醫生判讀ABPM曲線,標定基線值;若上述兩項均未實現,可將ABPM監測設備指定的入睡時間(22:00)、晨醒時間(定為5:00)作為基線時間。區分夜間血壓先上升、夜間血壓先下降和晨峰血壓三類定義特征提取的規則,涵蓋時間、幅度、變化率、面積、波動計數等在內的5種20個指標,實際使用時可按需對收縮壓、舒張壓以及脈壓等分別進行計算。后文中,圖1為血壓上升情形計算指標示意圖;圖2為血壓下降情形計算指標示意圖。
 圖1
				血壓上升情形指標計算示意圖
			
												
				Figure1.
				Diagram for calculating indicators of blood pressure rise
						
				圖1
				血壓上升情形指標計算示意圖
			
												
				Figure1.
				Diagram for calculating indicators of blood pressure rise
			
								 圖2
				血壓下降情形指標計算示意圖
			
												
				Figure2.
				Diagram of calculating indicators of blood pressure drop
						
				圖2
				血壓下降情形指標計算示意圖
			
												
				Figure2.
				Diagram of calculating indicators of blood pressure drop
			
								1.2.3 夜間血壓先上升的情形
(1)夜間血壓上升有效高度 :第1個高于基線血壓的值,圖1中
:第1個高于基線血壓的值,圖1中 表示為:
表示為:
|  | 
有效的  應滿足條件
 應滿足條件  ;其對應的時間點記作
;其對應的時間點記作  。
。
(2)夜間血壓上升最大高度  :夜間血壓超過基線的最大值,即:
:夜間血壓超過基線的最大值,即:
|  | 
(3)夜間血壓上升持續時間  :從基線上升至
:從基線上升至  所用的時間,即:
 所用的時間,即:
|  | 
(4)夜間血壓上升斜率  :上升高度
:上升高度  與上升持續時間
 與上升持續時間  的比值,即:
 的比值,即:
|  | 
(5)夜間血壓波動頻次  :基線以上血壓值個數,即圖1中紫色箭頭所示點的個數。
:基線以上血壓值個數,即圖1中紫色箭頭所示點的個數。
(6)夜間血壓基線上面積  :即圖1中紅色陰影部分面積,表示血壓增高的程度,其值等于血壓曲線
:即圖1中紅色陰影部分面積,表示血壓增高的程度,其值等于血壓曲線  部分在該段時間內的積分,即:
 部分在該段時間內的積分,即:
|  | 
其中  和
 和  需通過插值的方法求得。
 需通過插值的方法求得。
1.2.4 夜間血壓先下降的情形
(1)夜間血壓下降有效高度  :第1個低于基線血壓的值,圖2中
:第1個低于基線血壓的值,圖2中  表示為:
 表示為:
|  | 
有效的  應滿足條件
 應滿足條件  ;其對應的時間點記作
;其對應的時間點記作  。
。
(2)夜間血壓下降最大深度  :夜間血壓低于基線最大值,即:
:夜間血壓低于基線最大值,即:
|  | 
(3)夜間血壓下降持續時間  :從基線下降至
:從基線下降至  所用的時間,即:
 所用的時間,即:
|  | 
(4)夜間血壓下降斜率  :下降高度
:下降高度  與上升持續時間
 與上升持續時間  比值的相反數,即:
 比值的相反數,即:
|  | 
(5)夜間血壓二次上升持續時間  :從
:從  上升至
 上升至  所用的時間,其中
 所用的時間,其中  ,即:
,即:
|  | 
(6)夜間血壓二次上升斜率  :上升高度
:上升高度  或小于
 或小于  的某個
 的某個  與上升持續時間
 與上升持續時間  的比值,即:
 的比值,即:
|  | 
(7)夜間血壓波動頻次  :第1個有效下降
:第1個有效下降  點作為臨時基線,臨時基線以上且高于
 點作為臨時基線,臨時基線以上且高于  血壓值的個數,即圖2中紫色箭頭所示點的個數。
 血壓值的個數,即圖2中紫色箭頭所示點的個數。
(8)夜間血壓基線下面積  :即圖2中綠色陰影部分面積,表示血壓降低的程度,其值等于血壓曲線
:即圖2中綠色陰影部分面積,表示血壓降低的程度,其值等于血壓曲線  部分在該段時間內的積分,即:
 部分在該段時間內的積分,即:
|  | 
其中  和
 和  需通過插值的方法求得。
 需通過插值的方法求得。
		1.2.5   晨峰血壓變化的情況(如圖1 所示)
	
		
			
		(1)晨峰血壓上升最大高度  :晨峰血壓超過基線的最大值,即:
:晨峰血壓超過基線的最大值,即:
|  | 
其對應的時間點記作  。
。
(2)晨峰血壓上升持續時間  :從基線上升至
:從基線上升至  所用的時間,即:
 所用的時間,即:
|  | 
(3)晨峰血壓上升斜率  :上升高度
:上升高度  與上升持續時間
 與上升持續時間  的比值,即:
 的比值,即:
|  | 
(4)晨峰血壓下降持續時間  :從
:從  降至基線或某個
 降至基線或某個  所用的時間,即:
 所用的時間,即:
|  | 
圖2中  ,
, 需插值求得。
 需插值求得。
(5)晨峰血壓下降斜率  :下降高度
:下降高度  與下降持續時間
 與下降持續時間  比值的相反數,即:
 比值的相反數,即:
|  | 
(6)晨峰血壓基線上面積  :圖1中
:圖1中  時間以后紅色陰影部分面積,表示血壓增高的程度,其值等于血壓曲線
 時間以后紅色陰影部分面積,表示血壓增高的程度,其值等于血壓曲線  部分在該段時間內的積分,即:
 部分在該段時間內的積分,即:
|  | 
其中  需通過插值的方法求得。
 需通過插值的方法求得。
1.3 統計分析
統計分析使用SPSS 26.0軟件。正態計量數據使用  表示,非正態數據使用Md(IQR)表示;使用Kolmogorov-Smirnov法對數據進行正態性檢驗,采用Levene法進行方差齊性檢驗;滿足正態方差齊的連續數據比較使用兩獨立樣本t檢驗,偏態連續數據使用曼惠特尼-U檢驗,計數數據使用卡方或費舍爾精確概率法(理論頻數小于5的方格超過總數的20%時)檢驗。
 表示,非正態數據使用Md(IQR)表示;使用Kolmogorov-Smirnov法對數據進行正態性檢驗,采用Levene法進行方差齊性檢驗;滿足正態方差齊的連續數據比較使用兩獨立樣本t檢驗,偏態連續數據使用曼惠特尼-U檢驗,計數數據使用卡方或費舍爾精確概率法(理論頻數小于5的方格超過總數的20%時)檢驗。
1.4 建模分析
以非OSAHS組為負樣本組,OSAHS組為正樣本組,使用二分類邏輯回歸模型(logistic regression,LR)作為基準模型,同時選取支持向量機(support vector machine,SVM)、輕型梯度提升機(light gradient boosting machine,lightGBM)、極限梯度提升機(extreme gradient boosting,XGBoost)等機器學習模型進行研究。數據集按照4∶1的比例劃分訓練集和測試集,即:數據的80%作為訓練集(其中再取25%作驗證集,用于訓練時調整模型的超參數);20%作為測試集,用于測試模型對未知數據的泛化能力。模型訓練時采用5折交叉驗證,采用網格化搜索的方式進行超參數調整;模型的評估采用準確率(accuracy)、精確率(precision)、召回率(recall)、F1-score以及受試者操作特征(receiver operating characteristic,ROC)曲線下面積(area under curve,AUC)、精確率-召回率曲線(PR曲線)下面積(area under precision-recall curve,AP)衡量。
2 結果
如表2所示,現有動態血壓報告特征方面,相比非OSAHS組,OSAHS組的日間平均舒張壓、夜間平均收縮壓和夜間最小收縮壓顯著增加,且24小時收縮壓負荷更大,夜間收縮壓下降率更小,提示OSAHS患者的夜間血壓不下降且收縮壓表現更明顯,OSAHS導致的不利影響可能是白天舒張壓增高的重要原因。本文提出的特征方面,OSAHS組的二次血壓上升斜率更大,其收縮壓晨峰較非OSAHS組更晚且時間分布更分散,平均壓下降持續時間更短,提示OSAHS組血壓波動更為劇烈。
 表2
                動態血壓特征組間差異比較
		 	
		 			 				Table2.
    			Comparison of ambulatory blood pressure features between groups
			
						表2
                動態血壓特征組間差異比較
		 	
		 			 				Table2.
    			Comparison of ambulatory blood pressure features between groups
       		
       				構建二分類logistic回歸模型時,在不包含性別、年齡、患合并癥等條件下將特征進行標準化,使用遞歸特征消除(recursive feature elimination,RFE)的方式選擇特征,分類器選用LR模型,參數采用默認設置;接著使用lightGBM模型進行特征重要性排序,以此選擇最佳特征及其重要性得分,如圖3所示。
 圖3
				lightGBM模型計算的特征重要性排序
			
												
				Figure3.
				Rank of feature importance calculated by lightGBM model
						
				圖3
				lightGBM模型計算的特征重要性排序
			
												
				Figure3.
				Rank of feature importance calculated by lightGBM model
			
								將選擇的特征分別輸入LR、SVM、XGBoost以及light GBM模型中進行訓練和測試,模型評估指標如表3和圖4所示。我們的lightGBM模型依靠單純動態血壓數據在訓練集上對OSAHS識別預測準確率可以達到88.2%,精確率為78.5%,召回率為82.7%,F1得分0.805,AUC為0.945;在測試集上預測準確率可以達到80.0%,精確率為82.9%,召回率為72.5%,F1得分0.773,AUC 0.906,高于以往文獻中包含血壓特征的研究,他們的模型AUC分別為0.747[14]和0.804[17]。
 表3
                四種模型分別在訓練集和測試集上的性能
		 	
		 			 				Table3.
    			Performance of the four models on training set and test   set respectively
			
						表3
                四種模型分別在訓練集和測試集上的性能
		 	
		 			 				Table3.
    			Performance of the four models on training set and test   set respectively
       		
       				 圖4
				四個模型分別在訓練集和測試集上的ROC、PR曲線
			
												
				Figure4.
				ROC and PR curves of the four models on the training set and test set respectively
						
				圖4
				四個模型分別在訓練集和測試集上的ROC、PR曲線
			
												
				Figure4.
				ROC and PR curves of the four models on the training set and test set respectively
			
								3 討論和結論
本研究的結果表明,24小時動態血壓診斷報告中現有的特征如夜間收縮壓[18-19]、夜間舒張壓[20-21]、血壓節律[18,22]、血壓負荷[19,23-24]與以往研究結果一致,而我們提出的夜間血壓上升斜率、夜間血壓波動[25]次數以及晨峰[26]血壓啟動時刻等特征同樣具有統計學意義,夜間收縮壓和24小時舒張壓在OSAHS患者血壓變化中更為突出,我們新定義的斜率、面積、持續時間等特征在表征OSAHS患者時也取得顯著效果。動態血壓數據因其不等間隔和稀疏的原因,除用于高血壓分型的鑒別診斷外,較少用于其他疾病的篩查。盡管如此,本研究依舊認為OSAHS的呼吸暫停導致的血壓變化在臨床上是非常有用的,特別是OSAHS合并高血壓患者,血壓對睡眠呼吸暫停發作的表征有其獨特意義。雖然以前的研究也取得一些好的結果,STOP-Bang問卷引入AMBP變量后可較好地識別中-重度OSAHS患者[27],但該方法對輕度OSAHS的識別較為困難;苗曉東等[28]使用ABPM常規特征篩查了OSAHS,但模型整體性能還有提升空間;Torres等[14]使用ABPM監測的4個變量獲得的模型AUC為0.736,他們的特征僅為報告特征,缺乏針對性。一些作者認為ABPM檢查預測OSAHS時敏感性較低,準確性中等[29],事實上研究的結果還顯示出了較低的特異性[28]。針對上述研究存在的不足,我們研究的思路是針對疾病特點設計和制定特征規則,從而使特征能夠更加準確地反映OSAHS患者血壓變化特點。本研究提取了基于規則的5類20個特征用于建模,所訓練的lightGBM模型在測試集上的識別準確率為80.0%,精確率為82.9%,召回率為72.5%,AUC為0.906,所定義的動態血壓特征和訓練的分類器能夠用于OSAHS的有效檢測。
血壓數據的稀疏性也是它不同于連續生理信號的地方,進而導致了本研究具有一定的局限性。一是不同個體血壓測量的間隔、起始點以及入睡覺醒時間不同都會影響本研究給出的結果,因此,在現實臨床場景中應用時應該要求被檢測的患者記錄入睡、覺醒時間,以便本文算法更準確地評估。二是不同的數據采樣間隔導致我們定義的一些時間參數,如晨峰啟動時刻、晨峰上升時間等會發生誤差,進而由此計算的斜率等參數也會存在一定的誤差。因此,應用本文的算法和模型時應盡可能確保血壓采集的間隔更短,推薦合理的血壓采樣間隔使用20~30 min。三是袖帶機械性充放氣對受試者睡眠質量的影響可能會對模型造成干擾。于佳嵐等[30]認為動態血壓檢查過程可影響老年高血壓患者夜間睡眠質量從而造成患者血壓參數的變化,這可能會導致模型的假陽性率升高;也有研究認為動態血壓監測對患者睡眠質量無明顯影響[31],這時的模型基本上是準確的。
本研究根據OSAHS患者血壓變化特點,定義了針對OSAHS的動態血壓特征提取規則,開發了相應的特征提取算法,使用這些特征訓練了用于OSAHS篩查的機器學習模型,建立了單純運用動態血壓特征的OSAHS早期篩查模型,我們建立的lightGBM模型在訓練集和測試集上分別取得了0.945和0.906的AUC值,測試集上的識別準確率為80.0%。本研究為OSAHS篩查提供了一種新的思路和方法,為OSAHS患者夜間血壓變化提供了量化評估手段,有望在OSAHS篩查中發揮重要作用。未來的研究應著重在動態血壓睡眠監測中建立較為統一的范式,對使用動態血壓監測篩查OSAHS的醫療行為制定科學規范,控制患者個體間差異使其最小化,進一步提高動態血壓篩查的精準度,有利于在臨床診療中的推廣應用。此外,盡管本研究取得了較好的結果,但模型的性能還需進行嚴格的外部驗證,一些新的特征挖掘和模型開發研究仍然很有必要,我們的研究將進一步聚焦臨床問題展開工作。本研究提出的基于24小時動態血壓識別OSAHS的方法具有新穎性,可作為在PSG確診前的初篩手段,提高OSAHS患者的早期診斷率,為疾病的早期干預提供有力支撐。
重要聲明
利益沖突聲明:本文全體作者均聲明不存在利益沖突。
作者貢獻聲明:張健負責本研究算法設計和開發工作,處理分析數據以及撰寫文章;任皎潔博士負責研究設計和數據收集整理、結果解讀解釋相關工作;兩位作者對本文具有同等貢獻。孫書臣指導了研究設計、特征提取規則擬定和結果臨床解釋工作。張政波指導了算法設計開發、數據處理和建模分析工作。
倫理聲明:本研究經解放軍總醫院倫理審查委員會批準(批準編號為:S2018-095-01)。
 
        

 
                 
				 
                                                                    
                                                                        
                                                                        
                                                                         
																   	
                                                                    
                                                                    
																	 
																   	
                                                                    
                                                                    
																	 
																   	
                                                                    
                                                                    
																	