引用本文: 杜秋鳳, 蔣運蘭, 李滔, 易曉冬, 宋爽, 康靜. 慢性阻塞性肺疾病患者出院后30天內再入院風險預測模型的系統評價. 中國循證醫學雜志, 2024, 24(1): 49-55. doi: 10.7507/1672-2531.202306041 復制
版權信息: ?四川大學華西醫院華西期刊社《中國循證醫學雜志》版權所有,未經授權不得轉載、改編
慢性阻塞性肺疾病(chronic obstructive pulmonary disease,COPD)是以呼吸道不可逆性氣流受限為主要特征的慢性氣道疾病,是僅次于腦卒中和心血管疾病的全球第三大死亡原因,已經成為全球重要的公共衛生問題之一[1-3]。研究顯示,2020年我國60歲以上人群COPD患病率高達30%,隨著老齡化程度不斷加深,COPD防治形勢更為嚴峻[4,5]。慢性阻塞性肺疾病病因復雜,病程長,病情容易反復發作,大多數COPD患者存在出院后30天內再入院的風險[6]。30天內再入院是指非計劃的、突然發生的,患者在出院后30天內因相同或相關疾病再次入院[7]。研究顯示,COPD患者出院后30天內再入院率約為2.6%~82.2%,再入院不僅會加重患者的呼吸困難,引起肺功能進行性惡化,導致疾病快速進展,危及患者生命,還會增加患者的醫療費用,造成醫療資源的浪費[5,8,9]。慢性阻塞性肺疾病具有高齡化、高入院率、高醫療成本等特點,降低COPD患者再入院率成為醫護人員的挑戰之一,早期識別再入院高風險患者具有重要的臨床意義[3,5]。目前國內外已有關于COPD患者30天內再入院風險預測模型研究,但研究結果尚存在一定的差異。因此,本研究旨在系統評價COPD患者出院后30天內再入院風險預測模型,為臨床選擇合適的評估工具提供借鑒。
1 資料與方法
1.1 納入與排除標準
納入標準:① 研究對象年齡≥18歲,確診為COPD患者;② 研究內容為COPD患者出院后30天內再入院風險預測模型構建或驗證研究,對重復發表文獻僅納入最新最全的數據。排除標準:① 僅研究相關危險因素的研究,未構建模型;② 基于系統評價或Meta分析結果建立模型的研究;③ 模型包含的預測變量<2個;④ 無法獲取全文。
1.2 文獻檢索策略
計算機檢索CNKI、WanFang Data、VIP、CBM、PubMed、Embase、Web of Science、Cochrane Library數據庫中有關COPD患者出院后30天內再入院風險預測模型的文獻,采用主題詞和自由詞相結合的檢索方式,檢索時限均為建庫至2023年4月25日。中文檢索詞包括:慢性阻塞性肺疾病、慢阻肺、慢性阻塞性肺病、COPD、AECOPD、再入院、非計劃再入院、病人再入院、風險評估、風險篩查、預測、預測模型、預測因素、模型等;英文檢索詞包括:COPD、COAD、chronic obstructive pulmonary disease、chronic obstructive airway disease、chronic obstructive lung disease、readmission、rehospitalization、risk assessment、risk、predict*、prognos*、risk stratification、model*、tool*、score*等。以PubMed為例,具體檢索策略見附件框1。
1.3 文獻篩選與資料提取
將檢索獲得的文獻導入EndNote 20,由2名研究者根據納入、排除標準獨立篩選,出現分歧通過討論達成一致或由第3名研究者解決。
根據預測模型研究系統評價的關鍵評估和數據提取清單(critical appraisal and data extraction for systematic reviews of prediction modelling studies,CHARMS)[10]進行資料提取,提取內容包括:納入文獻、發表年份、國家、研究設計、研究對象、研究地點、候選變量、樣本量、缺失數據、模型建立方法、變量選擇、模型性能、驗證方法、最終包含的預測因子、適用人群及局限性。
1.4 納入文獻的偏倚風險和適用性評價
由2名研究者使用預測模型研究的偏倚風險評估工具(prediction model risk of bias assessment tool,PROBAST)[11,12]對納入文獻偏倚風險和適用性進行評估。
1.4.1 偏倚風險評估
偏倚風險評估包括研究對象、預測因子、結局、分析4個領域,共有20個信號問題,每個問題有“是”“可能是”“否”“可能否”或“不清楚”5種回答。若一個領域中所有回答均為“是”或“可能是”,則該領域為低偏倚風險;若有一個回答為“否”或“可能否”,則認為存在高偏倚風險;若有任意一個回答為“不清楚”,則認為該領域偏倚風險不清楚。所有領域均為低偏倚風險時,研究總體為低偏倚風險;有一個領域為高偏倚風險,則總體為高偏倚風險;若某一個領域偏倚風險不清楚而其他領域為低偏倚風險,則認為該研究總體偏倚風險不清楚。
1.4.2 適用性評估
適用性評估包括研究對象、預測因子、結局3個領域,各領域按“適用性高”“適用性低”“適用性不清楚”進行評價。若所有領域適用性高,則認為該研究總體適用性高;若有一個領域適用性低,則總體適用性低;若有任意一個領域適用性不清楚而其他領域適用性高則認為該研究總體適用性不清楚。
2 結果
2.1 文獻篩選流程和結果
初步檢索獲得相關文獻7 226篇,去重后獲得文獻5 095篇,逐步篩選最終納入8篇[13-20]文獻。文獻篩選流程及結果見附件圖1。
2.2 納入文獻的基本特征
納入文獻中,中國4篇[13,14,17,19],美國2篇[16,18],日本1篇[15],西班牙1篇[20];近5年發表的文獻有6篇[13-17,19]。8項研究中有6項[14-18,20]為隊列研究,1項[13]為病例-對照研究,1項[19]為橫斷面研究。本次共納入14個預測模型,其中3項研究[15,18,19]建立了2個及以上模型。納入文獻的基本特征見表1。

2.3 風險預測模型的建立情況
研究的候選預測變量數為11~47個,有2項研究[14,17]進行了變量處理。樣本總量為125~8 263例,結局事件數為24~741例。在缺失數據方面,有2項研究[13,19]報告了缺失例數,但均采用直接剔除的處理方法,其余研究未報告缺失數據情況。模型建立方法方面,5項研究[13-15,18,20]采用Logistic回歸方法,1項[16]使用因果貝葉斯網絡,1項[17]采用決策樹方法,還有1項[19]采用支持向量機建立模型。在變量選擇上,有7項研究[13,14,16-20]基于單因素分析篩選變量。模型建立情況見表2。

2.4 模型性能及預測因子
納入的8項研究中包含14個模型,14個模型的受試者工作特征曲線下面積(area under the curve,AUC)為0.58~0.918,其中10個模型AUC>0.7,預測性能較好。有4個模型同時報告了區分度和校準度,3個模型報告校準曲線,1個模型進行了擬合優度檢驗,且報告了P值,結果顯示一致性良好。在模型驗證方面,1項研究[14]進行了外部驗證,1項研究[19]采用隨機拆分驗證,2項研究[16,18]采用交叉驗證,1項研究[15]采用自舉法。最終模型包含的預測因子有4~11個,出現次數最多的前5個預測因子為吸煙、合并癥、年齡、文化程度、家庭氧療。不同模型的性能及預測因子見表3。

2.5 偏倚風險和適用性評價
采用預測模型研究的偏倚評估工具PROBAST[11,12]對納入文獻的偏倚風險和適用性進行評價,結果見表4。

2.5.1 研究對象領域的偏倚
2項研究[13,19]存在高偏倚風險,原因是回顧性研究可能存在回憶偏倚,僅通過查閱病歷無法獲得一些與COPD患者出院后30天內再入院相關的重要預測因素。
2.5.2 預測因子領域的偏倚
1項研究[20]在預測因子領域被評為低偏倚風險,7項研究[13-19]偏倚風險不清楚。Crisafulli等[20]的前瞻性研究中預測因素的測量在結局發生之前,默認采用了盲法,而其余研究[13-19]無法得知預測因子的評估是否在不了解結果數據的情況下進行,因此問題“預測因素的測量是否與結局無關”回答為“不清楚”。
2.5.3 結局領域的偏倚
5項研究[14-18]在結局領域存在高偏倚風險,3項研究[13,19,20]偏倚風險不清楚。5項研究[14-18]為回顧性研究在問題“所有研究對象的預測結局定義和測量是否一致或類似”的回答為“可能否”。3項研究[13,19,20]未明確指出結局的評估者是否不清楚預測因子的數據,在問題“結局的確定是否與預測因素無關”上的回答為“不清楚”。
2.5.4 分析領域的偏倚
8項研究在分析領域均存在高偏倚風險。問題主要包括:① 8項研究[13-20]結局事件數均不足。② 4項研究[14,16,17,19]在變量處理方法上將連續性變量轉化成分類變量,變量處理方法不妥。③ 2項研究[13,19]未將所有研究對象納入統計分析,而將缺失數據的研究對象直接進行剔除處理,6項研究[14-18,20]未提供缺失數據的信息。④ 7項研究[13,14,16-20]基于單因素分析篩選預測因子,未使用恰當的變量選擇方法。⑤ 僅有3項研究[14,15,20]同時報告了區分度和校準度,3項研究[13,17,20]未對模型進行內部或外部驗證。⑥ 8項研究[13-20]均未提及模型過度擬合或擬合不足的問題。
2.5.5 適用性評價
5項研究[15-18,20]呈現較好的總體適用性,3項研究[13,14,19]總體適用性較差。1項研究[19]納入對象局限于年齡≥80歲患者,1項研究[13]對象限定為衰弱的COPD患者,另1項研究[14]對象為戒煙患者,研究對象的適用性不佳。Goto等[15]的研究未考慮患者的一些臨床信息,Sharif等[18]未納入社會經濟等相關因子,Zhang等[19]未納入非常規檢查項目,故以上3項研究納入的預測因子不全面。
3 討論
3.1 本研究納入的預測模型具有較好的預測性能,但總體偏倚風險較高
本研究納入的14個預測模型AUC為0.59~0.918,其中10個模型AUC>0.7,具有較好的預測性能。但總體偏倚風險較高,主要集中于分析領域。原因主要是結局事件數不足、變量處理不當、基于單變量分析篩選預測因子、未報告缺失數據信息、模型性能評估不全及未報告模型擬合情況等。PROBAST評價工具[11]指出為減小模型開發研究出現過度擬合,結果事件數應達到候選預測因子數的20倍,即每個變量對應的事件發生例數(events per variable,EPV)>20例,由于慢阻肺患者30天內非計劃再入院風險預測模型存在較多候選預測因子,因此難以滿足EPV>20例,建議未來的模型研究應納入充足的樣本量。7項研究[13,14,16-20]在單因素分析的基礎上,將有統計學意義的變量納入模型進行分析,這種篩選預測因子的方法可以減少工作量,但可能會遺漏其中重要的危險因素,在變量選擇上,應同時結合專業知識和臨床經驗,謹慎納入和刪除變量[21]。另外有6項研究[14-18,20]未報告缺失數據,2項研究[13,19]將有缺失數據的研究對象直接排除,存在缺失數據處理不當的問題,這種處理方法可能會丟失剔除對象中隱藏的有用信息,結果可能會導致模型出現偏倚,未來研究應選擇恰當的缺失數據處理方法。5項研究[13,16-19]未報告模型的校準度,3項研究[13,17,20]未進行內部或外部驗證。建議未來預測模型研究參照PROBAST和多變量預測模型透明報告(transparent reporting of a multivariable prediction model for individual prognosis or diagnosis,TRIPOD)[22]進行模型設計與報告,以控制模型偏倚風險和規范報告。本研究中有5項[14-18]為回顧性隊列研究,模型中納入的預測因子可能不全面,同時可能存在數據缺失的風險,結果可能存在偏倚。而前瞻性研究中預測因子的測量發生在結局之前,能有效統一預測因子的評估方法,一定程度上模型結果更為可靠。未來應開展更多前瞻性研究,以更好地預測慢阻肺患者發生再入院的危險因素。
3.2 預測因子的選擇存在差異和共性
本研究納入的14個模型重潛在預測因子介于11~47個,最終模型包含的預測因子介于4~11個。由于研究類型和納入變量的差異,各研究所納入的預測因子不盡相同,但存在一定的共性。其中最常見的前5個預測因子為吸煙、合并癥、年齡、文化程度、家庭氧療。COPD患者吸煙與其癥狀持續、病情加重以及肺功能惡化等密切相關,煙草燃燒產生的化學物質會對人體產生化學刺激,誘導氣道巨噬細胞釋放細胞因子和蛋白酶,加重肺部炎癥反應,導致肺功能惡化[23-25]。研究發現,戒煙可以有效緩解COPD吸煙患者的臨床癥狀,降低下呼吸道感染發生風險,改善患者生活質量,降低再入院風險[26]。年齡較大的COPD患者體弱多病,機體免疫力降低,容易因細菌或病毒感染再次入院[5]。與Alqahtani等[27]研究結果一致,各種合并癥是COPD患者30天內再入院的重要危險因素,如心力衰竭、腎衰竭、抑郁等,合并癥增加與整體治療復雜性增加有關。COPD作為一種慢性疾病,病程持續時間長,患者在長期病程中常合并其他疾病,疾病之間相互影響,治療難度增加,再入院風險也隨之增加[28]。Spece等[29]發現合并癥指數每增加一個點,再入院風險就會增加24%。有研究表明,文化程度越低,患者對COPD健康知識的理解能力越差,依從性也會降低,再入院風險更高[30]。長期家庭氧療是COPD患者出院后常用的治療方法,能夠提高伴有低氧血癥的COPD患者的生存率,有利于患者的肺康復,但在沒有控制的情況下,不適當或自由吸氧可能會導致COPD患者發生高碳酸血癥[31,32]。此外,家庭氧療成本較高,一定程度上會降低患者的依從性[33]。家庭氧療時間過長會限制患者活動,缺乏身體活動是COPD患者糖尿病、心血管疾病等合并癥的危險因素,還會導致患者運動能力下降,增加呼吸困難的次數和嚴重程度[34-36]。臨床工作中應重視對這些共性因素的評估,高效識別風險人群。Njoku等[37]研究表明,生活在貧困地區的人們獲得醫療保健的機會較差,支付藥物費用的能力較低。社會因素對COPD患者再入院的潛在影響很大程度上被忽視,婚姻狀況單一的患者可能獨自生活,不能得到配偶支持來幫助其控制疾病,患者更容易因病情加重入院[38]。因此,社會因素、經濟因素也是COPD患者再入院的重要預測因子,但其在現存的預測模型中應用較少,未來應系統、全面納入相關危險因素,以期準確有效識別COPD再入院高危患者。
3.3 COPD患者出院后30天內再入院風險預測模型尚處于發展階段
本研究發現,COPD患者出院后30天內再入院風險預測模型研究開展較晚,目前仍處于發展階段。雖然國外開展了多項大樣本的研究,但由于建模人群種族和文化的差異,其是否適用于我國人群還有待探究。并且本研究納入的預測模型大多未進行外部驗證,未能切實服務于臨床醫護人員識別COPD再入院高危患者。隨著人工智能在醫學領域的發展,神經網絡、向量機等也被用于預測模型的構建,相比傳統Logistic回歸,其預測性能更佳[39],但本研究納入模型的建模方法以Logistic回歸為主,機器學習算法在COPD患者再入院風險預測中的應用仍不足。建議未來進一步開展多中心、大樣本、高質量的前瞻性隊列研究,基于人工智能和深度學習技術,結合我國國情構建出適合我國COPD患者的本土化、實用性強的預測模型,并對已開發的模型進行驗證和優化。
3.4 本研究對臨床的啟示
研究顯示,我國40歲以上COPD患病率為13.6%,25.6%的老年COPD患者出院后出現急性加重再入院,再入院發生率較高,嚴重危害患者身體健康,增加患者的醫療負擔,造成醫療資源的浪費[2,5]。COPD患者再入院的發生是可預防的,準確的風險預測工具是降低患者再入院率的關鍵,早期識別高危患者具有重要意義。本研究系統評價現存的COPD患者再入院風險預測模型,有助于醫護人員綜合考慮模型的預測性能、模型的適用對象、預測因子的可獲得性等差異,選擇適當的預測模型供臨床使用,幫助其盡早識別再入院高風險患者,及時采取有效的預防和治療措施,降低患者的死亡風險和治療負擔。
3.5 局限性分析
本系統評價存在一定的局限性:① 研究只納入了中、英文文獻,可能存在發表偏倚;② 由于納入文獻研究設計、數據來源、建模方法等方面的異質性,未對納入文獻進行整合和定量分析;③ 受不同國家文化和人群的影響,研究尚不可直接用于臨床;④ 大部分模型缺少外部驗證,模型的推廣性較差。
綜上所述,本研究共納入8項研究,包含14個COPD患者出院后30天內再入院的風險預測模型,對模型基本特征進行了系統評價。結果顯示,現有的風險預測模型預測性能較好,但總體偏倚風險較高,模型質量有待提高。建議未來研究者嚴格遵循PROBAST和TRIPOD,保證模型構建的科學性和嚴謹性,并開展多中心、大樣本的研究,結合深度學習算法,開發性能良好和適用性高的預測模型,為臨床提供高質量的臨床決策依據。
聲明 本研究無利益沖突。
慢性阻塞性肺疾病(chronic obstructive pulmonary disease,COPD)是以呼吸道不可逆性氣流受限為主要特征的慢性氣道疾病,是僅次于腦卒中和心血管疾病的全球第三大死亡原因,已經成為全球重要的公共衛生問題之一[1-3]。研究顯示,2020年我國60歲以上人群COPD患病率高達30%,隨著老齡化程度不斷加深,COPD防治形勢更為嚴峻[4,5]。慢性阻塞性肺疾病病因復雜,病程長,病情容易反復發作,大多數COPD患者存在出院后30天內再入院的風險[6]。30天內再入院是指非計劃的、突然發生的,患者在出院后30天內因相同或相關疾病再次入院[7]。研究顯示,COPD患者出院后30天內再入院率約為2.6%~82.2%,再入院不僅會加重患者的呼吸困難,引起肺功能進行性惡化,導致疾病快速進展,危及患者生命,還會增加患者的醫療費用,造成醫療資源的浪費[5,8,9]。慢性阻塞性肺疾病具有高齡化、高入院率、高醫療成本等特點,降低COPD患者再入院率成為醫護人員的挑戰之一,早期識別再入院高風險患者具有重要的臨床意義[3,5]。目前國內外已有關于COPD患者30天內再入院風險預測模型研究,但研究結果尚存在一定的差異。因此,本研究旨在系統評價COPD患者出院后30天內再入院風險預測模型,為臨床選擇合適的評估工具提供借鑒。
1 資料與方法
1.1 納入與排除標準
納入標準:① 研究對象年齡≥18歲,確診為COPD患者;② 研究內容為COPD患者出院后30天內再入院風險預測模型構建或驗證研究,對重復發表文獻僅納入最新最全的數據。排除標準:① 僅研究相關危險因素的研究,未構建模型;② 基于系統評價或Meta分析結果建立模型的研究;③ 模型包含的預測變量<2個;④ 無法獲取全文。
1.2 文獻檢索策略
計算機檢索CNKI、WanFang Data、VIP、CBM、PubMed、Embase、Web of Science、Cochrane Library數據庫中有關COPD患者出院后30天內再入院風險預測模型的文獻,采用主題詞和自由詞相結合的檢索方式,檢索時限均為建庫至2023年4月25日。中文檢索詞包括:慢性阻塞性肺疾病、慢阻肺、慢性阻塞性肺病、COPD、AECOPD、再入院、非計劃再入院、病人再入院、風險評估、風險篩查、預測、預測模型、預測因素、模型等;英文檢索詞包括:COPD、COAD、chronic obstructive pulmonary disease、chronic obstructive airway disease、chronic obstructive lung disease、readmission、rehospitalization、risk assessment、risk、predict*、prognos*、risk stratification、model*、tool*、score*等。以PubMed為例,具體檢索策略見附件框1。
1.3 文獻篩選與資料提取
將檢索獲得的文獻導入EndNote 20,由2名研究者根據納入、排除標準獨立篩選,出現分歧通過討論達成一致或由第3名研究者解決。
根據預測模型研究系統評價的關鍵評估和數據提取清單(critical appraisal and data extraction for systematic reviews of prediction modelling studies,CHARMS)[10]進行資料提取,提取內容包括:納入文獻、發表年份、國家、研究設計、研究對象、研究地點、候選變量、樣本量、缺失數據、模型建立方法、變量選擇、模型性能、驗證方法、最終包含的預測因子、適用人群及局限性。
1.4 納入文獻的偏倚風險和適用性評價
由2名研究者使用預測模型研究的偏倚風險評估工具(prediction model risk of bias assessment tool,PROBAST)[11,12]對納入文獻偏倚風險和適用性進行評估。
1.4.1 偏倚風險評估
偏倚風險評估包括研究對象、預測因子、結局、分析4個領域,共有20個信號問題,每個問題有“是”“可能是”“否”“可能否”或“不清楚”5種回答。若一個領域中所有回答均為“是”或“可能是”,則該領域為低偏倚風險;若有一個回答為“否”或“可能否”,則認為存在高偏倚風險;若有任意一個回答為“不清楚”,則認為該領域偏倚風險不清楚。所有領域均為低偏倚風險時,研究總體為低偏倚風險;有一個領域為高偏倚風險,則總體為高偏倚風險;若某一個領域偏倚風險不清楚而其他領域為低偏倚風險,則認為該研究總體偏倚風險不清楚。
1.4.2 適用性評估
適用性評估包括研究對象、預測因子、結局3個領域,各領域按“適用性高”“適用性低”“適用性不清楚”進行評價。若所有領域適用性高,則認為該研究總體適用性高;若有一個領域適用性低,則總體適用性低;若有任意一個領域適用性不清楚而其他領域適用性高則認為該研究總體適用性不清楚。
2 結果
2.1 文獻篩選流程和結果
初步檢索獲得相關文獻7 226篇,去重后獲得文獻5 095篇,逐步篩選最終納入8篇[13-20]文獻。文獻篩選流程及結果見附件圖1。
2.2 納入文獻的基本特征
納入文獻中,中國4篇[13,14,17,19],美國2篇[16,18],日本1篇[15],西班牙1篇[20];近5年發表的文獻有6篇[13-17,19]。8項研究中有6項[14-18,20]為隊列研究,1項[13]為病例-對照研究,1項[19]為橫斷面研究。本次共納入14個預測模型,其中3項研究[15,18,19]建立了2個及以上模型。納入文獻的基本特征見表1。

2.3 風險預測模型的建立情況
研究的候選預測變量數為11~47個,有2項研究[14,17]進行了變量處理。樣本總量為125~8 263例,結局事件數為24~741例。在缺失數據方面,有2項研究[13,19]報告了缺失例數,但均采用直接剔除的處理方法,其余研究未報告缺失數據情況。模型建立方法方面,5項研究[13-15,18,20]采用Logistic回歸方法,1項[16]使用因果貝葉斯網絡,1項[17]采用決策樹方法,還有1項[19]采用支持向量機建立模型。在變量選擇上,有7項研究[13,14,16-20]基于單因素分析篩選變量。模型建立情況見表2。

2.4 模型性能及預測因子
納入的8項研究中包含14個模型,14個模型的受試者工作特征曲線下面積(area under the curve,AUC)為0.58~0.918,其中10個模型AUC>0.7,預測性能較好。有4個模型同時報告了區分度和校準度,3個模型報告校準曲線,1個模型進行了擬合優度檢驗,且報告了P值,結果顯示一致性良好。在模型驗證方面,1項研究[14]進行了外部驗證,1項研究[19]采用隨機拆分驗證,2項研究[16,18]采用交叉驗證,1項研究[15]采用自舉法。最終模型包含的預測因子有4~11個,出現次數最多的前5個預測因子為吸煙、合并癥、年齡、文化程度、家庭氧療。不同模型的性能及預測因子見表3。

2.5 偏倚風險和適用性評價
采用預測模型研究的偏倚評估工具PROBAST[11,12]對納入文獻的偏倚風險和適用性進行評價,結果見表4。

2.5.1 研究對象領域的偏倚
2項研究[13,19]存在高偏倚風險,原因是回顧性研究可能存在回憶偏倚,僅通過查閱病歷無法獲得一些與COPD患者出院后30天內再入院相關的重要預測因素。
2.5.2 預測因子領域的偏倚
1項研究[20]在預測因子領域被評為低偏倚風險,7項研究[13-19]偏倚風險不清楚。Crisafulli等[20]的前瞻性研究中預測因素的測量在結局發生之前,默認采用了盲法,而其余研究[13-19]無法得知預測因子的評估是否在不了解結果數據的情況下進行,因此問題“預測因素的測量是否與結局無關”回答為“不清楚”。
2.5.3 結局領域的偏倚
5項研究[14-18]在結局領域存在高偏倚風險,3項研究[13,19,20]偏倚風險不清楚。5項研究[14-18]為回顧性研究在問題“所有研究對象的預測結局定義和測量是否一致或類似”的回答為“可能否”。3項研究[13,19,20]未明確指出結局的評估者是否不清楚預測因子的數據,在問題“結局的確定是否與預測因素無關”上的回答為“不清楚”。
2.5.4 分析領域的偏倚
8項研究在分析領域均存在高偏倚風險。問題主要包括:① 8項研究[13-20]結局事件數均不足。② 4項研究[14,16,17,19]在變量處理方法上將連續性變量轉化成分類變量,變量處理方法不妥。③ 2項研究[13,19]未將所有研究對象納入統計分析,而將缺失數據的研究對象直接進行剔除處理,6項研究[14-18,20]未提供缺失數據的信息。④ 7項研究[13,14,16-20]基于單因素分析篩選預測因子,未使用恰當的變量選擇方法。⑤ 僅有3項研究[14,15,20]同時報告了區分度和校準度,3項研究[13,17,20]未對模型進行內部或外部驗證。⑥ 8項研究[13-20]均未提及模型過度擬合或擬合不足的問題。
2.5.5 適用性評價
5項研究[15-18,20]呈現較好的總體適用性,3項研究[13,14,19]總體適用性較差。1項研究[19]納入對象局限于年齡≥80歲患者,1項研究[13]對象限定為衰弱的COPD患者,另1項研究[14]對象為戒煙患者,研究對象的適用性不佳。Goto等[15]的研究未考慮患者的一些臨床信息,Sharif等[18]未納入社會經濟等相關因子,Zhang等[19]未納入非常規檢查項目,故以上3項研究納入的預測因子不全面。
3 討論
3.1 本研究納入的預測模型具有較好的預測性能,但總體偏倚風險較高
本研究納入的14個預測模型AUC為0.59~0.918,其中10個模型AUC>0.7,具有較好的預測性能。但總體偏倚風險較高,主要集中于分析領域。原因主要是結局事件數不足、變量處理不當、基于單變量分析篩選預測因子、未報告缺失數據信息、模型性能評估不全及未報告模型擬合情況等。PROBAST評價工具[11]指出為減小模型開發研究出現過度擬合,結果事件數應達到候選預測因子數的20倍,即每個變量對應的事件發生例數(events per variable,EPV)>20例,由于慢阻肺患者30天內非計劃再入院風險預測模型存在較多候選預測因子,因此難以滿足EPV>20例,建議未來的模型研究應納入充足的樣本量。7項研究[13,14,16-20]在單因素分析的基礎上,將有統計學意義的變量納入模型進行分析,這種篩選預測因子的方法可以減少工作量,但可能會遺漏其中重要的危險因素,在變量選擇上,應同時結合專業知識和臨床經驗,謹慎納入和刪除變量[21]。另外有6項研究[14-18,20]未報告缺失數據,2項研究[13,19]將有缺失數據的研究對象直接排除,存在缺失數據處理不當的問題,這種處理方法可能會丟失剔除對象中隱藏的有用信息,結果可能會導致模型出現偏倚,未來研究應選擇恰當的缺失數據處理方法。5項研究[13,16-19]未報告模型的校準度,3項研究[13,17,20]未進行內部或外部驗證。建議未來預測模型研究參照PROBAST和多變量預測模型透明報告(transparent reporting of a multivariable prediction model for individual prognosis or diagnosis,TRIPOD)[22]進行模型設計與報告,以控制模型偏倚風險和規范報告。本研究中有5項[14-18]為回顧性隊列研究,模型中納入的預測因子可能不全面,同時可能存在數據缺失的風險,結果可能存在偏倚。而前瞻性研究中預測因子的測量發生在結局之前,能有效統一預測因子的評估方法,一定程度上模型結果更為可靠。未來應開展更多前瞻性研究,以更好地預測慢阻肺患者發生再入院的危險因素。
3.2 預測因子的選擇存在差異和共性
本研究納入的14個模型重潛在預測因子介于11~47個,最終模型包含的預測因子介于4~11個。由于研究類型和納入變量的差異,各研究所納入的預測因子不盡相同,但存在一定的共性。其中最常見的前5個預測因子為吸煙、合并癥、年齡、文化程度、家庭氧療。COPD患者吸煙與其癥狀持續、病情加重以及肺功能惡化等密切相關,煙草燃燒產生的化學物質會對人體產生化學刺激,誘導氣道巨噬細胞釋放細胞因子和蛋白酶,加重肺部炎癥反應,導致肺功能惡化[23-25]。研究發現,戒煙可以有效緩解COPD吸煙患者的臨床癥狀,降低下呼吸道感染發生風險,改善患者生活質量,降低再入院風險[26]。年齡較大的COPD患者體弱多病,機體免疫力降低,容易因細菌或病毒感染再次入院[5]。與Alqahtani等[27]研究結果一致,各種合并癥是COPD患者30天內再入院的重要危險因素,如心力衰竭、腎衰竭、抑郁等,合并癥增加與整體治療復雜性增加有關。COPD作為一種慢性疾病,病程持續時間長,患者在長期病程中常合并其他疾病,疾病之間相互影響,治療難度增加,再入院風險也隨之增加[28]。Spece等[29]發現合并癥指數每增加一個點,再入院風險就會增加24%。有研究表明,文化程度越低,患者對COPD健康知識的理解能力越差,依從性也會降低,再入院風險更高[30]。長期家庭氧療是COPD患者出院后常用的治療方法,能夠提高伴有低氧血癥的COPD患者的生存率,有利于患者的肺康復,但在沒有控制的情況下,不適當或自由吸氧可能會導致COPD患者發生高碳酸血癥[31,32]。此外,家庭氧療成本較高,一定程度上會降低患者的依從性[33]。家庭氧療時間過長會限制患者活動,缺乏身體活動是COPD患者糖尿病、心血管疾病等合并癥的危險因素,還會導致患者運動能力下降,增加呼吸困難的次數和嚴重程度[34-36]。臨床工作中應重視對這些共性因素的評估,高效識別風險人群。Njoku等[37]研究表明,生活在貧困地區的人們獲得醫療保健的機會較差,支付藥物費用的能力較低。社會因素對COPD患者再入院的潛在影響很大程度上被忽視,婚姻狀況單一的患者可能獨自生活,不能得到配偶支持來幫助其控制疾病,患者更容易因病情加重入院[38]。因此,社會因素、經濟因素也是COPD患者再入院的重要預測因子,但其在現存的預測模型中應用較少,未來應系統、全面納入相關危險因素,以期準確有效識別COPD再入院高危患者。
3.3 COPD患者出院后30天內再入院風險預測模型尚處于發展階段
本研究發現,COPD患者出院后30天內再入院風險預測模型研究開展較晚,目前仍處于發展階段。雖然國外開展了多項大樣本的研究,但由于建模人群種族和文化的差異,其是否適用于我國人群還有待探究。并且本研究納入的預測模型大多未進行外部驗證,未能切實服務于臨床醫護人員識別COPD再入院高危患者。隨著人工智能在醫學領域的發展,神經網絡、向量機等也被用于預測模型的構建,相比傳統Logistic回歸,其預測性能更佳[39],但本研究納入模型的建模方法以Logistic回歸為主,機器學習算法在COPD患者再入院風險預測中的應用仍不足。建議未來進一步開展多中心、大樣本、高質量的前瞻性隊列研究,基于人工智能和深度學習技術,結合我國國情構建出適合我國COPD患者的本土化、實用性強的預測模型,并對已開發的模型進行驗證和優化。
3.4 本研究對臨床的啟示
研究顯示,我國40歲以上COPD患病率為13.6%,25.6%的老年COPD患者出院后出現急性加重再入院,再入院發生率較高,嚴重危害患者身體健康,增加患者的醫療負擔,造成醫療資源的浪費[2,5]。COPD患者再入院的發生是可預防的,準確的風險預測工具是降低患者再入院率的關鍵,早期識別高危患者具有重要意義。本研究系統評價現存的COPD患者再入院風險預測模型,有助于醫護人員綜合考慮模型的預測性能、模型的適用對象、預測因子的可獲得性等差異,選擇適當的預測模型供臨床使用,幫助其盡早識別再入院高風險患者,及時采取有效的預防和治療措施,降低患者的死亡風險和治療負擔。
3.5 局限性分析
本系統評價存在一定的局限性:① 研究只納入了中、英文文獻,可能存在發表偏倚;② 由于納入文獻研究設計、數據來源、建模方法等方面的異質性,未對納入文獻進行整合和定量分析;③ 受不同國家文化和人群的影響,研究尚不可直接用于臨床;④ 大部分模型缺少外部驗證,模型的推廣性較差。
綜上所述,本研究共納入8項研究,包含14個COPD患者出院后30天內再入院的風險預測模型,對模型基本特征進行了系統評價。結果顯示,現有的風險預測模型預測性能較好,但總體偏倚風險較高,模型質量有待提高。建議未來研究者嚴格遵循PROBAST和TRIPOD,保證模型構建的科學性和嚴謹性,并開展多中心、大樣本的研究,結合深度學習算法,開發性能良好和適用性高的預測模型,為臨床提供高質量的臨床決策依據。
聲明 本研究無利益沖突。