版權信息: ?四川大學華西醫院華西期刊社《中國胸心血管外科臨床雜志》版權所有,未經授權不得轉載、改編
心力衰竭(heart failure,HF)是以呼吸困難、肺/體循環淤血、外周水腫等為主要表現的臨床綜合征[1],是各種心臟疾病的嚴重表現及終末期狀態。HF患者常因HF癥狀反復發作影響生活質量,且反復入院治療也產生巨大的醫療費用。研究表明,HF患者出院30 d后再入院率為18.6%[2],1年內再入院率為45.0%[3],HF患者人均住院費用達
1 資料與方法
1.1 文獻納入和排除標準
納入標準:① 研究內容為再入院風險預測模型的構建及驗證;② 結局指標為再入院;③ 隊列研究。排除標準:① 會議摘要、綜述、述評、信件等資料;② 無法獲取全文或資料不完整;③ 重復文獻;④ 只分析HF患者的再入院危險因素,未構建預測模型;⑤ 未報告建模過程或方法。
1.2 文獻檢索策略
檢索The Cochrane Library、PubMed、EMbase、Web of Science、中國知網、維普、萬方和中國生物醫學文獻數據庫中相關文獻,檢索時間為建庫至2024年4月30日。中文檢索詞:心力衰竭、心衰、再入院、預測模型、曲線下面積等。英文檢索詞:heart failure、cardiac failure、patient readmission、readmission、prediction model、area under curve等。PubMed檢索策略見附件表1。
1.3 文獻篩選及數據提取
由2名研究員獨立閱讀文獻題目及摘要初步篩選,再通讀全文,按照納入和排除標準嚴格篩選文獻。如有分歧,與第3名研究員商討。確認最終納入文獻后,2名研究員基于臨床預測模型系統評價數據提取清單(critical appraisal and data extraction for systematic reviews of prediction modelling studies,CHARMS)[6]獨立提取文獻信息并交叉核對。提取內容包括納入文獻的基本特征、模型開發與驗證細節、模型性能及呈現方式等。
1.4 文獻方法學質量評價
采用預測模型研究的偏倚風險評估工具(prediction model risk of bias assessment tool,PROBAST)[7-8]對納入文獻的偏倚風險和適用性進行評價。由2名研究員獨立完成并交叉核對,如有分歧,與第3名研究員商討。偏倚風險評估包含4個領域:研究對象、預測變量、結局和分析。適用性評價包含3個領域:研究對象、預測因子和 結果。每個領域被判定為低、高、不清楚3類。 當各個領域均判定為低風險時,整體呈低風險;≥1個領域判定為高風險時,整體呈高風險;≥1個領域判定為不清楚且其他均為低風險時,整體評價為不清楚。
1.5 研究注冊
本研究已在PROSPERO注冊,注冊號:CRD42024529902。按照PRISMA(preferred reporting items for systematic reviews and meta-analyses)報告規范[9]進行。
2 結果
2.1 文獻檢索及篩選結果
初步檢索獲得相關文獻
2.2 納入文獻基本特征
共納入19篇文獻[10-28],均為隊列研究,其中15篇為回顧性研究[10-20,24,26-28],4篇為前瞻性研究[21-23,25],文章發表時間為2019—2023年。研究對象方面,9項研究[12,14,16,18-22,27]針對HF患者建模,8項研究針對急性HF患者建模[10,13,17,23-26,28],1項研究針對慢性HF患者建模[15],1項研究針對HF合并心房顫動患者建模[11]。預測結局方面,8項研究為HF再入院[15-18,21,23,27-28],11項研究為全因再入院[10-14,19-20,22,24-26]。隨訪時間分別為30 d[15,20,22,26]、90 d[12]、3個月[17,27]、180 d[23]、6個月[13,19,24]、1年[10-11,14,16,18,28]、2年[21,25],報告的再入院率4.27%~56.90%。納入文獻基本特征見附件表2。
2.3 納入模型的構建情況
納入19項研究的建模所用樣本總量為203~
2.4 模型的預測因子及性能評估
納入19項研究共建立38個預測模型,單個預測模型最終納入的預測因子數量3~20個,其中出現頻次在3次及以上的預測因子包括左心室射血分數、N末端B型利鈉肽原、體重指數、收縮壓、心力衰竭類型、紐約心臟協會(New York Heart Association,NYHA)心功能分級、合并高血壓、合并糖尿病、合并心房顫動、腎功能不全、貧血、年齡、服藥依從性、抑郁,其臨床預測價值見附件表4。
模型的區分度方面,受試者工作特征曲線下面積(area under the curve,AUC)/C指數范圍0.547~0.962,其中有16個模型的AUC<0.7,區分度較差,其余模型的AUC均>0.7,表現出良好的預測性能。模型的校準度方面,除2項研究[14,19]未進行模型校準度評價外,其余研究均報告所建模型具有良好的校準度,涉及方法包括校準曲線圖、布里爾分數(Brier Score)、Hosmer-Lemeshow(HL)檢驗。模型的臨床有效性評價方面,5項研究[11-12,16,22,28]采用臨床決策曲線(decision curve analysis,DCA)對預測模型進行了臨床可行性評價。模型的呈現方式方面,13項研究[10-12,14-18,22-25,28]以列線圖呈現,1項研究[21]開發了在線風險計算器,另有1項研究[20]以列線圖和在線風險計算器同時呈現。具體納入模型的預測因子及性能評估見附件表5。
2.5 納入文獻偏倚風險和適應性評價
2.5.1 偏倚風險
8項研究[11,13-17,21,28]在研究對象領域為低風險,其余研究均被判定為高風險,涉及的問題主要是排除部分資料不全的病例[10,18,22,25,27],研究數據來源于現有數據或回顧性隊列研究[12,19-20,23-24,26]。4項研究[21-23,25]在預測變量領域為低風險,其余研究均因研究者評估預測變量時對結局均已知曉或可能知曉被判定為高風險。16項研究[10-18,20-23,26-28]在結果領域為低風險,其余3項研究[19,24-25]均因未報告預測因子評估和結果確定的時間間隔被判定為高風險。僅有1項研究[20]在統計分析領域為低風險,其余均被判定為高風險,涉及的主要問題包括:① 變量的處理:未提及變量處理方法[24],將連續變量轉化為分類變量進行處理[12-13,16-17,19,23,28];② 缺失數據的處理:未提及缺失數據的處理[10,12,16,25,27],未納入或排除資料不完整者[11,13-15,17-18,22,28];③ 預測變量的篩選:未提及篩選預測變量所用的統計學方法[26];④ 模型的性能報告及擬合度檢驗:部分模型[13-18,21-22,25]過擬合,另有部分模型[23-24,26]可能存在欠擬合。
2.5.2 適應性
9項研究[10,12-14,19,22,24-26]的總體適應性較好,總體適應性較差的研究主要有張春旭[11]的研究,納入對象與研究問題存在偏差,導致研究對象適應性不佳;8項研究[15-18,21,23,27-28]因僅考慮心血管原因再入院而在結果領域的適應性不佳,李代毅[20]的研究只在醫院信息庫中檢索患者再入院情況,未分析患者在其他醫療機構的再入院可能,同樣在結果領域適用性不佳。納入研究的偏倚風險與適應性評價結果見附件表6。
3 討論
我國HF患者再入院風險預測模型研究起步較晚,研究對象多集中在研究者所在地區,數據資料多通過問卷調查和/或電話訪談的方式獲得,預測因子以心功能分級、生物標志物、合并疾病多見。國外相關研究的數據資料多從醫療數據庫獲得,樣本量大且研究對象涉及不同種族、不同地區的人群,因此預測因子中多包含民族、人種、社會經濟地位等因素;受飲食結構、醫療水平、非藥物治療手段普及程度的影響,肥胖[29]、寄生蟲病和傳染病[30]、主動脈內球囊反搏[31]、心臟再同步治療[32]等預測因子也在國外的相關研究中較為常見。本研究納入的預測模型中,血壓[12]、體溫[20]等患者一般情況和肌鈣蛋白T[20]、血鉀[26]等實驗室化驗結果多見于隨訪時間<6個月的預測模型,而社會心理因素[13,21,25]、用藥依從性[11,13,16]及隨訪情況[16]多見于隨訪時間≥6個月的預測模型中。合并糖尿病、慢性腎功能不全、左心室射血分數、NYHA心功能分級、N末端B型利鈉肽原/腦鈉肽等出現頻次較高的預測因子,在各個隨訪時間節點均有納入。部分模型將焦慮、抑郁、獨居、飲食和睡眠等納入了風險預測因子,這些心理社會及生活因素均被證實是HF再入院風險的影響因素[33-35],但上述影響因素與生物標志物等客觀指標相比,獲得過程存在主觀性,需要大樣本量、規范的流行病學調查獲取真實可靠的數據,以支撐預測模型的開發。藥物干預及用藥依從性與HF患者的預后密切相關,部分模型[11,13,18,20]也將其納入預測因子,并證實其有良好的預測價值,但用藥方案及用藥依從性需通過隨訪進行監測與評估。另外,中醫藥干預也被證實是影響HF患者預后的重要因素[36],現已建立的中西醫預測模型在HF患者復合終點事件發生的預測中具有良好的準確度[37],但缺少針對HF患者再入院風險的中西醫預測模型,此次評價的19項研究均未將中醫藥干預措施納入研究。后續考慮將中醫證型及中醫藥干預作為預測因素納入研究,開發更適合我國HF患者再入院的風險預測模型。
Shin等[38]的研究顯示,機器學習方法在預測HF患者再入院和死亡率方面優于統計學方法,但本研究納入的模型中,大部分仍以logistic回歸作為建模方法,這可能與logistic回歸臨床可解釋性更強、更符合臨床實際相關。在采用相同預測因子開發預測模型的研究中,部分使用機器學習方法開發的模型,其預測性能部分優于logistic回歸[21,26],這可能與機器學習方法具有強大的數據分析和探索能力,通過機器學習方法開發的模型顯示出準確性、靈敏度和效率優勢相關[39]。但納入的模型中,并非所有模型的預測性能均優于logistic回歸,這可能與臨床樣本量過少、機器學習建模需要高質量數據有關[40]。隨著大數據時代的到來,機器學習方法在醫療領域有了更多的應用,可以考慮作為大數據集風險預測的靈活替代方案。
通過對納入文獻的偏倚風險和適用性進行評價后發現,多項研究[11,13-15,17-18,22,28]將有缺失數據的患者排除,或未提及缺失數據的處理方式[10,12,16,25,27],且多項研究[12-13,16-17,19,23,28]將連續變量離散化處理,這可能導致有效信息的流失,影響模型的預測能力。根據EPV(events per variable)原則,即每個變量對應的事件發生例數>20例,部分模型[13-18,21,22,25]的樣本量不足或納入的預測因子過多,導致EFP<20,模型存在過度擬合,另有部分模型[23-24,26]的EFP>50,可能存在欠擬合。模型校準度評價使用HL擬合優度檢驗、校準圖、校準斜率、校準截距和布里爾分數衡量,雖然納入的研究絕大多數都報告了HL斜率或校準圖,但僅有1項研究[21]采用了HL擬合優度檢驗與布里爾分數相結合的方式進行評估。另外,所納入的模型中,僅有5項研究[11-12,16,22,28]采用DCA對預測模型進行臨床可行性評價,均表示其開發的預測模型適用于臨床。但在實際臨床應用中,新的預測風險模型的收益、危害和成本,都是決定該模型是否可以應用于臨床的最后關鍵步驟[41]。
綜合數據來源、預測因素、模型質量及臨床應用等各方面存在的問題,建議后續HF患者再入院風險預測模型的建立過程中,進行多中心前瞻性隊列研究,優化并整合多中心數據,利用數據挖掘技術及機器學習方法處理數據,以提升數據質量;在預測因子選擇方面,除了考慮其臨床意義和統計學意義外,還應綜合其獲取難易、測量成本、客觀標準等進行取舍,以降低模型應用成本;在建模與驗證方面,應結合數據特征及類型選擇不同的建模方法,使用交叉驗證等方法優化模型參數,使用模型堆疊等集成方法進行模型集成及融合,使用外部驗證評估模型的泛化能力,還應采用SHAP(Shapley Additive exPlanations)等模型解釋工具,量化預測變量對模型預測結果的貢獻,以提高模型性能及臨床可解釋性;最后,選擇合適的模型載體進行呈現,如網頁計算器等交互性強的呈現方式,以使模型能更好地適用于臨床。
本研究存在以下局限:首先,我們雖進行了詳盡的文獻檢索,但由于沒有嘗試補充檢索及灰色文獻檢索,可能會遺漏一些相關文章,造成偏倚;其次,由于各研究的異質性存在差異,研究結果沒有進行定量綜合,限制了模型的可比性;再次,本研究未對HF患者隨訪時間節點進行限定,HF患者再入院與其隨訪時間密切相關,需要根據不同的隨訪時間進行風險評估;最后,由于研究人員進行質量評價過程中的主觀性,可能導致偏倚。
綜上所述,本研究系統評價了19項研究共涉及38個HF患者再入院風險預測模型。結果顯示,現階段關于HF患者再入院風險預測模型的預測因子選擇均以西醫指標為主;雖然部分模型有較好的性能,但缺乏外部驗證,并且臨床利用率低。建議未來研究者遵循PROBAST,保證模型構建的質量,并期待后續能有大范圍、大規模、涉及多個研究中心的大樣本量研究支持開發更為穩定且臨床適用性高的預測模型并應用于臨床,為盡早識別再入院高危患者提供有效幫助。
利益沖突:無。
作者貢獻:高瑞磊負責論文設計,數據整理及分析,論文撰寫;王丹負責數據整理及分析,論文修改;高武霖、管慧、董雪燕負責數據核對;戴國華負責論文設計、審閱與修改。
本文附件圖表見本刊網站電子版(
心力衰竭(heart failure,HF)是以呼吸困難、肺/體循環淤血、外周水腫等為主要表現的臨床綜合征[1],是各種心臟疾病的嚴重表現及終末期狀態。HF患者常因HF癥狀反復發作影響生活質量,且反復入院治療也產生巨大的醫療費用。研究表明,HF患者出院30 d后再入院率為18.6%[2],1年內再入院率為45.0%[3],HF患者人均住院費用達
1 資料與方法
1.1 文獻納入和排除標準
納入標準:① 研究內容為再入院風險預測模型的構建及驗證;② 結局指標為再入院;③ 隊列研究。排除標準:① 會議摘要、綜述、述評、信件等資料;② 無法獲取全文或資料不完整;③ 重復文獻;④ 只分析HF患者的再入院危險因素,未構建預測模型;⑤ 未報告建模過程或方法。
1.2 文獻檢索策略
檢索The Cochrane Library、PubMed、EMbase、Web of Science、中國知網、維普、萬方和中國生物醫學文獻數據庫中相關文獻,檢索時間為建庫至2024年4月30日。中文檢索詞:心力衰竭、心衰、再入院、預測模型、曲線下面積等。英文檢索詞:heart failure、cardiac failure、patient readmission、readmission、prediction model、area under curve等。PubMed檢索策略見附件表1。
1.3 文獻篩選及數據提取
由2名研究員獨立閱讀文獻題目及摘要初步篩選,再通讀全文,按照納入和排除標準嚴格篩選文獻。如有分歧,與第3名研究員商討。確認最終納入文獻后,2名研究員基于臨床預測模型系統評價數據提取清單(critical appraisal and data extraction for systematic reviews of prediction modelling studies,CHARMS)[6]獨立提取文獻信息并交叉核對。提取內容包括納入文獻的基本特征、模型開發與驗證細節、模型性能及呈現方式等。
1.4 文獻方法學質量評價
采用預測模型研究的偏倚風險評估工具(prediction model risk of bias assessment tool,PROBAST)[7-8]對納入文獻的偏倚風險和適用性進行評價。由2名研究員獨立完成并交叉核對,如有分歧,與第3名研究員商討。偏倚風險評估包含4個領域:研究對象、預測變量、結局和分析。適用性評價包含3個領域:研究對象、預測因子和 結果。每個領域被判定為低、高、不清楚3類。 當各個領域均判定為低風險時,整體呈低風險;≥1個領域判定為高風險時,整體呈高風險;≥1個領域判定為不清楚且其他均為低風險時,整體評價為不清楚。
1.5 研究注冊
本研究已在PROSPERO注冊,注冊號:CRD42024529902。按照PRISMA(preferred reporting items for systematic reviews and meta-analyses)報告規范[9]進行。
2 結果
2.1 文獻檢索及篩選結果
初步檢索獲得相關文獻
2.2 納入文獻基本特征
共納入19篇文獻[10-28],均為隊列研究,其中15篇為回顧性研究[10-20,24,26-28],4篇為前瞻性研究[21-23,25],文章發表時間為2019—2023年。研究對象方面,9項研究[12,14,16,18-22,27]針對HF患者建模,8項研究針對急性HF患者建模[10,13,17,23-26,28],1項研究針對慢性HF患者建模[15],1項研究針對HF合并心房顫動患者建模[11]。預測結局方面,8項研究為HF再入院[15-18,21,23,27-28],11項研究為全因再入院[10-14,19-20,22,24-26]。隨訪時間分別為30 d[15,20,22,26]、90 d[12]、3個月[17,27]、180 d[23]、6個月[13,19,24]、1年[10-11,14,16,18,28]、2年[21,25],報告的再入院率4.27%~56.90%。納入文獻基本特征見附件表2。
2.3 納入模型的構建情況
納入19項研究的建模所用樣本總量為203~
2.4 模型的預測因子及性能評估
納入19項研究共建立38個預測模型,單個預測模型最終納入的預測因子數量3~20個,其中出現頻次在3次及以上的預測因子包括左心室射血分數、N末端B型利鈉肽原、體重指數、收縮壓、心力衰竭類型、紐約心臟協會(New York Heart Association,NYHA)心功能分級、合并高血壓、合并糖尿病、合并心房顫動、腎功能不全、貧血、年齡、服藥依從性、抑郁,其臨床預測價值見附件表4。
模型的區分度方面,受試者工作特征曲線下面積(area under the curve,AUC)/C指數范圍0.547~0.962,其中有16個模型的AUC<0.7,區分度較差,其余模型的AUC均>0.7,表現出良好的預測性能。模型的校準度方面,除2項研究[14,19]未進行模型校準度評價外,其余研究均報告所建模型具有良好的校準度,涉及方法包括校準曲線圖、布里爾分數(Brier Score)、Hosmer-Lemeshow(HL)檢驗。模型的臨床有效性評價方面,5項研究[11-12,16,22,28]采用臨床決策曲線(decision curve analysis,DCA)對預測模型進行了臨床可行性評價。模型的呈現方式方面,13項研究[10-12,14-18,22-25,28]以列線圖呈現,1項研究[21]開發了在線風險計算器,另有1項研究[20]以列線圖和在線風險計算器同時呈現。具體納入模型的預測因子及性能評估見附件表5。
2.5 納入文獻偏倚風險和適應性評價
2.5.1 偏倚風險
8項研究[11,13-17,21,28]在研究對象領域為低風險,其余研究均被判定為高風險,涉及的問題主要是排除部分資料不全的病例[10,18,22,25,27],研究數據來源于現有數據或回顧性隊列研究[12,19-20,23-24,26]。4項研究[21-23,25]在預測變量領域為低風險,其余研究均因研究者評估預測變量時對結局均已知曉或可能知曉被判定為高風險。16項研究[10-18,20-23,26-28]在結果領域為低風險,其余3項研究[19,24-25]均因未報告預測因子評估和結果確定的時間間隔被判定為高風險。僅有1項研究[20]在統計分析領域為低風險,其余均被判定為高風險,涉及的主要問題包括:① 變量的處理:未提及變量處理方法[24],將連續變量轉化為分類變量進行處理[12-13,16-17,19,23,28];② 缺失數據的處理:未提及缺失數據的處理[10,12,16,25,27],未納入或排除資料不完整者[11,13-15,17-18,22,28];③ 預測變量的篩選:未提及篩選預測變量所用的統計學方法[26];④ 模型的性能報告及擬合度檢驗:部分模型[13-18,21-22,25]過擬合,另有部分模型[23-24,26]可能存在欠擬合。
2.5.2 適應性
9項研究[10,12-14,19,22,24-26]的總體適應性較好,總體適應性較差的研究主要有張春旭[11]的研究,納入對象與研究問題存在偏差,導致研究對象適應性不佳;8項研究[15-18,21,23,27-28]因僅考慮心血管原因再入院而在結果領域的適應性不佳,李代毅[20]的研究只在醫院信息庫中檢索患者再入院情況,未分析患者在其他醫療機構的再入院可能,同樣在結果領域適用性不佳。納入研究的偏倚風險與適應性評價結果見附件表6。
3 討論
我國HF患者再入院風險預測模型研究起步較晚,研究對象多集中在研究者所在地區,數據資料多通過問卷調查和/或電話訪談的方式獲得,預測因子以心功能分級、生物標志物、合并疾病多見。國外相關研究的數據資料多從醫療數據庫獲得,樣本量大且研究對象涉及不同種族、不同地區的人群,因此預測因子中多包含民族、人種、社會經濟地位等因素;受飲食結構、醫療水平、非藥物治療手段普及程度的影響,肥胖[29]、寄生蟲病和傳染病[30]、主動脈內球囊反搏[31]、心臟再同步治療[32]等預測因子也在國外的相關研究中較為常見。本研究納入的預測模型中,血壓[12]、體溫[20]等患者一般情況和肌鈣蛋白T[20]、血鉀[26]等實驗室化驗結果多見于隨訪時間<6個月的預測模型,而社會心理因素[13,21,25]、用藥依從性[11,13,16]及隨訪情況[16]多見于隨訪時間≥6個月的預測模型中。合并糖尿病、慢性腎功能不全、左心室射血分數、NYHA心功能分級、N末端B型利鈉肽原/腦鈉肽等出現頻次較高的預測因子,在各個隨訪時間節點均有納入。部分模型將焦慮、抑郁、獨居、飲食和睡眠等納入了風險預測因子,這些心理社會及生活因素均被證實是HF再入院風險的影響因素[33-35],但上述影響因素與生物標志物等客觀指標相比,獲得過程存在主觀性,需要大樣本量、規范的流行病學調查獲取真實可靠的數據,以支撐預測模型的開發。藥物干預及用藥依從性與HF患者的預后密切相關,部分模型[11,13,18,20]也將其納入預測因子,并證實其有良好的預測價值,但用藥方案及用藥依從性需通過隨訪進行監測與評估。另外,中醫藥干預也被證實是影響HF患者預后的重要因素[36],現已建立的中西醫預測模型在HF患者復合終點事件發生的預測中具有良好的準確度[37],但缺少針對HF患者再入院風險的中西醫預測模型,此次評價的19項研究均未將中醫藥干預措施納入研究。后續考慮將中醫證型及中醫藥干預作為預測因素納入研究,開發更適合我國HF患者再入院的風險預測模型。
Shin等[38]的研究顯示,機器學習方法在預測HF患者再入院和死亡率方面優于統計學方法,但本研究納入的模型中,大部分仍以logistic回歸作為建模方法,這可能與logistic回歸臨床可解釋性更強、更符合臨床實際相關。在采用相同預測因子開發預測模型的研究中,部分使用機器學習方法開發的模型,其預測性能部分優于logistic回歸[21,26],這可能與機器學習方法具有強大的數據分析和探索能力,通過機器學習方法開發的模型顯示出準確性、靈敏度和效率優勢相關[39]。但納入的模型中,并非所有模型的預測性能均優于logistic回歸,這可能與臨床樣本量過少、機器學習建模需要高質量數據有關[40]。隨著大數據時代的到來,機器學習方法在醫療領域有了更多的應用,可以考慮作為大數據集風險預測的靈活替代方案。
通過對納入文獻的偏倚風險和適用性進行評價后發現,多項研究[11,13-15,17-18,22,28]將有缺失數據的患者排除,或未提及缺失數據的處理方式[10,12,16,25,27],且多項研究[12-13,16-17,19,23,28]將連續變量離散化處理,這可能導致有效信息的流失,影響模型的預測能力。根據EPV(events per variable)原則,即每個變量對應的事件發生例數>20例,部分模型[13-18,21,22,25]的樣本量不足或納入的預測因子過多,導致EFP<20,模型存在過度擬合,另有部分模型[23-24,26]的EFP>50,可能存在欠擬合。模型校準度評價使用HL擬合優度檢驗、校準圖、校準斜率、校準截距和布里爾分數衡量,雖然納入的研究絕大多數都報告了HL斜率或校準圖,但僅有1項研究[21]采用了HL擬合優度檢驗與布里爾分數相結合的方式進行評估。另外,所納入的模型中,僅有5項研究[11-12,16,22,28]采用DCA對預測模型進行臨床可行性評價,均表示其開發的預測模型適用于臨床。但在實際臨床應用中,新的預測風險模型的收益、危害和成本,都是決定該模型是否可以應用于臨床的最后關鍵步驟[41]。
綜合數據來源、預測因素、模型質量及臨床應用等各方面存在的問題,建議后續HF患者再入院風險預測模型的建立過程中,進行多中心前瞻性隊列研究,優化并整合多中心數據,利用數據挖掘技術及機器學習方法處理數據,以提升數據質量;在預測因子選擇方面,除了考慮其臨床意義和統計學意義外,還應綜合其獲取難易、測量成本、客觀標準等進行取舍,以降低模型應用成本;在建模與驗證方面,應結合數據特征及類型選擇不同的建模方法,使用交叉驗證等方法優化模型參數,使用模型堆疊等集成方法進行模型集成及融合,使用外部驗證評估模型的泛化能力,還應采用SHAP(Shapley Additive exPlanations)等模型解釋工具,量化預測變量對模型預測結果的貢獻,以提高模型性能及臨床可解釋性;最后,選擇合適的模型載體進行呈現,如網頁計算器等交互性強的呈現方式,以使模型能更好地適用于臨床。
本研究存在以下局限:首先,我們雖進行了詳盡的文獻檢索,但由于沒有嘗試補充檢索及灰色文獻檢索,可能會遺漏一些相關文章,造成偏倚;其次,由于各研究的異質性存在差異,研究結果沒有進行定量綜合,限制了模型的可比性;再次,本研究未對HF患者隨訪時間節點進行限定,HF患者再入院與其隨訪時間密切相關,需要根據不同的隨訪時間進行風險評估;最后,由于研究人員進行質量評價過程中的主觀性,可能導致偏倚。
綜上所述,本研究系統評價了19項研究共涉及38個HF患者再入院風險預測模型。結果顯示,現階段關于HF患者再入院風險預測模型的預測因子選擇均以西醫指標為主;雖然部分模型有較好的性能,但缺乏外部驗證,并且臨床利用率低。建議未來研究者遵循PROBAST,保證模型構建的質量,并期待后續能有大范圍、大規模、涉及多個研究中心的大樣本量研究支持開發更為穩定且臨床適用性高的預測模型并應用于臨床,為盡早識別再入院高危患者提供有效幫助。
利益沖突:無。
作者貢獻:高瑞磊負責論文設計,數據整理及分析,論文撰寫;王丹負責數據整理及分析,論文修改;高武霖、管慧、董雪燕負責數據核對;戴國華負責論文設計、審閱與修改。
本文附件圖表見本刊網站電子版(