引用本文: 劉凌, 李惠菁, 張治, 胡笑燊, 馬云. 膝骨關節炎風險預測模型的系統評價. 中國循證醫學雜志, 2024, 24(9): 1038-1043. doi: 10.7507/1672-2531.202405081 復制
版權信息: ?四川大學華西醫院華西期刊社《中國循證醫學雜志》版權所有,未經授權不得轉載、改編
膝骨關節炎(knee osteoarthritis,KOA)是一種以關節軟骨進行性破壞為主要特征的慢性退行性疾病,通常會引起關節持續性疼痛和活動受限,可累及整個關節,包括骨骼、滑膜和關節囊[1]。流行病學調查顯示,在全球40歲及以上人群中的患病率為22.9%[2],我國55歲以上的人群中60%有KOA影像學改變,65歲以上的老年人KOA的發病率達85%,KOA總患病率為18%,且隨著人口老齡化加劇,該病的發病率也在逐年升高[3]。目前,早期KOA的治療方式主要是口服非甾體抗炎藥、晚期可行關節置換以及其他手術干預,但治療效果不太理想,口服藥會產生耐受性,手術具有一定的手術風險和植入物松動的可能性[4]。因此,預防和早期識別KOA至關重要。目前已有相關研究對KOA發病的危險因素進行探討,并建立預測模型,預測KOA的發病風險,以助于篩選高危人群,實現早期干預[5]。該領域存在多種方法和變量,模型的構建方法不同,納入的預測因子不同,結果也存在一定的異質性。因此,本文對KOA發病風險預測模型進行系統評價,識別、評估和綜合這些預測模型的質量和性能,以期為未來KOA預測模型的研究提供建議和參考。
1 資料和方法
1.1 納入與排除標準
1.1.1 研究類型
隊列研究、病例-對照研究和橫斷面研究。
1.1.2 研究對象
年齡≥18歲人群。
1.1.3 研究內容
KOA發病風險預測模型的開發或驗證研究。
1.1.4 排除標準
① 僅探討KOA危險因素,并未建立預測模型的研究;② 非中、英文文獻;③ 無法獲得全文或信息不全。
1.2 文獻檢索策略
計算機檢索CNKI、WanFang Data、VIP、PubMed、Embase、Web of Science 和Cochrane Library數據庫,搜集KOA發病風險預測模型的相關文獻,檢索時限均為建庫至2024年4月。檢索采用主題詞與自由詞相結合的方式進行,并根據各數據庫特點進行調整。同時檢索納入研究的參考文獻,以補充獲取相關資料。中文檢索詞包括:膝關節骨性關節炎、膝骨關節炎、膝關節骨關節炎、風險評分、預測風險因素評分、篩查模型、篩查工具、危險因素評分等;英文檢索詞包括:knee osteoarthriti*、osteoarthritis of knee、osteoarthritis of the knee、prediction model、prognostic model、risk prediction、risk score、risk assessment等。
1.3 文獻篩選與資料提取
由2名研究者獨立篩選文獻、提取資料并交叉核對。如有分歧,則通過討論或與第三方協商解決。根據預測模型研究系統評價的關鍵評估和數據提取清單(critical appraisal and data extraction for systematic reviews of prediction modelling studies,CHARMS)[6],提取數據并制定表格。資料提取內容包括:第一作者、國家、研究類型、候選變量、樣本量、缺失數據、建立模型方法、變量選擇、模型性能、模型呈現形式和最終包含的預測因子等。
1.4 納入研究的偏倚風險和適用性評估
由2名研究者采用預測模型研究的偏倚風險評估工具(prediction model risk of bias assessment tool,PROBAST)[7,8]對納入研究的偏倚風險和適用性獨立進行評價。
1.5 統計分析
對納入預測模型的建立情況、性能及驗證、偏倚風險與適用性評價結果進行描述性分析。
2 結果
2.1 文獻檢索結果
初檢共獲得相關文獻1 877篇,包括CNKI(n=262)、WanFang Data(n=1 078)、VIP(n=87)、PubMed(n=123)、Web of Science(n=94)、Embase(n=179)和Cochrane Library(n=54),經逐層篩選后,最終納入12篇文獻[9-20]。文獻篩選流程及結果見附件圖1。
2.2 納入研究的基本特征
納入研究的基本特征見表1。

2.3 預測模型的建立情況
共納入12項研究,包含21個模型,模型建立情況的基本特征見表2。

2.4 預測模型性能及驗證
納入研究的預測模型性能及驗證見表3。

2.5 偏倚風險與適用性評價結果
納入研究的偏倚風險與適用性評價結果見表4。

3 討論
本文共納入12項研究,包含21個模型。納入模型大多報告具有良好的區分度,部分研究缺少校準方法,且多數研究缺少外部驗證。納入研究的總體偏倚風險偏高,問題主要集中于預測因子領域,大多由于評估預測因子時未采用盲法。因限定了研究對象,大部分研究的總體適用性高。
納入研究的預測因子主要包括年齡、性別和BMI。有研究[21]表明,KOA的發病率隨年齡的增長而上升。在老年人群中,與衰老相關的各種因素都可導致KOA的發展。線粒體功能障礙、氧化應激和自噬減少會改變軟骨細胞功能,促進合成代謝過程中的分解代謝過程和細胞死亡[22],衰老細胞的積累可誘導KOA的進展[23]。老年人長期積累關節使用和損傷,從而發生關節軟骨的磨損、關節結構的退行性變化以及肌肉和韌帶的退化,隨著年齡的增長,股四頭肌肌肉萎縮,肌力減弱,使步態和壓力產生變化[24],影響KOA的發生發展。Novin等[25]發現,相比于男性,女性患有KOA或具有KOA影像學特征(如外側關節間隙狹窄、脛骨內側骨贅)的概率高出50%,且發病年齡也早于男性。在運動學中,Nishino等[26]研究發現,男性和女性的膝關節存在顯著差異,男性的軸向旋轉范圍較小,而女性的外翻旋轉范圍較寬,由于生理特征,女性的膝關節更容易受傷。Culvenor等[27]指出,肌肉無力會導致KOA進展,肌肉力量偏低的女性疾病進展的風險大大增加。此外,雌激素可以維持關節穩態,缺乏雌激素會引起骨質疏松,并成為關節炎的危險因素之一,因此絕經后女性更容易發生KOA[28]。Huang等[29]在研究中指出BMI對KOA具有潛在的正因果效應。一項Meta分析[30]發現肥胖和超重與KOA風險顯著相關。BMI增加導致KOA風險增加的一個重要因素是體重過重會使膝蓋承受主要的負荷[31]。實驗表明,體重負荷到軟骨上可以誘導軟骨變形和病變[32]。一項臨床研究[33]證實,異常的負荷會導致關節軟骨的組成、結構和機械性能發生變化。此外,膝關節損傷也是常見的危險因素。一項Meta分析[34]表明,既往膝關節損傷史是發生KOA的重要危險因素,交叉韌帶和半月板損傷可提高KOA的發生率[35]。Yoo的研究[14]納入了高血壓作為預測因素,發現高血壓與KOA有關,分析其原因可能是高血壓相關的動脈硬化引起關節下軟骨丟失和局部代謝性炎癥因素[36]。另外生物標志物、影像學特征也是重要的預測因子,未來研究可從臨床數據中挖掘KOA發病的預測因子,增強模型的說服力。
納入模型中,建模受試者工作特征曲線下面積(area under curve,AUC)的范圍為0.554~0.948之間,驗模AUC的范圍為0.6~0.94,建模AUC有4個效果一般,2個效果良好,驗模AUC有10個效果一般,4個效果良好,說明現有模型總體的預測性能效果一般,具有較大的提升空間[37]。Takahashi的研究[17]將易感因子納入預測因子,建立了三個模型,但AUC值(0.554~0.678)較低,通過結合臨床數據和調整年齡后進一步改進模型,獲得的平均AUC為0.867。Yoo等[14]使用人工神經網絡為建模方法構建了放射學KOA和癥狀性KOA模型,在內部驗證中,癥狀性KOA的AUC高達0.948,說明有良好的鑒別能力。有5項研究采用了外部驗證,外部驗證可以檢驗模型的推廣性和泛化能力,為臨床應用做準備[38]。Kerkhof等[15]的研究外部驗證的AUC高達0.86,模型中納入了KL評分。KL評分是通過站立位的膝關節X光片評估KOA嚴重程度的分級方法,一般認為KL≥2為患有KOA,該研究首次證明了這一風險因素的預測價值,意味著可疑的輕度退行性改變(如KL評分1所示)是未來KOA事件的重要預測因素。
12項納入研究總體偏倚風險均呈高風險。本研究使用的工具是PROBAST,為評估預測模型研究提供了一種標準化的評估框架[8]。8項研究在評估預測因子均未采用盲法,結果的信息可能會對預測因子的評估過程產生影響,導致偏倚。為了精確地評價一個預測模型的預測能力,需評估研究中模型的區分度和校準度,區分度是能夠有效區分不同風險水平的能力,校準度是預測實際發生的概率[37,39]。4項研究未報告校準度的信息,僅報告區分度,可能會導致預測模型出現一致性偏倚。為了提高風險預測模型的準確性和臨床應用價值,在模型開發完成后,需要對模型的區分度和校準度進行細致地評估,有助于提升模型的預測性能和促進向臨床應用的轉化。在設計研究方法時,可以參考CHARMS和PROBAST的指導原則[6,7],以利于構建出低偏倚風險和適用性高的預測模型。
現有模型的數據來源大都是來自OAI數據庫,其是一項針對KOA的多中心、前瞻性觀察研究;預測因子以人口統計學、臨床因素、影像學因素為主;部分模型的結果包含預測因子,可能會增加模型與實際結果的關聯性;在統計分析方面,部分文章沒有對模型的預測性能進行全面評估。在未來研究中,可考慮納入多中心研究,擴大樣本量,有利于識別模型在不同人群中的表現,并為模型的調整提供依據。目前建模方法以Logistic回歸為主,優點是易于解釋且在醫學領域應用廣泛;貝葉斯網絡可以呈現不確定性和因果關系;人工神經網絡能夠處理數據中的大量輸入特征和非線性關系[11]。除此之外還有隨機森林、決策樹等建模方法,具有訓練速度快,功能強大等優點[40]。未來研究可結合不同建模方法的優點,以探索多種方法的組合,從而得出最有效的預測模型。此外,目前大部分研究缺少外部驗證,而外部驗證是評估預測模型泛化能力的重要步驟,其結果可以識別模型的不足,指導模型的進一步改進,避免發生欠擬合和過擬合的情況,從而增加該模型的適用性。后續研究應選擇在不同時間段或地理區域收集的數據集對模型進行驗證,必要時根據外部驗證的結果對模型進行必要的更新和維護。
本研究存在一定的局限性:① 僅納入中、英文文獻,可能存在發表偏倚;② 納入的KOA風險預測模型偏倚風險較高;③ 由于納入的研究對象存在異質性,只進行了定性分析,評價結果相對局限。
綜上所述,本研究對KOA發病風險預測模型研究進行系統評價,模型總體預測性能一般,且整體偏倚風險高,超過一半的模型未進行外部驗證。建議未來建模可遵循CHARMS和PROBAST降低偏倚風險,增加具有理論基礎和臨床意義的預測因子,并加強對模型的驗證,以提高預測模型的臨床應用。
膝骨關節炎(knee osteoarthritis,KOA)是一種以關節軟骨進行性破壞為主要特征的慢性退行性疾病,通常會引起關節持續性疼痛和活動受限,可累及整個關節,包括骨骼、滑膜和關節囊[1]。流行病學調查顯示,在全球40歲及以上人群中的患病率為22.9%[2],我國55歲以上的人群中60%有KOA影像學改變,65歲以上的老年人KOA的發病率達85%,KOA總患病率為18%,且隨著人口老齡化加劇,該病的發病率也在逐年升高[3]。目前,早期KOA的治療方式主要是口服非甾體抗炎藥、晚期可行關節置換以及其他手術干預,但治療效果不太理想,口服藥會產生耐受性,手術具有一定的手術風險和植入物松動的可能性[4]。因此,預防和早期識別KOA至關重要。目前已有相關研究對KOA發病的危險因素進行探討,并建立預測模型,預測KOA的發病風險,以助于篩選高危人群,實現早期干預[5]。該領域存在多種方法和變量,模型的構建方法不同,納入的預測因子不同,結果也存在一定的異質性。因此,本文對KOA發病風險預測模型進行系統評價,識別、評估和綜合這些預測模型的質量和性能,以期為未來KOA預測模型的研究提供建議和參考。
1 資料和方法
1.1 納入與排除標準
1.1.1 研究類型
隊列研究、病例-對照研究和橫斷面研究。
1.1.2 研究對象
年齡≥18歲人群。
1.1.3 研究內容
KOA發病風險預測模型的開發或驗證研究。
1.1.4 排除標準
① 僅探討KOA危險因素,并未建立預測模型的研究;② 非中、英文文獻;③ 無法獲得全文或信息不全。
1.2 文獻檢索策略
計算機檢索CNKI、WanFang Data、VIP、PubMed、Embase、Web of Science 和Cochrane Library數據庫,搜集KOA發病風險預測模型的相關文獻,檢索時限均為建庫至2024年4月。檢索采用主題詞與自由詞相結合的方式進行,并根據各數據庫特點進行調整。同時檢索納入研究的參考文獻,以補充獲取相關資料。中文檢索詞包括:膝關節骨性關節炎、膝骨關節炎、膝關節骨關節炎、風險評分、預測風險因素評分、篩查模型、篩查工具、危險因素評分等;英文檢索詞包括:knee osteoarthriti*、osteoarthritis of knee、osteoarthritis of the knee、prediction model、prognostic model、risk prediction、risk score、risk assessment等。
1.3 文獻篩選與資料提取
由2名研究者獨立篩選文獻、提取資料并交叉核對。如有分歧,則通過討論或與第三方協商解決。根據預測模型研究系統評價的關鍵評估和數據提取清單(critical appraisal and data extraction for systematic reviews of prediction modelling studies,CHARMS)[6],提取數據并制定表格。資料提取內容包括:第一作者、國家、研究類型、候選變量、樣本量、缺失數據、建立模型方法、變量選擇、模型性能、模型呈現形式和最終包含的預測因子等。
1.4 納入研究的偏倚風險和適用性評估
由2名研究者采用預測模型研究的偏倚風險評估工具(prediction model risk of bias assessment tool,PROBAST)[7,8]對納入研究的偏倚風險和適用性獨立進行評價。
1.5 統計分析
對納入預測模型的建立情況、性能及驗證、偏倚風險與適用性評價結果進行描述性分析。
2 結果
2.1 文獻檢索結果
初檢共獲得相關文獻1 877篇,包括CNKI(n=262)、WanFang Data(n=1 078)、VIP(n=87)、PubMed(n=123)、Web of Science(n=94)、Embase(n=179)和Cochrane Library(n=54),經逐層篩選后,最終納入12篇文獻[9-20]。文獻篩選流程及結果見附件圖1。
2.2 納入研究的基本特征
納入研究的基本特征見表1。

2.3 預測模型的建立情況
共納入12項研究,包含21個模型,模型建立情況的基本特征見表2。

2.4 預測模型性能及驗證
納入研究的預測模型性能及驗證見表3。

2.5 偏倚風險與適用性評價結果
納入研究的偏倚風險與適用性評價結果見表4。

3 討論
本文共納入12項研究,包含21個模型。納入模型大多報告具有良好的區分度,部分研究缺少校準方法,且多數研究缺少外部驗證。納入研究的總體偏倚風險偏高,問題主要集中于預測因子領域,大多由于評估預測因子時未采用盲法。因限定了研究對象,大部分研究的總體適用性高。
納入研究的預測因子主要包括年齡、性別和BMI。有研究[21]表明,KOA的發病率隨年齡的增長而上升。在老年人群中,與衰老相關的各種因素都可導致KOA的發展。線粒體功能障礙、氧化應激和自噬減少會改變軟骨細胞功能,促進合成代謝過程中的分解代謝過程和細胞死亡[22],衰老細胞的積累可誘導KOA的進展[23]。老年人長期積累關節使用和損傷,從而發生關節軟骨的磨損、關節結構的退行性變化以及肌肉和韌帶的退化,隨著年齡的增長,股四頭肌肌肉萎縮,肌力減弱,使步態和壓力產生變化[24],影響KOA的發生發展。Novin等[25]發現,相比于男性,女性患有KOA或具有KOA影像學特征(如外側關節間隙狹窄、脛骨內側骨贅)的概率高出50%,且發病年齡也早于男性。在運動學中,Nishino等[26]研究發現,男性和女性的膝關節存在顯著差異,男性的軸向旋轉范圍較小,而女性的外翻旋轉范圍較寬,由于生理特征,女性的膝關節更容易受傷。Culvenor等[27]指出,肌肉無力會導致KOA進展,肌肉力量偏低的女性疾病進展的風險大大增加。此外,雌激素可以維持關節穩態,缺乏雌激素會引起骨質疏松,并成為關節炎的危險因素之一,因此絕經后女性更容易發生KOA[28]。Huang等[29]在研究中指出BMI對KOA具有潛在的正因果效應。一項Meta分析[30]發現肥胖和超重與KOA風險顯著相關。BMI增加導致KOA風險增加的一個重要因素是體重過重會使膝蓋承受主要的負荷[31]。實驗表明,體重負荷到軟骨上可以誘導軟骨變形和病變[32]。一項臨床研究[33]證實,異常的負荷會導致關節軟骨的組成、結構和機械性能發生變化。此外,膝關節損傷也是常見的危險因素。一項Meta分析[34]表明,既往膝關節損傷史是發生KOA的重要危險因素,交叉韌帶和半月板損傷可提高KOA的發生率[35]。Yoo的研究[14]納入了高血壓作為預測因素,發現高血壓與KOA有關,分析其原因可能是高血壓相關的動脈硬化引起關節下軟骨丟失和局部代謝性炎癥因素[36]。另外生物標志物、影像學特征也是重要的預測因子,未來研究可從臨床數據中挖掘KOA發病的預測因子,增強模型的說服力。
納入模型中,建模受試者工作特征曲線下面積(area under curve,AUC)的范圍為0.554~0.948之間,驗模AUC的范圍為0.6~0.94,建模AUC有4個效果一般,2個效果良好,驗模AUC有10個效果一般,4個效果良好,說明現有模型總體的預測性能效果一般,具有較大的提升空間[37]。Takahashi的研究[17]將易感因子納入預測因子,建立了三個模型,但AUC值(0.554~0.678)較低,通過結合臨床數據和調整年齡后進一步改進模型,獲得的平均AUC為0.867。Yoo等[14]使用人工神經網絡為建模方法構建了放射學KOA和癥狀性KOA模型,在內部驗證中,癥狀性KOA的AUC高達0.948,說明有良好的鑒別能力。有5項研究采用了外部驗證,外部驗證可以檢驗模型的推廣性和泛化能力,為臨床應用做準備[38]。Kerkhof等[15]的研究外部驗證的AUC高達0.86,模型中納入了KL評分。KL評分是通過站立位的膝關節X光片評估KOA嚴重程度的分級方法,一般認為KL≥2為患有KOA,該研究首次證明了這一風險因素的預測價值,意味著可疑的輕度退行性改變(如KL評分1所示)是未來KOA事件的重要預測因素。
12項納入研究總體偏倚風險均呈高風險。本研究使用的工具是PROBAST,為評估預測模型研究提供了一種標準化的評估框架[8]。8項研究在評估預測因子均未采用盲法,結果的信息可能會對預測因子的評估過程產生影響,導致偏倚。為了精確地評價一個預測模型的預測能力,需評估研究中模型的區分度和校準度,區分度是能夠有效區分不同風險水平的能力,校準度是預測實際發生的概率[37,39]。4項研究未報告校準度的信息,僅報告區分度,可能會導致預測模型出現一致性偏倚。為了提高風險預測模型的準確性和臨床應用價值,在模型開發完成后,需要對模型的區分度和校準度進行細致地評估,有助于提升模型的預測性能和促進向臨床應用的轉化。在設計研究方法時,可以參考CHARMS和PROBAST的指導原則[6,7],以利于構建出低偏倚風險和適用性高的預測模型。
現有模型的數據來源大都是來自OAI數據庫,其是一項針對KOA的多中心、前瞻性觀察研究;預測因子以人口統計學、臨床因素、影像學因素為主;部分模型的結果包含預測因子,可能會增加模型與實際結果的關聯性;在統計分析方面,部分文章沒有對模型的預測性能進行全面評估。在未來研究中,可考慮納入多中心研究,擴大樣本量,有利于識別模型在不同人群中的表現,并為模型的調整提供依據。目前建模方法以Logistic回歸為主,優點是易于解釋且在醫學領域應用廣泛;貝葉斯網絡可以呈現不確定性和因果關系;人工神經網絡能夠處理數據中的大量輸入特征和非線性關系[11]。除此之外還有隨機森林、決策樹等建模方法,具有訓練速度快,功能強大等優點[40]。未來研究可結合不同建模方法的優點,以探索多種方法的組合,從而得出最有效的預測模型。此外,目前大部分研究缺少外部驗證,而外部驗證是評估預測模型泛化能力的重要步驟,其結果可以識別模型的不足,指導模型的進一步改進,避免發生欠擬合和過擬合的情況,從而增加該模型的適用性。后續研究應選擇在不同時間段或地理區域收集的數據集對模型進行驗證,必要時根據外部驗證的結果對模型進行必要的更新和維護。
本研究存在一定的局限性:① 僅納入中、英文文獻,可能存在發表偏倚;② 納入的KOA風險預測模型偏倚風險較高;③ 由于納入的研究對象存在異質性,只進行了定性分析,評價結果相對局限。
綜上所述,本研究對KOA發病風險預測模型研究進行系統評價,模型總體預測性能一般,且整體偏倚風險高,超過一半的模型未進行外部驗證。建議未來建模可遵循CHARMS和PROBAST降低偏倚風險,增加具有理論基礎和臨床意義的預測因子,并加強對模型的驗證,以提高預測模型的臨床應用。