臨床預測模型通常使用多個變量的組合來預測個體的健康結局,然而針對同一結局往往存在著多個預測模型,這增加了選擇合適的模型用以指導臨床實踐的難度。近年來,使用系統評價/Meta分析評估和總結預測模型的研究越來越多,但它們對于關鍵信息的報告往往存在不足。為了提高預測模型系統評價/Meta分析的報告質量,2023年3月國外學者在BMJ發表了TRIPOD-SRMA報告規范。考慮到國內此類系統評價/Meta分析的數量正在快速增加,本文結合實例對該報告規范進行解讀,旨在幫助國內學者更好地理解與應用TRIPOD-SRMA報告規范,以期幫助提高相關研究的整體質量。
引用本文: 王子怡, 盧存存, 張晶磊, 黃家藝, 劉文迪, 尚文茹, 陳子佳, 崔璐, 趙曉曉, 胡曉曄, 楊克虎, 李秀霞. 個體預后與診斷多變量預測模型系統評價/Meta分析報告規范(TRIPOD-SRMA)解讀. 中國循證醫學雜志, 2024, 24(2): 202-210. doi: 10.7507/1672-2531.202308041 復制
版權信息: ?四川大學華西醫院華西期刊社《中國循證醫學雜志》版權所有,未經授權不得轉載、改編
預測模型是指利用多個預測因子估計患有(即診斷模型)或未來發生特定疾病或結局(即預后模型)風險的數學模型,它們對臨床實踐具有重要的指導意義[1]。目前,預測模型研究的數量正在急劇增加,并且越來越多地被應用于指導臨床實踐和公共衛生決策[2]。然而,不同預測模型的性能證據往往相互矛盾,這增加了選擇合適預測模型指導衛生決策的難度[3,4]。因此,有必要對針對同一臨床問題的預測模型開展系統評價,這對于驗證模型在不同目標人群、背景及地點的預測能力以及明確模型是否需要進一步調整或改進至關重要[5]。近年來發表的預測模型系統評價/Meta分析越來越多,但它們對關鍵信息的報告往往存在不足,這可能主要與缺少專門用于指導此類研究的報告規范有關[2,6]。
為了提高預測模型系統評價/Meta分析的報告質量,國外學者于2023年3月在BMJ發表了個體預后與診斷多變量預測模型系統評價/Meta分析(transparent reporting of multivariable prediction models for individual prognosis or diagnosis tailored for systematic reviews and meta-analyses,TRIPOD-SRMA)報告規范[7]。鑒于國內此類研究的數量正在快速增加[8-10],本文對該規范的制訂過程、適用范圍和條目進行介紹,并結合實例對條目要求進行分析,旨在幫助國內學者更好地理解與應用TRIPOD-SRMA報告規范,以期幫助提高國內此類系統評價/Meta分析的整體質量。
1 TRIPOD-SRMA制訂過程
首先成立由10位研究者組成的執行委員會,其中包括了來自TRIPOD工作組的成員[7];隨后召開第一次項目會議,會上執行委員會成員討論了開展預測模型系統評價的目的,并商定了TRIPOD-SRMA的適用范圍。在審查會議文件內容的基礎上,由2名委員會成員根據現有的相關報告規范(即TRIPOD[11]、TRIPOD-Cluster[12]和PRISMA[13,14])起草了TRIPOD-SRMA的初始清單。之后,執行委員會成員在兩次會議上對初始清單開展廣泛討論,并確定了擬納入的條目。隨后,開展了兩輪德爾菲調查以確定最終納入的條目。第一輪德爾菲小組由43名涉及預測模型研究領域的統計學家、臨床流行病學家、系統評價研究者和臨床醫生組成,基于5分制李克特量表評估了他們對納入條目的同意程度[15],并就每個條目要求他們留下評論意見。執行委員會召開線上會議對第一輪德爾菲調查結果開展了討論,將三分之二的參與者同意納入的條目視為一致同意并納入,對意見不一致條目進行了相應的更新和修訂;進而對修訂后的不一致條目開展第二輪德爾菲調查以討論其是否保留。最終確定了最終版TRIPOD-SRMA清單及其相應的摘要清單,并得到了執行委員會所有成員的認可。
2 TRIPOD-SRMA適用范圍
TRIPOD-SRMA適用于任何類型的個體預后與診斷多變量預測模型的系統評價/Meta分析[7]。它們應該具有以下目的:① 識別特定臨床專業內的所有預測模型;② 識別特定目標人群的所有預測模型;③ 識別特定結局的所有預測模型;④ 總結一個特定預測模型的預測性能;⑤ 總結和比較兩個或多個預測模型的預測性能[7]。應該注意的是,TRIPOD-SRMA不適用于關注特定因素的預后影響或變量與治療效應間交互作用的系統評價/Meta分析[16,17];也不適用于評估預測模型影響研究的系統評價,如評估在實踐中使用預測模型與不使用預測模型對下游結果影響的比較研究[18,19],因為它們更類似于干預性系統評價。此外,TRIPOD-SRMA也不適用于IPD-Meta分析,因為TRIPOD-Cluster規范已涵蓋這種情況[12]。
3 TRIPOD-SRMA條目解讀與實例
TRIPOD-SRMA全文清單分為標題、摘要、前言、方法、結果、討論和其他信息7個部分,共包含26個條目(34個子條目)(表1)。TRIPOD-SRMA摘要清單共12個條目(表2)。本研究以2021年發表在Pediatrics期刊上的“Prognostic models predicting mortality in preterm infants: systematic review and meta-analysis”研究[20]為例,在解釋條目的基礎上對例文進行分析,以幫助讀者更好地理解與應用TRIPOD-SRMA報告規范。


3.1 標題
條目1:明確報告該研究為預測模型系統評價/Meta分析,并具體說明與研究問題相關的目標人群和預測結局。
解讀:TRIPOD-SRMA要求作者應該明確報告他們的研究是系統評價或者是Meta分析,還是兩者兼有。標題應該盡可能詳盡,并包括相關術語,以便增加研究檢索和識別的敏感度,同時使讀者易于獲取到關鍵信息[21]。理想情況下,標題應該包含與預測模型相關的4個關鍵要素,即研究類型(開發/驗證)、臨床背景(診斷/預后)、目標人群和預測結局。
例文標題為“預測早產兒死亡率的預后模型:系統評價與Meta分析”[20],該標題提及系統評價與Meta分析,并且明確其研究的人群為早產兒(根據作者的研究目的,此處可進一步明確為“極早產兒”),臨床背景為預后,預測結局為死亡率。
3.2 摘要
條目2:見TRIPOD-SRMA摘要清單(表2),包括標題、目的、方法、結果、討論、資金和注冊。
解讀:摘要是一篇科研論文主要內容的概括性總結,因此,摘要應該盡可能地提供關鍵信息,確保讀者能夠了解系統評價的目標、開展過程和主要發現,從而幫助其決定是否需要進一步閱讀全文[22]。TRIPOD-SRMA提供了單獨的摘要報告清單,以期增加摘要報告的透明性。在目的部分,作者應該按照PICOTS原則[23](P:預測模型的目標人群,I:現有的預測模型,C:其他比較模型,O:預測結局,T:使用預測模型的時機與預后模型預測結果發生的時間范圍,S:預測模型應用場景)闡明系統評價的主要目的。在方法部分,應該總結檢索的信息來源、檢索時限以及任何限制,如語言或發表類型;說明多少名獨立的研究者根據什么標準選擇研究,描述數據提取過程中的評估方法以及用于綜合數據的方法。在結果部分,作者應該報告評估的主要結果,如果系統評價中包括Meta分析,還應該提供主要結局的效應量和置信區間。此外,還應該詳細描述這些分析中納入的研究和模型數量。局限性部分應該描述納入研究和系統評價中存在的主要局限性。同時,建議在摘要中報告注冊和資金信息。考慮到學術期刊通常對摘要字數存在限制,因此,系統評價作者實際應用時應該在符合期刊要求的條件下盡可能清晰地報告條目的每個要素[24]。
例文摘要在目的、信息來源、納入標準、偏倚風險評估方法、結果呈現、證據局限性、結果解釋等方面報告較完整,但卻沒有報告數據綜合的方法和資金及注冊方案信息。
3.3 前言
條目3:闡述已知背景下系統評價的理論基礎。
解讀:TRIPOD-SRMA要求作者在闡述個體預后與診斷多變量預測模型系統評價的研究背景時,應該說明開展該系統評價的潛在臨床意義及對現有知識的補充價值。
例文在背景部分詳細描述了目標研究問題的重要性,并說明了應用新的偏倚風險評估工具及更新檢索來填補現有系統評價中證據空白的必要性。
條目4:根據PICOTS原則對系統評價的問題進行清晰描述。
解讀:與開展干預性系統評價使用的PICOS原則類似,開展預測模型系統評價時應該使用PICOTS原則,這樣有助于清晰界定系統評價的研究問題,從而有助于作者實施系統評價中的其他步驟,并且能夠幫助讀者判斷研究結果對自己面臨的擬解決問題的適用性。
例文明確說明其研究目的是更新現有的預測早產兒死亡率的預后模型系統評價,并且在其補充材料的表格中明確描述其研究人群為極早產兒(即出生時胎齡小于32周或出生體重低于1 500克的新生兒),不限制預測模型的類型、預測結局、使用預測模型的時機、預測結果發生的時間范圍及其應用場景。
3.4 方法
條目5:明確定義作為合格標準的研究特征,包括任何特定感興趣的預測模型,以及納入的是開發或驗證研究(或兩者兼有)。
解讀:明確的納排標準有助于讀者判斷系統評價的有效性、適用性和全面性。TRIPOD-SRMA要求研究者應該明確說明和定義系統評價中使用的納排標準。因為其不僅會影響檢索策略的制定和篩選文獻的方法,還能幫助讀者判斷是否存在選擇偏倚[25]。
例文旨在納入預測極早產兒(即出生時胎齡小于32周或出生體重低于1 500克的新生兒)死亡率的所有預后模型,作者在使用文字描述的同時使用表格(原文表1[20])詳細呈現了系統評價的目的、預測模型的類型、預測模型的目標人群、預測結局、預測結果發生的時間范圍和使用預測模型的時機。
條目6:明確報告所有檢索或查詢的數據庫、注冊平臺、網站、組織機構、參考文獻清單或其他資源,以及每個資料來源最后檢索的日期。
解讀:TRIPOD-SRMA要求研究者詳細和全面地報告檢索的所有數據庫、注冊平臺、網站、組織機構、參考文獻清單或其他資源,以及每個檢索來源最后的檢索日期,以便保證系統評價結果的可再現性,并便于讀者評估其結果的完整性和時效性。
例文報告僅檢索了MEDLINE數據庫,檢索時限為2010年5月至2020年6月。
條目7:呈現所有數據庫、注冊平臺、網站的全部檢索策略,包括所使用的濾器和限定條件。
解讀:TRIPOD-SRMA要求作者呈現所有數據庫、注冊平臺、網站的全部檢索策略,以及所使用的濾器和限定條件。報告所有檢索策略細節不僅可以增強系統評價的透明性和提高可重復性,還有利于讀者通過檢索策略判斷檢索過程的全面性與準確性。
例文在補充材料中詳細描述了所使用數據庫的檢索策略的細節信息,包括檢索詞、檢索字段等。
條目8:明確篩選過程使用的方法,包括篩選的研究人員數量,是否獨立篩選。如果適用,應該詳細說明該過程中使用的自動化工具。
解讀:TRIPOD-SRMA要求作者詳細描述研究篩選的過程,以便能使讀者評估篩選過程中存在的潛在問題。系統評價中的研究選擇過程通常涉及多個階段,一般先根據標題和摘要篩選出潛在合格的研究,然后再閱讀全文以確定最終納入的研究。作者應該明確報告各個階段中的研究人員數量以及是否進行了獨立篩選。此外,由于人工智能與機器學習技術的快速發展,目前已有多種輔助研究篩選的自動化工具[26],使用了自動化工具的研究人員應該明確報告該信息。
例文明確報告由兩位研究者獨立閱讀了檢索獲取到的文章題目和摘要,并對可能符合納入標準的文獻閱讀了全文,以確定是否最終納入。此外,報告了篩選過程中的分歧是由第三位研究者解決。
條目9:明確數據提取使用的方法,包括提取數據的研究人員數量,是否獨立提取,任何向原文作者獲取或確認資料的過程。如果適用,應該詳細說明過程中使用的自動化工具。
解讀:TRIPOD-SRMA要求作者詳細報告數據提取使用的方法,包括是否聯系原文作者以獲取文章中未報告或報告不明確的信息、減少數據提取過程中偏差和錯誤的措施等。同時,應該明確數據提取人員數量和是否獨立提取,并且詳細說明過程中使用的自動化工具[27]。這樣可以幫助讀者重現數據提取和及時發現數據提取中可能存在的錯誤。
例文中清晰說明他們參考CHARMS清單[28]設計了數據提取表。數據提取過程由兩名研究者獨立完成,產生的分歧通過第三名研究者進行了仲裁決定。
條目10:10a列出并說明所有資料相關的條目;10b說明擬獲取的模型性能指標(如校準度、區分度、總體擬合度、臨床效用);10c描述需要但未報告的數據條目(條目10a、10b)的處理方法,如聯系原文作者獲取或根據報告的其他信息推斷。
解讀:條目10包括3個子條目,均是對數據資料的報告要求。TRIPOD-SRMA要求作者清晰地報告擬獲取的數據資料及處理缺失或模糊信息的方法,有助于讀者判斷這些數據條目的獲取是否合適以及該選擇過程是否存在偏倚。預測模型系統評價主要關注模型性能,模型性能指標是量化模型預測準確性和有效性的統計指標[7]。當擬獲取的數據條目存在缺失時,作者應該提供足夠詳細的處理細節,以便讀者可以重復研究者使用的方法,并評估其是否合適。
例文清晰說明提取的目標人群、候選預測因子、預測結局、模型開發和模型性能等方面的數據。但作者未報告處理數據缺失或模糊信息的方法。
條目11:詳細說明模型偏倚風險和適用性的評估方法,應該區分模型開發和驗證,包括所使用的任何工具的詳細信息、評價人員的數量及是否獨立評估。
解讀:偏倚風險的高低決定了預測模型的可靠性,而模型適用性反映了納入研究與系統評價擬解決問題之間的匹配程度,決定了模型是否可以直接應用解決目標臨床問題[29]。TRIPOD-SRMA要求作者詳細報告評估模型偏倚風險和適用性的具體工具、評價人員的數量及是否獨立評估,因為這有助于讀者判斷系統評價結果的可信度以及適用性。
例文報告其利用PROBAST工具[30]評估了納入研究的偏倚風險和適用性,并且詳細介紹了該工具的具體條目和判定標準。此外,作者報告偏倚風險評估過程由兩名研究者獨立完成,產生的分歧通過納入第三位研究者進行了解決。
條目12:12a描述對每個模型的性能指標進行綜合估計的任何方法。如果開展Meta分析,描述所使用的方法,包括匯總前的任何數據轉換、如何量化和處理模型性能中的任何異質性的方法及使用的統計軟件包;12b描述用于探索模型性能異質性的方法(如亞組分析、Meta回歸),包括是否預先制定;12c描述用于評估系統評價合并結果穩健性所開展的敏感性分析。
解讀:條目12包括3個子條目,是對系統評價中數據合成方法報告的要求。系統評價作者應該清晰地報告用于合成不同預測模型研究的統計分析方法,因為這樣有助于讀者判斷系統評價結果的可信度。尤其當開展Meta分析時,作者應該詳細報告所使用的統計軟件包及版本、統計模型等,因為不同的統計軟件包和(或)統計模型往往會導致合并結果存在差異,甚至得出完全相反的結果[31]。此外,作者還應該報告評估不同模型性能異質性的方法,因為異質性會影響是否能夠開展Meta分析。同時,作者應該清晰說明是否預先制定了用于評估合成結果穩健性的敏感性分析方法。
例文報告對在至少5項研究中出現外部驗證的預后模型采取隨機效應模型開展Meta分析。同時,使用I2量化模型性能的異質性,并且采用亞組分析探索異質性來源。此外,作者詳細描述了C統計量的缺失值或者極值的處理方法,并報告了統計分析中所使用的軟件(R 3.5.2軟件)。盡管作者在分析過程中剔除了一項結果異常的研究,但在方法學并未報告是否使用敏感性分析評估合成結果的穩健性。
條目13:描述用于評估預測模型證據質量的任何方法。
解讀:TRIPOD-SRMA要求作者詳細描述評估模型證據質量的方法。建議研究者在現有GRADE方法的基礎上,確定用于評估預測模型證據質量的具體方法,并在論文中清晰地報告具體的實施步驟[32]。
例文沒有描述評估模型證據質量的方法。
3.5 結果
條目14:描述檢索和篩選過程的結果,包括初檢獲取的文獻數量到最終納入的研究和模型數量,最好提供流程圖。
解讀:TRIPOD-SRMA要求作者清晰報告從不同來源(如數據庫、注冊平臺、參考文獻)獲取到的文獻數量,以便讀者判斷檢索結果是否存在引用或發表偏倚[24]。建議作者使用流程圖和文字詳細描述系統評價中文獻篩選的整個過程,報告包括初檢獲取到的文獻數量、去除重復的數量、根據題目和摘要排除的數量、無法獲取全文的數量、閱讀全文排除的數量及相應的排除原因。
例文使用文字詳細描述了檢索結果和篩選過程,并使用流程圖(原文圖1[20])展示了篩選過程,列出了排除研究的數量及排除的原因,但未提供全文篩選階段排除研究的清單。
條目15:呈現每個納入研究的特征和模型的細節(根據條目10),并提供引文。
解讀:TRIPOD-SRMA要求作者報告納入研究和模型的細節,這樣有助于讀者了解該系統評價納入研究和模型的特征,進而判斷系統評價結果的適用性。作者可以使用圖表的形式呈現單個研究或模型的主要特征,這有助于對納入研究或模型的特征進行比較和引用相應的參考文獻。
例文使用表格(原文表4[20])匯總了納入研究和模型的特征,并使用文字進行了描述。但其未提供單個研究和模型的特征,且沒有引用相應的參考文獻。
條目16:針對每個研究包含的模型開發和驗證,呈現偏倚風險和適用性評估的結果。
解讀:TRIPOD-SRMA強調模型開發和驗證是兩個單獨的階段,因此,建議作者應用圖表的形式分別呈現每個納入研究中模型開發和驗證部分的偏倚風險和適用性評估的結果。不僅應該給出偏倚風險和適用性評估的總體情況,還應該展示每個領域的具體評估結果及相應的判斷依據。
例文使用PROBAST工具評估了納入模型的偏倚風險和適用性,以圖的形式(原文圖3、圖4[20])呈現了評估結果的總體情況,并且區分模型開發和驗證階段。然而,作者未報告每個模型在PROBAST每個領域的評估結果及判斷依據。
條目17:呈現每個模型和所有評估性能的估計值與置信區間,包括它們是否與內部或外部驗證的性能相關。如果是內部驗證,應該詳細說明方法。
解讀:TRIPOD-SRMA要求作者應該詳細展示每個模型和所有評估性能的效應量及相應的置信區間,因為這樣有助于讀者根據這些結果評估單個模型結果的相對重要性,同時有助于開展其他分析和更新研究結果。內部驗證是開發新預測模型的一個必要步驟,作者應該提供自舉法、交叉驗證等具體內部驗證方法的細節。
例文以文字和森林圖的形式(原文圖5[20])呈現所有結局指標每個外部驗證模型性能的效應量及其95%可信區間。
條目18:18a呈現任何模型性能綜合的結果以及對效應估計產生貢獻的研究的詳細信息。如果開展了Meta分析,呈現每個模型和性能指標的合并效應量、精度(如置信/可信區間)及異質性檢驗結果,可以利用森林圖;18b呈現每個模型性能異質性可能來源的所有調查結果;18c呈現敏感性分析的結果,以便評估合并結果的穩健性。
解讀:條目18包括3個子條目,是對模型綜合結果報告的要求。TRIPOD-SRMA要求作者詳細報告所有模型性能統計匯總結果以及對合并效應量做出貢獻的研究細節,以便為衛生決策提供完整和無偏倚的證據。如果開展了Meta分析,應該報告異質性的評估結果,并對異質性的來源進行探索。同時作者應該清晰說明預先制定的所有亞組分析或敏感性分析的結果,從而避免選擇性報告偏倚。
例文以文字結合森林圖的形式(原文圖5[20])報告了Meta分析的結果,包括合并效應量及其95%可信區間,也描述了異質性檢驗的結果。同時,作者通過排除一項結果異常的研究和開展亞組分析來探索異質性顯著的原因。
條目19:呈現每個感興趣的預測模型證據質量的評估結果。
解讀:TRIPOD-SRMA要求作者明確報告每個模型證據質量的評估結果以及判斷依據。GRADE證據概要表是呈現證據質量的評估結果的一種有效和高效的方法,因此,作者應該使用該工具呈現證據質量的評價結果。
例文沒有評估預測模型的證據質量,也就沒有報告相應的結果。
3.6 討論
條目20:總結研究的主要發現,包括證據的優點和局限性。
解讀:TRIPOD-SRMA要求作者總結研究的主要發現,并描述現有證據的優點和局限性。這可以幫助讀者更好地理解研究結果,并評估其可靠性和適用性。
例文在討論部分總結了極早產兒死亡率預測模型的研究證據,認為有充足的現有研究能夠驗證結果。同時報告了納入的預測模型研究具有4個主要的局限性。
條目21:討論系統評價開展過程中的局限性。
解讀:TRIPOD-SRMA鼓勵作者討論研究過程中存在的可避免或不可避免的限制,這可以幫助讀者評估系統評價結果的可信度。
例文沒有討論其研究過程中是否存在局限性。
條目22:討論研究結果對實踐、政策以及未來研究的意義。
解讀:作者應該討論研究結果對臨床實踐、政策及未來相關研究的意義,要根據研究結果提出具有指導意義的實際建議,避免給出寬泛的建議。
例文認為由于缺乏驗證導致許多極早產兒預測模型在實踐應用中的價值尚不清楚。因此,作者認為未來的重點應是對現有預測模型的外部驗證和進一步調整,從而使得研究結果能夠適用于更廣泛的應用領域。但其沒有探討研究結果對政策的影響。
3.7 其他信息
條目23:23a提供注冊信息,包括注冊名稱、注冊號或聲明未進行注冊;23b提供研究方案的獲取途徑或聲明無研究方案;23c描述并解釋對注冊內容或研究方案中信息的任何修改。
解讀:TRIPOD-SRMA要求作者提供系統評價注冊的詳細信息,包括注冊平臺(如PROSPERO、INPLASY和Open Science Framework)[33]、注冊號或DOI號,這樣便于讀者通過比較預先制定的研究方案與系統評價的最終結果,進而判斷是否存在選擇性報告。作者可通過提供研究方案的引文、DOI號或鏈接使讀者更容易找到相關文件,從而減少尋找文件所花費的時間。鑒于研究者在研究開始時一般無法考慮到研究開展過程中可能遇到的所有情況,因此,如果對研究方案進行了修訂,作者應該詳細報告修改的信息及相應的理由以保證研究過程的透明性。此外,如果作者未準備研究方案或準備了但不愿意公開,這種情況也應該進行說明。
例文作者在“研究方案和全文的不同”部分報告了注冊平臺、注冊號并提供了引文。此外,作者報告了其全文和研究方案之間在納入標準和數據綜合方法方面存在的不同,并報告了相應的理由。
條目24:描述系統評價的資金來源及資金支持者在系統評價過程中所起的作用,或聲明無資金支持。
解讀:TRIPOD-SRMA要求作者報告系統評價的資金和非資金支持的來源以及資助者在系統評價中的作用,這有利于讀者評估不同類型的支持對系統評價結果的潛在影響。
例文明確報告了第一作者受到的資金來源,并且聲明該資助在研究設計、開展、分析、報告以及研究發表環節中均沒有發揮任何作用,同時報告其他作者沒有獲得外部的資金支持。
條目25:聲明系統評價作者的利益沖突。
解讀:研究的作者可能與某些對研究結果感興趣的組織或團體有合作關系(如作者可能為藥品開發公司或在審核的設備提供咨詢服務)[34],而這樣的關系或活動往往存在著利益沖突,會對系統評價結果的真實性和可信度產生不利影響,因此作者應該詳細如實地報告是否存在利益沖突以及所有處理利益沖突的方式。
例文聲明所有作者均沒有任何利益沖突。
條目26:報告以下哪些信息是公開的,并提供獲取途徑:數據提取表模板、納入研究的數據、用于分析的數據、數據分析代碼、系統評價中使用的其他資料。
解讀:TRIPOD-SRMA要求作者清晰報告數據、分析代碼和其他材料的共享,使讀者可以了解正文方法學部分以外的其他信息,有助于他們檢查是否存在錯誤,并重現研究結果。數據、分析代碼及其他材料可呈現在論文的附件或補充材料中,也可上傳至開放的公共數據庫,如Open Science Framework和Dryad[35]。如條件允許,應該盡量公開較為詳細的資料信息,但在某些特殊情況下,研究者可能無法自由共享資料,如研究團隊是數據的托管人而非持有者,或受到法律、許可限制,此時作者應該在條款和法律的允許下,盡可能地共享更多研究資料。
例文作者未提供數據提取表模板、納入研究的數據、用于分析的原始數據和數據分析代碼等信息。
4 小結
隨著數據科學和機器學習技術的快速發展,大量的生物醫學預測模型被開發出來用以指導臨床實踐與公共衛生決策[36]。近年來,預測模型系統評價/Meta分析論文數量顯著增加。然而,它們對關鍵的實施細節信息的報告往往存在明顯的缺失。盡管已有用于指導預測模型研究或系統評價/Meta分析報告的指南,如TRIPOD、PRISMA清單,但它們均缺少專門用于指導預測模型系統評價論文關鍵信息報告的要求。因此,相關學者制訂并于近期發表了TRIPOD-SRMA報告規范[7]。該規范作為第一個專門用于指導個體預后與診斷多變量預測模型系統評價/Meta分析研究報告的指南,其開發過程嚴格,但其尚存在一些需要注意的問題。例如,TRIPOD-SRMA清單涉及多個條目,而每個條目又涉及多個方面,但研究團隊目前尚未提供相應的解釋和說明文件,這增加了讀者使用該規范的難度。同時,鑒于國內中文期刊發表的預測模型系統評價/Meta分析的數量正在快速增加,因此,為了幫助國內相關研究者更好理解和應用該規范,本文對該規范的制訂過程、適用范圍和條目進行了介紹,并結合實例對條目要求進行了解讀。建議國內相關研究者參照TRIPOD-SRMA規范撰寫此類系統評價/Meta分析,從而提高相關研究報告的透明性和產生更多高質量的證據。同時建議國內相關學術期刊將TRIPOD-SRMA報告規范引入稿約,并在投稿指南中明確要求作者參照該規范報告研究結果,要求作者填寫TRIPOD-SRMA清單并上傳投稿系統,從而幫助期刊編輯和審稿專家評估研究報告的透明性和完整性。
預測模型是指利用多個預測因子估計患有(即診斷模型)或未來發生特定疾病或結局(即預后模型)風險的數學模型,它們對臨床實踐具有重要的指導意義[1]。目前,預測模型研究的數量正在急劇增加,并且越來越多地被應用于指導臨床實踐和公共衛生決策[2]。然而,不同預測模型的性能證據往往相互矛盾,這增加了選擇合適預測模型指導衛生決策的難度[3,4]。因此,有必要對針對同一臨床問題的預測模型開展系統評價,這對于驗證模型在不同目標人群、背景及地點的預測能力以及明確模型是否需要進一步調整或改進至關重要[5]。近年來發表的預測模型系統評價/Meta分析越來越多,但它們對關鍵信息的報告往往存在不足,這可能主要與缺少專門用于指導此類研究的報告規范有關[2,6]。
為了提高預測模型系統評價/Meta分析的報告質量,國外學者于2023年3月在BMJ發表了個體預后與診斷多變量預測模型系統評價/Meta分析(transparent reporting of multivariable prediction models for individual prognosis or diagnosis tailored for systematic reviews and meta-analyses,TRIPOD-SRMA)報告規范[7]。鑒于國內此類研究的數量正在快速增加[8-10],本文對該規范的制訂過程、適用范圍和條目進行介紹,并結合實例對條目要求進行分析,旨在幫助國內學者更好地理解與應用TRIPOD-SRMA報告規范,以期幫助提高國內此類系統評價/Meta分析的整體質量。
1 TRIPOD-SRMA制訂過程
首先成立由10位研究者組成的執行委員會,其中包括了來自TRIPOD工作組的成員[7];隨后召開第一次項目會議,會上執行委員會成員討論了開展預測模型系統評價的目的,并商定了TRIPOD-SRMA的適用范圍。在審查會議文件內容的基礎上,由2名委員會成員根據現有的相關報告規范(即TRIPOD[11]、TRIPOD-Cluster[12]和PRISMA[13,14])起草了TRIPOD-SRMA的初始清單。之后,執行委員會成員在兩次會議上對初始清單開展廣泛討論,并確定了擬納入的條目。隨后,開展了兩輪德爾菲調查以確定最終納入的條目。第一輪德爾菲小組由43名涉及預測模型研究領域的統計學家、臨床流行病學家、系統評價研究者和臨床醫生組成,基于5分制李克特量表評估了他們對納入條目的同意程度[15],并就每個條目要求他們留下評論意見。執行委員會召開線上會議對第一輪德爾菲調查結果開展了討論,將三分之二的參與者同意納入的條目視為一致同意并納入,對意見不一致條目進行了相應的更新和修訂;進而對修訂后的不一致條目開展第二輪德爾菲調查以討論其是否保留。最終確定了最終版TRIPOD-SRMA清單及其相應的摘要清單,并得到了執行委員會所有成員的認可。
2 TRIPOD-SRMA適用范圍
TRIPOD-SRMA適用于任何類型的個體預后與診斷多變量預測模型的系統評價/Meta分析[7]。它們應該具有以下目的:① 識別特定臨床專業內的所有預測模型;② 識別特定目標人群的所有預測模型;③ 識別特定結局的所有預測模型;④ 總結一個特定預測模型的預測性能;⑤ 總結和比較兩個或多個預測模型的預測性能[7]。應該注意的是,TRIPOD-SRMA不適用于關注特定因素的預后影響或變量與治療效應間交互作用的系統評價/Meta分析[16,17];也不適用于評估預測模型影響研究的系統評價,如評估在實踐中使用預測模型與不使用預測模型對下游結果影響的比較研究[18,19],因為它們更類似于干預性系統評價。此外,TRIPOD-SRMA也不適用于IPD-Meta分析,因為TRIPOD-Cluster規范已涵蓋這種情況[12]。
3 TRIPOD-SRMA條目解讀與實例
TRIPOD-SRMA全文清單分為標題、摘要、前言、方法、結果、討論和其他信息7個部分,共包含26個條目(34個子條目)(表1)。TRIPOD-SRMA摘要清單共12個條目(表2)。本研究以2021年發表在Pediatrics期刊上的“Prognostic models predicting mortality in preterm infants: systematic review and meta-analysis”研究[20]為例,在解釋條目的基礎上對例文進行分析,以幫助讀者更好地理解與應用TRIPOD-SRMA報告規范。


3.1 標題
條目1:明確報告該研究為預測模型系統評價/Meta分析,并具體說明與研究問題相關的目標人群和預測結局。
解讀:TRIPOD-SRMA要求作者應該明確報告他們的研究是系統評價或者是Meta分析,還是兩者兼有。標題應該盡可能詳盡,并包括相關術語,以便增加研究檢索和識別的敏感度,同時使讀者易于獲取到關鍵信息[21]。理想情況下,標題應該包含與預測模型相關的4個關鍵要素,即研究類型(開發/驗證)、臨床背景(診斷/預后)、目標人群和預測結局。
例文標題為“預測早產兒死亡率的預后模型:系統評價與Meta分析”[20],該標題提及系統評價與Meta分析,并且明確其研究的人群為早產兒(根據作者的研究目的,此處可進一步明確為“極早產兒”),臨床背景為預后,預測結局為死亡率。
3.2 摘要
條目2:見TRIPOD-SRMA摘要清單(表2),包括標題、目的、方法、結果、討論、資金和注冊。
解讀:摘要是一篇科研論文主要內容的概括性總結,因此,摘要應該盡可能地提供關鍵信息,確保讀者能夠了解系統評價的目標、開展過程和主要發現,從而幫助其決定是否需要進一步閱讀全文[22]。TRIPOD-SRMA提供了單獨的摘要報告清單,以期增加摘要報告的透明性。在目的部分,作者應該按照PICOTS原則[23](P:預測模型的目標人群,I:現有的預測模型,C:其他比較模型,O:預測結局,T:使用預測模型的時機與預后模型預測結果發生的時間范圍,S:預測模型應用場景)闡明系統評價的主要目的。在方法部分,應該總結檢索的信息來源、檢索時限以及任何限制,如語言或發表類型;說明多少名獨立的研究者根據什么標準選擇研究,描述數據提取過程中的評估方法以及用于綜合數據的方法。在結果部分,作者應該報告評估的主要結果,如果系統評價中包括Meta分析,還應該提供主要結局的效應量和置信區間。此外,還應該詳細描述這些分析中納入的研究和模型數量。局限性部分應該描述納入研究和系統評價中存在的主要局限性。同時,建議在摘要中報告注冊和資金信息。考慮到學術期刊通常對摘要字數存在限制,因此,系統評價作者實際應用時應該在符合期刊要求的條件下盡可能清晰地報告條目的每個要素[24]。
例文摘要在目的、信息來源、納入標準、偏倚風險評估方法、結果呈現、證據局限性、結果解釋等方面報告較完整,但卻沒有報告數據綜合的方法和資金及注冊方案信息。
3.3 前言
條目3:闡述已知背景下系統評價的理論基礎。
解讀:TRIPOD-SRMA要求作者在闡述個體預后與診斷多變量預測模型系統評價的研究背景時,應該說明開展該系統評價的潛在臨床意義及對現有知識的補充價值。
例文在背景部分詳細描述了目標研究問題的重要性,并說明了應用新的偏倚風險評估工具及更新檢索來填補現有系統評價中證據空白的必要性。
條目4:根據PICOTS原則對系統評價的問題進行清晰描述。
解讀:與開展干預性系統評價使用的PICOS原則類似,開展預測模型系統評價時應該使用PICOTS原則,這樣有助于清晰界定系統評價的研究問題,從而有助于作者實施系統評價中的其他步驟,并且能夠幫助讀者判斷研究結果對自己面臨的擬解決問題的適用性。
例文明確說明其研究目的是更新現有的預測早產兒死亡率的預后模型系統評價,并且在其補充材料的表格中明確描述其研究人群為極早產兒(即出生時胎齡小于32周或出生體重低于1 500克的新生兒),不限制預測模型的類型、預測結局、使用預測模型的時機、預測結果發生的時間范圍及其應用場景。
3.4 方法
條目5:明確定義作為合格標準的研究特征,包括任何特定感興趣的預測模型,以及納入的是開發或驗證研究(或兩者兼有)。
解讀:明確的納排標準有助于讀者判斷系統評價的有效性、適用性和全面性。TRIPOD-SRMA要求研究者應該明確說明和定義系統評價中使用的納排標準。因為其不僅會影響檢索策略的制定和篩選文獻的方法,還能幫助讀者判斷是否存在選擇偏倚[25]。
例文旨在納入預測極早產兒(即出生時胎齡小于32周或出生體重低于1 500克的新生兒)死亡率的所有預后模型,作者在使用文字描述的同時使用表格(原文表1[20])詳細呈現了系統評價的目的、預測模型的類型、預測模型的目標人群、預測結局、預測結果發生的時間范圍和使用預測模型的時機。
條目6:明確報告所有檢索或查詢的數據庫、注冊平臺、網站、組織機構、參考文獻清單或其他資源,以及每個資料來源最后檢索的日期。
解讀:TRIPOD-SRMA要求研究者詳細和全面地報告檢索的所有數據庫、注冊平臺、網站、組織機構、參考文獻清單或其他資源,以及每個檢索來源最后的檢索日期,以便保證系統評價結果的可再現性,并便于讀者評估其結果的完整性和時效性。
例文報告僅檢索了MEDLINE數據庫,檢索時限為2010年5月至2020年6月。
條目7:呈現所有數據庫、注冊平臺、網站的全部檢索策略,包括所使用的濾器和限定條件。
解讀:TRIPOD-SRMA要求作者呈現所有數據庫、注冊平臺、網站的全部檢索策略,以及所使用的濾器和限定條件。報告所有檢索策略細節不僅可以增強系統評價的透明性和提高可重復性,還有利于讀者通過檢索策略判斷檢索過程的全面性與準確性。
例文在補充材料中詳細描述了所使用數據庫的檢索策略的細節信息,包括檢索詞、檢索字段等。
條目8:明確篩選過程使用的方法,包括篩選的研究人員數量,是否獨立篩選。如果適用,應該詳細說明該過程中使用的自動化工具。
解讀:TRIPOD-SRMA要求作者詳細描述研究篩選的過程,以便能使讀者評估篩選過程中存在的潛在問題。系統評價中的研究選擇過程通常涉及多個階段,一般先根據標題和摘要篩選出潛在合格的研究,然后再閱讀全文以確定最終納入的研究。作者應該明確報告各個階段中的研究人員數量以及是否進行了獨立篩選。此外,由于人工智能與機器學習技術的快速發展,目前已有多種輔助研究篩選的自動化工具[26],使用了自動化工具的研究人員應該明確報告該信息。
例文明確報告由兩位研究者獨立閱讀了檢索獲取到的文章題目和摘要,并對可能符合納入標準的文獻閱讀了全文,以確定是否最終納入。此外,報告了篩選過程中的分歧是由第三位研究者解決。
條目9:明確數據提取使用的方法,包括提取數據的研究人員數量,是否獨立提取,任何向原文作者獲取或確認資料的過程。如果適用,應該詳細說明過程中使用的自動化工具。
解讀:TRIPOD-SRMA要求作者詳細報告數據提取使用的方法,包括是否聯系原文作者以獲取文章中未報告或報告不明確的信息、減少數據提取過程中偏差和錯誤的措施等。同時,應該明確數據提取人員數量和是否獨立提取,并且詳細說明過程中使用的自動化工具[27]。這樣可以幫助讀者重現數據提取和及時發現數據提取中可能存在的錯誤。
例文中清晰說明他們參考CHARMS清單[28]設計了數據提取表。數據提取過程由兩名研究者獨立完成,產生的分歧通過第三名研究者進行了仲裁決定。
條目10:10a列出并說明所有資料相關的條目;10b說明擬獲取的模型性能指標(如校準度、區分度、總體擬合度、臨床效用);10c描述需要但未報告的數據條目(條目10a、10b)的處理方法,如聯系原文作者獲取或根據報告的其他信息推斷。
解讀:條目10包括3個子條目,均是對數據資料的報告要求。TRIPOD-SRMA要求作者清晰地報告擬獲取的數據資料及處理缺失或模糊信息的方法,有助于讀者判斷這些數據條目的獲取是否合適以及該選擇過程是否存在偏倚。預測模型系統評價主要關注模型性能,模型性能指標是量化模型預測準確性和有效性的統計指標[7]。當擬獲取的數據條目存在缺失時,作者應該提供足夠詳細的處理細節,以便讀者可以重復研究者使用的方法,并評估其是否合適。
例文清晰說明提取的目標人群、候選預測因子、預測結局、模型開發和模型性能等方面的數據。但作者未報告處理數據缺失或模糊信息的方法。
條目11:詳細說明模型偏倚風險和適用性的評估方法,應該區分模型開發和驗證,包括所使用的任何工具的詳細信息、評價人員的數量及是否獨立評估。
解讀:偏倚風險的高低決定了預測模型的可靠性,而模型適用性反映了納入研究與系統評價擬解決問題之間的匹配程度,決定了模型是否可以直接應用解決目標臨床問題[29]。TRIPOD-SRMA要求作者詳細報告評估模型偏倚風險和適用性的具體工具、評價人員的數量及是否獨立評估,因為這有助于讀者判斷系統評價結果的可信度以及適用性。
例文報告其利用PROBAST工具[30]評估了納入研究的偏倚風險和適用性,并且詳細介紹了該工具的具體條目和判定標準。此外,作者報告偏倚風險評估過程由兩名研究者獨立完成,產生的分歧通過納入第三位研究者進行了解決。
條目12:12a描述對每個模型的性能指標進行綜合估計的任何方法。如果開展Meta分析,描述所使用的方法,包括匯總前的任何數據轉換、如何量化和處理模型性能中的任何異質性的方法及使用的統計軟件包;12b描述用于探索模型性能異質性的方法(如亞組分析、Meta回歸),包括是否預先制定;12c描述用于評估系統評價合并結果穩健性所開展的敏感性分析。
解讀:條目12包括3個子條目,是對系統評價中數據合成方法報告的要求。系統評價作者應該清晰地報告用于合成不同預測模型研究的統計分析方法,因為這樣有助于讀者判斷系統評價結果的可信度。尤其當開展Meta分析時,作者應該詳細報告所使用的統計軟件包及版本、統計模型等,因為不同的統計軟件包和(或)統計模型往往會導致合并結果存在差異,甚至得出完全相反的結果[31]。此外,作者還應該報告評估不同模型性能異質性的方法,因為異質性會影響是否能夠開展Meta分析。同時,作者應該清晰說明是否預先制定了用于評估合成結果穩健性的敏感性分析方法。
例文報告對在至少5項研究中出現外部驗證的預后模型采取隨機效應模型開展Meta分析。同時,使用I2量化模型性能的異質性,并且采用亞組分析探索異質性來源。此外,作者詳細描述了C統計量的缺失值或者極值的處理方法,并報告了統計分析中所使用的軟件(R 3.5.2軟件)。盡管作者在分析過程中剔除了一項結果異常的研究,但在方法學并未報告是否使用敏感性分析評估合成結果的穩健性。
條目13:描述用于評估預測模型證據質量的任何方法。
解讀:TRIPOD-SRMA要求作者詳細描述評估模型證據質量的方法。建議研究者在現有GRADE方法的基礎上,確定用于評估預測模型證據質量的具體方法,并在論文中清晰地報告具體的實施步驟[32]。
例文沒有描述評估模型證據質量的方法。
3.5 結果
條目14:描述檢索和篩選過程的結果,包括初檢獲取的文獻數量到最終納入的研究和模型數量,最好提供流程圖。
解讀:TRIPOD-SRMA要求作者清晰報告從不同來源(如數據庫、注冊平臺、參考文獻)獲取到的文獻數量,以便讀者判斷檢索結果是否存在引用或發表偏倚[24]。建議作者使用流程圖和文字詳細描述系統評價中文獻篩選的整個過程,報告包括初檢獲取到的文獻數量、去除重復的數量、根據題目和摘要排除的數量、無法獲取全文的數量、閱讀全文排除的數量及相應的排除原因。
例文使用文字詳細描述了檢索結果和篩選過程,并使用流程圖(原文圖1[20])展示了篩選過程,列出了排除研究的數量及排除的原因,但未提供全文篩選階段排除研究的清單。
條目15:呈現每個納入研究的特征和模型的細節(根據條目10),并提供引文。
解讀:TRIPOD-SRMA要求作者報告納入研究和模型的細節,這樣有助于讀者了解該系統評價納入研究和模型的特征,進而判斷系統評價結果的適用性。作者可以使用圖表的形式呈現單個研究或模型的主要特征,這有助于對納入研究或模型的特征進行比較和引用相應的參考文獻。
例文使用表格(原文表4[20])匯總了納入研究和模型的特征,并使用文字進行了描述。但其未提供單個研究和模型的特征,且沒有引用相應的參考文獻。
條目16:針對每個研究包含的模型開發和驗證,呈現偏倚風險和適用性評估的結果。
解讀:TRIPOD-SRMA強調模型開發和驗證是兩個單獨的階段,因此,建議作者應用圖表的形式分別呈現每個納入研究中模型開發和驗證部分的偏倚風險和適用性評估的結果。不僅應該給出偏倚風險和適用性評估的總體情況,還應該展示每個領域的具體評估結果及相應的判斷依據。
例文使用PROBAST工具評估了納入模型的偏倚風險和適用性,以圖的形式(原文圖3、圖4[20])呈現了評估結果的總體情況,并且區分模型開發和驗證階段。然而,作者未報告每個模型在PROBAST每個領域的評估結果及判斷依據。
條目17:呈現每個模型和所有評估性能的估計值與置信區間,包括它們是否與內部或外部驗證的性能相關。如果是內部驗證,應該詳細說明方法。
解讀:TRIPOD-SRMA要求作者應該詳細展示每個模型和所有評估性能的效應量及相應的置信區間,因為這樣有助于讀者根據這些結果評估單個模型結果的相對重要性,同時有助于開展其他分析和更新研究結果。內部驗證是開發新預測模型的一個必要步驟,作者應該提供自舉法、交叉驗證等具體內部驗證方法的細節。
例文以文字和森林圖的形式(原文圖5[20])呈現所有結局指標每個外部驗證模型性能的效應量及其95%可信區間。
條目18:18a呈現任何模型性能綜合的結果以及對效應估計產生貢獻的研究的詳細信息。如果開展了Meta分析,呈現每個模型和性能指標的合并效應量、精度(如置信/可信區間)及異質性檢驗結果,可以利用森林圖;18b呈現每個模型性能異質性可能來源的所有調查結果;18c呈現敏感性分析的結果,以便評估合并結果的穩健性。
解讀:條目18包括3個子條目,是對模型綜合結果報告的要求。TRIPOD-SRMA要求作者詳細報告所有模型性能統計匯總結果以及對合并效應量做出貢獻的研究細節,以便為衛生決策提供完整和無偏倚的證據。如果開展了Meta分析,應該報告異質性的評估結果,并對異質性的來源進行探索。同時作者應該清晰說明預先制定的所有亞組分析或敏感性分析的結果,從而避免選擇性報告偏倚。
例文以文字結合森林圖的形式(原文圖5[20])報告了Meta分析的結果,包括合并效應量及其95%可信區間,也描述了異質性檢驗的結果。同時,作者通過排除一項結果異常的研究和開展亞組分析來探索異質性顯著的原因。
條目19:呈現每個感興趣的預測模型證據質量的評估結果。
解讀:TRIPOD-SRMA要求作者明確報告每個模型證據質量的評估結果以及判斷依據。GRADE證據概要表是呈現證據質量的評估結果的一種有效和高效的方法,因此,作者應該使用該工具呈現證據質量的評價結果。
例文沒有評估預測模型的證據質量,也就沒有報告相應的結果。
3.6 討論
條目20:總結研究的主要發現,包括證據的優點和局限性。
解讀:TRIPOD-SRMA要求作者總結研究的主要發現,并描述現有證據的優點和局限性。這可以幫助讀者更好地理解研究結果,并評估其可靠性和適用性。
例文在討論部分總結了極早產兒死亡率預測模型的研究證據,認為有充足的現有研究能夠驗證結果。同時報告了納入的預測模型研究具有4個主要的局限性。
條目21:討論系統評價開展過程中的局限性。
解讀:TRIPOD-SRMA鼓勵作者討論研究過程中存在的可避免或不可避免的限制,這可以幫助讀者評估系統評價結果的可信度。
例文沒有討論其研究過程中是否存在局限性。
條目22:討論研究結果對實踐、政策以及未來研究的意義。
解讀:作者應該討論研究結果對臨床實踐、政策及未來相關研究的意義,要根據研究結果提出具有指導意義的實際建議,避免給出寬泛的建議。
例文認為由于缺乏驗證導致許多極早產兒預測模型在實踐應用中的價值尚不清楚。因此,作者認為未來的重點應是對現有預測模型的外部驗證和進一步調整,從而使得研究結果能夠適用于更廣泛的應用領域。但其沒有探討研究結果對政策的影響。
3.7 其他信息
條目23:23a提供注冊信息,包括注冊名稱、注冊號或聲明未進行注冊;23b提供研究方案的獲取途徑或聲明無研究方案;23c描述并解釋對注冊內容或研究方案中信息的任何修改。
解讀:TRIPOD-SRMA要求作者提供系統評價注冊的詳細信息,包括注冊平臺(如PROSPERO、INPLASY和Open Science Framework)[33]、注冊號或DOI號,這樣便于讀者通過比較預先制定的研究方案與系統評價的最終結果,進而判斷是否存在選擇性報告。作者可通過提供研究方案的引文、DOI號或鏈接使讀者更容易找到相關文件,從而減少尋找文件所花費的時間。鑒于研究者在研究開始時一般無法考慮到研究開展過程中可能遇到的所有情況,因此,如果對研究方案進行了修訂,作者應該詳細報告修改的信息及相應的理由以保證研究過程的透明性。此外,如果作者未準備研究方案或準備了但不愿意公開,這種情況也應該進行說明。
例文作者在“研究方案和全文的不同”部分報告了注冊平臺、注冊號并提供了引文。此外,作者報告了其全文和研究方案之間在納入標準和數據綜合方法方面存在的不同,并報告了相應的理由。
條目24:描述系統評價的資金來源及資金支持者在系統評價過程中所起的作用,或聲明無資金支持。
解讀:TRIPOD-SRMA要求作者報告系統評價的資金和非資金支持的來源以及資助者在系統評價中的作用,這有利于讀者評估不同類型的支持對系統評價結果的潛在影響。
例文明確報告了第一作者受到的資金來源,并且聲明該資助在研究設計、開展、分析、報告以及研究發表環節中均沒有發揮任何作用,同時報告其他作者沒有獲得外部的資金支持。
條目25:聲明系統評價作者的利益沖突。
解讀:研究的作者可能與某些對研究結果感興趣的組織或團體有合作關系(如作者可能為藥品開發公司或在審核的設備提供咨詢服務)[34],而這樣的關系或活動往往存在著利益沖突,會對系統評價結果的真實性和可信度產生不利影響,因此作者應該詳細如實地報告是否存在利益沖突以及所有處理利益沖突的方式。
例文聲明所有作者均沒有任何利益沖突。
條目26:報告以下哪些信息是公開的,并提供獲取途徑:數據提取表模板、納入研究的數據、用于分析的數據、數據分析代碼、系統評價中使用的其他資料。
解讀:TRIPOD-SRMA要求作者清晰報告數據、分析代碼和其他材料的共享,使讀者可以了解正文方法學部分以外的其他信息,有助于他們檢查是否存在錯誤,并重現研究結果。數據、分析代碼及其他材料可呈現在論文的附件或補充材料中,也可上傳至開放的公共數據庫,如Open Science Framework和Dryad[35]。如條件允許,應該盡量公開較為詳細的資料信息,但在某些特殊情況下,研究者可能無法自由共享資料,如研究團隊是數據的托管人而非持有者,或受到法律、許可限制,此時作者應該在條款和法律的允許下,盡可能地共享更多研究資料。
例文作者未提供數據提取表模板、納入研究的數據、用于分析的原始數據和數據分析代碼等信息。
4 小結
隨著數據科學和機器學習技術的快速發展,大量的生物醫學預測模型被開發出來用以指導臨床實踐與公共衛生決策[36]。近年來,預測模型系統評價/Meta分析論文數量顯著增加。然而,它們對關鍵的實施細節信息的報告往往存在明顯的缺失。盡管已有用于指導預測模型研究或系統評價/Meta分析報告的指南,如TRIPOD、PRISMA清單,但它們均缺少專門用于指導預測模型系統評價論文關鍵信息報告的要求。因此,相關學者制訂并于近期發表了TRIPOD-SRMA報告規范[7]。該規范作為第一個專門用于指導個體預后與診斷多變量預測模型系統評價/Meta分析研究報告的指南,其開發過程嚴格,但其尚存在一些需要注意的問題。例如,TRIPOD-SRMA清單涉及多個條目,而每個條目又涉及多個方面,但研究團隊目前尚未提供相應的解釋和說明文件,這增加了讀者使用該規范的難度。同時,鑒于國內中文期刊發表的預測模型系統評價/Meta分析的數量正在快速增加,因此,為了幫助國內相關研究者更好理解和應用該規范,本文對該規范的制訂過程、適用范圍和條目進行了介紹,并結合實例對條目要求進行了解讀。建議國內相關研究者參照TRIPOD-SRMA規范撰寫此類系統評價/Meta分析,從而提高相關研究報告的透明性和產生更多高質量的證據。同時建議國內相關學術期刊將TRIPOD-SRMA報告規范引入稿約,并在投稿指南中明確要求作者參照該規范報告研究結果,要求作者填寫TRIPOD-SRMA清單并上傳投稿系統,從而幫助期刊編輯和審稿專家評估研究報告的透明性和完整性。