證據綜合即圍繞特定研究問題,運用規范、明確、嚴謹的方法將現有研究數據、信息、知識匯集合并,為相關醫療衛生決策提供依據。目前證據綜合方法種類較多,相關應用研究數量激增,然而不同綜合方法之間容易混淆,進而造成誤用與濫用等問題。選擇不當的證據綜合方法會降低證據的可信度及其適用性,理清證據綜合方法選擇的路徑和環節對于規范開展循證評價具有積極推動作用。為此,本文先簡述證據綜合方法的發展概況與分類,梳理了醫學領域中系統評價等18種具有代表性的證據綜合方法及其應用示例。重點介紹了近年研發且已投入使用的證據綜合方法選擇工具“Right Review”,并討論了這些選擇工具及方法存在的局限性。同時參考已有的工具、理論、模型,擬定了一套證據綜合方法選擇路徑,提出了證據綜合開展的決策流程,以期為研究者合理選擇證據綜合方法提供參考。
版權信息: ?四川大學華西醫院華西期刊社《中國循證醫學雜志》版權所有,未經授權不得轉載、改編
證據綜合又稱為證據合成,是圍繞特定研究問題,運用規范、明確、嚴謹的方法將現有研究結果、知識和/或信息匯集合并,綜合相關已知內容,闡明尚待開發的未知領域[1],為臨床實踐、個人決策和政策制定提供依據[2]。當前是飛速發展的信息時代,各研究領域涌現出海量的數據和信息。面對繁雜多元、質量參差不齊的證據,決策者難以直接進行篩選、分析和判斷,因此對于高質量、多元化的證據綜合需求不斷增多,大量證據綜合方法及研究報告應運而生[3]。然而,日新月異的證據綜合方法以及各方法之間存在的相似或共同特征,令研究者容易混淆不同方法的適用情況。尤其給初學者選擇恰當的證據綜合方法造成困惑,從而產生重復、冗余和低質量的綜合證據[4]。因此需要進一步的指導來幫助研究者選擇合適、恰當的證據綜合方法,以提供更加準確、可靠的證據支持。為此,本文歸納了證據綜合方法的發展概況、類型及輔助決策工具,梳理總結醫學領域實際應用中具有代表性的證據綜合方法以及目前已有的決策工具,闡明其優勢與缺陷,同時參考現有的理論、工具、模型繪制新的證據綜合選擇路徑,旨在為研究人員選擇適宜證據綜合方法提供參考。
1 證據綜合方法的發展概況
在開展原始研究之前,對現有知識或證據進行綜合與評價能夠幫助研究者發現研究空白、提高研究質量和效率。證據綜合的理念在200年前已經產生[5],綜述是證據綜合的重要手段,然而囿于方法學與信息資源的限制,早期的傳統綜述通常不系統,缺乏科學的綜合方法,難以從現有信息中得出真實、可靠的結論。為了改變這一現狀,證據綜合及其方法的研究與開發日益受到重視。18世紀中期蘇格蘭航海外科醫生James Lind在發表第一個壞血病臨床試驗研究[6]之后,還強調了全面綜合已有的壞血病相關研究證據并對其進行客觀評價以減少偏倚的重要性[7],即搜集、綜合和評估相關研究主題證據,也就是證據綜合的重要性,此時已經可以看到系統性證據綜合方法的雛形。
近三十年來,證據綜合方法及其應用快速發展[5],系統評價(SR)是最早發展也是至今最重要的系統性證據綜合方法之一,它的出現令證據綜合有了跨越式的進步,其概念是在20世紀80年代由Archie Cochrane首次正式提出[8]。系統評價通過全面、系統檢索某一主題所有相關研究,按照納排標準進行篩選,經客觀評價、科學分析納入的研究,得出更加可靠的結論。隨著大量、多元化證據的涌現,單一的系統評價已難以滿足人們對證據綜合的需求。快速綜述、概況性綜述、系統評價再評價、動態系統評價等證據綜合方法層出不窮。1997年Best等[9]首次描述了一種快速證據綜合方法,并用于開展衛生技術評估項目,2008年快速綜述(RR)的概念被正式提出[10]。2000年系統評價再評價的概念被正式提出[11],用于開展針對系統評價的綜合、評價工作,并首次對精神分裂癥的藥物治療、普通感冒相關預防措施以及與戒煙有關的系統評價進行了再評價。2005年,Arksey首次提出概況性綜述的概念并制定了其基本研究框架[12],彌補了系統評價在研究廣度方面的不足。2014年Elliott提出動態系統評價(LSR)的概念[13],不同于傳統系統評價的一次性完成,LSR是定期對原始研究進行更新檢索和分析以反映新出現的證據,可促進該領域研究數據的即時整合分析。同年,Joanna Briggs研究所(JBI)混合方法研究系統評價(MMSRs)方法學組制訂了MMSRs指南,推動了MMSRs的發展,并于2020年發布更新的報告規范[14]。附件圖1為證據綜合方法發展歷史的時間軸。
目前,證據綜合研究仍處于高速發展階段,以醫學領域廣泛使用的SR為例,2019年在PubMed中檢索到的SR發表數量為平均每天約80篇[15],相比2010年增長了5.8倍,較2000年增長了20倍[5]。證據綜合方法及研究應用的不斷發展,促進了相關組織的建立與雜志的創辦。1993年,Cochrane協作網在英國牛津正式成立,旨在為臨床醫療實踐和醫療衛生決策提供綜合證據支持。自此,國際上先后建立了Campbell協作網、研究綜合方法協會(SRSM)等組織,這些組織致力于綜合不同主題領域的研究證據,為多元決策提供有力的證據支撐。此外,在SRSM的支持下,2010年創立Research Synthesis Methods雜志,旨在促進有關證據綜合方法的開發、設計、應用與傳播。2020年JBI Evidence Synthesis創刊,聚焦于醫療衛生領域的證據綜合方法創新和應用。針對系統評價也創立了專門的數據庫和期刊,如The Cochrane database of systematic reviews以及Systematic Review等,旨在推動高質量系統評價的注冊、實施、報告與發表。附件圖2為證據綜合領域的重要事件。
隨著證據綜合方法的發展,其相應的實施、報告規范和方法學質量評價工具也在持續更新完善。例如,1999年David Moher提出了QUOROM聲明,旨在提高隨機對照試驗系統評價的報告質量[16],2009年Moher等對該聲明進行更新,并將其更名為PRISMA[17],多個國際重要醫學期刊同步發表了該聲明[18]。目前國際上Cochrane協作網、科學編輯委員會等組織機構和近二百家期刊簽約使用PRISMA聲明[19]。該聲明仍在不斷更新拓展[20],例如2022年發布的中醫藥領域動物實驗系統評價報告規范PRISMA-ATCM[21],2024年發布的動態系統評價報告規范PRISMA-LSR[22]。關于系統評價的方法學質量評價工具有AMSTAR[23]、OQAQ[24]和SQAC[25]等,其中最為廣泛使用的是AMSTAR,AMSTAR于2007年發布,2017年進行了更新調整,用于評估系統評價的方法學質量[26]。不僅是系統評價的評價工具受到關注,其他證據綜合方法亦是如此。例如2010年Danielle等[27]提出了概況性綜述的實施規范,2018年Andrea等[28]制訂了概況性綜述的報告規范,即PRISMA概況性綜述擴展聲明(PRISMA-ScR)。EQUATOR網站上整理收錄了諸多證據綜合方法的報告規范,研究者開展證據綜合時可在該網站進行查詢獲取。遵循報告規范能夠提高證據綜合的質量與透明度,增強結論的可信度。當前,一些證據綜合方法的實施、報告規范仍待研發,例如證據圖譜的報告規范目前還在制作中[29]。
經過質量評價后的綜合證據如何幫助達成推薦意見、形成臨床實踐指南指導臨床決策呢?2004年,推薦分級的評估、制訂與評價(GRADE)工作組建立并發表證據質量和推薦強度進行分級的系統工具[30],給出了解決方案。在系統評價中應用GRADE工具可以評價證據質量級別,并在結果總結表和證據概要表中列出證據升降級的原因,有助于系統評價使用者對證據的準確理解和正確應用,從而形成推薦意見[31]。2009年,挪威Vandvik教授和加拿大Guyatt教授在GRADE工具的基礎上,進一步拓展深入,建立了一套快速制訂與傳播高質量臨床推薦意見的方法學系統—MAGIC,并形成了證據從生產、轉化到使用傳播的完整閉環,構建了數字化和可信的證據生態系統,推動臨床實踐指南的快速制訂與傳播推廣[32]。
證據綜合方法以及其相應組織、標準規范、應用轉化方式的涌現,促進了對“證據綜合”進一步的詮釋與理解。2018年,英國皇家學會和醫學科學院定義“證據綜合”為將來自各種來源和學科的信息匯集在一起為有關特定問題的辯論和決策提供證據支持的過程,并提出包容、嚴謹、透明、可訪問的證據綜合原則[33]。2020年,證據綜合國際網(ESI)發布了立場聲明,將“證據綜合”定義為使用系統和明確的方法綜合現有研究中的已知內容以闡明當前證據基礎,并提出了開展證據綜合工作的5個主要目標與9項核心原則,強調了嚴謹、透明的研究范式與科學的證據綜合方法等內容的重要性[1]。康奈爾大學圖書館于2016年推出的系統綜述服務,也隨著證據綜合方法的發展在2020年初更名為證據綜合服務,增添了快速綜述、系統評價再評價、概況性綜述、證據圖譜等證據綜合方法[34]。近年來,可穿戴設備、數據挖掘和機器學習以及智能AI的發展為證據分析、綜合造成新的機遇與挑戰,2023年Subbiah在Nature Medicine發文提及深度循證醫學理念,提出目前的循證醫學金字塔只是冰山一角,需要挖掘現有數據,對其進行深入的綜合與合并,以實現深度循證醫學[35]。可見為了更好地挖掘、運用轉化海量證據,證據綜合方法的更新、優化、迭代發展任重道遠。
2 醫學領域代表性的證據綜合方法
本團隊檢索醫學領域有關總結證據綜合方法現狀的文章,參考Grant[3]、Sutton[36]以及蘭州大學陳耀龍教授團隊[37]遴選的具有代表性的證據綜合方法,整理了醫學領域中18種代表性的證據綜合方法(附件表1)。
在實際應用中,可根據研究主題、具體需求和現有條件進行證據綜合方法的選擇。這些證據綜合方法可以單獨使用,也可聯合使用。系統評價通常結合Meta分析進行定量綜合。不同證據綜合方法的具體應用例如,Riazi等[51]開展了全球非酒精性脂肪性肝病(NAFLD)患病率和發病率的系統評價和Meta分析。Zhang等[52]為探討針灸治療癌癥患者失眠有效性和安全性而進行的系統評價和Meta分析。Lasa等[53]開展了生物制劑和小分子藥物對中重度潰瘍性結腸炎患者有效性和安全性的網狀Meta分析。Truong等[54]開展了概況性綜述研究用于分析運動相關膝關節損傷后恢復階段的心理、社會和背景因素情況。戴澤琦等[55]對耳鼻喉科口服中成藥的臨床證據進行了概況性綜述。Poland等[56]為應對猴痘疫情蔓延,開展了疫苗預防猴痘的快速綜述。Wang等[57]對治療COVID-19的中醫藥“三藥三方”(三藥:金花清感、連花清瘟、血必凈;三方:清肺排毒湯、化濕敗毒方、宣肺敗毒方)進行了快速系統評價和Meta分析。Gao等[58]綜合中醫藥治療糖尿病腎病的臨床證據,開展了證據圖譜。Karlsson等[59]針對運動療法對急性腰痛患者的有效性進行了系統評價再評價。Michelen等[60]針對長新冠(long COVID)的特征,開展了動態系統評價。
Moffat等[61]進行了一項混合方法研究綜述,探討了實踐中招募隨機對照試驗參與者的相關影響因素。Luiking等[62]以元民族志綜合探討了有關移民者的醫療衛生保健經歷。McHugh等[63]開展了一項加拿大土著青年參加體育和娛樂活動經歷的定性研究的元研究。Taqueti等[64]針對冠狀動脈微血管疾病的致病機制和治療選擇開展了前沿綜述。Rew等[65]對用于跨性別和性別多元化青年的青春期阻斷劑進行了批判性綜述。Ellis等[66]開展了自閉癥成人患者自閉癥健康護照(AHPs)的現實主義評論。Andrews等[67]進行了一項扎根理論研究探討護士自我照護和自我關懷的情況。Carton等[68]開展了框架綜合探討了新生兒監護病房(NCU)入院對照料者與嬰兒關系的影響。Reid等[69]針對接受血液透析的患者經歷,開展了一項主題綜合。Aragon等[70]通過敘述性綜述探討了歇性禁食模式及其對體重和身體健康的影響。
3 證據綜合方法的分類
目前,證據綜合方法豐富繁雜,其分類方法也存在多樣性,尚無統一的分類方法。不同的組織和研究者采取的分類方法不盡相同,常用的分類方法有以下四種,見附件圖3。
3.1 JBI分類
澳大利亞JBI循證衛生保健研究中心2005年將“證據綜合”概括為“理論”“方法學”和“系統評價”三部分[71],但此三者并非并列關系,理論和方法學是系統評價的支撐內容。2019年更新后的JBI模式將證據綜合概括歸納為系統評價、證據總結以及臨床實踐指南三部分[72]。其中,系統評價是證據綜合領域的關鍵方法,它不僅包含定量和定性研究,還涵蓋了干預性、診斷性、經濟性等不同類型的研究,以及系統評價再評價等。證據總結的形式則更加靈活寬泛,可以是小規模證據摘要或快速綜述。臨床實踐指南在證據綜合的基礎上包括了醫療實踐可行性、適宜性等方面的考量,此二者彌補了系統評價針對特定問題進行證據綜合的局限性[73]。
3.2 根據證據是否進行轉化分類
證據綜合是將已有研究證據進行合并匯總,根據證據是否進行轉化分為單純合成證據與轉化研究證據兩類[74]。單純合成證據即二次研究證據,是指研究者對原始研究證據中的數據信息進行合并、分析(如系統評價、Meta分析),也包括對系統評價/Meta分析的再評價和分析(如系統評價再評價)。轉化研究證據則是在對原始研究和二次研究證據進行合成的基礎上,將合成的證據綜合轉化為可供證據使用者作為決策依據的證據信息,例如證據圖、概況性綜述、衛生技術評估、臨床實踐指南等。
3.3 根據納入研究的數據類型分類
根據納入研究的數據類型,可將證據綜合方法分為定量、定性和混合方法三類。其中,定性綜合方法包括元民族志、元研究、扎根理論和主題綜合等,關注定性研究以及理論的挖掘、延伸和合成。定量綜合方法致力于對量化數據的合并分析,包括Meta分析和最佳證據綜合等。混合綜合方法兼顧定性與定量兩種研究數據類型,包括混合方法研究系統評價等[75]。
3.4 根據證據綜合目的分類
根據證據綜合的目的,可將證據綜合方法分為描述性、檢驗性、擴展性和批判性四類[76]。這四類方法可以單獨使用,亦可混合使用。其中,描述性證據綜合方法旨在對特定研究問題、主題相關文獻證據的描述總結,包括敘述性綜述、文本敘述綜合、元敘述以及概況性綜述等。檢驗性證據綜合方法聚焦于回答研究問題或驗證特定假設,包括現實主義評論、Meta分析、貝葉斯Meta分析等。擴展性證據綜合方法主要關注在已有證據基礎上構建新的理論,包括元民族志、元闡釋、元研究、框架綜合和主題綜合等。批判性證據綜合方法則是將一組證據與既定的標準進行比較,主要包括批判性綜述。
4 “Right Review”—證據綜合方法的選擇工具
面對諸多的證據綜合方法,如何選擇適宜和恰當的方法開展證據綜合研究成為研究者面臨的挑戰。Krystle等[77]開發設計了“Right Review”來嘗試解決證據綜合方法的選擇問題。“Right Review”是一種基于網絡的證據綜合方法選擇工具,用戶通過回答設置的一系列問題,工具可以推薦適合其研究問題的證據綜合方法。
該工具包括輸入和輸出面板、推理引擎和知識庫。輸入面板分為定量和定性綜合兩個入口,點擊進入后分別會顯示幾組具體問題與預設選項(見附件表2),用戶根據計劃開展的證據綜合勾選適當答案,勾選完成后點擊提交。提交后,輸出面板顯示工具推薦的證據綜合方法,以及該方法相關的實施和報告規范和具體示例。推理引擎由知識庫提供信息,知識庫將用戶的響應與證據綜合方法屬性進行匹配,以生成建議。知識庫由工具的問答、方法定義、解釋闡述文件、關鍵實施和報告規范、術語表、方法示例六部分組成。對于定性研究,開發者設計了10組問答來選擇15種證據綜合方法,包括框架綜合、主題綜合、元民族志等;對于定量研究,則通過5組問答來選擇26種證據綜合方法,包括干預措施的有效性和/或安全性的快速綜述、診斷研究的系統評價、系統評價再評價、概況性綜述等。
在“Right Review”工具應用中,如果選擇了“定量”選項,頁面跳轉顯示定量綜合的5個問題及相關選項,用戶每個問題只能選擇1個答案,若有問題適合多個答案,則需為每種答案重新應用該工具選擇,得出相應的推薦結果。在選擇過程中,如果對該問題或選項有疑問,可單擊該問題與選項后面藍白相間的問號標志查看相關解釋,之后單擊解釋框“close”選項回到原選擇頁面。應用示例:如果問題1目標選擇1f(識別/澄清概念、定義、現有研究和研究空白);問題2選擇2b大于等于兩種干預措施或診斷測試;問題3選擇3c將使用系統評價與原始研究;問題4選擇4a(僅描述性分析);問題5選擇5b不存在時間、成本限制。5個問題選擇完成后,點擊“submit”提交,頁面會自動跳轉,生成建議的方法。依據上述示例選擇的答案,該工具的推理引擎使用預先設計的決策樹匹配推薦的方法為概況性綜述。
如果選擇了“定性”選項,頁面則跳轉顯示定性綜合的10個問題及相關選項,用戶在每組問答中可勾選一個或多個答案。推理引擎使用評分方案來衡量用戶的回答與不同證據綜合方法屬性之間的匹配程度。單選問題在完全匹配時計1分,在不匹配時計0分。多選問題中選項則被分配部分分數,例如在問題2中,用戶最多可以選擇五個答案。框架綜合方法在問題2中預設三個答案,敘述綜合方法則預設包含五個。如果用戶只選擇了兩個預設的答案,則將獲得2/3的框架綜合分數和2/5的敘述性綜合分數,分母代表匹配響應預設答案的最大數量。推薦匹配得分最高的方法,總分與最高分相差0.5以內的其他方法也會顯示在輸出面板。
“Right Review”共計收錄了41種證據綜合方法,提供了一個簡單且用戶友好的網絡界面,為研究者選擇證據綜合方法給予了便利、可參考的途徑,但收錄方法間重疊度較高,而像較為常用的證據圖譜和動態系統評價等方法未被收錄,并且該工具根據用戶答案直接生成推薦結果,對證據綜合方法的選擇過程介紹不夠詳細,所以仍存在一定局限性。Pandor等[78]通過德爾菲法建立的STARR決策工具可指導用戶對證據綜合過程及內容進行合理簡化,確保在允許時間內完成快速綜述,并獲取最切實相關的證據綜合信息,但STARR決策工具僅針對快速綜述工具。除了開發證據綜合方法的選擇工具,國際上也有一些學者凝練了不同證據綜合方法之間的關鍵鑒別因素,以供方法的選擇。Booth等[50]依據不同的定性證據綜合方法,制訂了RETREAT框架,提煉決定方法選擇的七個因素,為研究者選擇定性證據綜合方法提供參考。Pullin等[79]強調了證據綜合方法的定性或定量形式,以及在某些情況下可以是混合形式,并總結呈現了部分方法的優缺點。Cook等[80]概述了用于生態環境領域的不同證據綜合方法,并建立了決策樹工具。然而,這些理論、模型方法以及選擇工具均存在一定的片面性,納入的證據綜合方法不具代表性,且大多缺少直觀的選擇路徑。
5 證據綜合方法選擇路徑的構建
鑒于以上證據綜合方法選擇工具和模型的局限性,本研究參考了已有的工具、理論、模型,旨在構建醫學領域具有代表性且較為常用的證據綜合方法的選擇路徑,以期輔助研究者選擇合適的證據綜合方法,為醫學研究和臨床實踐提供更加準確的高質量證據支持。
5.1 明確研究主題/問題
開展證據綜合之前,首先要明確研究主題/問題。在醫學領域,證據綜合的研究主題集中在經驗式/定性綜合、干預措施的有效性/安全性、診斷測試的準確性、預后研究綜合、流行病學研究(患病率/發病率、病因和/或風險)、經濟學評價和專家意見/政策審查[81]等方面。證據綜合可以選擇一個或多個主題,目前研究最多的為干預措施相關的證據綜合。
5.2 證據綜合方法選擇路徑
在明確研究主題,了解一定的證據綜合方法之后,應對研究主題進行初步檢索,考量已經發表的研究證據,結合研究需求與現實條件,選擇適宜的方法。參考Tobias等[82]制定的是否進行系統評價的決策圖,本文擴大了應用范圍并調整了部分選項設置,并設置了明確的發表時間限制,繪制了證據綜合工作開展決策流程圖。如附件圖4所示,檢索研究主題/問題相關的證據,若近1~2年存在已發表的高質量證據綜合研究,如無重大改進則不考慮同命題方法類型的證據綜合,可選擇其他證據綜合方法或者更換研究主題。若未見高質量綜合研究或發表時間超過3年,則可通過判斷有無新證據/重大改進、能否推進該領域發展,選擇是否進行該研究主題的證據綜合。
證據綜合方法選擇路徑(附件圖5)的繪制借鑒康奈爾大學圖書館[29]的綜述方法學決策樹設計,調整增設了決策問題,并添加了證據圖譜、動態系統評價、元民族志等12種證據綜合方法,基本涵蓋了醫學領域中常用的證據綜合手段。在決策問題的調整上,部分參考了“Right Review”的問題設置。本文設計的選擇路徑圖主要是基于研究主題,從經驗性綜合、全面綜合以識別研究空白、僅綜合系統評價和全面綜合并客觀評價四個方面進行考量。經驗性綜合主要是關于經驗、體驗等定性研究的綜合,以及對理論、概念、框架的探索;全面綜合以識別研究空白的證據綜合方法更加注重研究廣度,全面綜合并客觀評價則注重綜合評價的深入分析;僅綜合系統評價是對二次研究的綜合分析。在這四個方面的基礎上又設置了細分的決策問題,使用者可通過對決策問題的判斷,根據該項答案的指引流程進行證據綜合方法的選擇。若對選擇出證據綜合方法存在疑問,可參考附件表1內容。
具體而言,經驗性綜合通常不進行全面證據檢索及綜合,主要包含兩類,一類是對定性研究的綜合,例如現實主義評論、扎根理論、元民族志等,聚焦于理論、概念、框架、背景環境、人文因素的研究,側重于理解人類行為、體驗和社會現象的深層次意義,對此類醫學研究的證據綜合可幫助了解病人、患者家屬及醫護人員等不同群體的健康需求與觀點,探索醫療過程中不同人群的偏好、信仰及其造成醫療實踐過程中的有利/阻礙因素,有助于提高干預的成功率和可持續性。例如,梁立波等運用扎根理論方法,經過三級編碼,分析構建了防御性醫療“醫患關系—制度體系—社會環境”的影響作用機制模型[83]。Luiking等[62]調研移民者的醫療衛生保健體驗,運用元民族志的證據綜合方法深入研究,確定了五個關鍵影響因素,有助于促進醫療衛生組織和衛生保健中心為移民患者提供以人為本的照護。經驗性綜合的另一類方法則是傳統式的文獻綜述,例如敘述性綜述,對研究領域文獻進行匯總論述,形式靈活,易于進行,適合探索性問題,但缺乏標準化的方法,受個人主觀性影響較大。
若開展證據綜合目的是為了全面綜合現有研究、識別研究領域空白,強調全面性呈現,則可根據側重點的不同進行選擇。如果側重于初步評估現有研究文獻涉及到的范圍,旨在明確關鍵概念、定義、證據類型,尋找研究空白,則可根據是否有時間限制,選擇開展概況性綜述或快速概況性綜述。例如,徐思敏等采用概況性綜述的方法對國內外醫療機構藥物遴選相關方法和工具的目前發展情況進行匯總分析[84]。如果側重于簡明直觀地呈現其研究現狀、存在問題、發展方向和證據差距,展示某研究領域的整體全貌,則可選擇證據圖譜方法。楊克虎等通過證據圖譜的方法系統識別、呈現了運動干預抑郁癥患者的相關研究[85]。
若證據綜合目的是全面綜合并客觀評價現有研究結果,則可根據描述分析、定量綜合,定性定量研究綜合、是否定時更新來判斷。當時間充裕時,描述分析可選擇系統評價,時間限制時則選用快速綜述。例如,Poland等[52]在2022年猴痘疫情大規模蔓延時期,迅速開展了疫苗預防猴痘的快速綜述,為緊急預防干預提供證據支持。當證據綜合需要進行定量綜合時,根據干預/診斷等的比較個數,結合相應的Meta分析或網狀Meta分析。如果定時更新納入新的研究證據,可選擇開展動態系統評價。當需要綜合定性研究與定量研究時,則選用混合方法研究綜述方法進行證據綜合,其中混合方法研究系統評價(MMSRs)可按照JBI MMSRs指南進行規范報告[14]。Pimsen等[86]運用MMSRs的方法,分析醫療衛生保健提供者對乳腺癌幸存者提供性健康護理的經驗。
附件圖5中,除了定量綜合部分,經驗性綜合與全面性綜合等部分的方法選擇路徑基本適用于整個醫學領域的相關研究。定量綜合,通常與描述分析的系統評價同時進行,若存在時間限制,也可開展包含定量綜合的快速綜述。系統評價可以簡化為快速系統評價,其他方法如概況性綜述[87]、系統評價再評價[88]等均可以結合實際需要進行快速化。同時,在具體運用中,可以多種綜合方法聯合使用,例如Ferguson等[89]為探討可穿戴活動追蹤器增加身體活動和改善健康有效性,開展了系統評價再評價和Meta分析。
整體來看,確定研究主題后應先進行初步檢索,如果檢索出大量研究證據,一般可以先開展概況性綜述或者證據圖譜,熟悉該研究領域的基本全貌和研究空白,然后根據細化的問題選擇性開展更深入的系統評價分析[90]。如果檢索發現該領域已經存在諸多系統評價研究,則可考慮對現有的系統評價進行綜合評價。如果研究主題為定性方向,綜合經驗、體會等證據,則可根據研究中關于理論、概念、框架模型的側重點選擇相應的證據綜合方法,進一步挖掘探索。
以已經發表的研究舉例。研究目的為全面梳理總結口服中成藥治療成人功能性消化不良的臨床研究現況、發掘用藥規律及存在問題,結合繪制的選擇路徑(附件圖5),可識別該研究需要進行全面綜合,在全面綜合現有研究的基礎上識別研究空白,而且偏重研究廣度、范圍,因此選擇概況性綜述的方法[91]。在全面綜合并客觀評價中醫臨床預測模型研究方法學質量時,如果不需要定量分析與定時更新,僅需描述分析,則選用不含Meta分析的系統評價[92]。若相較于全面綜合證據,研究目的更側重于經驗性綜合,研究旨在綜合對群體行走體驗和感知的定性研究,以發展對群體行走體驗的新概念理解,則應選擇元民族志的證據綜合方法[93]。
6 局限性
本研究存在一定的局限性。首先,繪制的證據方法選擇路徑為了使流程圖更加簡明直觀,在內容呈現上做出了一定的取舍,決策問題描述較為簡短。經驗性綜合證據方法的決策流程較為單一,僅顯示其核心特征,可能需要參考文中相關方法的定義特征、優缺點和應用舉例等內容使用。其次,未將系統評價依據內容細分為干預措施的系統評價、診斷研究的系統評價、流行病學的系統評價等諸多類型。在定量綜合方面,未納入個體數據(IPD)Meta分析、累積Meta分析等運用相對較少的方法。此外,本文所繪制的決策流程圖是初步的線索框架,旨在幫助使用者尤其是初學者梳理證據綜合方法學選擇思路,按照設計流程,選擇的結果是獨立的證據綜合方法,在具體運用中,還需使用者根據研究主題與現實條件等因素,適當選取一種方法或者多種方法聯合使用。
綜上所述,當前,隨著醫學領域研究證據的快速增長和醫療數據的不斷累積,為高效地整合和分析龐雜的數據資源,為臨床實踐提供準確、及時的證據支持,選擇合適的證據綜合方法至關重要。本文簡要論述了證據綜合方法的發展概況及其分類,介紹了證據綜合方法選擇工具“Right Review”,并基于醫學領域代表性的證據綜合方法,初步建立了證據綜合方法選擇路徑。不過文中繪制的路徑僅為線索框架,決策流程設計與證據綜合方法的還不夠全面,有待未來研究進一步完善。
現今國際上發布了一系列證據綜合方法學指導手冊及實施、報告規范,但仍有部分證據綜合方法存在術語不統一、定義不清晰的問題,例如在國際上“證據圖譜”被表述“evidence map”“mapping review”和“systematic map”,不同學者、機構對于系統評價再評價的理解與界定也存在著一定的分歧[3],一些證據綜合方法也尚無相應指導規范。因此,亟需多方研究者共同努力,規范統一證據綜合方法術語及界定;制定并遵循相關證據綜合方法的實施、報告規范;通過證據綜合方法相關自動化工具和軟件的開發與應用,例如AutoMeta平臺[94]以及概況性評價制作的自動化工具[95]等,加快證據綜合工作效率且提供方法學指導、促進規范的落實;建立更加完善、直觀的證據綜合方法選擇路徑,為選擇適宜綜合方法,形成高質量綜合證據提供支持。
證據綜合又稱為證據合成,是圍繞特定研究問題,運用規范、明確、嚴謹的方法將現有研究結果、知識和/或信息匯集合并,綜合相關已知內容,闡明尚待開發的未知領域[1],為臨床實踐、個人決策和政策制定提供依據[2]。當前是飛速發展的信息時代,各研究領域涌現出海量的數據和信息。面對繁雜多元、質量參差不齊的證據,決策者難以直接進行篩選、分析和判斷,因此對于高質量、多元化的證據綜合需求不斷增多,大量證據綜合方法及研究報告應運而生[3]。然而,日新月異的證據綜合方法以及各方法之間存在的相似或共同特征,令研究者容易混淆不同方法的適用情況。尤其給初學者選擇恰當的證據綜合方法造成困惑,從而產生重復、冗余和低質量的綜合證據[4]。因此需要進一步的指導來幫助研究者選擇合適、恰當的證據綜合方法,以提供更加準確、可靠的證據支持。為此,本文歸納了證據綜合方法的發展概況、類型及輔助決策工具,梳理總結醫學領域實際應用中具有代表性的證據綜合方法以及目前已有的決策工具,闡明其優勢與缺陷,同時參考現有的理論、工具、模型繪制新的證據綜合選擇路徑,旨在為研究人員選擇適宜證據綜合方法提供參考。
1 證據綜合方法的發展概況
在開展原始研究之前,對現有知識或證據進行綜合與評價能夠幫助研究者發現研究空白、提高研究質量和效率。證據綜合的理念在200年前已經產生[5],綜述是證據綜合的重要手段,然而囿于方法學與信息資源的限制,早期的傳統綜述通常不系統,缺乏科學的綜合方法,難以從現有信息中得出真實、可靠的結論。為了改變這一現狀,證據綜合及其方法的研究與開發日益受到重視。18世紀中期蘇格蘭航海外科醫生James Lind在發表第一個壞血病臨床試驗研究[6]之后,還強調了全面綜合已有的壞血病相關研究證據并對其進行客觀評價以減少偏倚的重要性[7],即搜集、綜合和評估相關研究主題證據,也就是證據綜合的重要性,此時已經可以看到系統性證據綜合方法的雛形。
近三十年來,證據綜合方法及其應用快速發展[5],系統評價(SR)是最早發展也是至今最重要的系統性證據綜合方法之一,它的出現令證據綜合有了跨越式的進步,其概念是在20世紀80年代由Archie Cochrane首次正式提出[8]。系統評價通過全面、系統檢索某一主題所有相關研究,按照納排標準進行篩選,經客觀評價、科學分析納入的研究,得出更加可靠的結論。隨著大量、多元化證據的涌現,單一的系統評價已難以滿足人們對證據綜合的需求。快速綜述、概況性綜述、系統評價再評價、動態系統評價等證據綜合方法層出不窮。1997年Best等[9]首次描述了一種快速證據綜合方法,并用于開展衛生技術評估項目,2008年快速綜述(RR)的概念被正式提出[10]。2000年系統評價再評價的概念被正式提出[11],用于開展針對系統評價的綜合、評價工作,并首次對精神分裂癥的藥物治療、普通感冒相關預防措施以及與戒煙有關的系統評價進行了再評價。2005年,Arksey首次提出概況性綜述的概念并制定了其基本研究框架[12],彌補了系統評價在研究廣度方面的不足。2014年Elliott提出動態系統評價(LSR)的概念[13],不同于傳統系統評價的一次性完成,LSR是定期對原始研究進行更新檢索和分析以反映新出現的證據,可促進該領域研究數據的即時整合分析。同年,Joanna Briggs研究所(JBI)混合方法研究系統評價(MMSRs)方法學組制訂了MMSRs指南,推動了MMSRs的發展,并于2020年發布更新的報告規范[14]。附件圖1為證據綜合方法發展歷史的時間軸。
目前,證據綜合研究仍處于高速發展階段,以醫學領域廣泛使用的SR為例,2019年在PubMed中檢索到的SR發表數量為平均每天約80篇[15],相比2010年增長了5.8倍,較2000年增長了20倍[5]。證據綜合方法及研究應用的不斷發展,促進了相關組織的建立與雜志的創辦。1993年,Cochrane協作網在英國牛津正式成立,旨在為臨床醫療實踐和醫療衛生決策提供綜合證據支持。自此,國際上先后建立了Campbell協作網、研究綜合方法協會(SRSM)等組織,這些組織致力于綜合不同主題領域的研究證據,為多元決策提供有力的證據支撐。此外,在SRSM的支持下,2010年創立Research Synthesis Methods雜志,旨在促進有關證據綜合方法的開發、設計、應用與傳播。2020年JBI Evidence Synthesis創刊,聚焦于醫療衛生領域的證據綜合方法創新和應用。針對系統評價也創立了專門的數據庫和期刊,如The Cochrane database of systematic reviews以及Systematic Review等,旨在推動高質量系統評價的注冊、實施、報告與發表。附件圖2為證據綜合領域的重要事件。
隨著證據綜合方法的發展,其相應的實施、報告規范和方法學質量評價工具也在持續更新完善。例如,1999年David Moher提出了QUOROM聲明,旨在提高隨機對照試驗系統評價的報告質量[16],2009年Moher等對該聲明進行更新,并將其更名為PRISMA[17],多個國際重要醫學期刊同步發表了該聲明[18]。目前國際上Cochrane協作網、科學編輯委員會等組織機構和近二百家期刊簽約使用PRISMA聲明[19]。該聲明仍在不斷更新拓展[20],例如2022年發布的中醫藥領域動物實驗系統評價報告規范PRISMA-ATCM[21],2024年發布的動態系統評價報告規范PRISMA-LSR[22]。關于系統評價的方法學質量評價工具有AMSTAR[23]、OQAQ[24]和SQAC[25]等,其中最為廣泛使用的是AMSTAR,AMSTAR于2007年發布,2017年進行了更新調整,用于評估系統評價的方法學質量[26]。不僅是系統評價的評價工具受到關注,其他證據綜合方法亦是如此。例如2010年Danielle等[27]提出了概況性綜述的實施規范,2018年Andrea等[28]制訂了概況性綜述的報告規范,即PRISMA概況性綜述擴展聲明(PRISMA-ScR)。EQUATOR網站上整理收錄了諸多證據綜合方法的報告規范,研究者開展證據綜合時可在該網站進行查詢獲取。遵循報告規范能夠提高證據綜合的質量與透明度,增強結論的可信度。當前,一些證據綜合方法的實施、報告規范仍待研發,例如證據圖譜的報告規范目前還在制作中[29]。
經過質量評價后的綜合證據如何幫助達成推薦意見、形成臨床實踐指南指導臨床決策呢?2004年,推薦分級的評估、制訂與評價(GRADE)工作組建立并發表證據質量和推薦強度進行分級的系統工具[30],給出了解決方案。在系統評價中應用GRADE工具可以評價證據質量級別,并在結果總結表和證據概要表中列出證據升降級的原因,有助于系統評價使用者對證據的準確理解和正確應用,從而形成推薦意見[31]。2009年,挪威Vandvik教授和加拿大Guyatt教授在GRADE工具的基礎上,進一步拓展深入,建立了一套快速制訂與傳播高質量臨床推薦意見的方法學系統—MAGIC,并形成了證據從生產、轉化到使用傳播的完整閉環,構建了數字化和可信的證據生態系統,推動臨床實踐指南的快速制訂與傳播推廣[32]。
證據綜合方法以及其相應組織、標準規范、應用轉化方式的涌現,促進了對“證據綜合”進一步的詮釋與理解。2018年,英國皇家學會和醫學科學院定義“證據綜合”為將來自各種來源和學科的信息匯集在一起為有關特定問題的辯論和決策提供證據支持的過程,并提出包容、嚴謹、透明、可訪問的證據綜合原則[33]。2020年,證據綜合國際網(ESI)發布了立場聲明,將“證據綜合”定義為使用系統和明確的方法綜合現有研究中的已知內容以闡明當前證據基礎,并提出了開展證據綜合工作的5個主要目標與9項核心原則,強調了嚴謹、透明的研究范式與科學的證據綜合方法等內容的重要性[1]。康奈爾大學圖書館于2016年推出的系統綜述服務,也隨著證據綜合方法的發展在2020年初更名為證據綜合服務,增添了快速綜述、系統評價再評價、概況性綜述、證據圖譜等證據綜合方法[34]。近年來,可穿戴設備、數據挖掘和機器學習以及智能AI的發展為證據分析、綜合造成新的機遇與挑戰,2023年Subbiah在Nature Medicine發文提及深度循證醫學理念,提出目前的循證醫學金字塔只是冰山一角,需要挖掘現有數據,對其進行深入的綜合與合并,以實現深度循證醫學[35]。可見為了更好地挖掘、運用轉化海量證據,證據綜合方法的更新、優化、迭代發展任重道遠。
2 醫學領域代表性的證據綜合方法
本團隊檢索醫學領域有關總結證據綜合方法現狀的文章,參考Grant[3]、Sutton[36]以及蘭州大學陳耀龍教授團隊[37]遴選的具有代表性的證據綜合方法,整理了醫學領域中18種代表性的證據綜合方法(附件表1)。
在實際應用中,可根據研究主題、具體需求和現有條件進行證據綜合方法的選擇。這些證據綜合方法可以單獨使用,也可聯合使用。系統評價通常結合Meta分析進行定量綜合。不同證據綜合方法的具體應用例如,Riazi等[51]開展了全球非酒精性脂肪性肝病(NAFLD)患病率和發病率的系統評價和Meta分析。Zhang等[52]為探討針灸治療癌癥患者失眠有效性和安全性而進行的系統評價和Meta分析。Lasa等[53]開展了生物制劑和小分子藥物對中重度潰瘍性結腸炎患者有效性和安全性的網狀Meta分析。Truong等[54]開展了概況性綜述研究用于分析運動相關膝關節損傷后恢復階段的心理、社會和背景因素情況。戴澤琦等[55]對耳鼻喉科口服中成藥的臨床證據進行了概況性綜述。Poland等[56]為應對猴痘疫情蔓延,開展了疫苗預防猴痘的快速綜述。Wang等[57]對治療COVID-19的中醫藥“三藥三方”(三藥:金花清感、連花清瘟、血必凈;三方:清肺排毒湯、化濕敗毒方、宣肺敗毒方)進行了快速系統評價和Meta分析。Gao等[58]綜合中醫藥治療糖尿病腎病的臨床證據,開展了證據圖譜。Karlsson等[59]針對運動療法對急性腰痛患者的有效性進行了系統評價再評價。Michelen等[60]針對長新冠(long COVID)的特征,開展了動態系統評價。
Moffat等[61]進行了一項混合方法研究綜述,探討了實踐中招募隨機對照試驗參與者的相關影響因素。Luiking等[62]以元民族志綜合探討了有關移民者的醫療衛生保健經歷。McHugh等[63]開展了一項加拿大土著青年參加體育和娛樂活動經歷的定性研究的元研究。Taqueti等[64]針對冠狀動脈微血管疾病的致病機制和治療選擇開展了前沿綜述。Rew等[65]對用于跨性別和性別多元化青年的青春期阻斷劑進行了批判性綜述。Ellis等[66]開展了自閉癥成人患者自閉癥健康護照(AHPs)的現實主義評論。Andrews等[67]進行了一項扎根理論研究探討護士自我照護和自我關懷的情況。Carton等[68]開展了框架綜合探討了新生兒監護病房(NCU)入院對照料者與嬰兒關系的影響。Reid等[69]針對接受血液透析的患者經歷,開展了一項主題綜合。Aragon等[70]通過敘述性綜述探討了歇性禁食模式及其對體重和身體健康的影響。
3 證據綜合方法的分類
目前,證據綜合方法豐富繁雜,其分類方法也存在多樣性,尚無統一的分類方法。不同的組織和研究者采取的分類方法不盡相同,常用的分類方法有以下四種,見附件圖3。
3.1 JBI分類
澳大利亞JBI循證衛生保健研究中心2005年將“證據綜合”概括為“理論”“方法學”和“系統評價”三部分[71],但此三者并非并列關系,理論和方法學是系統評價的支撐內容。2019年更新后的JBI模式將證據綜合概括歸納為系統評價、證據總結以及臨床實踐指南三部分[72]。其中,系統評價是證據綜合領域的關鍵方法,它不僅包含定量和定性研究,還涵蓋了干預性、診斷性、經濟性等不同類型的研究,以及系統評價再評價等。證據總結的形式則更加靈活寬泛,可以是小規模證據摘要或快速綜述。臨床實踐指南在證據綜合的基礎上包括了醫療實踐可行性、適宜性等方面的考量,此二者彌補了系統評價針對特定問題進行證據綜合的局限性[73]。
3.2 根據證據是否進行轉化分類
證據綜合是將已有研究證據進行合并匯總,根據證據是否進行轉化分為單純合成證據與轉化研究證據兩類[74]。單純合成證據即二次研究證據,是指研究者對原始研究證據中的數據信息進行合并、分析(如系統評價、Meta分析),也包括對系統評價/Meta分析的再評價和分析(如系統評價再評價)。轉化研究證據則是在對原始研究和二次研究證據進行合成的基礎上,將合成的證據綜合轉化為可供證據使用者作為決策依據的證據信息,例如證據圖、概況性綜述、衛生技術評估、臨床實踐指南等。
3.3 根據納入研究的數據類型分類
根據納入研究的數據類型,可將證據綜合方法分為定量、定性和混合方法三類。其中,定性綜合方法包括元民族志、元研究、扎根理論和主題綜合等,關注定性研究以及理論的挖掘、延伸和合成。定量綜合方法致力于對量化數據的合并分析,包括Meta分析和最佳證據綜合等。混合綜合方法兼顧定性與定量兩種研究數據類型,包括混合方法研究系統評價等[75]。
3.4 根據證據綜合目的分類
根據證據綜合的目的,可將證據綜合方法分為描述性、檢驗性、擴展性和批判性四類[76]。這四類方法可以單獨使用,亦可混合使用。其中,描述性證據綜合方法旨在對特定研究問題、主題相關文獻證據的描述總結,包括敘述性綜述、文本敘述綜合、元敘述以及概況性綜述等。檢驗性證據綜合方法聚焦于回答研究問題或驗證特定假設,包括現實主義評論、Meta分析、貝葉斯Meta分析等。擴展性證據綜合方法主要關注在已有證據基礎上構建新的理論,包括元民族志、元闡釋、元研究、框架綜合和主題綜合等。批判性證據綜合方法則是將一組證據與既定的標準進行比較,主要包括批判性綜述。
4 “Right Review”—證據綜合方法的選擇工具
面對諸多的證據綜合方法,如何選擇適宜和恰當的方法開展證據綜合研究成為研究者面臨的挑戰。Krystle等[77]開發設計了“Right Review”來嘗試解決證據綜合方法的選擇問題。“Right Review”是一種基于網絡的證據綜合方法選擇工具,用戶通過回答設置的一系列問題,工具可以推薦適合其研究問題的證據綜合方法。
該工具包括輸入和輸出面板、推理引擎和知識庫。輸入面板分為定量和定性綜合兩個入口,點擊進入后分別會顯示幾組具體問題與預設選項(見附件表2),用戶根據計劃開展的證據綜合勾選適當答案,勾選完成后點擊提交。提交后,輸出面板顯示工具推薦的證據綜合方法,以及該方法相關的實施和報告規范和具體示例。推理引擎由知識庫提供信息,知識庫將用戶的響應與證據綜合方法屬性進行匹配,以生成建議。知識庫由工具的問答、方法定義、解釋闡述文件、關鍵實施和報告規范、術語表、方法示例六部分組成。對于定性研究,開發者設計了10組問答來選擇15種證據綜合方法,包括框架綜合、主題綜合、元民族志等;對于定量研究,則通過5組問答來選擇26種證據綜合方法,包括干預措施的有效性和/或安全性的快速綜述、診斷研究的系統評價、系統評價再評價、概況性綜述等。
在“Right Review”工具應用中,如果選擇了“定量”選項,頁面跳轉顯示定量綜合的5個問題及相關選項,用戶每個問題只能選擇1個答案,若有問題適合多個答案,則需為每種答案重新應用該工具選擇,得出相應的推薦結果。在選擇過程中,如果對該問題或選項有疑問,可單擊該問題與選項后面藍白相間的問號標志查看相關解釋,之后單擊解釋框“close”選項回到原選擇頁面。應用示例:如果問題1目標選擇1f(識別/澄清概念、定義、現有研究和研究空白);問題2選擇2b大于等于兩種干預措施或診斷測試;問題3選擇3c將使用系統評價與原始研究;問題4選擇4a(僅描述性分析);問題5選擇5b不存在時間、成本限制。5個問題選擇完成后,點擊“submit”提交,頁面會自動跳轉,生成建議的方法。依據上述示例選擇的答案,該工具的推理引擎使用預先設計的決策樹匹配推薦的方法為概況性綜述。
如果選擇了“定性”選項,頁面則跳轉顯示定性綜合的10個問題及相關選項,用戶在每組問答中可勾選一個或多個答案。推理引擎使用評分方案來衡量用戶的回答與不同證據綜合方法屬性之間的匹配程度。單選問題在完全匹配時計1分,在不匹配時計0分。多選問題中選項則被分配部分分數,例如在問題2中,用戶最多可以選擇五個答案。框架綜合方法在問題2中預設三個答案,敘述綜合方法則預設包含五個。如果用戶只選擇了兩個預設的答案,則將獲得2/3的框架綜合分數和2/5的敘述性綜合分數,分母代表匹配響應預設答案的最大數量。推薦匹配得分最高的方法,總分與最高分相差0.5以內的其他方法也會顯示在輸出面板。
“Right Review”共計收錄了41種證據綜合方法,提供了一個簡單且用戶友好的網絡界面,為研究者選擇證據綜合方法給予了便利、可參考的途徑,但收錄方法間重疊度較高,而像較為常用的證據圖譜和動態系統評價等方法未被收錄,并且該工具根據用戶答案直接生成推薦結果,對證據綜合方法的選擇過程介紹不夠詳細,所以仍存在一定局限性。Pandor等[78]通過德爾菲法建立的STARR決策工具可指導用戶對證據綜合過程及內容進行合理簡化,確保在允許時間內完成快速綜述,并獲取最切實相關的證據綜合信息,但STARR決策工具僅針對快速綜述工具。除了開發證據綜合方法的選擇工具,國際上也有一些學者凝練了不同證據綜合方法之間的關鍵鑒別因素,以供方法的選擇。Booth等[50]依據不同的定性證據綜合方法,制訂了RETREAT框架,提煉決定方法選擇的七個因素,為研究者選擇定性證據綜合方法提供參考。Pullin等[79]強調了證據綜合方法的定性或定量形式,以及在某些情況下可以是混合形式,并總結呈現了部分方法的優缺點。Cook等[80]概述了用于生態環境領域的不同證據綜合方法,并建立了決策樹工具。然而,這些理論、模型方法以及選擇工具均存在一定的片面性,納入的證據綜合方法不具代表性,且大多缺少直觀的選擇路徑。
5 證據綜合方法選擇路徑的構建
鑒于以上證據綜合方法選擇工具和模型的局限性,本研究參考了已有的工具、理論、模型,旨在構建醫學領域具有代表性且較為常用的證據綜合方法的選擇路徑,以期輔助研究者選擇合適的證據綜合方法,為醫學研究和臨床實踐提供更加準確的高質量證據支持。
5.1 明確研究主題/問題
開展證據綜合之前,首先要明確研究主題/問題。在醫學領域,證據綜合的研究主題集中在經驗式/定性綜合、干預措施的有效性/安全性、診斷測試的準確性、預后研究綜合、流行病學研究(患病率/發病率、病因和/或風險)、經濟學評價和專家意見/政策審查[81]等方面。證據綜合可以選擇一個或多個主題,目前研究最多的為干預措施相關的證據綜合。
5.2 證據綜合方法選擇路徑
在明確研究主題,了解一定的證據綜合方法之后,應對研究主題進行初步檢索,考量已經發表的研究證據,結合研究需求與現實條件,選擇適宜的方法。參考Tobias等[82]制定的是否進行系統評價的決策圖,本文擴大了應用范圍并調整了部分選項設置,并設置了明確的發表時間限制,繪制了證據綜合工作開展決策流程圖。如附件圖4所示,檢索研究主題/問題相關的證據,若近1~2年存在已發表的高質量證據綜合研究,如無重大改進則不考慮同命題方法類型的證據綜合,可選擇其他證據綜合方法或者更換研究主題。若未見高質量綜合研究或發表時間超過3年,則可通過判斷有無新證據/重大改進、能否推進該領域發展,選擇是否進行該研究主題的證據綜合。
證據綜合方法選擇路徑(附件圖5)的繪制借鑒康奈爾大學圖書館[29]的綜述方法學決策樹設計,調整增設了決策問題,并添加了證據圖譜、動態系統評價、元民族志等12種證據綜合方法,基本涵蓋了醫學領域中常用的證據綜合手段。在決策問題的調整上,部分參考了“Right Review”的問題設置。本文設計的選擇路徑圖主要是基于研究主題,從經驗性綜合、全面綜合以識別研究空白、僅綜合系統評價和全面綜合并客觀評價四個方面進行考量。經驗性綜合主要是關于經驗、體驗等定性研究的綜合,以及對理論、概念、框架的探索;全面綜合以識別研究空白的證據綜合方法更加注重研究廣度,全面綜合并客觀評價則注重綜合評價的深入分析;僅綜合系統評價是對二次研究的綜合分析。在這四個方面的基礎上又設置了細分的決策問題,使用者可通過對決策問題的判斷,根據該項答案的指引流程進行證據綜合方法的選擇。若對選擇出證據綜合方法存在疑問,可參考附件表1內容。
具體而言,經驗性綜合通常不進行全面證據檢索及綜合,主要包含兩類,一類是對定性研究的綜合,例如現實主義評論、扎根理論、元民族志等,聚焦于理論、概念、框架、背景環境、人文因素的研究,側重于理解人類行為、體驗和社會現象的深層次意義,對此類醫學研究的證據綜合可幫助了解病人、患者家屬及醫護人員等不同群體的健康需求與觀點,探索醫療過程中不同人群的偏好、信仰及其造成醫療實踐過程中的有利/阻礙因素,有助于提高干預的成功率和可持續性。例如,梁立波等運用扎根理論方法,經過三級編碼,分析構建了防御性醫療“醫患關系—制度體系—社會環境”的影響作用機制模型[83]。Luiking等[62]調研移民者的醫療衛生保健體驗,運用元民族志的證據綜合方法深入研究,確定了五個關鍵影響因素,有助于促進醫療衛生組織和衛生保健中心為移民患者提供以人為本的照護。經驗性綜合的另一類方法則是傳統式的文獻綜述,例如敘述性綜述,對研究領域文獻進行匯總論述,形式靈活,易于進行,適合探索性問題,但缺乏標準化的方法,受個人主觀性影響較大。
若開展證據綜合目的是為了全面綜合現有研究、識別研究領域空白,強調全面性呈現,則可根據側重點的不同進行選擇。如果側重于初步評估現有研究文獻涉及到的范圍,旨在明確關鍵概念、定義、證據類型,尋找研究空白,則可根據是否有時間限制,選擇開展概況性綜述或快速概況性綜述。例如,徐思敏等采用概況性綜述的方法對國內外醫療機構藥物遴選相關方法和工具的目前發展情況進行匯總分析[84]。如果側重于簡明直觀地呈現其研究現狀、存在問題、發展方向和證據差距,展示某研究領域的整體全貌,則可選擇證據圖譜方法。楊克虎等通過證據圖譜的方法系統識別、呈現了運動干預抑郁癥患者的相關研究[85]。
若證據綜合目的是全面綜合并客觀評價現有研究結果,則可根據描述分析、定量綜合,定性定量研究綜合、是否定時更新來判斷。當時間充裕時,描述分析可選擇系統評價,時間限制時則選用快速綜述。例如,Poland等[52]在2022年猴痘疫情大規模蔓延時期,迅速開展了疫苗預防猴痘的快速綜述,為緊急預防干預提供證據支持。當證據綜合需要進行定量綜合時,根據干預/診斷等的比較個數,結合相應的Meta分析或網狀Meta分析。如果定時更新納入新的研究證據,可選擇開展動態系統評價。當需要綜合定性研究與定量研究時,則選用混合方法研究綜述方法進行證據綜合,其中混合方法研究系統評價(MMSRs)可按照JBI MMSRs指南進行規范報告[14]。Pimsen等[86]運用MMSRs的方法,分析醫療衛生保健提供者對乳腺癌幸存者提供性健康護理的經驗。
附件圖5中,除了定量綜合部分,經驗性綜合與全面性綜合等部分的方法選擇路徑基本適用于整個醫學領域的相關研究。定量綜合,通常與描述分析的系統評價同時進行,若存在時間限制,也可開展包含定量綜合的快速綜述。系統評價可以簡化為快速系統評價,其他方法如概況性綜述[87]、系統評價再評價[88]等均可以結合實際需要進行快速化。同時,在具體運用中,可以多種綜合方法聯合使用,例如Ferguson等[89]為探討可穿戴活動追蹤器增加身體活動和改善健康有效性,開展了系統評價再評價和Meta分析。
整體來看,確定研究主題后應先進行初步檢索,如果檢索出大量研究證據,一般可以先開展概況性綜述或者證據圖譜,熟悉該研究領域的基本全貌和研究空白,然后根據細化的問題選擇性開展更深入的系統評價分析[90]。如果檢索發現該領域已經存在諸多系統評價研究,則可考慮對現有的系統評價進行綜合評價。如果研究主題為定性方向,綜合經驗、體會等證據,則可根據研究中關于理論、概念、框架模型的側重點選擇相應的證據綜合方法,進一步挖掘探索。
以已經發表的研究舉例。研究目的為全面梳理總結口服中成藥治療成人功能性消化不良的臨床研究現況、發掘用藥規律及存在問題,結合繪制的選擇路徑(附件圖5),可識別該研究需要進行全面綜合,在全面綜合現有研究的基礎上識別研究空白,而且偏重研究廣度、范圍,因此選擇概況性綜述的方法[91]。在全面綜合并客觀評價中醫臨床預測模型研究方法學質量時,如果不需要定量分析與定時更新,僅需描述分析,則選用不含Meta分析的系統評價[92]。若相較于全面綜合證據,研究目的更側重于經驗性綜合,研究旨在綜合對群體行走體驗和感知的定性研究,以發展對群體行走體驗的新概念理解,則應選擇元民族志的證據綜合方法[93]。
6 局限性
本研究存在一定的局限性。首先,繪制的證據方法選擇路徑為了使流程圖更加簡明直觀,在內容呈現上做出了一定的取舍,決策問題描述較為簡短。經驗性綜合證據方法的決策流程較為單一,僅顯示其核心特征,可能需要參考文中相關方法的定義特征、優缺點和應用舉例等內容使用。其次,未將系統評價依據內容細分為干預措施的系統評價、診斷研究的系統評價、流行病學的系統評價等諸多類型。在定量綜合方面,未納入個體數據(IPD)Meta分析、累積Meta分析等運用相對較少的方法。此外,本文所繪制的決策流程圖是初步的線索框架,旨在幫助使用者尤其是初學者梳理證據綜合方法學選擇思路,按照設計流程,選擇的結果是獨立的證據綜合方法,在具體運用中,還需使用者根據研究主題與現實條件等因素,適當選取一種方法或者多種方法聯合使用。
綜上所述,當前,隨著醫學領域研究證據的快速增長和醫療數據的不斷累積,為高效地整合和分析龐雜的數據資源,為臨床實踐提供準確、及時的證據支持,選擇合適的證據綜合方法至關重要。本文簡要論述了證據綜合方法的發展概況及其分類,介紹了證據綜合方法選擇工具“Right Review”,并基于醫學領域代表性的證據綜合方法,初步建立了證據綜合方法選擇路徑。不過文中繪制的路徑僅為線索框架,決策流程設計與證據綜合方法的還不夠全面,有待未來研究進一步完善。
現今國際上發布了一系列證據綜合方法學指導手冊及實施、報告規范,但仍有部分證據綜合方法存在術語不統一、定義不清晰的問題,例如在國際上“證據圖譜”被表述“evidence map”“mapping review”和“systematic map”,不同學者、機構對于系統評價再評價的理解與界定也存在著一定的分歧[3],一些證據綜合方法也尚無相應指導規范。因此,亟需多方研究者共同努力,規范統一證據綜合方法術語及界定;制定并遵循相關證據綜合方法的實施、報告規范;通過證據綜合方法相關自動化工具和軟件的開發與應用,例如AutoMeta平臺[94]以及概況性評價制作的自動化工具[95]等,加快證據綜合工作效率且提供方法學指導、促進規范的落實;建立更加完善、直觀的證據綜合方法選擇路徑,為選擇適宜綜合方法,形成高質量綜合證據提供支持。