版權信息: ?四川大學華西醫院華西期刊社《中國循證醫學雜志》版權所有,未經授權不得轉載、改編
疾病負擔研究在公共衛生領域具有重要作用,通過估算疾病導致的負擔幫助確定優先需要解決的問題,制定衛生防病的政策和策略,進而有效地分配有限的醫療資源[1, 2]。2020年,柳葉刀發布的2019 GBD專題報告,對全球204個國家和地區369種疾病和傷害的疾病負擔等數據進行了報道,對世界各國的衛生政策產生了重要影響[3];2024年,其再次發布2021 GBD研究報告,進一步系統分析811個國家/地區的288種死亡原因所造成的死亡率和壽命損失年,及其對全球人口的影響[4]。隨著循證醫學的發展,已有研究者采用系統評價方法進行疾病負擔的證據綜合,相關研究數量迅速增加,以求為衛生決策提供證據支持。
目前諸多領域使用系統評價方法開展研究,產出了相應的成果,并且許多研究者對其進行了方法學質量評價,發現這些研究存在不同程度的問題[5]。例如,某些研究可能沒有注冊研究方案,從而不能保證研究的前瞻性,也有研究未能納入灰色文獻,降低了文獻檢索的全面性并導致陽性結果概率增大[6, 7];另外還可能存在異質性、單個研究的偏倚風險對結果影響解釋不充分等問題。但是對于疾病負擔系統評價/Meta分析目前還沒有相關的方法學質量評價報告。相關系統評價/Meta分析可能會因研究設計不當等原因導致證據質量降低,從而誤導決策[8],因此對其進行質量評價非常重要,且有利于進一步指導證據的生產和利用。AMSTAR-2是目前應用廣泛的系統評價方法學質量評估工具[9]。本研究收集PubMed數據庫中疾病負擔系統評價/Meta分析,并進行方法學質量評估,為提升疾病負擔證據質量提供參考。
1 資料與方法
1.1 納入與排除標準
文獻納入標準為:① 研究類型為系統評價/Meta分析;② 結局指標為疾病負擔相關指標(如直接醫療費用、傷殘調整生命年等)。排除標準為:① 系統評價或者Meta分析的研究計劃書;② 綜述、會議論文或者摘要;③ 系統評價再評價;④ 重復發表和無法獲取全文的研究。
1.2 文獻檢索策略
計算機檢索PubMed數據庫,檢索時間為建庫到2024年10月12日,檢索詞包括:burden of illness、systematic review、meta-analysis等,詳細檢索策略見附件框1。由兩名研究人員根據文獻納入和排除標準獨立篩選文獻,首先閱讀文題和摘要進行初次篩選,下載初篩時納入的文獻全文進行復篩。最后交叉核對,當篩選文獻過程中理解不一致產生分歧時,根據納入排除標準討論;如不能解決,咨詢第三方[10]。
1.3 文獻篩選及資料提取
兩名研究人員根據Cochrane handbook所建議的數據提取項目[10],使用制定好的Excel數據提取表獨立提取資料,提取的信息包括:① 基本信息特征:如標題、研究方法、第一作者、國家(第一作者)、發表時間、納入原始研究數量、作者數量、偏倚風險評估工具、具體疾病、疾病負擔評價指標;② AMSTAR-2相關評價內容。
1.4 方法學質量評估
AMSTAR-2包括16個條目;由兩位研究人員對各個條目進行評價,有分歧時經過討論解決。AMSTAR-2的5個條目評估選項包括“符合”“部分符合”“不符合”,1個條目還包括“僅納入NRSI或RCT”;3個條目的評估選項包括“符合”“不符合”“未執行Meta分析”。16個條目中條目2、條目4、條目7、條目9、條目11、條目13、條目15為關鍵條目,評估結果使用“高級”“中級”“低級”和“極低級”表示。當16個條目都符合或者僅有一個非關鍵條目不符合時評價結果為“高級”;存在一個以上非關鍵條目不符合則為“中級”;存在一個關鍵條目不符合、有或者沒有非關鍵條目不符合則為“低級”;存在一個以上的關鍵條目不符合、有或沒有非關鍵條目不符合則為“極低級”[9]。
1.5 統計分析
在Excel 2021中統計納入文獻的基本特征和AMSTAR-2評估結果。AMSTAR-2各條目中“符合”“部分符合”“不符合”等評價結果的文獻數量所占比例用百分比表示;文獻的各個基本特征使用頻數和百分比描述。分析納入的疾病負擔系統評價/Meta分析在AMSTAR-2發表時間(≤2017年、>2017年)上符合各個條目文獻數量的差異;使用RevMan 5.4分別計算RR和95%可信區間(95%CI),統計學顯著性設為P<0.05。
2 結果
2.1 文獻篩選結果
計算機檢索PubMed數據庫,初檢得到疾病負擔系統評價/Meta分析10 870篇,使用EndNote 20剔除重復文章10篇,初篩納入文獻10 860篇。進一步閱讀摘要和標題排除不符合納入標準的文獻10 269篇,得到591篇文獻;經過閱讀全文復篩,最終納入文獻308篇。文獻篩選流程見附件圖1。
2.2 納入文獻的基本特征
納入文獻中,2006年到2024年發表的文獻呈現波動上升趨勢;其中2024年發表文獻最多,為55篇(17.86%);2022年和2019年都發表了25篇(8.12%),2023年發表的文獻有40篇(12.99%)。308篇文獻發表自49個國家(第一作者所在國家),其中美國發表文獻的數量較多,為53篇(17.21%);其次發表文獻數量較多的國家依次是英國(11.36%)、中國(8.12%)和德國(7.14%);其余國家發表文獻的數量均在10篇以下。擁有資金資助的文獻為172篇(55.84%),未報告利益沖突的文獻有55篇(17.86%),未使用偏倚風險評估工具的文獻有149篇(48.38%)。詳細內容如附件表1。
2.3 方法學質量評估
將納入的308篇文獻使用AMSTAR-2評估,總體來看,有12篇文獻(3.90%)評估結果為低級,296篇文獻(96.10%)評估結果為極低級。條目1、條目5、條目8和條目16符合率超過了70%;條目3、條目10、條目13、條目14不符合率超過了70%。在關鍵條目中,符合率都比較低,條目4和條目9符合率相對較高,150篇文獻(48.70%)使用了全面的檢索策略,有158篇文獻(51.30%)使用了合理的偏倚風險評估方法;完全符合制定了前期研究方案的文獻有98篇(31.82%),提供排除研究清單和理由的文獻僅有9篇(2.92%)。其他條目中,251篇文獻(81.49%)研究篩選具有可重復性,253篇文獻(82.14%)報告了潛在利益沖突,見圖1。

*:為關鍵條目。
根據AMSTAR-2發表時間(≤2017年、>2017年),比較了符合AMSTAR-2各個條目文獻的數量,見附件圖2。結果顯示,條目2(制定前期研究方案)、條目5(研究篩選可重復性)、條目6(數據提取可重復性)、條目8(納入研究詳細基本信息)、條目9(偏倚風險評估合理性)和條目14(解釋討論異質性)未與無效線相交,差異有統計學意義,并且2017年之后發表的文獻在這幾個條目中,相較于2017年之前的文獻有改善。
3 討論
系統評價為臨床決策和深入研究提供了重要證據,但擁有嚴謹的研究過程和可靠結果的系統評價/Meta分析才能真正為臨床醫生、患者以及決策者提供科學的依據和指導[11],否則會產生誤導。隨著循證醫學在各研究領域發展的深入,疾病負擔系統評價/Meta分析的研究也相應增多。但不同的研究者在做系統評價/Meta分析時,受到不同因素的影響,導致質量高低不一[12]。本研究納入308篇文獻,綜合分析顯示相關系統評價/Meta分析部分條目在AMSTAR-2發表后文章符合率才有所改善,這可能由于2007年AMSTAR評價工具部分條目不能很好地評價方法學質量,且有些條目解釋存在困難;而2017年推出AMSTAR-2,在一定程度上解決了此前存在的問題[13]。另外,隨著循證醫學的發展和應用,更加規范了制作系統評價的流程,這也提高了系統評價/Meta分析的方法學質量。但目前的疾病負擔系統評價/Meta分析還存在其他的問題,還需提高其方法學質量。
前期研究方案注冊對提高系統評價/Meta分析方法學質量至關重要。試驗注冊是方法學質量評估關鍵條目之一,其對研究的方法學質量會有影響。目前雖沒有對系統評價/Meta分析注冊做強制性要求,但隨著該研究方法在各領域運用的增多和深入,發表偏倚等方法學質量問題越來越被關注,系統評價/Meta分析的注冊引起了學術界的關注[14]。系統評價/Meta分析注冊的主要作用是降低實施和報告偏倚,增加研究的透明性、結果穩健性,還為正在進行其他研究的人員提供重要資源[15]。此外,Straus等[16]研究發現未進行試驗注冊產生了同一主題系統評價重復發表的問題,從而耗費了巨大的人力和財力資源,而這些資源可以用于其他研究和提供保健服務,因此系統評價/Meta分析的前期研究方案注冊是有必要的。另外,在研究方案中需要細化研究問題、檢索式、納入排除標準以及偏倚風險評價等[17],注冊研究方案則有利于對這些問題的進一步規范,從而提高方法學質量。目前可以在PROSPRERO(https://www.crd.york.ac.uk/PROSPERO/)等平臺進行注冊,形成高質量的研究方案,為臨床工作者或其他決策者提供指導[18]。
全面檢索相關文獻,有利于提高結果可靠性。本研究納入的大部分文獻檢索不全面,未對灰色文獻、注冊平臺等進行檢索。系統評價的順利開展以原始研究為基礎,文獻檢索不全面可能會導致選擇偏倚、數據庫偏倚[19]。研究者應盡可能全面檢索文獻,追溯納入研究的參考文獻、補充檢索灰色文獻或咨詢相關領域專家等,確保納入研究的全面性,以增強研究結果的說服力。缺少排除研究清單不能很好地展示文獻選擇過程,從而對文獻質量評估造成干擾[20],降低文獻篩選過程的透明化[21]。排除的文獻清單可能由于篇幅限制的原因,不能在文中展示,可以將其做成附件一并提交,以便讀者查閱。
部分文獻未報告資金資助和資助者的角色,被資助研究有可能會報告研究結果偏向提供資金的一方[22],因此對資金來源的充分解釋是非常有必要的。另外,報告原始研究的基金資助信息可以幫助判斷可能存在的利益沖突[23],這將有利于同行評議專家和讀者對其有更好的把握。研究者可以參考Cochrane Library中某些高質量的系統評價,將納入研究的基金資助信息放入納入研究清單附件中。
研究者應該充分調查異質性的來源,做亞組分析并在討論部分進行合理解釋。本研究部分文獻做了異質性分析,并在討論部分解釋異質性來源,討論其對結果的影響。研究進行過程中可能還存在發表偏倚等因素影響系統評價結果;同時在檢測發表偏倚時,不僅要關注陽性結果還要關注陰性結果,研究者應該將漏斗圖或統計學檢驗結合文獻檢索是否全面來判斷發表偏倚的存在,進而充分討論其對研究結果產生的影響[17]。有研究表示使用漏斗圖評估發表偏倚敏感性不高[24],應該多維度評估發表偏倚,可以使用多種統計學方法,如Egger法、修剪填補法來分析發表偏倚[25]。
本研究存在一定局限性:僅檢索了PubMed數據庫的疾病負擔系統評價/Meta分析,且都為英文文獻,因此文獻發表語言存在一定的局限性;其次檢索和評價過程都是人工完成,可能存在因主觀因素造成的偏差。
綜上所述,使用AMSTAR-2評價本研究納入的308篇文獻,整體方法學質量較低,主要存在的問題包括缺乏前期研究方案、未補充檢索灰色文獻等導致檢索文獻不全面、未提供排除研究的清單并說明原因、缺乏對納入研究資金來源的報告等。因此,未來需要進一步重視系統評價制作流程的規范化,包括文獻篩選、數據提取等方面;重視研究方案的制定和注冊,保證后期研究的順利進行[26]。隨著技術的進步,信息化已成為諸多領域提升效率和效果的關鍵,未來研究應深入探討如何利用大數據、人工智能等現代信息技術,進一步優化系統評價制作的質量,提高其精準性和實時性。
疾病負擔研究在公共衛生領域具有重要作用,通過估算疾病導致的負擔幫助確定優先需要解決的問題,制定衛生防病的政策和策略,進而有效地分配有限的醫療資源[1, 2]。2020年,柳葉刀發布的2019 GBD專題報告,對全球204個國家和地區369種疾病和傷害的疾病負擔等數據進行了報道,對世界各國的衛生政策產生了重要影響[3];2024年,其再次發布2021 GBD研究報告,進一步系統分析811個國家/地區的288種死亡原因所造成的死亡率和壽命損失年,及其對全球人口的影響[4]。隨著循證醫學的發展,已有研究者采用系統評價方法進行疾病負擔的證據綜合,相關研究數量迅速增加,以求為衛生決策提供證據支持。
目前諸多領域使用系統評價方法開展研究,產出了相應的成果,并且許多研究者對其進行了方法學質量評價,發現這些研究存在不同程度的問題[5]。例如,某些研究可能沒有注冊研究方案,從而不能保證研究的前瞻性,也有研究未能納入灰色文獻,降低了文獻檢索的全面性并導致陽性結果概率增大[6, 7];另外還可能存在異質性、單個研究的偏倚風險對結果影響解釋不充分等問題。但是對于疾病負擔系統評價/Meta分析目前還沒有相關的方法學質量評價報告。相關系統評價/Meta分析可能會因研究設計不當等原因導致證據質量降低,從而誤導決策[8],因此對其進行質量評價非常重要,且有利于進一步指導證據的生產和利用。AMSTAR-2是目前應用廣泛的系統評價方法學質量評估工具[9]。本研究收集PubMed數據庫中疾病負擔系統評價/Meta分析,并進行方法學質量評估,為提升疾病負擔證據質量提供參考。
1 資料與方法
1.1 納入與排除標準
文獻納入標準為:① 研究類型為系統評價/Meta分析;② 結局指標為疾病負擔相關指標(如直接醫療費用、傷殘調整生命年等)。排除標準為:① 系統評價或者Meta分析的研究計劃書;② 綜述、會議論文或者摘要;③ 系統評價再評價;④ 重復發表和無法獲取全文的研究。
1.2 文獻檢索策略
計算機檢索PubMed數據庫,檢索時間為建庫到2024年10月12日,檢索詞包括:burden of illness、systematic review、meta-analysis等,詳細檢索策略見附件框1。由兩名研究人員根據文獻納入和排除標準獨立篩選文獻,首先閱讀文題和摘要進行初次篩選,下載初篩時納入的文獻全文進行復篩。最后交叉核對,當篩選文獻過程中理解不一致產生分歧時,根據納入排除標準討論;如不能解決,咨詢第三方[10]。
1.3 文獻篩選及資料提取
兩名研究人員根據Cochrane handbook所建議的數據提取項目[10],使用制定好的Excel數據提取表獨立提取資料,提取的信息包括:① 基本信息特征:如標題、研究方法、第一作者、國家(第一作者)、發表時間、納入原始研究數量、作者數量、偏倚風險評估工具、具體疾病、疾病負擔評價指標;② AMSTAR-2相關評價內容。
1.4 方法學質量評估
AMSTAR-2包括16個條目;由兩位研究人員對各個條目進行評價,有分歧時經過討論解決。AMSTAR-2的5個條目評估選項包括“符合”“部分符合”“不符合”,1個條目還包括“僅納入NRSI或RCT”;3個條目的評估選項包括“符合”“不符合”“未執行Meta分析”。16個條目中條目2、條目4、條目7、條目9、條目11、條目13、條目15為關鍵條目,評估結果使用“高級”“中級”“低級”和“極低級”表示。當16個條目都符合或者僅有一個非關鍵條目不符合時評價結果為“高級”;存在一個以上非關鍵條目不符合則為“中級”;存在一個關鍵條目不符合、有或者沒有非關鍵條目不符合則為“低級”;存在一個以上的關鍵條目不符合、有或沒有非關鍵條目不符合則為“極低級”[9]。
1.5 統計分析
在Excel 2021中統計納入文獻的基本特征和AMSTAR-2評估結果。AMSTAR-2各條目中“符合”“部分符合”“不符合”等評價結果的文獻數量所占比例用百分比表示;文獻的各個基本特征使用頻數和百分比描述。分析納入的疾病負擔系統評價/Meta分析在AMSTAR-2發表時間(≤2017年、>2017年)上符合各個條目文獻數量的差異;使用RevMan 5.4分別計算RR和95%可信區間(95%CI),統計學顯著性設為P<0.05。
2 結果
2.1 文獻篩選結果
計算機檢索PubMed數據庫,初檢得到疾病負擔系統評價/Meta分析10 870篇,使用EndNote 20剔除重復文章10篇,初篩納入文獻10 860篇。進一步閱讀摘要和標題排除不符合納入標準的文獻10 269篇,得到591篇文獻;經過閱讀全文復篩,最終納入文獻308篇。文獻篩選流程見附件圖1。
2.2 納入文獻的基本特征
納入文獻中,2006年到2024年發表的文獻呈現波動上升趨勢;其中2024年發表文獻最多,為55篇(17.86%);2022年和2019年都發表了25篇(8.12%),2023年發表的文獻有40篇(12.99%)。308篇文獻發表自49個國家(第一作者所在國家),其中美國發表文獻的數量較多,為53篇(17.21%);其次發表文獻數量較多的國家依次是英國(11.36%)、中國(8.12%)和德國(7.14%);其余國家發表文獻的數量均在10篇以下。擁有資金資助的文獻為172篇(55.84%),未報告利益沖突的文獻有55篇(17.86%),未使用偏倚風險評估工具的文獻有149篇(48.38%)。詳細內容如附件表1。
2.3 方法學質量評估
將納入的308篇文獻使用AMSTAR-2評估,總體來看,有12篇文獻(3.90%)評估結果為低級,296篇文獻(96.10%)評估結果為極低級。條目1、條目5、條目8和條目16符合率超過了70%;條目3、條目10、條目13、條目14不符合率超過了70%。在關鍵條目中,符合率都比較低,條目4和條目9符合率相對較高,150篇文獻(48.70%)使用了全面的檢索策略,有158篇文獻(51.30%)使用了合理的偏倚風險評估方法;完全符合制定了前期研究方案的文獻有98篇(31.82%),提供排除研究清單和理由的文獻僅有9篇(2.92%)。其他條目中,251篇文獻(81.49%)研究篩選具有可重復性,253篇文獻(82.14%)報告了潛在利益沖突,見圖1。

*:為關鍵條目。
根據AMSTAR-2發表時間(≤2017年、>2017年),比較了符合AMSTAR-2各個條目文獻的數量,見附件圖2。結果顯示,條目2(制定前期研究方案)、條目5(研究篩選可重復性)、條目6(數據提取可重復性)、條目8(納入研究詳細基本信息)、條目9(偏倚風險評估合理性)和條目14(解釋討論異質性)未與無效線相交,差異有統計學意義,并且2017年之后發表的文獻在這幾個條目中,相較于2017年之前的文獻有改善。
3 討論
系統評價為臨床決策和深入研究提供了重要證據,但擁有嚴謹的研究過程和可靠結果的系統評價/Meta分析才能真正為臨床醫生、患者以及決策者提供科學的依據和指導[11],否則會產生誤導。隨著循證醫學在各研究領域發展的深入,疾病負擔系統評價/Meta分析的研究也相應增多。但不同的研究者在做系統評價/Meta分析時,受到不同因素的影響,導致質量高低不一[12]。本研究納入308篇文獻,綜合分析顯示相關系統評價/Meta分析部分條目在AMSTAR-2發表后文章符合率才有所改善,這可能由于2007年AMSTAR評價工具部分條目不能很好地評價方法學質量,且有些條目解釋存在困難;而2017年推出AMSTAR-2,在一定程度上解決了此前存在的問題[13]。另外,隨著循證醫學的發展和應用,更加規范了制作系統評價的流程,這也提高了系統評價/Meta分析的方法學質量。但目前的疾病負擔系統評價/Meta分析還存在其他的問題,還需提高其方法學質量。
前期研究方案注冊對提高系統評價/Meta分析方法學質量至關重要。試驗注冊是方法學質量評估關鍵條目之一,其對研究的方法學質量會有影響。目前雖沒有對系統評價/Meta分析注冊做強制性要求,但隨著該研究方法在各領域運用的增多和深入,發表偏倚等方法學質量問題越來越被關注,系統評價/Meta分析的注冊引起了學術界的關注[14]。系統評價/Meta分析注冊的主要作用是降低實施和報告偏倚,增加研究的透明性、結果穩健性,還為正在進行其他研究的人員提供重要資源[15]。此外,Straus等[16]研究發現未進行試驗注冊產生了同一主題系統評價重復發表的問題,從而耗費了巨大的人力和財力資源,而這些資源可以用于其他研究和提供保健服務,因此系統評價/Meta分析的前期研究方案注冊是有必要的。另外,在研究方案中需要細化研究問題、檢索式、納入排除標準以及偏倚風險評價等[17],注冊研究方案則有利于對這些問題的進一步規范,從而提高方法學質量。目前可以在PROSPRERO(https://www.crd.york.ac.uk/PROSPERO/)等平臺進行注冊,形成高質量的研究方案,為臨床工作者或其他決策者提供指導[18]。
全面檢索相關文獻,有利于提高結果可靠性。本研究納入的大部分文獻檢索不全面,未對灰色文獻、注冊平臺等進行檢索。系統評價的順利開展以原始研究為基礎,文獻檢索不全面可能會導致選擇偏倚、數據庫偏倚[19]。研究者應盡可能全面檢索文獻,追溯納入研究的參考文獻、補充檢索灰色文獻或咨詢相關領域專家等,確保納入研究的全面性,以增強研究結果的說服力。缺少排除研究清單不能很好地展示文獻選擇過程,從而對文獻質量評估造成干擾[20],降低文獻篩選過程的透明化[21]。排除的文獻清單可能由于篇幅限制的原因,不能在文中展示,可以將其做成附件一并提交,以便讀者查閱。
部分文獻未報告資金資助和資助者的角色,被資助研究有可能會報告研究結果偏向提供資金的一方[22],因此對資金來源的充分解釋是非常有必要的。另外,報告原始研究的基金資助信息可以幫助判斷可能存在的利益沖突[23],這將有利于同行評議專家和讀者對其有更好的把握。研究者可以參考Cochrane Library中某些高質量的系統評價,將納入研究的基金資助信息放入納入研究清單附件中。
研究者應該充分調查異質性的來源,做亞組分析并在討論部分進行合理解釋。本研究部分文獻做了異質性分析,并在討論部分解釋異質性來源,討論其對結果的影響。研究進行過程中可能還存在發表偏倚等因素影響系統評價結果;同時在檢測發表偏倚時,不僅要關注陽性結果還要關注陰性結果,研究者應該將漏斗圖或統計學檢驗結合文獻檢索是否全面來判斷發表偏倚的存在,進而充分討論其對研究結果產生的影響[17]。有研究表示使用漏斗圖評估發表偏倚敏感性不高[24],應該多維度評估發表偏倚,可以使用多種統計學方法,如Egger法、修剪填補法來分析發表偏倚[25]。
本研究存在一定局限性:僅檢索了PubMed數據庫的疾病負擔系統評價/Meta分析,且都為英文文獻,因此文獻發表語言存在一定的局限性;其次檢索和評價過程都是人工完成,可能存在因主觀因素造成的偏差。
綜上所述,使用AMSTAR-2評價本研究納入的308篇文獻,整體方法學質量較低,主要存在的問題包括缺乏前期研究方案、未補充檢索灰色文獻等導致檢索文獻不全面、未提供排除研究的清單并說明原因、缺乏對納入研究資金來源的報告等。因此,未來需要進一步重視系統評價制作流程的規范化,包括文獻篩選、數據提取等方面;重視研究方案的制定和注冊,保證后期研究的順利進行[26]。隨著技術的進步,信息化已成為諸多領域提升效率和效果的關鍵,未來研究應深入探討如何利用大數據、人工智能等現代信息技術,進一步優化系統評價制作的質量,提高其精準性和實時性。