研究結果的選擇性不報告和發表偏倚影響系統評價和Meta分析的效度,進而影響臨床決策的制定。目前缺乏嚴格的方法評價網狀Meta分析證據缺失偏倚風險。本文介紹網狀Meta分析證據缺失偏倚風險評價工具ROB-MEN的主要內容,包括其工具表格、操作過程以及相關信號問題等。ROB-MEN工具的關鍵內容是兩兩比較表和ROB-MEN表,可應用于干預措施多、網絡結構復雜的網狀Meta分析,避免偏倚風險評價過程耗時久且耗費大量人力物力。同時ROB-MEN具有邏輯清晰、細節嚴謹、可用性強等優點,是首個評價網狀Meta分析證據缺失偏倚風險的工具,可為臨床研究者提供權威參考,值得推廣和應用。
引用本文: 胡玉鵬, 朱濤, 鄧湘金, 曾維, 陳金龍, 湯煒, 劉暢. 網狀Meta分析證據缺失偏倚風險評價工具ROB-MEN中文解讀. 中國循證醫學雜志, 2024, 24(4): 451-458. doi: 10.7507/1672-2531.202309087 復制
版權信息: ?四川大學華西醫院華西期刊社《中國循證醫學雜志》版權所有,未經授權不得轉載、改編
1 ROB-MEN工具的制定背景
證據缺失偏倚(bias due to missing evidence)又稱為不報告偏倚(non-reporting bias),包括研究內偏倚和研究間偏倚:研究內偏倚即對研究結果的選擇性不報告,是研究者根據研究結果的P值、大小或方向在研究報告中刻意不報告某些結果造成的偏倚,這種情況下證據缺失表現為研究結果缺失;研究間偏倚是由于研究結果的P值、大小或方向導致研究報告無法發表或延遲發表,或者即使發表也無法被系統評價獲取,如發表在非英文期刊或未被常用數據庫索引的期刊上,這類情況下證據缺失表現為研究缺失[1,2]。
傳統Meta分析(兩兩比較Meta分析,pairwise meta-analysis)可以采用多種方法評估證據缺失偏倚:定性方法包括將研究計劃書與已發表的報告作比較、對已發表與未發表來源的結果數據進行比較、對同一研究的重復發表的報告進行比較等;統計學方法包括漏斗圖[3-5]、小樣本研究效應檢驗(非參數秩相關檢驗、線性回歸檢驗、反正弦檢驗等)[3,6-8]、剪補法、外插法以及選擇模型[9,10]等。基于此,Page等[1]于2017年開發了用于評價證據缺失偏倚風險的ROB-ME(risk of bias due to missing evidence)工具。ROB-ME工具結合定性方法與統計學方法,可全面評價傳統Meta分析的證據缺失偏倚風險[1,2]。
網狀Meta分析是對傳統Meta分析的擴展,可以結合直接證據和間接證據進行多個干預措施之間的兩兩比較。由于沒有專門的方法學評價工具,網狀Meta分析的證據缺失偏倚評價通常使用兩兩比較Meta分析的數值方法。早在2012年,Chaimani等[11]針對評價網狀Meta分析中小樣本研究效應提出了基于網狀Meta回歸的模型,但對于存在較大異質性的情況表現較差,且可能會受到群體偏倚的影響;對于發表偏倚,Mavridis等[12]將貝葉斯選擇模型擴展至網狀Meta分析,然而該模型僅適用于星形網絡結構,對于全絡狀結構該模型仍需擴展;為了較為直觀地呈現證據基礎、假設評估、網狀Meta分析擬合模型及結果解釋,研究人員開發了一套多變量Meta分析Stata程序并用圖形形式呈現結果,其局限性在于每個圖形有用與否取決于數據的性質[13]。
然而目前對于網狀Meta分析中的證據缺失偏倚仍缺乏相關的方法學評價工具。為解決該問題,Chiocchia等[14]專家團隊于2020年共同制定網狀Meta分析證據缺失偏倚風險評價工具ROB-MEN(risk of bias due to missing evidence in network meta-analysis)。該團隊除了開發ROB-MEN工具以外,還開發了網頁應用以方便用戶使用ROB-MEN工具,網頁應用是基于R語言Shiny程序包制作而成。ROB-MEN工具結合了定性和定量的方法,在ROB-ME工具的基礎上增添了有關網狀Meta分析的內容,內容嚴謹科學且具有較強的實用性。目前國內仍未發表對ROB-MEN進行解讀的方法學文獻,因而該工具未得到大范圍使用。大多數國內網狀Meta分析對證據缺失偏倚風險的評價仍停留在使用兩兩比較Meta分析的數值方法,如漏斗圖等。
現階段Virginia等對ROB-MEN網頁版應用的具體流程進行了詳細說明[15]。目前為止,該工具已初步用于網狀Meta分析。Birkinshaw等[16]將ROB-MEN工具用于不同種類和不同劑量的抗抑郁藥對成人慢性疼痛管理的網狀Meta分析中,評價其證據缺失偏倚風險,取得了很好的效果。網狀Meta分析結構復雜,對研究者的數理統計能力要求極高。ROB-MEN作為第一個用來評價網狀Meta分析中證據缺失偏倚風險的工具,適用于不同的網狀Meta分析,評價證據缺失偏倚風險省時省力[14]。為保證使用可靠性,研究人員在使用前應熟悉該工具的基本理論,明確其框架結構;使用時若遇到數據分析或技術層面的問題,需及時尋求專業幫助[15]。本文旨在對ROB-MEN工具進行解讀。
2 ROB-MEN工具的解讀
ROB-MEN工具用于評價網狀Meta分析中的證據缺失偏倚,其流程見圖1,其結構形式主要是兩個表格即兩兩比較表(pairwise comparisons table)和ROB-MEN表(ROB-MEN table),分別用來評價兩兩比較中的證據缺失偏倚風險和網狀Meta分析效應估計值的證據缺失偏倚風險。其網頁應用操作過程清晰簡便,通過每一對兩兩比較的直接證據和間接證據等依據,完成每一對比較所對應表格中不同列的信息填寫,從而得出最終偏倚風險判斷。

2.1 兩兩比較中的證據缺失偏倚風險評價(兩兩比較表的填寫)
2.1.1 兩兩比較的分組
在包含T項干預措施的網狀Meta分析中,共有T(T?1)/2項可能的兩兩比較。根據現有研究數據中包含的證據情況將這些兩兩比較分成如下3個組,并填入兩兩比較表中(各組行數可根據具體情況增刪):A組—觀察到感興趣的研究結果,即在該組的比較中,有直接證據報告了感興趣的研究結果;B組—觀察到其他研究結果,即在該組的比較中,僅有其他結果的直接證據而沒有感興趣的研究結果的直接證據;C組—未觀察到研究結果,即該組的比較不存在任何直接證據。A組由于有直接證據報告了感興趣的研究結果,故稱為直接比較;而B、C兩組由于沒有感興趣的研究結果的直接證據,故稱為間接比較。
我們以一篇網狀Meta分析的系統評價為例[17],展示兩兩比較表(表1)。該系統評價包含18項干預措施(抗抑郁藥),共153項兩兩比較。在兩兩比較表中,70項比較分到A組,2項比較分到B組,81項比較分到C組。

對兩兩比較的分組完成之后,統計每項比較中報告了感興趣的研究結果的研究數量和系統評價確定的研究總數,并分別填入兩兩比較表的第1列和第2列中,括號內的數字代表受試者數量。值得注意的是,在B組中,報告了感興趣研究結果的研究數量及受試者數量(即表中第1列數據)均定義為0;在C組中,報告了感興趣研究結果的研究數量及受試者數量、系統評價確定的研究總量及受試者總量(即第1列、第2列的數據)均定義為0。
2.1.2 研究內偏倚評價
使用ROB-ME工具的步驟二[1]可以評價研究內偏倚,關于ROB-ME工具的解讀可以參考本團隊已發表的文章[2],在此不再贅述。基于ROB-ME工具的步驟二,A組和B組的每項比較的研究內偏倚可以通過表2的信號問題評價為兩種結果:① 對干預措施X有利;② 未檢測到偏倚。對C組而言,研究內偏倚評價結果為不適用。完成每項比較的研究內偏倚評價后,將評價結果填入兩兩比較表(表1)的第3列。

2.1.3 研究間偏倚評價
使用ROB-ME工具的步驟三[1,2]可以定性評價是否存在研究間偏倚,亦可參考表3進行定性評價;對不少于10項研究的兩兩比較,還可以考慮使用輪廓增強漏斗圖、Meta回歸模型、對小樣本研究效應的統計學檢驗、傳統Meta分析的選擇模型等統計學方法[6]定量評價研究間偏倚。研究間偏倚的評價結果亦為兩種結果:① 對干預措施X有利;② 未檢測到偏倚。完成每項比較的研究間偏倚評價后,將評價結果填入兩兩比較表(表1)的第4列。

2.1.4 兩兩比較中的整體評價
對A組和B組,完成研究內偏倚評價和研究間偏倚評價后,根據決策路徑(圖2)得出每項比較的證據缺失偏倚的整體評價結果:① 對干預措施X有利;② 未檢測到偏倚。對于C組,研究間偏倚評價結果即為整體偏倚評價結果。完成每項比較的證據缺失偏倚的整體評價后,將評價結果填入兩兩比較表(表1)的第5列。

2.2 網狀Meta分析效應估計的證據缺失偏倚風險評價(ROB-MEN表的填寫)
2.2.1 效應估計的分組
在網狀Meta分析中,每一項兩兩比較都可推斷出對應的效應,依據其證據來源,可以分為:直接效應估計、間接效應估計、混合效應估計。在ROB-MEN表中,我們把這些效應估計分為兩組:① 混合/直接效應估計,對應A組的直接比較;② 間接效應估計,對應B組和C組的間接比較。
仍以上述網狀Meta分析的系統評價為例[17],簡要展示ROB-MEN表(表4)。在ROB-MEN表中,70項比較的效應估計分到“混合/直接效應估計”組,對應兩兩比較表中A組;83項比較的效應估計分到“間接效應估計”組,對應兩兩比較表中B組和C組。

2.2.2 貢獻度評價
貢獻度圖(contribution plot)以矩陣列表的形式展示各項直接比較(即直接證據)在網狀Meta分析效應估計中的權重百分比(貢獻度),因此又稱為貢獻度矩陣,是網狀Meta分析的一種常見的可視化表達方式。貢獻度矩陣的行是網狀Meta分析的效應估計,包括混合效應估計、間接效應估計等;貢獻度矩陣的列是所有直接比較。利用Stata軟件計算貢獻度、繪制貢獻度矩陣可以參考趙坤等[18]的教程。
根據兩兩比較表(表1)A組的整體評價結果(第5列),可以確定哪些直接比較可能發生了偏倚,我們稱之為“有偏比較”。根據偏倚方向,分別將有偏比較的貢獻度填入ROB-MEN表(表4)的第1、2列中。
結合第1、2列兩個不同方向的有偏比較的貢獻度,定性評價每一行的效應估計的“有偏證據”的貢獻度,填入到ROB-MEN表(表4)第3列,評價結果有三種:① 有偏比較無實質性貢獻;② 有偏比較的實質性貢獻對干預措施X有利;③ 有偏比較的實質性貢獻相互抵消。評價標準為:① 若第1、2列的貢獻度差值<15%且至少有一列為0,則有偏比較無實質性貢獻;② 若第1、2列的貢獻度差值≥15%,則有偏比較的實質性貢獻對干預措施X有利;③ 其余情況下,則有偏比較的實質性貢獻相互抵消。
2.2.3 間接證據的偏倚評價
對“間接效應估計”組,將兩兩比較表(表1)B、C組的整體評價結果(第5列)填入ROB-MEN表(表4)的第4列,即為間接證據的偏倚評價結果。對“混合/直接效應估計”組,ROB-MEN表(表4)的第4列保持空白。
2.2.4 小樣本研究效應評價
將網狀Meta分析的效應估計填入ROB-MEN表(表4)的第5列,包括點估計值與95%置信區間的區間估計范圍。然后,使用納入研究的方差或標準誤作為協變量,建立網狀Meta回歸(network meta-analysis regression,NMR)模型[14],計算出NMR模型在取納入研究的方差最小值時的效應估計,包括點估計與區間估計,填入ROB-MEN表(表4)的第6列。通過觀察第5列NMA區間估計與第6列NMR區間估計是否有重疊,即可定性評價是否存在小樣本研究效應:若兩個區間有重疊,則評價結果為“無小樣本研究效應”;若兩個區間無重疊,則考慮有小樣本研究效應,需要進一步確定偏倚方向,評價結果為“小樣本研究效應對干預措施X有利”。完成小樣本研究效應評價后,將評價結果填入ROB-MEN表(表4)的第7列。
2.2.5 網狀Meta分析效應估計的整體偏倚風險評價
參考表5對每項網狀Meta分析效應估計的證據缺失偏倚的整體偏倚風險進行評價,評價結果分為三級:低風險、中風險、高風險,然后把評價結果填入ROB-MEN表(表4)的第8列。

2.3 網狀Meta分析效應估計的證據缺失偏倚風險評價結果的可視化表達
完成每項網狀Meta分析效應估計的證據缺失偏倚的整體偏倚風險評價以后,即填完ROB-MEN表(表4)的第8列以后,可以繪制正交表來表達證據缺失偏倚風險。我們繼續以上述網狀Meta分析的系統評價為例[17]繪制正交表(圖3):正交表的對角線為18項干預措施(抗抑郁藥),對角線上每格為白色;對角線以外的每格都代表對應列與對應行的兩種干預措施之間的兩兩比較,其顏色代表不同的偏倚風險等級,綠色代表低風險,黃色代表中風險,紅色代表高風險;對角線下方的每格的內容是對應列與對應行的兩種干預措施之間的效應估計,本系統評價中是比值比的點估計值及95%置信區間;對角線上方的紅色格子則填寫偏倚方向,填寫X即代表證據缺失偏倚方向對干預措施X有利。

3 討論
證據缺失偏倚會影響網狀Meta分析的可靠性,因此需對網狀Meta分析包含的所有干預措施的兩兩比較采用恰當的方法學質量評價。ROB-MEN是第一個評價網狀Meta分析證據缺失偏倚風險的工具,具有邏輯清晰、細節嚴謹、可用性強等優點。在CINeMA的報告偏倚領域也采納了ROB-MEN工具[19]。
ROB-MEN工具以傳統Meta分析為基礎,核心是兩兩比較表和ROB-MEN表,回答一系列邏輯嚴密的信號問題,進而對網狀Meta分析中各個比較的證據缺失偏倚風險做出準確判斷,在評價過程中較少依靠評價者的主觀性,例如其中使用到的貢獻矩陣以及網狀Meta回歸模型等定量分析方法。其評價流程科學嚴謹,各步驟有機結合,互不可分。在ROB-MEN工具中,研究內偏倚風險評估和研究間偏倚評估的標準參考了ROB-ME工具中的步驟二至步驟三的部分[1],是ROB-ME工具的拓展延伸。
網狀Meta分析可能包含諸多干預措施,繼而形成大量的兩兩比較,導致研究內容多且繁瑣,評價偏倚風險需要諸多人力物力,過程冗長耗時,如本文中示例的網狀Meta分析[17]包含18項干預措施合計153項兩兩比較。對于評價者而言,工作量和繁瑣程度都將是相當巨大的挑戰。基于R語言Shiny程序包開發的網頁應用很好地解決了這一問題,增強了ROB-MEN工具的可行性。用戶在評價了所有比較的偏倚風險后,該網頁就會自動生成兩兩比較表和ROB-MEN表,操作簡便,適用性強。但ROB-MEN工具也存在局限性。它不適用于網狀Meta分析中位于網絡結構之外感興趣的干預措施,無法處理與網絡不連接的干預措施之間的比較。這種情況下可先分別評價每一個子網絡進而得到偏倚風險的最終評價[14]。
我國的網狀Meta分析取得了長足的進步。早在2011年,國內的第一篇網狀Meta分析相關文獻在《中國循證兒科雜志》上發表[20]。此后的十余年間,網狀Meta分析在國內開展迅速。截至目前,僅國內公開發表的網狀Meta分析就多達1300余篇。其范圍涵蓋廣泛,包括動物實驗網狀Meta分析、生存數據網狀Meta分析、單個病例數據網狀Meta分析和觀察性研究網狀Meta分析等。國內也有學者發表了相關方法學文獻[21-25],對于推動國內網狀Meta分析的發展起到了重要作用。雖然ROB-MEN工具在國內的應用尚未普及,但根據目前國內網狀Meta分析的發展速度,未來有進一步使用并成為評價證據缺失偏倚風險主流工具的趨勢。隨著國內網狀Meta分析的進一步發展,對于該工具的需求不斷增大。為適應需求,ROB-MEN工具可考慮推出漢化版網頁應用,便于廣大國內用戶使用。
對于我國數量眾多的研究者而言,ROB-MEN工具的使用能夠極大提高網狀Meta分析的研究效率,便于用戶理解和操作。同時,該工具的理論框架和底層邏輯也為國內專業統計學家和計算機專家提供了借鑒思路,從而開發更多網狀Meta分析相關的工具。綜上所述,ROB-MEN工具未來可為臨床研究者提供權威參考,尤其是在評價多項干預措施并存的網狀Meta分析證據缺失偏倚風險方面值得推廣和應用。
1 ROB-MEN工具的制定背景
證據缺失偏倚(bias due to missing evidence)又稱為不報告偏倚(non-reporting bias),包括研究內偏倚和研究間偏倚:研究內偏倚即對研究結果的選擇性不報告,是研究者根據研究結果的P值、大小或方向在研究報告中刻意不報告某些結果造成的偏倚,這種情況下證據缺失表現為研究結果缺失;研究間偏倚是由于研究結果的P值、大小或方向導致研究報告無法發表或延遲發表,或者即使發表也無法被系統評價獲取,如發表在非英文期刊或未被常用數據庫索引的期刊上,這類情況下證據缺失表現為研究缺失[1,2]。
傳統Meta分析(兩兩比較Meta分析,pairwise meta-analysis)可以采用多種方法評估證據缺失偏倚:定性方法包括將研究計劃書與已發表的報告作比較、對已發表與未發表來源的結果數據進行比較、對同一研究的重復發表的報告進行比較等;統計學方法包括漏斗圖[3-5]、小樣本研究效應檢驗(非參數秩相關檢驗、線性回歸檢驗、反正弦檢驗等)[3,6-8]、剪補法、外插法以及選擇模型[9,10]等。基于此,Page等[1]于2017年開發了用于評價證據缺失偏倚風險的ROB-ME(risk of bias due to missing evidence)工具。ROB-ME工具結合定性方法與統計學方法,可全面評價傳統Meta分析的證據缺失偏倚風險[1,2]。
網狀Meta分析是對傳統Meta分析的擴展,可以結合直接證據和間接證據進行多個干預措施之間的兩兩比較。由于沒有專門的方法學評價工具,網狀Meta分析的證據缺失偏倚評價通常使用兩兩比較Meta分析的數值方法。早在2012年,Chaimani等[11]針對評價網狀Meta分析中小樣本研究效應提出了基于網狀Meta回歸的模型,但對于存在較大異質性的情況表現較差,且可能會受到群體偏倚的影響;對于發表偏倚,Mavridis等[12]將貝葉斯選擇模型擴展至網狀Meta分析,然而該模型僅適用于星形網絡結構,對于全絡狀結構該模型仍需擴展;為了較為直觀地呈現證據基礎、假設評估、網狀Meta分析擬合模型及結果解釋,研究人員開發了一套多變量Meta分析Stata程序并用圖形形式呈現結果,其局限性在于每個圖形有用與否取決于數據的性質[13]。
然而目前對于網狀Meta分析中的證據缺失偏倚仍缺乏相關的方法學評價工具。為解決該問題,Chiocchia等[14]專家團隊于2020年共同制定網狀Meta分析證據缺失偏倚風險評價工具ROB-MEN(risk of bias due to missing evidence in network meta-analysis)。該團隊除了開發ROB-MEN工具以外,還開發了網頁應用以方便用戶使用ROB-MEN工具,網頁應用是基于R語言Shiny程序包制作而成。ROB-MEN工具結合了定性和定量的方法,在ROB-ME工具的基礎上增添了有關網狀Meta分析的內容,內容嚴謹科學且具有較強的實用性。目前國內仍未發表對ROB-MEN進行解讀的方法學文獻,因而該工具未得到大范圍使用。大多數國內網狀Meta分析對證據缺失偏倚風險的評價仍停留在使用兩兩比較Meta分析的數值方法,如漏斗圖等。
現階段Virginia等對ROB-MEN網頁版應用的具體流程進行了詳細說明[15]。目前為止,該工具已初步用于網狀Meta分析。Birkinshaw等[16]將ROB-MEN工具用于不同種類和不同劑量的抗抑郁藥對成人慢性疼痛管理的網狀Meta分析中,評價其證據缺失偏倚風險,取得了很好的效果。網狀Meta分析結構復雜,對研究者的數理統計能力要求極高。ROB-MEN作為第一個用來評價網狀Meta分析中證據缺失偏倚風險的工具,適用于不同的網狀Meta分析,評價證據缺失偏倚風險省時省力[14]。為保證使用可靠性,研究人員在使用前應熟悉該工具的基本理論,明確其框架結構;使用時若遇到數據分析或技術層面的問題,需及時尋求專業幫助[15]。本文旨在對ROB-MEN工具進行解讀。
2 ROB-MEN工具的解讀
ROB-MEN工具用于評價網狀Meta分析中的證據缺失偏倚,其流程見圖1,其結構形式主要是兩個表格即兩兩比較表(pairwise comparisons table)和ROB-MEN表(ROB-MEN table),分別用來評價兩兩比較中的證據缺失偏倚風險和網狀Meta分析效應估計值的證據缺失偏倚風險。其網頁應用操作過程清晰簡便,通過每一對兩兩比較的直接證據和間接證據等依據,完成每一對比較所對應表格中不同列的信息填寫,從而得出最終偏倚風險判斷。

2.1 兩兩比較中的證據缺失偏倚風險評價(兩兩比較表的填寫)
2.1.1 兩兩比較的分組
在包含T項干預措施的網狀Meta分析中,共有T(T?1)/2項可能的兩兩比較。根據現有研究數據中包含的證據情況將這些兩兩比較分成如下3個組,并填入兩兩比較表中(各組行數可根據具體情況增刪):A組—觀察到感興趣的研究結果,即在該組的比較中,有直接證據報告了感興趣的研究結果;B組—觀察到其他研究結果,即在該組的比較中,僅有其他結果的直接證據而沒有感興趣的研究結果的直接證據;C組—未觀察到研究結果,即該組的比較不存在任何直接證據。A組由于有直接證據報告了感興趣的研究結果,故稱為直接比較;而B、C兩組由于沒有感興趣的研究結果的直接證據,故稱為間接比較。
我們以一篇網狀Meta分析的系統評價為例[17],展示兩兩比較表(表1)。該系統評價包含18項干預措施(抗抑郁藥),共153項兩兩比較。在兩兩比較表中,70項比較分到A組,2項比較分到B組,81項比較分到C組。

對兩兩比較的分組完成之后,統計每項比較中報告了感興趣的研究結果的研究數量和系統評價確定的研究總數,并分別填入兩兩比較表的第1列和第2列中,括號內的數字代表受試者數量。值得注意的是,在B組中,報告了感興趣研究結果的研究數量及受試者數量(即表中第1列數據)均定義為0;在C組中,報告了感興趣研究結果的研究數量及受試者數量、系統評價確定的研究總量及受試者總量(即第1列、第2列的數據)均定義為0。
2.1.2 研究內偏倚評價
使用ROB-ME工具的步驟二[1]可以評價研究內偏倚,關于ROB-ME工具的解讀可以參考本團隊已發表的文章[2],在此不再贅述。基于ROB-ME工具的步驟二,A組和B組的每項比較的研究內偏倚可以通過表2的信號問題評價為兩種結果:① 對干預措施X有利;② 未檢測到偏倚。對C組而言,研究內偏倚評價結果為不適用。完成每項比較的研究內偏倚評價后,將評價結果填入兩兩比較表(表1)的第3列。

2.1.3 研究間偏倚評價
使用ROB-ME工具的步驟三[1,2]可以定性評價是否存在研究間偏倚,亦可參考表3進行定性評價;對不少于10項研究的兩兩比較,還可以考慮使用輪廓增強漏斗圖、Meta回歸模型、對小樣本研究效應的統計學檢驗、傳統Meta分析的選擇模型等統計學方法[6]定量評價研究間偏倚。研究間偏倚的評價結果亦為兩種結果:① 對干預措施X有利;② 未檢測到偏倚。完成每項比較的研究間偏倚評價后,將評價結果填入兩兩比較表(表1)的第4列。

2.1.4 兩兩比較中的整體評價
對A組和B組,完成研究內偏倚評價和研究間偏倚評價后,根據決策路徑(圖2)得出每項比較的證據缺失偏倚的整體評價結果:① 對干預措施X有利;② 未檢測到偏倚。對于C組,研究間偏倚評價結果即為整體偏倚評價結果。完成每項比較的證據缺失偏倚的整體評價后,將評價結果填入兩兩比較表(表1)的第5列。

2.2 網狀Meta分析效應估計的證據缺失偏倚風險評價(ROB-MEN表的填寫)
2.2.1 效應估計的分組
在網狀Meta分析中,每一項兩兩比較都可推斷出對應的效應,依據其證據來源,可以分為:直接效應估計、間接效應估計、混合效應估計。在ROB-MEN表中,我們把這些效應估計分為兩組:① 混合/直接效應估計,對應A組的直接比較;② 間接效應估計,對應B組和C組的間接比較。
仍以上述網狀Meta分析的系統評價為例[17],簡要展示ROB-MEN表(表4)。在ROB-MEN表中,70項比較的效應估計分到“混合/直接效應估計”組,對應兩兩比較表中A組;83項比較的效應估計分到“間接效應估計”組,對應兩兩比較表中B組和C組。

2.2.2 貢獻度評價
貢獻度圖(contribution plot)以矩陣列表的形式展示各項直接比較(即直接證據)在網狀Meta分析效應估計中的權重百分比(貢獻度),因此又稱為貢獻度矩陣,是網狀Meta分析的一種常見的可視化表達方式。貢獻度矩陣的行是網狀Meta分析的效應估計,包括混合效應估計、間接效應估計等;貢獻度矩陣的列是所有直接比較。利用Stata軟件計算貢獻度、繪制貢獻度矩陣可以參考趙坤等[18]的教程。
根據兩兩比較表(表1)A組的整體評價結果(第5列),可以確定哪些直接比較可能發生了偏倚,我們稱之為“有偏比較”。根據偏倚方向,分別將有偏比較的貢獻度填入ROB-MEN表(表4)的第1、2列中。
結合第1、2列兩個不同方向的有偏比較的貢獻度,定性評價每一行的效應估計的“有偏證據”的貢獻度,填入到ROB-MEN表(表4)第3列,評價結果有三種:① 有偏比較無實質性貢獻;② 有偏比較的實質性貢獻對干預措施X有利;③ 有偏比較的實質性貢獻相互抵消。評價標準為:① 若第1、2列的貢獻度差值<15%且至少有一列為0,則有偏比較無實質性貢獻;② 若第1、2列的貢獻度差值≥15%,則有偏比較的實質性貢獻對干預措施X有利;③ 其余情況下,則有偏比較的實質性貢獻相互抵消。
2.2.3 間接證據的偏倚評價
對“間接效應估計”組,將兩兩比較表(表1)B、C組的整體評價結果(第5列)填入ROB-MEN表(表4)的第4列,即為間接證據的偏倚評價結果。對“混合/直接效應估計”組,ROB-MEN表(表4)的第4列保持空白。
2.2.4 小樣本研究效應評價
將網狀Meta分析的效應估計填入ROB-MEN表(表4)的第5列,包括點估計值與95%置信區間的區間估計范圍。然后,使用納入研究的方差或標準誤作為協變量,建立網狀Meta回歸(network meta-analysis regression,NMR)模型[14],計算出NMR模型在取納入研究的方差最小值時的效應估計,包括點估計與區間估計,填入ROB-MEN表(表4)的第6列。通過觀察第5列NMA區間估計與第6列NMR區間估計是否有重疊,即可定性評價是否存在小樣本研究效應:若兩個區間有重疊,則評價結果為“無小樣本研究效應”;若兩個區間無重疊,則考慮有小樣本研究效應,需要進一步確定偏倚方向,評價結果為“小樣本研究效應對干預措施X有利”。完成小樣本研究效應評價后,將評價結果填入ROB-MEN表(表4)的第7列。
2.2.5 網狀Meta分析效應估計的整體偏倚風險評價
參考表5對每項網狀Meta分析效應估計的證據缺失偏倚的整體偏倚風險進行評價,評價結果分為三級:低風險、中風險、高風險,然后把評價結果填入ROB-MEN表(表4)的第8列。

2.3 網狀Meta分析效應估計的證據缺失偏倚風險評價結果的可視化表達
完成每項網狀Meta分析效應估計的證據缺失偏倚的整體偏倚風險評價以后,即填完ROB-MEN表(表4)的第8列以后,可以繪制正交表來表達證據缺失偏倚風險。我們繼續以上述網狀Meta分析的系統評價為例[17]繪制正交表(圖3):正交表的對角線為18項干預措施(抗抑郁藥),對角線上每格為白色;對角線以外的每格都代表對應列與對應行的兩種干預措施之間的兩兩比較,其顏色代表不同的偏倚風險等級,綠色代表低風險,黃色代表中風險,紅色代表高風險;對角線下方的每格的內容是對應列與對應行的兩種干預措施之間的效應估計,本系統評價中是比值比的點估計值及95%置信區間;對角線上方的紅色格子則填寫偏倚方向,填寫X即代表證據缺失偏倚方向對干預措施X有利。

3 討論
證據缺失偏倚會影響網狀Meta分析的可靠性,因此需對網狀Meta分析包含的所有干預措施的兩兩比較采用恰當的方法學質量評價。ROB-MEN是第一個評價網狀Meta分析證據缺失偏倚風險的工具,具有邏輯清晰、細節嚴謹、可用性強等優點。在CINeMA的報告偏倚領域也采納了ROB-MEN工具[19]。
ROB-MEN工具以傳統Meta分析為基礎,核心是兩兩比較表和ROB-MEN表,回答一系列邏輯嚴密的信號問題,進而對網狀Meta分析中各個比較的證據缺失偏倚風險做出準確判斷,在評價過程中較少依靠評價者的主觀性,例如其中使用到的貢獻矩陣以及網狀Meta回歸模型等定量分析方法。其評價流程科學嚴謹,各步驟有機結合,互不可分。在ROB-MEN工具中,研究內偏倚風險評估和研究間偏倚評估的標準參考了ROB-ME工具中的步驟二至步驟三的部分[1],是ROB-ME工具的拓展延伸。
網狀Meta分析可能包含諸多干預措施,繼而形成大量的兩兩比較,導致研究內容多且繁瑣,評價偏倚風險需要諸多人力物力,過程冗長耗時,如本文中示例的網狀Meta分析[17]包含18項干預措施合計153項兩兩比較。對于評價者而言,工作量和繁瑣程度都將是相當巨大的挑戰。基于R語言Shiny程序包開發的網頁應用很好地解決了這一問題,增強了ROB-MEN工具的可行性。用戶在評價了所有比較的偏倚風險后,該網頁就會自動生成兩兩比較表和ROB-MEN表,操作簡便,適用性強。但ROB-MEN工具也存在局限性。它不適用于網狀Meta分析中位于網絡結構之外感興趣的干預措施,無法處理與網絡不連接的干預措施之間的比較。這種情況下可先分別評價每一個子網絡進而得到偏倚風險的最終評價[14]。
我國的網狀Meta分析取得了長足的進步。早在2011年,國內的第一篇網狀Meta分析相關文獻在《中國循證兒科雜志》上發表[20]。此后的十余年間,網狀Meta分析在國內開展迅速。截至目前,僅國內公開發表的網狀Meta分析就多達1300余篇。其范圍涵蓋廣泛,包括動物實驗網狀Meta分析、生存數據網狀Meta分析、單個病例數據網狀Meta分析和觀察性研究網狀Meta分析等。國內也有學者發表了相關方法學文獻[21-25],對于推動國內網狀Meta分析的發展起到了重要作用。雖然ROB-MEN工具在國內的應用尚未普及,但根據目前國內網狀Meta分析的發展速度,未來有進一步使用并成為評價證據缺失偏倚風險主流工具的趨勢。隨著國內網狀Meta分析的進一步發展,對于該工具的需求不斷增大。為適應需求,ROB-MEN工具可考慮推出漢化版網頁應用,便于廣大國內用戶使用。
對于我國數量眾多的研究者而言,ROB-MEN工具的使用能夠極大提高網狀Meta分析的研究效率,便于用戶理解和操作。同時,該工具的理論框架和底層邏輯也為國內專業統計學家和計算機專家提供了借鑒思路,從而開發更多網狀Meta分析相關的工具。綜上所述,ROB-MEN工具未來可為臨床研究者提供權威參考,尤其是在評價多項干預措施并存的網狀Meta分析證據缺失偏倚風險方面值得推廣和應用。