系統評價與Meta分析已成為整合多源研究數據、提升證據質量的核心方法。傳統Meta分析在處理多種治療選項時顯示出局限性,而網狀Meta分析(NMA)通過構建涵蓋多種治療選項的證據網絡,允許同時比較多個治療方案的直接與間接證據,從而提供更全面、精確的臨床決策支持。本文全面回顧了NMA的統計學原理、三個基本假設及其統計推斷框架,并對比分析了目前主流的NMA軟件與軟件包,如R(gemtc、netmeta、rjags、pcnetmeta等)、Stata(mvmeta、network)、WinBUGS、SAS、ADDIS及各類在線應用等,指出其優缺點及適用場景,為研究者在各種臨床研究和政策制定中提供一個科學、統一的指導框架。
版權信息: ?四川大學華西醫院華西期刊社《中國循證醫學雜志》版權所有,未經授權不得轉載、改編
在當今醫學研究領域,系統評價與Meta分析已成為證據綜合的主要方法,通過整合不同研究結果,有效提升證據的可靠性與質量。這些分析方法有效克服了單一研究間因樣本量不足或結果不一致而帶來的局限,為臨床決策提供堅實的科學支撐。然而,傳統的Meta分析通常限于比較兩種干預措施的效果,面對多種治療選項時,則無法全面評估各種方案的相對效益[1,2]。
網狀Meta分析(NMA)作為Meta分析的擴展,可以同時比較多個治療方案的直接與間接證據。通過構建包含所有治療選擇的網絡,NMA增強了證據的科學性和可靠性,并為臨床決策提供了更為全面精確的指導[3-5]。例如,在癌癥治療方案比較中,NMA揭示了各種方案的相對優勢,輔助醫生為患者定制個性化治療計劃[6,7]。近年來,這一方法已被廣泛應用,并受到Lancet[8]與BMJ[9]等高影響力醫學期刊的關注與推廣。此外,在藥物經濟學評估和公共衛生政策制定等領域,NMA也展現了其重要價值[10,11]。
鑒于NMA方法學的復雜性,其實際應用中常出現方法論不一、數據呈現不統一以及軟件工具與報告標準不一致等問題,這些問題降低了研究結果的可比性與一致性。此外,研究者對于頻率論與貝葉斯方法兩種主要模型的理解與應用不一,增加了結果的異質性。因此,本研究系統介紹了NMA的基本原理與方法,并對目前主流使用的NMA軟件及軟件包進行了詳盡比較與分析,旨在提供一個統一的科學指導框架,幫助研究者更有效地理解與應用這一重要分析方法。
1 NMA分析統計學原理與三個基本假設
1.1 NMA分析統計學原理簡介
NMA通過整合直接比較和間接比較的證據,增強研究結果的可靠性與全面性,其核心在于構建和分析一個包含多種治療措施的多臂試驗網絡,使得每種治療都可以與多個其他診療方案進行比較。目前,NMA的主要原理包括:
① 調整間接比較(AIC)[4]:作為NMA的基礎方法之一,AIC允許通過共同對照組間接評估兩種治療方法的效果,這種方法最初由Bucher等[12,13]提出,已成為進行間接比較的經典技術,具體方法如下:
![]() |
![]() |
假設存在治療a和b,以及對照c,為比較治療a和b,可以通過共同對照c進行間接比較。其中,和
分別表示干預措施a與c、b與c在某結果指標效應量OR的對數;
與
則分別代表干預措施a與c、b與c在某結果指標效應量OR的標準誤。
② 混合治療效應(MTC)[4]:此方法在AIC基礎上進行了擴展,它通過綜合直接比較和間接比較的結果,使用統計方法合成所有可用證據,這不僅增強了分析的統計效力,且提高了精確性,為臨床決策提供了更全面的證據基礎。
其合并結果為:
![]() |
其標準誤差為:
![]() |
![]() |
直接比較結果的效應量和標準誤分別為與
,公式1和公式3同樣適用于相對危險度和危險比;對于連續性變量,無需對效應量取對數,可直接按結果(均數差)進行計算。
1.2 NMA的三個基本假設
NMA的基本假設包括同質性、相似性與一致性[1,14],這是確保分析準確性和可靠性的關鍵。同質性即要求納入的研究評估相同或相似的效應,可通過固定效應或隨機效應模型進行分析,常用Cochran’s Q統計量檢驗同質性;相似性假設保證間接比較的合理性,要求納入的研究在臨床和方法學方面保持一致性,嚴格的納入和排除標準有助于提高研究間的可比性;一致性假設指出直接比較和間接比較的結果應相符,在閉合環的證據網絡中尤其重要,可通過節點拆分法、不一致性方差估計法和反向計算法等進行一致性檢驗。
2 NMA統計推斷框架
2.1 頻率論框架
2.1.1 原理概述
頻率論方法[2,15,16](frequentist statistics)通過直接和間接比較不同干預措施的效應,使用樣本數據進行假設檢驗和效應估計,基于統計推斷方法(如可信區間和P值)來評估干預效果。頻率論不依賴于先驗信息,采用最大似然估計或最小二乘法求解參數,因此在處理新領域或數據稀缺的情況下具有計算速度快的優勢。
2.1.2 主要模型算法與適用場景
頻率論方法主要包括倒方差法(IV)和廣義線性(混合)模型[GLM(GLMM)][2,17]。IV法通過將各研究效應值的方差倒數作為權重進行加權平均,計算出的總體效應方差為權重之和的倒數[18]。這種方法適合于效應量較一致的場景,計算簡單直觀,然而在研究間異質性較大的情況下,這種方法的效果可能會受限。
GLMM通過對數據進行適當的變換,使干預效應近似線性化,適用于處理連續變量、二分類變量、多分類變量和計數變量等多種結局變量類型[17]。GLMM的靈活性和廣泛的應用范圍使其在研究間存在顯著異質性的情況下能提供穩健的結果,能夠處理固定效應及隨機效應。
2.2 貝葉斯模型
2.2.1 原理概述
貝葉斯方法(Bayesian models)基于貝葉斯統計學原理,結合先驗信息與觀測數據,利用貝葉斯定理估計和推斷效應,貝葉斯定理的基本形式[2]為:
![]() |
其中,是后驗分布,表示在給定數據
后參數
的概率分布;
是似然函數,表示在給定參數
下觀測到數據
的概率;
是先驗分布,表示在沒有觀測數據時參數
的先驗信息;P
D)是數據的邊際分布,可以通過積分在整個參數空間中得到。
在貝葉斯NMA中,先驗分布與似然函數共同構成后驗分布,用于估計干預措施的效果[17]。此模型適用于固定效應和隨機效應模型,前者假設所有研究共享一個真實效應量,后者假設效應量在不同研究間變異,但可用隨機效應解釋這種異質性。貝葉斯推斷結果以后驗分布形式呈現,顯示效應量的整體概率分布,并允許通過更新后驗信息作為新的先驗信息,實現信息的迭代更新,為決策提供全面信息。
2.2.2 主要模型算法與適用場景
貝葉斯模型在干預性試驗NMA中廣泛應用,主要通過馬爾可夫鏈蒙特卡羅(MCMC)算法實現[19],MCMC構建馬爾科夫鏈以從后驗分布中抽樣,逐步逼近其真實形態。常用的MCMC算法包括吉布斯抽樣(Gibbs sampling)和Metropolis-Hastings算法(M-H算法)。
貝葉斯方法的優勢在于,面對數據稀缺或不確定性較大的情況,能夠引入先驗信息以提供穩健結果,尤其在處理小樣本或高異質性研究時。此外,其能“自動”考慮研究間方差的不確定性,并將其整合入效應量的后驗分布中,形成一個“總”不確定性,反映在95%可信區間內。
3 NMA統計分析主流軟件與軟件包介紹
隨著NMA領域的不斷發展,眾多軟件和軟件包相繼問世[20-44],極大地簡化了NMA的執行流程,從而使得研究者可以更加高效地進行復雜的數據分析(表1)。本部分旨在介紹和比較這些主流統計分析軟件和軟件包,以幫助研究者全面了解各工具的功能、優缺點及適用場景,從而做出合適的選擇。

3.1 軟件簡介
在NMA領域中,各類軟件和工具包得到了廣泛應用。R語言憑借其開源性質和強大的社區支持,已成為NMA分析的首選工具之一[45],其擁有多個專為NMA設計的軟件包,如“netmeta”“gemtc”和“metafor”,這些軟件包提供了從數據管理到高級統計分析、異質性檢測、一致性評估及結果可視化的全面功能。此外,Stata和SAS等其他主流軟件也為NMA提供了強有力的支持,其中,Stata以其用戶友好的界面和高效的數據處理能力而聞名,SAS則專注于復雜的統計建模。同時,貝葉斯分析工具如WinBUGS、OpenBUGS、ADDIS、JAGS及基于Excel的NetMetaXL插件和各類在線NMA應用,也是執行NMA的常用選擇。研究者在選擇不同工具時需考慮到具體需求、分析的復雜度以及對軟件的熟悉程度。
3.2 方法學框架的選擇
在NMA實踐中,不同的軟件包顯示出其方法學傾向和功能的差異。盡管當前大多數統計軟件趨向于采用貝葉斯方法來應對復雜數據結構和模型參數的不確定性,但頻率論方法在某些應用場景下仍保持其重要性。
貝葉斯方法因其靈活性及對先驗知識的整合能力而受到廣泛關注,R語言中的“gemtc”“rjags”和“pcnetmeta”等包為研究者提供了全面的貝葉斯分析工具。同時,WinBUGS和OpenBUGS等軟件也專注于處理復雜的貝葉斯模型,使研究者能夠有效地處理多源數據和高度不確定性,從而增強分析的適應性和解釋力。盡管貝葉斯方法頗受青睞,如“netmeta”和“metafor”包,以及Stata和NMAstudio等軟件,仍主要基于頻率論框架設計,特別適合于需要明確統計推斷的大規模數據分析。于研究者而言,理解每種方法的理論基礎和實際應用范圍,是選擇最適合其項目需求的軟件包的關鍵。通過評估各軟件包在不同研究場景下的優勢和局限性,研究者可以選擇最符合其研究目標的工具,從而優化研究設計和提升結果的科學性。
3.3 模型構建與統計分析
構建模型與統計分析是NMA的核心環節,決定了研究的結構、分析的深度以及結果的可靠性,不同層次的模型相互結合,共同支持效應估計與比較。以下部分將詳細闡述各類模型及其在NMA中的作用,并總結常見統計學模型、軟件實現及其應用場景。
3.3.1 效應模型 效應模型是NMA的基礎,用于估計不同研究間的效應量[2 ]:
① 固定效應模型假設所有研究共享相同的效應大小,且效應差異主要來源于隨機誤差而非研究間的真實差異,因此該模型適用于研究間異質性較小且一致性較高的網絡結構。該模型可在R(netmeta、gemtc)、Stata(network)等軟件實現。
② 隨機效應模型考慮了研究間的異質性,假設每個研究的效應是總體效應的一個隨機樣本。該模型能夠更好地捕捉研究間的異質性,且能夠處理復雜網絡和多樣干預的比較,常用的估計方法包括DerSimonian和Laird方法、貝葉斯方法等。此模型可通過R(netmeta、gemtc、rjags)、Stata(network)、JAGS、WinBUGS、OpenBUGS等軟件實現。
3.3.2 統計學模型 統計學模型在NMA中起著至關重要的作用,用于效應估計、異質性調整以及復雜數據結構的處理[45]。目前常見的統計學模型包括GLM、GLMM、分層模型、回歸模型、多元分析模型、兩步法和電網模型理論[45,46]等。它們在應對多層次數據、調整協變量、處理多重干預比較以及復雜網絡結構等方面提供了穩健且靈活的分析框架。表2總結了NMA中常用的統計學模型、主要特點及適用的軟件工具[45-51]。

此外,“coda”[27]通常不作為獨立使用的軟件包,而是與“rjags”或“R2WinBUGS”等貝葉斯統計分析工具聯合使用。該軟件包主要用于處理這些工具生成的MCMC樣本,提供后驗分析的診斷和可視化工具,通過圖形如跡線圖和自相關圖來檢視樣本的獨立性和分布特征。
3.4 異質性檢驗與一致性評估
在NMA中,異質性檢驗與一致性評估是相互關聯的關鍵步驟,共同影響研究結論的穩定性和可信度。通過這兩項分析,研究者能夠深入探測研究間的差異和證據的協調性,從而優化模型選擇和數據解釋。盡管大多數軟件不能完全支持這兩項復雜的評估,但策略性地選擇并聯合使用不同工具,可以實現更為精確的判斷。
3.4.1 異質性檢驗
異質性檢驗主要用于分析NMA中納入研究之間結果的差異,幫助研究者選擇最合適的統計模型(如固定效應模型或隨機效應模型)來處理這些差異。常見的檢驗方法包括:
① I2和Tau2統計量[2,4]:常用的頻率學方法,用于量化研究間的異質性。I2統計量評估異質性占總變異的比例,而Tau2則估計異質性的方差,這些方法可通過R(netmeta、metafor)和Stata(metan)等軟件實現。
② 貝葉斯異質性評估:貝葉斯方法通過后驗分布評估模型參數的不確定性,靈活處理異質性,尤其適用于復雜的多維數據,此法主要可通過R(gemtc、pcnetmeta、multinma、BUGSnet)、WinBUGS、JAGS等軟件實現,提供了一種更全面的分析視角。
3.4.2 一致性評估
一致性評估用于檢驗NMA閉環結構中不同來源的證據(直接與間接比較)的效應估計是否一致。這一假設是NMA的核心基礎,認為閉環結構中的直接比較與間接比較應當產生一致的效應估計。但實際應用中,這一假設可能受到異質性、效應修飾和研究方法差異等因素的影響。在隨機效應模型中,一致性假設可擴展為可交換性假設,即認為每項研究的比較效應在同一框架下是相同或可交換的。基于此假設,若構建的一致方程組成立,則認為網狀結構具有一致性。
當前,常見的一致性評估方法主要包括[20,52-55]:① 局部不一致性檢驗(節點拆分法):此方法通過比較特定節點的直接與間接證據,精確定位不一致性來源,R軟件的gemtc包和OpenBUGS等軟件支持該方法,適用于復雜網絡的局部不一致性檢測。
② 全局不一致性檢驗:該方法通過全網絡的一致性統計檢驗,評估證據整體的協調性。R(gemtc、netmeta)、Stata(mvmeta、network)、NetMetaXL等軟件能夠實現全局不一致性檢驗。
③ 反向計算法(back-calculation method):通過計算直接比較與對應間接比較的差異來評估一致性,適用于簡單閉環結構的初步檢測,R(netmeta)和Stata軟件可實現此功能,但在多臂研究存在時可能難以適用。
④ 非關聯均值效應模型(UME):通過比較非一致性模型與一致性模型的擬合優度來檢測全局不一致性,UME模型允許各干預比較效應獨立估計,適用于復雜網絡的整體一致性檢測。
在網絡結構較簡單且研究間差異較小時,可假設一致性模型并使用相關軟件進行分析;而當網絡復雜或出現不一致性跡象時,應進一步使用不一致性模型調整,以確保結果的可靠性。
3.5 證據可視化與診療方案排序
在NMA中,證據可視化和診療方案排序對于輔助研究者和決策者直觀理解分析結果及比較不同診療方案的相對效益極為關鍵,這包括網絡圖、森林圖、聯賽表、貢獻圖、SUCRA曲線及漏斗圖等多種形式。各類NMA軟件工具在實現這些功能的程度和方法上有所差異,多數情況下,需要聯合使用多個軟件包才能充分展示NMA證據的全面可視化視圖。
① 網絡圖與森林圖:是展示研究間聯系和比較強度的重要可視化工具。例如,R軟件的“netmeta”和“gemtc”包可以生成清晰的網絡圖,這些圖形直觀地顯示了不同治療間的聯系結構和比較強度。Stata通過其“network”系列命令也提供了生成網絡圖和森林圖的功能,這些圖形易于調整和解釋,特別適合于幫助NMA新手理解復雜的關系,同時也滿足部分追求高質量圖形輸出的用戶的需求。
② 聯賽表與SUCRA曲線:此功能為NMA分析中的核心元素,它們對政策制定和臨床決策具有重要影響。聯賽表展示了所有可能比較的效應估計及其對應的可信區間,為研究者提供了一個全面的治療比較視圖。例如,Stata的“network”命令和R的“netmeta”包均能生成詳盡的聯賽表;R軟件的“gemtc”包通過計算和可視化SUCRA值,提供了診療方案的相對效益排序,而ADDIS軟件利用“rank probability”計算實現方案排序,增強了決策支持的科學性。
③ 貢獻圖:主要通過R的“netmeta”包、Stata軟件實現,分析每個直接比較對整體網絡估計的貢獻程度,幫助研究者識別哪些比較對整體結果影響最大,從而突出關鍵證據的影響力,這種可視化工具在揭示數據的內在聯系和證據的重要性方面起到了關鍵作用。
正確選擇和使用這些可視化工具對于有效傳達復雜的NMA結果至關重要,有助于為臨床實踐和政策制定提供直觀的科學依據。研究者應根據具體的分析需求選擇合適的軟件組合,以實現最佳的可視化效果和數據解釋。
3.6 發表偏倚檢測
發表偏倚是由于研究結果的性質(通常是正面結果比負面或無顯著結果更易被發表)引起的系統誤差。在NMA中,發表偏倚的存在可能直接影響對治療效果的估計,進而誤導臨床決策和政策制定。目前,主要通過以下方法進行發表偏倚的檢測:① 調整比較的漏斗圖(funnel plots):作為發表偏倚的常用可視化檢測工具,漏斗圖通過展示研究效應大小與其精確度(通常為標準誤)之間的關系,揭示小規模研究中可能的過度散布現象;② 多重比較的回歸測試:此方法改進了傳統的Egger檢驗(Egger's test),以適應NMA中復雜的比較網絡。通過在回歸模型中加入特定網絡的調整項,該方法能夠更準確地探測并反映網絡中可能的發表偏倚;③ 網絡元回歸(network meta-regression):通過將研究大小或質量等協變量納入模型,此方法檢測網絡中潛在的發表偏倚,評估這些因素對效應大小估計的系統性影響;④ 貝葉斯方法:在貝葉斯框架下進行NMA時,可以通過設置復雜的先驗分布來調整發表偏倚的影響,例如為小樣本研究設置偏倚調整的先驗,以反映這些研究可能更傾向于報告較大的效應。
當前支持NMA中發表偏倚檢測的軟件包不多,主要通過R中的“netmeta”包、Stata軟件實現比較調整的漏斗圖和網絡元回歸,用于可視化多種比較間的偏倚情況。此外,盡管WinBUGS或OpenBUGS這類軟件不直接提供發表偏倚檢測工具,但它們允許用戶在模型中引入先驗分布,以反映對較小研究或未發表研究的偏倚預期,這種方法需要深入理解統計建模和貝葉斯推斷方法。在實際操作中,由于單一軟件可能不足以滿足所有分析需求,研究者經常需要綜合使用多個工具來實現發表偏倚的全面檢測。例如,研究者可能需要使用R進行數據處理和初步分析,然后使用WinBUGS進行復雜的貝葉斯分析,最后回到R或Stata來生成圖形和進行進一步的統計測試。
3.7 用戶交互界面與優缺點評析
在開展NMA的過程中,直觀且用戶友好的界面能夠簡化操作,特別是對非統計背景的用戶而言,更能降低使用難度。目前,常用于NMA的軟件如R、Stata、WinBUGS和OpenBUGS主要依賴于腳本命令進行操作,這種設計雖然為用戶提供了極高的靈活性和廣泛的自定義選項,但同時也可能給初學者帶來較大的挑戰。其中,R軟件通過其圖形用戶界面擴展如RStudio,為用戶提供了一個更加友好的操作環境,支持代碼自動完成、窗口管理和圖形顯示等功能,顯著增強了NMA分析的直觀性和便捷性。此外,軟件如ADDIS、NetMetaXL、SAS及各類在線NMA應用程序,通過提供基于圖形的用戶界面,使用戶無需精通復雜的編程知識即可進行NMA設置和執行,這類軟件特別適合于需要快速掌握NMA操作并開展標準分析的用戶。表3中對目前主流的NMA軟件交互與其優缺點進行了系統辨析。

4 總結與展望
NMA在現代醫學研究和政策制定中扮演著日益重要的角色,通過綜合直接與間接證據,為多種干預措施的相對效能提供全面評估。這種分析方法不僅增強了研究結果的可靠性,也為臨床決策提供了堅實的科學基礎。鑒于此,擁有多功能的強大統計軟件顯得尤為重要。本文詳細介紹了若干主流的NMA軟件包,并探討了它們在方法學框架、模型構建、統計分析和證據可視化等方面的應用差異。每種工具都具有其獨特優勢,研究者應根據具體需求靈活選擇,并聯合使用這些工具以實現最佳分析效果。
未來,隨著醫學研究的深入和AI技術的進步,NMA的方法學預計將得到進一步完善,尤其在增強模型透明度、提升結果穩定性及處理復雜數據結構的能力方面。預計研究者還將開發出更多集成化的NMA工具,這些工具將通過提供更直觀的操作界面、更智能的數據處理和更精確的結果展示,降低NMA的技術門檻并擴大其應用范圍。同時,加強對臨床研究人員和政策制定者在NMA領域的教育和培訓顯得尤為重要,確保其能正確理解和使用NMA結果,促進基于證據的醫療決策過程。總之,隨著方法學的創新和軟件工具的不斷完善,NMA將在未來的醫學研究和實踐中發揮更大作用,為全球健康治療策略的制定和優化提供堅實的科學支持。
在當今醫學研究領域,系統評價與Meta分析已成為證據綜合的主要方法,通過整合不同研究結果,有效提升證據的可靠性與質量。這些分析方法有效克服了單一研究間因樣本量不足或結果不一致而帶來的局限,為臨床決策提供堅實的科學支撐。然而,傳統的Meta分析通常限于比較兩種干預措施的效果,面對多種治療選項時,則無法全面評估各種方案的相對效益[1,2]。
網狀Meta分析(NMA)作為Meta分析的擴展,可以同時比較多個治療方案的直接與間接證據。通過構建包含所有治療選擇的網絡,NMA增強了證據的科學性和可靠性,并為臨床決策提供了更為全面精確的指導[3-5]。例如,在癌癥治療方案比較中,NMA揭示了各種方案的相對優勢,輔助醫生為患者定制個性化治療計劃[6,7]。近年來,這一方法已被廣泛應用,并受到Lancet[8]與BMJ[9]等高影響力醫學期刊的關注與推廣。此外,在藥物經濟學評估和公共衛生政策制定等領域,NMA也展現了其重要價值[10,11]。
鑒于NMA方法學的復雜性,其實際應用中常出現方法論不一、數據呈現不統一以及軟件工具與報告標準不一致等問題,這些問題降低了研究結果的可比性與一致性。此外,研究者對于頻率論與貝葉斯方法兩種主要模型的理解與應用不一,增加了結果的異質性。因此,本研究系統介紹了NMA的基本原理與方法,并對目前主流使用的NMA軟件及軟件包進行了詳盡比較與分析,旨在提供一個統一的科學指導框架,幫助研究者更有效地理解與應用這一重要分析方法。
1 NMA分析統計學原理與三個基本假設
1.1 NMA分析統計學原理簡介
NMA通過整合直接比較和間接比較的證據,增強研究結果的可靠性與全面性,其核心在于構建和分析一個包含多種治療措施的多臂試驗網絡,使得每種治療都可以與多個其他診療方案進行比較。目前,NMA的主要原理包括:
① 調整間接比較(AIC)[4]:作為NMA的基礎方法之一,AIC允許通過共同對照組間接評估兩種治療方法的效果,這種方法最初由Bucher等[12,13]提出,已成為進行間接比較的經典技術,具體方法如下:
![]() |
![]() |
假設存在治療a和b,以及對照c,為比較治療a和b,可以通過共同對照c進行間接比較。其中,和
分別表示干預措施a與c、b與c在某結果指標效應量OR的對數;
與
則分別代表干預措施a與c、b與c在某結果指標效應量OR的標準誤。
② 混合治療效應(MTC)[4]:此方法在AIC基礎上進行了擴展,它通過綜合直接比較和間接比較的結果,使用統計方法合成所有可用證據,這不僅增強了分析的統計效力,且提高了精確性,為臨床決策提供了更全面的證據基礎。
其合并結果為:
![]() |
其標準誤差為:
![]() |
![]() |
直接比較結果的效應量和標準誤分別為與
,公式1和公式3同樣適用于相對危險度和危險比;對于連續性變量,無需對效應量取對數,可直接按結果(均數差)進行計算。
1.2 NMA的三個基本假設
NMA的基本假設包括同質性、相似性與一致性[1,14],這是確保分析準確性和可靠性的關鍵。同質性即要求納入的研究評估相同或相似的效應,可通過固定效應或隨機效應模型進行分析,常用Cochran’s Q統計量檢驗同質性;相似性假設保證間接比較的合理性,要求納入的研究在臨床和方法學方面保持一致性,嚴格的納入和排除標準有助于提高研究間的可比性;一致性假設指出直接比較和間接比較的結果應相符,在閉合環的證據網絡中尤其重要,可通過節點拆分法、不一致性方差估計法和反向計算法等進行一致性檢驗。
2 NMA統計推斷框架
2.1 頻率論框架
2.1.1 原理概述
頻率論方法[2,15,16](frequentist statistics)通過直接和間接比較不同干預措施的效應,使用樣本數據進行假設檢驗和效應估計,基于統計推斷方法(如可信區間和P值)來評估干預效果。頻率論不依賴于先驗信息,采用最大似然估計或最小二乘法求解參數,因此在處理新領域或數據稀缺的情況下具有計算速度快的優勢。
2.1.2 主要模型算法與適用場景
頻率論方法主要包括倒方差法(IV)和廣義線性(混合)模型[GLM(GLMM)][2,17]。IV法通過將各研究效應值的方差倒數作為權重進行加權平均,計算出的總體效應方差為權重之和的倒數[18]。這種方法適合于效應量較一致的場景,計算簡單直觀,然而在研究間異質性較大的情況下,這種方法的效果可能會受限。
GLMM通過對數據進行適當的變換,使干預效應近似線性化,適用于處理連續變量、二分類變量、多分類變量和計數變量等多種結局變量類型[17]。GLMM的靈活性和廣泛的應用范圍使其在研究間存在顯著異質性的情況下能提供穩健的結果,能夠處理固定效應及隨機效應。
2.2 貝葉斯模型
2.2.1 原理概述
貝葉斯方法(Bayesian models)基于貝葉斯統計學原理,結合先驗信息與觀測數據,利用貝葉斯定理估計和推斷效應,貝葉斯定理的基本形式[2]為:
![]() |
其中,是后驗分布,表示在給定數據
后參數
的概率分布;
是似然函數,表示在給定參數
下觀測到數據
的概率;
是先驗分布,表示在沒有觀測數據時參數
的先驗信息;P
D)是數據的邊際分布,可以通過積分在整個參數空間中得到。
在貝葉斯NMA中,先驗分布與似然函數共同構成后驗分布,用于估計干預措施的效果[17]。此模型適用于固定效應和隨機效應模型,前者假設所有研究共享一個真實效應量,后者假設效應量在不同研究間變異,但可用隨機效應解釋這種異質性。貝葉斯推斷結果以后驗分布形式呈現,顯示效應量的整體概率分布,并允許通過更新后驗信息作為新的先驗信息,實現信息的迭代更新,為決策提供全面信息。
2.2.2 主要模型算法與適用場景
貝葉斯模型在干預性試驗NMA中廣泛應用,主要通過馬爾可夫鏈蒙特卡羅(MCMC)算法實現[19],MCMC構建馬爾科夫鏈以從后驗分布中抽樣,逐步逼近其真實形態。常用的MCMC算法包括吉布斯抽樣(Gibbs sampling)和Metropolis-Hastings算法(M-H算法)。
貝葉斯方法的優勢在于,面對數據稀缺或不確定性較大的情況,能夠引入先驗信息以提供穩健結果,尤其在處理小樣本或高異質性研究時。此外,其能“自動”考慮研究間方差的不確定性,并將其整合入效應量的后驗分布中,形成一個“總”不確定性,反映在95%可信區間內。
3 NMA統計分析主流軟件與軟件包介紹
隨著NMA領域的不斷發展,眾多軟件和軟件包相繼問世[20-44],極大地簡化了NMA的執行流程,從而使得研究者可以更加高效地進行復雜的數據分析(表1)。本部分旨在介紹和比較這些主流統計分析軟件和軟件包,以幫助研究者全面了解各工具的功能、優缺點及適用場景,從而做出合適的選擇。

3.1 軟件簡介
在NMA領域中,各類軟件和工具包得到了廣泛應用。R語言憑借其開源性質和強大的社區支持,已成為NMA分析的首選工具之一[45],其擁有多個專為NMA設計的軟件包,如“netmeta”“gemtc”和“metafor”,這些軟件包提供了從數據管理到高級統計分析、異質性檢測、一致性評估及結果可視化的全面功能。此外,Stata和SAS等其他主流軟件也為NMA提供了強有力的支持,其中,Stata以其用戶友好的界面和高效的數據處理能力而聞名,SAS則專注于復雜的統計建模。同時,貝葉斯分析工具如WinBUGS、OpenBUGS、ADDIS、JAGS及基于Excel的NetMetaXL插件和各類在線NMA應用,也是執行NMA的常用選擇。研究者在選擇不同工具時需考慮到具體需求、分析的復雜度以及對軟件的熟悉程度。
3.2 方法學框架的選擇
在NMA實踐中,不同的軟件包顯示出其方法學傾向和功能的差異。盡管當前大多數統計軟件趨向于采用貝葉斯方法來應對復雜數據結構和模型參數的不確定性,但頻率論方法在某些應用場景下仍保持其重要性。
貝葉斯方法因其靈活性及對先驗知識的整合能力而受到廣泛關注,R語言中的“gemtc”“rjags”和“pcnetmeta”等包為研究者提供了全面的貝葉斯分析工具。同時,WinBUGS和OpenBUGS等軟件也專注于處理復雜的貝葉斯模型,使研究者能夠有效地處理多源數據和高度不確定性,從而增強分析的適應性和解釋力。盡管貝葉斯方法頗受青睞,如“netmeta”和“metafor”包,以及Stata和NMAstudio等軟件,仍主要基于頻率論框架設計,特別適合于需要明確統計推斷的大規模數據分析。于研究者而言,理解每種方法的理論基礎和實際應用范圍,是選擇最適合其項目需求的軟件包的關鍵。通過評估各軟件包在不同研究場景下的優勢和局限性,研究者可以選擇最符合其研究目標的工具,從而優化研究設計和提升結果的科學性。
3.3 模型構建與統計分析
構建模型與統計分析是NMA的核心環節,決定了研究的結構、分析的深度以及結果的可靠性,不同層次的模型相互結合,共同支持效應估計與比較。以下部分將詳細闡述各類模型及其在NMA中的作用,并總結常見統計學模型、軟件實現及其應用場景。
3.3.1 效應模型 效應模型是NMA的基礎,用于估計不同研究間的效應量[2 ]:
① 固定效應模型假設所有研究共享相同的效應大小,且效應差異主要來源于隨機誤差而非研究間的真實差異,因此該模型適用于研究間異質性較小且一致性較高的網絡結構。該模型可在R(netmeta、gemtc)、Stata(network)等軟件實現。
② 隨機效應模型考慮了研究間的異質性,假設每個研究的效應是總體效應的一個隨機樣本。該模型能夠更好地捕捉研究間的異質性,且能夠處理復雜網絡和多樣干預的比較,常用的估計方法包括DerSimonian和Laird方法、貝葉斯方法等。此模型可通過R(netmeta、gemtc、rjags)、Stata(network)、JAGS、WinBUGS、OpenBUGS等軟件實現。
3.3.2 統計學模型 統計學模型在NMA中起著至關重要的作用,用于效應估計、異質性調整以及復雜數據結構的處理[45]。目前常見的統計學模型包括GLM、GLMM、分層模型、回歸模型、多元分析模型、兩步法和電網模型理論[45,46]等。它們在應對多層次數據、調整協變量、處理多重干預比較以及復雜網絡結構等方面提供了穩健且靈活的分析框架。表2總結了NMA中常用的統計學模型、主要特點及適用的軟件工具[45-51]。

此外,“coda”[27]通常不作為獨立使用的軟件包,而是與“rjags”或“R2WinBUGS”等貝葉斯統計分析工具聯合使用。該軟件包主要用于處理這些工具生成的MCMC樣本,提供后驗分析的診斷和可視化工具,通過圖形如跡線圖和自相關圖來檢視樣本的獨立性和分布特征。
3.4 異質性檢驗與一致性評估
在NMA中,異質性檢驗與一致性評估是相互關聯的關鍵步驟,共同影響研究結論的穩定性和可信度。通過這兩項分析,研究者能夠深入探測研究間的差異和證據的協調性,從而優化模型選擇和數據解釋。盡管大多數軟件不能完全支持這兩項復雜的評估,但策略性地選擇并聯合使用不同工具,可以實現更為精確的判斷。
3.4.1 異質性檢驗
異質性檢驗主要用于分析NMA中納入研究之間結果的差異,幫助研究者選擇最合適的統計模型(如固定效應模型或隨機效應模型)來處理這些差異。常見的檢驗方法包括:
① I2和Tau2統計量[2,4]:常用的頻率學方法,用于量化研究間的異質性。I2統計量評估異質性占總變異的比例,而Tau2則估計異質性的方差,這些方法可通過R(netmeta、metafor)和Stata(metan)等軟件實現。
② 貝葉斯異質性評估:貝葉斯方法通過后驗分布評估模型參數的不確定性,靈活處理異質性,尤其適用于復雜的多維數據,此法主要可通過R(gemtc、pcnetmeta、multinma、BUGSnet)、WinBUGS、JAGS等軟件實現,提供了一種更全面的分析視角。
3.4.2 一致性評估
一致性評估用于檢驗NMA閉環結構中不同來源的證據(直接與間接比較)的效應估計是否一致。這一假設是NMA的核心基礎,認為閉環結構中的直接比較與間接比較應當產生一致的效應估計。但實際應用中,這一假設可能受到異質性、效應修飾和研究方法差異等因素的影響。在隨機效應模型中,一致性假設可擴展為可交換性假設,即認為每項研究的比較效應在同一框架下是相同或可交換的。基于此假設,若構建的一致方程組成立,則認為網狀結構具有一致性。
當前,常見的一致性評估方法主要包括[20,52-55]:① 局部不一致性檢驗(節點拆分法):此方法通過比較特定節點的直接與間接證據,精確定位不一致性來源,R軟件的gemtc包和OpenBUGS等軟件支持該方法,適用于復雜網絡的局部不一致性檢測。
② 全局不一致性檢驗:該方法通過全網絡的一致性統計檢驗,評估證據整體的協調性。R(gemtc、netmeta)、Stata(mvmeta、network)、NetMetaXL等軟件能夠實現全局不一致性檢驗。
③ 反向計算法(back-calculation method):通過計算直接比較與對應間接比較的差異來評估一致性,適用于簡單閉環結構的初步檢測,R(netmeta)和Stata軟件可實現此功能,但在多臂研究存在時可能難以適用。
④ 非關聯均值效應模型(UME):通過比較非一致性模型與一致性模型的擬合優度來檢測全局不一致性,UME模型允許各干預比較效應獨立估計,適用于復雜網絡的整體一致性檢測。
在網絡結構較簡單且研究間差異較小時,可假設一致性模型并使用相關軟件進行分析;而當網絡復雜或出現不一致性跡象時,應進一步使用不一致性模型調整,以確保結果的可靠性。
3.5 證據可視化與診療方案排序
在NMA中,證據可視化和診療方案排序對于輔助研究者和決策者直觀理解分析結果及比較不同診療方案的相對效益極為關鍵,這包括網絡圖、森林圖、聯賽表、貢獻圖、SUCRA曲線及漏斗圖等多種形式。各類NMA軟件工具在實現這些功能的程度和方法上有所差異,多數情況下,需要聯合使用多個軟件包才能充分展示NMA證據的全面可視化視圖。
① 網絡圖與森林圖:是展示研究間聯系和比較強度的重要可視化工具。例如,R軟件的“netmeta”和“gemtc”包可以生成清晰的網絡圖,這些圖形直觀地顯示了不同治療間的聯系結構和比較強度。Stata通過其“network”系列命令也提供了生成網絡圖和森林圖的功能,這些圖形易于調整和解釋,特別適合于幫助NMA新手理解復雜的關系,同時也滿足部分追求高質量圖形輸出的用戶的需求。
② 聯賽表與SUCRA曲線:此功能為NMA分析中的核心元素,它們對政策制定和臨床決策具有重要影響。聯賽表展示了所有可能比較的效應估計及其對應的可信區間,為研究者提供了一個全面的治療比較視圖。例如,Stata的“network”命令和R的“netmeta”包均能生成詳盡的聯賽表;R軟件的“gemtc”包通過計算和可視化SUCRA值,提供了診療方案的相對效益排序,而ADDIS軟件利用“rank probability”計算實現方案排序,增強了決策支持的科學性。
③ 貢獻圖:主要通過R的“netmeta”包、Stata軟件實現,分析每個直接比較對整體網絡估計的貢獻程度,幫助研究者識別哪些比較對整體結果影響最大,從而突出關鍵證據的影響力,這種可視化工具在揭示數據的內在聯系和證據的重要性方面起到了關鍵作用。
正確選擇和使用這些可視化工具對于有效傳達復雜的NMA結果至關重要,有助于為臨床實踐和政策制定提供直觀的科學依據。研究者應根據具體的分析需求選擇合適的軟件組合,以實現最佳的可視化效果和數據解釋。
3.6 發表偏倚檢測
發表偏倚是由于研究結果的性質(通常是正面結果比負面或無顯著結果更易被發表)引起的系統誤差。在NMA中,發表偏倚的存在可能直接影響對治療效果的估計,進而誤導臨床決策和政策制定。目前,主要通過以下方法進行發表偏倚的檢測:① 調整比較的漏斗圖(funnel plots):作為發表偏倚的常用可視化檢測工具,漏斗圖通過展示研究效應大小與其精確度(通常為標準誤)之間的關系,揭示小規模研究中可能的過度散布現象;② 多重比較的回歸測試:此方法改進了傳統的Egger檢驗(Egger's test),以適應NMA中復雜的比較網絡。通過在回歸模型中加入特定網絡的調整項,該方法能夠更準確地探測并反映網絡中可能的發表偏倚;③ 網絡元回歸(network meta-regression):通過將研究大小或質量等協變量納入模型,此方法檢測網絡中潛在的發表偏倚,評估這些因素對效應大小估計的系統性影響;④ 貝葉斯方法:在貝葉斯框架下進行NMA時,可以通過設置復雜的先驗分布來調整發表偏倚的影響,例如為小樣本研究設置偏倚調整的先驗,以反映這些研究可能更傾向于報告較大的效應。
當前支持NMA中發表偏倚檢測的軟件包不多,主要通過R中的“netmeta”包、Stata軟件實現比較調整的漏斗圖和網絡元回歸,用于可視化多種比較間的偏倚情況。此外,盡管WinBUGS或OpenBUGS這類軟件不直接提供發表偏倚檢測工具,但它們允許用戶在模型中引入先驗分布,以反映對較小研究或未發表研究的偏倚預期,這種方法需要深入理解統計建模和貝葉斯推斷方法。在實際操作中,由于單一軟件可能不足以滿足所有分析需求,研究者經常需要綜合使用多個工具來實現發表偏倚的全面檢測。例如,研究者可能需要使用R進行數據處理和初步分析,然后使用WinBUGS進行復雜的貝葉斯分析,最后回到R或Stata來生成圖形和進行進一步的統計測試。
3.7 用戶交互界面與優缺點評析
在開展NMA的過程中,直觀且用戶友好的界面能夠簡化操作,特別是對非統計背景的用戶而言,更能降低使用難度。目前,常用于NMA的軟件如R、Stata、WinBUGS和OpenBUGS主要依賴于腳本命令進行操作,這種設計雖然為用戶提供了極高的靈活性和廣泛的自定義選項,但同時也可能給初學者帶來較大的挑戰。其中,R軟件通過其圖形用戶界面擴展如RStudio,為用戶提供了一個更加友好的操作環境,支持代碼自動完成、窗口管理和圖形顯示等功能,顯著增強了NMA分析的直觀性和便捷性。此外,軟件如ADDIS、NetMetaXL、SAS及各類在線NMA應用程序,通過提供基于圖形的用戶界面,使用戶無需精通復雜的編程知識即可進行NMA設置和執行,這類軟件特別適合于需要快速掌握NMA操作并開展標準分析的用戶。表3中對目前主流的NMA軟件交互與其優缺點進行了系統辨析。

4 總結與展望
NMA在現代醫學研究和政策制定中扮演著日益重要的角色,通過綜合直接與間接證據,為多種干預措施的相對效能提供全面評估。這種分析方法不僅增強了研究結果的可靠性,也為臨床決策提供了堅實的科學基礎。鑒于此,擁有多功能的強大統計軟件顯得尤為重要。本文詳細介紹了若干主流的NMA軟件包,并探討了它們在方法學框架、模型構建、統計分析和證據可視化等方面的應用差異。每種工具都具有其獨特優勢,研究者應根據具體需求靈活選擇,并聯合使用這些工具以實現最佳分析效果。
未來,隨著醫學研究的深入和AI技術的進步,NMA的方法學預計將得到進一步完善,尤其在增強模型透明度、提升結果穩定性及處理復雜數據結構的能力方面。預計研究者還將開發出更多集成化的NMA工具,這些工具將通過提供更直觀的操作界面、更智能的數據處理和更精確的結果展示,降低NMA的技術門檻并擴大其應用范圍。同時,加強對臨床研究人員和政策制定者在NMA領域的教育和培訓顯得尤為重要,確保其能正確理解和使用NMA結果,促進基于證據的醫療決策過程。總之,隨著方法學的創新和軟件工具的不斷完善,NMA將在未來的醫學研究和實踐中發揮更大作用,為全球健康治療策略的制定和優化提供堅實的科學支持。