干預類系統評價中對臨床問題的計劃和報告,對評價的真實性和結果的可靠性有重要影響。好的計劃有助于減少評價過程中的偏倚,確保數據合并的可重復性。InSynQ(Intervention Synthesis Questions)清單是一個為干預類系統評價的臨床問題而設計的工具。其目的是促進系統評價方法學的標準化,支持系統評價在計劃階段和報告階段完整地報告臨床問題,為臨床決策提供更準確的證據基礎。
版權信息: ?四川大學華西醫院華西期刊社《中國循證醫學雜志》版權所有,未經授權不得轉載、改編
1 InSynQ清單的制定背景
系統評價是一種針對特定的臨床問題,識別、整理、評估和合并現有證據的研究方法。系統評價為衛生專業人員、政策制定者、公眾和其他研究者[1,2]的決策提供了證據基礎。干預類系統評價是針對干預措施的預防效果或治療效果的系統評價(例如某疫苗對某傳染病的預防效果、某新藥對某疾病的治療效果),因此也被稱為防治類系統評價或治療類系統評價,有時也會考慮干預措施的安全性問題(不良反應等傷害),其納入的原始研究往往以臨床隨機對照試驗居多[2]。在一篇干預類系統評價中有可能針對多個臨床問題[3],比如評估不同類型的干預對健康狀況的影響(例如,更改隨訪方式、增加物理距離或戴口罩是否能有效減少居家護理環境中COVID-19的傳播[4]),或者同一干預在不同類型人群中的效果(例如,輪狀病毒疫苗的預防效果在不同基礎死亡率的國家中是否有所不同[5])。對這些臨床問題進行詳細計劃可以確保系統評價的效果,專注于關鍵的臨床問題,還可以減少評價過程中的偏倚,降低數據合并決策受納入研究影響的風險,從而提高系統評價的真實性。此外,對數據合并的臨床問題進行完整和明確的報告對系統評價的可理解性和可靠性也至關重要。
在干預類系統評價中,系統評價的作者需要先定義臨床問題,然后利用PICO框架[6-8]制定納入標準。以上述的COVID-19研究[4]為例,作者首先需要評估納入研究可能的干預措施(例如“更改隨訪方式”“物理距離”等)。然后確定系統評價的納入標準,這將直接影響系統評價的結果和結論。同樣的,對每個數據合并的納入標準也是如此,但此前Cochrane干預類系統評價指導手冊主要聚焦于寬泛的臨床問題和研究的納入標準,沒有細化到特定的數據合并,直至其在第6版引入了“每個數據合并對應的PICO”(PICO for each synthesis)的概念[6],幫助系統評價的作者能夠以更透明的、可重復的方式將系統評價中納入研究分配給每項數據合并。
Brennan等[9]以圖1中的假設案例,說明了系統評價中對每個數據合并的臨床問題進行計劃和報告的必要性。假設為鍛煉對膝關節骨關節炎效果進行系統評價,圖中左邊列出了系統評價的臨床問題和納入標準,A組和B組分別是系統評價中干預相關的兩組可能的臨床問題:A組是寬泛的臨床問題(broad question),與系統評價總體寬泛的臨床問題類似,幾乎不需要額外信息來分組,例如問題1和問題2與系統評價的臨床問題基本一致,因此決定哪些研究符合當前數據合并僅僅取決于結局域的不同;B組則細化到特定的臨床問題(narrower/special question),干預可進一步分組為“負重鍛煉”和“非負重鍛煉”,因此為了確定哪些研究適用于哪一項數據合并,系統評價的作者需要定義“負重鍛煉”和“非負重鍛煉”的標準。因此,在理想情況下,研究者應當明確報告他們打算進行數據合并的臨床問題,以及為了實現這些問題分析所需的兩兩比較和標準。

此外,寬泛的和特定的這兩類臨床問題可以用于同一個系統評價[10]。例如,B組中的兩種干預可以包含在同一項數據合并中,分為不同的亞組,每個亞組都有相應的估計值,并同時得出總體估計(即進行多水平的分組計劃)。或者,當原始證據數據太少而無法討論特定臨床問題(B組)時,才會探討更寬泛的臨床問題(A組)。
基于此,Cumpston等[11]提出了InSynQ清單,為每項數據合并定義PICO,預先指定干預措施和臨床結局的分組、確定這些分組在數據合并中的作用、指定分組之間的兩兩比較。這些決策過程應該在系統評價的計劃階段和報告階段均予以報告,為讀者提供足夠的數據合并的方法學信息,使該系統評價能夠被其他評價團隊復現[11]。本研究對CNKI、WanFang Data、Europe PubMed Central、Web of Science數據庫進行全文檢索,檢索詞為InsynQ,不設置時間和語言限制。篩選后發現該清單發布至今僅有1篇英文研究對其進行了應用并報告[12],中文文獻尚無應用,這與InsynQ于2023年提出時間較近有關;此外,2024年開始的Cochrane計劃書雖然都全部建議遵守InsynQ清單,但大多數計劃書目前仍處于審稿狀態而尚未發表,因此也導致InsynQ清單的傳播僅局限在最新的Cochrane計劃書。InSynQ清單適用于干預類系統評價,可以幫助作者和編輯促進干預類系統評價臨床問題的計劃和報告,有助于同行評議與讀者的循證實踐[3,6]。本研究對其進行詳細解讀,以期為我國相關研究的報告提供參考。
2 InSynQ清單的內容與解讀
2.1 InSynQ清單內容
InSynQ清單共有11項,遵循PRISMA 2020標準[13-15],可用于系統評價的方案設計、實施、報告撰寫、同行評議以及發表以后的研究復現。InSynQ清單要點內容的中文解讀見表1,清單原文可參考完整的清單列表[9]。其中第1至9項適用于系統評價的計劃階段和報告階段,包括了數據合并所針對的臨床問題的具體說明以及分組在數據合并中的作用。這些項目是在計劃階段制定的,在報告階段時其解釋應保持不變。而第10、11項僅適用于系統評價的報告階段,包括數據合并所針對臨床問題的更改和結果的更改。

2.2 InSynQ清單解讀
清單共有11個項目,包括必要項(必須報告的內容)和可能的附加項(補充報告但非必要的內容)。
2.2.1 指定數據合并的研究人群和干預的分組
必要項:① 對每個分組進行標記。② 對每個分組進行足夠詳細的定義,以便復現每個研究適合納入哪個分組。如果上述定義基于已有文獻(例如:干預的分類),則說明引用參考文獻來源即可。③ 如果系統評價納入的原始研究是多種干預措施組合而成的干預,則指定在數據合并中這些干預的定義和分組。④ 如果系統評價納入陰性對照(例如:常規護理、無干預措施),則指定在數據合并中將這些對照如何分組。⑤ 針對寬泛和特定的兩類臨床問題,描述任何可能的、進行多水平分組的計劃。⑥ 應對原始證據數量,描述任何可能的應對計劃(例如:如果針對特定的臨床問題的研究數量太少,則計劃進行更寬泛的臨床問題的分組)。
附加項:① 考慮采用框或表格來展示分組的詳細定義。② 考慮使用邏輯模型或圖來可視化地總結分組情況、不同PICO要素之間的聯系以及每個PICO要素內部的分組。
解讀:在數據合并中,會將相似特征的研究進行分組,以便查驗干預的效果,或影響干預效果的因素。對數據合并中使用到的每個干預分組和人群分組進行清晰的定義,將幫助讀者理解數據合并的意義,還有助于確保系統評價方法學的透明度,使得哪些研究屬于哪項數據合并的過程可以復現。
可以在系統評價的各部分(例如:背景、方法),以各種形式(例如:列表、描述性文本、表格、圖例)指定分組,只要明確用于數據合并的分組即可。
2.2.2 指定數據合并的結局域
必要項:① 對每個結局域進行標記。② 對每個結局域(即“正在測量什么”)進行足夠詳細的定義,以便能夠對每個研究的結局進行分類。③ 對結局域指定適合的測量方法、測量工具或量表(即“結局是如何測量的”)。④ 對結局域指定時間框架(即“何時測量結局”)(例如:最長12周)。⑤ 針對寬泛的和特定的兩類臨床問題,描述任何可能對結局域進行多水平分類的計劃。(例如:“抗抑郁藥物對抑郁癥的效果”與“使用漢密爾頓抑郁量表測量抗抑郁藥物對抑郁癥的效果”或“使用兒童抑郁量表修訂版測量抗抑郁藥物對抑郁癥的效果”)。⑥ 應對原始證據數量,描述任何可能的應對計劃(例如:如果針對“特定健康行為”影響的結局指標的研究數量太少,則計劃改為“任何健康行為”影響的結局指標)。
附加項:① 考慮使用表格來展示結局域的詳細信息。
解讀:指定在數據合并中要使用的結局域可以讓讀者理解評價中討論的具體臨床問題(即評價目的)。例如,評價新一代抗抑郁藥對“任何持續時間抑郁癥”“短期內(最長12周)的抑郁癥”“長期內(最長12個月)的抑郁癥”,或所有3個結局域的效果。此外,指定結局域使讀者能夠確認數據合并中使用的分組是預先計劃的,還是受到納入研究報告內容的影響。
在進行數據合并時,結局域基本要素通常會在Cochrane計劃書或系統評價模板中的“結局測量類型”部分報告,詳細的定義可能在表格中報告。需注意的是,應避免在沒有明確指定結局將如何分組的情況下,在“結局測量類型”部分列出結局。例如,在標題“抑郁癥”下列出“漢密爾頓抑郁量表”“蒙哥馬利-阿斯伯格抑郁量表”“兒童抑郁量表”,讀者不清楚數據合并的分組是“抑郁癥”,還是將對每個測量量表分別進行數據合并。
2.2.3 給出分組的理由
必要項:① 對于每個PICO要素,描述分組的理由。② 如果分組基于現有體系(例如:已發表的理論框架、分類體系或核心結局指標集合或其他系統評價),則說明引用參考文獻來源,并注明為本次系統評價所做的相應調整。
附加項:① 考慮使用邏輯模型或圖來可視化地總結不同PICO要素之間的聯系和每個PICO要素內部的分組,以及作用機制(路徑)。
解讀:數據合并中分組的依據是多樣的(例如:干預的內容、目的或實施方式;結局指標測量方法或時間;與不公平相關的人口特征)。分組的理由可以是理論(例如:可能的作用機制)、現有體系或臨床實踐、經驗證據、系統評價作者的優先事項(見項目8)或其他因素。決策還應考慮影響數據合并的實際臨床問題。例如,根據可用證據的數量決定討論特定的臨床問題還是寬泛的臨床問題。
報告數據合并中分組的理由,有助于讀者理解系統評價考慮了哪些因素以及為什么做出特定分組的決策。這些決策對系統評價的作者來說可能顯而易見,但對讀者來說卻不一定。另外給出分組理由可以讓讀者驗證分組方法是否與評價目的一致,增加其可信度。對于將所有干預措施(或其他PICO元素)在同一個寬泛的分組中進行數據合并的特殊情況(例如:任意運動、任意心理社會干預、任意健康行為結果),也同樣要給出理由。
一般來說,分組的理由應在指定數據合并分組的部分報告。在某些情況下,例如需要更詳細的解釋或使用邏輯模型時,可能在其他部分(例如:背景)給出分組理由,并從方法學部分交叉引用。
2.2.4 確定每個分組在數據合并中的作用
必要項:① 確定哪些特定的分組會構成基本的比較,以及哪些分組會在比較中用于分層。② 如果可以,確定哪些特定的分組可以用于探索干預效果變化的可能原因(例如:亞組分析或Meta回歸中)。③ 如果可以,確定哪些特定的分組可以用于敏感性分析,以檢驗研究結論或假設的穩健性。④ 確定特定的分組在數據合并或文章總結中的其他作用(例如:組織文本或圖表)。⑤ 如果使用邏輯模型或圖來展示分組,明確這些分組在數據合并中的作用。
本項目沒有附加項。
解讀:確定每個分組在數據合并中的作用,可以讓讀者理解數據合并的結構。分組可以作為兩兩比較的基礎,即在每項數據合并中指定的干預組和結局域。此外,分組還可以用于組織文本(即將分組作為報告文本的小標題)或圖表,探索干預效果改變的可能原因,檢驗數據合并結果的穩健性。一個常見的場景是,在寬泛分類中特定的干預措施,例如:某一系統評價中符合條件的干預措施包括“關系方法”(例如,父母-子女干預,以家庭為中心的干預)和“身心方法”(例如,團體音樂療法、瑜伽),符合條件的對照組是“任意非活性對照”,這時需要進一步說明,是① 使用寬泛的類別構成基本比較(關系方法與對照組、身心方法與對照組),并在這些類別中按特定類型干預進行分層;還是② 使用特定類型的干預構成基本比較(父母-子女干預與對照組;瑜伽與對照組),將廣泛的類別作為標題。從而讓讀者了解作者將如何構建數據合并。
需根據具體情況確定在哪一部分報告每個分組在數據合并中的作用。例如,① 在異質性或敏感性分析中使用的分組通常在Cochrane計劃書或系統評價模板的“數據合并”部分的小節中報告(即“亞組分析和異質性分析”“敏感性分析”)。② 在報告2.2.5項的內容時直接確定用于比較的分組的作用,則無需進一步解釋。
2.2.5 指定干預組之間的兩兩比較
必要項:① 列舉干預組(包括對照組)之間所有可能的兩兩比較。② 對這些兩兩比較的重要性進行排序,或者聲明重要性沒有排序。③ 決定共同干預是納入同一比較中還是納入不同比較中。④ 當從所有可能的兩兩比較中僅選擇一部分報告時,則說明做出選擇的理由。
本項目沒有附加項。
解讀:預先指定兩兩比較,能夠保證呈現的比較結果和事先計劃一致,而不是在系統評價過程中僅選擇性報告有利的結果。例如存在多個干預組:認知行為療法(CBT)、行為療法(BT)、認知療法(CT)、等候名單(WL)的評價中,有6種可能的比較,評價可能只對其中一部分感興趣(例如,CBT與WL、BT與WL),預先指定感興趣的兩兩比較組,能夠向讀者保證呈現的比較是事先計劃好的,而非挑選后的結果。
目前Cochrane計劃書或系統評價模板中沒有特定的“比較”部分,作者可以創建特定的副標題,具體位置適合放在方法的“數據合并”部分,也可以考慮放在“納入評價標準-干預類型”部分。
2.2.6 確保研究目的與數據合并所針對的臨床問題相一致
必要項:① 確保研究目的涵蓋了數據合并所針對的臨床問題,并且有足夠的細節使得研究目的與相應的數據合并相匹配。② 在系統評價的報告中,針對臨床問題各部分均使用一致的措辭(術語),包括研究目的部分。
本項目沒有附加項。
解讀:雖然系統評價的作者在為數據合并制定PICO之前就已經確定了系統評價的研究目的,但是還是需要確保系統評價的研究目的與每項數據合并的PICO相一致。這些PICO是系統評價研究目的的具體體現。
以基于學校的促進體育活動的干預評價為例,假設研究目的是:評估基于學校的不同類型干預(課前或課后體育活動、提高身體素質的課程、校內體育活動、多種活動組合)與常規鍛煉相比,對體能和體質的影響。作者計劃在兩個水平上進行數據合并:① 任意基于學校的促進體育活動干預與常規鍛煉的比較;② 四種特定類型的干預(每種都需要定義)效果。需要在評價中詳細區分所有5個干預組及其在數據合并中的作用,結局和分組也是如此。如果作者選擇評價任意基于學校的促進體育活動干預效果,需要給出理由,以便讀者清楚地了解研究目的和數據合并所針對的臨床問題是否一致。
應在研究目的部分報告本項目。
2.2.7 指定數據合并的方法學分組
必要項:① 提供方法學分組的理由。② 對每個方法學分組進行標記。③ 對每個方法學分組進行足夠詳細的定義,以便能夠對每個研究進行分組。④ 描述方法學分組在數據合并中的作用。
本項目沒有附加項。
解讀:干預類系統評價主要是討論關于干預措施收益和風險的臨床問題,InSynQ清單第1~5項已經給出了相關分組的指導。此外,干預類系統評價還需要討論針對上述臨床問題的分析結果面對不同的方法學因素(例如:不同的偏倚風險、不同的研究設計、不同的結局測量方法)是否穩健,從而提高結論的可靠性。與人群、干預措施和結局類似,本項目重要的是清晰地定義數據合并中每個方法學分組、分組的依據和理由(項目3)以及每個分組在數據合并中的作用(例如,敏感性分析,亞組分析)(項目4)。
數據合并中方法學分組的基本要素通常在Cochrane計劃書或系統評價模板的“數據合并”部分的小節中報告(即“亞組分析和異質性分析”“敏感性分析”)。
2.2.8 說明患者、公眾以及其他利益相關者是如何參與臨床問題制定的
必要項:① 描述患者、公眾以及其他利益相關者是如何參與臨床問題制定的(理想情況下使用ACTIVE框架)。如果沒有患者、公眾或其他利益相關者的參與,則予以說明。
本項目沒有附加項。
解讀:患者和公眾參與(PPI)制定系統評價的臨床問題可以提高研究的患者相關性以及臨床重要性。PPI可能包括涉及的患者、潛在患者、護工、享受公共衛生服務的健康人以及公共衛生服務機構代表。除了PPI以外,其他利益相關者包括衛生專業人員、衛生決策者以及研究基金資助者。ACTIVE(authors and consumers together impacting on evidence)框架是研究者與其他利益相關者共同參與循證研究的理想方案,該框架包括“誰參與?”“如何招募利益相關者?”“參與的方式是什么?”“在系統評價過程的哪個階段參與?”以及“參與到什么程度?”這5個問題。患者、公眾以及其他利益相關者可以基于ACTIVE框架,從多個角度來參與臨床問題的制訂,例如確定結局域(InSynQ清單第2項)、優先考慮哪些比較(InSynQ清單第5項)。
理想情況下,在各階段參與評價的利益相關者(包括制定評價問題)應在自己的部分對本項目予以報告,可以作為方法的一部分,也可以作為額外的補充材料。當特定方法的選擇(例如,結局域的選擇)受到利益相關者的影響時,也可能在對應的部分報告(例如,結局測量類型)。
2.2.9 針對各項數據合并,描述納入研究的決策過程
必要項:① 針對各項數據合并,描述納入研究的決策過程(例如:列出研究的干預特征,并與每項數據合并的計劃分組進行比較)。
本項目沒有附加項。
解讀:在進行數據合并(PRISMA 2020[13-15]第13d項)之前,必須決定哪些研究適用于哪項項數據合并(PRISMA 2020[13-15]第5項)。這一決策過程可能涉及主觀判斷,從而影響數據合并的結果,然而系統評價的報告經常缺失這些與決策過程相關的信息。為了提高決策的透明度,建議報告這些與決策過程相關的所有信息。這可能涉及對人群、干預措施和結局的主要特征進行制表和編碼。例如,在評估心理干預措施對孕期戒煙效果的評價中,根據預先指定的,每項研究的主要干預措施被編碼為以下之一:咨詢、健康教育、反饋、基于激勵的干預、社會支持。這種編碼為各項數據合并(例如,基于激勵的干預與常規護理)確定納入的研究提供了基礎,類似的編碼可應用于人群和結局。
在Cochrane計劃書或系統評價模板的“數據提取與管理”或“數據合并”部分報告。具體報告位置將取決于作者對研究的PICO元素進行編碼和分析的方法。
2.2.10 說明在系統評價報告階段對計劃方案中的分組或比較所做的更改
必要項:① 對于所有在計劃方案中未報告但是在系統評價中使用到的分組進行標記和定義。② 列出所有在計劃方案中未報告但是在系統評價中做出的比較。③ 說明在系統評價中對這些計劃的分組或比較進行更改的理由。
本項目沒有附加項。
解讀:在系統評價實施過程中,尤其是涉及多臂研究、多種干預組或者多種結局域的復雜情況,作者可能會更改計劃方案,從而實現對現有原始證據的最佳利用。比如發現在原計劃的兩兩比較中原始證據數量不足時,可能會采用更寬泛的分組或比較。
所有新增的分組或兩兩比較應在方法部分報告(例如,將新的兩兩比較添加到比較列表中)。所有變更,包括未使用的方法,也應在“方案與評價之間的差異”部分描述。
2.2.11 結果部分的分組和比較需要與方法學部分一致
必要項:① 使用方法學部分指定的分組和比較來報告系統評價的結果。② 使用方法學部分相同的分組標簽來報告系統評價的結果。
本項目沒有附加項。
解讀:在報告結果部分時,其數據合并的PICO應與系統評價的研究目的和方法學部分中的報告保持一致,這樣有助于讀者輕松地將研究結果與臨床問題相匹配,從而有助于讀者的循證實踐。例如:① 應用與方法學相同的分組和比較;② 應用與方法學相同的分組標簽(即使用一致的術語);③ 按照研究目的順序呈現結果;④ 結果部分的描述對應其解決的研究目的。
3 討論
3.1 InSynQ清單與其他報告規范的關系
InSynQ清單詳細說明了如何報告干預類系統評價的臨床問題,以及在系統評價過程中處理如何這些臨床問題。PRISMA 2020報告規范[13-15]、SWiM報告規范[16,17]和Cochrane干預類系統評價的MECIR標準[18]都包括了臨床問題相關的項目,涉及評價的研究目的、兩兩比較、分組等方面。InSynQ清單并非用于取代上述報告規范,而是對其進行補充說明,因為已有規范缺少對目前已發表的評價中已知的不完整報告內容的指導[11],例如PRISMA 2020和SWiM有與分組相關的報告要素,但從項目及相關的解釋中可以看出,這兩個報告規范都沒有將“每個數據合并對應的PICO”與“評價的PICO”的概念區分開來,因此InSynQ清單對其進行補充說明,在系統評價中進一步考慮數據合并相關的PICO要素。表2列出了相關報告規范的項目[11],并說明這些項目是如何應用于InSynQ的制定。

3.2 InSynQ清單的目標人群
InSynQ清單的目標人群主要是系統評價的作者。InSynQ清單描述了經驗豐富的系統評價作者在制定和報告數據合并臨床問題時的步驟,對于循證醫學教育和新手(經驗較少的作者團隊)成長有很大幫助。在復雜的干預類系統評價中,很容易忽略一些有助于讀者理解的細節報告,因此InSynQ清單對已經具有一定經驗的作者團隊也同樣有所裨益。
InSynQ清單可以幫助方法學專家與系統評價作者團隊合作制定數據合并的計劃,以及幫助評議專家確保制定的系統評價計劃或撰寫的系統評價報告符合真正的需求。因此,InSynQ清單對于編輯以及同行評議專家的重要性也不言而喻。
3.3 InSynQ清單在Cochrane系統評價的應用
InSynQ清單實施的關鍵在于完成系統評價中每項數據的PICO問題。而PICO臨床問題的多樣性給預先指定每項數據合并的PICO帶來了巨大的挑戰。對于Cochrane系統評價的作者,通過網頁應用RevManWeb的增強功能則可以相對容易實現這一過程。
Cochrane干預類系統評價指導手冊[3,6,20]和InSynQ清單為這些增強功能提供了方法論基礎。RevManWeb內嵌的增強功能,可以提示作者在計劃階段在計劃書中定義每項數據合并的PICO,通過定義兩兩比較、干預組、每組符合條件的干預措施以及其他PICO要素來構建需要的數據合并。從而可在報告階段在RevManWeb上進行數據提取,實現數據導入,并根據計劃的兩兩比較進行Meta分析[21]。
綜上所述,干預類系統評價臨床問題清單InSynQ是從Cochrane干預類系統評價指導手冊中發展而來,是對PRISMA 2020[13]、SWiM[16]和MECIR[18]等報告規范的補充說明。對于我國數量眾多的循證研究者而言,InSynQ清單能夠幫助研究者計劃和完整地報告數據合并的臨床問題,尤其是對于多個臨床問題的干預類系統評價,可以增加決策的透明度和可重復性,因此InSynQ清單值得推廣和應用。
1 InSynQ清單的制定背景
系統評價是一種針對特定的臨床問題,識別、整理、評估和合并現有證據的研究方法。系統評價為衛生專業人員、政策制定者、公眾和其他研究者[1,2]的決策提供了證據基礎。干預類系統評價是針對干預措施的預防效果或治療效果的系統評價(例如某疫苗對某傳染病的預防效果、某新藥對某疾病的治療效果),因此也被稱為防治類系統評價或治療類系統評價,有時也會考慮干預措施的安全性問題(不良反應等傷害),其納入的原始研究往往以臨床隨機對照試驗居多[2]。在一篇干預類系統評價中有可能針對多個臨床問題[3],比如評估不同類型的干預對健康狀況的影響(例如,更改隨訪方式、增加物理距離或戴口罩是否能有效減少居家護理環境中COVID-19的傳播[4]),或者同一干預在不同類型人群中的效果(例如,輪狀病毒疫苗的預防效果在不同基礎死亡率的國家中是否有所不同[5])。對這些臨床問題進行詳細計劃可以確保系統評價的效果,專注于關鍵的臨床問題,還可以減少評價過程中的偏倚,降低數據合并決策受納入研究影響的風險,從而提高系統評價的真實性。此外,對數據合并的臨床問題進行完整和明確的報告對系統評價的可理解性和可靠性也至關重要。
在干預類系統評價中,系統評價的作者需要先定義臨床問題,然后利用PICO框架[6-8]制定納入標準。以上述的COVID-19研究[4]為例,作者首先需要評估納入研究可能的干預措施(例如“更改隨訪方式”“物理距離”等)。然后確定系統評價的納入標準,這將直接影響系統評價的結果和結論。同樣的,對每個數據合并的納入標準也是如此,但此前Cochrane干預類系統評價指導手冊主要聚焦于寬泛的臨床問題和研究的納入標準,沒有細化到特定的數據合并,直至其在第6版引入了“每個數據合并對應的PICO”(PICO for each synthesis)的概念[6],幫助系統評價的作者能夠以更透明的、可重復的方式將系統評價中納入研究分配給每項數據合并。
Brennan等[9]以圖1中的假設案例,說明了系統評價中對每個數據合并的臨床問題進行計劃和報告的必要性。假設為鍛煉對膝關節骨關節炎效果進行系統評價,圖中左邊列出了系統評價的臨床問題和納入標準,A組和B組分別是系統評價中干預相關的兩組可能的臨床問題:A組是寬泛的臨床問題(broad question),與系統評價總體寬泛的臨床問題類似,幾乎不需要額外信息來分組,例如問題1和問題2與系統評價的臨床問題基本一致,因此決定哪些研究符合當前數據合并僅僅取決于結局域的不同;B組則細化到特定的臨床問題(narrower/special question),干預可進一步分組為“負重鍛煉”和“非負重鍛煉”,因此為了確定哪些研究適用于哪一項數據合并,系統評價的作者需要定義“負重鍛煉”和“非負重鍛煉”的標準。因此,在理想情況下,研究者應當明確報告他們打算進行數據合并的臨床問題,以及為了實現這些問題分析所需的兩兩比較和標準。

此外,寬泛的和特定的這兩類臨床問題可以用于同一個系統評價[10]。例如,B組中的兩種干預可以包含在同一項數據合并中,分為不同的亞組,每個亞組都有相應的估計值,并同時得出總體估計(即進行多水平的分組計劃)。或者,當原始證據數據太少而無法討論特定臨床問題(B組)時,才會探討更寬泛的臨床問題(A組)。
基于此,Cumpston等[11]提出了InSynQ清單,為每項數據合并定義PICO,預先指定干預措施和臨床結局的分組、確定這些分組在數據合并中的作用、指定分組之間的兩兩比較。這些決策過程應該在系統評價的計劃階段和報告階段均予以報告,為讀者提供足夠的數據合并的方法學信息,使該系統評價能夠被其他評價團隊復現[11]。本研究對CNKI、WanFang Data、Europe PubMed Central、Web of Science數據庫進行全文檢索,檢索詞為InsynQ,不設置時間和語言限制。篩選后發現該清單發布至今僅有1篇英文研究對其進行了應用并報告[12],中文文獻尚無應用,這與InsynQ于2023年提出時間較近有關;此外,2024年開始的Cochrane計劃書雖然都全部建議遵守InsynQ清單,但大多數計劃書目前仍處于審稿狀態而尚未發表,因此也導致InsynQ清單的傳播僅局限在最新的Cochrane計劃書。InSynQ清單適用于干預類系統評價,可以幫助作者和編輯促進干預類系統評價臨床問題的計劃和報告,有助于同行評議與讀者的循證實踐[3,6]。本研究對其進行詳細解讀,以期為我國相關研究的報告提供參考。
2 InSynQ清單的內容與解讀
2.1 InSynQ清單內容
InSynQ清單共有11項,遵循PRISMA 2020標準[13-15],可用于系統評價的方案設計、實施、報告撰寫、同行評議以及發表以后的研究復現。InSynQ清單要點內容的中文解讀見表1,清單原文可參考完整的清單列表[9]。其中第1至9項適用于系統評價的計劃階段和報告階段,包括了數據合并所針對的臨床問題的具體說明以及分組在數據合并中的作用。這些項目是在計劃階段制定的,在報告階段時其解釋應保持不變。而第10、11項僅適用于系統評價的報告階段,包括數據合并所針對臨床問題的更改和結果的更改。

2.2 InSynQ清單解讀
清單共有11個項目,包括必要項(必須報告的內容)和可能的附加項(補充報告但非必要的內容)。
2.2.1 指定數據合并的研究人群和干預的分組
必要項:① 對每個分組進行標記。② 對每個分組進行足夠詳細的定義,以便復現每個研究適合納入哪個分組。如果上述定義基于已有文獻(例如:干預的分類),則說明引用參考文獻來源即可。③ 如果系統評價納入的原始研究是多種干預措施組合而成的干預,則指定在數據合并中這些干預的定義和分組。④ 如果系統評價納入陰性對照(例如:常規護理、無干預措施),則指定在數據合并中將這些對照如何分組。⑤ 針對寬泛和特定的兩類臨床問題,描述任何可能的、進行多水平分組的計劃。⑥ 應對原始證據數量,描述任何可能的應對計劃(例如:如果針對特定的臨床問題的研究數量太少,則計劃進行更寬泛的臨床問題的分組)。
附加項:① 考慮采用框或表格來展示分組的詳細定義。② 考慮使用邏輯模型或圖來可視化地總結分組情況、不同PICO要素之間的聯系以及每個PICO要素內部的分組。
解讀:在數據合并中,會將相似特征的研究進行分組,以便查驗干預的效果,或影響干預效果的因素。對數據合并中使用到的每個干預分組和人群分組進行清晰的定義,將幫助讀者理解數據合并的意義,還有助于確保系統評價方法學的透明度,使得哪些研究屬于哪項數據合并的過程可以復現。
可以在系統評價的各部分(例如:背景、方法),以各種形式(例如:列表、描述性文本、表格、圖例)指定分組,只要明確用于數據合并的分組即可。
2.2.2 指定數據合并的結局域
必要項:① 對每個結局域進行標記。② 對每個結局域(即“正在測量什么”)進行足夠詳細的定義,以便能夠對每個研究的結局進行分類。③ 對結局域指定適合的測量方法、測量工具或量表(即“結局是如何測量的”)。④ 對結局域指定時間框架(即“何時測量結局”)(例如:最長12周)。⑤ 針對寬泛的和特定的兩類臨床問題,描述任何可能對結局域進行多水平分類的計劃。(例如:“抗抑郁藥物對抑郁癥的效果”與“使用漢密爾頓抑郁量表測量抗抑郁藥物對抑郁癥的效果”或“使用兒童抑郁量表修訂版測量抗抑郁藥物對抑郁癥的效果”)。⑥ 應對原始證據數量,描述任何可能的應對計劃(例如:如果針對“特定健康行為”影響的結局指標的研究數量太少,則計劃改為“任何健康行為”影響的結局指標)。
附加項:① 考慮使用表格來展示結局域的詳細信息。
解讀:指定在數據合并中要使用的結局域可以讓讀者理解評價中討論的具體臨床問題(即評價目的)。例如,評價新一代抗抑郁藥對“任何持續時間抑郁癥”“短期內(最長12周)的抑郁癥”“長期內(最長12個月)的抑郁癥”,或所有3個結局域的效果。此外,指定結局域使讀者能夠確認數據合并中使用的分組是預先計劃的,還是受到納入研究報告內容的影響。
在進行數據合并時,結局域基本要素通常會在Cochrane計劃書或系統評價模板中的“結局測量類型”部分報告,詳細的定義可能在表格中報告。需注意的是,應避免在沒有明確指定結局將如何分組的情況下,在“結局測量類型”部分列出結局。例如,在標題“抑郁癥”下列出“漢密爾頓抑郁量表”“蒙哥馬利-阿斯伯格抑郁量表”“兒童抑郁量表”,讀者不清楚數據合并的分組是“抑郁癥”,還是將對每個測量量表分別進行數據合并。
2.2.3 給出分組的理由
必要項:① 對于每個PICO要素,描述分組的理由。② 如果分組基于現有體系(例如:已發表的理論框架、分類體系或核心結局指標集合或其他系統評價),則說明引用參考文獻來源,并注明為本次系統評價所做的相應調整。
附加項:① 考慮使用邏輯模型或圖來可視化地總結不同PICO要素之間的聯系和每個PICO要素內部的分組,以及作用機制(路徑)。
解讀:數據合并中分組的依據是多樣的(例如:干預的內容、目的或實施方式;結局指標測量方法或時間;與不公平相關的人口特征)。分組的理由可以是理論(例如:可能的作用機制)、現有體系或臨床實踐、經驗證據、系統評價作者的優先事項(見項目8)或其他因素。決策還應考慮影響數據合并的實際臨床問題。例如,根據可用證據的數量決定討論特定的臨床問題還是寬泛的臨床問題。
報告數據合并中分組的理由,有助于讀者理解系統評價考慮了哪些因素以及為什么做出特定分組的決策。這些決策對系統評價的作者來說可能顯而易見,但對讀者來說卻不一定。另外給出分組理由可以讓讀者驗證分組方法是否與評價目的一致,增加其可信度。對于將所有干預措施(或其他PICO元素)在同一個寬泛的分組中進行數據合并的特殊情況(例如:任意運動、任意心理社會干預、任意健康行為結果),也同樣要給出理由。
一般來說,分組的理由應在指定數據合并分組的部分報告。在某些情況下,例如需要更詳細的解釋或使用邏輯模型時,可能在其他部分(例如:背景)給出分組理由,并從方法學部分交叉引用。
2.2.4 確定每個分組在數據合并中的作用
必要項:① 確定哪些特定的分組會構成基本的比較,以及哪些分組會在比較中用于分層。② 如果可以,確定哪些特定的分組可以用于探索干預效果變化的可能原因(例如:亞組分析或Meta回歸中)。③ 如果可以,確定哪些特定的分組可以用于敏感性分析,以檢驗研究結論或假設的穩健性。④ 確定特定的分組在數據合并或文章總結中的其他作用(例如:組織文本或圖表)。⑤ 如果使用邏輯模型或圖來展示分組,明確這些分組在數據合并中的作用。
本項目沒有附加項。
解讀:確定每個分組在數據合并中的作用,可以讓讀者理解數據合并的結構。分組可以作為兩兩比較的基礎,即在每項數據合并中指定的干預組和結局域。此外,分組還可以用于組織文本(即將分組作為報告文本的小標題)或圖表,探索干預效果改變的可能原因,檢驗數據合并結果的穩健性。一個常見的場景是,在寬泛分類中特定的干預措施,例如:某一系統評價中符合條件的干預措施包括“關系方法”(例如,父母-子女干預,以家庭為中心的干預)和“身心方法”(例如,團體音樂療法、瑜伽),符合條件的對照組是“任意非活性對照”,這時需要進一步說明,是① 使用寬泛的類別構成基本比較(關系方法與對照組、身心方法與對照組),并在這些類別中按特定類型干預進行分層;還是② 使用特定類型的干預構成基本比較(父母-子女干預與對照組;瑜伽與對照組),將廣泛的類別作為標題。從而讓讀者了解作者將如何構建數據合并。
需根據具體情況確定在哪一部分報告每個分組在數據合并中的作用。例如,① 在異質性或敏感性分析中使用的分組通常在Cochrane計劃書或系統評價模板的“數據合并”部分的小節中報告(即“亞組分析和異質性分析”“敏感性分析”)。② 在報告2.2.5項的內容時直接確定用于比較的分組的作用,則無需進一步解釋。
2.2.5 指定干預組之間的兩兩比較
必要項:① 列舉干預組(包括對照組)之間所有可能的兩兩比較。② 對這些兩兩比較的重要性進行排序,或者聲明重要性沒有排序。③ 決定共同干預是納入同一比較中還是納入不同比較中。④ 當從所有可能的兩兩比較中僅選擇一部分報告時,則說明做出選擇的理由。
本項目沒有附加項。
解讀:預先指定兩兩比較,能夠保證呈現的比較結果和事先計劃一致,而不是在系統評價過程中僅選擇性報告有利的結果。例如存在多個干預組:認知行為療法(CBT)、行為療法(BT)、認知療法(CT)、等候名單(WL)的評價中,有6種可能的比較,評價可能只對其中一部分感興趣(例如,CBT與WL、BT與WL),預先指定感興趣的兩兩比較組,能夠向讀者保證呈現的比較是事先計劃好的,而非挑選后的結果。
目前Cochrane計劃書或系統評價模板中沒有特定的“比較”部分,作者可以創建特定的副標題,具體位置適合放在方法的“數據合并”部分,也可以考慮放在“納入評價標準-干預類型”部分。
2.2.6 確保研究目的與數據合并所針對的臨床問題相一致
必要項:① 確保研究目的涵蓋了數據合并所針對的臨床問題,并且有足夠的細節使得研究目的與相應的數據合并相匹配。② 在系統評價的報告中,針對臨床問題各部分均使用一致的措辭(術語),包括研究目的部分。
本項目沒有附加項。
解讀:雖然系統評價的作者在為數據合并制定PICO之前就已經確定了系統評價的研究目的,但是還是需要確保系統評價的研究目的與每項數據合并的PICO相一致。這些PICO是系統評價研究目的的具體體現。
以基于學校的促進體育活動的干預評價為例,假設研究目的是:評估基于學校的不同類型干預(課前或課后體育活動、提高身體素質的課程、校內體育活動、多種活動組合)與常規鍛煉相比,對體能和體質的影響。作者計劃在兩個水平上進行數據合并:① 任意基于學校的促進體育活動干預與常規鍛煉的比較;② 四種特定類型的干預(每種都需要定義)效果。需要在評價中詳細區分所有5個干預組及其在數據合并中的作用,結局和分組也是如此。如果作者選擇評價任意基于學校的促進體育活動干預效果,需要給出理由,以便讀者清楚地了解研究目的和數據合并所針對的臨床問題是否一致。
應在研究目的部分報告本項目。
2.2.7 指定數據合并的方法學分組
必要項:① 提供方法學分組的理由。② 對每個方法學分組進行標記。③ 對每個方法學分組進行足夠詳細的定義,以便能夠對每個研究進行分組。④ 描述方法學分組在數據合并中的作用。
本項目沒有附加項。
解讀:干預類系統評價主要是討論關于干預措施收益和風險的臨床問題,InSynQ清單第1~5項已經給出了相關分組的指導。此外,干預類系統評價還需要討論針對上述臨床問題的分析結果面對不同的方法學因素(例如:不同的偏倚風險、不同的研究設計、不同的結局測量方法)是否穩健,從而提高結論的可靠性。與人群、干預措施和結局類似,本項目重要的是清晰地定義數據合并中每個方法學分組、分組的依據和理由(項目3)以及每個分組在數據合并中的作用(例如,敏感性分析,亞組分析)(項目4)。
數據合并中方法學分組的基本要素通常在Cochrane計劃書或系統評價模板的“數據合并”部分的小節中報告(即“亞組分析和異質性分析”“敏感性分析”)。
2.2.8 說明患者、公眾以及其他利益相關者是如何參與臨床問題制定的
必要項:① 描述患者、公眾以及其他利益相關者是如何參與臨床問題制定的(理想情況下使用ACTIVE框架)。如果沒有患者、公眾或其他利益相關者的參與,則予以說明。
本項目沒有附加項。
解讀:患者和公眾參與(PPI)制定系統評價的臨床問題可以提高研究的患者相關性以及臨床重要性。PPI可能包括涉及的患者、潛在患者、護工、享受公共衛生服務的健康人以及公共衛生服務機構代表。除了PPI以外,其他利益相關者包括衛生專業人員、衛生決策者以及研究基金資助者。ACTIVE(authors and consumers together impacting on evidence)框架是研究者與其他利益相關者共同參與循證研究的理想方案,該框架包括“誰參與?”“如何招募利益相關者?”“參與的方式是什么?”“在系統評價過程的哪個階段參與?”以及“參與到什么程度?”這5個問題。患者、公眾以及其他利益相關者可以基于ACTIVE框架,從多個角度來參與臨床問題的制訂,例如確定結局域(InSynQ清單第2項)、優先考慮哪些比較(InSynQ清單第5項)。
理想情況下,在各階段參與評價的利益相關者(包括制定評價問題)應在自己的部分對本項目予以報告,可以作為方法的一部分,也可以作為額外的補充材料。當特定方法的選擇(例如,結局域的選擇)受到利益相關者的影響時,也可能在對應的部分報告(例如,結局測量類型)。
2.2.9 針對各項數據合并,描述納入研究的決策過程
必要項:① 針對各項數據合并,描述納入研究的決策過程(例如:列出研究的干預特征,并與每項數據合并的計劃分組進行比較)。
本項目沒有附加項。
解讀:在進行數據合并(PRISMA 2020[13-15]第13d項)之前,必須決定哪些研究適用于哪項項數據合并(PRISMA 2020[13-15]第5項)。這一決策過程可能涉及主觀判斷,從而影響數據合并的結果,然而系統評價的報告經常缺失這些與決策過程相關的信息。為了提高決策的透明度,建議報告這些與決策過程相關的所有信息。這可能涉及對人群、干預措施和結局的主要特征進行制表和編碼。例如,在評估心理干預措施對孕期戒煙效果的評價中,根據預先指定的,每項研究的主要干預措施被編碼為以下之一:咨詢、健康教育、反饋、基于激勵的干預、社會支持。這種編碼為各項數據合并(例如,基于激勵的干預與常規護理)確定納入的研究提供了基礎,類似的編碼可應用于人群和結局。
在Cochrane計劃書或系統評價模板的“數據提取與管理”或“數據合并”部分報告。具體報告位置將取決于作者對研究的PICO元素進行編碼和分析的方法。
2.2.10 說明在系統評價報告階段對計劃方案中的分組或比較所做的更改
必要項:① 對于所有在計劃方案中未報告但是在系統評價中使用到的分組進行標記和定義。② 列出所有在計劃方案中未報告但是在系統評價中做出的比較。③ 說明在系統評價中對這些計劃的分組或比較進行更改的理由。
本項目沒有附加項。
解讀:在系統評價實施過程中,尤其是涉及多臂研究、多種干預組或者多種結局域的復雜情況,作者可能會更改計劃方案,從而實現對現有原始證據的最佳利用。比如發現在原計劃的兩兩比較中原始證據數量不足時,可能會采用更寬泛的分組或比較。
所有新增的分組或兩兩比較應在方法部分報告(例如,將新的兩兩比較添加到比較列表中)。所有變更,包括未使用的方法,也應在“方案與評價之間的差異”部分描述。
2.2.11 結果部分的分組和比較需要與方法學部分一致
必要項:① 使用方法學部分指定的分組和比較來報告系統評價的結果。② 使用方法學部分相同的分組標簽來報告系統評價的結果。
本項目沒有附加項。
解讀:在報告結果部分時,其數據合并的PICO應與系統評價的研究目的和方法學部分中的報告保持一致,這樣有助于讀者輕松地將研究結果與臨床問題相匹配,從而有助于讀者的循證實踐。例如:① 應用與方法學相同的分組和比較;② 應用與方法學相同的分組標簽(即使用一致的術語);③ 按照研究目的順序呈現結果;④ 結果部分的描述對應其解決的研究目的。
3 討論
3.1 InSynQ清單與其他報告規范的關系
InSynQ清單詳細說明了如何報告干預類系統評價的臨床問題,以及在系統評價過程中處理如何這些臨床問題。PRISMA 2020報告規范[13-15]、SWiM報告規范[16,17]和Cochrane干預類系統評價的MECIR標準[18]都包括了臨床問題相關的項目,涉及評價的研究目的、兩兩比較、分組等方面。InSynQ清單并非用于取代上述報告規范,而是對其進行補充說明,因為已有規范缺少對目前已發表的評價中已知的不完整報告內容的指導[11],例如PRISMA 2020和SWiM有與分組相關的報告要素,但從項目及相關的解釋中可以看出,這兩個報告規范都沒有將“每個數據合并對應的PICO”與“評價的PICO”的概念區分開來,因此InSynQ清單對其進行補充說明,在系統評價中進一步考慮數據合并相關的PICO要素。表2列出了相關報告規范的項目[11],并說明這些項目是如何應用于InSynQ的制定。

3.2 InSynQ清單的目標人群
InSynQ清單的目標人群主要是系統評價的作者。InSynQ清單描述了經驗豐富的系統評價作者在制定和報告數據合并臨床問題時的步驟,對于循證醫學教育和新手(經驗較少的作者團隊)成長有很大幫助。在復雜的干預類系統評價中,很容易忽略一些有助于讀者理解的細節報告,因此InSynQ清單對已經具有一定經驗的作者團隊也同樣有所裨益。
InSynQ清單可以幫助方法學專家與系統評價作者團隊合作制定數據合并的計劃,以及幫助評議專家確保制定的系統評價計劃或撰寫的系統評價報告符合真正的需求。因此,InSynQ清單對于編輯以及同行評議專家的重要性也不言而喻。
3.3 InSynQ清單在Cochrane系統評價的應用
InSynQ清單實施的關鍵在于完成系統評價中每項數據的PICO問題。而PICO臨床問題的多樣性給預先指定每項數據合并的PICO帶來了巨大的挑戰。對于Cochrane系統評價的作者,通過網頁應用RevManWeb的增強功能則可以相對容易實現這一過程。
Cochrane干預類系統評價指導手冊[3,6,20]和InSynQ清單為這些增強功能提供了方法論基礎。RevManWeb內嵌的增強功能,可以提示作者在計劃階段在計劃書中定義每項數據合并的PICO,通過定義兩兩比較、干預組、每組符合條件的干預措施以及其他PICO要素來構建需要的數據合并。從而可在報告階段在RevManWeb上進行數據提取,實現數據導入,并根據計劃的兩兩比較進行Meta分析[21]。
綜上所述,干預類系統評價臨床問題清單InSynQ是從Cochrane干預類系統評價指導手冊中發展而來,是對PRISMA 2020[13]、SWiM[16]和MECIR[18]等報告規范的補充說明。對于我國數量眾多的循證研究者而言,InSynQ清單能夠幫助研究者計劃和完整地報告數據合并的臨床問題,尤其是對于多個臨床問題的干預類系統評價,可以增加決策的透明度和可重復性,因此InSynQ清單值得推廣和應用。