一項具有臨床應用價值的干預措施必須是有效且安全的,因此評價干預措施時,需綜合權衡其益害比,只有益處大于危害的干預措施才有應用價值。評價某種干預措施的益害關系,應在臨床試驗中同時報告益處和危害的證據。為了提高臨床試驗中危害的報告質量,CONSORT工作組曾在2001版的CONSORT聲明中增加了1項有關危害的條目,之后又于2004年發布了針對危害報告的擴展版,但該擴展版并未得到廣泛應用,目前危害的報告仍不充分。為了改善這一情況,CONSORT工作組對《更好地報告隨機試驗中的危害:CONSORT聲明擴展版》進行了更新,發布了《CONSORT危害2022聲明、解釋與說明:隨機試驗危害報告指南的更新版》(Harms 2022)。本文對Harms 2022更新情況進行介紹和解讀,旨在幫助研究人員更好地理解與應用該聲明,以期為提高臨床研究中危害的報告質量提供幫助。
引用本文: 李斌艷, 王麗瓊, 段炎珊, 王宇, 屠建鋒, 石廣霞, 劉存志. 隨機試驗危害報告指南:Harms 2022聲明解讀. 中國循證醫學雜志, 2024, 24(3): 339-347. doi: 10.7507/1672-2531.202306157 復制
版權信息: ?四川大學華西醫院華西期刊社《中國循證醫學雜志》版權所有,未經授權不得轉載、改編
干預措施的益害關系對臨床應用的選擇及證據評價尤為重要[1]。幾乎所有醫療干預措施都會對人體存在或多或少的不良影響,因此評價某項干預措施時,不但要了解其益處,還要知道其危害性,以綜合權衡益害比[2],明確臨床應用價值。但是由于干預和隨訪時間短、計劃和設計不充分、文章篇幅有限、研究人員報告意識差[3]、缺乏監督管理機構[4]等原因,臨床試驗中對危害的報告仍存在不足[5,6]。干預措施的危害會嚴重影響患者的生活質量[7]和治療依從性[8],并增加患者和衛生系統的經濟成本[9]。為了讓患者和醫療保健提供者做出真正明智的決定,建議在臨床試驗中同時報告益處和危害的證據。
隨機對照試驗(randomized controlled trial,RCT)是目前國際上公認的評價干預措施效果的金標準,為規范RCT的報告,1996年David Moher和Drummond Rennie教授起草了第一版CONSORT聲明[10],該版聲明并未對危害的報告提出要求;隨后在2001年的修訂版中增加了一項關于危害的條目[11],但僅這一項條目并不能充分反映危害相關問題的重要性;因此,CONSORT工作組集中討論了如何改進這一不足,于2004年發布了《更好地報告隨機試驗中的危害:CONSORT聲明擴展版》(簡稱“Harms 2004”),對危害的完整報告提供了具體指導[12]。然而,該版聲明并未得到廣泛應用。有研究發現自Harms 2004發布以來,RCT中危害的報告情況略有改善但仍不理想,Harms 2004中有一半條目的報告率低于50%[13]。有系統評價對2015—2016年發表在BMJ、JAMA、NEJM、Lancet期刊上的RCT進行分析,發現所有納入研究均未使用Harms 2004以規范危害的報告[6]。盡管CONSORT已獲得眾多醫學期刊的認可,但大部分醫學期刊的投稿說明中并未明確提及其危害擴展版,Harms 2004的認可度仍亟待提高。
為改善臨床試驗中危害報告不充分的情況,CONSORT工作組對Harms 2004進行了更新,于2023年4月在BMJ雜志上發布了《CONSORT危害2022聲明、解釋與說明:隨機試驗危害報告指南的更新版》(簡稱“Harms 2022”)。本文對Harms 2022所有條目進行中文解讀,旨在幫助研究人員更好地理解與應用該聲明,以期為提高臨床研究中危害的報告質量提供幫助。
1 Harms 2022聲明簡介
與Harms 2004不同,Harms 2022不再被設為獨立的擴展版,而是將危害有關的條目整合到CONSORT中,目的是促進RCT中干預措施利弊關系的完整透明報告。該清單包括標題和摘要、引言、方法、結果、討論和其他信息6個部分共16個條目,其中新增的3個條目,分別是6c、17a2和17c,以減少潛在的報告偏倚;17a2要求如果在正文中未報告危害,應提供原因(如在附件中補充報告、未監測危害、未觀察到危害發生等)以及是否可以從其他地方獲得數據;17c要求若沒有觀察到危害,應清楚報告是零事件。另外13個條目(1b、2b、6a、11a、12a、13a、14a、16、17a、17b、18、20和24)在CONSORT原條目的基礎上通過添加“益處和危害(benefits and harms)”這一短語進行最低限度的修改。CONSORT 2010[14]和Harms 2022[15]的條目清單比較見表1。Harms 2004中的條目5、6、8包含多個組成部分,給危害的報告帶來挑戰,Harms 2022對這些條目進行了細化,使其更加清晰,并新增了條目24,是關于試驗方案的報告。Harms 2004[12]與Harms 2022[15]條目清單比較見表2。
2 術語
Harms 2022將危害定義為干預或治療過程中可能產生的不良后果的總和,將不良事件和藥物不良反應作為描述危害的另一個術語,多用于監督管理研究。聲明中還明確提到不推薦使用其他術語來描述危害,例如“安全性(safety)”“副作用(side effect)”“風險(risk)”。應用“安全性”一詞報告危害的研究很多[16,17],但“安全性”一詞有一定的誤導性,可能暗示干預措施的危害很小或沒有危害,應盡量避免使用;“副作用”指應用治療量的藥物后出現的與治療目的無關的藥理作用,會隨著治療目的的不同而有所改變,并暗示與干預措施的機制有關。例如,阿托品在臨床上有廣泛應用,可解除胃腸道平滑肌痙攣、抑制腺體分泌、擴瞳(表現為視物不清)等[18]。當患者服用阿托品治療胃腸道疼痛時,視物不清是其副作用;而作為眼科擴瞳藥物時,視物不清又是其藥理作用。因此雖然副作用有時會引起一定的不適,但并非一定指有害的作用。除此之外,參加德爾菲調查的患者代表們認為副作用一詞低估了危害的嚴重性,不推薦使用;“風險”一詞強調不確定性,通俗來講,指的是發生某事件的概率,并不能用來表示事件的性質。當用風險一詞描述危害時,其實際代表的是該干預措施發生危害的概率。同時要求避免使用一些沒有明確含義、模棱兩可的術語,例如“意外事件(unintended events)”、“預期事件(anticipated events)”等。
Harms 2022要求在試驗中應說明危害的結局是否是預先設定的,如果是,還應說明如何監測危害(系統評估還是非系統評估)。其中預先設定是指在方案中明確定義的結局指標,非預先設定是指試驗方案或試驗注冊之外的結局指標。系統評估是指使用標準化的臨床檢查、問卷調查和醫療器械測量受試者的相關指標;非系統評估則是指對危害進行被動或非結構化報告,是患者在無提示的基礎上進行的自發報告,因此可以發現先前未報告過的危害,尤其是當多個受試者出現相同的危害事件,可以對系統評估做有意義的補充。
在危害報告中使用不規范的術語,可能會誤導讀者、低估危害嚴重性等,Harms 2022對術語的使用做了進一步規范,可以提高研究者對危害的重視程度,平衡好RCT研究中對益處和危害的報告。
3 條目解讀
3.1 標題和摘要
條目1b:結構式摘要,包括試驗設計、方法、益處和危害結局的結果、結論幾個部分(具體的指導建議見“CONSORT for abstracts”)。
解讀:修改條目,通過添加“benefits and harms”短語。摘要中危害的報告若缺乏準確性和完整性可能會對讀者造成誤導或帶來困惑,尤其是對于那些無法獲取全文的讀者。例如在摘要中只報告益處而未提及危害,可能會使讀者不清楚該研究是未監測危害,還是監測了但未觀察到危害發生,亦或是監測并觀察到了危害但未報告。此外,在摘要中使用模棱兩可的描述(如“安全”“耐受良好”)可能誤導讀者認為該干預措施是安全的。因此在摘要的結果部分,應同時報告益處和危害。
3.2 引言
條目2b:對益處和危害結局的具體目的或假設。
解讀:修改條目,同上。幾乎所有醫療干預措施都會對人體存在或多或少的不良影響,因此評價某項干預措施時,不但要了解其益處,還要知道其危害性。該條目要求研究者在引言部分同時說明試驗計劃中對益處和危害的考慮。報告時可以用一句話概括,如“我們假設,與假經顱直流電刺激(transcranial direct current stimulation,tDCS)相比,tDCS對抑郁癥的療效更佳,并且兩組的不良事件發生率相似”[19]。
3.3 方法
條目6a:完整而確切地說明預先設定的主要和次要結局指標,包括益處和危害,以及它們是在何時、如何測評的。
解讀:修改條目,同上。危害應該被視為重要的結局指標進行詳細說明,其原則是提供的信息要足以使他人也能夠使用這些指標。對預先設定并進行系統評估的危害,應提供定義(如失眠)、具體的測量工具(如失眠的嚴重程度指數)、評估指標(如較基線的變化值、療后值、時間-事件)、統計指標(如均值、中位數、比例)、每個結局指標收集的時間點等;對于非系統評估的危害,則應詳細說明收集患者危害信息的具體方法及時間點(如附上一個空白的病例報告表)。若預先設定的結局指標在評估的時間點、統計指標等方面存在改動,也應進行報告,明確這些信息可減少潛在的報告偏倚,提高可信度。
關于測量方式,建議研究中盡可能使用標準化和確證過的測量工具來監測危害。例如艾森貝格(Asberg)抗抑郁藥不良反應量表可用于評定患者服用抗抑郁藥后的不良反應、諾氏(Naranjo's)評估量表可用來評價和確定藥物使用與藥物不良反應之間的相關性及緊密程度。關于如何選擇測量工具,COSMIN(consensus-based standards for the selection of health measurement instruments)等指南中有具體指導。
條目6c:描述是否以及如何確定非預先設定的益處和危害結局,包括任何選擇標準,如果適用的話。
解讀:新增條目。在試驗報告中增加非預先設定的結局指標是一個備受關注的問題[20],一項研究評估了2015年10月至11月發表在BMJ、JAMA、Lancet、NEJM、Ann Intern Med期刊上的所有試驗,發現納入的67個試驗共增加了365個結局指標,但只有13.7%的結局指標被描述為非預先設定[21]。預先設定的結局和最終報告的結局之間的差異會給試驗帶來選擇性報告偏倚,因此要求研究者在試驗報告中說明是否有非預先設定的益處和危害結局指標。如果有,還應報告哪些是非預先設定的結局,增加這些結局的原因以及采用的測量工具、評估指標、統計指標以及每個指標的采集時間等。
條目11a:如果實施了盲法,分配干預措施之后對誰設盲(例如受試者、醫護提供者、益處和危害的結局評估者)以及盲法是如何實施的。
解讀:修改條目,同上。研究者在試驗過程中可能會傾向于使干預組的危害少于對照組,而對危害的結局評估者設盲可減少其個人傾向對結局評估的影響。如果可以的話,可以選擇設立外部委員會,由委員會的成員對危害進行評估和歸因分析。患者是否設盲對危害評估也可能會造成影響。例如明確知道自己服用的是安慰劑的患者(已破盲)和不確定自己服用的是藥物還是安慰劑的患者(未破盲),二者對危害的報告可能是不同的,主要取決于患者的預期是積極還是消極。
條目12a:用于比較各組益處和危害的主要和次要結局指標的統計學方法。
解讀:修改條目,同上。要求研究者報告每個結局指標所采用的統計學方法,包括益處和危害的,并說明這些方法是否是預先設定的。對于非系統評價的危害,很多研究在統計分析之前會對其進行編碼并分組。例如在一項評估健康新生兒口服2型脊髓灰質炎疫苗的安全性研究中,將患者主動報告的不良事件分為感染類、胃腸類、皮膚病等不同類別[22]。將不良事件進行分類,有利于發現危害相關的綜合征,但可能導致忽視某種重要危害。若涉及這種情況,研究者應明確分類的標準以及分類是否是預先設定的。
當危害與時間相關時,研究者還應說明試驗中如何計劃和解釋危害發生的時間、持續時間,隨訪時間以及復發性不良事件的計數方式(是作為不同的事件分別計數還是只算作一起不良事件),報告這些信息有利于更準確全面地了解危害。例如化療藥物產生的周圍神經病變,其發病特點為早期出現,隨著時間的推移而逐漸好轉,其癥狀嚴重程度可能隨化療周期呈現“鋸齒狀模式”[23]。對于這種危害,需要在報告的時候,將癥狀與時間相關聯。
3.4 結果
條目13a:隨機分配到各組的受試者例數,接受已分配治療的例數,以及納入益處和危害結局分析的例數。
解讀:修改條目,同上。由于篩選或脫落等原因,納入益處和危害結局分析的人群可能是不同的[24],應分別交代。例如,治療中使用了禁用藥物的受試者,根據符合方案數據集的定義,應將其從療效分析中排除,但該受試者接受過至少一次治療,符合安全性數據集定義,應納入危害分析中。此外,試驗中干預措施劑量減少、停藥的信息也應進行報告,并強調原因。因為雖然患者并未退出試驗,但這種變化可能與危害、患者耐受性等有關。有研究[25]將停藥、降低劑量等定義為重要不良事件,程度雖不如嚴重不良事件,但重視這些信息有助于改進干預措施,更好地應用于臨床。
在長期隨訪的試驗中,對于因危害退出的患者,應將早期和晚期退出的受試者分開描述(可區分早期和晚期危害),以提高危害相關信息的準確性。
條目14a:招募期、對益處和危害結局的隨訪時間,并說明具體日期。
解讀:修改條目,同上。對危害評估的時間多種多樣,可以在整個研究期間進行,也可以只在部分期間或特定時間點進行,甚至在療效評估完成后繼續進行,因此應明確報告對危害結局的隨訪時間。
CONSORT Harms 2022特殊考量:試篩期(run-in periods)。
解讀:試篩期是指在隨機化之前,通過給病人試驗性用藥,排除那些出現危害事件的病人,因此使用試篩期的試驗可能會低估干預措施的危害性[26]。從評估危害的角度出發,如果試驗使用了試篩期,研究者應對試篩期期間或之后因危害而被排除的患者進行報告,否則可能低估干預措施的危害性;報告的內容應包括:被排除患者的數量、基線特征以及被排除的原因等。
條目16:各組納入每一種益處和危害結局分析的受試者數目(分母),以及是否按最初的分組分析,以及是否有任何排除。
解讀:修改條目,同上。益處和危害結局指標的分析人群可能是不同的[24,27],研究者應報告清楚是哪些人群被包含在哪些分析中以及對應的受試者數目。安全性數據集可用于臨床試驗的危害評價,通常包括所有隨機化后至少接受一次治療的受試者。
條目17a:各組關于益處和危害的每一項主要和次要結局指標的結果,效應估計值及其精確性(如95%可信區間)
解讀:修改條目,同上。要求對危害的結局指標,也應提供結果、效應值和精確性(95%可信區間)等信息。在報告危害時,建議將其分為系統和非系統評價,并且無論危害是否與干預措施有關,均進行報告;同時要求在報告中明確以下內容:① 報告的是至少出現一種不良事件的參與者人數(發生率)還是每單位時間內不良事件的發生數(率),以及復發性不良事件是否包括在內;② 嚴重不良事件的發生情況;③ 報告危害發生的時間并明確指出危害與暴露時間的相關性。因為暴露時間不同,患者出現危害的可能性也不同;④ 如果進行了歸因分析,即使危害被認為與干預措施無關,也應報告。
條目17a2:對于試驗報告中省略的結局(益處和危害),應提供未報告的理由,并指出可以從何處獲得省略的數據。
解讀:新增條目。在一篇文章中同時報告益處和危害,可幫助研究者更好的權衡干預措施的利弊,但由于文章篇幅有限、有大量預先設定的次要結局指標等原因,研究者可能無法在正文中同時報告所有益處和危害的結果。當出現這種情況時,研究者應說明未在正文中報告的原因,以及在何處可以獲得省略的數據。如果未能在附件中提供省略的數據,也需說明原因。
條目17b:對于益處和危害的結局,建議同時提供相對效應值和絕對效應值。
解讀:修改條目,同上。危害的結局指標常被定義為二分類變量,這種情況下遵循CONSORT指南要求,同時提供帶有可信區間的相對和絕對效應值是合適的。然而對于非系統評價的危害,應謹慎使用相對和絕對效應值,因為這些結果不是主動收集的。研究者對危害進行主動監測能更及時、客觀地獲得相關信息,若依賴于被動監測可能導致報告不及時、漏報率高等問題,進而低估危害的發生率[28]。建議對項目17a和17b的報告應視情況而定,而不僅僅基于結果是否是二分類變量。
條目17c:如果未觀察到危害,則報告零事件。
解讀:新增條目。要求研究者如果未觀察到任何危害發生,應在RCT中明確報告結果為無不良事件發生,而不能選擇不報告,使讀者明確該研究是未進行監測危害,還是監測了但未觀察到危害發生,亦或是監測并觀察到危害但未進行報告,提高研究透明度。
條目18:對益處和危害結局所做的其他分析的結果,包括亞組分析和校正分析,指出哪些是預先設定的分析,哪些是非預先設定的分析。
解讀:修改條目,同上。要求研究者對益處和危害所做的其他分析給予同等重視。與益處的亞組分析相似,危害也應報告分析了哪些亞組、選擇這些亞組的原因以及亞組間差異的大小和方向是否是預先設定的。對危害的亞組分析是有意義的,例如某干預措施在全部研究對象中觀察到的危害性是可接受的,但研究者可能還想知道在一些特定亞組中該干預措施的危害性是否同樣可以接受,因此可能會做亞組分析;并且越來越多的監管機構在新藥上市前,會要求對年齡、性別、種族等進行亞組分析[12],以全面評價新藥安全性,盡可能保證用藥安全。
3.5 討論
條目20:試驗的局限性、與收集或報告危害數據有關的潛在偏倚和不精確的原因、以及出現多種分析結果或進行選擇分析的原因(如果有這種情況)。
解讀:修改條目,同上。研究者應注意報告危害相關的局限性,包括無結論性的發現、對危害的檢驗效能低、事后分析、短期干預可能無法發現長期治療后產生的危害、僅報告出現危害事件的患者比例而忽視了重復出現的危害事件、由于危害停止干預后導致患者數據缺失等。在報告局限性時,建議同時說明為減少局限性所采取的措施。例如由于危害導致停止干預后,患者的部分數據缺失,采用多重插補等方式處理缺失值。
條目24:在哪里可以獲取完整的試驗方案和其他相關文件,包括與危害有關的補充信息。
解讀:修改條目,同上。有研究顯示,在臨床試驗中,普遍存在危害報告不充分的問題[5]。雖然Harms 2022要求盡可能在一篇文章中同時報告益處與危害以方便權衡利弊,但受篇幅限制等原因,在正文中報告關于危害的所有信息可能是困難的,因此建議研究者將未能在正文中報告的危害相關信息以附件或補充材料的方式提供給讀者,并說明在哪里可以獲取到這些信息。
4 討論
CONSORT聲明被廣泛用于提高RCT的質量,已得到500多家醫學期刊的認可,包括Lancet、BMJ、JAMA等。Harms 2022通過將危害有關的條目融入到CONSORT中,對試驗中危害的報告提出最低限度的要求。其中1b、2b、6a等13個條目是在CONSORT 2010原條目基礎上通過添加“益處和危害(benefits and harms)”這一短語進行修改的,旨在要求研究者在報告中同時提供干預措施益處和危害的證據;對新增的6c、17a2和17c條目內容進行對比,發現3個條目分別提到了“非預先設定的危害”“省略報告的危害”“未觀察到危害”,說明Harms 2022強調全面詳細地報告危害。危害報告的缺失容易給讀者帶來困惑且不利于全面衡量干預措施的利弊關系。例如在正文中省略報告危害,可能會使讀者不清楚該研究是未監測危害,還是監測了但未觀察到危害發生,亦或是監測并觀察到了危害但未報告。這提示研究者在開展RCT時,應盡可能詳細報告所有危害,如未觀察到危害,應明確報告無危害發生,必要時可添加相關補充材料。此外,Harms 2022減少了危害報告中的各類偏倚,如對危害的結局評估者設盲可減少測量偏倚,區分預先設定和非預先設定的危害可減少報告偏倚,完整報告納入危害結局分析的人數及是否有任何排除可減少隨訪偏倚。與Harms 2004相比,Harms 2022的最大變化是將危害有關的項目整合到CONSORT 2010中,不再設為單獨的擴展版;其次,有綜述[15]表明,Harms 2004中包含多個組成部分的條目不利于危害的報告,而Harms 2022通過在CONSORT基礎上進行條目的修改和增加,使危害的報告條目更加清晰;最后,在條目方面Harms 2022新增了一條對危害補充信息報告的要求。
幾乎所有醫療干預措施都會對人體存在或多或少的不良影響,因此評價某項干預措施時,不但要了解其益處,還要知道其危害性,綜合權衡益害后才能明確其臨床應用價值[2]。但是大量證據顯示,迄今為止臨床試驗中危害的報告仍不充分[3,6],其原因可能在于從申辦者到研究者都存在對危害的概念認識不清和報告意識薄弱的問題[4];除此之外,我國在對臨床試驗的安全監管方面存在不足,導致一些研究的申辦者可能會對試驗進行干預以減少不良事件的記錄。
Harms 2022是在CONSORT 2010的基礎上,結合Harms 2004,經過嚴格的文獻綜述、專家咨詢(德爾菲法)和面對面共識會議等步驟修訂而成,可信度高。因此建議發表RCT的醫學期刊將該聲明引入稿約或作者須知,同時建議研究者、期刊審稿人、編輯等參考本聲明不斷規范和完善RCT中危害的報告。作為醫學期刊編輯,應合理應用該聲明審閱和評價稿件內容,引導研究者按照聲明開展臨床研究,做到完整、清晰和透明地報告干預措施的益處和危害,從而達到提高期刊質量的目的。作為研究者,在試驗設計和實施階段,即參考本聲明考慮對干預措施益處和危害的評估,最終在論文中向讀者詳細報告有關干預措施益害關系的充分信息。另外,可以開展有效的宣傳教育以提高研究者、期刊編輯等對本清單的知曉率,提高研究者對危害報告的重視程度。
本文對Harms 2022報告清單進行解讀,旨在幫助研究者更好地理解和應用該聲明,以期為提高RCT中危害的報告質量提供幫助,不斷促進研究者完整透明地報告RCT中干預措施的益處和危害,有利于全面評估干預措施的益害關系,使其更好地服務于臨床,最終提高臨床診療水平、促進患者健康。
干預措施的益害關系對臨床應用的選擇及證據評價尤為重要[1]。幾乎所有醫療干預措施都會對人體存在或多或少的不良影響,因此評價某項干預措施時,不但要了解其益處,還要知道其危害性,以綜合權衡益害比[2],明確臨床應用價值。但是由于干預和隨訪時間短、計劃和設計不充分、文章篇幅有限、研究人員報告意識差[3]、缺乏監督管理機構[4]等原因,臨床試驗中對危害的報告仍存在不足[5,6]。干預措施的危害會嚴重影響患者的生活質量[7]和治療依從性[8],并增加患者和衛生系統的經濟成本[9]。為了讓患者和醫療保健提供者做出真正明智的決定,建議在臨床試驗中同時報告益處和危害的證據。
隨機對照試驗(randomized controlled trial,RCT)是目前國際上公認的評價干預措施效果的金標準,為規范RCT的報告,1996年David Moher和Drummond Rennie教授起草了第一版CONSORT聲明[10],該版聲明并未對危害的報告提出要求;隨后在2001年的修訂版中增加了一項關于危害的條目[11],但僅這一項條目并不能充分反映危害相關問題的重要性;因此,CONSORT工作組集中討論了如何改進這一不足,于2004年發布了《更好地報告隨機試驗中的危害:CONSORT聲明擴展版》(簡稱“Harms 2004”),對危害的完整報告提供了具體指導[12]。然而,該版聲明并未得到廣泛應用。有研究發現自Harms 2004發布以來,RCT中危害的報告情況略有改善但仍不理想,Harms 2004中有一半條目的報告率低于50%[13]。有系統評價對2015—2016年發表在BMJ、JAMA、NEJM、Lancet期刊上的RCT進行分析,發現所有納入研究均未使用Harms 2004以規范危害的報告[6]。盡管CONSORT已獲得眾多醫學期刊的認可,但大部分醫學期刊的投稿說明中并未明確提及其危害擴展版,Harms 2004的認可度仍亟待提高。
為改善臨床試驗中危害報告不充分的情況,CONSORT工作組對Harms 2004進行了更新,于2023年4月在BMJ雜志上發布了《CONSORT危害2022聲明、解釋與說明:隨機試驗危害報告指南的更新版》(簡稱“Harms 2022”)。本文對Harms 2022所有條目進行中文解讀,旨在幫助研究人員更好地理解與應用該聲明,以期為提高臨床研究中危害的報告質量提供幫助。
1 Harms 2022聲明簡介
與Harms 2004不同,Harms 2022不再被設為獨立的擴展版,而是將危害有關的條目整合到CONSORT中,目的是促進RCT中干預措施利弊關系的完整透明報告。該清單包括標題和摘要、引言、方法、結果、討論和其他信息6個部分共16個條目,其中新增的3個條目,分別是6c、17a2和17c,以減少潛在的報告偏倚;17a2要求如果在正文中未報告危害,應提供原因(如在附件中補充報告、未監測危害、未觀察到危害發生等)以及是否可以從其他地方獲得數據;17c要求若沒有觀察到危害,應清楚報告是零事件。另外13個條目(1b、2b、6a、11a、12a、13a、14a、16、17a、17b、18、20和24)在CONSORT原條目的基礎上通過添加“益處和危害(benefits and harms)”這一短語進行最低限度的修改。CONSORT 2010[14]和Harms 2022[15]的條目清單比較見表1。Harms 2004中的條目5、6、8包含多個組成部分,給危害的報告帶來挑戰,Harms 2022對這些條目進行了細化,使其更加清晰,并新增了條目24,是關于試驗方案的報告。Harms 2004[12]與Harms 2022[15]條目清單比較見表2。
2 術語
Harms 2022將危害定義為干預或治療過程中可能產生的不良后果的總和,將不良事件和藥物不良反應作為描述危害的另一個術語,多用于監督管理研究。聲明中還明確提到不推薦使用其他術語來描述危害,例如“安全性(safety)”“副作用(side effect)”“風險(risk)”。應用“安全性”一詞報告危害的研究很多[16,17],但“安全性”一詞有一定的誤導性,可能暗示干預措施的危害很小或沒有危害,應盡量避免使用;“副作用”指應用治療量的藥物后出現的與治療目的無關的藥理作用,會隨著治療目的的不同而有所改變,并暗示與干預措施的機制有關。例如,阿托品在臨床上有廣泛應用,可解除胃腸道平滑肌痙攣、抑制腺體分泌、擴瞳(表現為視物不清)等[18]。當患者服用阿托品治療胃腸道疼痛時,視物不清是其副作用;而作為眼科擴瞳藥物時,視物不清又是其藥理作用。因此雖然副作用有時會引起一定的不適,但并非一定指有害的作用。除此之外,參加德爾菲調查的患者代表們認為副作用一詞低估了危害的嚴重性,不推薦使用;“風險”一詞強調不確定性,通俗來講,指的是發生某事件的概率,并不能用來表示事件的性質。當用風險一詞描述危害時,其實際代表的是該干預措施發生危害的概率。同時要求避免使用一些沒有明確含義、模棱兩可的術語,例如“意外事件(unintended events)”、“預期事件(anticipated events)”等。
Harms 2022要求在試驗中應說明危害的結局是否是預先設定的,如果是,還應說明如何監測危害(系統評估還是非系統評估)。其中預先設定是指在方案中明確定義的結局指標,非預先設定是指試驗方案或試驗注冊之外的結局指標。系統評估是指使用標準化的臨床檢查、問卷調查和醫療器械測量受試者的相關指標;非系統評估則是指對危害進行被動或非結構化報告,是患者在無提示的基礎上進行的自發報告,因此可以發現先前未報告過的危害,尤其是當多個受試者出現相同的危害事件,可以對系統評估做有意義的補充。
在危害報告中使用不規范的術語,可能會誤導讀者、低估危害嚴重性等,Harms 2022對術語的使用做了進一步規范,可以提高研究者對危害的重視程度,平衡好RCT研究中對益處和危害的報告。
3 條目解讀
3.1 標題和摘要
條目1b:結構式摘要,包括試驗設計、方法、益處和危害結局的結果、結論幾個部分(具體的指導建議見“CONSORT for abstracts”)。
解讀:修改條目,通過添加“benefits and harms”短語。摘要中危害的報告若缺乏準確性和完整性可能會對讀者造成誤導或帶來困惑,尤其是對于那些無法獲取全文的讀者。例如在摘要中只報告益處而未提及危害,可能會使讀者不清楚該研究是未監測危害,還是監測了但未觀察到危害發生,亦或是監測并觀察到了危害但未報告。此外,在摘要中使用模棱兩可的描述(如“安全”“耐受良好”)可能誤導讀者認為該干預措施是安全的。因此在摘要的結果部分,應同時報告益處和危害。
3.2 引言
條目2b:對益處和危害結局的具體目的或假設。
解讀:修改條目,同上。幾乎所有醫療干預措施都會對人體存在或多或少的不良影響,因此評價某項干預措施時,不但要了解其益處,還要知道其危害性。該條目要求研究者在引言部分同時說明試驗計劃中對益處和危害的考慮。報告時可以用一句話概括,如“我們假設,與假經顱直流電刺激(transcranial direct current stimulation,tDCS)相比,tDCS對抑郁癥的療效更佳,并且兩組的不良事件發生率相似”[19]。
3.3 方法
條目6a:完整而確切地說明預先設定的主要和次要結局指標,包括益處和危害,以及它們是在何時、如何測評的。
解讀:修改條目,同上。危害應該被視為重要的結局指標進行詳細說明,其原則是提供的信息要足以使他人也能夠使用這些指標。對預先設定并進行系統評估的危害,應提供定義(如失眠)、具體的測量工具(如失眠的嚴重程度指數)、評估指標(如較基線的變化值、療后值、時間-事件)、統計指標(如均值、中位數、比例)、每個結局指標收集的時間點等;對于非系統評估的危害,則應詳細說明收集患者危害信息的具體方法及時間點(如附上一個空白的病例報告表)。若預先設定的結局指標在評估的時間點、統計指標等方面存在改動,也應進行報告,明確這些信息可減少潛在的報告偏倚,提高可信度。
關于測量方式,建議研究中盡可能使用標準化和確證過的測量工具來監測危害。例如艾森貝格(Asberg)抗抑郁藥不良反應量表可用于評定患者服用抗抑郁藥后的不良反應、諾氏(Naranjo's)評估量表可用來評價和確定藥物使用與藥物不良反應之間的相關性及緊密程度。關于如何選擇測量工具,COSMIN(consensus-based standards for the selection of health measurement instruments)等指南中有具體指導。
條目6c:描述是否以及如何確定非預先設定的益處和危害結局,包括任何選擇標準,如果適用的話。
解讀:新增條目。在試驗報告中增加非預先設定的結局指標是一個備受關注的問題[20],一項研究評估了2015年10月至11月發表在BMJ、JAMA、Lancet、NEJM、Ann Intern Med期刊上的所有試驗,發現納入的67個試驗共增加了365個結局指標,但只有13.7%的結局指標被描述為非預先設定[21]。預先設定的結局和最終報告的結局之間的差異會給試驗帶來選擇性報告偏倚,因此要求研究者在試驗報告中說明是否有非預先設定的益處和危害結局指標。如果有,還應報告哪些是非預先設定的結局,增加這些結局的原因以及采用的測量工具、評估指標、統計指標以及每個指標的采集時間等。
條目11a:如果實施了盲法,分配干預措施之后對誰設盲(例如受試者、醫護提供者、益處和危害的結局評估者)以及盲法是如何實施的。
解讀:修改條目,同上。研究者在試驗過程中可能會傾向于使干預組的危害少于對照組,而對危害的結局評估者設盲可減少其個人傾向對結局評估的影響。如果可以的話,可以選擇設立外部委員會,由委員會的成員對危害進行評估和歸因分析。患者是否設盲對危害評估也可能會造成影響。例如明確知道自己服用的是安慰劑的患者(已破盲)和不確定自己服用的是藥物還是安慰劑的患者(未破盲),二者對危害的報告可能是不同的,主要取決于患者的預期是積極還是消極。
條目12a:用于比較各組益處和危害的主要和次要結局指標的統計學方法。
解讀:修改條目,同上。要求研究者報告每個結局指標所采用的統計學方法,包括益處和危害的,并說明這些方法是否是預先設定的。對于非系統評價的危害,很多研究在統計分析之前會對其進行編碼并分組。例如在一項評估健康新生兒口服2型脊髓灰質炎疫苗的安全性研究中,將患者主動報告的不良事件分為感染類、胃腸類、皮膚病等不同類別[22]。將不良事件進行分類,有利于發現危害相關的綜合征,但可能導致忽視某種重要危害。若涉及這種情況,研究者應明確分類的標準以及分類是否是預先設定的。
當危害與時間相關時,研究者還應說明試驗中如何計劃和解釋危害發生的時間、持續時間,隨訪時間以及復發性不良事件的計數方式(是作為不同的事件分別計數還是只算作一起不良事件),報告這些信息有利于更準確全面地了解危害。例如化療藥物產生的周圍神經病變,其發病特點為早期出現,隨著時間的推移而逐漸好轉,其癥狀嚴重程度可能隨化療周期呈現“鋸齒狀模式”[23]。對于這種危害,需要在報告的時候,將癥狀與時間相關聯。
3.4 結果
條目13a:隨機分配到各組的受試者例數,接受已分配治療的例數,以及納入益處和危害結局分析的例數。
解讀:修改條目,同上。由于篩選或脫落等原因,納入益處和危害結局分析的人群可能是不同的[24],應分別交代。例如,治療中使用了禁用藥物的受試者,根據符合方案數據集的定義,應將其從療效分析中排除,但該受試者接受過至少一次治療,符合安全性數據集定義,應納入危害分析中。此外,試驗中干預措施劑量減少、停藥的信息也應進行報告,并強調原因。因為雖然患者并未退出試驗,但這種變化可能與危害、患者耐受性等有關。有研究[25]將停藥、降低劑量等定義為重要不良事件,程度雖不如嚴重不良事件,但重視這些信息有助于改進干預措施,更好地應用于臨床。
在長期隨訪的試驗中,對于因危害退出的患者,應將早期和晚期退出的受試者分開描述(可區分早期和晚期危害),以提高危害相關信息的準確性。
條目14a:招募期、對益處和危害結局的隨訪時間,并說明具體日期。
解讀:修改條目,同上。對危害評估的時間多種多樣,可以在整個研究期間進行,也可以只在部分期間或特定時間點進行,甚至在療效評估完成后繼續進行,因此應明確報告對危害結局的隨訪時間。
CONSORT Harms 2022特殊考量:試篩期(run-in periods)。
解讀:試篩期是指在隨機化之前,通過給病人試驗性用藥,排除那些出現危害事件的病人,因此使用試篩期的試驗可能會低估干預措施的危害性[26]。從評估危害的角度出發,如果試驗使用了試篩期,研究者應對試篩期期間或之后因危害而被排除的患者進行報告,否則可能低估干預措施的危害性;報告的內容應包括:被排除患者的數量、基線特征以及被排除的原因等。
條目16:各組納入每一種益處和危害結局分析的受試者數目(分母),以及是否按最初的分組分析,以及是否有任何排除。
解讀:修改條目,同上。益處和危害結局指標的分析人群可能是不同的[24,27],研究者應報告清楚是哪些人群被包含在哪些分析中以及對應的受試者數目。安全性數據集可用于臨床試驗的危害評價,通常包括所有隨機化后至少接受一次治療的受試者。
條目17a:各組關于益處和危害的每一項主要和次要結局指標的結果,效應估計值及其精確性(如95%可信區間)
解讀:修改條目,同上。要求對危害的結局指標,也應提供結果、效應值和精確性(95%可信區間)等信息。在報告危害時,建議將其分為系統和非系統評價,并且無論危害是否與干預措施有關,均進行報告;同時要求在報告中明確以下內容:① 報告的是至少出現一種不良事件的參與者人數(發生率)還是每單位時間內不良事件的發生數(率),以及復發性不良事件是否包括在內;② 嚴重不良事件的發生情況;③ 報告危害發生的時間并明確指出危害與暴露時間的相關性。因為暴露時間不同,患者出現危害的可能性也不同;④ 如果進行了歸因分析,即使危害被認為與干預措施無關,也應報告。
條目17a2:對于試驗報告中省略的結局(益處和危害),應提供未報告的理由,并指出可以從何處獲得省略的數據。
解讀:新增條目。在一篇文章中同時報告益處和危害,可幫助研究者更好的權衡干預措施的利弊,但由于文章篇幅有限、有大量預先設定的次要結局指標等原因,研究者可能無法在正文中同時報告所有益處和危害的結果。當出現這種情況時,研究者應說明未在正文中報告的原因,以及在何處可以獲得省略的數據。如果未能在附件中提供省略的數據,也需說明原因。
條目17b:對于益處和危害的結局,建議同時提供相對效應值和絕對效應值。
解讀:修改條目,同上。危害的結局指標常被定義為二分類變量,這種情況下遵循CONSORT指南要求,同時提供帶有可信區間的相對和絕對效應值是合適的。然而對于非系統評價的危害,應謹慎使用相對和絕對效應值,因為這些結果不是主動收集的。研究者對危害進行主動監測能更及時、客觀地獲得相關信息,若依賴于被動監測可能導致報告不及時、漏報率高等問題,進而低估危害的發生率[28]。建議對項目17a和17b的報告應視情況而定,而不僅僅基于結果是否是二分類變量。
條目17c:如果未觀察到危害,則報告零事件。
解讀:新增條目。要求研究者如果未觀察到任何危害發生,應在RCT中明確報告結果為無不良事件發生,而不能選擇不報告,使讀者明確該研究是未進行監測危害,還是監測了但未觀察到危害發生,亦或是監測并觀察到危害但未進行報告,提高研究透明度。
條目18:對益處和危害結局所做的其他分析的結果,包括亞組分析和校正分析,指出哪些是預先設定的分析,哪些是非預先設定的分析。
解讀:修改條目,同上。要求研究者對益處和危害所做的其他分析給予同等重視。與益處的亞組分析相似,危害也應報告分析了哪些亞組、選擇這些亞組的原因以及亞組間差異的大小和方向是否是預先設定的。對危害的亞組分析是有意義的,例如某干預措施在全部研究對象中觀察到的危害性是可接受的,但研究者可能還想知道在一些特定亞組中該干預措施的危害性是否同樣可以接受,因此可能會做亞組分析;并且越來越多的監管機構在新藥上市前,會要求對年齡、性別、種族等進行亞組分析[12],以全面評價新藥安全性,盡可能保證用藥安全。
3.5 討論
條目20:試驗的局限性、與收集或報告危害數據有關的潛在偏倚和不精確的原因、以及出現多種分析結果或進行選擇分析的原因(如果有這種情況)。
解讀:修改條目,同上。研究者應注意報告危害相關的局限性,包括無結論性的發現、對危害的檢驗效能低、事后分析、短期干預可能無法發現長期治療后產生的危害、僅報告出現危害事件的患者比例而忽視了重復出現的危害事件、由于危害停止干預后導致患者數據缺失等。在報告局限性時,建議同時說明為減少局限性所采取的措施。例如由于危害導致停止干預后,患者的部分數據缺失,采用多重插補等方式處理缺失值。
條目24:在哪里可以獲取完整的試驗方案和其他相關文件,包括與危害有關的補充信息。
解讀:修改條目,同上。有研究顯示,在臨床試驗中,普遍存在危害報告不充分的問題[5]。雖然Harms 2022要求盡可能在一篇文章中同時報告益處與危害以方便權衡利弊,但受篇幅限制等原因,在正文中報告關于危害的所有信息可能是困難的,因此建議研究者將未能在正文中報告的危害相關信息以附件或補充材料的方式提供給讀者,并說明在哪里可以獲取到這些信息。
4 討論
CONSORT聲明被廣泛用于提高RCT的質量,已得到500多家醫學期刊的認可,包括Lancet、BMJ、JAMA等。Harms 2022通過將危害有關的條目融入到CONSORT中,對試驗中危害的報告提出最低限度的要求。其中1b、2b、6a等13個條目是在CONSORT 2010原條目基礎上通過添加“益處和危害(benefits and harms)”這一短語進行修改的,旨在要求研究者在報告中同時提供干預措施益處和危害的證據;對新增的6c、17a2和17c條目內容進行對比,發現3個條目分別提到了“非預先設定的危害”“省略報告的危害”“未觀察到危害”,說明Harms 2022強調全面詳細地報告危害。危害報告的缺失容易給讀者帶來困惑且不利于全面衡量干預措施的利弊關系。例如在正文中省略報告危害,可能會使讀者不清楚該研究是未監測危害,還是監測了但未觀察到危害發生,亦或是監測并觀察到了危害但未報告。這提示研究者在開展RCT時,應盡可能詳細報告所有危害,如未觀察到危害,應明確報告無危害發生,必要時可添加相關補充材料。此外,Harms 2022減少了危害報告中的各類偏倚,如對危害的結局評估者設盲可減少測量偏倚,區分預先設定和非預先設定的危害可減少報告偏倚,完整報告納入危害結局分析的人數及是否有任何排除可減少隨訪偏倚。與Harms 2004相比,Harms 2022的最大變化是將危害有關的項目整合到CONSORT 2010中,不再設為單獨的擴展版;其次,有綜述[15]表明,Harms 2004中包含多個組成部分的條目不利于危害的報告,而Harms 2022通過在CONSORT基礎上進行條目的修改和增加,使危害的報告條目更加清晰;最后,在條目方面Harms 2022新增了一條對危害補充信息報告的要求。
幾乎所有醫療干預措施都會對人體存在或多或少的不良影響,因此評價某項干預措施時,不但要了解其益處,還要知道其危害性,綜合權衡益害后才能明確其臨床應用價值[2]。但是大量證據顯示,迄今為止臨床試驗中危害的報告仍不充分[3,6],其原因可能在于從申辦者到研究者都存在對危害的概念認識不清和報告意識薄弱的問題[4];除此之外,我國在對臨床試驗的安全監管方面存在不足,導致一些研究的申辦者可能會對試驗進行干預以減少不良事件的記錄。
Harms 2022是在CONSORT 2010的基礎上,結合Harms 2004,經過嚴格的文獻綜述、專家咨詢(德爾菲法)和面對面共識會議等步驟修訂而成,可信度高。因此建議發表RCT的醫學期刊將該聲明引入稿約或作者須知,同時建議研究者、期刊審稿人、編輯等參考本聲明不斷規范和完善RCT中危害的報告。作為醫學期刊編輯,應合理應用該聲明審閱和評價稿件內容,引導研究者按照聲明開展臨床研究,做到完整、清晰和透明地報告干預措施的益處和危害,從而達到提高期刊質量的目的。作為研究者,在試驗設計和實施階段,即參考本聲明考慮對干預措施益處和危害的評估,最終在論文中向讀者詳細報告有關干預措施益害關系的充分信息。另外,可以開展有效的宣傳教育以提高研究者、期刊編輯等對本清單的知曉率,提高研究者對危害報告的重視程度。
本文對Harms 2022報告清單進行解讀,旨在幫助研究者更好地理解和應用該聲明,以期為提高RCT中危害的報告質量提供幫助,不斷促進研究者完整透明地報告RCT中干預措施的益處和危害,有利于全面評估干預措施的益害關系,使其更好地服務于臨床,最終提高臨床診療水平、促進患者健康。