針對臨床研究中結局指標報告不完整、不規范的情況,國際上的方法學專家在臨床試驗方案報告標準(SPIRIT)2013聲明和臨床試驗報告的統一標準(CONSORT)2010聲明的基礎上,于2022年同步推出了臨床試驗方案及報告中無論人群和研究類型都應報告的結局指標條目,即SPIRIT-結局指標2022擴展版和CONSORT-結局指標2022擴展版。本文對這兩個結局指標報告指南進行了介紹和解讀,并指出,對于臨床研究者而言,使用結局指標報告指南有助于研究者在制定研究方案及報告研究結果時全面考慮結局指標相關的問題,提高研究設計及報告的質量;對于核心指標集研究而言,結局指標核心五要素的提出對核心指標集研究者提供了結局指標提取和分析的思路,有助于核心指標集研究的規范化;結局指標報告指南中對相關醫學術語的解釋則一定程度上有助于中醫藥領域方法學的完善。
引用本文: 邱瑞瑾, 張心怡, 劉姝伶, 關之玥, 陳卓, 王文惠, 商洪才. 臨床研究結局指標報告指南解讀及其對中醫藥領域研究的意義及啟示. 中國循證醫學雜志, 2024, 24(1): 119-124. doi: 10.7507/1672-2531.202307127 復制
版權信息: ?四川大學華西醫院華西期刊社《中國循證醫學雜志》版權所有,未經授權不得轉載、改編
臨床研究的透明度和研究報告的完整性對證據評估和臨床決策有至關重要的作用。在研究開始之前進行研究注冊、發表研究方案、使用研究報告標準完整報告研究信息則是提高研究透明度和完整性的重要舉措。提高健康研究的質量和透明度(Enhancing the Quality and Transparency of Health Research,EQUATOR)協作網目前收錄了不同研究類型的576個報告指南[1]。然而,在醫學領域,國內外的研究均顯示,隨機對照試驗的報告質量仍有很大提升空間[2-4]。
近些年,臨床研究報告指南不斷完善,以臨床試驗報告的統一標準(consolidated standards of reporting trials,CONSORT)聲明為例,目前已有35個擴展版本,涉及不同干預措施、不同研究類型、不同研究目的、不同結局指標的報告[1]。在CONSORT聲明中指出需要完整而確切地說明預先設定的主要和次要結局指標,包括它們是在何時以及如何測評的[5]。然而,臨床研究中結局指標報告的質量參差不齊,沒有報告或沒有完整報告主要結局指標的情況非常普遍[6]。
學術期刊、監管機構和其它來源的臨床試驗中結局指標報告的推薦有多達1 758項[7],這些不同的推薦不僅給使用者造成困難,也會影響結果的比較或合并,造成浪費。因此,國際上的方法學專家在臨床試驗方案報告標準(standard protocol items: recommendations for interventional trials,SPIRIT)2013聲明和CONSORT-2010聲明的基礎上,于2022年同步發布了適用于所有人群和研究類型的結局指標報告指南,即SPIRIT-結局指標2022擴展版[8]和CONSORT-結局指標2022擴展版[9]。本文將對這兩個結局指標報告指南進行解讀,并探討其對中醫藥領域研究的意義,以期為相關研究者提供參考。
1 結局指標報告指南解讀
SPIRIT-結局指標2022擴展版和CONSORT-結局指標2022擴展版的研究是同步進行的,其中CONSORT-結局指標2022擴展版中包含了SPIRIT-結局指標2022擴展版的全部內容,涉及結局指標、樣本量、統計分析等主題。其中SPIRIT-結局指標2022擴展版中數據采集方法的條目在CONSORT-結局指標2022擴展版中歸屬于結局指標。CONSORT-結局指標2022擴展版版中在結局指標評估和輔助分析主題下對結局指標報告有了新的規定,主要涉及研究方案中預先規定和沒有規定的結局指標的報告。
在使用這兩個結局指標報告指南時,研究者也推薦了一些關鍵術語的定義供用戶參考,如復合指標(composite outcome)、建構效度(construct validity)、內容效度(content validity)、標準效度(criterion validity)、跨文化效度(cross-cultural validity)、最小臨床意義變化(minimal important change)、最小臨床意義差異(minimal important difference)、結局指標(outcome)、主要結局指標(primary outcome)、可靠性(reliability)、反應性(responsiveness)、次要結局指標(secondary outcomes)、最小價值效應(smallest worthwhile effect)、結構效度(construct validity)、研究工具(study instrument)、目標差異(target difference) 、效度(validity)等。
在結局指標報告指南中,研究者采用了健康測量工具選擇的共識標準(consensus-based standards for the selection of health measurement instruments,COSMIN)工作組給出的結局指標的定義,即結局指標是指正在評估的、以檢查干預措施效果的內容[10]。
此外,研究者也明確指出了結局指標的5個核心要素(域、測量變量或特定測量、特定度量、聚合方法、時間點)及其定義,并通過例子進行說明,以避免研究者在進行結局指標描述或報告時混淆概念。結局指標報告指南中特別解釋了結局指標域(domain)的概念,廣義上講,結局指標域是對一個結局指標進行描述的名字或概念(如疼痛)[11,12],有時候也與“結構”(construct)和“屬性”(attribute)密切相關,甚至也可以等同使用[13]。結局指標的核心要素見表1。

結局指標報告指南的第1條是提供試驗選擇主要結局指標的理由。研究者特意指出,在研究方案和研究報告中需要報告研究所選擇的結局指標是否來自核心指標集,這將有助于提高同類臨床研究中結局指標報告的一致性,使更多研究能納入系統評價;在結局指標工具的報告中,明確指出應有相關工具在與研究樣本相似的人群中的反應能力的證據,這將有助于減少選擇不合適的結局指標測量工具造成對干預措施效應量的錯誤估計和由此產生的倫理問題;在報告結局指標的時間點時,也鼓勵研究者提供選擇結局指標時間的理由(如基于干預后的預期臨床軌跡或實現有臨床意義的治療暴露所需的治療持續時間),這樣有助于幫助其他研究者在應用證據或進行文獻二次分析時判斷研究的價值和意義。結局指標報告指南的具體內容如下。
1.1 SPIRIT結局指標2022擴展版
通過專家咨詢和對結局指標報告指南的范圍綜述,研究者共獲取了108個臨床試驗方案中要解決的結局指標特定報告相關的建議,其中大多數(72%)在SPIRIT 2013聲明沒有提及。經過條目合并、德爾菲調查和共識會議,最終有9個結局指標特定報告條目納入了SPIRIT-結局指標2022擴展版,研究者對這些條目進行了解釋。2022 SPIRIT結局指標擴展版的具體條目見表2。

1.2 CONSORT-結局指標2022擴展版
通過范圍綜述和專家咨詢,研究者共獲得了128個試驗中與結局指標報告相關的條目,其中83%的條目并沒有納入CONSORT 2010聲明。經過條目合并、德爾菲調查和共識會議,最終有17個條目納入了CONSORT-結局指標2022擴展版,研究者并對每個條目進行了解釋。CONSORT-結局指標2022擴展版條目清單見表3。

這兩個結局指標報告指南均有一些局限性:① 納入清單的條目適用于系統收集結局指標,包括大多數潛在的益處和一些危害;但是,其他條目可能適用于報告未經系統評估的危害[14];② 這些條目尚未納入到主要的SPIRIT和CONSORT清單中,這可能會造成用戶的額外負擔,影響其應用;③ 雖然不同國家的專家和研究小組參加了這兩個研究,但德爾菲投票結果可能存在偏倚;④ 由于對共識小組成員進行了目的抽樣,因此共識會議小組成員未充分表達的觀點可能有所不同。
2 結局指標報告指南對中醫藥領域研究的意義和啟示
2.1 結局指標報告指南對中醫臨床研究的意義和啟示
由于國內的許多醫學期刊在發表臨床研究時不要求作者采用相關的研究報告指南進行報告,加上版面限制,有些研究過程中的關鍵信息可能無法體現,極大地影響了研究報告質量,這種情況在中醫臨床研究領域也相當普遍。加上許多研究未進行研究注冊或未發表研究方案,研究的透明度欠缺,進一步可能影響證據使用者對研究的信心。
此外,中醫臨床研究中結局指標的報告存在諸多問題,如同類臨床研究結局指標選擇差異大、缺少終點結局指標、沒有報告或沒有完整報告主要結局指標、不良反應/副作用報告不足、復合結局指標較多、結局指標測量工具/方法選擇多樣化、沒有報告結局指標測量工具/方法等[15]。這些問題不僅降低了研究價值,也會導致許多臨床研究無法進行同類比較或合并,一定程度上降低了臨床研究價值和經費浪費。
因此,使用結局指標報告指南,能幫助研究者在制定研究方案及報告研究結果時,全面考慮結局指標相關的問題,以提高研究設計及報告的質量,如在進行結局指標選擇時,可以檢索是否存在相關的核心指標集,并決定是否使用核心指標集,這將能一定程度上減少同類臨床研究中結局指標報告的異質性,提高研究價值,減少浪費;在選擇結局指標測量工具時,能促使研究者選擇最佳測量性能的工具,以準確地測量干預措施的臨床效應;在進行結局指標測量時間報告時,能慎重考慮選擇測量時間的依據,以及選擇的測量時間能否反映疾病變化,以減少研究周期過短而造成無法觀測到疾病轉歸的情況;在選擇復合結局指標時,應明確復合指標以及其中每部分的定義及標準,則可以幫助系統評價研究者在進行復合結局指標的合并或比較時判斷其異質性。
此外,結局指標報告指南對研究注冊平臺、同行評審專家、期刊編輯、監管機構都有積極的意義。對于研究注冊平臺而言,若能要求研究者在進行研究注冊時提供詳細的結局指標報告相關的信息,則能從源頭把控結局指標報告的完整性及科學性,也有助于在研究結果發布后發現潛在的選擇性報告偏倚;對于同行評審專家和期刊編輯而言則能幫助其判斷結局指標報告的完整性;對于監管機構而言,則可以幫助其通過結局指標報告情況判斷研究所選擇的結局指標、測量工具、測量時間的科學性。
2.2 結局指標報告指南對中醫藥領域核心指標集研究的意義
核心指標集引入中醫藥領域已有10年時間[15]。近些年來,中醫藥領域核心指標集研究的數量越來越多[16],這不僅能幫助中醫藥領域的研究者選擇臨床研究中應該報告的結局指標,也能一定程度上提高研究價值。
然而,核心指標集的使用情況并不樂觀。有研究顯示,國際頂級期刊JAMA、NEJM、The Lancet、BMJ和Ann Intern Med在2019年10月至2020年3月發表的臨床研究中,高達98%的研究沒有使用核心指標集[17]。此外,不同疾病領域的核心指標集的應用情況差異很大,如在隨機對照試驗中,核心指標集的應用從0%(痛風)到82%(類風濕性關節炎)不等[18]。這些情況可能與核心指標集構建中沒有納入所有利益相關者的意見、沒有推薦合適的測量工具[19]、臨床研究者對結局指標的偏好[17]有關,從而阻礙了核心指標集的廣泛應用。
結局指標報告指南中除了要求臨床研究者報告是否使用了相關的核心指標集,也要求臨床研究者報告測量工具及其性能。對于核心指標集研究者而言,在進行結局指標推薦后,也應對相關的指標測量工具的性能及質量評估后,通過共識的方式推薦相關的指標測量工具,這不僅有助于核心指標集的推廣及應用,也能幫助報告相關結局指標的臨床研究者選擇合適的結局指標測量工具,這不僅能極大減輕臨床研究者在進行研究設計時的負擔,也可減少不同研究在進行比較或合并時測量的異質性。
此外,結局指標報告指南中提及的結局指標核心五要素對核心指標集研究的規范化有重要意義。在臨床研究中,研究者在進行結局指標報告時有時并未區分結局指標、測量變量、特定度量及測量時間,以測量工具命名結局指標的情況時有出現,或者結局指標的呈現形式是指標域加測量時間或特定度量的組合。對于核心指標集研究者而言,在從臨床研究提取結局指標時也會出現不區分結局指標的各個要素的問題,因此可能會造成指標的重復或者缺乏邏輯性。有研究者推薦了進行結局指標異質性報告時,提取和分析結局指標的方法,但主要針對以指標域加測量時間命名的結局指標[20],針對結局指標不規范的其它情況并未說明。而結局指標核心五要素的提出為核心指標集研究者提供了結局指標提取和分析的思路,即結局指標提取時應重點關注指標域,對于以測量變量命名的結局指標,應根據測量變量的目的將其轉化為指標域;對于以特定度量命名(特別是“到發生終點事件的時間”)的結局指標,應僅保留終點事件,若該事件最終納入核心指標集,在進一步明確測量工具時,可將“到發生終點事件的時間”納入原始清單。
2.3 結局指標報告指南對中醫藥領域方法學研究的意義和啟示
結局指標報告指南中對相關醫學術語的解釋則一定程度上有助于中醫藥領域方法學的完善。特別是其提到的指標域的概念,即指標域是描述≥1個結局指標的名稱或概念。然而,由于結局指標的分類和術語并未達成共識,指標域的范圍應該有多大目前并無定論[21]。不同結局指標分類框架中涉及的指標域的數量不等[21],對于結構層級比較清晰的Williamson/Clarke框架而言,包含了5個核心域的38個指標域[22]。在臨床研究或者結局指標研究中,這些指標域是否需要進一步細化為更加實用的子指標域目前尚無定論。
此外,雖然結局指標報告指南適用于任何結局指標類型、人群和研究類型,但對于中醫特色指標(如證候),需要有更多研究進行證候名稱的規范以及每種證候應報告的核心要素的組成,以幫助研究者完整報告中醫證候相關的信息。前期已有研究者提出了中醫證候名稱規范化的研究方法以及中醫核心證候指標集的概念及研究方法[23-25],但是仍需要進一步推廣,使更多研究者針對這一領域的需求開展研究。
3 總結
結局指標報告指南的制定將幫助臨床研究者進行研究方案制定及研究結果報告時完整報告結局指標相關的條目,提高臨床研究的透明度和可重復性。結局指標報告指南對于中醫藥領域而言也具有積極的意義,不僅有助于提高中醫臨床研究結局指標報告的質量,對中醫臨床研究方法學及核心指標集的研究都有一定的意義和啟發。
致謝 感謝國家留學基金委對本研究的支持。
臨床研究的透明度和研究報告的完整性對證據評估和臨床決策有至關重要的作用。在研究開始之前進行研究注冊、發表研究方案、使用研究報告標準完整報告研究信息則是提高研究透明度和完整性的重要舉措。提高健康研究的質量和透明度(Enhancing the Quality and Transparency of Health Research,EQUATOR)協作網目前收錄了不同研究類型的576個報告指南[1]。然而,在醫學領域,國內外的研究均顯示,隨機對照試驗的報告質量仍有很大提升空間[2-4]。
近些年,臨床研究報告指南不斷完善,以臨床試驗報告的統一標準(consolidated standards of reporting trials,CONSORT)聲明為例,目前已有35個擴展版本,涉及不同干預措施、不同研究類型、不同研究目的、不同結局指標的報告[1]。在CONSORT聲明中指出需要完整而確切地說明預先設定的主要和次要結局指標,包括它們是在何時以及如何測評的[5]。然而,臨床研究中結局指標報告的質量參差不齊,沒有報告或沒有完整報告主要結局指標的情況非常普遍[6]。
學術期刊、監管機構和其它來源的臨床試驗中結局指標報告的推薦有多達1 758項[7],這些不同的推薦不僅給使用者造成困難,也會影響結果的比較或合并,造成浪費。因此,國際上的方法學專家在臨床試驗方案報告標準(standard protocol items: recommendations for interventional trials,SPIRIT)2013聲明和CONSORT-2010聲明的基礎上,于2022年同步發布了適用于所有人群和研究類型的結局指標報告指南,即SPIRIT-結局指標2022擴展版[8]和CONSORT-結局指標2022擴展版[9]。本文將對這兩個結局指標報告指南進行解讀,并探討其對中醫藥領域研究的意義,以期為相關研究者提供參考。
1 結局指標報告指南解讀
SPIRIT-結局指標2022擴展版和CONSORT-結局指標2022擴展版的研究是同步進行的,其中CONSORT-結局指標2022擴展版中包含了SPIRIT-結局指標2022擴展版的全部內容,涉及結局指標、樣本量、統計分析等主題。其中SPIRIT-結局指標2022擴展版中數據采集方法的條目在CONSORT-結局指標2022擴展版中歸屬于結局指標。CONSORT-結局指標2022擴展版版中在結局指標評估和輔助分析主題下對結局指標報告有了新的規定,主要涉及研究方案中預先規定和沒有規定的結局指標的報告。
在使用這兩個結局指標報告指南時,研究者也推薦了一些關鍵術語的定義供用戶參考,如復合指標(composite outcome)、建構效度(construct validity)、內容效度(content validity)、標準效度(criterion validity)、跨文化效度(cross-cultural validity)、最小臨床意義變化(minimal important change)、最小臨床意義差異(minimal important difference)、結局指標(outcome)、主要結局指標(primary outcome)、可靠性(reliability)、反應性(responsiveness)、次要結局指標(secondary outcomes)、最小價值效應(smallest worthwhile effect)、結構效度(construct validity)、研究工具(study instrument)、目標差異(target difference) 、效度(validity)等。
在結局指標報告指南中,研究者采用了健康測量工具選擇的共識標準(consensus-based standards for the selection of health measurement instruments,COSMIN)工作組給出的結局指標的定義,即結局指標是指正在評估的、以檢查干預措施效果的內容[10]。
此外,研究者也明確指出了結局指標的5個核心要素(域、測量變量或特定測量、特定度量、聚合方法、時間點)及其定義,并通過例子進行說明,以避免研究者在進行結局指標描述或報告時混淆概念。結局指標報告指南中特別解釋了結局指標域(domain)的概念,廣義上講,結局指標域是對一個結局指標進行描述的名字或概念(如疼痛)[11,12],有時候也與“結構”(construct)和“屬性”(attribute)密切相關,甚至也可以等同使用[13]。結局指標的核心要素見表1。

結局指標報告指南的第1條是提供試驗選擇主要結局指標的理由。研究者特意指出,在研究方案和研究報告中需要報告研究所選擇的結局指標是否來自核心指標集,這將有助于提高同類臨床研究中結局指標報告的一致性,使更多研究能納入系統評價;在結局指標工具的報告中,明確指出應有相關工具在與研究樣本相似的人群中的反應能力的證據,這將有助于減少選擇不合適的結局指標測量工具造成對干預措施效應量的錯誤估計和由此產生的倫理問題;在報告結局指標的時間點時,也鼓勵研究者提供選擇結局指標時間的理由(如基于干預后的預期臨床軌跡或實現有臨床意義的治療暴露所需的治療持續時間),這樣有助于幫助其他研究者在應用證據或進行文獻二次分析時判斷研究的價值和意義。結局指標報告指南的具體內容如下。
1.1 SPIRIT結局指標2022擴展版
通過專家咨詢和對結局指標報告指南的范圍綜述,研究者共獲取了108個臨床試驗方案中要解決的結局指標特定報告相關的建議,其中大多數(72%)在SPIRIT 2013聲明沒有提及。經過條目合并、德爾菲調查和共識會議,最終有9個結局指標特定報告條目納入了SPIRIT-結局指標2022擴展版,研究者對這些條目進行了解釋。2022 SPIRIT結局指標擴展版的具體條目見表2。

1.2 CONSORT-結局指標2022擴展版
通過范圍綜述和專家咨詢,研究者共獲得了128個試驗中與結局指標報告相關的條目,其中83%的條目并沒有納入CONSORT 2010聲明。經過條目合并、德爾菲調查和共識會議,最終有17個條目納入了CONSORT-結局指標2022擴展版,研究者并對每個條目進行了解釋。CONSORT-結局指標2022擴展版條目清單見表3。

這兩個結局指標報告指南均有一些局限性:① 納入清單的條目適用于系統收集結局指標,包括大多數潛在的益處和一些危害;但是,其他條目可能適用于報告未經系統評估的危害[14];② 這些條目尚未納入到主要的SPIRIT和CONSORT清單中,這可能會造成用戶的額外負擔,影響其應用;③ 雖然不同國家的專家和研究小組參加了這兩個研究,但德爾菲投票結果可能存在偏倚;④ 由于對共識小組成員進行了目的抽樣,因此共識會議小組成員未充分表達的觀點可能有所不同。
2 結局指標報告指南對中醫藥領域研究的意義和啟示
2.1 結局指標報告指南對中醫臨床研究的意義和啟示
由于國內的許多醫學期刊在發表臨床研究時不要求作者采用相關的研究報告指南進行報告,加上版面限制,有些研究過程中的關鍵信息可能無法體現,極大地影響了研究報告質量,這種情況在中醫臨床研究領域也相當普遍。加上許多研究未進行研究注冊或未發表研究方案,研究的透明度欠缺,進一步可能影響證據使用者對研究的信心。
此外,中醫臨床研究中結局指標的報告存在諸多問題,如同類臨床研究結局指標選擇差異大、缺少終點結局指標、沒有報告或沒有完整報告主要結局指標、不良反應/副作用報告不足、復合結局指標較多、結局指標測量工具/方法選擇多樣化、沒有報告結局指標測量工具/方法等[15]。這些問題不僅降低了研究價值,也會導致許多臨床研究無法進行同類比較或合并,一定程度上降低了臨床研究價值和經費浪費。
因此,使用結局指標報告指南,能幫助研究者在制定研究方案及報告研究結果時,全面考慮結局指標相關的問題,以提高研究設計及報告的質量,如在進行結局指標選擇時,可以檢索是否存在相關的核心指標集,并決定是否使用核心指標集,這將能一定程度上減少同類臨床研究中結局指標報告的異質性,提高研究價值,減少浪費;在選擇結局指標測量工具時,能促使研究者選擇最佳測量性能的工具,以準確地測量干預措施的臨床效應;在進行結局指標測量時間報告時,能慎重考慮選擇測量時間的依據,以及選擇的測量時間能否反映疾病變化,以減少研究周期過短而造成無法觀測到疾病轉歸的情況;在選擇復合結局指標時,應明確復合指標以及其中每部分的定義及標準,則可以幫助系統評價研究者在進行復合結局指標的合并或比較時判斷其異質性。
此外,結局指標報告指南對研究注冊平臺、同行評審專家、期刊編輯、監管機構都有積極的意義。對于研究注冊平臺而言,若能要求研究者在進行研究注冊時提供詳細的結局指標報告相關的信息,則能從源頭把控結局指標報告的完整性及科學性,也有助于在研究結果發布后發現潛在的選擇性報告偏倚;對于同行評審專家和期刊編輯而言則能幫助其判斷結局指標報告的完整性;對于監管機構而言,則可以幫助其通過結局指標報告情況判斷研究所選擇的結局指標、測量工具、測量時間的科學性。
2.2 結局指標報告指南對中醫藥領域核心指標集研究的意義
核心指標集引入中醫藥領域已有10年時間[15]。近些年來,中醫藥領域核心指標集研究的數量越來越多[16],這不僅能幫助中醫藥領域的研究者選擇臨床研究中應該報告的結局指標,也能一定程度上提高研究價值。
然而,核心指標集的使用情況并不樂觀。有研究顯示,國際頂級期刊JAMA、NEJM、The Lancet、BMJ和Ann Intern Med在2019年10月至2020年3月發表的臨床研究中,高達98%的研究沒有使用核心指標集[17]。此外,不同疾病領域的核心指標集的應用情況差異很大,如在隨機對照試驗中,核心指標集的應用從0%(痛風)到82%(類風濕性關節炎)不等[18]。這些情況可能與核心指標集構建中沒有納入所有利益相關者的意見、沒有推薦合適的測量工具[19]、臨床研究者對結局指標的偏好[17]有關,從而阻礙了核心指標集的廣泛應用。
結局指標報告指南中除了要求臨床研究者報告是否使用了相關的核心指標集,也要求臨床研究者報告測量工具及其性能。對于核心指標集研究者而言,在進行結局指標推薦后,也應對相關的指標測量工具的性能及質量評估后,通過共識的方式推薦相關的指標測量工具,這不僅有助于核心指標集的推廣及應用,也能幫助報告相關結局指標的臨床研究者選擇合適的結局指標測量工具,這不僅能極大減輕臨床研究者在進行研究設計時的負擔,也可減少不同研究在進行比較或合并時測量的異質性。
此外,結局指標報告指南中提及的結局指標核心五要素對核心指標集研究的規范化有重要意義。在臨床研究中,研究者在進行結局指標報告時有時并未區分結局指標、測量變量、特定度量及測量時間,以測量工具命名結局指標的情況時有出現,或者結局指標的呈現形式是指標域加測量時間或特定度量的組合。對于核心指標集研究者而言,在從臨床研究提取結局指標時也會出現不區分結局指標的各個要素的問題,因此可能會造成指標的重復或者缺乏邏輯性。有研究者推薦了進行結局指標異質性報告時,提取和分析結局指標的方法,但主要針對以指標域加測量時間命名的結局指標[20],針對結局指標不規范的其它情況并未說明。而結局指標核心五要素的提出為核心指標集研究者提供了結局指標提取和分析的思路,即結局指標提取時應重點關注指標域,對于以測量變量命名的結局指標,應根據測量變量的目的將其轉化為指標域;對于以特定度量命名(特別是“到發生終點事件的時間”)的結局指標,應僅保留終點事件,若該事件最終納入核心指標集,在進一步明確測量工具時,可將“到發生終點事件的時間”納入原始清單。
2.3 結局指標報告指南對中醫藥領域方法學研究的意義和啟示
結局指標報告指南中對相關醫學術語的解釋則一定程度上有助于中醫藥領域方法學的完善。特別是其提到的指標域的概念,即指標域是描述≥1個結局指標的名稱或概念。然而,由于結局指標的分類和術語并未達成共識,指標域的范圍應該有多大目前并無定論[21]。不同結局指標分類框架中涉及的指標域的數量不等[21],對于結構層級比較清晰的Williamson/Clarke框架而言,包含了5個核心域的38個指標域[22]。在臨床研究或者結局指標研究中,這些指標域是否需要進一步細化為更加實用的子指標域目前尚無定論。
此外,雖然結局指標報告指南適用于任何結局指標類型、人群和研究類型,但對于中醫特色指標(如證候),需要有更多研究進行證候名稱的規范以及每種證候應報告的核心要素的組成,以幫助研究者完整報告中醫證候相關的信息。前期已有研究者提出了中醫證候名稱規范化的研究方法以及中醫核心證候指標集的概念及研究方法[23-25],但是仍需要進一步推廣,使更多研究者針對這一領域的需求開展研究。
3 總結
結局指標報告指南的制定將幫助臨床研究者進行研究方案制定及研究結果報告時完整報告結局指標相關的條目,提高臨床研究的透明度和可重復性。結局指標報告指南對于中醫藥領域而言也具有積極的意義,不僅有助于提高中醫臨床研究結局指標報告的質量,對中醫臨床研究方法學及核心指標集的研究都有一定的意義和啟發。
致謝 感謝國家留學基金委對本研究的支持。