引用本文: 邱幸瑩, 唐淇, 曹文聰, 劉冰清, 溫澤淮, 李庚. 中醫藥相關核心結局指標集研究的文獻質量評價. 中國循證醫學雜志, 2024, 24(2): 192-201. doi: 10.7507/1672-2531.202306158 復制
版權信息: ?四川大學華西醫院華西期刊社《中國循證醫學雜志》版權所有,未經授權不得轉載、改編
核心結局指標集(core outcome set,COS)是指特定疾病或健康領域的臨床研究必須測量和報告的、統一的、標準化的最小結局指標集合,其構建可通過提高同類臨床研究的可比性、減少選擇性報告偏倚、優化結局指標的選擇,為臨床實踐提供高級別證據及減少研究資源的浪費[1]。建立中醫藥相關COS有助于解決中醫臨床研究中結局指標異質性等問題,有助于改進中醫臨床研究的設計和實施,提高研究結果的可信度[2]。一個質量良好的COS在實施后可以引導改善患者的結局[3]。同時,透明、準確、完整的高質量報告能提高研究的可靠性,更有效地促進研究成果為臨床研究和實踐提供信息[4]。
為了提高COS研究報告的透明性和完整性,COMET(core outcome measures in effectiveness trials)工作組于2016年發布了《核心結局指標集報告規范》(COS-STAR)[5]。隨后,《核心結局指標集研制規范》(COS-STAD)[3]于2017年發布,它為COS研制者提供了COS研究設計參考以改善COS研制質量,也可幫助COS使用者判斷某個COS的方法學質量。2019年,《核心結局指標集研究方案報告規范》(COS-STAP)[6]發布,其目的是提升COS研究方案的完整性與規范性,從源頭上保障COS研究的完整性和透明度。在中醫藥相關核心結局指標集(core outcome set on traditional Chinese medicine,COS-TCM)研究的初期,引入COS-STAP、COS-STAR、COS-STAD等規范,有助于相關研究者在研究初期制定完善的研究方案,有利于提高研究的完整性、透明度和研究質量,減少研究資源的浪費[7]。
隨著COS在中醫領域的廣泛應用,COS-TCM相關文章發表數量總體呈逐年增長趨勢[8-10],但COS-TCM研究方法學質量和報告水平參差不齊。目前尚無系統地評價COS-TCM研究質量的報告。本研究系統檢索已發表的COS-TCM研究方案與結果的公開發表文獻,并利用上述標準和報告規范進行綜合評價,以期為研究者提供一定的參考,以利于提高COS-TCM相關研究報告水平和方法學質量。
1 資料與方法
1.1 納入與排除標準
1.1.1 納入標準
COS-TCM研究方案與COS-TCM研究結果報告。
1.1.2 排除標準
① 重復發表的文章(如期刊論文與學位論文有重復,優先納入期刊文章);② COS-TCM研制中間環節成果類文獻(比如系統評價、定性研究);③ COS-TCM研究方法學類文獻。
1.2 文獻檢索策略
計算機檢索CNKI、VIP、WanFang Data、PubMed、Web of Science、Embase和Cochrane Library數據庫,搜集有關COS-TCM研究方案與結果,檢索時限均為建庫至2023年4月18日。檢索采用主題詞和自由詞相結合的方式進行,并根據各數據庫特點進行調整。同時追溯納入研究的參考文獻,以補充獲取相關資料。中文檢索詞包括:核心指標集、核心指標、結局指標、中醫、中藥、針灸、推拿、導引、針刺、艾灸等。英文檢索詞包括:core outcome set、core outcome sets、CoS、Chinese medicine、TCM、acupuncture moxibustion、massage等。
1.3 文獻篩選與資料提取
由2名研究者獨立篩選文獻、提取資料并交叉核對。1位研究者通過閱讀文獻題目和摘要進行初步篩選排除不相關文獻。然后閱讀文獻全文,確定符合標準的文獻。另1名研究者進行抽樣核對,如出現分歧,則通過討論或咨詢第三名研究者解決。
1.4 COS研究及報告質量規范
本文采用COMET工作組制定的COS研究報告或研制規范(COS-STAP、COS-STAR和COS-STAD)對納入文獻進行評價。COS-STAP包含6個主題13個條目,主題分別是題目/摘要、引言、方法、分析、倫理與傳播、管理信息(具體條目可參見表2),其應用有助于高質量COS研究方案的起草和發布,并可明確COS研究過程、減少實施環節的偏倚,從而促進研究最終COS的完整性和透明度[6];COS-STAR由18個條目組成,規范了COS研究報告需涉及的內容(具體條目可參見表4),以確保COS研究報告透明度和清晰度[5];COS-STAD包含COS研制過程需滿足的11條最低標準,涉及應用范圍、利益相關者及共識過程三個重要共性環節(具體條目可參見表3),可幫助COS開發人員改進研究方法,也有助于COS使用者評價其質量[3]。
COS-STAP、COS-STAR、COS-STAD有相互重疊的部分,但有其不同的側重點。COS-STAP是針對COS研究方案的報告,COS-STAR則是針對COS研究結果的報告。但COS-STAP和COS-STAR僅保證了COS的報告質量,而不能保證其方法學質量。因此,還需采用COS-STAD以補充報告規范中與研究方法相關條目的不足。三者相輔相成,能幫助使用者更容易判斷COS的價值及適用性[7]。
1.5 質量評價
由于COS-STAP、COS-STAD和COS-STAR均未規定評分標準,為便于較直觀地觀察到研究和報告質量,本文參照其條目自擬了如下的評分標準:對照各規范的條目清單,如明確報告某條目則得1分,若報告不完全、或未報告或“不清楚”則得0分。研究者使用COS-STAP評價COS-TCM方案報告質量,依據COS-STAD和COS-STAR評價COS-TCM研究結果的報告質量。評價過程由1位研究者獨立完成,另1名研究者進行抽樣核對。結果交叉校對,不一致時咨詢第三位研究者決定。
1.6 統計分析
采用Microsoft Office Excel 2021記錄評分結果,以描述性統計方法計算每篇文獻最終得分及其條目報告率和各條目報告篇數占總篇數的百分比。
2 結果
2.1 文獻篩選流程及結果
按照預先制定的檢索式,經查重和篩選后,最終納入文獻27篇[11-37](涉及23項COS-TCM研究),其中13篇為研究方案、14篇為COS-TCM研制結果報告。文獻篩選流程及結果見附件圖1。
23項研究中,既發表了研究方案又發表了研究結果的有4項,研究方案和最終結果報告發表的時間間隔為1~3年。除1項研究[11]未注冊外,其他研究均已在COMET網站注冊。臨床醫生、方法學專家和患者是納入最多的利益相關者。研究方法方面,多數研究采用了多種研究方法,其中系統評價、共識會議和Delphi調查使用率較高。納入研究的主要特征見表1。

2.2 質量評價結果
2.2.1 COS-STAP評價結果
我們使用COS-STAP對納入的14篇COS-TCM研究方案進行了評價。COS-STAP共包含13個條目,滿分19分。表2結果顯示,所有研究方案均報告了題目、摘要、背景、目的和具體范圍中的健康問題、干預措施和應用場景,但3篇[12-14]未報告目標人群。4篇方案[15-18]遵循了COS-STAP全部報告條目。報告率相對較低的條目為方法領域中的條目4(利益相關者)和分析領域中的條目9(缺失數據),報告率分別為71.4%和42.9%。條目5b(描述剔除/合并結局指標的過程)和條目11(COS研制完成后的傳播計劃)均有2篇方案[14,19,20]未報告。此外,因1篇[14]研究方案為會議論文,信息報告不全,可能會影響COS-STAP的實際報告率。

2.2.2 COS-STAD評價結果
納入研究中共有14項發布了研究結果,分別采用COS-STAD和COS-STAR對這些研究及其報告質量進行評價。COS-STAD包括3個領域11個條目,滿分為11分。結果發現,14項研究的得分范圍為3~11分,其中1項研究[32]滿足COS-STAD的所有條目,另1項研究[11]只有3個條目符合COS-STAD要求(表3)。具體范圍領域中,只有5項研究(35.7%)[21,23,27,32,33]明確報告了COS涵蓋的人群(條目3)。在利益相關者領域,13項研究(92.9%)報告了COS使用者和醫療衛生專家(條目5和條目6),11項研究(78.6%)納入了患者或其代表(條目7)。在共識過程領域,僅有4項研究(28.6%)[12,26,30,32]關注了結局指標清單的語言描述。

2.2.3 COS-STAR評價結果
COS-STAR包括6個領域,共18個條目,滿分25分。我們基于COS-STAR,對納入的14篇COS-TCM研究報告進行評價。分析發現,報告率最低的是條目11(方案偏離)僅有7.1%。除因未明確報告COS涵蓋人群導致條目3a報告率(35.7%)較低外,所有文獻在題目/摘要和引言領域均符合報告規范的要求(表4);在方案領域,平均報告率為74.6%,報告率較低的有條目5(參與者)和條目10(關于研究倫理和知情同意問題的說明);結果領域中報告率最低的是方案偏離(條目11),其次是提供COS制定所有階段涉及人員的數量和相關特點等數據(條目12);在討論領域,14篇文獻均說明了COS形成過程中的不足,11篇文獻(78.6%)在結論部分結合其他證據,提供對最終COS的解釋以及對今后研究的影響;其他信息領域,13篇(92.9%)報告了資助情況,只有28.6%(4/14)的文獻[12,21,32,33]描述了利益沖突。

2.3 COS-TCM研究方案與報告結果的一致性
COS-STAP中有17項內容(條目)與COS-STAR重疊。研究表明[7]條目的一致性有利于研究從方案平穩過渡到結果,并有助于判斷研究過程中是否存在偏倚,故我們基于COS-STAP和COS-STAR共有條目,對納入的既發表了研究方案又發表了研究結果的4項COS-TCM研究進行一致性評價。一致性評價標準擬為5級,其定義如下:A,方案和研究結果均報告且一致;B,方案和研究結果均報告但不一致;C,方案報告了而研究結果未報告;D,方案未報告但研究結果進行了報告;E,方案和研究結果均未報告。具體評價結果見表5。我們發現,除1項研究因方案為會議論文[14](獲得信息有限),無法比較是否產生了方案偏離外,剩余3項均有研究結果與方案不符的內容:1項研究[26]改變了方案[25]中系統評價納入的研究類型、定性研究方法及共識會議的舉辦方式,但未在結果文獻中報告改變及修改方案的理由;1項研究[23]報告了共識會議形成COS的方法從評分改為專家討論,但未描述原因;只有1項研究[12]在結果中報告了系統評價增加臨床試驗注冊平臺的檢索和Delphi第3輪結局指標保留標準的改變,并描述了修改方案的原因。

3 討論
近年來,COS-TCM研究受到中醫藥領域學者的重視,其數量呈現逐年遞增趨勢,其研究方法和報告質量也倍受關注。COS-STAD、COS-STAR、COS-STAP發布后,COS-TCM研究者將其引入國內并進行了本土化的探索[7,38-40],同時也就COS-TCM研制方法展開了探索[41-45]并發布了技術規范[46]。國際通用指南的發布與國內COS-TCM方法的探索使得大部分COS-TCM研究質量得到了一定保證,但可能存在以下問題和值得改進之處。
首先,較少研究關注結局指標清單的語言描述。我們發現,發布結果的COS-TCM研究中只有4項關注了結局指標清單的語言描述。為確保不同專業和不同文化程度的利益相關者能正確地理解COS,今后的COS-TCM研究需改進結局指標的描述語言,力求通俗易懂,避免使用大量難以理解地醫學術語[47]。其次,許多研究未明確目標人群的細節。未描述適用目標人群的9項研究中,有4項研究對其系統評價納入疾病人群特征進行了規定。該條目的漏報,可能是因為將系統評價過程研究設計要素(PICO)的納排標準與COS的適用范圍混淆,或是因為在研究設計時,未考慮同一疾病不同分型/分期等的結局指標存在差異。COS可從疾病、年齡、性別等人群差異描述該COS適用于特定疾病的全部人群或部分人群。第三,缺失數據處理沒有得到重視。COS研制者應設定處理方法和相關標準(如首輪調查的部分應答者是否參加下一輪調查/完成最少比例的調查將被邀請繼續參加下一輪調查)[47]。COS方案的共識過程需提出如何處理此類缺失數據以避免偏倚,也可借助調查軟件“完成所有問題方可提交”的設置,盡量使數據缺失最小化。第四,未充分報告或漏報參與者情況、方案修改、利益沖突等細節。各利益相關群體代表的人數、專業構成、資歷要求、選擇方式等參與者信息影響著最終COS的科學性和實用性,故需要詳細報告,而報告COS制定所有階段涉及人員的數量、學歷、地域分布、專業背景等相關特征有助于判斷評分過程的可靠性。納入分析的文獻中,所有學位論文和中文文章均未描述利益沖突,可能是學位論文和大部分中文期刊未規定報告利益沖突,或者研究確實存在漏報的情況。最后,發表了結果的14項研究中,僅有4項發表了方案,從表5的一致性評價可發現,實際研究過程及結果報告與事先制定的方案存在不一致,但同時描述了變更的內容與原因的研究只有1項[12]。在研究實施過程中對方案進行修訂是常見的,根據實際情況適當的修改方案也有助于研究更好實施并產生更合理結果,但需要在研究發表時說明變更原因和影響。預先制訂和發布方案,有利于增加COS研制過程的透明度,而對研制過程中方案的修改做出解釋更增強了此作用[48]。因此,預先發表COS-TCM方案是必要的,方案的修訂也應是透明的。
我們發現,COS-TCM方案報告質量優于結果報告質量。這可能涉及如下原因:① 中、英文發表要求不同:除1篇會議論文外,COS-TCM研究方案均發表于英文SCI期刊,對格式要求較明確,文章質量相對較高;COS-TCM結果大部分發表于中文期刊或以學位論文形式呈現,中文期刊發表時因篇幅限制,且較少使用附錄補充信息,容易導致報告內容的遺缺。② 研究實際實施過程存在困難:COS-STAR與COS-STAP條目有相互重疊的部分,COS-STAR增加了研制結果應報告的細節(條目4、11~16)。在制定方案時,更容易做到描述上的盡善盡美,但在研究實施過程中因時間、經費、人力等因素導致方案偏離或研制過程未涉及應報告的條目等情況可能會導致研究者選擇性報告。
COS-STAP、COS-STAR、COS-STAD的發表推進了COS研制方法的標準化、透明化和研究質量的提升。然而,這三項國際規范的制定主要基于現代醫學的醫療實踐情況,共識過程未考慮中醫特點;且三項規范均為最低標準,如報告規范給出了每條目需報告的內容,但具體報告形式未給出建議。COS-TCM研究在遵循國際規范的基礎上,需與中醫特色相結合,結局指標要與中醫藥臨床價值和優勢相關[9],關注并描述與西醫COS的差異和中醫藥特殊要點[46]。
本研究也存在一定的局限性。首先,盡管在檢索數據庫文獻后也進行了COMET網站和文獻引文的手工檢索,但仍不排除一些COS-TCM相關研究的遺漏。其次,在進行質量評價評分時,簡單地采用1分(明確報告)、0分(報告不完全、未報告或不清楚)二分法,不排除有研究在研制COS-TCM時考慮了相關條目但未報告的情況。此外,本研究評價的質量主要以報告質量來估計,可能與實施時的方法學質量有差異。在使用COS規范評價COS-TCM研究方案與結果報告時缺少與中醫藥內容相關條目,也可能無法體現COS-TCM研究的中醫藥特色。
總之,目前COS-TCM研究多數是符合COS研制和報告國際報告規范的,但仍存在部分內容報告不全、未描述方案與實際結果不一致等情況。因此,COS-TCM研究仍需提高其方法學質量和研究報告透明度,重視方案的發表與修訂。我們建議,今后的COS-TCM在研制和發表時應核對相關報告規范并附上檢查清單;適當以附錄形式補充正文因篇幅而未提及的內容,確保未遺漏應報告的條目;如實報告研制過程的變化和方案偏離的情況。未來有必要結合中醫藥特點,研發COS-TCM研究的質量評價工具和報告規范。
核心結局指標集(core outcome set,COS)是指特定疾病或健康領域的臨床研究必須測量和報告的、統一的、標準化的最小結局指標集合,其構建可通過提高同類臨床研究的可比性、減少選擇性報告偏倚、優化結局指標的選擇,為臨床實踐提供高級別證據及減少研究資源的浪費[1]。建立中醫藥相關COS有助于解決中醫臨床研究中結局指標異質性等問題,有助于改進中醫臨床研究的設計和實施,提高研究結果的可信度[2]。一個質量良好的COS在實施后可以引導改善患者的結局[3]。同時,透明、準確、完整的高質量報告能提高研究的可靠性,更有效地促進研究成果為臨床研究和實踐提供信息[4]。
為了提高COS研究報告的透明性和完整性,COMET(core outcome measures in effectiveness trials)工作組于2016年發布了《核心結局指標集報告規范》(COS-STAR)[5]。隨后,《核心結局指標集研制規范》(COS-STAD)[3]于2017年發布,它為COS研制者提供了COS研究設計參考以改善COS研制質量,也可幫助COS使用者判斷某個COS的方法學質量。2019年,《核心結局指標集研究方案報告規范》(COS-STAP)[6]發布,其目的是提升COS研究方案的完整性與規范性,從源頭上保障COS研究的完整性和透明度。在中醫藥相關核心結局指標集(core outcome set on traditional Chinese medicine,COS-TCM)研究的初期,引入COS-STAP、COS-STAR、COS-STAD等規范,有助于相關研究者在研究初期制定完善的研究方案,有利于提高研究的完整性、透明度和研究質量,減少研究資源的浪費[7]。
隨著COS在中醫領域的廣泛應用,COS-TCM相關文章發表數量總體呈逐年增長趨勢[8-10],但COS-TCM研究方法學質量和報告水平參差不齊。目前尚無系統地評價COS-TCM研究質量的報告。本研究系統檢索已發表的COS-TCM研究方案與結果的公開發表文獻,并利用上述標準和報告規范進行綜合評價,以期為研究者提供一定的參考,以利于提高COS-TCM相關研究報告水平和方法學質量。
1 資料與方法
1.1 納入與排除標準
1.1.1 納入標準
COS-TCM研究方案與COS-TCM研究結果報告。
1.1.2 排除標準
① 重復發表的文章(如期刊論文與學位論文有重復,優先納入期刊文章);② COS-TCM研制中間環節成果類文獻(比如系統評價、定性研究);③ COS-TCM研究方法學類文獻。
1.2 文獻檢索策略
計算機檢索CNKI、VIP、WanFang Data、PubMed、Web of Science、Embase和Cochrane Library數據庫,搜集有關COS-TCM研究方案與結果,檢索時限均為建庫至2023年4月18日。檢索采用主題詞和自由詞相結合的方式進行,并根據各數據庫特點進行調整。同時追溯納入研究的參考文獻,以補充獲取相關資料。中文檢索詞包括:核心指標集、核心指標、結局指標、中醫、中藥、針灸、推拿、導引、針刺、艾灸等。英文檢索詞包括:core outcome set、core outcome sets、CoS、Chinese medicine、TCM、acupuncture moxibustion、massage等。
1.3 文獻篩選與資料提取
由2名研究者獨立篩選文獻、提取資料并交叉核對。1位研究者通過閱讀文獻題目和摘要進行初步篩選排除不相關文獻。然后閱讀文獻全文,確定符合標準的文獻。另1名研究者進行抽樣核對,如出現分歧,則通過討論或咨詢第三名研究者解決。
1.4 COS研究及報告質量規范
本文采用COMET工作組制定的COS研究報告或研制規范(COS-STAP、COS-STAR和COS-STAD)對納入文獻進行評價。COS-STAP包含6個主題13個條目,主題分別是題目/摘要、引言、方法、分析、倫理與傳播、管理信息(具體條目可參見表2),其應用有助于高質量COS研究方案的起草和發布,并可明確COS研究過程、減少實施環節的偏倚,從而促進研究最終COS的完整性和透明度[6];COS-STAR由18個條目組成,規范了COS研究報告需涉及的內容(具體條目可參見表4),以確保COS研究報告透明度和清晰度[5];COS-STAD包含COS研制過程需滿足的11條最低標準,涉及應用范圍、利益相關者及共識過程三個重要共性環節(具體條目可參見表3),可幫助COS開發人員改進研究方法,也有助于COS使用者評價其質量[3]。
COS-STAP、COS-STAR、COS-STAD有相互重疊的部分,但有其不同的側重點。COS-STAP是針對COS研究方案的報告,COS-STAR則是針對COS研究結果的報告。但COS-STAP和COS-STAR僅保證了COS的報告質量,而不能保證其方法學質量。因此,還需采用COS-STAD以補充報告規范中與研究方法相關條目的不足。三者相輔相成,能幫助使用者更容易判斷COS的價值及適用性[7]。
1.5 質量評價
由于COS-STAP、COS-STAD和COS-STAR均未規定評分標準,為便于較直觀地觀察到研究和報告質量,本文參照其條目自擬了如下的評分標準:對照各規范的條目清單,如明確報告某條目則得1分,若報告不完全、或未報告或“不清楚”則得0分。研究者使用COS-STAP評價COS-TCM方案報告質量,依據COS-STAD和COS-STAR評價COS-TCM研究結果的報告質量。評價過程由1位研究者獨立完成,另1名研究者進行抽樣核對。結果交叉校對,不一致時咨詢第三位研究者決定。
1.6 統計分析
采用Microsoft Office Excel 2021記錄評分結果,以描述性統計方法計算每篇文獻最終得分及其條目報告率和各條目報告篇數占總篇數的百分比。
2 結果
2.1 文獻篩選流程及結果
按照預先制定的檢索式,經查重和篩選后,最終納入文獻27篇[11-37](涉及23項COS-TCM研究),其中13篇為研究方案、14篇為COS-TCM研制結果報告。文獻篩選流程及結果見附件圖1。
23項研究中,既發表了研究方案又發表了研究結果的有4項,研究方案和最終結果報告發表的時間間隔為1~3年。除1項研究[11]未注冊外,其他研究均已在COMET網站注冊。臨床醫生、方法學專家和患者是納入最多的利益相關者。研究方法方面,多數研究采用了多種研究方法,其中系統評價、共識會議和Delphi調查使用率較高。納入研究的主要特征見表1。

2.2 質量評價結果
2.2.1 COS-STAP評價結果
我們使用COS-STAP對納入的14篇COS-TCM研究方案進行了評價。COS-STAP共包含13個條目,滿分19分。表2結果顯示,所有研究方案均報告了題目、摘要、背景、目的和具體范圍中的健康問題、干預措施和應用場景,但3篇[12-14]未報告目標人群。4篇方案[15-18]遵循了COS-STAP全部報告條目。報告率相對較低的條目為方法領域中的條目4(利益相關者)和分析領域中的條目9(缺失數據),報告率分別為71.4%和42.9%。條目5b(描述剔除/合并結局指標的過程)和條目11(COS研制完成后的傳播計劃)均有2篇方案[14,19,20]未報告。此外,因1篇[14]研究方案為會議論文,信息報告不全,可能會影響COS-STAP的實際報告率。

2.2.2 COS-STAD評價結果
納入研究中共有14項發布了研究結果,分別采用COS-STAD和COS-STAR對這些研究及其報告質量進行評價。COS-STAD包括3個領域11個條目,滿分為11分。結果發現,14項研究的得分范圍為3~11分,其中1項研究[32]滿足COS-STAD的所有條目,另1項研究[11]只有3個條目符合COS-STAD要求(表3)。具體范圍領域中,只有5項研究(35.7%)[21,23,27,32,33]明確報告了COS涵蓋的人群(條目3)。在利益相關者領域,13項研究(92.9%)報告了COS使用者和醫療衛生專家(條目5和條目6),11項研究(78.6%)納入了患者或其代表(條目7)。在共識過程領域,僅有4項研究(28.6%)[12,26,30,32]關注了結局指標清單的語言描述。

2.2.3 COS-STAR評價結果
COS-STAR包括6個領域,共18個條目,滿分25分。我們基于COS-STAR,對納入的14篇COS-TCM研究報告進行評價。分析發現,報告率最低的是條目11(方案偏離)僅有7.1%。除因未明確報告COS涵蓋人群導致條目3a報告率(35.7%)較低外,所有文獻在題目/摘要和引言領域均符合報告規范的要求(表4);在方案領域,平均報告率為74.6%,報告率較低的有條目5(參與者)和條目10(關于研究倫理和知情同意問題的說明);結果領域中報告率最低的是方案偏離(條目11),其次是提供COS制定所有階段涉及人員的數量和相關特點等數據(條目12);在討論領域,14篇文獻均說明了COS形成過程中的不足,11篇文獻(78.6%)在結論部分結合其他證據,提供對最終COS的解釋以及對今后研究的影響;其他信息領域,13篇(92.9%)報告了資助情況,只有28.6%(4/14)的文獻[12,21,32,33]描述了利益沖突。

2.3 COS-TCM研究方案與報告結果的一致性
COS-STAP中有17項內容(條目)與COS-STAR重疊。研究表明[7]條目的一致性有利于研究從方案平穩過渡到結果,并有助于判斷研究過程中是否存在偏倚,故我們基于COS-STAP和COS-STAR共有條目,對納入的既發表了研究方案又發表了研究結果的4項COS-TCM研究進行一致性評價。一致性評價標準擬為5級,其定義如下:A,方案和研究結果均報告且一致;B,方案和研究結果均報告但不一致;C,方案報告了而研究結果未報告;D,方案未報告但研究結果進行了報告;E,方案和研究結果均未報告。具體評價結果見表5。我們發現,除1項研究因方案為會議論文[14](獲得信息有限),無法比較是否產生了方案偏離外,剩余3項均有研究結果與方案不符的內容:1項研究[26]改變了方案[25]中系統評價納入的研究類型、定性研究方法及共識會議的舉辦方式,但未在結果文獻中報告改變及修改方案的理由;1項研究[23]報告了共識會議形成COS的方法從評分改為專家討論,但未描述原因;只有1項研究[12]在結果中報告了系統評價增加臨床試驗注冊平臺的檢索和Delphi第3輪結局指標保留標準的改變,并描述了修改方案的原因。

3 討論
近年來,COS-TCM研究受到中醫藥領域學者的重視,其數量呈現逐年遞增趨勢,其研究方法和報告質量也倍受關注。COS-STAD、COS-STAR、COS-STAP發布后,COS-TCM研究者將其引入國內并進行了本土化的探索[7,38-40],同時也就COS-TCM研制方法展開了探索[41-45]并發布了技術規范[46]。國際通用指南的發布與國內COS-TCM方法的探索使得大部分COS-TCM研究質量得到了一定保證,但可能存在以下問題和值得改進之處。
首先,較少研究關注結局指標清單的語言描述。我們發現,發布結果的COS-TCM研究中只有4項關注了結局指標清單的語言描述。為確保不同專業和不同文化程度的利益相關者能正確地理解COS,今后的COS-TCM研究需改進結局指標的描述語言,力求通俗易懂,避免使用大量難以理解地醫學術語[47]。其次,許多研究未明確目標人群的細節。未描述適用目標人群的9項研究中,有4項研究對其系統評價納入疾病人群特征進行了規定。該條目的漏報,可能是因為將系統評價過程研究設計要素(PICO)的納排標準與COS的適用范圍混淆,或是因為在研究設計時,未考慮同一疾病不同分型/分期等的結局指標存在差異。COS可從疾病、年齡、性別等人群差異描述該COS適用于特定疾病的全部人群或部分人群。第三,缺失數據處理沒有得到重視。COS研制者應設定處理方法和相關標準(如首輪調查的部分應答者是否參加下一輪調查/完成最少比例的調查將被邀請繼續參加下一輪調查)[47]。COS方案的共識過程需提出如何處理此類缺失數據以避免偏倚,也可借助調查軟件“完成所有問題方可提交”的設置,盡量使數據缺失最小化。第四,未充分報告或漏報參與者情況、方案修改、利益沖突等細節。各利益相關群體代表的人數、專業構成、資歷要求、選擇方式等參與者信息影響著最終COS的科學性和實用性,故需要詳細報告,而報告COS制定所有階段涉及人員的數量、學歷、地域分布、專業背景等相關特征有助于判斷評分過程的可靠性。納入分析的文獻中,所有學位論文和中文文章均未描述利益沖突,可能是學位論文和大部分中文期刊未規定報告利益沖突,或者研究確實存在漏報的情況。最后,發表了結果的14項研究中,僅有4項發表了方案,從表5的一致性評價可發現,實際研究過程及結果報告與事先制定的方案存在不一致,但同時描述了變更的內容與原因的研究只有1項[12]。在研究實施過程中對方案進行修訂是常見的,根據實際情況適當的修改方案也有助于研究更好實施并產生更合理結果,但需要在研究發表時說明變更原因和影響。預先制訂和發布方案,有利于增加COS研制過程的透明度,而對研制過程中方案的修改做出解釋更增強了此作用[48]。因此,預先發表COS-TCM方案是必要的,方案的修訂也應是透明的。
我們發現,COS-TCM方案報告質量優于結果報告質量。這可能涉及如下原因:① 中、英文發表要求不同:除1篇會議論文外,COS-TCM研究方案均發表于英文SCI期刊,對格式要求較明確,文章質量相對較高;COS-TCM結果大部分發表于中文期刊或以學位論文形式呈現,中文期刊發表時因篇幅限制,且較少使用附錄補充信息,容易導致報告內容的遺缺。② 研究實際實施過程存在困難:COS-STAR與COS-STAP條目有相互重疊的部分,COS-STAR增加了研制結果應報告的細節(條目4、11~16)。在制定方案時,更容易做到描述上的盡善盡美,但在研究實施過程中因時間、經費、人力等因素導致方案偏離或研制過程未涉及應報告的條目等情況可能會導致研究者選擇性報告。
COS-STAP、COS-STAR、COS-STAD的發表推進了COS研制方法的標準化、透明化和研究質量的提升。然而,這三項國際規范的制定主要基于現代醫學的醫療實踐情況,共識過程未考慮中醫特點;且三項規范均為最低標準,如報告規范給出了每條目需報告的內容,但具體報告形式未給出建議。COS-TCM研究在遵循國際規范的基礎上,需與中醫特色相結合,結局指標要與中醫藥臨床價值和優勢相關[9],關注并描述與西醫COS的差異和中醫藥特殊要點[46]。
本研究也存在一定的局限性。首先,盡管在檢索數據庫文獻后也進行了COMET網站和文獻引文的手工檢索,但仍不排除一些COS-TCM相關研究的遺漏。其次,在進行質量評價評分時,簡單地采用1分(明確報告)、0分(報告不完全、未報告或不清楚)二分法,不排除有研究在研制COS-TCM時考慮了相關條目但未報告的情況。此外,本研究評價的質量主要以報告質量來估計,可能與實施時的方法學質量有差異。在使用COS規范評價COS-TCM研究方案與結果報告時缺少與中醫藥內容相關條目,也可能無法體現COS-TCM研究的中醫藥特色。
總之,目前COS-TCM研究多數是符合COS研制和報告國際報告規范的,但仍存在部分內容報告不全、未描述方案與實際結果不一致等情況。因此,COS-TCM研究仍需提高其方法學質量和研究報告透明度,重視方案的發表與修訂。我們建議,今后的COS-TCM在研制和發表時應核對相關報告規范并附上檢查清單;適當以附錄形式補充正文因篇幅而未提及的內容,確保未遺漏應報告的條目;如實報告研制過程的變化和方案偏離的情況。未來有必要結合中醫藥特點,研發COS-TCM研究的質量評價工具和報告規范。