筆者系統解讀了2022–2023年間JAMA Surgery發表的關于隨機對照試驗(randomized clinical trial,RCT)方法指導的系列文章,重點針對試驗的實施與監督管理、受試者招募、統計學應用以及論文發表的關鍵要點進行了概述與指導,旨在為外科醫生開展高效的臨床試驗和發表研究成果提供有價值的參考。
版權信息: ?四川大學華西醫院華西期刊社《中國普外基礎與臨床雜志》版權所有,未經授權不得轉載、改編
隨機對照試驗(randomized clinical trial,RCT)作為臨床研究中最為嚴謹的設計,被廣泛用于評估外科干預措施的效果。然而,確保外科RCT的準確性和普適性仍然面臨諸多挑戰。盡管臨床試驗管理規范(good clinical practice,GCP)和隨機對照試驗報告規范(consolidated standards of reporting trials,CONSORT)為符合倫理和科學標準的試驗提供了指導框架,但在實施過程中,精細化管理尤為關鍵。筆者系統解讀了2022–2023年間JAMA Surgery發表的關于RCT方法指導的系列文章,在解讀(一)里面,重點介紹了RCT的設計、選擇、倫理考量、質量控制、預算、經費支持等方面的內容[1],在此部分,筆者講深入闡述RCT的實施與監督管理、受試者招募策略、統計學應用、輔助結果參數選擇及論文發表的關鍵要點[2-11],旨在確保試驗順利進行,并幫助研究者成功發表研究成果。
1 外科臨床試驗實施與監督管理
GCP和CONSORT為符合倫理的臨床研究提供了參考依據。為確保研究結果的可信度并最大限度減少潛在危害,成功實施試驗的關鍵要素包括:協議委員會與指導委員會的參與、獨立安全監查委員會的監督、遵守當地研究法規、在患者招募前進行試驗注冊,以及維持高質量的臨床試驗程序。試驗的實施、監督與管理是高質量臨床試驗的核心。
1.1 試驗實施
1.1.1 試驗實施前期工作
① 籌集資金并獲得機構審查委員會(Institutional Review Board,IRB)批準;② 試驗注冊:在國際醫學期刊編輯委員會認可的臨床注冊中心注冊試驗,為試驗闡釋和保持透明度提供標準平臺;③ 制定試驗方案:通過委員會制定試驗方案,擴大參與度,并提高試驗獲得批準、資助、實施和成功完成的可能性;④ 召開研究者會議:在篩選和招募開始前,召開研究者會議,審查方案各方面、數據收集方法和不良事件報告;⑤ 研究中心啟動訪視:對研究中心的研究人員進行全面培訓,確保其熟悉研究流程、文件和職責,確保試驗按方案有序開展。
1.1.2 試驗實施需要的人員
試驗的成功實施依賴于團隊成員的協調合作,包括臨床試驗主要研究員(principal investigator,PI)、合作研究員、臨床試驗協調員和統計員。其中,PI和協調員至關重要。PI負責簽署所有研究、監管和數據使用協議,協調員則負責篩選參與者、獲取知情同意、與IRB溝通、報告不良事件以及管理數據。
1.2 試驗監督與管理
1.2.1 指導/監督委員會
指導或監督委員會通常由方案委員會的關鍵成員組成,支持PI確保研究按計劃進行。他們的主要任務包括:① 評估參與研究的外科醫生和支持機構的技術水平;② 確保受試者的持續招募;③ 定期召開會議,更新研究進展,解決技術問題,支持干預措施的標準化,確定額外的合作研究員(當招募速度慢于預期時),裁定不良事件的嚴重程度,判斷是否需要調整方案,解決數據相關問題;④ 在試驗期間進行現場訪問以優化試驗;⑤ 持續查閱并學習相關文獻,以支持試驗的穩步推進,或根據最新醫療水平調整研究終點。
1.2.2 數據安全監查委員會
每項試驗都需要制定數據和安全監控計劃,以保障受試者的安全并維護數據的完整性和有效性。監控的類型因研究而異,但每項研究至少需由PI或IRB進行監控,并應有數據安全監查委員會(data and safety monitoring board,DSMB)的額外監控。DSMB的職責包括:① 維護研究的倫理環境;② 獨立審查試驗數據和結果,檢測不良事件;③ 評估結果,確定研究者和研究地點間的差異是否影響結果;④ 在某些情況下,計劃進行中期分析,并使用特定的停止規則,以最小化對參與者的傷害或在高概率顯示干預有效時提前停止試驗。
1.3 常見問題
隨著試驗的進展,尤其是在涉及新手術技術或新型保守療法的研究中,可能會出現參與人數不足或偏離計劃方法的風險。假如沒有新的證據支持提前終止試驗,研究者必須堅持臨床均勢原則,以確保在改變標準做法前完成試驗。新產生的數據可能影響試驗結果,或揭示潛在的陰性結果[12]。因此,試驗指導委員會和數據安全監查委員會必須具備應對不斷變化的數據和實踐的能力。
2 外科臨床試驗受試者招募
受試者招募失敗是導致臨床試驗終止的最常見原因之一,而受試者的多樣性則是確保研究結果普適性的關鍵[13]。該指南重點探討了外科RCT中的受試者招募過程,討論了如何確保試驗人群的多樣性以及提高受試者招募成功率的關鍵策略。
2.1 受試者招募的基本要點
① 確保臨床試驗合作伙伴和工作人員的多樣性。② 確保所有參與試驗的外科醫生,以及所有中心的主要研究人員,始終致力于受試者招募。③ 了解與性別、年齡、種族和民族相關的疾病負擔。例如,乳腺癌試驗通常只招募女性,因為男性乳腺癌罕見,少數病例可能影響統計效率。④ 在涉及特定人群子群中疾病嚴重程度不成比例的試驗中,應將相關差異納入研究設計,確保能夠評估和解釋健康差異。與生物統計學家合作,確定是否需要對特定人群進行過度抽樣,以確保足夠的統計效力。⑤ 選擇研究地點時,應考慮人口統計學特征[14],避免在缺乏多樣性的社區中進行研究。⑥ 確定能夠協助建立信任的社區組織、倡導團體和患者指導團隊,建立長期合作關系,并將合作報酬納入試驗預算,反饋研究結果。⑦ 確定影響招募多樣化患者的具體障礙(如語言、文化素養和經濟因素),并在試驗設計和預算中加以解決。
2.2 招募特殊人群
2.2.1 老年人
在臨床試驗中,老年患者常因合并癥可能影響研究結果而被排除。然而,隨著年齡增長,許多疾病(如大多數癌癥)的發病率顯著增加。因此,放寬排除標準或專門設計針對老年患者的臨床試驗,將他們納入腫瘤學等研究中至關重要。
2.2.2 孕婦
允許孕婦參與的Ⅲ期試驗往往僅限于與妊娠相關的疾病研究,如子癇前期。美國衛生與人力資源部提供了將孕婦安全納入臨床試驗的指導,要求獲得孕婦及其配偶的同意,并記錄干預措施的安全性數據。
2.2.3 兒童
涉及兒童的臨床試驗非常復雜,既要保護兒童的權利,又要確保在疾病治療方面取得進展。當研究問題無法通過成人群體得出可靠結論,或涉及兒科疾病且預期兒童與成人在療效和安全性方面存在差異時,可招募兒童進行試驗。
2.3 常見問題
在健康受試者中,絕大部分人承認參加臨床試驗主要是出于金錢需求[15-16]。因此,為防止對經濟弱勢群體產生不當影響,人類研究倫理委員會通常會限制提供財務激勵。然而,臨床試驗可能要求受試者進行額外的診治,這會產生額外費用。研究人員可以通過延長或調整門診時間、提供交通補償或托兒服務,減少這些費用對受試者招募的影響。此外,受試者的文化程度各異,教育水平越高,參與意愿越強[17]。為確保不同背景的受試者都能理解臨床試驗的目的、程序、風險和獲益,研究人員應提供多種形式的信息資源,如使用信息圖表簡化復雜概念,制作視頻解釋關鍵步驟,并提供多種語言的資源,以滿足不同語言背景的參與者需求。大多數外科試驗涉及單一干預,患者對某種治療方案的強烈偏好可能影響試驗的可行性并引入偏倚。明確不同治療的臨床療效并在試驗初期告知患者,是確保他們全面參與研究的關鍵。
3 外科臨床試驗相關的統計學
在制定研究問題、設計和執行試驗以及解釋結果時,需要仔細考慮假設及其相關條件。因此,該指南建議從研究項目開始階段就應讓統計專家參與研究的各個環節。基于此,該指南總結了外科臨床試驗中統計學方面的關鍵要點。
3.1 注冊研究
統計分析依賴于概率論,因此偶然性結果是不可避免的。雖然0.05的偶然結果風險被廣泛接受,但不發表或有選擇性地發表試驗結果可能進一步影響公眾對已公布試驗結果的信任[18]。為降低偶然性結果的風險,應預先制定研究和統計分析方案,遵循既定報告規范,并公開注冊試驗,使方案公開接受同行評審[19-20]。這些措施有助于確保研究的透明性、可重復性和可信度。
3.2 提出假設,確定最小臨床意義差值
要從臨床有效的研究問題中提出可檢驗的假設并得出有意義的推論,確定相關結果的最小差異至關重要,這個最小差異稱為最小臨床意義差值(minimal clinically important difference,MCID),它為樣本量計算提供依據,并決定推論的下限。MCID可用于評估研究結果的臨床意義[21]。然而,MCID值過小可能導致樣本量過大,增加研究難度并使受試者面臨不必要的隨機化和潛在療效欠佳的治療;MCID值過大則可能導致樣本量不足,從而忽略具有臨床意義的差異。在提出假設時,應進行全面的文獻綜述,以確定潛在治療效果的最佳估計值。學者們主要推薦以效標法為主,結合其他方法(如文獻分析法、專家共識法)來估算MCID[21]。
3.3 計算樣本量
樣本量是回答研究問題所需的最小參與者數量,也是從倫理角度允許暴露于試驗的最大參與者數量。樣本量計算應考慮統計錯誤風險,通常將α設置為0.05,β設置為0.20[22]。然而,由于臨床試驗的復雜性,計算時還需考慮參與者入組失敗、中途退出、失訪等情況。如果對特定參與者亞組特別感興趣,則樣本量應足夠大,以滿足預先設定的亞組分析[23]。建議參考差異引導(difference elicitation in trial,DELTA)指南,并邀請經驗豐富的統計學家參與樣本量的計算。
3.4 隨機化
即使在完全隨機的情況下,特別是在樣本量較小的試驗中,組間不平衡仍可能發生。分層隨機化可以幫助避免重要指標的組間不平衡。假設研究目的是比較兩種不同的疝氣修補方法(無張力疝修補和不放置補片的傳統修補方式)對復發性疝氣患者的治療效果,可以根據“復發史”將患者分為兩個層次(首次復發和多次復發),在每個層次中患者再進行隨機分配,確保每種修補方法在兩個層次中都有均等的患者數量。這種分層隨機化的方法控制了復發史這一可能影響結局的重要因素,從而提高了研究結果的有效性和可信度。但同時需要注意分層分析帶來的樣本量減少的問題。
隨機分配后的差異是偶然的,與統計學檢驗結果無關。對于重要的基線差異,可以通過在統計分析中預先設定的調整方案進行處理。
3.5 統計分析
理論上,對于設計良好且執行到位的RCT,主要分析可以像χ2檢驗或t檢驗一樣簡單。然而,實際分析往往更為復雜,此時經驗豐富的統計學家的參與至關重要。臨床試驗結果分析主要有兩種方法:一是意向性分析,即無論受試者是否完成試驗或接受指定治療,都保留在原組進行分析[24];二是依從性分析,即僅納入按照指定干預方案完成研究的患者,未按計劃完成的患者被排除在外[25]。盡管意向性分析中已進行了隨機化,但仍需調整某些協變量(包括隨機化分層變量),以確保結果的獨立性。在進行多重檢驗時,偶然結果的風險增加,因此可通過多重檢驗校正來降低風險。在解釋分析結果時,除統計學檢驗結果外,還應考慮研究設計、執行情況、效應值及其置信區間。
3.6 缺失數據
缺失數據中可能存在系統性差異,影響統計效能并可能引入選擇偏倚。然而,數據缺失常常難以避免。常見的數據缺失處理方法包括:簡單刪除、加權、填補和不處理[26]。無論采用哪種方法,都應進行敏感性分析,以檢驗結果的穩定性[27]。
3.7 中期分析和終止規則
在大多數外科試驗中,為確保患者安全,由DSMB對數據進行常規審查是十分必要的,尤其包括對不良事件和主要結果的中期分析,會涉及到多重檢驗,應限制對主要成果數據的評估,以避免產生偶然結果。
4 外科臨床試驗的輔助結果參數
選擇合適的結果參數對于RCT的成功至關重要。美國醫學研究所提出了6個定義醫療質量的參數:安全、有效、以患者為中心、及時、高效和公平。安全性和有效性是首要目標,以患者為中心、及時、高效和公平是輔助參數。
4.1 風險分層參數
在外科臨床試驗中,使用風險分層參數可以更準確地評估和分層患者風險,確保試驗結果的可靠性和有效性。風險分層參數包括基因組學、臨床虛弱量表、生物測定等。在基因組學中,通過全基因組測序分析組織樣本中的體細胞和生殖細胞突變,有助于預測干預措施的成功,從而優化樣本量并加速試驗完成。臨床虛弱量表中,年齡是風險調整的一個重要參數[28],結合認知、藥物使用、營養、獨立性和功能評估,可以更精確地進行外科干預的風險分層。在生物測定中,性別和體質量指數是常見的風險分層參數,放射學參數如全身脂肪或肌肉含量也被用來評估外科手術風險。
4.2 結果參數
選擇合適的結果參數是確保臨床試驗成功的關鍵,通常分為主要和次要結果參數。結果參數包括基因組學、蛋白質組學、經濟評估、以患者為中心的設計等。基因組學和蛋白質組學通過基因表達分析和循環蛋白標志物評估干預措施的早期反應[29-30],盡管昂貴,但對假設檢驗和試驗優化至關重要。經濟評估則通過跟蹤短期和長期成本,在療效相當的情況下,幫助區分最佳治療方法。以患者為中心的設計是指利用移動設備、健康應用和可穿戴傳感器收集患者生成的健康數據,提升了患者的參與度與數據的真實性。新型數據收集方法包括:基于網絡和應用程序的工具,允許患者遠程報告生理參數、藥物使用情況和飲食消費,以及提供實時家庭報告[31];可穿戴設備自動收集數據,具有低成本、防水、舒適、長電池壽命等優勢,并與患者癥狀應用程序結合,提供可靠的臨床治療和試驗數據[32-33]。
4.3 常見問題
在臨床試驗中增加結果參數和采用更精細的參數可能會顯著增加成本。因此,定期評估研究參數的有效性,識別有用的指標以節省臨床費用并簡化試驗流程至關重要。遠程醫療雖然具有成本和技術可及性的不平等問題[34],但其顯著優勢在于允許家庭成員無需請假即可參與親人的醫療討論,同時通過減少門診隨訪次數,提高患者生活質量,減輕治療負擔并降低成本[35]。外科醫生的責任是推廣和普及成本效益高的新技術與干預措施,使盡可能多的患者受益,避免讓新技術成為經濟負擔。
5 臨床試驗論文發表
臨床試驗的最后一步,也是最具挑戰的一步,就是文章的撰寫和發表。該指南指出,研究者在考慮主要終點、次要終點、樣本量計算、試驗注冊和倫理審查的同時,應從一開始就規劃試驗結果的發表。并且對于設計精良的臨床試驗,研究者也應考慮在研究完成注冊后發表研究方案。研究方案發表過程中,同行評審專家可能對研究方案細節提出進一步的改進,不僅有助于研究的順利開展,同時也可以讓研究更早得到業界關注,為后續試驗結果的發表提供保障。
5.1 研究主題與擬投期刊的相關性
研究的主題是臨床試驗的起點,也是試驗報告中最重要的部分。在科學寫作中,保持新穎性至關重要,至少應在視角上有所創新。了解目標讀者,選擇與之匹配的期刊,而非一味追求高影響因子。
5.2 遵循研究報告指南
“EQUATOR Network”網站提供了不同類型研究的報告規范,例如臨床試驗方案的SPIRIT指南[36]。對于RCT的報告,應遵循CONSORT指南[37],該指南為研究者提供了標準的結果報告格式,包括試驗流程圖(補充材料1),以及標題、摘要、方法、結果、討論等部分的詳細檢查清單(補充材料2)。此外,CONSORT指南還制定了特定試驗設計的擴展指南,如非劣效試驗[38]和整群試驗[39]。對于要求按照CONSORT指南準備稿件的期刊,通常建議在投稿時附上檢查清單,并注明每個項目在文章中的具體位置。
5.3 作者署名
國際醫學期刊編輯委員會建議,只有滿足以下4個標準才能被列為論文作者:① 參與試驗的構思與設計,數據的獲取、分析或解釋;② 參與文章的起草、修改或撰寫;③ 認可最終發表的版本;④ 對研究和發表論文的真實性、完整性與誠信負責。不符合以上標準的貢獻者不具備作者資格,但可被視為參與者。在合作研究中,若合作研究者眾多且無法對標準中的前2項做出有意義的貢獻,文章可以以集體合作的名義發表,但至少需有1人承擔作者責任。
5.4 常見問題
5.4.1 P值
研究結果應如實呈現,避免夸大或過度追求不必要的顯著性。臨床重要性應優先于統計學顯著性。P值(probability value)雖然重要,但不能單獨使用,尤其不應在基線患者的人口統計數據中使用,因為,在基線的描述性統計中,關注的是組間的均衡性和代表性,而非統計學顯著性。
5.4.2 統計效能
高統計效能(power)意味著研究者對拒絕錯誤的原假設更有信心,從而獲得更可靠的研究結果。樣本量不足是導致臨床試驗失敗的常見原因之一。多中心和國際合作研究能有效解決受試者招募困難的問題,而合理的資金配置是克服設計和執行問題的關鍵。激勵措施可以加快招募進程。
5.4.3 誠信
不當行為是試驗發表的主要障礙,包括虛構數據、數據處理不當、作者身份不端等。試驗報告應嚴格遵循預先定義的終點,如在試驗過程中出現額外的臨床相關結果,應明確說明并獲得倫理委員會的批準。
6 小結
筆者系統解讀了2022–2023年間JAMA Surgery發表的關于RCT方法指導的系列文章,深入探討了RCT的實施與監督管理、受試者招募、統計學應用、輔助結果參數選擇及論文發表的關鍵要點。通過借鑒這些國際標準和指導,為我國外科臨床試驗的順利實施和研究成果的發表提供了規范化的參考,旨在提升外科RCT的質量和透明度,推動高效臨床試驗的開展及研究成果的成功發表。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們沒有相互競爭的利益。
作者貢獻聲明:孔雕負責文獻檢索及起草文章;胥月晴負責完善總結要點;文天夫、李川和彭偉負責審核并修改。
——(完)
隨機對照試驗(randomized clinical trial,RCT)作為臨床研究中最為嚴謹的設計,被廣泛用于評估外科干預措施的效果。然而,確保外科RCT的準確性和普適性仍然面臨諸多挑戰。盡管臨床試驗管理規范(good clinical practice,GCP)和隨機對照試驗報告規范(consolidated standards of reporting trials,CONSORT)為符合倫理和科學標準的試驗提供了指導框架,但在實施過程中,精細化管理尤為關鍵。筆者系統解讀了2022–2023年間JAMA Surgery發表的關于RCT方法指導的系列文章,在解讀(一)里面,重點介紹了RCT的設計、選擇、倫理考量、質量控制、預算、經費支持等方面的內容[1],在此部分,筆者講深入闡述RCT的實施與監督管理、受試者招募策略、統計學應用、輔助結果參數選擇及論文發表的關鍵要點[2-11],旨在確保試驗順利進行,并幫助研究者成功發表研究成果。
1 外科臨床試驗實施與監督管理
GCP和CONSORT為符合倫理的臨床研究提供了參考依據。為確保研究結果的可信度并最大限度減少潛在危害,成功實施試驗的關鍵要素包括:協議委員會與指導委員會的參與、獨立安全監查委員會的監督、遵守當地研究法規、在患者招募前進行試驗注冊,以及維持高質量的臨床試驗程序。試驗的實施、監督與管理是高質量臨床試驗的核心。
1.1 試驗實施
1.1.1 試驗實施前期工作
① 籌集資金并獲得機構審查委員會(Institutional Review Board,IRB)批準;② 試驗注冊:在國際醫學期刊編輯委員會認可的臨床注冊中心注冊試驗,為試驗闡釋和保持透明度提供標準平臺;③ 制定試驗方案:通過委員會制定試驗方案,擴大參與度,并提高試驗獲得批準、資助、實施和成功完成的可能性;④ 召開研究者會議:在篩選和招募開始前,召開研究者會議,審查方案各方面、數據收集方法和不良事件報告;⑤ 研究中心啟動訪視:對研究中心的研究人員進行全面培訓,確保其熟悉研究流程、文件和職責,確保試驗按方案有序開展。
1.1.2 試驗實施需要的人員
試驗的成功實施依賴于團隊成員的協調合作,包括臨床試驗主要研究員(principal investigator,PI)、合作研究員、臨床試驗協調員和統計員。其中,PI和協調員至關重要。PI負責簽署所有研究、監管和數據使用協議,協調員則負責篩選參與者、獲取知情同意、與IRB溝通、報告不良事件以及管理數據。
1.2 試驗監督與管理
1.2.1 指導/監督委員會
指導或監督委員會通常由方案委員會的關鍵成員組成,支持PI確保研究按計劃進行。他們的主要任務包括:① 評估參與研究的外科醫生和支持機構的技術水平;② 確保受試者的持續招募;③ 定期召開會議,更新研究進展,解決技術問題,支持干預措施的標準化,確定額外的合作研究員(當招募速度慢于預期時),裁定不良事件的嚴重程度,判斷是否需要調整方案,解決數據相關問題;④ 在試驗期間進行現場訪問以優化試驗;⑤ 持續查閱并學習相關文獻,以支持試驗的穩步推進,或根據最新醫療水平調整研究終點。
1.2.2 數據安全監查委員會
每項試驗都需要制定數據和安全監控計劃,以保障受試者的安全并維護數據的完整性和有效性。監控的類型因研究而異,但每項研究至少需由PI或IRB進行監控,并應有數據安全監查委員會(data and safety monitoring board,DSMB)的額外監控。DSMB的職責包括:① 維護研究的倫理環境;② 獨立審查試驗數據和結果,檢測不良事件;③ 評估結果,確定研究者和研究地點間的差異是否影響結果;④ 在某些情況下,計劃進行中期分析,并使用特定的停止規則,以最小化對參與者的傷害或在高概率顯示干預有效時提前停止試驗。
1.3 常見問題
隨著試驗的進展,尤其是在涉及新手術技術或新型保守療法的研究中,可能會出現參與人數不足或偏離計劃方法的風險。假如沒有新的證據支持提前終止試驗,研究者必須堅持臨床均勢原則,以確保在改變標準做法前完成試驗。新產生的數據可能影響試驗結果,或揭示潛在的陰性結果[12]。因此,試驗指導委員會和數據安全監查委員會必須具備應對不斷變化的數據和實踐的能力。
2 外科臨床試驗受試者招募
受試者招募失敗是導致臨床試驗終止的最常見原因之一,而受試者的多樣性則是確保研究結果普適性的關鍵[13]。該指南重點探討了外科RCT中的受試者招募過程,討論了如何確保試驗人群的多樣性以及提高受試者招募成功率的關鍵策略。
2.1 受試者招募的基本要點
① 確保臨床試驗合作伙伴和工作人員的多樣性。② 確保所有參與試驗的外科醫生,以及所有中心的主要研究人員,始終致力于受試者招募。③ 了解與性別、年齡、種族和民族相關的疾病負擔。例如,乳腺癌試驗通常只招募女性,因為男性乳腺癌罕見,少數病例可能影響統計效率。④ 在涉及特定人群子群中疾病嚴重程度不成比例的試驗中,應將相關差異納入研究設計,確保能夠評估和解釋健康差異。與生物統計學家合作,確定是否需要對特定人群進行過度抽樣,以確保足夠的統計效力。⑤ 選擇研究地點時,應考慮人口統計學特征[14],避免在缺乏多樣性的社區中進行研究。⑥ 確定能夠協助建立信任的社區組織、倡導團體和患者指導團隊,建立長期合作關系,并將合作報酬納入試驗預算,反饋研究結果。⑦ 確定影響招募多樣化患者的具體障礙(如語言、文化素養和經濟因素),并在試驗設計和預算中加以解決。
2.2 招募特殊人群
2.2.1 老年人
在臨床試驗中,老年患者常因合并癥可能影響研究結果而被排除。然而,隨著年齡增長,許多疾病(如大多數癌癥)的發病率顯著增加。因此,放寬排除標準或專門設計針對老年患者的臨床試驗,將他們納入腫瘤學等研究中至關重要。
2.2.2 孕婦
允許孕婦參與的Ⅲ期試驗往往僅限于與妊娠相關的疾病研究,如子癇前期。美國衛生與人力資源部提供了將孕婦安全納入臨床試驗的指導,要求獲得孕婦及其配偶的同意,并記錄干預措施的安全性數據。
2.2.3 兒童
涉及兒童的臨床試驗非常復雜,既要保護兒童的權利,又要確保在疾病治療方面取得進展。當研究問題無法通過成人群體得出可靠結論,或涉及兒科疾病且預期兒童與成人在療效和安全性方面存在差異時,可招募兒童進行試驗。
2.3 常見問題
在健康受試者中,絕大部分人承認參加臨床試驗主要是出于金錢需求[15-16]。因此,為防止對經濟弱勢群體產生不當影響,人類研究倫理委員會通常會限制提供財務激勵。然而,臨床試驗可能要求受試者進行額外的診治,這會產生額外費用。研究人員可以通過延長或調整門診時間、提供交通補償或托兒服務,減少這些費用對受試者招募的影響。此外,受試者的文化程度各異,教育水平越高,參與意愿越強[17]。為確保不同背景的受試者都能理解臨床試驗的目的、程序、風險和獲益,研究人員應提供多種形式的信息資源,如使用信息圖表簡化復雜概念,制作視頻解釋關鍵步驟,并提供多種語言的資源,以滿足不同語言背景的參與者需求。大多數外科試驗涉及單一干預,患者對某種治療方案的強烈偏好可能影響試驗的可行性并引入偏倚。明確不同治療的臨床療效并在試驗初期告知患者,是確保他們全面參與研究的關鍵。
3 外科臨床試驗相關的統計學
在制定研究問題、設計和執行試驗以及解釋結果時,需要仔細考慮假設及其相關條件。因此,該指南建議從研究項目開始階段就應讓統計專家參與研究的各個環節。基于此,該指南總結了外科臨床試驗中統計學方面的關鍵要點。
3.1 注冊研究
統計分析依賴于概率論,因此偶然性結果是不可避免的。雖然0.05的偶然結果風險被廣泛接受,但不發表或有選擇性地發表試驗結果可能進一步影響公眾對已公布試驗結果的信任[18]。為降低偶然性結果的風險,應預先制定研究和統計分析方案,遵循既定報告規范,并公開注冊試驗,使方案公開接受同行評審[19-20]。這些措施有助于確保研究的透明性、可重復性和可信度。
3.2 提出假設,確定最小臨床意義差值
要從臨床有效的研究問題中提出可檢驗的假設并得出有意義的推論,確定相關結果的最小差異至關重要,這個最小差異稱為最小臨床意義差值(minimal clinically important difference,MCID),它為樣本量計算提供依據,并決定推論的下限。MCID可用于評估研究結果的臨床意義[21]。然而,MCID值過小可能導致樣本量過大,增加研究難度并使受試者面臨不必要的隨機化和潛在療效欠佳的治療;MCID值過大則可能導致樣本量不足,從而忽略具有臨床意義的差異。在提出假設時,應進行全面的文獻綜述,以確定潛在治療效果的最佳估計值。學者們主要推薦以效標法為主,結合其他方法(如文獻分析法、專家共識法)來估算MCID[21]。
3.3 計算樣本量
樣本量是回答研究問題所需的最小參與者數量,也是從倫理角度允許暴露于試驗的最大參與者數量。樣本量計算應考慮統計錯誤風險,通常將α設置為0.05,β設置為0.20[22]。然而,由于臨床試驗的復雜性,計算時還需考慮參與者入組失敗、中途退出、失訪等情況。如果對特定參與者亞組特別感興趣,則樣本量應足夠大,以滿足預先設定的亞組分析[23]。建議參考差異引導(difference elicitation in trial,DELTA)指南,并邀請經驗豐富的統計學家參與樣本量的計算。
3.4 隨機化
即使在完全隨機的情況下,特別是在樣本量較小的試驗中,組間不平衡仍可能發生。分層隨機化可以幫助避免重要指標的組間不平衡。假設研究目的是比較兩種不同的疝氣修補方法(無張力疝修補和不放置補片的傳統修補方式)對復發性疝氣患者的治療效果,可以根據“復發史”將患者分為兩個層次(首次復發和多次復發),在每個層次中患者再進行隨機分配,確保每種修補方法在兩個層次中都有均等的患者數量。這種分層隨機化的方法控制了復發史這一可能影響結局的重要因素,從而提高了研究結果的有效性和可信度。但同時需要注意分層分析帶來的樣本量減少的問題。
隨機分配后的差異是偶然的,與統計學檢驗結果無關。對于重要的基線差異,可以通過在統計分析中預先設定的調整方案進行處理。
3.5 統計分析
理論上,對于設計良好且執行到位的RCT,主要分析可以像χ2檢驗或t檢驗一樣簡單。然而,實際分析往往更為復雜,此時經驗豐富的統計學家的參與至關重要。臨床試驗結果分析主要有兩種方法:一是意向性分析,即無論受試者是否完成試驗或接受指定治療,都保留在原組進行分析[24];二是依從性分析,即僅納入按照指定干預方案完成研究的患者,未按計劃完成的患者被排除在外[25]。盡管意向性分析中已進行了隨機化,但仍需調整某些協變量(包括隨機化分層變量),以確保結果的獨立性。在進行多重檢驗時,偶然結果的風險增加,因此可通過多重檢驗校正來降低風險。在解釋分析結果時,除統計學檢驗結果外,還應考慮研究設計、執行情況、效應值及其置信區間。
3.6 缺失數據
缺失數據中可能存在系統性差異,影響統計效能并可能引入選擇偏倚。然而,數據缺失常常難以避免。常見的數據缺失處理方法包括:簡單刪除、加權、填補和不處理[26]。無論采用哪種方法,都應進行敏感性分析,以檢驗結果的穩定性[27]。
3.7 中期分析和終止規則
在大多數外科試驗中,為確保患者安全,由DSMB對數據進行常規審查是十分必要的,尤其包括對不良事件和主要結果的中期分析,會涉及到多重檢驗,應限制對主要成果數據的評估,以避免產生偶然結果。
4 外科臨床試驗的輔助結果參數
選擇合適的結果參數對于RCT的成功至關重要。美國醫學研究所提出了6個定義醫療質量的參數:安全、有效、以患者為中心、及時、高效和公平。安全性和有效性是首要目標,以患者為中心、及時、高效和公平是輔助參數。
4.1 風險分層參數
在外科臨床試驗中,使用風險分層參數可以更準確地評估和分層患者風險,確保試驗結果的可靠性和有效性。風險分層參數包括基因組學、臨床虛弱量表、生物測定等。在基因組學中,通過全基因組測序分析組織樣本中的體細胞和生殖細胞突變,有助于預測干預措施的成功,從而優化樣本量并加速試驗完成。臨床虛弱量表中,年齡是風險調整的一個重要參數[28],結合認知、藥物使用、營養、獨立性和功能評估,可以更精確地進行外科干預的風險分層。在生物測定中,性別和體質量指數是常見的風險分層參數,放射學參數如全身脂肪或肌肉含量也被用來評估外科手術風險。
4.2 結果參數
選擇合適的結果參數是確保臨床試驗成功的關鍵,通常分為主要和次要結果參數。結果參數包括基因組學、蛋白質組學、經濟評估、以患者為中心的設計等。基因組學和蛋白質組學通過基因表達分析和循環蛋白標志物評估干預措施的早期反應[29-30],盡管昂貴,但對假設檢驗和試驗優化至關重要。經濟評估則通過跟蹤短期和長期成本,在療效相當的情況下,幫助區分最佳治療方法。以患者為中心的設計是指利用移動設備、健康應用和可穿戴傳感器收集患者生成的健康數據,提升了患者的參與度與數據的真實性。新型數據收集方法包括:基于網絡和應用程序的工具,允許患者遠程報告生理參數、藥物使用情況和飲食消費,以及提供實時家庭報告[31];可穿戴設備自動收集數據,具有低成本、防水、舒適、長電池壽命等優勢,并與患者癥狀應用程序結合,提供可靠的臨床治療和試驗數據[32-33]。
4.3 常見問題
在臨床試驗中增加結果參數和采用更精細的參數可能會顯著增加成本。因此,定期評估研究參數的有效性,識別有用的指標以節省臨床費用并簡化試驗流程至關重要。遠程醫療雖然具有成本和技術可及性的不平等問題[34],但其顯著優勢在于允許家庭成員無需請假即可參與親人的醫療討論,同時通過減少門診隨訪次數,提高患者生活質量,減輕治療負擔并降低成本[35]。外科醫生的責任是推廣和普及成本效益高的新技術與干預措施,使盡可能多的患者受益,避免讓新技術成為經濟負擔。
5 臨床試驗論文發表
臨床試驗的最后一步,也是最具挑戰的一步,就是文章的撰寫和發表。該指南指出,研究者在考慮主要終點、次要終點、樣本量計算、試驗注冊和倫理審查的同時,應從一開始就規劃試驗結果的發表。并且對于設計精良的臨床試驗,研究者也應考慮在研究完成注冊后發表研究方案。研究方案發表過程中,同行評審專家可能對研究方案細節提出進一步的改進,不僅有助于研究的順利開展,同時也可以讓研究更早得到業界關注,為后續試驗結果的發表提供保障。
5.1 研究主題與擬投期刊的相關性
研究的主題是臨床試驗的起點,也是試驗報告中最重要的部分。在科學寫作中,保持新穎性至關重要,至少應在視角上有所創新。了解目標讀者,選擇與之匹配的期刊,而非一味追求高影響因子。
5.2 遵循研究報告指南
“EQUATOR Network”網站提供了不同類型研究的報告規范,例如臨床試驗方案的SPIRIT指南[36]。對于RCT的報告,應遵循CONSORT指南[37],該指南為研究者提供了標準的結果報告格式,包括試驗流程圖(補充材料1),以及標題、摘要、方法、結果、討論等部分的詳細檢查清單(補充材料2)。此外,CONSORT指南還制定了特定試驗設計的擴展指南,如非劣效試驗[38]和整群試驗[39]。對于要求按照CONSORT指南準備稿件的期刊,通常建議在投稿時附上檢查清單,并注明每個項目在文章中的具體位置。
5.3 作者署名
國際醫學期刊編輯委員會建議,只有滿足以下4個標準才能被列為論文作者:① 參與試驗的構思與設計,數據的獲取、分析或解釋;② 參與文章的起草、修改或撰寫;③ 認可最終發表的版本;④ 對研究和發表論文的真實性、完整性與誠信負責。不符合以上標準的貢獻者不具備作者資格,但可被視為參與者。在合作研究中,若合作研究者眾多且無法對標準中的前2項做出有意義的貢獻,文章可以以集體合作的名義發表,但至少需有1人承擔作者責任。
5.4 常見問題
5.4.1 P值
研究結果應如實呈現,避免夸大或過度追求不必要的顯著性。臨床重要性應優先于統計學顯著性。P值(probability value)雖然重要,但不能單獨使用,尤其不應在基線患者的人口統計數據中使用,因為,在基線的描述性統計中,關注的是組間的均衡性和代表性,而非統計學顯著性。
5.4.2 統計效能
高統計效能(power)意味著研究者對拒絕錯誤的原假設更有信心,從而獲得更可靠的研究結果。樣本量不足是導致臨床試驗失敗的常見原因之一。多中心和國際合作研究能有效解決受試者招募困難的問題,而合理的資金配置是克服設計和執行問題的關鍵。激勵措施可以加快招募進程。
5.4.3 誠信
不當行為是試驗發表的主要障礙,包括虛構數據、數據處理不當、作者身份不端等。試驗報告應嚴格遵循預先定義的終點,如在試驗過程中出現額外的臨床相關結果,應明確說明并獲得倫理委員會的批準。
6 小結
筆者系統解讀了2022–2023年間JAMA Surgery發表的關于RCT方法指導的系列文章,深入探討了RCT的實施與監督管理、受試者招募、統計學應用、輔助結果參數選擇及論文發表的關鍵要點。通過借鑒這些國際標準和指導,為我國外科臨床試驗的順利實施和研究成果的發表提供了規范化的參考,旨在提升外科RCT的質量和透明度,推動高效臨床試驗的開展及研究成果的成功發表。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們沒有相互競爭的利益。
作者貢獻聲明:孔雕負責文獻檢索及起草文章;胥月晴負責完善總結要點;文天夫、李川和彭偉負責審核并修改。
——(完)