中醫臨床研究中結局指標遴選存在諸多問題,如結局指標的適用性研究不足、辨證論治個體化指標體現不充分、整體/綜合評價指標選擇方法不完善、結局指標重要性判斷缺乏證據支持、結局指標的人文價值體現不明顯等。雖然核心指標集可以一定程度上幫助臨床研究者選擇結局指標,但其目前并未被臨床研究者廣泛應用,且核心指標集中結局指標重要性的判斷主要基于參與者的個人經驗,缺少方法學的支持,也會導致同一疾病有多個核心指標集,造成浪費。筆者認為,需要不斷完善結局指標研究的方法學,特別是在核心指標集研究中,可通過構建證據和人文價值理念指導下的中醫臨床療效評價核心指標遴選框架來解決這些問題。
引用本文: 邱瑞瑾, 關之玥, 張心怡, 陳卓, 王文惠, 商洪才. 中醫臨床療效評價核心指標遴選的關鍵問題及解決途徑. 中國循證醫學雜志, 2024, 24(4): 466-471. doi: 10.7507/1672-2531.202307055 復制
版權信息: ?四川大學華西醫院華西期刊社《中國循證醫學雜志》版權所有,未經授權不得轉載、改編
中醫藥的核心競爭力在于確切的臨床療效證據。新型冠狀病毒肺炎爆發以來,中醫藥在疾病防治的各個階段發揮了獨特優勢,尤其以清肺排毒湯為代表的“三藥三方”在臨床救治中發揮了重要作用。但中醫藥療效一直備受外界質疑,其原因除缺乏高質量研究證據外,也與現今的療效評價方法與中醫的本體特點(辨證論治及整體觀)不符有關。
研發符合中醫藥本體特點的臨床療效評價創新方法與技術是當前中醫藥發展面臨的重大工程技術難題,也是提高中醫藥核心競爭力和促進中醫藥傳承創新發展的關鍵,其中療效評價指標的遴選是核心環節之一[1]。然而,中醫臨床研究中結局指標選擇存在一些問題,如:同類臨床研究結局指標選擇差異大、終點結局指標報告不足、沒有報告或沒有完整報告主要結局指標、缺少患者報告的結局指標、不良反應/副作用報告不充分、中醫證候指標不足等問題[2]。為此,國內研究者引入核心指標集概念,提出了中醫藥領域核心指標集的研究方法,并在此基礎上提出了中醫核心證候指標集的概念以及構建方法[3,4],已應用于相關疾病領域[5-8]。
在臨床研究中應用核心指標集可以提高同類臨床研究結局指標報告的一致性,使更多研究能進行同類比較,亦有助于發現潛在的選擇性報告偏倚。然而,調查顯示,核心指標集的使用情況普遍偏低,如臨床研究者認為使用核心指標集有諸多限制,而且核心指標集中往往包含太多指標,以及核心指標集可能會增加患者的負擔,或者推薦了過時的指標[9,10]。
出現這些情況的原因與當前核心指標的遴選方法不完善有關。筆者結合多年核心指標集研究經驗,分析了臨床療效評價中核心指標遴選存在的問題,并針對中醫臨床療效評價中結局指標的特點提出相應的解決策略,以為相關研究者提供參考。
1 臨床療效評價核心指標遴選中存在的關鍵問題
1.1 結局指標的適用性研究不足
核心指標集的形成不僅與患者健康狀態和干預措施相關,也與應用場景、選擇的結局指標分類框架、測量的時間點和使用者有關。在核心指標集研究中,其應用場景有臨床研究,也有臨床實踐;研究者選擇的結局指標分類框架既有通用的,如Williamson/Clarke結局框架,也有適用于特定疾病的,如風濕病學結局指標測量核心框架;針對同一疾病的短期研究和長期研究分別構建不同的核心指標集,或在同一核心指標集中體現遠期指標和近期指標的差異;使用者有臨床研究者/系統評價者,也有患者[11-14]。由此可見,同一結局指標并非適用于所有類型的臨床療效評價,有時會導致同一疾病有多個不同的核心指標集。基于這些問題,筆者前期提出將母方案設計方法引入到核心指標集構建中,使核心指標集能適用于不同的情境[15]。但整體而言,結局指標的適用性研究并不充分,一定程度上也會影響研究者選擇合適的核心指標。
1.2 結局指標重要性判斷缺乏證據支持
對于結局指標重要性的判斷,目前使用最多的是推薦、評估、發展和評價的等級(grades of recommendation, assessment, development and evaluation,GRADE)工作組推薦的9分評分法,其中1~3分代表結局指標“不重要”,4~6分代表結局指標“重要但不關鍵”,7~9分代表結局指標“關鍵”。此外,GRADE工作組也推薦了判斷結局指標重要性的三個步驟:初步判斷結局指標重要性、審查系統評價證據后重新判斷結局指標重要性、判斷干預措施的理想效果和不理想效果之間的平衡[16]。
在核心指標集研究中,結局指標重要性的判斷主要來自專家經驗,尚缺少證據支持。如病死率作為終點指標往往被認為是一個關鍵指標,然而,在很多情況下,臨床研究中出現死亡的情形很少[17];此外,替代指標與終點事件的相關性在很多情況下并不清楚,如對于某些生理學指標而言,若缺乏相關臨床流行病學證據證明這些指標的異常與特定人群的死亡相關,可能會出現某種干預措施僅在動物模型中有效,而在人體中無效的情況[18]。
國外有研究者針對RCT中主要結局指標的選擇提出了六項原則:① 干預措施應該能合理地改變主要結局指標;② 主要結局指標對決策者重要;③ 主要結局指標對患者重要;④ 主要結局指標可以被有效地測量;⑤ 主要結局指標可以被可靠地測量;⑥ 如有可能,使用易于理解的連續量表[18]。但應用這些原則在RCT中選擇結局指標時,仍需要有證據支持。
1.3 結局指標的人文價值體現不明顯
結局指標的價值在目前的研究中考慮得較少,大多是在選擇測量工具時,針對測量工具的質量和性能進行推薦。國外“基于共識標準選擇健康測量工具”(consensus-based standards for the selection of health measurement instruments,COSMIN)工作組研發了結局指標測量工具的質量評價工具,被引入到核心指標集研究中[19]。但是在核心指標集研究過程中,不同利益相關群體進行結局指標重要性判斷時很少會考慮結局指標的可測量性及相關測量工具的性能,一般是在核心指標確定后,研究者針對每個結局指標的測量工具進行證據檢索和評價后,推薦高質量的測量工具。有時研究者也會把結局指標和測量工具混淆,如將測量生活質量的量表列入結局指標清單中,對于不了解相關量表性能及質量的專家來說難以進行判斷和選擇。
國內外的研究者早已意識到在結局指標選擇中應注重人文價值,提出患者報告結局的重要性。在核心指標集研究中,有87%的研究納入了患者。隨著研究數量的增多,患者參與核心指標集的問題不再是“是否參與”,而是“如何參與”[20]。但是受多種因素影響,在核心指標集構建中,醫生/研究者在結局指標優先級排序上仍處于主導地位。筆者前期研究亦發現,由于大部分患者不具備醫學知識,不了解疾病的發生、發展和轉歸,對于結局指標的看法,患者的回答往往是“希望把病治好”“不要留下后遺癥”,或者“我不懂這些,就聽醫生安排”等比較籠統和模糊的回答[2]。而患者報告結局的測量方式目前以量表為主,雖然生存質量量表可以一定程度上凸顯中醫藥治療疾病的特色和優勢,但其運用目前僅限于少數慢性疾病,范圍相對局限,且針對性、目的性不強;或由于缺乏高質量量表,對某些疾病而言,可能無法推薦合適的患者報告結局的測量工具[21]。因此,在沒有高質量的測量工具的情況下,也可基于當前證據暫時推薦可行性高、內容效度和內部一致性良好的工具[22]。
整體而言,在結局指標遴選中需進一步反映患者的意愿和價值觀。
2 中醫臨床療效評價核心指標遴選的關鍵問題
中醫學者普遍認為,中醫臨床療效評價核心指標應體現中醫特色[5,23]。然而,前期研究顯示,國內完成的9項中醫藥領域核心指標集中,僅5項研究涉及了能體現中醫特色的證候指標[24]。此外,在中醫臨床療效評價中,核心指標的遴選也應關注以下關鍵問題。
2.1 關注中醫臨床辨證論治個體化指標
目前群體化研究為主導的模式以終點指標和替代指標為主,無法解決中醫辨證論治個體化與標準化之間的矛盾,甚至一些中醫臨床研究的設計中會回避辨證論治特色。
針對這些問題,研究者也進行了一些有益的嘗試,如在單病例隨機對照試驗設計中,通過遴選中醫核心證候指標,采用循證目標成就量表法進行療效評價,凸顯中醫診療的個體化特征[25];借鑒核心指標集理念,結合專家經驗和數學模型,融合大數據分析,在長時程理念下通過優化個體化結局指標體系來構建中醫個體化長時程療效評價方法[26];此外,筆者前期以中醫證候的最小單元—證候要素為基礎,形成了中醫核心證候指標集的構建方法,包含特定疾病核心證候類型,每種證候的核心癥狀,為中醫證候療效的可比性提供基礎,已應用于心血管病領域[3,27]。但整體而言,目前尚缺少合理的、重點突出的、體現中醫個體化特點的指標清單。
2.2 整體/綜合評價時核心指標選擇應反映患者整體狀況
對整體觀指導下的中醫臨床療效進行評價時,評價指標也應能反映患者的整體狀況。當前中醫臨床療效評價或注重客觀指標改善,或注重證候改善,或運用量表評價生活質量,這些方法都具有局部性的特征。如何實現整體性的中醫臨床療效評價,如何構建這些指標之間的關系,用什么樣的方法分析更合理,如何形成中醫整體/綜合療效評價指標,尚需更多的研究提供證據支持[27,28]。
目前國外的整體評價主要集中于量表制定、評估患者整體健康狀況以及衛生技術評估等領域。有研究者開展的臨床研究綜合評價,主要從結局指標的不同維度進行報告,沒有體現療效的整體性[29];近些年國內外研究者關注的多主要終點指標評價法,其方向主要集中于研究設計和統計方法方面,對不同指標的療效評價仍是單獨進行[30]。有中醫研究者認為可以將西醫療效指標、中醫證候指標及生活質量指標共同作為主要終點指標,建立中醫藥整體評價方法[31],目前仍處于探索階段。
對于慢性疾病而言,可能會存在不同維度的指標。每個患者受疾病的影響和對治療的反應可能是不同維度指標的組合,因此將不同維度的指標合并成單個指標可能具有一定意義。國際上風濕病結局指標測量工作組提出了將多維度指標合并成一個指標的方法,為整體評價指標的構建提供了思路[32]。
中醫學者認為,可以利用系統科學的原理和方法進行中醫臨床療效整體評價。從宏觀、中觀、微觀3個層面選取定量或定性參數,形成2X-4Y療效評價體系[33]。其中2X指通用評價參數和專科評價參數相結合,4Y指西醫疾病療效評價,中醫證候療效評價,患者報告結局、醫生報告結局等。這一模式具有中醫原創思維的特點,但在實際操作中會有一定難度,特別是需要明確微觀、中觀、宏觀參數的指標體系以及不同評價參數之間的相關性。
3 解決中醫臨床療效評價核心指標遴選問題的途徑
構建中醫臨床療效評價核心指標遴選框架/方法是有效解決中醫臨床療效評價核心指標遴選問題的潛在途徑。臨床療效評價核心指標遴選框架/方法可以從以下三個方面考慮。
3.1 建立中醫臨床療效評價核心指標應用范圍框架
研究者需要進一步完善結局指標研究的方法學,包括結局指標的適用性研究,如不同疾病狀態、人群特征、干預措施、應用場景和報告者所使用的結局指標有哪些特點,可以通過形成中醫臨床療效評價指標應用范圍框架來幫助研究者選擇合適的結局指標;進一步探索辨證論治思想指導下的個體化療效評價指標的特點,如中醫證候的客觀化表現、特殊人群的指標特點等;進一步明確在進行整體療效評價時,哪些類型的結局指標能反映患者的整體變化。圖1為中醫臨床療效評價核心指標應用范圍框架示例,下一步將通過專家咨詢及共識會議完善該框架,為后續研究提供基礎。

3.2 建立中醫臨床療效評價核心指標遴選證據評價框架
由于結局指標的重要性判斷往往以主觀判斷為主,不同研究者的判斷結果有一定差異,甚至在同一疾病的核心指標集研究中,不同團隊推薦的核心指標也不同,這種情況不僅會影響研究者使用核心指標集,也一定程度上造成浪費。此外,選擇不合適的結局指標進行療效評價時,不僅會夸大或縮小干預措施的效應,也可能存在著倫理問題。
因此,若能構建中醫臨床療效評價核心指標遴選證據評價框架,使研究者在遴選結局指標時充分考慮哪些類型的指標需要提供證據(如替代指標和終點事件的關系,終點事件在不同人群中的發生率),證據的來源(如流行病學調查、系統評價、定性研究、觀察性研究、RCT、藥品說明書或專家經驗)以及證據的質量評價工具等,則不僅為核心指標集的研究者提供結局指標重要性判斷的依據,也能幫助臨床研究者選擇其它重要的結局指標進行報告。
3.3 建立中醫臨床療效評價核心指標遴選人文價值評價框架
基于結局指標難以反映人文價值的問題,筆者前期提出在核心指標集研究中應用敘事醫學方法[34],通過充分了解患者的經歷和價值觀來獲得患者對結局指標的看法。通過敘事醫學研究,由醫生和患者共同對結局指標的價值進行定量和定性相結合的多維評價,這可能是彌合循證醫學及中醫人文之間鴻溝的一種手段。圍繞敘事醫學和中醫臨床療效評價體系,國內研究者進行了一些探索性研究,如將循證醫學、敘事醫學與中醫辨證論治相結合,構建醫患共同參與的中醫臨床療效評價體系,提出循證目標成就量表法及醫患共建平行病歷,并應用到相關疾病領域中[25,35]。
在進行核心指標遴選時,結局指標人文價值的分析方法可通過建立人文價值評價框架來實現,可根據評價內容選擇進行定量評價(如采用多準則決策分析模型)或僅進行定性評價。如結局指標的測量是否會增加患者的負擔、結局指標是否是患者關注的指標、結局指標測量的費用如何等方面,使研究者在進行結局指標選擇時,不僅能反映出結局指標的人文特色,也能反映患者的意愿和價值觀。
4 小結
選擇合適的結局指標是對臨床療效進行真實評價的基礎。許多疾病的臨床療效評價指標的數量多達上百個[7,36],因此不僅為臨床研究者選擇結局指標帶來挑戰,也影響核心指標集的研究。核心指標集的構建是由不同利益相關群體達成共識的、應在特定疾病領域所有臨床研究中報告的最小指標集合。目前在核心指標集研究中,研究者僅對結局指標進行匯總和分類,對結局指標重要性的判斷主要依賴于專家的經驗。在結局指標選擇中,患者的價值觀體現得并不明顯,研究者雖然會通過訪談方式獲得患者所關心的結局指標,但這些結局指標如何測量,是否能夠被測量,測量方法能否被患者接受,目前尚不清楚。
筆者認為,合理的中醫臨床療效評價指標遴選方法需要考慮結局指標和疾病狀態匹配、結局指標能體現人文價值、結局指標能反映干預措施的特色、結局指標能體現辨證論治的特點、核心指標應能反映患者的整體情況。針對中醫臨床療效評價指標遴選中存在的問題,筆者提出臨床療效評價核心指標遴選框架/方法,通過建立中醫臨床療效評價核心指標應用范圍框架、證據框架和人文價值評價框架來幫助研究者選擇合適的核心指標,相關研究已獲得國家自然科學基金的支持。
致謝 感謝國家留學基金委對本研究的支持。
中醫藥的核心競爭力在于確切的臨床療效證據。新型冠狀病毒肺炎爆發以來,中醫藥在疾病防治的各個階段發揮了獨特優勢,尤其以清肺排毒湯為代表的“三藥三方”在臨床救治中發揮了重要作用。但中醫藥療效一直備受外界質疑,其原因除缺乏高質量研究證據外,也與現今的療效評價方法與中醫的本體特點(辨證論治及整體觀)不符有關。
研發符合中醫藥本體特點的臨床療效評價創新方法與技術是當前中醫藥發展面臨的重大工程技術難題,也是提高中醫藥核心競爭力和促進中醫藥傳承創新發展的關鍵,其中療效評價指標的遴選是核心環節之一[1]。然而,中醫臨床研究中結局指標選擇存在一些問題,如:同類臨床研究結局指標選擇差異大、終點結局指標報告不足、沒有報告或沒有完整報告主要結局指標、缺少患者報告的結局指標、不良反應/副作用報告不充分、中醫證候指標不足等問題[2]。為此,國內研究者引入核心指標集概念,提出了中醫藥領域核心指標集的研究方法,并在此基礎上提出了中醫核心證候指標集的概念以及構建方法[3,4],已應用于相關疾病領域[5-8]。
在臨床研究中應用核心指標集可以提高同類臨床研究結局指標報告的一致性,使更多研究能進行同類比較,亦有助于發現潛在的選擇性報告偏倚。然而,調查顯示,核心指標集的使用情況普遍偏低,如臨床研究者認為使用核心指標集有諸多限制,而且核心指標集中往往包含太多指標,以及核心指標集可能會增加患者的負擔,或者推薦了過時的指標[9,10]。
出現這些情況的原因與當前核心指標的遴選方法不完善有關。筆者結合多年核心指標集研究經驗,分析了臨床療效評價中核心指標遴選存在的問題,并針對中醫臨床療效評價中結局指標的特點提出相應的解決策略,以為相關研究者提供參考。
1 臨床療效評價核心指標遴選中存在的關鍵問題
1.1 結局指標的適用性研究不足
核心指標集的形成不僅與患者健康狀態和干預措施相關,也與應用場景、選擇的結局指標分類框架、測量的時間點和使用者有關。在核心指標集研究中,其應用場景有臨床研究,也有臨床實踐;研究者選擇的結局指標分類框架既有通用的,如Williamson/Clarke結局框架,也有適用于特定疾病的,如風濕病學結局指標測量核心框架;針對同一疾病的短期研究和長期研究分別構建不同的核心指標集,或在同一核心指標集中體現遠期指標和近期指標的差異;使用者有臨床研究者/系統評價者,也有患者[11-14]。由此可見,同一結局指標并非適用于所有類型的臨床療效評價,有時會導致同一疾病有多個不同的核心指標集。基于這些問題,筆者前期提出將母方案設計方法引入到核心指標集構建中,使核心指標集能適用于不同的情境[15]。但整體而言,結局指標的適用性研究并不充分,一定程度上也會影響研究者選擇合適的核心指標。
1.2 結局指標重要性判斷缺乏證據支持
對于結局指標重要性的判斷,目前使用最多的是推薦、評估、發展和評價的等級(grades of recommendation, assessment, development and evaluation,GRADE)工作組推薦的9分評分法,其中1~3分代表結局指標“不重要”,4~6分代表結局指標“重要但不關鍵”,7~9分代表結局指標“關鍵”。此外,GRADE工作組也推薦了判斷結局指標重要性的三個步驟:初步判斷結局指標重要性、審查系統評價證據后重新判斷結局指標重要性、判斷干預措施的理想效果和不理想效果之間的平衡[16]。
在核心指標集研究中,結局指標重要性的判斷主要來自專家經驗,尚缺少證據支持。如病死率作為終點指標往往被認為是一個關鍵指標,然而,在很多情況下,臨床研究中出現死亡的情形很少[17];此外,替代指標與終點事件的相關性在很多情況下并不清楚,如對于某些生理學指標而言,若缺乏相關臨床流行病學證據證明這些指標的異常與特定人群的死亡相關,可能會出現某種干預措施僅在動物模型中有效,而在人體中無效的情況[18]。
國外有研究者針對RCT中主要結局指標的選擇提出了六項原則:① 干預措施應該能合理地改變主要結局指標;② 主要結局指標對決策者重要;③ 主要結局指標對患者重要;④ 主要結局指標可以被有效地測量;⑤ 主要結局指標可以被可靠地測量;⑥ 如有可能,使用易于理解的連續量表[18]。但應用這些原則在RCT中選擇結局指標時,仍需要有證據支持。
1.3 結局指標的人文價值體現不明顯
結局指標的價值在目前的研究中考慮得較少,大多是在選擇測量工具時,針對測量工具的質量和性能進行推薦。國外“基于共識標準選擇健康測量工具”(consensus-based standards for the selection of health measurement instruments,COSMIN)工作組研發了結局指標測量工具的質量評價工具,被引入到核心指標集研究中[19]。但是在核心指標集研究過程中,不同利益相關群體進行結局指標重要性判斷時很少會考慮結局指標的可測量性及相關測量工具的性能,一般是在核心指標確定后,研究者針對每個結局指標的測量工具進行證據檢索和評價后,推薦高質量的測量工具。有時研究者也會把結局指標和測量工具混淆,如將測量生活質量的量表列入結局指標清單中,對于不了解相關量表性能及質量的專家來說難以進行判斷和選擇。
國內外的研究者早已意識到在結局指標選擇中應注重人文價值,提出患者報告結局的重要性。在核心指標集研究中,有87%的研究納入了患者。隨著研究數量的增多,患者參與核心指標集的問題不再是“是否參與”,而是“如何參與”[20]。但是受多種因素影響,在核心指標集構建中,醫生/研究者在結局指標優先級排序上仍處于主導地位。筆者前期研究亦發現,由于大部分患者不具備醫學知識,不了解疾病的發生、發展和轉歸,對于結局指標的看法,患者的回答往往是“希望把病治好”“不要留下后遺癥”,或者“我不懂這些,就聽醫生安排”等比較籠統和模糊的回答[2]。而患者報告結局的測量方式目前以量表為主,雖然生存質量量表可以一定程度上凸顯中醫藥治療疾病的特色和優勢,但其運用目前僅限于少數慢性疾病,范圍相對局限,且針對性、目的性不強;或由于缺乏高質量量表,對某些疾病而言,可能無法推薦合適的患者報告結局的測量工具[21]。因此,在沒有高質量的測量工具的情況下,也可基于當前證據暫時推薦可行性高、內容效度和內部一致性良好的工具[22]。
整體而言,在結局指標遴選中需進一步反映患者的意愿和價值觀。
2 中醫臨床療效評價核心指標遴選的關鍵問題
中醫學者普遍認為,中醫臨床療效評價核心指標應體現中醫特色[5,23]。然而,前期研究顯示,國內完成的9項中醫藥領域核心指標集中,僅5項研究涉及了能體現中醫特色的證候指標[24]。此外,在中醫臨床療效評價中,核心指標的遴選也應關注以下關鍵問題。
2.1 關注中醫臨床辨證論治個體化指標
目前群體化研究為主導的模式以終點指標和替代指標為主,無法解決中醫辨證論治個體化與標準化之間的矛盾,甚至一些中醫臨床研究的設計中會回避辨證論治特色。
針對這些問題,研究者也進行了一些有益的嘗試,如在單病例隨機對照試驗設計中,通過遴選中醫核心證候指標,采用循證目標成就量表法進行療效評價,凸顯中醫診療的個體化特征[25];借鑒核心指標集理念,結合專家經驗和數學模型,融合大數據分析,在長時程理念下通過優化個體化結局指標體系來構建中醫個體化長時程療效評價方法[26];此外,筆者前期以中醫證候的最小單元—證候要素為基礎,形成了中醫核心證候指標集的構建方法,包含特定疾病核心證候類型,每種證候的核心癥狀,為中醫證候療效的可比性提供基礎,已應用于心血管病領域[3,27]。但整體而言,目前尚缺少合理的、重點突出的、體現中醫個體化特點的指標清單。
2.2 整體/綜合評價時核心指標選擇應反映患者整體狀況
對整體觀指導下的中醫臨床療效進行評價時,評價指標也應能反映患者的整體狀況。當前中醫臨床療效評價或注重客觀指標改善,或注重證候改善,或運用量表評價生活質量,這些方法都具有局部性的特征。如何實現整體性的中醫臨床療效評價,如何構建這些指標之間的關系,用什么樣的方法分析更合理,如何形成中醫整體/綜合療效評價指標,尚需更多的研究提供證據支持[27,28]。
目前國外的整體評價主要集中于量表制定、評估患者整體健康狀況以及衛生技術評估等領域。有研究者開展的臨床研究綜合評價,主要從結局指標的不同維度進行報告,沒有體現療效的整體性[29];近些年國內外研究者關注的多主要終點指標評價法,其方向主要集中于研究設計和統計方法方面,對不同指標的療效評價仍是單獨進行[30]。有中醫研究者認為可以將西醫療效指標、中醫證候指標及生活質量指標共同作為主要終點指標,建立中醫藥整體評價方法[31],目前仍處于探索階段。
對于慢性疾病而言,可能會存在不同維度的指標。每個患者受疾病的影響和對治療的反應可能是不同維度指標的組合,因此將不同維度的指標合并成單個指標可能具有一定意義。國際上風濕病結局指標測量工作組提出了將多維度指標合并成一個指標的方法,為整體評價指標的構建提供了思路[32]。
中醫學者認為,可以利用系統科學的原理和方法進行中醫臨床療效整體評價。從宏觀、中觀、微觀3個層面選取定量或定性參數,形成2X-4Y療效評價體系[33]。其中2X指通用評價參數和專科評價參數相結合,4Y指西醫疾病療效評價,中醫證候療效評價,患者報告結局、醫生報告結局等。這一模式具有中醫原創思維的特點,但在實際操作中會有一定難度,特別是需要明確微觀、中觀、宏觀參數的指標體系以及不同評價參數之間的相關性。
3 解決中醫臨床療效評價核心指標遴選問題的途徑
構建中醫臨床療效評價核心指標遴選框架/方法是有效解決中醫臨床療效評價核心指標遴選問題的潛在途徑。臨床療效評價核心指標遴選框架/方法可以從以下三個方面考慮。
3.1 建立中醫臨床療效評價核心指標應用范圍框架
研究者需要進一步完善結局指標研究的方法學,包括結局指標的適用性研究,如不同疾病狀態、人群特征、干預措施、應用場景和報告者所使用的結局指標有哪些特點,可以通過形成中醫臨床療效評價指標應用范圍框架來幫助研究者選擇合適的結局指標;進一步探索辨證論治思想指導下的個體化療效評價指標的特點,如中醫證候的客觀化表現、特殊人群的指標特點等;進一步明確在進行整體療效評價時,哪些類型的結局指標能反映患者的整體變化。圖1為中醫臨床療效評價核心指標應用范圍框架示例,下一步將通過專家咨詢及共識會議完善該框架,為后續研究提供基礎。

3.2 建立中醫臨床療效評價核心指標遴選證據評價框架
由于結局指標的重要性判斷往往以主觀判斷為主,不同研究者的判斷結果有一定差異,甚至在同一疾病的核心指標集研究中,不同團隊推薦的核心指標也不同,這種情況不僅會影響研究者使用核心指標集,也一定程度上造成浪費。此外,選擇不合適的結局指標進行療效評價時,不僅會夸大或縮小干預措施的效應,也可能存在著倫理問題。
因此,若能構建中醫臨床療效評價核心指標遴選證據評價框架,使研究者在遴選結局指標時充分考慮哪些類型的指標需要提供證據(如替代指標和終點事件的關系,終點事件在不同人群中的發生率),證據的來源(如流行病學調查、系統評價、定性研究、觀察性研究、RCT、藥品說明書或專家經驗)以及證據的質量評價工具等,則不僅為核心指標集的研究者提供結局指標重要性判斷的依據,也能幫助臨床研究者選擇其它重要的結局指標進行報告。
3.3 建立中醫臨床療效評價核心指標遴選人文價值評價框架
基于結局指標難以反映人文價值的問題,筆者前期提出在核心指標集研究中應用敘事醫學方法[34],通過充分了解患者的經歷和價值觀來獲得患者對結局指標的看法。通過敘事醫學研究,由醫生和患者共同對結局指標的價值進行定量和定性相結合的多維評價,這可能是彌合循證醫學及中醫人文之間鴻溝的一種手段。圍繞敘事醫學和中醫臨床療效評價體系,國內研究者進行了一些探索性研究,如將循證醫學、敘事醫學與中醫辨證論治相結合,構建醫患共同參與的中醫臨床療效評價體系,提出循證目標成就量表法及醫患共建平行病歷,并應用到相關疾病領域中[25,35]。
在進行核心指標遴選時,結局指標人文價值的分析方法可通過建立人文價值評價框架來實現,可根據評價內容選擇進行定量評價(如采用多準則決策分析模型)或僅進行定性評價。如結局指標的測量是否會增加患者的負擔、結局指標是否是患者關注的指標、結局指標測量的費用如何等方面,使研究者在進行結局指標選擇時,不僅能反映出結局指標的人文特色,也能反映患者的意愿和價值觀。
4 小結
選擇合適的結局指標是對臨床療效進行真實評價的基礎。許多疾病的臨床療效評價指標的數量多達上百個[7,36],因此不僅為臨床研究者選擇結局指標帶來挑戰,也影響核心指標集的研究。核心指標集的構建是由不同利益相關群體達成共識的、應在特定疾病領域所有臨床研究中報告的最小指標集合。目前在核心指標集研究中,研究者僅對結局指標進行匯總和分類,對結局指標重要性的判斷主要依賴于專家的經驗。在結局指標選擇中,患者的價值觀體現得并不明顯,研究者雖然會通過訪談方式獲得患者所關心的結局指標,但這些結局指標如何測量,是否能夠被測量,測量方法能否被患者接受,目前尚不清楚。
筆者認為,合理的中醫臨床療效評價指標遴選方法需要考慮結局指標和疾病狀態匹配、結局指標能體現人文價值、結局指標能反映干預措施的特色、結局指標能體現辨證論治的特點、核心指標應能反映患者的整體情況。針對中醫臨床療效評價指標遴選中存在的問題,筆者提出臨床療效評價核心指標遴選框架/方法,通過建立中醫臨床療效評價核心指標應用范圍框架、證據框架和人文價值評價框架來幫助研究者選擇合適的核心指標,相關研究已獲得國家自然科學基金的支持。
致謝 感謝國家留學基金委對本研究的支持。