為了在臨床試驗中充分考慮患者相關因素,美國食品和藥品監督管理局制定了一系列“以患者為中心的藥物研發”的指導原則。本文圍繞指導原則3“選擇與研發合適的臨床結局評估”,對臨床結局評估的內涵、研制流程、評分機制、干擾因素及敏感性五個方面進行概述,并介紹四種常見類型的臨床結局評估,為以患者為中心的臨床試驗結局評價工作實施提供參考。
引用本文: 張晨瑤, 吳曉蕾, 史夢龍, 馬毓聰, 龐穩泰, 杜亮, 劉炳林, 曹璐佳, 張俊華. “以患者為中心”臨床結局評估的選擇與開發. 中國循證醫學雜志, 2024, 24(4): 472-477. doi: 10.7507/1672-2531.202307067 復制
版權信息: ?四川大學華西醫院華西期刊社《中國循證醫學雜志》版權所有,未經授權不得轉載、改編
以患者為中心的藥物研發(patient-focused drug development,PFDD)是指通過多渠道全面收集患者的訴求和建議,并將收集的信息進行規范化處理后納入藥物研發全過程,有助于確保患者的體驗、觀點、需求和優先事項被納入藥物研發和評估中[1]。患者是藥物的使用者,也是藥物價值的判斷者,對藥物的開發和評價至關重要,因此,有必要提高患者在醫療產品開發和監管決策制定過程中的話語權。美國食品和藥品監督管理局(US Food and Drug Administration,FDA)在2012年正式提出“以患者為中心的藥物研發”[2],并于2020年6月至2023年4月間發布了4部系列指導文件[3]。指導原則1討論了如何收集綜合而有代表性的信息,介紹了患者體驗數據及收集時的注意事項[4]。指導原則2從方法學角度討論了如何收集對患者有重要意義的信息[5];指導原則3討論了如何選擇、開發或完善適用于研發目標的臨床結局評估(clinical outcome assessments,COA)[6]。指導原則4將臨床療效評價納入監管決策的終點指標中,并討論可用于收集、獲取、存儲和分析臨床療效指標評價數據的方法、標準和技術[7]。其中指導原則3與指導原則4雖已發布,但仍處于草稿階段,后續可能會有所完善。本文對指導原則3進行介紹,以期為COA相關研究工作的開展提供方法學參考。
1 COA相關概念
1.1 COA概念
PFDD相關研究的一個核心問題是對患者重要的臨床指標的測評,因此需要開發對患者重要的COA。作為FDA認證的醫療器械開發工具[8],COA通過患者(及表現)、臨床醫生、觀察者的報告來反映患者的感受、功能或生存狀況,從而體現藥物干預的效應、變化及臨床價值。COA通過標準化過程生成的數值或評級值即為COA分數,用以反映醫療產品的獲益及風險。
1.2 收益概念(concept of interest,COI)
COI指COA所要評價的患者個人體驗或臨床、生理、功能狀態,能夠反映出患者認為重要的健康因素。COI可隨著干預而變化,且能夠在試驗期內驗證組間差異是否具有臨床意義。一般來說,醫療產品對健康可能產生的積極或消極影響都屬于COI的范疇。
1.3 應用場景(context of use,COU)
COU指該COA用于評價的患者疾病狀況。選擇COU時需考慮:① 臨床試驗目的及基于COA得出終點指標的依據;② 目標人群;③ 臨床試驗設計,包括對照組的類型及是否采用盲法;④ 評價COA的時間;⑤ COA的采集地點、采集方式及采集對象等。
例如,在一個評估非小細胞肺癌癥狀的COA中,采用患者報告結局(patient-reported outcome,PRO)這一類型來收集患者數據,COI包括咳嗽、呼吸困難、疲憊、疼痛及食欲五個方面,COU則是指18歲及18歲以上被診斷為ⅢB期或Ⅳ期非小細胞肺癌并正在接受治療的患者[8]。
2 COA的類型
臨床常用的COA共有四種類型,研究者可根據COI、COU及實際需求選擇一種或多種COA。所選的COA應能夠反映COI的所有重要內容,包括COI的具體屬性,從而全面評價COI。表1所示為四種類型的COA,包括PRO、觀察者報告結局(observer-reported outcome,ObsRO)、臨床醫生報告結局(clinician-reported outcome,ClinRO)及功能結局(performance outcome,PerfO)。

3 COA研制的一般流程
COA的選擇、修改或研制過程,主要包括3個部分:① 了解疾病或病癥情況;② 明確臨床獲益和臨床風險;③ 選擇/研制COA(圖1)。

3.1 了解疾病/病癥情況
了解的內容包括:① 疾病或病癥的表現和自然史;② 根據疾病的嚴重程度、并發癥等劃分的患者亞群;③ 患者的診療環境;④ 患者和/或護理人員對疾病的認識;⑤ 患者的治療需求和優先事項。據此能夠了解該疾病可能導致的患者癥狀及其影響。
3.2 明確臨床獲益和臨床風險
這一步驟主要考慮醫療產品將從哪些方面改善患者體驗和/或其治療效果。有助于明確COI和COU,包括利益相關群體、臨床試驗設計、研究目標和終點。對于較復雜的健康因素,可能需要制定一個概念模型,從而支持路線圖的前兩個步驟。
3.3 選擇/研制COA
在選定合適的COA類型后,需對已有COA進行評價。首先在美國藥品評審中心與美國生物制品中心藥物開發工具檢索網站對現有COA進行檢索,該網站收錄了所有已提交至FDA的COA,并根據疾病名稱、療法、COA的認證狀態、FDA審核狀態及日期等對其進行分類,可能出現3種情況(表2)。

在研制新的COA時,一般需要:① 記錄開發過程中的所有步驟和收集的數據;② 提供證據證明COA分數與對COU中COI的評價相對應;③ 評價擬定的COA可能存在的局限性;④ 建立COA用戶手冊并提供培訓材料,從而保障操作;⑤ 明確COA的評分方法,包括處理缺失數據的方法。
一般不建議在同一個試驗中為不同年齡組患者選擇不同版本的COA,因為這可能會帶來不必要的測量誤差。在選擇、開發兒科人群COA時,建議對所有年齡段的患者采用簡化版COA。當兒童可自我管理時,COA應由兒童獨立完成。由于幼兒理解能力有限,應考慮對幼兒使用簡化的適齡反應量表。此外,還可以用數字健康技術來收集COA數據。對于殘障人士則需考慮COA的無障礙和通用設計。
3.4 構建概念框架
概念框架由概念模型和測量模型兩部分組成,概念模型用于展示患者體驗與COI的關系,測量模型展示COA的評分機制。概念框架用于展示臨床試驗中選擇COA的路線圖的每一步結果,有助于審查COA的開發流程。概念框架總結了:① 目標群體中患者的相關體驗;② 將要評價的COI;③ 擬定的COA類型;④ COA的評分機制。通過概念框架能夠明確COA如何反映COI的所有重要內容。圖2是一項非小細胞肺癌PRO的概念框架舉例,涵蓋咳嗽、疼痛、呼吸困難、疲倦及食欲5個COI,共包括7個條目,這5個COI是評估治療非小細胞肺癌療效的關鍵[9]。

3.5 確定COA評價效力的強弱
COA評價效力的強弱是由“COA分數反映COU下COI的能力”決定的,COA分數反映COI的能力越佳,則該COA的評價效力越強。在驗證COA的評價效力時,需考慮:① COI和COU;② 有充分證據闡釋選用某種COA的理由。有些COA評價的是與患者的具體健康體驗直接對應的COI,有些則可能會評價與其間接相關的COI。當COA分數與重要的健康要素之間的關系相對間接且不確定性較強時,可以通過明確COA分數與其他變量之間的關系來尋求額外證據,其他變量與患者體驗的關系應更加直接,從而驗證COA的評價效力。此外,還應明確COA分數反映的內容以及分數差異的大小與患者體驗的聯系,從而為決策者提供參考。
4 COA的評分機制
COA通常是評價量表的呈現形式,且每個COA都有特定方式來記錄受訪者的應答。
4.1 受訪者對單個條目的應答
對于單個條目,應答選項不應重疊,不同的應答選項應能夠真正反映出COI之間的差異,且措辭清晰易懂。
4.2 受訪者對多個條目的應答
如果一個COA分數是通過整合受訪者對多個條目的應答而產生,則需對該評分方式的基本原理進行闡述。將對多個條目/任務的反應結合起來的方法通常表示為一種測量模型,該模型可以將受訪者的應答與反映COI的COA分數聯系起來,測量模型的類型決定了條目組合的方式。常見的測量模型是反射指標模型和復合指標模型。
4.2.1 反射指標模型
如患者所有的應答都在反映患者對單一方面的COI時,被稱為一維假設,此時可將患者對多個條目的應答合并為一個反射指標。例如,一個PRO可能包括多個詢問下肢相關活動能力的條目。這些條目都是下肢相關活動能力的反映或影響,所以條目應該與一維測量模型相一致(圖3a)。
4.2.2 復合指標模型
采用多個條目組合在一起來明確并評價一個COI,稱為復合指標模型(圖3b),它不像反射指標模型那樣假設所有條目都僅反映同一方面。例如,“日常生活基本活動”這一概念可以定義為患者能夠獨立完成生活所必需的日常任務的程度。日常任務可以通過與患者及其照護人員的共識確定,具體涉及個人衛生、穿衣、如廁、飲食和步行等項目。對于基于復合指標模型的COA,申請者應說明選擇構成該評價條目的過程,以及如何將對多個條目的應答結合起來,從而得出COA的分數。
4.3 基于計算機自適應測試的評分方法
利用計算機自適應測試(computerized adaptive testing,CAT)程序,基于受訪者對先前條目的反應,估計其后續反應。只需較少的條目就能得到每個患者相對精確的評分,評價效率更高。
4.4 處理缺失數據的方法
缺失條目應答會給涉及多個條目的COA分數造成混亂。評分算法應明確說明在存在缺失條目應答的情況下如何計算分數。
5 COA分數的干擾因素
在良好設計的COA中,影響患者對COA應答的主要是COI。申請者或COA開發者應考慮最有可能的干擾因素,并評估其干擾程度。干擾因素可能來自:① 受訪者的人口學特征(性別、年齡和教育水平等)或文化、語言背景;② 受訪者的記憶偏差;③ 受訪者的疲勞狀態;④ 評價方式;⑤ 預期偏差;⑥ PerfO的實踐效應,由于PerfO是基于患者在標準化任務中的表現進行評分,患者表現會隨著時間推移,在多次實踐中有所提高,但這是由于對任務逐漸熟悉,而非癥狀和功能的改善。
6 COA分數的敏感性
COA分數需要足夠敏感,以反映出在COU下患者的COI隨著時間推移發生的變化。COA的敏感性可能因目標人群而異。要驗證COA分數測量患者臨床變化的敏感性,一般有以下兩種方法。
6.1 評價COA分數反映臨床變化的能力
檢驗某COA與其他COA(評價相同或相似COI的COA)之間分數變化間的關系時,應預設其發生變化的原因相同(例如,兩個COA可能都是由于疾病進展導致COA分數的提高/降低),并對二者分數變化的方向和幅度做出明確假設。當二者的變化密切相關時,COA分數反映臨床變化的可信度就會增加。
6.2 評價COA分數的可靠性
在獲得COA反映變化能力的直接證據之前,申請者可先評價COA的信度,包括重測信度、評分者信度及評估相關任務間的分數差異。在評價COA信度時,COA分數的一致性與COA類型之間存在潛在關聯性。
7 小結
指導原則1介紹了收集患者體驗數據的注意事項,指導原則2介紹了收集對患者有重要意義信息的方法,指導原則3承上啟下,介紹了在收集以上信息后針對性開發COA的流程,指導原則4討論了如何將COA評分納入監管決策的終點指標中。這一系列指導原則能夠幫助開發者收集、整理有助于制定監管決策的患者體驗信息,從而為患者提供更好的療效。本文結合指導原則3,重點介紹了COA研制的要點和評分機制。在明確疾病類型和COI的基礎上,需要明確COA類型,并構建概念模型和測量模型。COA可采用現有的指標,或基于現有指標進行優化,或基于COU和COI研制新的指標。改造指標或開發指標及測量工具,要遵循量表制定基本原理,從靈敏度、特異度、信度、效度等方面進行評估。COA的選擇與開發是一個系統工程,需要多學科的協作。如何把患者訴求轉化為可科學度量的評價指標,需要選擇或開發適合的結局評價工具。目前“以患者為中心”的相關研究仍在發展階段,相關技術方法需要進一步發展完善,以更好地服務于新藥研發。
以患者為中心的藥物研發(patient-focused drug development,PFDD)是指通過多渠道全面收集患者的訴求和建議,并將收集的信息進行規范化處理后納入藥物研發全過程,有助于確保患者的體驗、觀點、需求和優先事項被納入藥物研發和評估中[1]。患者是藥物的使用者,也是藥物價值的判斷者,對藥物的開發和評價至關重要,因此,有必要提高患者在醫療產品開發和監管決策制定過程中的話語權。美國食品和藥品監督管理局(US Food and Drug Administration,FDA)在2012年正式提出“以患者為中心的藥物研發”[2],并于2020年6月至2023年4月間發布了4部系列指導文件[3]。指導原則1討論了如何收集綜合而有代表性的信息,介紹了患者體驗數據及收集時的注意事項[4]。指導原則2從方法學角度討論了如何收集對患者有重要意義的信息[5];指導原則3討論了如何選擇、開發或完善適用于研發目標的臨床結局評估(clinical outcome assessments,COA)[6]。指導原則4將臨床療效評價納入監管決策的終點指標中,并討論可用于收集、獲取、存儲和分析臨床療效指標評價數據的方法、標準和技術[7]。其中指導原則3與指導原則4雖已發布,但仍處于草稿階段,后續可能會有所完善。本文對指導原則3進行介紹,以期為COA相關研究工作的開展提供方法學參考。
1 COA相關概念
1.1 COA概念
PFDD相關研究的一個核心問題是對患者重要的臨床指標的測評,因此需要開發對患者重要的COA。作為FDA認證的醫療器械開發工具[8],COA通過患者(及表現)、臨床醫生、觀察者的報告來反映患者的感受、功能或生存狀況,從而體現藥物干預的效應、變化及臨床價值。COA通過標準化過程生成的數值或評級值即為COA分數,用以反映醫療產品的獲益及風險。
1.2 收益概念(concept of interest,COI)
COI指COA所要評價的患者個人體驗或臨床、生理、功能狀態,能夠反映出患者認為重要的健康因素。COI可隨著干預而變化,且能夠在試驗期內驗證組間差異是否具有臨床意義。一般來說,醫療產品對健康可能產生的積極或消極影響都屬于COI的范疇。
1.3 應用場景(context of use,COU)
COU指該COA用于評價的患者疾病狀況。選擇COU時需考慮:① 臨床試驗目的及基于COA得出終點指標的依據;② 目標人群;③ 臨床試驗設計,包括對照組的類型及是否采用盲法;④ 評價COA的時間;⑤ COA的采集地點、采集方式及采集對象等。
例如,在一個評估非小細胞肺癌癥狀的COA中,采用患者報告結局(patient-reported outcome,PRO)這一類型來收集患者數據,COI包括咳嗽、呼吸困難、疲憊、疼痛及食欲五個方面,COU則是指18歲及18歲以上被診斷為ⅢB期或Ⅳ期非小細胞肺癌并正在接受治療的患者[8]。
2 COA的類型
臨床常用的COA共有四種類型,研究者可根據COI、COU及實際需求選擇一種或多種COA。所選的COA應能夠反映COI的所有重要內容,包括COI的具體屬性,從而全面評價COI。表1所示為四種類型的COA,包括PRO、觀察者報告結局(observer-reported outcome,ObsRO)、臨床醫生報告結局(clinician-reported outcome,ClinRO)及功能結局(performance outcome,PerfO)。

3 COA研制的一般流程
COA的選擇、修改或研制過程,主要包括3個部分:① 了解疾病或病癥情況;② 明確臨床獲益和臨床風險;③ 選擇/研制COA(圖1)。

3.1 了解疾病/病癥情況
了解的內容包括:① 疾病或病癥的表現和自然史;② 根據疾病的嚴重程度、并發癥等劃分的患者亞群;③ 患者的診療環境;④ 患者和/或護理人員對疾病的認識;⑤ 患者的治療需求和優先事項。據此能夠了解該疾病可能導致的患者癥狀及其影響。
3.2 明確臨床獲益和臨床風險
這一步驟主要考慮醫療產品將從哪些方面改善患者體驗和/或其治療效果。有助于明確COI和COU,包括利益相關群體、臨床試驗設計、研究目標和終點。對于較復雜的健康因素,可能需要制定一個概念模型,從而支持路線圖的前兩個步驟。
3.3 選擇/研制COA
在選定合適的COA類型后,需對已有COA進行評價。首先在美國藥品評審中心與美國生物制品中心藥物開發工具檢索網站對現有COA進行檢索,該網站收錄了所有已提交至FDA的COA,并根據疾病名稱、療法、COA的認證狀態、FDA審核狀態及日期等對其進行分類,可能出現3種情況(表2)。

在研制新的COA時,一般需要:① 記錄開發過程中的所有步驟和收集的數據;② 提供證據證明COA分數與對COU中COI的評價相對應;③ 評價擬定的COA可能存在的局限性;④ 建立COA用戶手冊并提供培訓材料,從而保障操作;⑤ 明確COA的評分方法,包括處理缺失數據的方法。
一般不建議在同一個試驗中為不同年齡組患者選擇不同版本的COA,因為這可能會帶來不必要的測量誤差。在選擇、開發兒科人群COA時,建議對所有年齡段的患者采用簡化版COA。當兒童可自我管理時,COA應由兒童獨立完成。由于幼兒理解能力有限,應考慮對幼兒使用簡化的適齡反應量表。此外,還可以用數字健康技術來收集COA數據。對于殘障人士則需考慮COA的無障礙和通用設計。
3.4 構建概念框架
概念框架由概念模型和測量模型兩部分組成,概念模型用于展示患者體驗與COI的關系,測量模型展示COA的評分機制。概念框架用于展示臨床試驗中選擇COA的路線圖的每一步結果,有助于審查COA的開發流程。概念框架總結了:① 目標群體中患者的相關體驗;② 將要評價的COI;③ 擬定的COA類型;④ COA的評分機制。通過概念框架能夠明確COA如何反映COI的所有重要內容。圖2是一項非小細胞肺癌PRO的概念框架舉例,涵蓋咳嗽、疼痛、呼吸困難、疲倦及食欲5個COI,共包括7個條目,這5個COI是評估治療非小細胞肺癌療效的關鍵[9]。

3.5 確定COA評價效力的強弱
COA評價效力的強弱是由“COA分數反映COU下COI的能力”決定的,COA分數反映COI的能力越佳,則該COA的評價效力越強。在驗證COA的評價效力時,需考慮:① COI和COU;② 有充分證據闡釋選用某種COA的理由。有些COA評價的是與患者的具體健康體驗直接對應的COI,有些則可能會評價與其間接相關的COI。當COA分數與重要的健康要素之間的關系相對間接且不確定性較強時,可以通過明確COA分數與其他變量之間的關系來尋求額外證據,其他變量與患者體驗的關系應更加直接,從而驗證COA的評價效力。此外,還應明確COA分數反映的內容以及分數差異的大小與患者體驗的聯系,從而為決策者提供參考。
4 COA的評分機制
COA通常是評價量表的呈現形式,且每個COA都有特定方式來記錄受訪者的應答。
4.1 受訪者對單個條目的應答
對于單個條目,應答選項不應重疊,不同的應答選項應能夠真正反映出COI之間的差異,且措辭清晰易懂。
4.2 受訪者對多個條目的應答
如果一個COA分數是通過整合受訪者對多個條目的應答而產生,則需對該評分方式的基本原理進行闡述。將對多個條目/任務的反應結合起來的方法通常表示為一種測量模型,該模型可以將受訪者的應答與反映COI的COA分數聯系起來,測量模型的類型決定了條目組合的方式。常見的測量模型是反射指標模型和復合指標模型。
4.2.1 反射指標模型
如患者所有的應答都在反映患者對單一方面的COI時,被稱為一維假設,此時可將患者對多個條目的應答合并為一個反射指標。例如,一個PRO可能包括多個詢問下肢相關活動能力的條目。這些條目都是下肢相關活動能力的反映或影響,所以條目應該與一維測量模型相一致(圖3a)。
4.2.2 復合指標模型
采用多個條目組合在一起來明確并評價一個COI,稱為復合指標模型(圖3b),它不像反射指標模型那樣假設所有條目都僅反映同一方面。例如,“日常生活基本活動”這一概念可以定義為患者能夠獨立完成生活所必需的日常任務的程度。日常任務可以通過與患者及其照護人員的共識確定,具體涉及個人衛生、穿衣、如廁、飲食和步行等項目。對于基于復合指標模型的COA,申請者應說明選擇構成該評價條目的過程,以及如何將對多個條目的應答結合起來,從而得出COA的分數。
4.3 基于計算機自適應測試的評分方法
利用計算機自適應測試(computerized adaptive testing,CAT)程序,基于受訪者對先前條目的反應,估計其后續反應。只需較少的條目就能得到每個患者相對精確的評分,評價效率更高。
4.4 處理缺失數據的方法
缺失條目應答會給涉及多個條目的COA分數造成混亂。評分算法應明確說明在存在缺失條目應答的情況下如何計算分數。
5 COA分數的干擾因素
在良好設計的COA中,影響患者對COA應答的主要是COI。申請者或COA開發者應考慮最有可能的干擾因素,并評估其干擾程度。干擾因素可能來自:① 受訪者的人口學特征(性別、年齡和教育水平等)或文化、語言背景;② 受訪者的記憶偏差;③ 受訪者的疲勞狀態;④ 評價方式;⑤ 預期偏差;⑥ PerfO的實踐效應,由于PerfO是基于患者在標準化任務中的表現進行評分,患者表現會隨著時間推移,在多次實踐中有所提高,但這是由于對任務逐漸熟悉,而非癥狀和功能的改善。
6 COA分數的敏感性
COA分數需要足夠敏感,以反映出在COU下患者的COI隨著時間推移發生的變化。COA的敏感性可能因目標人群而異。要驗證COA分數測量患者臨床變化的敏感性,一般有以下兩種方法。
6.1 評價COA分數反映臨床變化的能力
檢驗某COA與其他COA(評價相同或相似COI的COA)之間分數變化間的關系時,應預設其發生變化的原因相同(例如,兩個COA可能都是由于疾病進展導致COA分數的提高/降低),并對二者分數變化的方向和幅度做出明確假設。當二者的變化密切相關時,COA分數反映臨床變化的可信度就會增加。
6.2 評價COA分數的可靠性
在獲得COA反映變化能力的直接證據之前,申請者可先評價COA的信度,包括重測信度、評分者信度及評估相關任務間的分數差異。在評價COA信度時,COA分數的一致性與COA類型之間存在潛在關聯性。
7 小結
指導原則1介紹了收集患者體驗數據的注意事項,指導原則2介紹了收集對患者有重要意義信息的方法,指導原則3承上啟下,介紹了在收集以上信息后針對性開發COA的流程,指導原則4討論了如何將COA評分納入監管決策的終點指標中。這一系列指導原則能夠幫助開發者收集、整理有助于制定監管決策的患者體驗信息,從而為患者提供更好的療效。本文結合指導原則3,重點介紹了COA研制的要點和評分機制。在明確疾病類型和COI的基礎上,需要明確COA類型,并構建概念模型和測量模型。COA可采用現有的指標,或基于現有指標進行優化,或基于COU和COI研制新的指標。改造指標或開發指標及測量工具,要遵循量表制定基本原理,從靈敏度、特異度、信度、效度等方面進行評估。COA的選擇與開發是一個系統工程,需要多學科的協作。如何把患者訴求轉化為可科學度量的評價指標,需要選擇或開發適合的結局評價工具。目前“以患者為中心”的相關研究仍在發展階段,相關技術方法需要進一步發展完善,以更好地服務于新藥研發。