引用本文: 楊夢婷, 姬小芮, 顏唯祎, 張書雅, 鄒錕, 萬朝敏, 賈知軍, 成果, 曾力楠, 張伶俐. 兒童藥物治療滿意度研究的系統評價. 中國循證醫學雜志, 2024, 24(2): 183-191. doi: 10.7507/1672-2531.202305134 復制
版權信息: ?四川大學華西醫院華西期刊社《中國循證醫學雜志》版權所有,未經授權不得轉載、改編
患者藥物治療滿意度(treatment satisfaction of medication,TS-M)是指患者對服藥過程和與藥物治療相關結果的滿意程度[1]。TS-M作為患者報告結局指標(patient-reported outcomes,PROs)中一個子類,能夠從患者的角度為臨床研究和實踐提供關于疾病活動和治療效果更加全面的信息[2-6],能夠預示患者對藥物使用的正確性及藥物治療的依從性和持續性,也能夠影響治療結果,對于藥物評價和遴選具有重要意義[7-10]。
近年來,越來越多兒童藥物研究將患者TS-M作為結局指標評價干預措施的效能[11-15],但用于評價兒科患者TS-M的工具數量較少,且尚無采用系統評價的方法評價國內外兒童TS-M研究及測評工具的研究報道。因此,本研究系統評價涉及兒童TS-M測評工具的研究,了解現有的兒童TS-M工具,并評估其質量,以期為臨床研究中合理選擇兒童TS-M量表提供參考,也為中國兒科患者TS-M量表的研制提供借鑒。
1 資料與方法
1.1 納入與排除標準
1.1.1 納入標準
① 納入對象:接受藥物治療的18歲以下兒童;② 研究內容:涉及患者TS-M測評;③ 研究類型:不限。
1.1.2 排除標準
① 重復發表的文獻;② 非中、英文文獻;③ 綜述、系統評價及其他二次研究;④ 無法提取患者TS-M測評工具相關信息的文獻。
1.2 文獻檢索策略
計算機檢索PubMed、Embase、Cochrane Library、CBM、WanFang Data、VIP和CNKI數據庫及醫學量表網站(ePROVIDE、常笑醫學網),搜集有關兒童TS-M測評工具的相關研究,檢索時限均為建庫至2022年11月。檢索采用主題詞和自由詞相結合的方式進行,并根據各數據庫特點進行調整。同時追溯納入研究的參考文獻,以補充獲取相關資料。中文檢索詞包括:藥物、患者滿意度、治療滿意度、兒童或青少年或父母等;英文檢索詞包括:medication、patient satisfaction、treatment satisfaction、pediatric、child、adolescent、parent等。
1.3 文獻篩選與資料提取
由2名研究者獨立篩選文獻、提取資料并交叉核對。如遇分歧,則通過討論或與第三方協商解決。文獻篩選時首先閱讀文題,在排除明顯不相關的文獻后,進一步閱讀摘要和全文以確定是否納入。如有需要,通過郵件、電話聯系原始研究作者獲取未確定但對本研究非常重要的信息。資料提取內容包括:① 研究相關信息:研究題目、第一作者、發表年份、研究類型、國家、研究人群、使用的測評TS-M工具等;② 量表相關信息:研制國家、量表類型、量表適用范圍、量表維度及條目、語言版本等。
1.4 納入研究的特征分析
描述性分析兒科患者TS-M相關研究的研究人群、測評方法等。在醫學領域,PROs測評(patient-reported outcome measures,PROMs)使用的工具類型主要包括量表、單個條目、訪談和日記等[16,17]。量表一詞在使用上有時被稱為測評工具、問卷或調查表[18]。根據評定對象的不同,量表可分為普適性和特異性量表,后者可為疾病特異性或藥物特異性量表等。根據是否經過嚴格的方法學驗證,量表可分為經驗證開發的工具和未經驗證的工具 [19]。
針對納入的TS-M測評工具應用研究,我們將根據測評工具的命名和相關描述以及進一步工具相關文獻補充檢索,由2名研究員獨立判斷所使用的測評工具類型。例如研究員會判斷該研究是使用了未經驗證的自制調查問卷還是經研究驗證開發使用的測評量表。后者的判斷將基于該工具是否有已發表的開發或驗證研究文獻。如遇分歧,則通過小組討論解決。
1.5 納入量表的描述性分析和質量評價
描述性分析納入兒童TS-M量表的基本信息、方法學質量。由2名研究者分別根據COSMIN PROs測量系統評價指南[20],采用COSMIN偏倚風險評價清單[21]、更新版良好測量屬性標準[20-23]獨立評價兒童TS-M量表開發質量和測量性能,采用COSMIN指南修訂版推薦分級的評價、制定與評估(modified grades of recommendations assessment, development and evaluation,GRADE)[24]評級證據質量,并交叉核對結果。如遇分歧,則通過小組討論解決。根據COSMIN偏倚風險評價清單,研究員將單個研究方法學質量評價為以下4個等級之一:非常好、合格、有問題或不合格。隨后,研究員基于COSMIN更新版良好測量屬性標準評價量表的5種測量性能,包括內容效度、結構效度、內部一致性、重測信度和建構效度。評價等級包括:足夠(+)、不足夠(?)、不確定(?)、不一致(±)。最后,采用COSMIN指南中修訂的GRADE方法來評價量表開發和驗證的總體證據質量,分為高、中、低和非常低4個等級。
2 結果
2.1 文獻篩選流程及結果
初檢共獲得文獻6 016篇,包括PubMed(n=3 279)、Embase(n=1 692)、Cochrane Library(n=521)、CNKI(n=240)、VIP(n=113)、WanFang Data(n=96)、CBM(n=57)和醫學量表網站(n=18)。經逐層篩選后,最終納入157個研究,包括TS-M測評工具的應用研究150篇,兒童TS-M量表開發及驗證研究7篇[25-31]。
2.2 兒童研究中選用的TS-M測評工具
150項TS-M測評工具應用研究中101項研究對象為兒童,49項研究對象為兒童及成人。共涉及五大洲42個國家,其中在中國開展的研究有26項(17.3%)。根據國際疾病分類(ICD-11)[32],涉及疾病12大類。研究的基本特征見表1。

150篇文獻涉及的TS-M測評工具包括兩大類:經驗證開發的工具和未經驗證的工具[33]。本研究納入的150項研究中,101項研究(67.3%)使用未經驗證的自制TS-M問卷或訪談,37項研究(24.7%)使用經驗證開發的成人TS-M量表,3項研究(2.0%)[34-36]使用經驗證開發兒童及成人患者均可使用的量表,9項研究(6.0%)[15,37-44]使用針對兒童開發驗證的TS-M量表。自制問卷或訪談常采用Likert法對患兒或家長就藥物治療的滿意度進行調查[45]。37項研究涉及13個適用于成人患者的TS-M量表,包括適用于成人各種疾病的藥物治療滿意度量表(treatment satisfaction questionnaire for medication,TSQM)[46-48],適用于成人特定疾病,如糖尿病治療滿意度量表(diabetes treatment satisfaction questionnaire,DTSQ)[49]、胰島素治療滿意度量表(insulin treatment satisfaction questionnaire,ITSQ)[50]、血友病特異性治療滿意度問卷(haemophilia-specific treatment satisfaction questionnaire,Hemo-SatP)[51]等。
12項兒童研究使用3種適用于兒童的TS-M量表[15,34-44],其中糖尿病DTSQ-Teen和DTSQ-Parent量表在現有研究中被使用的頻率最高[4.7%(7/150)],其次為適用于接受鐵螯合劑治療患者的SICT量表[2.0%(3/150)]和適用于注意力缺陷多動障礙患兒及家長的SAMS量表[1.3%(2/150)]。
2.3 評價結果
2.3.1 量表的基本信息
共納入2個適用于兒童患者[25,26]和5個適用于兒童及成人患者的TS-M量表[27-31],7個量表均為測評某種疾病或藥物TS-M的特異性量表。2009年,英國學者在成人DTSQ[49]基礎上研制了青少年版(DTSQ-Teen)、家長版(DTSQ-Parent)[25]及住院患者版(DTSQ-IP)[27]量表,分別適用于12~18歲兒童、≤11歲兒童的家長及≥16歲兒童及成人糖尿病住院患者。2011年德國學者又針對注意力缺陷多動障礙患兒研制了TS-M量表(satisfaction with medication scale,SAMS),同樣包括患者自我報告版(SAMS-S)和家長替代報告版(SAMS-P),分別適用于12~18歲兒童和6~11歲兒童的家長[26]。目前DTSQ-Teen、DTSQ-Parent及SAMS均尚未被翻譯和修訂為中文版。其余4個兒童及成人TS-M量表SWAM Scale?[28]、SICT[29]、ICT-Sat[30]及SQ-ISHI[31]分別適用于雙相情感障礙或精神分裂癥、接受鐵螯合劑治療以及A型血友病患者。7個量表的基本特征見表2。

2.3.2 量表開發研究的方法學質量評價及證據質量評級
SAMS、DTSQ-IP、SWAM Scale?、SICT、ICT-Sat及SQ-ISHI 6個量表在總體設計中均清晰描述了量表的測量結構和目標人群,且研究人群的選擇具有代表性。但6個量表均未清晰描述結構的來源,SAMS、SICT及SQ-ISHI 3個量表未清晰描述其使用背景。同時,由于6個量表開發研究對概念引出過程描述均不清楚,根據“最差分數計數”原則,量表設計總體方法學質量評價為“有問題”。應用認知性訪談法評估目標人群對量表內容的可理解性和全面性看法時:SAMS、DTSQ-IP和SICT量表并未對是否向患者問及量表的可理解性和全面性進行描述,SWAM Scale?、ICT-Sat及SQ-ISHI量表的開發者并未提及認知訪談是否由經驗豐富的訪談者實施、是否基于恰當的訪談提綱、訪談是否錄音并轉錄、是否至少有兩名研究者參與資料分析及使用了何種分析方法等內容,故6個量表開發研究認知性訪談部分的方法學質量為“不合格”和“有問題”。納入的7個量表:DTSQ-Teen及DTSQ-Parent未披露完整開發信息無法評價,SAMS開發質量為“不合格”,DTSQ-IP、SWAM Scale?、SICT、ICT-Sat和SQ-ISHI量表開發研究方法學質量被評為“有問題”。詳見表3、表4。


2.3.3 量表測量性能研究方法學質量評價、測量性能評價及證據質量評級
基于COSMIN指南評價結果見表4、表5。7個兒童TS-M量表的開發或驗證研究均未對量表的跨文化效度/測量不變性、測量誤差及效標效度進行評價。結構效度和內部一致性是兩個最常被評價的測量屬性:SAMS、DTSQ-IP、SWAM Scale?、SICT及ICT-Sat 5個量表的方法學質量均為“合格”及以上,均具有“足夠”(高質量證據)的內部一致性;但由于指標數據的不清晰報告,僅ICT-Sat量表的結構效度為“足夠”(高質量證據)。SICT及ICT-Sat量表研究中的量表聚合效度和區分效度方法學質量均為“非常好”,2個量表的聚合效度和區分效度均為“足夠”(高質量證據)。僅SWAM Scale?和SQ-ISHI量表進行了內容效度研究:兩量表均未提及是否雇用經驗豐富的主持人/訪談者、是否使用提綱及錄音轉錄等細節;SQ-ISHI量表研究未采用專家評定法評價量表的內容效度,故兩個量表內容效度研究方法學質量均為“有問題”。僅基于量表開發研究與研究員的主觀評估,SAMS、DTSQ-IP、SWAM Scale?、SICT、ICT-Sat及SQ-ISHI 6個量表具有不一致的內容效度(中等至非常低質量證據)。僅ICT-Sat量表評價了重測信度:研究中均未對測量的間隔期間患者是否穩定進行描述,統計方法上未使用組內相關系數而僅計算了Pearson或Spearman相關系數,方法學質量為“有問題”,ICT-Sat量表重測信度可能為“不確定”(低質量證據)。

根據COSMIN指南,7種可用于兒科患者的TS-M量表均不滿足被推薦使用的標準,即具有“足夠”的內容效度(任何質量證據)和“足夠”的內部一致性(至少低質量證據)。需要更多的性能測量研究去判斷7個量表是否可以被推薦使用。
3 討論
本研究系統梳理了現有兒童研究中選用的TS-M測評工具,同時采用國際上應用廣泛的PROMs質量評價標準COSMIN[20,22]評估了現有兒童TS-M量表的開發研究方法學質量和心理學測量性能,并采用了修訂式GRADE對證據質量進行評級[20,22,24]。目前,超90%兒童研究未使用適用于兒童的TS-M測評工具進行TS-M測評;而現有兒童TS-M量表應用范圍較窄、開發質量存在問題、缺乏測量性能驗證研究。
本研究發現目前可用于兒童患者的7個量表均在維度及內容與成人量表[46-49,52]相類似,涵蓋了有效性、安全性、經濟性、便利性等多個方面。這些量表均為針對特定疾病(糖尿病、注意力多動障礙綜合征、雙相情感障礙或精神分裂癥、血友病)或藥物(鐵螯合劑)而設計的特異性量表,因此具體內容會更加針對特定疾病或藥物。然而,有些對于兒童較重要的維度及內容可能沒有得到充分關注,例如社會環境因素,包括同學和師生關系等。此外,這7個量表目前均未針對亞洲人群開展相關驗證研究,其是否存在人群適用性差距有待考量。本研究也發現兒童研究中應用TS-M測評工具不合理的情況。首先,67.3%的兒童臨床研究使用未經驗證的自制問卷或訪談,缺乏嚴謹完整的量表開發、評價和驗證過程[53,54]。其次,考慮到:① 現有成人量表在開發驗證階段目標人群均為18歲以上成人,缺乏其適用于18歲以下人群的證據[46-48,52];② 兒童理解能力、描述能力以及用藥經驗相對有限,兒童量表需要采用適合兒童年齡組的語言和表達方式[55];③ 兒童量表所包含的維度和內容可能與成人并不相同,例如學校環境、家庭和同伴關系等[56];④ 兒童量表的開發和應用不僅需要兒童自我報告,還需要依靠父母/監護人的輔助或替代報告,以保證評估的全面性和準確性[56,57];故成人量表可能并不直接適用于兒童。最后,質量評價結果表明:現有兒童TS-M工具的方法學質量可能存在不足。除DSTQ-Teen/Parent[25]和SAMS[26]量表缺乏信息無法進行評價外,其余5個量表[27-31]開發質量均為“有問題”。主要是因為在概念引出和認知訪談階段未清楚描述或缺少對患者及專家就條目相關性、可理解性和內容全面性所進行的定性研究。“患者參與”是量表研制的關鍵環節,量表開發過程需要通過訪談法或焦點小組討論法等定性研究方法廣泛聽取患者及專家的意見[58,59]。量表的測量性能,尤其是內容效度、重測信度、建構效度等方面仍需高質量研究進行驗證。此外,已有兒童量表均為僅適用特定疾病的特異性量表,應用范圍較為局限[25-31],尚缺乏適用于其他多種兒童疾病的普適性量表。
本研究的局限性:① 未納入非中、英文文獻,可能存在語言偏倚;② 本研究納入了1篇會議摘要形式的量表開發研究[18],以致該量表質量評價階段可能存在信息不足。
總之,目前兒科研究中應用TS-M測評工具存在不合理,適用于兒科患者的TS-M量表仍然缺乏。未來的研究可以開發更多適用于兒童的通用型或疾病/藥物特異型TS-M測評工具,并在實踐中推廣使用,以保證對兒童的TS-M進行準確評估。其次,未來在研制適用于兒童患者的TS-M量表時,應著力提升量表研制的規范性,可按照標準化研制流程或COSMIN進行量表開發與測量性能驗證。這將有助于確保量表的信度和效度,提高其在臨床實踐中的可靠性和有效性。同時對于量表開發或驗證研究的報告也應該清晰、規范和全面,COSMIN已制定了PROMs驗證研究報告規范,但尚無量表開發研究的報告規范。此外,在兒童量表的開發中,應該充分考慮兒童的認知能力和生理特點,采用易于理解和適合兒童的語言和表述方式,以確保量表的可行性和有效性。
聲明 本研究無任何利益沖突。
患者藥物治療滿意度(treatment satisfaction of medication,TS-M)是指患者對服藥過程和與藥物治療相關結果的滿意程度[1]。TS-M作為患者報告結局指標(patient-reported outcomes,PROs)中一個子類,能夠從患者的角度為臨床研究和實踐提供關于疾病活動和治療效果更加全面的信息[2-6],能夠預示患者對藥物使用的正確性及藥物治療的依從性和持續性,也能夠影響治療結果,對于藥物評價和遴選具有重要意義[7-10]。
近年來,越來越多兒童藥物研究將患者TS-M作為結局指標評價干預措施的效能[11-15],但用于評價兒科患者TS-M的工具數量較少,且尚無采用系統評價的方法評價國內外兒童TS-M研究及測評工具的研究報道。因此,本研究系統評價涉及兒童TS-M測評工具的研究,了解現有的兒童TS-M工具,并評估其質量,以期為臨床研究中合理選擇兒童TS-M量表提供參考,也為中國兒科患者TS-M量表的研制提供借鑒。
1 資料與方法
1.1 納入與排除標準
1.1.1 納入標準
① 納入對象:接受藥物治療的18歲以下兒童;② 研究內容:涉及患者TS-M測評;③ 研究類型:不限。
1.1.2 排除標準
① 重復發表的文獻;② 非中、英文文獻;③ 綜述、系統評價及其他二次研究;④ 無法提取患者TS-M測評工具相關信息的文獻。
1.2 文獻檢索策略
計算機檢索PubMed、Embase、Cochrane Library、CBM、WanFang Data、VIP和CNKI數據庫及醫學量表網站(ePROVIDE、常笑醫學網),搜集有關兒童TS-M測評工具的相關研究,檢索時限均為建庫至2022年11月。檢索采用主題詞和自由詞相結合的方式進行,并根據各數據庫特點進行調整。同時追溯納入研究的參考文獻,以補充獲取相關資料。中文檢索詞包括:藥物、患者滿意度、治療滿意度、兒童或青少年或父母等;英文檢索詞包括:medication、patient satisfaction、treatment satisfaction、pediatric、child、adolescent、parent等。
1.3 文獻篩選與資料提取
由2名研究者獨立篩選文獻、提取資料并交叉核對。如遇分歧,則通過討論或與第三方協商解決。文獻篩選時首先閱讀文題,在排除明顯不相關的文獻后,進一步閱讀摘要和全文以確定是否納入。如有需要,通過郵件、電話聯系原始研究作者獲取未確定但對本研究非常重要的信息。資料提取內容包括:① 研究相關信息:研究題目、第一作者、發表年份、研究類型、國家、研究人群、使用的測評TS-M工具等;② 量表相關信息:研制國家、量表類型、量表適用范圍、量表維度及條目、語言版本等。
1.4 納入研究的特征分析
描述性分析兒科患者TS-M相關研究的研究人群、測評方法等。在醫學領域,PROs測評(patient-reported outcome measures,PROMs)使用的工具類型主要包括量表、單個條目、訪談和日記等[16,17]。量表一詞在使用上有時被稱為測評工具、問卷或調查表[18]。根據評定對象的不同,量表可分為普適性和特異性量表,后者可為疾病特異性或藥物特異性量表等。根據是否經過嚴格的方法學驗證,量表可分為經驗證開發的工具和未經驗證的工具 [19]。
針對納入的TS-M測評工具應用研究,我們將根據測評工具的命名和相關描述以及進一步工具相關文獻補充檢索,由2名研究員獨立判斷所使用的測評工具類型。例如研究員會判斷該研究是使用了未經驗證的自制調查問卷還是經研究驗證開發使用的測評量表。后者的判斷將基于該工具是否有已發表的開發或驗證研究文獻。如遇分歧,則通過小組討論解決。
1.5 納入量表的描述性分析和質量評價
描述性分析納入兒童TS-M量表的基本信息、方法學質量。由2名研究者分別根據COSMIN PROs測量系統評價指南[20],采用COSMIN偏倚風險評價清單[21]、更新版良好測量屬性標準[20-23]獨立評價兒童TS-M量表開發質量和測量性能,采用COSMIN指南修訂版推薦分級的評價、制定與評估(modified grades of recommendations assessment, development and evaluation,GRADE)[24]評級證據質量,并交叉核對結果。如遇分歧,則通過小組討論解決。根據COSMIN偏倚風險評價清單,研究員將單個研究方法學質量評價為以下4個等級之一:非常好、合格、有問題或不合格。隨后,研究員基于COSMIN更新版良好測量屬性標準評價量表的5種測量性能,包括內容效度、結構效度、內部一致性、重測信度和建構效度。評價等級包括:足夠(+)、不足夠(?)、不確定(?)、不一致(±)。最后,采用COSMIN指南中修訂的GRADE方法來評價量表開發和驗證的總體證據質量,分為高、中、低和非常低4個等級。
2 結果
2.1 文獻篩選流程及結果
初檢共獲得文獻6 016篇,包括PubMed(n=3 279)、Embase(n=1 692)、Cochrane Library(n=521)、CNKI(n=240)、VIP(n=113)、WanFang Data(n=96)、CBM(n=57)和醫學量表網站(n=18)。經逐層篩選后,最終納入157個研究,包括TS-M測評工具的應用研究150篇,兒童TS-M量表開發及驗證研究7篇[25-31]。
2.2 兒童研究中選用的TS-M測評工具
150項TS-M測評工具應用研究中101項研究對象為兒童,49項研究對象為兒童及成人。共涉及五大洲42個國家,其中在中國開展的研究有26項(17.3%)。根據國際疾病分類(ICD-11)[32],涉及疾病12大類。研究的基本特征見表1。

150篇文獻涉及的TS-M測評工具包括兩大類:經驗證開發的工具和未經驗證的工具[33]。本研究納入的150項研究中,101項研究(67.3%)使用未經驗證的自制TS-M問卷或訪談,37項研究(24.7%)使用經驗證開發的成人TS-M量表,3項研究(2.0%)[34-36]使用經驗證開發兒童及成人患者均可使用的量表,9項研究(6.0%)[15,37-44]使用針對兒童開發驗證的TS-M量表。自制問卷或訪談常采用Likert法對患兒或家長就藥物治療的滿意度進行調查[45]。37項研究涉及13個適用于成人患者的TS-M量表,包括適用于成人各種疾病的藥物治療滿意度量表(treatment satisfaction questionnaire for medication,TSQM)[46-48],適用于成人特定疾病,如糖尿病治療滿意度量表(diabetes treatment satisfaction questionnaire,DTSQ)[49]、胰島素治療滿意度量表(insulin treatment satisfaction questionnaire,ITSQ)[50]、血友病特異性治療滿意度問卷(haemophilia-specific treatment satisfaction questionnaire,Hemo-SatP)[51]等。
12項兒童研究使用3種適用于兒童的TS-M量表[15,34-44],其中糖尿病DTSQ-Teen和DTSQ-Parent量表在現有研究中被使用的頻率最高[4.7%(7/150)],其次為適用于接受鐵螯合劑治療患者的SICT量表[2.0%(3/150)]和適用于注意力缺陷多動障礙患兒及家長的SAMS量表[1.3%(2/150)]。
2.3 評價結果
2.3.1 量表的基本信息
共納入2個適用于兒童患者[25,26]和5個適用于兒童及成人患者的TS-M量表[27-31],7個量表均為測評某種疾病或藥物TS-M的特異性量表。2009年,英國學者在成人DTSQ[49]基礎上研制了青少年版(DTSQ-Teen)、家長版(DTSQ-Parent)[25]及住院患者版(DTSQ-IP)[27]量表,分別適用于12~18歲兒童、≤11歲兒童的家長及≥16歲兒童及成人糖尿病住院患者。2011年德國學者又針對注意力缺陷多動障礙患兒研制了TS-M量表(satisfaction with medication scale,SAMS),同樣包括患者自我報告版(SAMS-S)和家長替代報告版(SAMS-P),分別適用于12~18歲兒童和6~11歲兒童的家長[26]。目前DTSQ-Teen、DTSQ-Parent及SAMS均尚未被翻譯和修訂為中文版。其余4個兒童及成人TS-M量表SWAM Scale?[28]、SICT[29]、ICT-Sat[30]及SQ-ISHI[31]分別適用于雙相情感障礙或精神分裂癥、接受鐵螯合劑治療以及A型血友病患者。7個量表的基本特征見表2。

2.3.2 量表開發研究的方法學質量評價及證據質量評級
SAMS、DTSQ-IP、SWAM Scale?、SICT、ICT-Sat及SQ-ISHI 6個量表在總體設計中均清晰描述了量表的測量結構和目標人群,且研究人群的選擇具有代表性。但6個量表均未清晰描述結構的來源,SAMS、SICT及SQ-ISHI 3個量表未清晰描述其使用背景。同時,由于6個量表開發研究對概念引出過程描述均不清楚,根據“最差分數計數”原則,量表設計總體方法學質量評價為“有問題”。應用認知性訪談法評估目標人群對量表內容的可理解性和全面性看法時:SAMS、DTSQ-IP和SICT量表并未對是否向患者問及量表的可理解性和全面性進行描述,SWAM Scale?、ICT-Sat及SQ-ISHI量表的開發者并未提及認知訪談是否由經驗豐富的訪談者實施、是否基于恰當的訪談提綱、訪談是否錄音并轉錄、是否至少有兩名研究者參與資料分析及使用了何種分析方法等內容,故6個量表開發研究認知性訪談部分的方法學質量為“不合格”和“有問題”。納入的7個量表:DTSQ-Teen及DTSQ-Parent未披露完整開發信息無法評價,SAMS開發質量為“不合格”,DTSQ-IP、SWAM Scale?、SICT、ICT-Sat和SQ-ISHI量表開發研究方法學質量被評為“有問題”。詳見表3、表4。


2.3.3 量表測量性能研究方法學質量評價、測量性能評價及證據質量評級
基于COSMIN指南評價結果見表4、表5。7個兒童TS-M量表的開發或驗證研究均未對量表的跨文化效度/測量不變性、測量誤差及效標效度進行評價。結構效度和內部一致性是兩個最常被評價的測量屬性:SAMS、DTSQ-IP、SWAM Scale?、SICT及ICT-Sat 5個量表的方法學質量均為“合格”及以上,均具有“足夠”(高質量證據)的內部一致性;但由于指標數據的不清晰報告,僅ICT-Sat量表的結構效度為“足夠”(高質量證據)。SICT及ICT-Sat量表研究中的量表聚合效度和區分效度方法學質量均為“非常好”,2個量表的聚合效度和區分效度均為“足夠”(高質量證據)。僅SWAM Scale?和SQ-ISHI量表進行了內容效度研究:兩量表均未提及是否雇用經驗豐富的主持人/訪談者、是否使用提綱及錄音轉錄等細節;SQ-ISHI量表研究未采用專家評定法評價量表的內容效度,故兩個量表內容效度研究方法學質量均為“有問題”。僅基于量表開發研究與研究員的主觀評估,SAMS、DTSQ-IP、SWAM Scale?、SICT、ICT-Sat及SQ-ISHI 6個量表具有不一致的內容效度(中等至非常低質量證據)。僅ICT-Sat量表評價了重測信度:研究中均未對測量的間隔期間患者是否穩定進行描述,統計方法上未使用組內相關系數而僅計算了Pearson或Spearman相關系數,方法學質量為“有問題”,ICT-Sat量表重測信度可能為“不確定”(低質量證據)。

根據COSMIN指南,7種可用于兒科患者的TS-M量表均不滿足被推薦使用的標準,即具有“足夠”的內容效度(任何質量證據)和“足夠”的內部一致性(至少低質量證據)。需要更多的性能測量研究去判斷7個量表是否可以被推薦使用。
3 討論
本研究系統梳理了現有兒童研究中選用的TS-M測評工具,同時采用國際上應用廣泛的PROMs質量評價標準COSMIN[20,22]評估了現有兒童TS-M量表的開發研究方法學質量和心理學測量性能,并采用了修訂式GRADE對證據質量進行評級[20,22,24]。目前,超90%兒童研究未使用適用于兒童的TS-M測評工具進行TS-M測評;而現有兒童TS-M量表應用范圍較窄、開發質量存在問題、缺乏測量性能驗證研究。
本研究發現目前可用于兒童患者的7個量表均在維度及內容與成人量表[46-49,52]相類似,涵蓋了有效性、安全性、經濟性、便利性等多個方面。這些量表均為針對特定疾病(糖尿病、注意力多動障礙綜合征、雙相情感障礙或精神分裂癥、血友病)或藥物(鐵螯合劑)而設計的特異性量表,因此具體內容會更加針對特定疾病或藥物。然而,有些對于兒童較重要的維度及內容可能沒有得到充分關注,例如社會環境因素,包括同學和師生關系等。此外,這7個量表目前均未針對亞洲人群開展相關驗證研究,其是否存在人群適用性差距有待考量。本研究也發現兒童研究中應用TS-M測評工具不合理的情況。首先,67.3%的兒童臨床研究使用未經驗證的自制問卷或訪談,缺乏嚴謹完整的量表開發、評價和驗證過程[53,54]。其次,考慮到:① 現有成人量表在開發驗證階段目標人群均為18歲以上成人,缺乏其適用于18歲以下人群的證據[46-48,52];② 兒童理解能力、描述能力以及用藥經驗相對有限,兒童量表需要采用適合兒童年齡組的語言和表達方式[55];③ 兒童量表所包含的維度和內容可能與成人并不相同,例如學校環境、家庭和同伴關系等[56];④ 兒童量表的開發和應用不僅需要兒童自我報告,還需要依靠父母/監護人的輔助或替代報告,以保證評估的全面性和準確性[56,57];故成人量表可能并不直接適用于兒童。最后,質量評價結果表明:現有兒童TS-M工具的方法學質量可能存在不足。除DSTQ-Teen/Parent[25]和SAMS[26]量表缺乏信息無法進行評價外,其余5個量表[27-31]開發質量均為“有問題”。主要是因為在概念引出和認知訪談階段未清楚描述或缺少對患者及專家就條目相關性、可理解性和內容全面性所進行的定性研究。“患者參與”是量表研制的關鍵環節,量表開發過程需要通過訪談法或焦點小組討論法等定性研究方法廣泛聽取患者及專家的意見[58,59]。量表的測量性能,尤其是內容效度、重測信度、建構效度等方面仍需高質量研究進行驗證。此外,已有兒童量表均為僅適用特定疾病的特異性量表,應用范圍較為局限[25-31],尚缺乏適用于其他多種兒童疾病的普適性量表。
本研究的局限性:① 未納入非中、英文文獻,可能存在語言偏倚;② 本研究納入了1篇會議摘要形式的量表開發研究[18],以致該量表質量評價階段可能存在信息不足。
總之,目前兒科研究中應用TS-M測評工具存在不合理,適用于兒科患者的TS-M量表仍然缺乏。未來的研究可以開發更多適用于兒童的通用型或疾病/藥物特異型TS-M測評工具,并在實踐中推廣使用,以保證對兒童的TS-M進行準確評估。其次,未來在研制適用于兒童患者的TS-M量表時,應著力提升量表研制的規范性,可按照標準化研制流程或COSMIN進行量表開發與測量性能驗證。這將有助于確保量表的信度和效度,提高其在臨床實踐中的可靠性和有效性。同時對于量表開發或驗證研究的報告也應該清晰、規范和全面,COSMIN已制定了PROMs驗證研究報告規范,但尚無量表開發研究的報告規范。此外,在兒童量表的開發中,應該充分考慮兒童的認知能力和生理特點,采用易于理解和適合兒童的語言和表述方式,以確保量表的可行性和有效性。
聲明 本研究無任何利益沖突。