引用本文: 石雨晴, 刁莎, 曾力楠, 易秋莎, 李海龍, 楊稀策, 何苗, 郭家平, 黃超, 王強, 張伶俐. 指南臨床適用性評價指標體系的系統評價. 中國循證醫學雜志, 2024, 24(1): 61-68. doi: 10.7507/1672-2531.202306030 復制
版權信息: ?四川大學華西醫院華西期刊社《中國循證醫學雜志》版權所有,未經授權不得轉載、改編
臨床實踐指南(clinical practice guideline,CPG)(以下簡稱“指南”)是指基于系統評價證據并權衡不同干預措施利弊形成的、能夠為患者優化保健服務的推薦意見[1]。高質量的指南能將復雜的科學研究結果轉化到臨床診療建議中,為醫療工作者提供標準化的臨床實踐措施,改善患者治療效果,減少衛生保健的不公平性,提高醫療服務質量[2]。近年來,全球指南數量呈快速增長趨勢,1990—2023年PubMed數據庫收錄的指南數量已增長近50倍,但指南的質量良莠不齊。制訂指南評價工具AGREEⅡ(appraisal of guidelines for research and evaluation)的牽頭專家Melissa C Brouwers指出,指南質量的提高并未改善指南臨床適用性[3],其中的指南臨床適用性即推薦意見能夠在臨床實踐中推廣使用的程度[4]。指南臨床適用性不足將導致指南推廣與實施效果不佳,為甄別出臨床適用性高的指南,科學的臨床適用性評價工具起到關鍵作用[5]。然而,目前全球指南臨床適用性評價工具在評價維度、條目解釋、條目賦值、評價者依從性等方面存在問題,難以直接使用[6]。本研究采用系統評價的方法,分析全球指南臨床適用性評價指標體系的評價條目,為循證建立適用于我國診療環境的指南臨床適用性評價指標體系提供依據。
1 資料與方法
1.1 納入與排除標準
1.1.1 納入標準
指南臨床適用性評價指標的中、英文文獻,研究類型包括:① 涉及指南臨床適用性評價指標體系的開發、評價工具或影響因素的原始研究;② 綜述及系統評價。
1.1.2 排除標準
排除重復發表或原文無法獲取的文獻。
1.2 文獻檢索策略
計算機檢索PubMed、Embase、Cochrane Library、CNKI、WanFang Data和VIP數據庫,在前期檢索方案的基礎上擴大檢索詞,檢索字段檢索范圍限制為摘要,學科范圍限制為生物醫學衛生領域,檢索時限均從建庫至2022年11月。中文數據庫檢索式:(指南OR共識OR意見)AND(適用性);英文數據庫結合主題檢索與自由詞檢索,以PubMed為例,其具體檢索策略見附件框1。
1.3 文獻篩選和數據提取
由兩名研究員背對背閱讀文獻的標題、摘要,根據研究內容剔除非指南臨床適用性評價指標的文獻,全文閱讀后納入可能符合標準的文獻,對于不確定的文獻經討論后決定是否納入。最后由兩名研究員獨立提取納入文獻的信息,主要內容包括:① 基本信息,包括作者、年份、期刊或網址;② 研究內容(研究目的、方法);③ 指南臨床適用性潛在影響因素具體條目、評價細則等相關內容。
1.4 資料整合
采用主題綜合法概括指南臨床適用性評價指標的主旨信息[7],根據提取的原始內容,歸納總結形成描述性主題,基于描述性主題的共同主題,歸納總結形成分析性主題,再基于描述性主題和分析性主題的共同主題,歸納總結形成三級主題,最終形成評價條目池。其核心步驟詳見圖1。

2 結果
2.1 文獻篩選流程及結果
初檢獲得中、英文文獻分別為2 557篇和9 075篇,合計11 632篇。通過剔重、閱讀摘要等,初步篩選出222篇;進一步閱讀全文、參考文獻并補充檢索,最終納入定性分析的文獻82篇,文獻篩選流程及結果見附件圖1。
2.2 國內外指南臨床適用性評價條目概況
2.2.1 納入研究的研究目的
根據研究目的將指南臨床適用性評價條目的文獻分為三類,其中研究目的為指南的制訂或評價體系開發的文獻有10篇,涉及指南臨床適用性或應用性評價的文獻有53篇,涉及指南臨床適用性影響因素的文獻有19篇。納入研究的基本信息見附件表1。
2.2.2 納入研究的研究方法
在指南制訂或評價體系開發的10篇文獻中,有德爾菲法2篇、問卷調查法2篇、文獻綜述法1篇,其余未報道。
在對指南的適用性或應用性評價的53篇文獻中,采用調查問卷和前瞻性病例調查分析方法的文獻13篇,僅采用調查問卷法的文獻16篇,僅采用前瞻性病例調查分析法的文獻4篇,采用系統評價方法的文獻11篇,采用文獻綜述方法的文獻5篇,采用德爾菲法的文獻1篇,采用問卷調查與半結構化訪談方法的文獻1篇,采用回顧性評價方法的文獻1篇,1篇未報道。
在指南臨床適用性影響因素的19篇文獻中,采用系統評價或文獻綜述方法的文獻4篇,采用焦點小組討論的文獻4篇,采用問卷調查法的文獻3篇,采用深度訪談法的文獻1篇,采用會議共識法的文獻1篇,采用混合模型研究的方法的文獻5篇,未報道1篇。
2.2.3 納入研究的指南制訂或評價工具
涉及指南的制訂或評價體系開發的工具《加拿大醫學協會臨床實踐指南手冊》,指南報告規范的評價工具RIGHT清單以及指南改編的評價工具ADAPTE工具各有1篇文獻。
25篇文獻采用中醫診療指南的適用性評價工具《中醫臨床診療指南適用性調查問卷》,22篇文獻采用中醫診療指南的應用性評價工具《中醫臨床診療指南應用評價病例調查表》,5篇文獻采用影像學檢查的臨床適用性評價(MICA)工具。
指南的實施應用層面評價的工具包括加拿大多倫多大學學者Gagliardi提出的指南實施能力框架以及耶魯大學Shiffman教授團隊建立的GLIA標準,納入文獻各有1篇。
涉及指南方法學質量的IOM評價標準文獻2篇、NGC標準文獻1篇以及AQUMED標準文獻1篇,對于中醫藥指南的質量評價工具有廣州中醫藥大學李慧教授團隊建立的醫學指南臨床適用性評價工具,納入文獻1篇,采用國際上公認的評價指南質量的“金標準”AGREEⅡ評價工具的文獻10篇,以及由復旦大學循證醫學中心的王吉耀教授團隊根據中國國情開發的AGREE-China評價工具文獻1篇,AGREE-REX的開發是對AGREEⅡ的補充,主要關注指南可信度和可實施性,旨在提升指南推薦意見的質量,納入文獻6篇(見附件表2)。
在指南臨床適用性影響因素的方面,5篇文獻采用自制的問卷作為調查工具,問卷類型包括封閉式問卷、開放式問卷。
2.3 國內外指南臨床適用性影響因素現狀
納入研究中15項研究影響因素都包括與醫務人員相關的因素,例如知識、技能和態度;14項研究納入指南因素,例如指南的格式、可及性、信效度、操作復雜程度等;8項研究納入環境因素,例如社會環境、組織環境、經濟環境等,有1項研究將患者因素納入為社會環境中;7項研究納入患者因素,例如患者的依從性、個性化需求。具體的影響因素見附件表3。
2.4 形成評價條目池
根據系統評價結果,共獲得指南臨床適用性評價指標141條,其中第三級主題5個、分析性主題14個、描述性主題141個;可行性領域中的影響因素包括醫務人員因素、患者/患者家屬因素、環境因素和指南因素(表1、表2)。


3 討論
在制訂評價條目方面,本研究形成4個領域:可獲得性、可讀性、可行性和可接受性,涵蓋了從指南獲取到使用的全過程,從指南到用戶全對象。與同類工具相比,本研究以更全面、更準確的方式呈現條目。同時,本研究對于可行性中的影響因素進一步研究,從醫務人員、患者及家屬、環境、指南維度分析促進或者阻礙指南臨床適用性的因素。與同類工具相比,本研究的表述通俗易懂,更易讓指南評價者和目標使用者理解。
除了對現有指南的臨床適用性評價,甄別出臨床適用性高的指南并推廣應用外,還需從指南的開發、改編、實施各環節提高指南的臨床適用性。例如,ADAPTE提出在改編指南時需要考慮患者、醫務人員的專業知識、環境設備、法律政策因素,以促進指南的使用[4]。Pronovost等[8]提出在實施環節為加強臨床醫生對指南的依從性需要開發配套的實施工具,例如指南實施策略的文件和快速參考手冊。從本研究指南適用性的4個領域著手:① 可獲得性:可借助現代信息技術,增加獲取途徑,降低獲取成本,提高指南的推廣程度;② 可讀性:通過加粗、加框等方式增強推薦意見的可識別性和清晰性;③ 可行性:可提供指南實施工具以及適合不同場景的版本,必要時對目標受眾進行培訓,提高指南轉化效率;④ 可接受性:考慮目標受眾的觀點和偏好,考慮實施地域的文化包容度以及醫療機構的診療習慣,提高指南推薦意見的認同度。
為探索指南臨床適用性可行性領域的影響因素,本研究系統評價各模型的特征,從產生影響的主體角度將影響因素劃分為醫務人員因素、患者/患者家屬因素、環境因素和指南因素。例如,Cabana等構建的模型是研究指南適用性影響因素的著名模型之一,該模型關注的主體為醫務人員,提出知識、態度和行為環環相扣影響著臨床醫生遵循循證指南,由于存在大量臨床信息、難以獲得指南,對指南缺乏認識或不熟悉,阻礙了醫生對指南的了解;對指南不認可、缺乏自我效能感、缺乏預期結果以及存在以往臨床實踐的慣性會影響醫生對指南的態度[9]。本研究在此基礎上結合不同模型的特征,將影響臨床醫生行為的患者因素、指南因素和環境因素單獨劃分出來,將知識與態度合并為醫務人員因素,更具有綜合性和全面性。
與同類工具相比方面,2005年美國耶魯大學醫學信息中心的Shiffman教授團隊創建的The Guideline Implementability Appraisal(GLIA)標準,從10個維度,31個條目來評價CPG的可實施性。可判定性和可執行性是關鍵維度,其他維度包括全局性、內容表述和格式、可衡量性、有效性、靈活性、對護理過程的影響、新穎性、可電子化[10]。其他領域均包含于本研究可讀性領域的“結構”、“內容”、“語言表達”,可行性領域的“協調配套性”、“靈活性”、“技術水平”和“可電子化”分析性主題中。
AGREEⅡ工具目前已在國際上成為通用的方法學工具,用于指南的開發、報告和評估,但由于主要關注在指南報告的方法質量和內部有效性,而很少關注推薦意見的外部有效性,仍有不足。AGREE-REX的開發是對AGREEⅡ的補充,主要關注指南可信度和可實施性,旨在提升指南推薦意見的質量,由3個領域(臨床適用性、價值觀和偏好、可實施性)以及11個條目組成,其中,臨床適用性包括證據、用戶適用性和患者/人群適用性,分別包含于本研究的可讀性領域的“語言表達”,可接受領域的“與用戶意見相符程度”,可行性領域的“臨床作用”[11]。
2012年,中國中醫科學院和廣東省中醫院在國家中醫藥管理局組織下制定了《中醫臨床診療指南應用評價方案》,分為適用性評價和應用性評價兩個部分。在適用性方面,臨床醫生填寫《中醫臨床診療指南適用性調查問卷》,適用性部分由指南質量水平、指南應用情況、意見建議、綜合評價3個部分組成,共有22條目[12]。排除該問卷條目中包含中醫相關領域問題,其他條目分別對應本研究制定條目中可讀性領域的“結構”和“內容”,可行性領域的“臨床應用”、“技術水平”、“協調配套性”和“臨床作用”分析性主題。
本研究的局限性:① 由于語言限制,本研究僅檢索了數據庫中的中、英文文獻,存在選擇性偏倚;② 由于主題綜合法的主觀因素影響較大,不同研究者對于文獻條目的理解和整合能力不同,對于形成的條目有待下一步專家咨詢并更新;③ 本研究條目較多,可能導致依從性差,在轉換為調查問卷時語言需更加準確凝練。
綜上所述,本研究系統評價構建了指南評價條目,為指南評價指標體系的制訂和實施提供循證參考。未來建議在形成指南臨床適用性清單后,應大力推廣并為指南制訂者提供標準,進一步提高我國指南制訂質量和臨床適用性。
臨床實踐指南(clinical practice guideline,CPG)(以下簡稱“指南”)是指基于系統評價證據并權衡不同干預措施利弊形成的、能夠為患者優化保健服務的推薦意見[1]。高質量的指南能將復雜的科學研究結果轉化到臨床診療建議中,為醫療工作者提供標準化的臨床實踐措施,改善患者治療效果,減少衛生保健的不公平性,提高醫療服務質量[2]。近年來,全球指南數量呈快速增長趨勢,1990—2023年PubMed數據庫收錄的指南數量已增長近50倍,但指南的質量良莠不齊。制訂指南評價工具AGREEⅡ(appraisal of guidelines for research and evaluation)的牽頭專家Melissa C Brouwers指出,指南質量的提高并未改善指南臨床適用性[3],其中的指南臨床適用性即推薦意見能夠在臨床實踐中推廣使用的程度[4]。指南臨床適用性不足將導致指南推廣與實施效果不佳,為甄別出臨床適用性高的指南,科學的臨床適用性評價工具起到關鍵作用[5]。然而,目前全球指南臨床適用性評價工具在評價維度、條目解釋、條目賦值、評價者依從性等方面存在問題,難以直接使用[6]。本研究采用系統評價的方法,分析全球指南臨床適用性評價指標體系的評價條目,為循證建立適用于我國診療環境的指南臨床適用性評價指標體系提供依據。
1 資料與方法
1.1 納入與排除標準
1.1.1 納入標準
指南臨床適用性評價指標的中、英文文獻,研究類型包括:① 涉及指南臨床適用性評價指標體系的開發、評價工具或影響因素的原始研究;② 綜述及系統評價。
1.1.2 排除標準
排除重復發表或原文無法獲取的文獻。
1.2 文獻檢索策略
計算機檢索PubMed、Embase、Cochrane Library、CNKI、WanFang Data和VIP數據庫,在前期檢索方案的基礎上擴大檢索詞,檢索字段檢索范圍限制為摘要,學科范圍限制為生物醫學衛生領域,檢索時限均從建庫至2022年11月。中文數據庫檢索式:(指南OR共識OR意見)AND(適用性);英文數據庫結合主題檢索與自由詞檢索,以PubMed為例,其具體檢索策略見附件框1。
1.3 文獻篩選和數據提取
由兩名研究員背對背閱讀文獻的標題、摘要,根據研究內容剔除非指南臨床適用性評價指標的文獻,全文閱讀后納入可能符合標準的文獻,對于不確定的文獻經討論后決定是否納入。最后由兩名研究員獨立提取納入文獻的信息,主要內容包括:① 基本信息,包括作者、年份、期刊或網址;② 研究內容(研究目的、方法);③ 指南臨床適用性潛在影響因素具體條目、評價細則等相關內容。
1.4 資料整合
采用主題綜合法概括指南臨床適用性評價指標的主旨信息[7],根據提取的原始內容,歸納總結形成描述性主題,基于描述性主題的共同主題,歸納總結形成分析性主題,再基于描述性主題和分析性主題的共同主題,歸納總結形成三級主題,最終形成評價條目池。其核心步驟詳見圖1。

2 結果
2.1 文獻篩選流程及結果
初檢獲得中、英文文獻分別為2 557篇和9 075篇,合計11 632篇。通過剔重、閱讀摘要等,初步篩選出222篇;進一步閱讀全文、參考文獻并補充檢索,最終納入定性分析的文獻82篇,文獻篩選流程及結果見附件圖1。
2.2 國內外指南臨床適用性評價條目概況
2.2.1 納入研究的研究目的
根據研究目的將指南臨床適用性評價條目的文獻分為三類,其中研究目的為指南的制訂或評價體系開發的文獻有10篇,涉及指南臨床適用性或應用性評價的文獻有53篇,涉及指南臨床適用性影響因素的文獻有19篇。納入研究的基本信息見附件表1。
2.2.2 納入研究的研究方法
在指南制訂或評價體系開發的10篇文獻中,有德爾菲法2篇、問卷調查法2篇、文獻綜述法1篇,其余未報道。
在對指南的適用性或應用性評價的53篇文獻中,采用調查問卷和前瞻性病例調查分析方法的文獻13篇,僅采用調查問卷法的文獻16篇,僅采用前瞻性病例調查分析法的文獻4篇,采用系統評價方法的文獻11篇,采用文獻綜述方法的文獻5篇,采用德爾菲法的文獻1篇,采用問卷調查與半結構化訪談方法的文獻1篇,采用回顧性評價方法的文獻1篇,1篇未報道。
在指南臨床適用性影響因素的19篇文獻中,采用系統評價或文獻綜述方法的文獻4篇,采用焦點小組討論的文獻4篇,采用問卷調查法的文獻3篇,采用深度訪談法的文獻1篇,采用會議共識法的文獻1篇,采用混合模型研究的方法的文獻5篇,未報道1篇。
2.2.3 納入研究的指南制訂或評價工具
涉及指南的制訂或評價體系開發的工具《加拿大醫學協會臨床實踐指南手冊》,指南報告規范的評價工具RIGHT清單以及指南改編的評價工具ADAPTE工具各有1篇文獻。
25篇文獻采用中醫診療指南的適用性評價工具《中醫臨床診療指南適用性調查問卷》,22篇文獻采用中醫診療指南的應用性評價工具《中醫臨床診療指南應用評價病例調查表》,5篇文獻采用影像學檢查的臨床適用性評價(MICA)工具。
指南的實施應用層面評價的工具包括加拿大多倫多大學學者Gagliardi提出的指南實施能力框架以及耶魯大學Shiffman教授團隊建立的GLIA標準,納入文獻各有1篇。
涉及指南方法學質量的IOM評價標準文獻2篇、NGC標準文獻1篇以及AQUMED標準文獻1篇,對于中醫藥指南的質量評價工具有廣州中醫藥大學李慧教授團隊建立的醫學指南臨床適用性評價工具,納入文獻1篇,采用國際上公認的評價指南質量的“金標準”AGREEⅡ評價工具的文獻10篇,以及由復旦大學循證醫學中心的王吉耀教授團隊根據中國國情開發的AGREE-China評價工具文獻1篇,AGREE-REX的開發是對AGREEⅡ的補充,主要關注指南可信度和可實施性,旨在提升指南推薦意見的質量,納入文獻6篇(見附件表2)。
在指南臨床適用性影響因素的方面,5篇文獻采用自制的問卷作為調查工具,問卷類型包括封閉式問卷、開放式問卷。
2.3 國內外指南臨床適用性影響因素現狀
納入研究中15項研究影響因素都包括與醫務人員相關的因素,例如知識、技能和態度;14項研究納入指南因素,例如指南的格式、可及性、信效度、操作復雜程度等;8項研究納入環境因素,例如社會環境、組織環境、經濟環境等,有1項研究將患者因素納入為社會環境中;7項研究納入患者因素,例如患者的依從性、個性化需求。具體的影響因素見附件表3。
2.4 形成評價條目池
根據系統評價結果,共獲得指南臨床適用性評價指標141條,其中第三級主題5個、分析性主題14個、描述性主題141個;可行性領域中的影響因素包括醫務人員因素、患者/患者家屬因素、環境因素和指南因素(表1、表2)。


3 討論
在制訂評價條目方面,本研究形成4個領域:可獲得性、可讀性、可行性和可接受性,涵蓋了從指南獲取到使用的全過程,從指南到用戶全對象。與同類工具相比,本研究以更全面、更準確的方式呈現條目。同時,本研究對于可行性中的影響因素進一步研究,從醫務人員、患者及家屬、環境、指南維度分析促進或者阻礙指南臨床適用性的因素。與同類工具相比,本研究的表述通俗易懂,更易讓指南評價者和目標使用者理解。
除了對現有指南的臨床適用性評價,甄別出臨床適用性高的指南并推廣應用外,還需從指南的開發、改編、實施各環節提高指南的臨床適用性。例如,ADAPTE提出在改編指南時需要考慮患者、醫務人員的專業知識、環境設備、法律政策因素,以促進指南的使用[4]。Pronovost等[8]提出在實施環節為加強臨床醫生對指南的依從性需要開發配套的實施工具,例如指南實施策略的文件和快速參考手冊。從本研究指南適用性的4個領域著手:① 可獲得性:可借助現代信息技術,增加獲取途徑,降低獲取成本,提高指南的推廣程度;② 可讀性:通過加粗、加框等方式增強推薦意見的可識別性和清晰性;③ 可行性:可提供指南實施工具以及適合不同場景的版本,必要時對目標受眾進行培訓,提高指南轉化效率;④ 可接受性:考慮目標受眾的觀點和偏好,考慮實施地域的文化包容度以及醫療機構的診療習慣,提高指南推薦意見的認同度。
為探索指南臨床適用性可行性領域的影響因素,本研究系統評價各模型的特征,從產生影響的主體角度將影響因素劃分為醫務人員因素、患者/患者家屬因素、環境因素和指南因素。例如,Cabana等構建的模型是研究指南適用性影響因素的著名模型之一,該模型關注的主體為醫務人員,提出知識、態度和行為環環相扣影響著臨床醫生遵循循證指南,由于存在大量臨床信息、難以獲得指南,對指南缺乏認識或不熟悉,阻礙了醫生對指南的了解;對指南不認可、缺乏自我效能感、缺乏預期結果以及存在以往臨床實踐的慣性會影響醫生對指南的態度[9]。本研究在此基礎上結合不同模型的特征,將影響臨床醫生行為的患者因素、指南因素和環境因素單獨劃分出來,將知識與態度合并為醫務人員因素,更具有綜合性和全面性。
與同類工具相比方面,2005年美國耶魯大學醫學信息中心的Shiffman教授團隊創建的The Guideline Implementability Appraisal(GLIA)標準,從10個維度,31個條目來評價CPG的可實施性。可判定性和可執行性是關鍵維度,其他維度包括全局性、內容表述和格式、可衡量性、有效性、靈活性、對護理過程的影響、新穎性、可電子化[10]。其他領域均包含于本研究可讀性領域的“結構”、“內容”、“語言表達”,可行性領域的“協調配套性”、“靈活性”、“技術水平”和“可電子化”分析性主題中。
AGREEⅡ工具目前已在國際上成為通用的方法學工具,用于指南的開發、報告和評估,但由于主要關注在指南報告的方法質量和內部有效性,而很少關注推薦意見的外部有效性,仍有不足。AGREE-REX的開發是對AGREEⅡ的補充,主要關注指南可信度和可實施性,旨在提升指南推薦意見的質量,由3個領域(臨床適用性、價值觀和偏好、可實施性)以及11個條目組成,其中,臨床適用性包括證據、用戶適用性和患者/人群適用性,分別包含于本研究的可讀性領域的“語言表達”,可接受領域的“與用戶意見相符程度”,可行性領域的“臨床作用”[11]。
2012年,中國中醫科學院和廣東省中醫院在國家中醫藥管理局組織下制定了《中醫臨床診療指南應用評價方案》,分為適用性評價和應用性評價兩個部分。在適用性方面,臨床醫生填寫《中醫臨床診療指南適用性調查問卷》,適用性部分由指南質量水平、指南應用情況、意見建議、綜合評價3個部分組成,共有22條目[12]。排除該問卷條目中包含中醫相關領域問題,其他條目分別對應本研究制定條目中可讀性領域的“結構”和“內容”,可行性領域的“臨床應用”、“技術水平”、“協調配套性”和“臨床作用”分析性主題。
本研究的局限性:① 由于語言限制,本研究僅檢索了數據庫中的中、英文文獻,存在選擇性偏倚;② 由于主題綜合法的主觀因素影響較大,不同研究者對于文獻條目的理解和整合能力不同,對于形成的條目有待下一步專家咨詢并更新;③ 本研究條目較多,可能導致依從性差,在轉換為調查問卷時語言需更加準確凝練。
綜上所述,本研究系統評價構建了指南評價條目,為指南評價指標體系的制訂和實施提供循證參考。未來建議在形成指南臨床適用性清單后,應大力推廣并為指南制訂者提供標準,進一步提高我國指南制訂質量和臨床適用性。