臨床實踐指南(CPGs)是醫療決策的核心,其評價工具如AGREE和RIGHT,致力于確保指南基于最佳證據,提升醫療質量。本文回顧了CPGs評價工具的歷史和現狀,分析了現有工具的多樣性和應用上的復雜性,以及評價結果的不一致性。本文詳細討論了現有評價工具的優缺點,并提出了未來發展的方向。建議未來應聚焦于創建更為簡潔的工具,并實施加強國際協作以及采納人工智能技術的策略。這些措施將致力于提升評價工作的效率與精確度,同時助力醫療實踐向更高水準的質量標準邁進。
版權信息: ?四川大學華西醫院華西期刊社《中國循證醫學雜志》版權所有,未經授權不得轉載、改編
臨床實踐指南(CPGs)是循證醫學資源的關鍵組成部分,并且是循證醫學原理在臨床醫療中應用的具體體現[1]。根據1990年美國醫學研究所(IOM)的經典定義,CPGs是基于系統評價的證據和平衡了不同干預措施的利弊,在此基礎上形成的能為患者提供最佳保健服務的推薦意見[2]。作為臨床醫生實施循證決策過程中的關鍵工具,CPGs在提高疾病治療成果方面扮演著重要角色[3]。研究證實,合理運用CPGs能夠帶來諸多益處,包括提升患者生存率、降低死亡率、增強護理服務的質量以及提高醫療成本效益[4]。然而,CPGs的質量參差不齊,且在實踐中的應用效果也有好有壞。如果指南執行不力,所提供的指導可能無法滿足患者的最佳利益。因此,醫療工作者有責任辨別出可靠與不可靠的指南,并利用各種評估工具來篩選出高質量的CPGs[5,6]。為了幫助醫療專業人員系統地評估CPGs的質量和適用性,研究者們開發了多種評價工具。一個全面、易于使用且高效的評價工具對于醫護人員來說至關重要,它可以輔助他們判斷CPGs的可靠性和實用性[7]。本研究旨在概述CPGs評價工具的發展歷程,并詳細介紹全球主要的評價工具,包括它們的關鍵點、優勢以及相互之間的差異。通過本研究,我們希望能夠為醫療專業人員提供一個關于如何選擇和使用這些工具的指導,以確保獲取并應用最高質量的CPGs。
1 CPGs評價工具的歷史沿革
1.1 CPGs評價工具初始階段(1992—1993年)—CPGs評價體系初步建立
1992年,Lohr K和Field M在其出版的“Guidelines for clinical practice: from development to use”一書中提出理想臨床實踐指南應該具有的8個屬性,并在此基礎上開發出了最早的臨床實踐指南質量評價工具,評價條目共有46條[1]。該工具的提出,不僅奠定了現代CPGs評價方法的基礎,也標志著對CPGs進行系統化和標準化評價的開始。從那時起,CPGs評價工具經歷了不斷的演進和完善,以適應不斷變化的醫療環境和提高臨床決策的質量。1993年,加拿大Hayward及其團隊制定的臨床實踐指南評價工具共有9條評價條目;同期,美國Selker等[8]制定的臨床實踐指南評價工具共有7條評價條目。此階段CPGs評價工具的制定團隊均來自北美洲,且內容主要聚焦于CPGs真實性、可靠性/可重復性、臨床適用性、臨床靈活性、清晰性、審查計劃和制定團隊等方面,而對CPGs的實施、傳播和評估等方面的關注不夠。
1.2 CPGs評價工具的發展階段(1995—2008年)—重視CPGs證據檢索與評估、推薦意見的制定與呈現
在該時期,共計發布了36種專門用于評估CPGs的工具,詳見附件圖1。這些工具的開發背后有著強大的國際化團隊支持,他們分別來自北美的美國和加拿大、歐洲的英國、法國、德國、意大利、西班牙等,以及澳大利亞。這些工具的設計初衷是全面提升CPGs的質量和實用性。除了重視CPGs的實施性、傳播范圍和評估效果,這些評價工具還特別增加了對CPGs中證據檢索與評估過程的關注,確保了證據的科學性和可靠性。此外,它們還專注于推薦意見的制定過程和表述方式,以提高指南的清晰度和臨床醫生的接受度。這些評價工具的推出,標志著CPGs評價體系的一次重大進步。
1.3 CPGs評價工具的完善階段(2009年至今)—考慮多種因素完善CPGs評價工具
在2009年,AGREE國際協作組織對原先的AGREE工具進行了修訂,發布了更新版AGREE II。這一版本對CPGs的質量保證和成功實施具有顯著影響,其有效性已經得到了國際衛生保健機構的廣泛認可,并被譽為CPGs質量評價的“金標準”[9,10]。隨著AGREE II的推廣應用,中國學者也基于此框架,針對國內實際情況,開發了適宜的CPGs評價體系[11]。2017年,國際實踐指南報告規范(RIGHT)的提出,為指南的報告質量提供了新的評估工具[12]。RIGHT的推出,旨在提高實踐指南報告的完整性和報告質量,幫助提升臨床實踐指南的透明度和科學性。隨后,學者們在RIGHT的基礎上開展了進一步的研究工作。到了2020年和2022年,國內學者為了更好地適應CPGs的適用性和實施性,分別開發了相應的評價工具[13,14]。這些工具的出現,雖然從不同角度對CPGs進行了評價,但它們在全面反映CPGs的質量和實施效果方面仍有待提高。鑒于此,2021年世界衛生組織和中華醫學會雜志社聯合成立了專家工作組,共同開發了一種綜合評價CPGs科學性(scientific)、透明性(transparent)和適用性(applicable)的評級工具,簡稱“STAR”[15]。STAR工具的開發,標志著對CPGs評價體系的進一步豐富和完善,旨在更全面地評估和提升CPGs的質量和實施效果。
此外,一些研究者也對這些評價工具做了階段性的總結。在2000年,Graham[7]及其同事進行了一項開創性的比較研究,評估了15種CPGs的質量評價工具,這些工具涉及8~142個指標或條目。繼此之后,2005年Vlayen等[6]對24種不同的CPGs評價工具進行了全面的匯總與分析。延續這一研究脈絡,在2013年,Siering和同事們對1995年至2011年期間發布的CPGs評價相關的原始和綜述研究進行了綜合性分析,并歸納了40種不同的評價工具[16],這些工具專注于評估CPGs在多個質量相關的維度上的表現。
這一發展過程體現了CPGs評價工具從初步的評估到多維度、系統化評價的演變,以及不斷追求更高科學性和適用性的發展趨勢。隨著醫療實踐和研究的不斷進步,評價工具也在不斷地更新和完善,以期為醫療專業人員、患者和政策制定者提供更全面、更精確的評估方法,促進CPGs的高質量發展。
2 CPGs評價工具的現狀
基于現有研究,我們將進一步深化對幾種廣泛應用的CPGs評價工具及其衍生版本的分析。我們的分析將覆蓋五個關鍵維度:方法學質量、報告質量、指南的適用性、實施可行性以及整體評級。在這一過程中,我們將綜合評估這些工具的推出時間、主要服務的用戶群體以及它們各自的評價指標體系。所有這些綜合分析的結果見附件圖2,以便更直觀地理解各工具的特點和應用情況。
2.1 方法學質量
方法學質量評價主要關注CPGs制定過程中是否采用了科學嚴謹的方法,包括CPGs的制定是否基于充分的證據、是否有明確的制定流程、是否使用了合適的證據評價和推薦意見形成的方法等,表1概述了不同的方法學質量評價工具的特征。

2.1.1 AGREE
AGREE是由13個國家的研究者于2003年共同開發的一種用于評估CPGs方法學質量的常用工具,并且由AGREE國際協作組織于2009年對其進行修訂后推出了AGREEⅡ[9,17]。該工具已經被翻譯成包括中文在內的多種語言版本。在非英語地區,推薦使用經過AGREE II國際協作組織認可的翻譯版本。雖然AGREE II是一個廣泛使用的CPGs評估工具,但在評估某些特定類型的指南時也可能存在條目覆蓋不足、缺乏針對性等問題,為了解決這些問題,AGREE II的擴展版被開發出來,以提供更加專門化和針對性的評估工具。該工作組目前已經制定了4種擴展版本,其包括最佳推薦意見(AGREE-REX)、衛生系統(AGREE-HS)、全球評定量表(AGREE-GRS)、外科干預(AGREE-S)[18-21]。AGREE-REX是對AGREEⅡ的補充,其專門評估CPGs中推薦意見的質量,確保其在臨床應用是的可靠性和可實施性;AGREE-HS是專為評估衛生系統指南而設計,旨在解決衛生系統決策挑戰;AGREE-GRS則是一個國際性的工具,其強調了指南需要適應不同文化和衛生保健環境的重要性,以確保其在全球范圍內的適用性;而AGREE-S是專為外科干預相關的指南制定和評估而設計的,其提供了一套專門針對外科手術和干預措施的評估標準,以確保指南在外科領域的適用性和質量。
2.1.2 AGREE-China
AGREE II作為一個國際廣泛認可的臨床實踐指南評估工具,雖然具有很多優勢,但在中國的實際情況下存在一些局限性:① AGREE Ⅱ不僅要求評價者有專業的知識背景,還要對CPGs的制定過程和循證醫學基本概念(如證據分級系統、證據檢索方法)等知識比較熟悉,這限制了其在我國的應用;② AGREE Ⅱ中每個條目的權重都一樣,但實際上不同條目的重要性存在不同;③ AGREE II中的一些條目并不適用于中國的情況,例如審核工具等。因此,王吉耀等循證醫學專家基于國外公認的AGREE Ⅱ的框架并結合現階段針對中國CPGs評價工作需要,制定了具有與AGREEⅡ實質性等效的AGREE-China[22]。AGREE-China是為了滿足中國特定需求而設計的CPGs評估工具,它通過為指南條目分配不同的權重、剔除不適宜的條目,并引入與中國實際情況相契合的條目,來提升評估的科學性和適用性。此外,AGREE-China優化了評估流程,有效縮短了評估時間,提高了評估工作的效率。該工具包括15個條目和1條整體評價,其涵蓋了科學性/嚴謹性、有效性/安全性、經濟型、可用性/可行性和利益沖突5個領域。每個條目的評分采用李克特(Likert)等級評分量表進行評估,并根據條目的重要性不同而給予不同的權重,進而計算不同領域和整個量表的總分,其分數越高則CPGs的質量越高。
2.2 報告質量
報告質量評價則側重于指南報告是否清晰、完整,是否提供了足夠的信息以供使用者理解和應用。表2概述了不同的報告質量評價工具的特征。

2.2.1 RIGHT
RIGHT是由中國學者牽頭,并與來自世界各地的專家共同制定的一種用于評估CPGs報告質量的工具。該清單由22個被認為對良好報告CPGs至關重要的條目組成,共涉及7大領域,旨在為衛生政策與體系、公共衛生和臨床實踐領域的指南提供報告規范,幫助提高CPGs的完整性和報告質量[12]。RIGHT規范已被翻譯成包括中文在內的4種語言,并且得到了超過25個國家研究人員的引用和世界衛生組織指南的遵循。
隨著不同領域對指南報告規范的特定需求增加,RIGHT工作組開發了擴展版,以滿足特定領域或類型的指南報告需求。目前已發表的擴展版包括介紹和解釋(RIGHT for Introduction And Interpretation)、針刺指南(RIGHT for Acupuncture)、中醫藥指南(RIGHT-TCM)、患者指南(RIGHT-PVG)、指南改編(RIGHT-Ad@pt)、中成藥指南(RIGHT for CPM)[23-28]。
2.2.2 更新指南報告清單(CheckUp)
CheckUp可用于評估更新指南中報告的完整性,并作為告知指南制定者報告要求的工具[29]。該清單包括16個條目,可大致分為介紹、編輯獨立性和采用的方法三個領域。該工具特別強調透明度的重要性,通過評估指南的報告質量,包括是否明確報告了評價問題和方法、是否充分描述了納入研究、是否評價了納入研究的偏倚風險等因素,從而提高指南的透明度。另外,該工具還納入了影響指南質量的關鍵因素,如指南的應用性、透明性和前瞻性注冊等,這些都是提升指南透明度的重要方面。因此,遵守CheckUp可能會提高CPGs更新的全面性和透明度,從而造福患者和公眾、醫療保健專業人員和其他相關利益相關者。
2.2.3 指南標準化會議(COGS)臨床實踐指南報告規范
2002年4月召開了COGS,以確定指南報告的標準,從而提高指南質量并促進其實施[30]。COGS報告規范通過提供一個標準化的模板和詳細列出所有必要信息,確保了臨床實踐指南報告的準確性和完整性。在必要時,該規范還可能具有強制性,要求所有相關企業或部門遵守,以減少因信息缺失或錯誤而造成的質量缺陷,并促進制定更易于實施的建議聲明。
2.2.4 AGREE報告清單
AGREE 報告清單納入了AGREE II的內容,以概述實現高質量實踐指南所需的報告標準,旨在提高CPGs的報告的全面性、完整性和透明度[10]。它包括6個領域的23個項目(每個項目都有特定的報告標準),其結構和設計與AGREE II一致。
2.4 指南臨床適用性評價工具
臨床適用性是評價CPGs推薦意見是否能在臨床實踐中推廣使用的重要指標,高臨床適用性的CPGs可充分發揮其臨床指導作用。CPGs臨床適應性評價工具旨在定量評估CPGs的臨床適用性,進而促進CPGs的臨床應用。該工具包括評價者基本信息和評價條目兩個部分,其中12個條目共涵蓋可獲得性、可讀性、可接受性和可行性4個領域[13]。
2.5 臨床實踐指南實施性評價工具
CPGs實施性評價工具是由臨床相關專業醫生和指南制訂方法學專家共同制定的工具,旨在為評價CPGs實施性提供標準和方法。該工具包括5個評價領域(可及性、溝通性、可執行性、易識別性和應用性)共7個評價條目,其表面效度和內容效度均良好[14]。
2.6 STAR
STAR評級工具是由中華醫學會雜志社指南與標準研究中心聯合世界衛生組織指南實施與知識轉化合作中心研發的一套指南評級體系。該工具的研發旨在滿足中國指南綜合評價的需求,通過科學性、透明性、適用性的多維度評級,為醫務人員推薦高質量指南和共識提供參考。STAR評級工具的研發采用了多種方法,包括概況性評價、德爾菲調查、層次分析法、共識會議以及信度、效度和易用性測試。該工具包含11個不同權重的領域和39個條目,并采用層次分析法確定了條目權重,以全面評估指南的質量[15]。該工具通過增加“注冊”“計劃書”“可及性”等新的領域、全面的信效度和易用性驗證、公開評價全過程等手段,有效解決了現有CPGs評價方法和工具存在的條目覆蓋面不足、驗證不充分、維度單一和評價工作量大的問題。
3 CPGs評價工具存在的問題和對策
盡管CPGs評價工具種類繁多,為醫療專業人員提供了有力的質量評估手段,它們在實際應用過程中仍遭遇不少挑戰。這些挑戰包括對評價者進行專業培訓的必要性、評價條目權重的恰當分配、條目對不同類型指南的適用性,以及評價工作本身所需的時間投入等。評價工具的多樣性雖然為使用者提供了豐富的選擇,但也可能導致選擇上的困惑,而工具的復雜性可能限制了它們在日常臨床工作中的應用。此外,由于不同評價工具采用的標準和關注點各異,可能會導致評價結果的不一致性,影響指南選擇和應用的確定性。
為了克服這些問題,未來的發展方向應當包括簡化和統一評價工具的設計,以提升其用戶友好度和廣泛應用的可能性;增強國際合作,確保評價工具能夠適應不同國家和地區的醫療實踐需求;融入人工智能和機器學習技術,以提高評價過程的自動化和智能化,減少人為因素的干擾,提高評價效率和準確性。通過這些措施,可以期待CPGs評價工具在未來能夠更加精準、高效地服務于醫療質量的提升和患者護理的改善。
綜上所述,CPGs評價工具的共同宗旨在于提升臨床指南的質量和透明度,確保這些指南建立在最可靠的證據基礎之上,并滿足其既定的應用目標。隨著醫療領域的持續進步和研究的深入,這些評價工具也在經歷著不斷的革新與完善。這些工具的發展對于提高CPGs的質量和可靠性起到了關鍵作用,它們不僅增強了指南的權威性,還推動了醫療實踐向更加規范化和標準化的方向發展。本研究的目的在于為醫療專業人員提供一個清晰的視角,幫助他們深入理解各種CPGs評價工具的特性和適用情況,使他們能夠更加高效地應用這些工具。通過這種方式,醫療專業人員可以確保患者接受到的是依據最佳科學證據所提供的醫療服務,從而提高治療的效果和安全性,同時也為醫療決策提供了堅實的支持。隨著評價工具的不斷優化,預期將進一步提升臨床實踐指南的實用性和有效性,最終實現改善患者治療效果的目標。
臨床實踐指南(CPGs)是循證醫學資源的關鍵組成部分,并且是循證醫學原理在臨床醫療中應用的具體體現[1]。根據1990年美國醫學研究所(IOM)的經典定義,CPGs是基于系統評價的證據和平衡了不同干預措施的利弊,在此基礎上形成的能為患者提供最佳保健服務的推薦意見[2]。作為臨床醫生實施循證決策過程中的關鍵工具,CPGs在提高疾病治療成果方面扮演著重要角色[3]。研究證實,合理運用CPGs能夠帶來諸多益處,包括提升患者生存率、降低死亡率、增強護理服務的質量以及提高醫療成本效益[4]。然而,CPGs的質量參差不齊,且在實踐中的應用效果也有好有壞。如果指南執行不力,所提供的指導可能無法滿足患者的最佳利益。因此,醫療工作者有責任辨別出可靠與不可靠的指南,并利用各種評估工具來篩選出高質量的CPGs[5,6]。為了幫助醫療專業人員系統地評估CPGs的質量和適用性,研究者們開發了多種評價工具。一個全面、易于使用且高效的評價工具對于醫護人員來說至關重要,它可以輔助他們判斷CPGs的可靠性和實用性[7]。本研究旨在概述CPGs評價工具的發展歷程,并詳細介紹全球主要的評價工具,包括它們的關鍵點、優勢以及相互之間的差異。通過本研究,我們希望能夠為醫療專業人員提供一個關于如何選擇和使用這些工具的指導,以確保獲取并應用最高質量的CPGs。
1 CPGs評價工具的歷史沿革
1.1 CPGs評價工具初始階段(1992—1993年)—CPGs評價體系初步建立
1992年,Lohr K和Field M在其出版的“Guidelines for clinical practice: from development to use”一書中提出理想臨床實踐指南應該具有的8個屬性,并在此基礎上開發出了最早的臨床實踐指南質量評價工具,評價條目共有46條[1]。該工具的提出,不僅奠定了現代CPGs評價方法的基礎,也標志著對CPGs進行系統化和標準化評價的開始。從那時起,CPGs評價工具經歷了不斷的演進和完善,以適應不斷變化的醫療環境和提高臨床決策的質量。1993年,加拿大Hayward及其團隊制定的臨床實踐指南評價工具共有9條評價條目;同期,美國Selker等[8]制定的臨床實踐指南評價工具共有7條評價條目。此階段CPGs評價工具的制定團隊均來自北美洲,且內容主要聚焦于CPGs真實性、可靠性/可重復性、臨床適用性、臨床靈活性、清晰性、審查計劃和制定團隊等方面,而對CPGs的實施、傳播和評估等方面的關注不夠。
1.2 CPGs評價工具的發展階段(1995—2008年)—重視CPGs證據檢索與評估、推薦意見的制定與呈現
在該時期,共計發布了36種專門用于評估CPGs的工具,詳見附件圖1。這些工具的開發背后有著強大的國際化團隊支持,他們分別來自北美的美國和加拿大、歐洲的英國、法國、德國、意大利、西班牙等,以及澳大利亞。這些工具的設計初衷是全面提升CPGs的質量和實用性。除了重視CPGs的實施性、傳播范圍和評估效果,這些評價工具還特別增加了對CPGs中證據檢索與評估過程的關注,確保了證據的科學性和可靠性。此外,它們還專注于推薦意見的制定過程和表述方式,以提高指南的清晰度和臨床醫生的接受度。這些評價工具的推出,標志著CPGs評價體系的一次重大進步。
1.3 CPGs評價工具的完善階段(2009年至今)—考慮多種因素完善CPGs評價工具
在2009年,AGREE國際協作組織對原先的AGREE工具進行了修訂,發布了更新版AGREE II。這一版本對CPGs的質量保證和成功實施具有顯著影響,其有效性已經得到了國際衛生保健機構的廣泛認可,并被譽為CPGs質量評價的“金標準”[9,10]。隨著AGREE II的推廣應用,中國學者也基于此框架,針對國內實際情況,開發了適宜的CPGs評價體系[11]。2017年,國際實踐指南報告規范(RIGHT)的提出,為指南的報告質量提供了新的評估工具[12]。RIGHT的推出,旨在提高實踐指南報告的完整性和報告質量,幫助提升臨床實踐指南的透明度和科學性。隨后,學者們在RIGHT的基礎上開展了進一步的研究工作。到了2020年和2022年,國內學者為了更好地適應CPGs的適用性和實施性,分別開發了相應的評價工具[13,14]。這些工具的出現,雖然從不同角度對CPGs進行了評價,但它們在全面反映CPGs的質量和實施效果方面仍有待提高。鑒于此,2021年世界衛生組織和中華醫學會雜志社聯合成立了專家工作組,共同開發了一種綜合評價CPGs科學性(scientific)、透明性(transparent)和適用性(applicable)的評級工具,簡稱“STAR”[15]。STAR工具的開發,標志著對CPGs評價體系的進一步豐富和完善,旨在更全面地評估和提升CPGs的質量和實施效果。
此外,一些研究者也對這些評價工具做了階段性的總結。在2000年,Graham[7]及其同事進行了一項開創性的比較研究,評估了15種CPGs的質量評價工具,這些工具涉及8~142個指標或條目。繼此之后,2005年Vlayen等[6]對24種不同的CPGs評價工具進行了全面的匯總與分析。延續這一研究脈絡,在2013年,Siering和同事們對1995年至2011年期間發布的CPGs評價相關的原始和綜述研究進行了綜合性分析,并歸納了40種不同的評價工具[16],這些工具專注于評估CPGs在多個質量相關的維度上的表現。
這一發展過程體現了CPGs評價工具從初步的評估到多維度、系統化評價的演變,以及不斷追求更高科學性和適用性的發展趨勢。隨著醫療實踐和研究的不斷進步,評價工具也在不斷地更新和完善,以期為醫療專業人員、患者和政策制定者提供更全面、更精確的評估方法,促進CPGs的高質量發展。
2 CPGs評價工具的現狀
基于現有研究,我們將進一步深化對幾種廣泛應用的CPGs評價工具及其衍生版本的分析。我們的分析將覆蓋五個關鍵維度:方法學質量、報告質量、指南的適用性、實施可行性以及整體評級。在這一過程中,我們將綜合評估這些工具的推出時間、主要服務的用戶群體以及它們各自的評價指標體系。所有這些綜合分析的結果見附件圖2,以便更直觀地理解各工具的特點和應用情況。
2.1 方法學質量
方法學質量評價主要關注CPGs制定過程中是否采用了科學嚴謹的方法,包括CPGs的制定是否基于充分的證據、是否有明確的制定流程、是否使用了合適的證據評價和推薦意見形成的方法等,表1概述了不同的方法學質量評價工具的特征。

2.1.1 AGREE
AGREE是由13個國家的研究者于2003年共同開發的一種用于評估CPGs方法學質量的常用工具,并且由AGREE國際協作組織于2009年對其進行修訂后推出了AGREEⅡ[9,17]。該工具已經被翻譯成包括中文在內的多種語言版本。在非英語地區,推薦使用經過AGREE II國際協作組織認可的翻譯版本。雖然AGREE II是一個廣泛使用的CPGs評估工具,但在評估某些特定類型的指南時也可能存在條目覆蓋不足、缺乏針對性等問題,為了解決這些問題,AGREE II的擴展版被開發出來,以提供更加專門化和針對性的評估工具。該工作組目前已經制定了4種擴展版本,其包括最佳推薦意見(AGREE-REX)、衛生系統(AGREE-HS)、全球評定量表(AGREE-GRS)、外科干預(AGREE-S)[18-21]。AGREE-REX是對AGREEⅡ的補充,其專門評估CPGs中推薦意見的質量,確保其在臨床應用是的可靠性和可實施性;AGREE-HS是專為評估衛生系統指南而設計,旨在解決衛生系統決策挑戰;AGREE-GRS則是一個國際性的工具,其強調了指南需要適應不同文化和衛生保健環境的重要性,以確保其在全球范圍內的適用性;而AGREE-S是專為外科干預相關的指南制定和評估而設計的,其提供了一套專門針對外科手術和干預措施的評估標準,以確保指南在外科領域的適用性和質量。
2.1.2 AGREE-China
AGREE II作為一個國際廣泛認可的臨床實踐指南評估工具,雖然具有很多優勢,但在中國的實際情況下存在一些局限性:① AGREE Ⅱ不僅要求評價者有專業的知識背景,還要對CPGs的制定過程和循證醫學基本概念(如證據分級系統、證據檢索方法)等知識比較熟悉,這限制了其在我國的應用;② AGREE Ⅱ中每個條目的權重都一樣,但實際上不同條目的重要性存在不同;③ AGREE II中的一些條目并不適用于中國的情況,例如審核工具等。因此,王吉耀等循證醫學專家基于國外公認的AGREE Ⅱ的框架并結合現階段針對中國CPGs評價工作需要,制定了具有與AGREEⅡ實質性等效的AGREE-China[22]。AGREE-China是為了滿足中國特定需求而設計的CPGs評估工具,它通過為指南條目分配不同的權重、剔除不適宜的條目,并引入與中國實際情況相契合的條目,來提升評估的科學性和適用性。此外,AGREE-China優化了評估流程,有效縮短了評估時間,提高了評估工作的效率。該工具包括15個條目和1條整體評價,其涵蓋了科學性/嚴謹性、有效性/安全性、經濟型、可用性/可行性和利益沖突5個領域。每個條目的評分采用李克特(Likert)等級評分量表進行評估,并根據條目的重要性不同而給予不同的權重,進而計算不同領域和整個量表的總分,其分數越高則CPGs的質量越高。
2.2 報告質量
報告質量評價則側重于指南報告是否清晰、完整,是否提供了足夠的信息以供使用者理解和應用。表2概述了不同的報告質量評價工具的特征。

2.2.1 RIGHT
RIGHT是由中國學者牽頭,并與來自世界各地的專家共同制定的一種用于評估CPGs報告質量的工具。該清單由22個被認為對良好報告CPGs至關重要的條目組成,共涉及7大領域,旨在為衛生政策與體系、公共衛生和臨床實踐領域的指南提供報告規范,幫助提高CPGs的完整性和報告質量[12]。RIGHT規范已被翻譯成包括中文在內的4種語言,并且得到了超過25個國家研究人員的引用和世界衛生組織指南的遵循。
隨著不同領域對指南報告規范的特定需求增加,RIGHT工作組開發了擴展版,以滿足特定領域或類型的指南報告需求。目前已發表的擴展版包括介紹和解釋(RIGHT for Introduction And Interpretation)、針刺指南(RIGHT for Acupuncture)、中醫藥指南(RIGHT-TCM)、患者指南(RIGHT-PVG)、指南改編(RIGHT-Ad@pt)、中成藥指南(RIGHT for CPM)[23-28]。
2.2.2 更新指南報告清單(CheckUp)
CheckUp可用于評估更新指南中報告的完整性,并作為告知指南制定者報告要求的工具[29]。該清單包括16個條目,可大致分為介紹、編輯獨立性和采用的方法三個領域。該工具特別強調透明度的重要性,通過評估指南的報告質量,包括是否明確報告了評價問題和方法、是否充分描述了納入研究、是否評價了納入研究的偏倚風險等因素,從而提高指南的透明度。另外,該工具還納入了影響指南質量的關鍵因素,如指南的應用性、透明性和前瞻性注冊等,這些都是提升指南透明度的重要方面。因此,遵守CheckUp可能會提高CPGs更新的全面性和透明度,從而造福患者和公眾、醫療保健專業人員和其他相關利益相關者。
2.2.3 指南標準化會議(COGS)臨床實踐指南報告規范
2002年4月召開了COGS,以確定指南報告的標準,從而提高指南質量并促進其實施[30]。COGS報告規范通過提供一個標準化的模板和詳細列出所有必要信息,確保了臨床實踐指南報告的準確性和完整性。在必要時,該規范還可能具有強制性,要求所有相關企業或部門遵守,以減少因信息缺失或錯誤而造成的質量缺陷,并促進制定更易于實施的建議聲明。
2.2.4 AGREE報告清單
AGREE 報告清單納入了AGREE II的內容,以概述實現高質量實踐指南所需的報告標準,旨在提高CPGs的報告的全面性、完整性和透明度[10]。它包括6個領域的23個項目(每個項目都有特定的報告標準),其結構和設計與AGREE II一致。
2.4 指南臨床適用性評價工具
臨床適用性是評價CPGs推薦意見是否能在臨床實踐中推廣使用的重要指標,高臨床適用性的CPGs可充分發揮其臨床指導作用。CPGs臨床適應性評價工具旨在定量評估CPGs的臨床適用性,進而促進CPGs的臨床應用。該工具包括評價者基本信息和評價條目兩個部分,其中12個條目共涵蓋可獲得性、可讀性、可接受性和可行性4個領域[13]。
2.5 臨床實踐指南實施性評價工具
CPGs實施性評價工具是由臨床相關專業醫生和指南制訂方法學專家共同制定的工具,旨在為評價CPGs實施性提供標準和方法。該工具包括5個評價領域(可及性、溝通性、可執行性、易識別性和應用性)共7個評價條目,其表面效度和內容效度均良好[14]。
2.6 STAR
STAR評級工具是由中華醫學會雜志社指南與標準研究中心聯合世界衛生組織指南實施與知識轉化合作中心研發的一套指南評級體系。該工具的研發旨在滿足中國指南綜合評價的需求,通過科學性、透明性、適用性的多維度評級,為醫務人員推薦高質量指南和共識提供參考。STAR評級工具的研發采用了多種方法,包括概況性評價、德爾菲調查、層次分析法、共識會議以及信度、效度和易用性測試。該工具包含11個不同權重的領域和39個條目,并采用層次分析法確定了條目權重,以全面評估指南的質量[15]。該工具通過增加“注冊”“計劃書”“可及性”等新的領域、全面的信效度和易用性驗證、公開評價全過程等手段,有效解決了現有CPGs評價方法和工具存在的條目覆蓋面不足、驗證不充分、維度單一和評價工作量大的問題。
3 CPGs評價工具存在的問題和對策
盡管CPGs評價工具種類繁多,為醫療專業人員提供了有力的質量評估手段,它們在實際應用過程中仍遭遇不少挑戰。這些挑戰包括對評價者進行專業培訓的必要性、評價條目權重的恰當分配、條目對不同類型指南的適用性,以及評價工作本身所需的時間投入等。評價工具的多樣性雖然為使用者提供了豐富的選擇,但也可能導致選擇上的困惑,而工具的復雜性可能限制了它們在日常臨床工作中的應用。此外,由于不同評價工具采用的標準和關注點各異,可能會導致評價結果的不一致性,影響指南選擇和應用的確定性。
為了克服這些問題,未來的發展方向應當包括簡化和統一評價工具的設計,以提升其用戶友好度和廣泛應用的可能性;增強國際合作,確保評價工具能夠適應不同國家和地區的醫療實踐需求;融入人工智能和機器學習技術,以提高評價過程的自動化和智能化,減少人為因素的干擾,提高評價效率和準確性。通過這些措施,可以期待CPGs評價工具在未來能夠更加精準、高效地服務于醫療質量的提升和患者護理的改善。
綜上所述,CPGs評價工具的共同宗旨在于提升臨床指南的質量和透明度,確保這些指南建立在最可靠的證據基礎之上,并滿足其既定的應用目標。隨著醫療領域的持續進步和研究的深入,這些評價工具也在經歷著不斷的革新與完善。這些工具的發展對于提高CPGs的質量和可靠性起到了關鍵作用,它們不僅增強了指南的權威性,還推動了醫療實踐向更加規范化和標準化的方向發展。本研究的目的在于為醫療專業人員提供一個清晰的視角,幫助他們深入理解各種CPGs評價工具的特性和適用情況,使他們能夠更加高效地應用這些工具。通過這種方式,醫療專業人員可以確保患者接受到的是依據最佳科學證據所提供的醫療服務,從而提高治療的效果和安全性,同時也為醫療決策提供了堅實的支持。隨著評價工具的不斷優化,預期將進一步提升臨床實踐指南的實用性和有效性,最終實現改善患者治療效果的目標。