引用本文: 劉崢, 楊春松, 曾力楠, 賈知軍, 成果, 余勤, 吳瑾, 張伶俐. 第三代非甾體類芳香化酶抑制劑治療矮身材兒童有效性與安全性的系統評價. 中國循證醫學雜志, 2024, 24(4): 429-438. doi: 10.7507/1672-2531.202307118 復制
版權信息: ?四川大學華西醫院華西期刊社《中國循證醫學雜志》版權所有,未經授權不得轉載、改編
矮身材是指在相似的生活環境下,個體身高明顯低于同種族、同性別、同年齡的正常人群平均身高2個標準差或低于第3百分位數。據報道,目前我國約有3.7%的兒童存在身材矮小等生長發育障礙,男孩與女孩的患病率相當,且高發于西南部、農村等不發達地區[1],其中,4~15歲需要治療的生長遲緩兒童約有700萬[2]。導致兒童身材矮小的原因較多,包括遺傳、環境、營養、睡眠、運動量及內分泌等因素,主要常見于特發性矮小癥(idiopathic short stature,ISS)、生長激素缺乏癥(growth hormone deficiency,GHD)、小于胎齡兒(small for gestational age,SGA)等人群。身材矮小往往影響患兒的身心發育,并容易出現自卑、抑郁、社交退縮等心理或行為障礙,影響升學、就業和人際關系質量[3]。隨著社會競爭和生活壓力的不斷增大,當代家長的“育兒焦慮”使其對孩子身高的期望值越來越高,目前身材矮小已成為小兒內分泌科的主要就診原因之一[4]。
臨床上常用于治療身材矮小的藥物為重組人生長激素(recombinant human growth hormone,rhGH),經國內外大量臨床實踐證明,rhGH能有效提高矮身材兒童的生長速率并改善最終成年身高[5]。由于我國矮身材兒童患者多,疾病知曉率、就診率及治療率較低,目前臨床上存在大量青春中晚期的矮小患者,該部分患者由于錯過最佳治療時機,就診時骨齡偏大,生長潛能受限,從而導致rhGH的治療效果不理想。另一方面,有相關研究發現雌激素是調控骨骼生長和成熟的重要內分泌因子之一[6],這為進一步改善兒童生長發育提供了新的治療途徑。
芳香化酶是雄激素轉化為雌激素的重要限速酶,芳香化酶抑制劑(aromatase inhibitor,AIs)可通過抑制芳香化酶活性,有效降低患者體內的雌激素水平,臨床上主要用于治療絕經后晚期乳腺癌。目前應用較為廣泛的AIs為第三代非甾體類AIs,包括阿那曲唑和來曲唑,其相較于甾體類AIs以及第一、二代非甾體類AIs具有更高的選擇性和可逆性。基于AIs的藥理特點,有研究指出AIs可通過減少雌激素的生物合成,調控骨骼分化過程,延遲骨骺閉合,延長rhGH的促生長效應,進而改善矮身材患兒的終身高[7]。然而,AIs用于治療矮身材屬于明確的超說明書用藥。目前已有小樣本的臨床研究報道了AIs在矮身材兒童中的應用情況,但檢驗效能不高,尚無足夠證據支持AIs在兒科患者中的使用,此外,性激素水平變化帶來的潛在不良反應風險尚不清楚。既往一項研究[8]綜合評估了AIs治療矮身材的風險與獲益,但由于納入文獻不足,僅進行了描述性分析,無法有效指導臨床實踐。因此,本研究擬通過Meta分析整合現有最新證據,系統評價第三代非甾體類AIs治療矮身材兒童的有效性與安全性,旨在為臨床合理用藥提供循證參考。
1 資料與方法
1.1 納入與排除標準
1.1.1 研究類型
隨機對照試驗(randomized controlled trial,RCT)、隊列研究。
1.1.2 研究對象
年齡小于18歲且身高低于同種族、同性別、同年齡正常健康兒童平均身高2個標準差或第3百分位數的矮身材兒童患者。
1.1.3 干預措施
試驗組采用AIs(來曲唑或阿那曲唑)聯合rhGH治療,對照組采用rhGH治療。
1.1.4 結局指標
① 有效性:主要結局指標為最終成年身高(final adult height,FAH),次要結局指標為治療結束時的身高、預測成年身高(predict adult height,PAH)、預測成年身高差值(△PAH)、骨齡(bone age,BA)、骨齡差值/實際年齡差值(△BA/△CA)、生長速率(growth velocity,GV);② 安全性:不良事件發生類型及發生率,分類標準參照MedDRA 20.1[9]。
1.1.5 排除標準
① 重復發表文獻;② 無法獲取全文的文獻;③ 非中、英文文獻。
1.2 文獻檢索策略
計算機檢索PubMed、Embase、Cochrane Library、CNKI、WanFang Data、VIP和CBM數據,收集rhGH聯合或不聯合第三代非甾體類AIs治療矮小身材兒童的相關臨床研究,檢索時限均從建庫至2022年12月28日。追溯納入文獻的參考文獻,以補充檢索符合納入標準的相關文獻。檢索采用主題詞和自由詞結合的方式進行,并根據各數據庫特點進行相應調整。中文檢索詞包括:芳香化酶抑制劑、來曲唑、阿那曲唑、兒童、矮小等;英文檢索詞包括:aromatase inhibitor*、letrozole、anastrozole、child*、short stature等。以PubMed為例,具體檢索策略見附件框1。
1.3 文獻篩選與資料提取
由兩名研究者根據納入與排除標準獨立篩選文獻、提取資料并交叉核對,如遇分歧,則通過討論或由第三方裁定。文獻篩選時首先閱讀標題和摘要,在排除明顯不相關的文獻后,進一步閱讀全文,以確定最終是否納入。根據研究目的設計統一的資料提取表,以10%的文獻進行預試驗,修訂資料提取表并制定填表說明。資料提取內容包括:① 納入研究的基本信息:第一作者、發表年份、國家、研究類型;② 研究對象的基本特征:樣本量、性別、年齡;③ 干預措施:藥品名稱、劑量、用藥頻次、療程;④ 結局指標:包括有效性和安全性指標;⑤ 偏倚風險評價的關鍵要素。此外,通過郵件、電話聯系等方式向原始研究作者獲取不完整或缺失的重要資料。
1.4 偏倚風險評價
由兩名研究者獨立評價納入研究的偏倚風險并交叉核對,如遇分歧,則通過討論或由第三方裁定。采用Cochrane偏倚風險評價工具2.0(ROB 2.0)評價RCT,質量評價共包括5個方面:隨機化過程中的偏倚、偏離既定干預措施的偏倚、結局數據缺失的偏倚、結局測量的偏倚以及選擇性報告結果,判斷結果分為“低偏倚風險”“高偏倚風險”“可能存在偏倚風險”(為統一說法,本研究設定該評價結果與“中等偏倚風險”等價)。采用紐卡斯爾-渥太華(the newcastle-ottawa scale,NOS)量表評價隊列研究,質量評價共包括3個方面:研究人群選擇、組間可比性、結果測量,總分為9分,并設定0~3分為高偏倚風險,4~6分為中等偏倚風險,7~9分為低偏倚風險。
1.5 統計分析
采用RevMan 5.3軟件進行Meta分析。計量資料采用均數差(mean difference,MD)表示合并效應量,計數資料采用相對危險度(relative risk,RR)表示合并效應量,并采用95%可信區間(confidence interval,CI)表示各效應量的區間估計。對納入研究采用χ2檢驗進行異質性分析(檢驗水準為α=0.1),結合I2定量判斷異質性大小。當P>0.10且I2≤50%時,可認為各研究結果間無統計學異質性,采用固定效應模型進行Meta分析;反之,則進一步分析異質性來源,在排除明顯臨床異質性的影響后,采用隨機效應模型進行Meta分析。對于無法定量合并的結果采用描述性分析。采用Stata 15.0軟件對納入研究數量≥10個的結局指標進行Egger’s檢驗,當P>0.05 時表明無明顯發表偏倚,反之則提示可能存在發表偏倚,并采用剪補法校正合并結果。采用逐一剔除法進行敏感性分析,驗證研究結果的穩定性。P<0.05為差異有統計學意義。
2 結果
2.1 文獻檢索結果
初檢共獲得相關文獻2 818篇,經閱讀標題、摘要及全文后,最終共納入文獻18篇[10-27],其中中文文獻14篇[12-17, 19-26],英文文獻4篇[10, 11, 18, 27]。文獻篩選流程及結果見附件圖1。
2.2 納入研究的基本特征及偏倚風險評價結果
共納入18篇文獻,包括9項RCT[10, 11, 14, 18-23]和9項隊列研究[12, 13, 15-17, 24-27]。納入文獻共包括1 053例患者,其中男孩1 028例,女孩25例。研究分別來自中國(n=14)[12-17, 19-26]、美國(n=3)[11, 18, 27]和法國(n=1)[10]。納入的9項RCT中,1項研究為低偏倚風險[10],6項研究為中偏倚風險[14, 19-23],2項研究為高偏倚風險[11, 18];納入的9項隊列研究中,3項研究為低偏倚風險[15, 24, 25],6項研究為中偏倚風險[12, 13, 16, 17, 26, 27]。納入文獻的基本特征及偏倚風險評價結果見表1。

2.3 有效性評價
2.3.1 FAH
共4項研究[10-13]報道了AIs對矮身材兒童FAH的影響,包括2項RCT和2項隊列研究,各研究間無統計學異質性(I2=0%,P=0.45),采用固定效應模型進行Meta分析,結果顯示,試驗組患者的FAH高于對照組,差異有統計學意義[MD=2.48,95%CI(2.02,2.94),P<0.01]。其中,2項RCT[10, 11]的Meta分析結果顯示,試驗組患者的FAH高于對照組,差異有統計學意義[MD=2.22,95%CI(1.39,3.05),P<0.01],2項隊列研究[12, 13]的Meta分析結果顯示,試驗組患者的FAH高于對照組,差異有統計學意義[MD=2.60,95%CI(2.04,3.15),P<0.01](表2)。

2.3.2 結束治療時身高
共6項研究[14-19]報道了矮身材兒童結束治療時身高,包括3項RCT和3項隊列研究,各研究間有統計學異質性(I2=91%,P<0.01),采用隨機效應模型進行Meta分析,結果顯示,試驗組患者結束治療時身高高于對照組,但差異無統計學意義[MD=4.03,95%CI(?0.01,8.06),P=0.05]。其中,3項RCT[14, 18, 19]的Meta分析結果顯示,試驗組患者結束治療時身高高于對照組,但差異無統計學意義[MD=3.89,95%CI(?4.91,12.70),P=0.39],3項隊列研究[15-17]的Meta分析結果顯示,試驗組患者結束治療時身高高于對照組,差異有統計學意義[MD=4.01,95%CI(2.40,5.62),P<0.01](表2)。
2.3.3 結束治療時PAH
共9項研究[10, 14, 15, 20-25]報道了矮身材兒童結束治療時PAH,包括6項RCT和3項隊列研究,各研究間有統計學異質性(I2=81%,P<0.01),采用隨機效應模型進行Meta分析,結果顯示,試驗組患者結束治療時PAH高于對照組,差異有統計學意義[MD=4.27,95%CI(2.71,5.83),P<0.01]。其中,6項RCT[10, 14, 20-23]的Meta分析結果顯示,試驗組患者結束治療時PAH高于對照組,差異有統計學意義[MD=4.06,95%CI(2.08,6.04),P<0.01],3項隊列研究[15, 24, 25]的Meta分析結果顯示,試驗組患者結束治療時PAH高于對照組,差異有統計學意義[MD=5.26,95%CI(4.08,6.44),P<0.01](表2)。
2.3.4 結束治療時△PAH
共5項研究[16-18, 20, 26]報道了矮身材兒童結束治療時△PAH,包括2項RCT和3項隊列研究,各研究間有統計學異質性(I2=78%,P<0.01),采用隨機效應模型進行Meta分析,結果顯示,試驗組患者結束治療時△PAH高于對照組,差異有統計學意義[MD=4.26,95%CI(3.23,5.28),P<0.01]。其中,2項RCT[18, 20]的Meta分析結果顯示,試驗組患者結束治療時△PAH高于對照組,差異有統計學意義[MD=4.94,95%CI(3.47,6.41),P<0.01],3項隊列研究[16, 17, 26]的Meta分析結果顯示,試驗組患者結束治療時△PAH高于對照組,差異有統計學意義[MD=3.66,95%CI(2.77,4.56),P<0.01](表2)。
2.3.5 結束治療時BA
共15項研究[11, 12, 14-24, 26, 27]報道了矮身材兒童結束治療時BA,包括8項RCT和7項隊列研究,各研究間有統計學異質性(I2=91%,P<0.01),采用隨機效應模型進行Meta分析,結果顯示,試驗組患者結束治療時BA低于對照組,差異有統計學意義[MD=?0.62,95%CI(?0.89,?0.36),P<0.01]。其中,8項RCT[11, 14, 18-23]的Meta分析結果顯示,試驗組患者結束治療時BA低于對照組,差異有統計學意義[MD=?0.72,95%CI(?1.06,?0.39),P<0.01],7項隊列研究[12, 15-17, 24, 26, 27]的Meta分析結果顯示,試驗組患者結束治療時BA低于對照組,差異有統計學意義[MD=?0.49,95%CI(?0.98,?0.01),P=0.04](表2)。
2.3.6 結束治療時△BA/△CA
共4項隊列研究[13, 16, 17, 26]報道了矮身材兒童結束治療時△BA/△CA,各研究間無統計學異質性(I2=24%,P=0.27),采用固定效應模型進行Meta分析,結果顯示,試驗組患者結束治療時△BA/△CA低于對照組,差異有統計學意義[MD=?0.47,95%CI(?0.56,?0.37),P<0.01](表2)。
2.3.7 結束治療時GV
共13項研究[10, 13-15, 19-27]報道了矮身材兒童結束治療時GV,包括7項RCT和6項隊列研究,各研究間有統計學異質性(I2=92%,P<0.01),采用隨機效應模型進行Meta分析,結果顯示,試驗組患者結束治療時GV高于對照組,差異有統計學意義[MD=1.34,95%CI(0.89,1.78),P<0.01]。其中,7項RCT[10, 14, 19-23]的Meta分析結果顯示,試驗組患者結束治療時GV高于對照組,差異有統計學意義[MD=1.68,95%CI(0.80,2.57),P<0.01],6項隊列研究[13, 15, 24-27]的Meta分析結果顯示,試驗組患者結束治療時GV高于對照組,差異有統計學意義[MD=1.12,95%CI(0.48,1.77),P<0.01](表2)。
2.4 安全性評價
2.4.1 不良事件總發生率
共13項研究[10, 12-15, 17, 18, 20, 22-26]報道了不良事件總發生率,包括6項RCT和7項隊列研究,各研究間有統計學異質性(I2=33%,P=0.01),采用隨機效應模型進行Meta分析,結果顯示,試驗組的不良事件發生率高于對照組,差異有統計學意義[RR=2.10,95%CI(1.48,2.99),P<0.01]。其中,6項RCT[10, 14, 18, 20, 22, 23]的Meta分析結果顯示,試驗組的不良事件發生率高于對照組,差異有統計學意義[RR=1.95,95%CI(1.24,3.08),P<0.01],7項隊列研究[12, 13, 15, 17, 24-26]的Meta分析結果顯示,試驗組的不良事件發生率高于對照組,差異有統計學意義[RR=2.70,95%CI(1.69,4.30),P<0.01](表3)。

2.4.2 內分泌系統不良事件發生率
共8項研究[12-15, 20, 23-25]報道了內分泌系統不良事件,主要為甲狀腺功能異常、睪酮升高、皮質醇升高,包括3項RCT和5項隊列研究,各研究間無統計學異質性(I2=0%,P=0.82),采用固定效應模型進行Meta分析,結果顯示,試驗組的內分泌系統不良事件發生率高于對照組,差異有統計學意義[RR=1.81,95%CI(1.31,2.49),P<0.01]。其中,3項RCT[14, 20, 23]的Meta分析結果顯示,試驗組的內分泌系統不良事件發生率高于對照組,但差異無統計學意義[RR=2.48,95%CI(0.57,10.75),P=0.22],5項隊列研究[12, 13, 15, 24, 25]的Meta分析結果顯示,試驗組的內分泌系統不良事件發生率高于對照組,差異有統計學意義[RR=1.75,95%CI(1.27,2.41),P<0.01](表3)。
2.4.3 肝膽系統不良事件發生率
共3項隊列研究[17, 25, 26]報道了肝膽系統不良事件,主要為肝功能異常、轉氨酶升高、間接膽紅素升高,各研究間無統計學異質性(I2=0%,P=0.78),采用固定效應模型進行Meta分析,結果顯示,試驗組的肝膽系統不良事件發生率高于對照組,但差異無統計學意義[RR=3.33,95%CI(0.72,15.28),P=0.12](表3)。
2.4.4 腎臟泌尿系統不良事件發生率
共1項隊列研究[17]報道了腎臟泌尿系統不良事件,主要為肌酐升高,結果顯示,試驗組的腎臟泌尿系統不良事件發生率高于對照組,但差異無統計學意義[RR=2.83,95%CI(0.15,53.58),P=0.49](表3)。
2.4.5 代謝及營養類不良事件發生率
共4項研究[14, 15, 17, 22]報道了代謝及營養類不良事件,主要為空腹血糖升高、空腹胰島素升高、血脂異常、高尿酸血癥,包括2項RCT和2項隊列研究,各研究間有統計學異質性(I2=75%,P<0.01),采用隨機效應模型進行Meta分析,結果顯示,試驗組的代謝及營養類不良事件發生率高于對照組,但差異無統計學意義[RR=2.18,95%CI(0.32,14.72),P=0.42]。其中,2項RCT[14, 22]的Meta分析結果顯示,試驗組的代謝及營養類不良事件發生率低于對照組,但差異無統計學意義[RR=0.56,95%CI(0.12,2.51),P=0.44],2項隊列研究[15, 17]的Meta分析結果顯示,試驗組的代謝及營養類不良事件發生率高于對照組,但差異無統計學意義[RR=5.89,95%CI(0.37,94.04),P=0.21](表3)。
2.4.6 胃腸道系統不良事件發生率
共3項RCT[10, 18, 22]報道了胃腸道系統不良事件,包括嘔吐、腹痛,各研究間無統計學異質性(I2=22%,P=0.28),采用固定效應模型進行Meta分析,結果顯示,試驗組的胃腸道系統不良事件發生率高于對照組,但差異無統計學意義[RR=2.00,95%CI(0.76,5.25),P=0.16](表3)。
2.4.7 肌肉骨骼系統不良事件發生率
共10項研究[10, 14, 18, 20, 22]報道了肌肉骨骼系統不良事件,主要為膝關節疼痛、骨折、骨密度異常、脊柱側彎癥,包括5項RCT和5項隊列研究,各研究間無統計學異質性(I2=0%,P=0.87),采用固定效應模型進行Meta分析,結果顯示,試驗組的肌肉骨骼系統不良事件發生率高于對照組,但差異無統計學意義[RR=1.50,95%CI(0.91,2.46),P=0.11]。其中,5項RCT[10, 14, 18, 20, 22]的Meta分析結果顯示,試驗組的肌肉骨骼系統不良事件發生率低于對照組,但差異無統計學意義[RR=0.90,95%CI(0.38,2.15),P=0.81],5項隊列研究[13, 15, 17, 24, 26]的Meta分析結果顯示,試驗組的肌肉骨骼系統不良事件發生率高于對照組,差異有統計學意義[RR=1.89,95%CI(1.02,3.51),P=0.04](表3)。
2.4.8 皮膚及皮下組織系統不良事件發生率
共5項研究[10, 12, 17, 20, 25]報道了皮膚及皮下組織系統不良事件,主要為外陰色素沉著、毛發增多、面部痤瘡,包括2項RCT和3項隊列研究,各研究間有統計學異質性(I2=54%,P=0.04),采用隨機效應模型進行Meta分析,結果顯示,試驗組的皮膚及皮下組織系統不良事件發生率高于對照組,差異有統計學意義[RR=6.55,95%CI(2.51,17.11),P<0.01]。其中,2項RCT[10, 20]的Meta分析結果顯示,試驗組的皮膚及皮下組織系統不良事件發生率高于對照組,但差異無統計學意義[RR=6.00,95%CI(0.12,292.12),P=0.37],3項隊列研究[12, 17, 25]的Meta分析結果顯示,試驗組的皮膚及皮下組織系統不良事件發生率高于對照組,差異有統計學意義[RR=6.42,95%CI(2.41,17.06),P<0.01](表3)。
2.4.9 血液與淋巴系統不良事件發生率
共1項隊列研究[17]報道了血液與淋巴系統不良事件,主要為粒細胞減少,結果顯示,試驗組的血液與淋巴系統不良事件發生率高于對照組,但差異無統計學意義[RR=1.21,95%CI(0.05,29.16),P=0.91](表3)。
2.4.10 血管與淋巴管系統不良事件發生率
共1項隊列研究[24]報道了血管與淋巴管系統不良事件,主要為下肢水腫,結果顯示,試驗組的血管與淋巴管系統不良事件發生率高于對照組,但差異無統計學意義[RR=1.50,95%CI(0.27,8.34),P=0.64](表3)。
2.4.11 神經精神系統不良事件發生率
共2項研究[10, 17]報道了神經精神系統不良事件,主要為失眠、輕度抑郁、焦慮、嗜睡及記憶力減退,包括1項RCT和1項隊列研究,各研究間無統計學異質性(I2=0%,P=0.72),采用固定效應模型進行Meta分析,結果顯示,試驗組的神經精神系統不良事件發生率高于對照組,但差異無統計學意義[RR=1.57,95%CI(0.37,6.74),P=0.54]。其中,1項RCT[10]的Meta分析結果顯示,試驗組的神經精神系統不良事件發生率高于對照組,但差異無統計學意義[RR=1.43,95%CI(0.27,7.61),P=0.68],1項隊列研究[17]的Meta分析結果顯示,試驗組的神經精神系統不良事件發生率高于對照組,但差異無統計學意義[RR=2.02,95%CI(0.10,41.20),P=0.65](表3)。
2.5 發表偏倚
采用Egger’s檢驗進行發表偏倚評估,結果顯示,BA、GV、不良事件總發生率及肌肉骨骼系統不良事件發生率均無明顯發表偏倚(P值均>0.05)。其余結局指標由于納入研究數量少于10項,故暫未進行發表偏倚評估。
2.6 敏感性分析
采用逐一剔除法進行敏感性分析,結果顯示,在治療結束時身高方面,排除Mauras等[18]的研究后,各研究間異質性降低(I2=7%,P=0.37),且試驗組患者結束治療時身高顯著高于對照組[MD=4.49,95%CI(2.96,6.01),P<0.01],與主分析結果不一致,說明該研究對此結局指標的合并結果影響較大。其余結局指標在逐一剔除單個研究后的合并結果未發生明顯改變,說明結果穩定性較好。
3 討論
兒童骨骼生長板的發育時間是決定身高的關鍵因素,其主要受生長激素-胰島素樣生長因子-1(insulin-like growth factor-1,IGF-1)功能軸的調控[28],臨床上通常使用rhGH治療兒童生長發育性疾病,但對于生長潛能受限的青春中晚期患兒而言,高額的治療成本可能無法獲得相應的身高收益。AIs通過抑制芳香化酶阻止雄激素轉化為雌激素,減少內源性雌激素生成,調控骨骼分化與成熟,延遲骨骺閉合,減緩骨齡進程,為改善最終身高提供了新的治療途徑。由于雌激素對女性發育具有重要作用,因此AIs不適用于青春期女孩。近20年來,AIs在國內外逐漸被應用于治療兒童身材矮小癥狀,但因其超說明書性質與潛在的不良反應,AIs的獲益與風險仍待進一步論證。
本研究通過Meta分析綜合比較AIs聯合rhGH與rhGH單藥治療矮身材兒童的有效性與安全性,結果顯示:與單用rhGH相比,AIs聯合rhGH在延緩骨齡進展、提高生長速率、改善PAH和最終身高方面具有一定的積極作用,但相應增加了不良事件的發生率,尤其是內分泌系統、皮膚及皮下組織系統的不良事件,具體表現為睪酮升高、外陰色素沉著、毛發增多、面部痤瘡等高雄激素癥狀,其他系統的不良事件則未在兩組間呈現顯著性差異,短期安全性和耐受性良好。相較于以往研究,本研究更加全面地收集了當前最新證據,為指導臨床治療矮身材兒童提供了更有效的證據支撐。
敏感性分析結果顯示,Mauras等[18]的研究對治療結束時身高的合并結果影響較大。經對比分析后發現,該研究因結局數據缺失存在較高的偏倚風險,并增加了納入研究間的異質性,進而影響結果的穩定性。在排除Mauras等[18]的研究后,各研究間異質性降低,合并效應值從無統計學意義轉變為具有統計學意義,且RCT與隊列研究的結果方向一致,進一步提高了該結果的可靠性,說明AIs聯合rhGH在治療結束時的身高明顯高于rhGH單藥治療。
在安全性方面,納入研究中僅1篇研究[25]報道了睪酮升高、外陰色素沉著和毛發增多不良事件,研究結果提示試驗組睪酮升高、外陰色素沉著和毛發增多的發生風險分別是對照組的1.90倍、7.49倍和2.60倍,但該研究僅隨訪1年,尚未報道患者后續用藥或停藥后的不良事件轉歸情況。此外,共5篇研究[10, 12, 17, 20, 25]報道了面部痤瘡這一不良事件,合并結果顯示試驗組面部痤瘡的發生風險是對照組的14.26倍,多數患者癥狀在停藥后逐漸恢復,不良反應尚在可耐受范圍內。AIs的主要機制為抑制芳香化酶的催化作用,減少雄激素轉化為雌激素,在降低體內雌激素水平的同時,則會導致雄激素的明顯增加。睪酮水平的升高可促進皮脂腺發育并產生大量皮脂,從而導致體毛增多、嚴重痤瘡等癥狀。有研究[29]提出可考慮加用螺內酯改善患者的高雄激素血癥。螺內酯作為傳統的利尿劑,同時亦具有抗雄激素作用,其可通過競爭性抑制皮膚雄激素受體減少皮脂分泌,從而改善痤瘡癥狀。然而,加用螺內酯可能導致額外的藥物不良反應,如高鉀血癥、低血壓等,進一步引起處方級聯效應,其臨床獲益與風險尚未經過高質量研究證實,因此,在上述不良事件耐受的情況下,不建議臨床常規聯用螺內酯。
現有證據表明,AIs協同rhGH雖然可改善矮身材兒童的治療結局,但由于納入研究的隨訪時間普遍較短,目前仍缺乏AIs長期安全性的臨床數據,特別是高雄激素水平對生殖系統的遠期影響。既往動物試驗提示,長期使用AIs可導致雄性大鼠的精子數量及活性下降、睪丸體積縮小,使大鼠生育能力受損[30, 31]。國內一項臨床研究結果顯示,接受AIs治療的患兒的抗繆勒管激素和抑制素B水平表現異常,提示AIs可能抑制睪丸支持細胞的發育成熟[32],但目前尚未在青春期男性中觀察到遠期結果。因此,建議未來臨床研究應進一步延長隨訪時間,重點關注AIs引起的高雄激素水平對患兒的遠期影響。此外,考慮到AIs的臨床療效與潛在不良反應,在應用AIs治療矮身材兒童前,應向患者及其監護人充分告知用藥的獲益與風險,權衡利弊,謹慎選擇治療方案,并在治療過程中加強隨訪管理和用藥監測,發現不良事件時須及時采取相應應對措施。
本研究的局限性:① 納入研究的樣本量較小,整體質量不高,僅有22.2%(4/18)的研究總體評價為低偏倚風險,其余研究由于未說明分配隱藏方式、未設置盲法、未控制組間混雜因素、結局數據缺失或未進行臨床試驗注冊,可能存在選擇偏倚和測量偏倚,降低了結果的證據強度;② 不同研究納入患者的基線特征不一致,如開始治療年齡和治療時間,導致部分結局指標的納入研究間存在臨床異質性,可能影響結果的可靠性,受研究數量的限制,尚未開展更詳細的亞組分析;③ 納入對象主要為ISS、GHD、SGA,結果可能不適用于其他病因引起的身材矮小,如性早熟、營養不良等;④ 納入文獻語言限定為中文和英文,可能存在語言偏倚。
綜上所述,第三代非甾體類AIs聯合rhGH可有效減緩骨齡進程,提高生長速率,并改善各類型矮身材兒童的最終身高,但同時可能增加不良事件的發生率。受限于納入研究樣本量及質量,未來仍需高質量的長期隨訪研究進一步評估其遠期安全性,為促進臨床合理用藥、保障用藥安全提供更有力的證據支撐。
矮身材是指在相似的生活環境下,個體身高明顯低于同種族、同性別、同年齡的正常人群平均身高2個標準差或低于第3百分位數。據報道,目前我國約有3.7%的兒童存在身材矮小等生長發育障礙,男孩與女孩的患病率相當,且高發于西南部、農村等不發達地區[1],其中,4~15歲需要治療的生長遲緩兒童約有700萬[2]。導致兒童身材矮小的原因較多,包括遺傳、環境、營養、睡眠、運動量及內分泌等因素,主要常見于特發性矮小癥(idiopathic short stature,ISS)、生長激素缺乏癥(growth hormone deficiency,GHD)、小于胎齡兒(small for gestational age,SGA)等人群。身材矮小往往影響患兒的身心發育,并容易出現自卑、抑郁、社交退縮等心理或行為障礙,影響升學、就業和人際關系質量[3]。隨著社會競爭和生活壓力的不斷增大,當代家長的“育兒焦慮”使其對孩子身高的期望值越來越高,目前身材矮小已成為小兒內分泌科的主要就診原因之一[4]。
臨床上常用于治療身材矮小的藥物為重組人生長激素(recombinant human growth hormone,rhGH),經國內外大量臨床實踐證明,rhGH能有效提高矮身材兒童的生長速率并改善最終成年身高[5]。由于我國矮身材兒童患者多,疾病知曉率、就診率及治療率較低,目前臨床上存在大量青春中晚期的矮小患者,該部分患者由于錯過最佳治療時機,就診時骨齡偏大,生長潛能受限,從而導致rhGH的治療效果不理想。另一方面,有相關研究發現雌激素是調控骨骼生長和成熟的重要內分泌因子之一[6],這為進一步改善兒童生長發育提供了新的治療途徑。
芳香化酶是雄激素轉化為雌激素的重要限速酶,芳香化酶抑制劑(aromatase inhibitor,AIs)可通過抑制芳香化酶活性,有效降低患者體內的雌激素水平,臨床上主要用于治療絕經后晚期乳腺癌。目前應用較為廣泛的AIs為第三代非甾體類AIs,包括阿那曲唑和來曲唑,其相較于甾體類AIs以及第一、二代非甾體類AIs具有更高的選擇性和可逆性。基于AIs的藥理特點,有研究指出AIs可通過減少雌激素的生物合成,調控骨骼分化過程,延遲骨骺閉合,延長rhGH的促生長效應,進而改善矮身材患兒的終身高[7]。然而,AIs用于治療矮身材屬于明確的超說明書用藥。目前已有小樣本的臨床研究報道了AIs在矮身材兒童中的應用情況,但檢驗效能不高,尚無足夠證據支持AIs在兒科患者中的使用,此外,性激素水平變化帶來的潛在不良反應風險尚不清楚。既往一項研究[8]綜合評估了AIs治療矮身材的風險與獲益,但由于納入文獻不足,僅進行了描述性分析,無法有效指導臨床實踐。因此,本研究擬通過Meta分析整合現有最新證據,系統評價第三代非甾體類AIs治療矮身材兒童的有效性與安全性,旨在為臨床合理用藥提供循證參考。
1 資料與方法
1.1 納入與排除標準
1.1.1 研究類型
隨機對照試驗(randomized controlled trial,RCT)、隊列研究。
1.1.2 研究對象
年齡小于18歲且身高低于同種族、同性別、同年齡正常健康兒童平均身高2個標準差或第3百分位數的矮身材兒童患者。
1.1.3 干預措施
試驗組采用AIs(來曲唑或阿那曲唑)聯合rhGH治療,對照組采用rhGH治療。
1.1.4 結局指標
① 有效性:主要結局指標為最終成年身高(final adult height,FAH),次要結局指標為治療結束時的身高、預測成年身高(predict adult height,PAH)、預測成年身高差值(△PAH)、骨齡(bone age,BA)、骨齡差值/實際年齡差值(△BA/△CA)、生長速率(growth velocity,GV);② 安全性:不良事件發生類型及發生率,分類標準參照MedDRA 20.1[9]。
1.1.5 排除標準
① 重復發表文獻;② 無法獲取全文的文獻;③ 非中、英文文獻。
1.2 文獻檢索策略
計算機檢索PubMed、Embase、Cochrane Library、CNKI、WanFang Data、VIP和CBM數據,收集rhGH聯合或不聯合第三代非甾體類AIs治療矮小身材兒童的相關臨床研究,檢索時限均從建庫至2022年12月28日。追溯納入文獻的參考文獻,以補充檢索符合納入標準的相關文獻。檢索采用主題詞和自由詞結合的方式進行,并根據各數據庫特點進行相應調整。中文檢索詞包括:芳香化酶抑制劑、來曲唑、阿那曲唑、兒童、矮小等;英文檢索詞包括:aromatase inhibitor*、letrozole、anastrozole、child*、short stature等。以PubMed為例,具體檢索策略見附件框1。
1.3 文獻篩選與資料提取
由兩名研究者根據納入與排除標準獨立篩選文獻、提取資料并交叉核對,如遇分歧,則通過討論或由第三方裁定。文獻篩選時首先閱讀標題和摘要,在排除明顯不相關的文獻后,進一步閱讀全文,以確定最終是否納入。根據研究目的設計統一的資料提取表,以10%的文獻進行預試驗,修訂資料提取表并制定填表說明。資料提取內容包括:① 納入研究的基本信息:第一作者、發表年份、國家、研究類型;② 研究對象的基本特征:樣本量、性別、年齡;③ 干預措施:藥品名稱、劑量、用藥頻次、療程;④ 結局指標:包括有效性和安全性指標;⑤ 偏倚風險評價的關鍵要素。此外,通過郵件、電話聯系等方式向原始研究作者獲取不完整或缺失的重要資料。
1.4 偏倚風險評價
由兩名研究者獨立評價納入研究的偏倚風險并交叉核對,如遇分歧,則通過討論或由第三方裁定。采用Cochrane偏倚風險評價工具2.0(ROB 2.0)評價RCT,質量評價共包括5個方面:隨機化過程中的偏倚、偏離既定干預措施的偏倚、結局數據缺失的偏倚、結局測量的偏倚以及選擇性報告結果,判斷結果分為“低偏倚風險”“高偏倚風險”“可能存在偏倚風險”(為統一說法,本研究設定該評價結果與“中等偏倚風險”等價)。采用紐卡斯爾-渥太華(the newcastle-ottawa scale,NOS)量表評價隊列研究,質量評價共包括3個方面:研究人群選擇、組間可比性、結果測量,總分為9分,并設定0~3分為高偏倚風險,4~6分為中等偏倚風險,7~9分為低偏倚風險。
1.5 統計分析
采用RevMan 5.3軟件進行Meta分析。計量資料采用均數差(mean difference,MD)表示合并效應量,計數資料采用相對危險度(relative risk,RR)表示合并效應量,并采用95%可信區間(confidence interval,CI)表示各效應量的區間估計。對納入研究采用χ2檢驗進行異質性分析(檢驗水準為α=0.1),結合I2定量判斷異質性大小。當P>0.10且I2≤50%時,可認為各研究結果間無統計學異質性,采用固定效應模型進行Meta分析;反之,則進一步分析異質性來源,在排除明顯臨床異質性的影響后,采用隨機效應模型進行Meta分析。對于無法定量合并的結果采用描述性分析。采用Stata 15.0軟件對納入研究數量≥10個的結局指標進行Egger’s檢驗,當P>0.05 時表明無明顯發表偏倚,反之則提示可能存在發表偏倚,并采用剪補法校正合并結果。采用逐一剔除法進行敏感性分析,驗證研究結果的穩定性。P<0.05為差異有統計學意義。
2 結果
2.1 文獻檢索結果
初檢共獲得相關文獻2 818篇,經閱讀標題、摘要及全文后,最終共納入文獻18篇[10-27],其中中文文獻14篇[12-17, 19-26],英文文獻4篇[10, 11, 18, 27]。文獻篩選流程及結果見附件圖1。
2.2 納入研究的基本特征及偏倚風險評價結果
共納入18篇文獻,包括9項RCT[10, 11, 14, 18-23]和9項隊列研究[12, 13, 15-17, 24-27]。納入文獻共包括1 053例患者,其中男孩1 028例,女孩25例。研究分別來自中國(n=14)[12-17, 19-26]、美國(n=3)[11, 18, 27]和法國(n=1)[10]。納入的9項RCT中,1項研究為低偏倚風險[10],6項研究為中偏倚風險[14, 19-23],2項研究為高偏倚風險[11, 18];納入的9項隊列研究中,3項研究為低偏倚風險[15, 24, 25],6項研究為中偏倚風險[12, 13, 16, 17, 26, 27]。納入文獻的基本特征及偏倚風險評價結果見表1。

2.3 有效性評價
2.3.1 FAH
共4項研究[10-13]報道了AIs對矮身材兒童FAH的影響,包括2項RCT和2項隊列研究,各研究間無統計學異質性(I2=0%,P=0.45),采用固定效應模型進行Meta分析,結果顯示,試驗組患者的FAH高于對照組,差異有統計學意義[MD=2.48,95%CI(2.02,2.94),P<0.01]。其中,2項RCT[10, 11]的Meta分析結果顯示,試驗組患者的FAH高于對照組,差異有統計學意義[MD=2.22,95%CI(1.39,3.05),P<0.01],2項隊列研究[12, 13]的Meta分析結果顯示,試驗組患者的FAH高于對照組,差異有統計學意義[MD=2.60,95%CI(2.04,3.15),P<0.01](表2)。

2.3.2 結束治療時身高
共6項研究[14-19]報道了矮身材兒童結束治療時身高,包括3項RCT和3項隊列研究,各研究間有統計學異質性(I2=91%,P<0.01),采用隨機效應模型進行Meta分析,結果顯示,試驗組患者結束治療時身高高于對照組,但差異無統計學意義[MD=4.03,95%CI(?0.01,8.06),P=0.05]。其中,3項RCT[14, 18, 19]的Meta分析結果顯示,試驗組患者結束治療時身高高于對照組,但差異無統計學意義[MD=3.89,95%CI(?4.91,12.70),P=0.39],3項隊列研究[15-17]的Meta分析結果顯示,試驗組患者結束治療時身高高于對照組,差異有統計學意義[MD=4.01,95%CI(2.40,5.62),P<0.01](表2)。
2.3.3 結束治療時PAH
共9項研究[10, 14, 15, 20-25]報道了矮身材兒童結束治療時PAH,包括6項RCT和3項隊列研究,各研究間有統計學異質性(I2=81%,P<0.01),采用隨機效應模型進行Meta分析,結果顯示,試驗組患者結束治療時PAH高于對照組,差異有統計學意義[MD=4.27,95%CI(2.71,5.83),P<0.01]。其中,6項RCT[10, 14, 20-23]的Meta分析結果顯示,試驗組患者結束治療時PAH高于對照組,差異有統計學意義[MD=4.06,95%CI(2.08,6.04),P<0.01],3項隊列研究[15, 24, 25]的Meta分析結果顯示,試驗組患者結束治療時PAH高于對照組,差異有統計學意義[MD=5.26,95%CI(4.08,6.44),P<0.01](表2)。
2.3.4 結束治療時△PAH
共5項研究[16-18, 20, 26]報道了矮身材兒童結束治療時△PAH,包括2項RCT和3項隊列研究,各研究間有統計學異質性(I2=78%,P<0.01),采用隨機效應模型進行Meta分析,結果顯示,試驗組患者結束治療時△PAH高于對照組,差異有統計學意義[MD=4.26,95%CI(3.23,5.28),P<0.01]。其中,2項RCT[18, 20]的Meta分析結果顯示,試驗組患者結束治療時△PAH高于對照組,差異有統計學意義[MD=4.94,95%CI(3.47,6.41),P<0.01],3項隊列研究[16, 17, 26]的Meta分析結果顯示,試驗組患者結束治療時△PAH高于對照組,差異有統計學意義[MD=3.66,95%CI(2.77,4.56),P<0.01](表2)。
2.3.5 結束治療時BA
共15項研究[11, 12, 14-24, 26, 27]報道了矮身材兒童結束治療時BA,包括8項RCT和7項隊列研究,各研究間有統計學異質性(I2=91%,P<0.01),采用隨機效應模型進行Meta分析,結果顯示,試驗組患者結束治療時BA低于對照組,差異有統計學意義[MD=?0.62,95%CI(?0.89,?0.36),P<0.01]。其中,8項RCT[11, 14, 18-23]的Meta分析結果顯示,試驗組患者結束治療時BA低于對照組,差異有統計學意義[MD=?0.72,95%CI(?1.06,?0.39),P<0.01],7項隊列研究[12, 15-17, 24, 26, 27]的Meta分析結果顯示,試驗組患者結束治療時BA低于對照組,差異有統計學意義[MD=?0.49,95%CI(?0.98,?0.01),P=0.04](表2)。
2.3.6 結束治療時△BA/△CA
共4項隊列研究[13, 16, 17, 26]報道了矮身材兒童結束治療時△BA/△CA,各研究間無統計學異質性(I2=24%,P=0.27),采用固定效應模型進行Meta分析,結果顯示,試驗組患者結束治療時△BA/△CA低于對照組,差異有統計學意義[MD=?0.47,95%CI(?0.56,?0.37),P<0.01](表2)。
2.3.7 結束治療時GV
共13項研究[10, 13-15, 19-27]報道了矮身材兒童結束治療時GV,包括7項RCT和6項隊列研究,各研究間有統計學異質性(I2=92%,P<0.01),采用隨機效應模型進行Meta分析,結果顯示,試驗組患者結束治療時GV高于對照組,差異有統計學意義[MD=1.34,95%CI(0.89,1.78),P<0.01]。其中,7項RCT[10, 14, 19-23]的Meta分析結果顯示,試驗組患者結束治療時GV高于對照組,差異有統計學意義[MD=1.68,95%CI(0.80,2.57),P<0.01],6項隊列研究[13, 15, 24-27]的Meta分析結果顯示,試驗組患者結束治療時GV高于對照組,差異有統計學意義[MD=1.12,95%CI(0.48,1.77),P<0.01](表2)。
2.4 安全性評價
2.4.1 不良事件總發生率
共13項研究[10, 12-15, 17, 18, 20, 22-26]報道了不良事件總發生率,包括6項RCT和7項隊列研究,各研究間有統計學異質性(I2=33%,P=0.01),采用隨機效應模型進行Meta分析,結果顯示,試驗組的不良事件發生率高于對照組,差異有統計學意義[RR=2.10,95%CI(1.48,2.99),P<0.01]。其中,6項RCT[10, 14, 18, 20, 22, 23]的Meta分析結果顯示,試驗組的不良事件發生率高于對照組,差異有統計學意義[RR=1.95,95%CI(1.24,3.08),P<0.01],7項隊列研究[12, 13, 15, 17, 24-26]的Meta分析結果顯示,試驗組的不良事件發生率高于對照組,差異有統計學意義[RR=2.70,95%CI(1.69,4.30),P<0.01](表3)。

2.4.2 內分泌系統不良事件發生率
共8項研究[12-15, 20, 23-25]報道了內分泌系統不良事件,主要為甲狀腺功能異常、睪酮升高、皮質醇升高,包括3項RCT和5項隊列研究,各研究間無統計學異質性(I2=0%,P=0.82),采用固定效應模型進行Meta分析,結果顯示,試驗組的內分泌系統不良事件發生率高于對照組,差異有統計學意義[RR=1.81,95%CI(1.31,2.49),P<0.01]。其中,3項RCT[14, 20, 23]的Meta分析結果顯示,試驗組的內分泌系統不良事件發生率高于對照組,但差異無統計學意義[RR=2.48,95%CI(0.57,10.75),P=0.22],5項隊列研究[12, 13, 15, 24, 25]的Meta分析結果顯示,試驗組的內分泌系統不良事件發生率高于對照組,差異有統計學意義[RR=1.75,95%CI(1.27,2.41),P<0.01](表3)。
2.4.3 肝膽系統不良事件發生率
共3項隊列研究[17, 25, 26]報道了肝膽系統不良事件,主要為肝功能異常、轉氨酶升高、間接膽紅素升高,各研究間無統計學異質性(I2=0%,P=0.78),采用固定效應模型進行Meta分析,結果顯示,試驗組的肝膽系統不良事件發生率高于對照組,但差異無統計學意義[RR=3.33,95%CI(0.72,15.28),P=0.12](表3)。
2.4.4 腎臟泌尿系統不良事件發生率
共1項隊列研究[17]報道了腎臟泌尿系統不良事件,主要為肌酐升高,結果顯示,試驗組的腎臟泌尿系統不良事件發生率高于對照組,但差異無統計學意義[RR=2.83,95%CI(0.15,53.58),P=0.49](表3)。
2.4.5 代謝及營養類不良事件發生率
共4項研究[14, 15, 17, 22]報道了代謝及營養類不良事件,主要為空腹血糖升高、空腹胰島素升高、血脂異常、高尿酸血癥,包括2項RCT和2項隊列研究,各研究間有統計學異質性(I2=75%,P<0.01),采用隨機效應模型進行Meta分析,結果顯示,試驗組的代謝及營養類不良事件發生率高于對照組,但差異無統計學意義[RR=2.18,95%CI(0.32,14.72),P=0.42]。其中,2項RCT[14, 22]的Meta分析結果顯示,試驗組的代謝及營養類不良事件發生率低于對照組,但差異無統計學意義[RR=0.56,95%CI(0.12,2.51),P=0.44],2項隊列研究[15, 17]的Meta分析結果顯示,試驗組的代謝及營養類不良事件發生率高于對照組,但差異無統計學意義[RR=5.89,95%CI(0.37,94.04),P=0.21](表3)。
2.4.6 胃腸道系統不良事件發生率
共3項RCT[10, 18, 22]報道了胃腸道系統不良事件,包括嘔吐、腹痛,各研究間無統計學異質性(I2=22%,P=0.28),采用固定效應模型進行Meta分析,結果顯示,試驗組的胃腸道系統不良事件發生率高于對照組,但差異無統計學意義[RR=2.00,95%CI(0.76,5.25),P=0.16](表3)。
2.4.7 肌肉骨骼系統不良事件發生率
共10項研究[10, 14, 18, 20, 22]報道了肌肉骨骼系統不良事件,主要為膝關節疼痛、骨折、骨密度異常、脊柱側彎癥,包括5項RCT和5項隊列研究,各研究間無統計學異質性(I2=0%,P=0.87),采用固定效應模型進行Meta分析,結果顯示,試驗組的肌肉骨骼系統不良事件發生率高于對照組,但差異無統計學意義[RR=1.50,95%CI(0.91,2.46),P=0.11]。其中,5項RCT[10, 14, 18, 20, 22]的Meta分析結果顯示,試驗組的肌肉骨骼系統不良事件發生率低于對照組,但差異無統計學意義[RR=0.90,95%CI(0.38,2.15),P=0.81],5項隊列研究[13, 15, 17, 24, 26]的Meta分析結果顯示,試驗組的肌肉骨骼系統不良事件發生率高于對照組,差異有統計學意義[RR=1.89,95%CI(1.02,3.51),P=0.04](表3)。
2.4.8 皮膚及皮下組織系統不良事件發生率
共5項研究[10, 12, 17, 20, 25]報道了皮膚及皮下組織系統不良事件,主要為外陰色素沉著、毛發增多、面部痤瘡,包括2項RCT和3項隊列研究,各研究間有統計學異質性(I2=54%,P=0.04),采用隨機效應模型進行Meta分析,結果顯示,試驗組的皮膚及皮下組織系統不良事件發生率高于對照組,差異有統計學意義[RR=6.55,95%CI(2.51,17.11),P<0.01]。其中,2項RCT[10, 20]的Meta分析結果顯示,試驗組的皮膚及皮下組織系統不良事件發生率高于對照組,但差異無統計學意義[RR=6.00,95%CI(0.12,292.12),P=0.37],3項隊列研究[12, 17, 25]的Meta分析結果顯示,試驗組的皮膚及皮下組織系統不良事件發生率高于對照組,差異有統計學意義[RR=6.42,95%CI(2.41,17.06),P<0.01](表3)。
2.4.9 血液與淋巴系統不良事件發生率
共1項隊列研究[17]報道了血液與淋巴系統不良事件,主要為粒細胞減少,結果顯示,試驗組的血液與淋巴系統不良事件發生率高于對照組,但差異無統計學意義[RR=1.21,95%CI(0.05,29.16),P=0.91](表3)。
2.4.10 血管與淋巴管系統不良事件發生率
共1項隊列研究[24]報道了血管與淋巴管系統不良事件,主要為下肢水腫,結果顯示,試驗組的血管與淋巴管系統不良事件發生率高于對照組,但差異無統計學意義[RR=1.50,95%CI(0.27,8.34),P=0.64](表3)。
2.4.11 神經精神系統不良事件發生率
共2項研究[10, 17]報道了神經精神系統不良事件,主要為失眠、輕度抑郁、焦慮、嗜睡及記憶力減退,包括1項RCT和1項隊列研究,各研究間無統計學異質性(I2=0%,P=0.72),采用固定效應模型進行Meta分析,結果顯示,試驗組的神經精神系統不良事件發生率高于對照組,但差異無統計學意義[RR=1.57,95%CI(0.37,6.74),P=0.54]。其中,1項RCT[10]的Meta分析結果顯示,試驗組的神經精神系統不良事件發生率高于對照組,但差異無統計學意義[RR=1.43,95%CI(0.27,7.61),P=0.68],1項隊列研究[17]的Meta分析結果顯示,試驗組的神經精神系統不良事件發生率高于對照組,但差異無統計學意義[RR=2.02,95%CI(0.10,41.20),P=0.65](表3)。
2.5 發表偏倚
采用Egger’s檢驗進行發表偏倚評估,結果顯示,BA、GV、不良事件總發生率及肌肉骨骼系統不良事件發生率均無明顯發表偏倚(P值均>0.05)。其余結局指標由于納入研究數量少于10項,故暫未進行發表偏倚評估。
2.6 敏感性分析
采用逐一剔除法進行敏感性分析,結果顯示,在治療結束時身高方面,排除Mauras等[18]的研究后,各研究間異質性降低(I2=7%,P=0.37),且試驗組患者結束治療時身高顯著高于對照組[MD=4.49,95%CI(2.96,6.01),P<0.01],與主分析結果不一致,說明該研究對此結局指標的合并結果影響較大。其余結局指標在逐一剔除單個研究后的合并結果未發生明顯改變,說明結果穩定性較好。
3 討論
兒童骨骼生長板的發育時間是決定身高的關鍵因素,其主要受生長激素-胰島素樣生長因子-1(insulin-like growth factor-1,IGF-1)功能軸的調控[28],臨床上通常使用rhGH治療兒童生長發育性疾病,但對于生長潛能受限的青春中晚期患兒而言,高額的治療成本可能無法獲得相應的身高收益。AIs通過抑制芳香化酶阻止雄激素轉化為雌激素,減少內源性雌激素生成,調控骨骼分化與成熟,延遲骨骺閉合,減緩骨齡進程,為改善最終身高提供了新的治療途徑。由于雌激素對女性發育具有重要作用,因此AIs不適用于青春期女孩。近20年來,AIs在國內外逐漸被應用于治療兒童身材矮小癥狀,但因其超說明書性質與潛在的不良反應,AIs的獲益與風險仍待進一步論證。
本研究通過Meta分析綜合比較AIs聯合rhGH與rhGH單藥治療矮身材兒童的有效性與安全性,結果顯示:與單用rhGH相比,AIs聯合rhGH在延緩骨齡進展、提高生長速率、改善PAH和最終身高方面具有一定的積極作用,但相應增加了不良事件的發生率,尤其是內分泌系統、皮膚及皮下組織系統的不良事件,具體表現為睪酮升高、外陰色素沉著、毛發增多、面部痤瘡等高雄激素癥狀,其他系統的不良事件則未在兩組間呈現顯著性差異,短期安全性和耐受性良好。相較于以往研究,本研究更加全面地收集了當前最新證據,為指導臨床治療矮身材兒童提供了更有效的證據支撐。
敏感性分析結果顯示,Mauras等[18]的研究對治療結束時身高的合并結果影響較大。經對比分析后發現,該研究因結局數據缺失存在較高的偏倚風險,并增加了納入研究間的異質性,進而影響結果的穩定性。在排除Mauras等[18]的研究后,各研究間異質性降低,合并效應值從無統計學意義轉變為具有統計學意義,且RCT與隊列研究的結果方向一致,進一步提高了該結果的可靠性,說明AIs聯合rhGH在治療結束時的身高明顯高于rhGH單藥治療。
在安全性方面,納入研究中僅1篇研究[25]報道了睪酮升高、外陰色素沉著和毛發增多不良事件,研究結果提示試驗組睪酮升高、外陰色素沉著和毛發增多的發生風險分別是對照組的1.90倍、7.49倍和2.60倍,但該研究僅隨訪1年,尚未報道患者后續用藥或停藥后的不良事件轉歸情況。此外,共5篇研究[10, 12, 17, 20, 25]報道了面部痤瘡這一不良事件,合并結果顯示試驗組面部痤瘡的發生風險是對照組的14.26倍,多數患者癥狀在停藥后逐漸恢復,不良反應尚在可耐受范圍內。AIs的主要機制為抑制芳香化酶的催化作用,減少雄激素轉化為雌激素,在降低體內雌激素水平的同時,則會導致雄激素的明顯增加。睪酮水平的升高可促進皮脂腺發育并產生大量皮脂,從而導致體毛增多、嚴重痤瘡等癥狀。有研究[29]提出可考慮加用螺內酯改善患者的高雄激素血癥。螺內酯作為傳統的利尿劑,同時亦具有抗雄激素作用,其可通過競爭性抑制皮膚雄激素受體減少皮脂分泌,從而改善痤瘡癥狀。然而,加用螺內酯可能導致額外的藥物不良反應,如高鉀血癥、低血壓等,進一步引起處方級聯效應,其臨床獲益與風險尚未經過高質量研究證實,因此,在上述不良事件耐受的情況下,不建議臨床常規聯用螺內酯。
現有證據表明,AIs協同rhGH雖然可改善矮身材兒童的治療結局,但由于納入研究的隨訪時間普遍較短,目前仍缺乏AIs長期安全性的臨床數據,特別是高雄激素水平對生殖系統的遠期影響。既往動物試驗提示,長期使用AIs可導致雄性大鼠的精子數量及活性下降、睪丸體積縮小,使大鼠生育能力受損[30, 31]。國內一項臨床研究結果顯示,接受AIs治療的患兒的抗繆勒管激素和抑制素B水平表現異常,提示AIs可能抑制睪丸支持細胞的發育成熟[32],但目前尚未在青春期男性中觀察到遠期結果。因此,建議未來臨床研究應進一步延長隨訪時間,重點關注AIs引起的高雄激素水平對患兒的遠期影響。此外,考慮到AIs的臨床療效與潛在不良反應,在應用AIs治療矮身材兒童前,應向患者及其監護人充分告知用藥的獲益與風險,權衡利弊,謹慎選擇治療方案,并在治療過程中加強隨訪管理和用藥監測,發現不良事件時須及時采取相應應對措施。
本研究的局限性:① 納入研究的樣本量較小,整體質量不高,僅有22.2%(4/18)的研究總體評價為低偏倚風險,其余研究由于未說明分配隱藏方式、未設置盲法、未控制組間混雜因素、結局數據缺失或未進行臨床試驗注冊,可能存在選擇偏倚和測量偏倚,降低了結果的證據強度;② 不同研究納入患者的基線特征不一致,如開始治療年齡和治療時間,導致部分結局指標的納入研究間存在臨床異質性,可能影響結果的可靠性,受研究數量的限制,尚未開展更詳細的亞組分析;③ 納入對象主要為ISS、GHD、SGA,結果可能不適用于其他病因引起的身材矮小,如性早熟、營養不良等;④ 納入文獻語言限定為中文和英文,可能存在語言偏倚。
綜上所述,第三代非甾體類AIs聯合rhGH可有效減緩骨齡進程,提高生長速率,并改善各類型矮身材兒童的最終身高,但同時可能增加不良事件的發生率。受限于納入研究樣本量及質量,未來仍需高質量的長期隨訪研究進一步評估其遠期安全性,為促進臨床合理用藥、保障用藥安全提供更有力的證據支撐。