局部晚期直腸癌的標準治療方式為新輔助放化療聯合手術治療,但經相同治療方案后的患者表現出較大的結局差異。對于新輔助治療反應良好的患者,可謹慎選擇“等待&觀察”的策略,以避免手術及其他并發癥。因此,準確評估局部晚期直腸癌患者新輔助治療后腫瘤的反應可以更好地制定個性化治療策略。目前的研究發現,血液樣本檢測、體格檢查、內鏡、影像學檢查及人工智能在評估新輔助治療反應方面各有利弊。因此,該文對不同臨床工具在評估及預測局部晚期直腸癌新輔助治療反應的應用研究成果進行了綜述,并對未來發展方向進行了展望。
引用本文: 梁玉汶, 杜小波. 局部晚期直腸癌新輔助治療反應評估及預測研究進展. 華西醫學, 2024, 39(5): 825-832. doi: 10.7507/1002-0179.202401286 復制
版權信息: ?四川大學華西醫院華西期刊社《華西醫學》版權所有,未經授權不得轉載、改編
結直腸癌是全球第三大常見癌癥,也是癌癥死亡的第二大原因,每年新發病例數約為 200 萬例[1]。近 40%的新發結直腸腫瘤位于直腸,其中大部分為局部晚期直腸癌(locally advanced rectal adenocarcinoma, LARC),指不伴淋巴結受累的 T3 或 T4 期腫瘤或伴淋巴結受累時任何 T 分期的腫瘤[2]。對于 LARC 患者,標準治療為多模式聯合治療方案,包括新輔助放化療(neoadjuvant chemoradiotherapy, nCRT)、全直腸系膜切除術,以及術后輔助化療[3-4]。對于可切除的直腸癌患者,nCRT 提高了病理完全緩解(pathological complete response, pCR)率和局部控制率,與術前單純放療相比還進一步降低了病理分期[5-6]。但在接受 nCRT 后,僅 15%~20%的患者可以達到 pCR[7],提示預后較好[8-9]。這表明 LARC 具有很強的異質性,nCRT 對不同患者療效差異巨大。因此,準確評估及預測腫瘤對 nCRT 的治療反應,對手術方案、輔助治療策略等臨床決策至關重要[10]。既往研究表明,對于新輔助治療后經嚴格篩選達到臨床完全緩解(complete clinical response, cCR),且現有常規外科技術保肛困難,有強烈保肛意愿者可結合各中心實際情況謹慎采用“等待&觀察”策略,并定期隨訪,以避免手術和保全器官[7, 11]。但需要指出的是,cCR 并不等于 pCR。數據表明,經評估達到明顯 cCR 的患者中,有 15%~25%的患者出現了局部復發[12]。因此,準確評估及預測患者對 nCRT 的反應,是制定 LARC 患者個性化治療方案的關鍵。因此,本文回顧了不同評估 LARC 患者對 nCRT 治療反應的參數或工具的潛在價值,以總結其應用現狀并展望發展方向。
1 血液樣本檢測
血液是較為簡便易得的樣本,因此大量研究報道了不同以血液為樣本檢測的不同指標如血小板[13]、血清腫瘤標志物[14]、循環腫瘤細胞、循環腫瘤 DNA[15]等預測 LARC 對新輔助治療反應的作用。
血小板計數(platelet count, PLT)是臨床常用的外周血檢測指標。有研究通過單因素分析發現 LARC 患者 nCRT 前 PLT 高于閾值預示著更差的 pCR[13, 16],但僅有有限的研究通過多因素分析證實 PLT 與 pCR 相關[16]。在通過血清血紅蛋白水平預測 LARC 對 nCRT 反應的研究中表現出類似的結果,多項研究僅通過單因素分析證明血清血紅蛋白水平與 nCRT 反應間存在關系,而多因素分析中均未表現出二者相關[13, 17-18]。
癌胚抗原(carcinoembryonic antigen, CEA)是直腸癌的血清腫瘤標志物之一,是一種表達于正常上皮細胞膜頂端的糖蛋白,其在腫瘤細胞中去極化,從而在循環中的表達和濃度升高[19]。血清 CEA 水平被視為 CRC 的預后標志物[20],但 nCRT 前血清 CEA 水平對 LARC 治療反應的預測作用存在爭議。有研究表明,nCRT 前血清 CEA 水平低于 2.5 ng/mL 的 LARC 患者較血清 CEA 水平高于該閾值的患者表現出更佳的 pCR[14]。多項研究通過單因素分析表明 LARC 患者 nCRT 前血清 CEA 值低于臨界值預示著對 nCRT 更好的反應和腫瘤退縮[13, 16, 21-26],進一步進行多因素分析也證實 nCRT 前低血清 CEA 水平是腫瘤退縮的獨立預測因素[16, 23-26],但需指出的是這些研究設定的血清 CEA 閾值存在差異,尚缺乏足夠靈敏度和特異度的閾值[27]。值得注意的是,還有一部分研究的結果中并沒有表現出 nCRT 前血清 CEA 的水平與腫瘤治療反應之間的統計學關系[28-32]。此外,還有研究發現 nCRT 后低于閾值的血清 CEA 水平與 pCR 相關[22, 26, 33-34]。
液體活檢通過從腫瘤患者各種體液(如血液、尿液、胸腹腔積液等)中獲得腫瘤相關組織或細胞,以檢測和分析腫瘤相關生物標志物[35]。液體活檢可以檢測血液中的循環腫瘤細胞、ctDNA、游離細胞 DNA(cell-free DNA, cfDNA)和外泌體等[36],ctDNA 是 cfDNA 在降解中產生的小片段,來源于患者凋亡或壞死腫瘤細胞的 DNA,具有腫瘤特異性的分子特征[37-39]。NCRT 前 ctDNA/cfDNA 水平預測治療反應的研究間表現出有差異的結果。Ravenda 等[15]研究發現,達到 pCR 的患者在 nCRT 前檢測出的 ctDNA 水平最低,nCRT 后尚有腫瘤殘存的患者治療前 ctDNA 水平較高(P=0.18)。同樣的,Zhou 等[40]的研究也發現 nCRT 反應良好的 LARC 患者治療前 ctDNA 陽性率降低(P<0.001)。而已有研究結果表明,LARC 患者 nCRT 前 ctDNA/cfDNA 的水平與患者是否達到 pCR 無關[41-45]。Chang 等[46]進行的一項 Meta 分析表明,nCRT 前的 ctDNA 狀態與 LARC 患者是否 pCR 無關。然而,其研究還發現 nCRT 后 ctDNA 的陽性表達預示著更差的 pCR。這可能是由于 nCRT 后,原發腫瘤組織釋放的 ctDNA 清除,而體內殘存腫瘤的患者會繼續釋放 ctDNA。
2 內鏡檢查及活組織病理檢查
直腸內鏡檢查可觀察到腫瘤形態學變化,反映了 nCRT 后不同程度的消退[47],因此,內鏡圖像被認為是評估 LARC 對 nCRT 反應的重要臨床工具。然而,該方法存在可重復性、標準化等方面的局限性。內鏡檢查通過觀測直腸黏膜的細微改變來評估治療反應,但它無法提供直腸黏膜內以及直腸系膜內的改變[47]。此外,不同患者的內鏡特征與 nCRT 后腫瘤反應程度的相關性尚未得到廣泛研究[48]。
nCRT 后腸黏膜的變化可以經直腸內鏡放大黏膜圖像觀察到。這些變化包括水腫、炎癥、狹窄、充氣時彈性降低等,同時還提供了其他的如黏膜顏色等可視性特征,對 nCRT 的反應具有提示作用[49]。在進行評估時,內鏡下所見的特征包括:① 扁平,白色瘢痕;② 毛細血管擴張;③ 有/無潰瘍;④ 有/無結節;⑤ 黏膜小結節或輕微黏膜異常;⑥ 淺表潰瘍;⑦ 瘢痕處輕度持續性紅斑;⑧ 可見腫瘤。在確定腫瘤對 nCRT 的反應程度時,通過陽性/陰性或存在/不存在評估內鏡下所見上述特征的表現。根據鏡下的不同表現,將 nCRT 后的直腸癌患者分為 cCR、近似cCR和非完全臨床緩解[50-51]。然而,內鏡標準及個體內鏡特征的判斷具有較強主觀性,容易受到不同觀測者的影響。
應用預先制定的內鏡特征標準可以提高內鏡評估的客觀性,從而準確地判斷直腸腫瘤對 nCRT 的反應程度[48, 52]。既往研究發現,外科醫生之間在通過內鏡下特征評估腫瘤退縮等級(tumor regression grade, TRG)時存在差異,有經驗的外科醫生間在內鏡特征選擇和 TRG 評估方面的變異性較低[48]。另一項研究指出,運用預先制定的內鏡特征標準在判斷可能或確定的 nCRT 后腫瘤完全緩解時,其靈敏度為 72%~90%。在被評估為確定或可能完全緩解的患者中,有 63%~78%的患者最終被證實達到 pCR,或至少 2 年沒有出現局部復發[52]。
當內鏡檢查高度懷疑直腸癌患者 nCRT 后腫瘤仍存在時,活組織病理檢查是較為推薦的手段,但內鏡下只能鉗夾到有限的淺表組織,假陰性取樣風險較高。既往研究報道,通過內鏡活檢獲得的黏膜和黏膜下層的淺表組織活檢將無法檢測到 25%臨床分期 T2 期和 40%臨床分期 T3/T4 期的直腸癌患者腫瘤細胞的存在[53]。這可能是因為腫瘤細胞延腸壁縱向侵襲,而不是延淺表黏膜層水平生長。因此,有研究推薦采用包括固有肌層在內的全層活檢,以提供更為準確的取樣和病理 T 分期結果[54]。
3 影像學檢查
磁共振成像(magnetic resonance imaging, MRI)對直腸癌基線分期和 nCRT 后再分期至關重要[55-56]。由于其較高的軟組織分辨率和多平面成像技術,MRI 可以提供直腸腫瘤與其毗鄰結構的詳細特征[57]。此外,MRI 的功能成像和后處理技術能夠對殘留腫瘤進行定量分析[58]。在 T2 加權(T2 weighted image, T2WI)MRI 圖像上,腫瘤纖維化表現出與正常固有肌層相似的信號強度,殘余腫瘤則表現出與治療前 MRI 圖像相似的中等信號[58]。以擴散加權成像(diffusion-weighted imaging, DWI)和灌注成像為代表的功能成像序列,可以在細胞水平上更好地反映腫瘤的生理和生物學特性。DWI 有助于區分纖維化和活躍增殖的細胞,可反映存活腫瘤細胞的活性并提高診斷準確性[59]。通過量化 DWI 序列的特性,可以得到表觀擴散系數,較低的表觀擴散系數值往往預示著腫瘤細胞密度和侵襲性的增加[60-61]。研究發現,由放射科經驗豐富的專家和普通醫師根據 nCRT 后的 MRI 圖像確定的 T 分期與病理檢查 T 分期的一致性分別為 48%和 43%,達到中等的總體準確性,在評估反應較差的患者時的準確性優于反應較好的患者[62]。這可能是由于臨床醫生在判斷包括纖維化在內的任何異常區域時,更傾向于謹慎的評估。因此需要強調將 MRI 檢查與內鏡及直腸指檢等技術相結合,以最準確地評估局部腫瘤對 nCRT 的反應程度[63]。
nCRT 后 MRI 評估腫瘤反應的最佳時機取決于 nCRT 后距離手術的間隔時間,然而目前尚缺乏對 nCRT 治療完成到手術的最佳間隔時間的共識。nCRT 對腫瘤的殺傷作用隨時間推移而增加,因而治療后等待時間越長,達到 pCR 的患者可能越多[64]。盡管在 nCRT 完成 8 周后進行手術可能更有益[65],但處于放射性骨盆纖維化和相關手術并發癥等考慮,外科醫生往往選擇 nCRT 完成后 6~8 周進行手術[66]。因此,應在 nCRT 結束后 6~8 周及手術前進行 MRI 檢查,以評估直腸癌患者的腫瘤退縮情況。
基于 MRI 的腫瘤退縮等級(MRI-based tumor regression grade, mrTRG)是評估 nCRT 后腫瘤的消退程度的工具之一[67],mrTRG 是由纖維性或腫瘤性信號強度在整個腫瘤區域中的占比來定義的[68],不同 mrTRG 評分系統在定義 TRG 時存在細微差別,但總體上 mrTRG 等級越低則表示腫瘤退縮越明顯,如 mrTRG 1 級表示無癌細胞存活。通常較難區別治療導致的纖維化和存活腫瘤細胞的信號強度,因此 nCRT 后 mrTRG 評估具有挑戰[69]。隨著檢查技術的進步及經驗的積累,MRI 評估 nCRT 后直腸腫瘤區域變化的準確性有所提升。一項多中心的前瞻性研究報道,3 名經驗豐富的專業放射科醫師獨立閱片評估及共同審查后,通過 mrTRG 評估 nCRT 后 pCR 的陽性預測值為 40%,而 MRI 再分期確定殘余腫瘤并經病理檢查證實的陰性預測值達 84%[70]。另一項研究發現 mrTRG 預測 pCR 的特異度為 69.6%,陽性預測值達 85.6%[71]。Niu 等[72]研究發現 mrTRG 與病理 TRG 之間具有一致性,mrTRG 二分類[pCR(mrTRG1) vs. 非 pCR(mrTRG2-5)]時加權 kappa 值為 0.391,三分類[pCR(mrTRG1) vs. 腫瘤部分緩解(mrTRG2-3) vs. 腫瘤無反應(mrTRG4-5)]時加權 kappa 值為 0.287。
同步正電子發射斷層掃描(positron emission tomography, PET)和 MRI(PET/MRI)是將 MRI 解剖學和定量優勢與 PET 檢查獲得的生理信息相結合的技術。與 PET/CT 相比,PET/MRI 能增加收集 PET 數據的時間,量化放射性示蹤劑的攝取以及使用 MRI 的多參數進行評估等[73]。近年來 PET/MRI 的應用不斷增多,但仍是一項新興技術,缺乏在直腸癌分期和放化療后評估中長期前瞻性和預后數據。與單獨使用 MRI 相比,使用 PET/CT 評估直腸癌患者 nCRT 反應時,其在再分期的敏感性、特異性和準確性方面均有提高。Crimì 等[74]的研究發現 PET/MRI 和 MRI 對于直腸癌患者 nCRT 治療后病理 T 分期判斷的準確性分別為 92%和 89%。PET/MRI 潛在缺點包括成像設備的可及性有限、檢查成本和檢查時間的增加等,還需要更多大樣本研究進一步探索其在 nCRT 后評估腫瘤退縮情況的能力。
4 影像組學及人工智能
影像組學是指從 CT、MRI 等影像圖像中高通量地提取大量影像組學特征,之后運用機器學習的方法對這些特征進行統計學分析,建立具有分類、預測功能的模型[75]。由于能夠深度挖掘各種影像學檢查獲取的圖像中人眼難以發現的特征,并對數據進行定量的分析,一定程度上克服了人工閱片的主觀性,并在腫瘤的診斷、分期、分級、預后預測等方面表現出巨大潛力[76-77]。影像組學研究的基本工作流程包括原始影像數據采集、數據預處理、圖像分割、特征提取、特征降維、建模分析及驗證,其中特征提取和構建模型最為關鍵。目前,已有大量研究報道影像組學在預測直腸癌對 nCRT 反應方面具有較好的表現[78-80]。
Cheng 等[81]基于晚期直腸癌患者 nCRT 前的多序列 MRI 圖像,使用多元邏輯回歸的方法構建了預測 pCR 模型。其所構建模型的受試者操作特征曲線下面積(area under curve, AUC)為 0.855,準確性為 0.831。類似的,另一項運用多元邏輯回歸方法構建預測 LARC 患者 nCRT 療效模型的研究納入了患者治療前 MRI 檢查 T2WI 圖像,基于腫瘤區域影像組學特性構建的模型 AUC 為 0.805[82]。盡管上述兩項研究對于 nCRT 后患者反應的分類不同,一個是預測 pCR(定義為 TRG 1),一個是預測主要病理緩解(定義為 TRG 1-2),但其預測結果沒有表現出較大差別,這表明影像組學模型在預測 nCRT 時的巨大潛力。除了邏輯回歸這一統計學方法外,還有學者基于其他機器學習算法構建的預測模型也展現出了較好的預測能力。如 Wei 等[83]分別基于支持向量機、邏輯回歸、隨機森林等方法構建預測 LARC 患者在 nCRT 后是否達到 pCR 的模型。最終,隨機森林模型表現出更佳的預測性能,其準確率達 84.4%,AUC 為 0.829。
此外,諸如卷積神經網絡等深度學習方法也表現出了良好的預測 nCRT 反應的性能。Fu 等[84]基于 LARC 患者 nCRT 前 MRI 的 DWI 序列圖像,通過卷積神經網絡提取基于深度學習的影像組學特征構建預測對 nCRT 反應的模型,最終該模型的 AUC 達到 0.73,優于人工提取的影像組學特征所構建的預測模型(AUC=0.64)。而 Shi 等[85]基于卷積神經網絡的深度學習和影像組學,使用治療前的多參數 MRI 圖像構建了直腸癌 nCRT 療效的預測模型,最終深度學習模型預測 pCR 的平均 AUC 為 0.59,預測準確性不如影像組學(AUC=0.78)。但這兩項研究的樣本量較少,均不足 100 例,因此在深度學習的研究中,尚需要進一步探索,運用大樣本數據對模型進行訓練,檢驗模型的預測性能。
最近的研究表明,將 nCRT 不同時期的 MRI 圖像結合構建預測模型時,對 nCRT 反應的預測準確性有所增加。正如已有研究將治療前(AUC=0.59)和放化療中期(放療開始后 3~4 周,AUC=0.74)的影像組學特征結合之后,基于卷積神經網絡構建的預測模型效能與單獨使用單一時期特征模型相比,準確性更高(AUC=0.83)[85]。還有一些研究將基于 nCRT 前后 MRI 影像組學特征的差異構建預測模型。如 Chen 等[86]運用支持向量機算法,聯合 nCRT 前后的影像組學特征及其差異構建預測模型,聯合預測模型達到了 96.15%的準確性,而基于治療前圖像的預測模型和治療后圖像的預測模型準確性分別為 92.3%和 88.46%。類似的,在已有研究中,基于不同時期影像組學特征差異構建的模型均表現出較好的預測 nCRT 療效的能力[87-88]。這可能是由于 nCRT 后 MRI 是在完成整個療程后進行的,時間非常接近手術,因此與病理反應高度相關。
還有一些研究將影像組學特征與其他因素如臨床特征結合,構建了聯合預測模型,以期進一步提高模型的預測效能。Delli 等[89]基于 nCRT 前的 MRI 圖像,將臨床特征(于 MRI 檢查結果獲得,如腫瘤位置、腫瘤總體積、直腸系膜筋膜浸潤等)與影像組學特征聯合,運用機器學習方法構建預測 nCRT 反應的模型。最終聯合模型的 AUC 達到 0.793,較基于單一特征構建的模型改善了預測性能。另一項研究也嘗試將臨床基線參數(CEA、腫瘤治療后長度和厚度)與影像組學特征聯合構建了預測 nCRT 后達到 pCR 的列線圖模型,其 AUC 達到了 0.912,而基于單一特征構建的模型 AUC 為 0.842~0.855[81]。類似的,諸多既往研究中也報道了影像組學特征與臨床信息的聯合模型可以達到更佳的預測效果[82-83]。
除了影像組學方面的運用外,有研究將人工智能與內鏡檢查圖像結合,以評估直腸癌患者對 nCRT 的反應。Haak 等[90]基于 LARC 患者 nCRT 后的內鏡圖像,運用卷積神經網絡算法構建了評估 nCRT 療效的模型,結果表明,基于內鏡圖像模型的 AUC 為 0.71~0.79。而既往文獻報道有經驗的內鏡醫生在預測直腸癌患者對 nCRT 的反應時的 AUC 為 0.80~0.88[52,91]。Wang 等[92]基于內鏡圖像的深度學習算法來評估 LARC 患者的 nCRT 反應時,發現深度學習模型與人工評估表現相當。以上兩項研究的樣本量均較小,這可能無法更好地訓練預測模型。另一項納入了 1 000 例 LARC 患者的大樣本研究同樣基于患者內鏡檢查圖像,運用深度學習方法構建預測 nCRT 后腫瘤退縮的模型,達到了 92.1%的準確性,AUC 為 0.95,且其表現優于 3 名經驗豐富的內鏡醫師[93]。因此,需要多中心、大樣本數據訓練深度學習模型,以進一步確定其表現。
大量研究結果表明影像組學在直腸癌的 nCRT 療效評估中可能發揮重要作用,對患者的個性化治療以及臨床決策的制定具有潛在價值,但將其轉化為臨床實際運用時還面臨許多挑戰和需改進之處。第一,目前大多數影像組學相關研究為單中心、小樣本研究,研究過程中不可避免地存在偏倚。第二,各機構所使用的影像設備標準各異,其圖像受機器參數、造影劑等因素影像可能存在誤差,也會影響結果的可重復性。第三,大多數研究在進行圖像分割時采用人工勾畫,非常費時費力,并且會受到操作者經驗等個人因素的影響,需要進一步探索基于深度學習的圖像自動或半自動勾畫的方法。因此,未來需要進行更多大樣本、多中心的研究,甚至開展前瞻性研究,進一步探索影像組學在預測直腸癌患者對 nCRT 反應的效能,并驗證模型的穩定性和泛化能力,以實現人工智能相關技術的臨床應用。
5 總結與展望
隨著診療理念及技術的進步,對于 nCRT 之后經全面詳細評估達到 cCR 的直腸癌患者可在權衡相關診療條件的情況下考慮開展“等待&觀察”策略,這提高了器官保存率并且可以避免手術并發癥。但在直腸癌患者中相對較高的局部復發率對準確評估 nCRT 療效提出了較高要求。基于血液樣本檢測得到的腫瘤標志物在預測 LARC 患者對 nCRT 反應中表現出潛在的作用,具有微創、可重復、可動態檢測的優勢。但尚需進行更多大樣本、前瞻性的研究以確定更佳的閾值,提高標志物的靈敏度和特異度,同時還需考慮成本效益因素。直腸指檢、內鏡和直腸 MRI 檢查相結合,是較為常用的綜合評估直腸癌患者對 nCRT 的反應方法,但其準確仍然較差,同時容易受到觀察者間主觀因素的影響。因此,在面對模棱兩可的發現時,需謹慎觀察,通過多學科討論以及結合多種檢查手段,個體化權衡利弊。最后,影像組學在評估 nCRT 療效方面也表現出具有希望的作用,隨著人工智能技術的發展,有望實現臨床應用,進一步推動直腸癌綜合診療的進步,為患者帶來更準確、高效的診療服務。
利益沖突:所有作者聲明不存在利益沖突。
結直腸癌是全球第三大常見癌癥,也是癌癥死亡的第二大原因,每年新發病例數約為 200 萬例[1]。近 40%的新發結直腸腫瘤位于直腸,其中大部分為局部晚期直腸癌(locally advanced rectal adenocarcinoma, LARC),指不伴淋巴結受累的 T3 或 T4 期腫瘤或伴淋巴結受累時任何 T 分期的腫瘤[2]。對于 LARC 患者,標準治療為多模式聯合治療方案,包括新輔助放化療(neoadjuvant chemoradiotherapy, nCRT)、全直腸系膜切除術,以及術后輔助化療[3-4]。對于可切除的直腸癌患者,nCRT 提高了病理完全緩解(pathological complete response, pCR)率和局部控制率,與術前單純放療相比還進一步降低了病理分期[5-6]。但在接受 nCRT 后,僅 15%~20%的患者可以達到 pCR[7],提示預后較好[8-9]。這表明 LARC 具有很強的異質性,nCRT 對不同患者療效差異巨大。因此,準確評估及預測腫瘤對 nCRT 的治療反應,對手術方案、輔助治療策略等臨床決策至關重要[10]。既往研究表明,對于新輔助治療后經嚴格篩選達到臨床完全緩解(complete clinical response, cCR),且現有常規外科技術保肛困難,有強烈保肛意愿者可結合各中心實際情況謹慎采用“等待&觀察”策略,并定期隨訪,以避免手術和保全器官[7, 11]。但需要指出的是,cCR 并不等于 pCR。數據表明,經評估達到明顯 cCR 的患者中,有 15%~25%的患者出現了局部復發[12]。因此,準確評估及預測患者對 nCRT 的反應,是制定 LARC 患者個性化治療方案的關鍵。因此,本文回顧了不同評估 LARC 患者對 nCRT 治療反應的參數或工具的潛在價值,以總結其應用現狀并展望發展方向。
1 血液樣本檢測
血液是較為簡便易得的樣本,因此大量研究報道了不同以血液為樣本檢測的不同指標如血小板[13]、血清腫瘤標志物[14]、循環腫瘤細胞、循環腫瘤 DNA[15]等預測 LARC 對新輔助治療反應的作用。
血小板計數(platelet count, PLT)是臨床常用的外周血檢測指標。有研究通過單因素分析發現 LARC 患者 nCRT 前 PLT 高于閾值預示著更差的 pCR[13, 16],但僅有有限的研究通過多因素分析證實 PLT 與 pCR 相關[16]。在通過血清血紅蛋白水平預測 LARC 對 nCRT 反應的研究中表現出類似的結果,多項研究僅通過單因素分析證明血清血紅蛋白水平與 nCRT 反應間存在關系,而多因素分析中均未表現出二者相關[13, 17-18]。
癌胚抗原(carcinoembryonic antigen, CEA)是直腸癌的血清腫瘤標志物之一,是一種表達于正常上皮細胞膜頂端的糖蛋白,其在腫瘤細胞中去極化,從而在循環中的表達和濃度升高[19]。血清 CEA 水平被視為 CRC 的預后標志物[20],但 nCRT 前血清 CEA 水平對 LARC 治療反應的預測作用存在爭議。有研究表明,nCRT 前血清 CEA 水平低于 2.5 ng/mL 的 LARC 患者較血清 CEA 水平高于該閾值的患者表現出更佳的 pCR[14]。多項研究通過單因素分析表明 LARC 患者 nCRT 前血清 CEA 值低于臨界值預示著對 nCRT 更好的反應和腫瘤退縮[13, 16, 21-26],進一步進行多因素分析也證實 nCRT 前低血清 CEA 水平是腫瘤退縮的獨立預測因素[16, 23-26],但需指出的是這些研究設定的血清 CEA 閾值存在差異,尚缺乏足夠靈敏度和特異度的閾值[27]。值得注意的是,還有一部分研究的結果中并沒有表現出 nCRT 前血清 CEA 的水平與腫瘤治療反應之間的統計學關系[28-32]。此外,還有研究發現 nCRT 后低于閾值的血清 CEA 水平與 pCR 相關[22, 26, 33-34]。
液體活檢通過從腫瘤患者各種體液(如血液、尿液、胸腹腔積液等)中獲得腫瘤相關組織或細胞,以檢測和分析腫瘤相關生物標志物[35]。液體活檢可以檢測血液中的循環腫瘤細胞、ctDNA、游離細胞 DNA(cell-free DNA, cfDNA)和外泌體等[36],ctDNA 是 cfDNA 在降解中產生的小片段,來源于患者凋亡或壞死腫瘤細胞的 DNA,具有腫瘤特異性的分子特征[37-39]。NCRT 前 ctDNA/cfDNA 水平預測治療反應的研究間表現出有差異的結果。Ravenda 等[15]研究發現,達到 pCR 的患者在 nCRT 前檢測出的 ctDNA 水平最低,nCRT 后尚有腫瘤殘存的患者治療前 ctDNA 水平較高(P=0.18)。同樣的,Zhou 等[40]的研究也發現 nCRT 反應良好的 LARC 患者治療前 ctDNA 陽性率降低(P<0.001)。而已有研究結果表明,LARC 患者 nCRT 前 ctDNA/cfDNA 的水平與患者是否達到 pCR 無關[41-45]。Chang 等[46]進行的一項 Meta 分析表明,nCRT 前的 ctDNA 狀態與 LARC 患者是否 pCR 無關。然而,其研究還發現 nCRT 后 ctDNA 的陽性表達預示著更差的 pCR。這可能是由于 nCRT 后,原發腫瘤組織釋放的 ctDNA 清除,而體內殘存腫瘤的患者會繼續釋放 ctDNA。
2 內鏡檢查及活組織病理檢查
直腸內鏡檢查可觀察到腫瘤形態學變化,反映了 nCRT 后不同程度的消退[47],因此,內鏡圖像被認為是評估 LARC 對 nCRT 反應的重要臨床工具。然而,該方法存在可重復性、標準化等方面的局限性。內鏡檢查通過觀測直腸黏膜的細微改變來評估治療反應,但它無法提供直腸黏膜內以及直腸系膜內的改變[47]。此外,不同患者的內鏡特征與 nCRT 后腫瘤反應程度的相關性尚未得到廣泛研究[48]。
nCRT 后腸黏膜的變化可以經直腸內鏡放大黏膜圖像觀察到。這些變化包括水腫、炎癥、狹窄、充氣時彈性降低等,同時還提供了其他的如黏膜顏色等可視性特征,對 nCRT 的反應具有提示作用[49]。在進行評估時,內鏡下所見的特征包括:① 扁平,白色瘢痕;② 毛細血管擴張;③ 有/無潰瘍;④ 有/無結節;⑤ 黏膜小結節或輕微黏膜異常;⑥ 淺表潰瘍;⑦ 瘢痕處輕度持續性紅斑;⑧ 可見腫瘤。在確定腫瘤對 nCRT 的反應程度時,通過陽性/陰性或存在/不存在評估內鏡下所見上述特征的表現。根據鏡下的不同表現,將 nCRT 后的直腸癌患者分為 cCR、近似cCR和非完全臨床緩解[50-51]。然而,內鏡標準及個體內鏡特征的判斷具有較強主觀性,容易受到不同觀測者的影響。
應用預先制定的內鏡特征標準可以提高內鏡評估的客觀性,從而準確地判斷直腸腫瘤對 nCRT 的反應程度[48, 52]。既往研究發現,外科醫生之間在通過內鏡下特征評估腫瘤退縮等級(tumor regression grade, TRG)時存在差異,有經驗的外科醫生間在內鏡特征選擇和 TRG 評估方面的變異性較低[48]。另一項研究指出,運用預先制定的內鏡特征標準在判斷可能或確定的 nCRT 后腫瘤完全緩解時,其靈敏度為 72%~90%。在被評估為確定或可能完全緩解的患者中,有 63%~78%的患者最終被證實達到 pCR,或至少 2 年沒有出現局部復發[52]。
當內鏡檢查高度懷疑直腸癌患者 nCRT 后腫瘤仍存在時,活組織病理檢查是較為推薦的手段,但內鏡下只能鉗夾到有限的淺表組織,假陰性取樣風險較高。既往研究報道,通過內鏡活檢獲得的黏膜和黏膜下層的淺表組織活檢將無法檢測到 25%臨床分期 T2 期和 40%臨床分期 T3/T4 期的直腸癌患者腫瘤細胞的存在[53]。這可能是因為腫瘤細胞延腸壁縱向侵襲,而不是延淺表黏膜層水平生長。因此,有研究推薦采用包括固有肌層在內的全層活檢,以提供更為準確的取樣和病理 T 分期結果[54]。
3 影像學檢查
磁共振成像(magnetic resonance imaging, MRI)對直腸癌基線分期和 nCRT 后再分期至關重要[55-56]。由于其較高的軟組織分辨率和多平面成像技術,MRI 可以提供直腸腫瘤與其毗鄰結構的詳細特征[57]。此外,MRI 的功能成像和后處理技術能夠對殘留腫瘤進行定量分析[58]。在 T2 加權(T2 weighted image, T2WI)MRI 圖像上,腫瘤纖維化表現出與正常固有肌層相似的信號強度,殘余腫瘤則表現出與治療前 MRI 圖像相似的中等信號[58]。以擴散加權成像(diffusion-weighted imaging, DWI)和灌注成像為代表的功能成像序列,可以在細胞水平上更好地反映腫瘤的生理和生物學特性。DWI 有助于區分纖維化和活躍增殖的細胞,可反映存活腫瘤細胞的活性并提高診斷準確性[59]。通過量化 DWI 序列的特性,可以得到表觀擴散系數,較低的表觀擴散系數值往往預示著腫瘤細胞密度和侵襲性的增加[60-61]。研究發現,由放射科經驗豐富的專家和普通醫師根據 nCRT 后的 MRI 圖像確定的 T 分期與病理檢查 T 分期的一致性分別為 48%和 43%,達到中等的總體準確性,在評估反應較差的患者時的準確性優于反應較好的患者[62]。這可能是由于臨床醫生在判斷包括纖維化在內的任何異常區域時,更傾向于謹慎的評估。因此需要強調將 MRI 檢查與內鏡及直腸指檢等技術相結合,以最準確地評估局部腫瘤對 nCRT 的反應程度[63]。
nCRT 后 MRI 評估腫瘤反應的最佳時機取決于 nCRT 后距離手術的間隔時間,然而目前尚缺乏對 nCRT 治療完成到手術的最佳間隔時間的共識。nCRT 對腫瘤的殺傷作用隨時間推移而增加,因而治療后等待時間越長,達到 pCR 的患者可能越多[64]。盡管在 nCRT 完成 8 周后進行手術可能更有益[65],但處于放射性骨盆纖維化和相關手術并發癥等考慮,外科醫生往往選擇 nCRT 完成后 6~8 周進行手術[66]。因此,應在 nCRT 結束后 6~8 周及手術前進行 MRI 檢查,以評估直腸癌患者的腫瘤退縮情況。
基于 MRI 的腫瘤退縮等級(MRI-based tumor regression grade, mrTRG)是評估 nCRT 后腫瘤的消退程度的工具之一[67],mrTRG 是由纖維性或腫瘤性信號強度在整個腫瘤區域中的占比來定義的[68],不同 mrTRG 評分系統在定義 TRG 時存在細微差別,但總體上 mrTRG 等級越低則表示腫瘤退縮越明顯,如 mrTRG 1 級表示無癌細胞存活。通常較難區別治療導致的纖維化和存活腫瘤細胞的信號強度,因此 nCRT 后 mrTRG 評估具有挑戰[69]。隨著檢查技術的進步及經驗的積累,MRI 評估 nCRT 后直腸腫瘤區域變化的準確性有所提升。一項多中心的前瞻性研究報道,3 名經驗豐富的專業放射科醫師獨立閱片評估及共同審查后,通過 mrTRG 評估 nCRT 后 pCR 的陽性預測值為 40%,而 MRI 再分期確定殘余腫瘤并經病理檢查證實的陰性預測值達 84%[70]。另一項研究發現 mrTRG 預測 pCR 的特異度為 69.6%,陽性預測值達 85.6%[71]。Niu 等[72]研究發現 mrTRG 與病理 TRG 之間具有一致性,mrTRG 二分類[pCR(mrTRG1) vs. 非 pCR(mrTRG2-5)]時加權 kappa 值為 0.391,三分類[pCR(mrTRG1) vs. 腫瘤部分緩解(mrTRG2-3) vs. 腫瘤無反應(mrTRG4-5)]時加權 kappa 值為 0.287。
同步正電子發射斷層掃描(positron emission tomography, PET)和 MRI(PET/MRI)是將 MRI 解剖學和定量優勢與 PET 檢查獲得的生理信息相結合的技術。與 PET/CT 相比,PET/MRI 能增加收集 PET 數據的時間,量化放射性示蹤劑的攝取以及使用 MRI 的多參數進行評估等[73]。近年來 PET/MRI 的應用不斷增多,但仍是一項新興技術,缺乏在直腸癌分期和放化療后評估中長期前瞻性和預后數據。與單獨使用 MRI 相比,使用 PET/CT 評估直腸癌患者 nCRT 反應時,其在再分期的敏感性、特異性和準確性方面均有提高。Crimì 等[74]的研究發現 PET/MRI 和 MRI 對于直腸癌患者 nCRT 治療后病理 T 分期判斷的準確性分別為 92%和 89%。PET/MRI 潛在缺點包括成像設備的可及性有限、檢查成本和檢查時間的增加等,還需要更多大樣本研究進一步探索其在 nCRT 后評估腫瘤退縮情況的能力。
4 影像組學及人工智能
影像組學是指從 CT、MRI 等影像圖像中高通量地提取大量影像組學特征,之后運用機器學習的方法對這些特征進行統計學分析,建立具有分類、預測功能的模型[75]。由于能夠深度挖掘各種影像學檢查獲取的圖像中人眼難以發現的特征,并對數據進行定量的分析,一定程度上克服了人工閱片的主觀性,并在腫瘤的診斷、分期、分級、預后預測等方面表現出巨大潛力[76-77]。影像組學研究的基本工作流程包括原始影像數據采集、數據預處理、圖像分割、特征提取、特征降維、建模分析及驗證,其中特征提取和構建模型最為關鍵。目前,已有大量研究報道影像組學在預測直腸癌對 nCRT 反應方面具有較好的表現[78-80]。
Cheng 等[81]基于晚期直腸癌患者 nCRT 前的多序列 MRI 圖像,使用多元邏輯回歸的方法構建了預測 pCR 模型。其所構建模型的受試者操作特征曲線下面積(area under curve, AUC)為 0.855,準確性為 0.831。類似的,另一項運用多元邏輯回歸方法構建預測 LARC 患者 nCRT 療效模型的研究納入了患者治療前 MRI 檢查 T2WI 圖像,基于腫瘤區域影像組學特性構建的模型 AUC 為 0.805[82]。盡管上述兩項研究對于 nCRT 后患者反應的分類不同,一個是預測 pCR(定義為 TRG 1),一個是預測主要病理緩解(定義為 TRG 1-2),但其預測結果沒有表現出較大差別,這表明影像組學模型在預測 nCRT 時的巨大潛力。除了邏輯回歸這一統計學方法外,還有學者基于其他機器學習算法構建的預測模型也展現出了較好的預測能力。如 Wei 等[83]分別基于支持向量機、邏輯回歸、隨機森林等方法構建預測 LARC 患者在 nCRT 后是否達到 pCR 的模型。最終,隨機森林模型表現出更佳的預測性能,其準確率達 84.4%,AUC 為 0.829。
此外,諸如卷積神經網絡等深度學習方法也表現出了良好的預測 nCRT 反應的性能。Fu 等[84]基于 LARC 患者 nCRT 前 MRI 的 DWI 序列圖像,通過卷積神經網絡提取基于深度學習的影像組學特征構建預測對 nCRT 反應的模型,最終該模型的 AUC 達到 0.73,優于人工提取的影像組學特征所構建的預測模型(AUC=0.64)。而 Shi 等[85]基于卷積神經網絡的深度學習和影像組學,使用治療前的多參數 MRI 圖像構建了直腸癌 nCRT 療效的預測模型,最終深度學習模型預測 pCR 的平均 AUC 為 0.59,預測準確性不如影像組學(AUC=0.78)。但這兩項研究的樣本量較少,均不足 100 例,因此在深度學習的研究中,尚需要進一步探索,運用大樣本數據對模型進行訓練,檢驗模型的預測性能。
最近的研究表明,將 nCRT 不同時期的 MRI 圖像結合構建預測模型時,對 nCRT 反應的預測準確性有所增加。正如已有研究將治療前(AUC=0.59)和放化療中期(放療開始后 3~4 周,AUC=0.74)的影像組學特征結合之后,基于卷積神經網絡構建的預測模型效能與單獨使用單一時期特征模型相比,準確性更高(AUC=0.83)[85]。還有一些研究將基于 nCRT 前后 MRI 影像組學特征的差異構建預測模型。如 Chen 等[86]運用支持向量機算法,聯合 nCRT 前后的影像組學特征及其差異構建預測模型,聯合預測模型達到了 96.15%的準確性,而基于治療前圖像的預測模型和治療后圖像的預測模型準確性分別為 92.3%和 88.46%。類似的,在已有研究中,基于不同時期影像組學特征差異構建的模型均表現出較好的預測 nCRT 療效的能力[87-88]。這可能是由于 nCRT 后 MRI 是在完成整個療程后進行的,時間非常接近手術,因此與病理反應高度相關。
還有一些研究將影像組學特征與其他因素如臨床特征結合,構建了聯合預測模型,以期進一步提高模型的預測效能。Delli 等[89]基于 nCRT 前的 MRI 圖像,將臨床特征(于 MRI 檢查結果獲得,如腫瘤位置、腫瘤總體積、直腸系膜筋膜浸潤等)與影像組學特征聯合,運用機器學習方法構建預測 nCRT 反應的模型。最終聯合模型的 AUC 達到 0.793,較基于單一特征構建的模型改善了預測性能。另一項研究也嘗試將臨床基線參數(CEA、腫瘤治療后長度和厚度)與影像組學特征聯合構建了預測 nCRT 后達到 pCR 的列線圖模型,其 AUC 達到了 0.912,而基于單一特征構建的模型 AUC 為 0.842~0.855[81]。類似的,諸多既往研究中也報道了影像組學特征與臨床信息的聯合模型可以達到更佳的預測效果[82-83]。
除了影像組學方面的運用外,有研究將人工智能與內鏡檢查圖像結合,以評估直腸癌患者對 nCRT 的反應。Haak 等[90]基于 LARC 患者 nCRT 后的內鏡圖像,運用卷積神經網絡算法構建了評估 nCRT 療效的模型,結果表明,基于內鏡圖像模型的 AUC 為 0.71~0.79。而既往文獻報道有經驗的內鏡醫生在預測直腸癌患者對 nCRT 的反應時的 AUC 為 0.80~0.88[52,91]。Wang 等[92]基于內鏡圖像的深度學習算法來評估 LARC 患者的 nCRT 反應時,發現深度學習模型與人工評估表現相當。以上兩項研究的樣本量均較小,這可能無法更好地訓練預測模型。另一項納入了 1 000 例 LARC 患者的大樣本研究同樣基于患者內鏡檢查圖像,運用深度學習方法構建預測 nCRT 后腫瘤退縮的模型,達到了 92.1%的準確性,AUC 為 0.95,且其表現優于 3 名經驗豐富的內鏡醫師[93]。因此,需要多中心、大樣本數據訓練深度學習模型,以進一步確定其表現。
大量研究結果表明影像組學在直腸癌的 nCRT 療效評估中可能發揮重要作用,對患者的個性化治療以及臨床決策的制定具有潛在價值,但將其轉化為臨床實際運用時還面臨許多挑戰和需改進之處。第一,目前大多數影像組學相關研究為單中心、小樣本研究,研究過程中不可避免地存在偏倚。第二,各機構所使用的影像設備標準各異,其圖像受機器參數、造影劑等因素影像可能存在誤差,也會影響結果的可重復性。第三,大多數研究在進行圖像分割時采用人工勾畫,非常費時費力,并且會受到操作者經驗等個人因素的影響,需要進一步探索基于深度學習的圖像自動或半自動勾畫的方法。因此,未來需要進行更多大樣本、多中心的研究,甚至開展前瞻性研究,進一步探索影像組學在預測直腸癌患者對 nCRT 反應的效能,并驗證模型的穩定性和泛化能力,以實現人工智能相關技術的臨床應用。
5 總結與展望
隨著診療理念及技術的進步,對于 nCRT 之后經全面詳細評估達到 cCR 的直腸癌患者可在權衡相關診療條件的情況下考慮開展“等待&觀察”策略,這提高了器官保存率并且可以避免手術并發癥。但在直腸癌患者中相對較高的局部復發率對準確評估 nCRT 療效提出了較高要求。基于血液樣本檢測得到的腫瘤標志物在預測 LARC 患者對 nCRT 反應中表現出潛在的作用,具有微創、可重復、可動態檢測的優勢。但尚需進行更多大樣本、前瞻性的研究以確定更佳的閾值,提高標志物的靈敏度和特異度,同時還需考慮成本效益因素。直腸指檢、內鏡和直腸 MRI 檢查相結合,是較為常用的綜合評估直腸癌患者對 nCRT 的反應方法,但其準確仍然較差,同時容易受到觀察者間主觀因素的影響。因此,在面對模棱兩可的發現時,需謹慎觀察,通過多學科討論以及結合多種檢查手段,個體化權衡利弊。最后,影像組學在評估 nCRT 療效方面也表現出具有希望的作用,隨著人工智能技術的發展,有望實現臨床應用,進一步推動直腸癌綜合診療的進步,為患者帶來更準確、高效的診療服務。
利益沖突:所有作者聲明不存在利益沖突。