引用本文: 黃潤棋, 強光亮, 劉益飛, 史加海. 基于SHOX2和RASSF1A甲基化水平的機器學習算法預測早期肺腺癌病理類型. 中國胸心血管外科臨床雜志, 2025, 32(1): 67-72. doi: 10.7507/1007-4848.202408048 復制
版權信息: ?四川大學華西醫院華西期刊社《中國胸心血管外科臨床雜志》版權所有,未經授權不得轉載、改編
肺癌是所有癌癥中死亡率最高的類型,每年導致全球 180 萬人死亡[1]。肺腺癌是最常見的肺癌亞型,占所有肺癌的39%,且其發病率正在逐年上升[2-3]。早期肺腺癌的病理演變經歷了從不典型腺瘤樣增生(atypical adenomatous hyperplasia,AAH)到原位腺癌(adenocarcinoma in situ,AIS),再到微浸潤腺癌(minimally invasive adenocarcinoma,MIA)及浸潤性腺癌(invasive adenocarcinoma,IA)的過程。對于 AIS 和 MIA,肺楔形切除、肺段切除已被證明在確保治療效果的同時,能夠最大限度地保留肺功能、縮短手術時間、減少術后并發癥。而對于IA,可能需要進行肺葉切除或全肺切除,且常需聯合放療、化療以及靶向治療[4]。因此,早期肺腺癌病理類型的準確診斷是臨床決策面臨的巨大挑戰。低劑量計算機斷層掃描(low-dose computed tomography,LDCT)具有高敏感性,有助于早期肺腺癌的檢測,能夠識別肺實質中的細微變化,包括一些已確定的肺腺癌典型影像表現,如毛玻璃結節。盡管LDCT篩查顯著提高了早期肺癌的檢測率,但由于可檢出的病變尺寸變得更小,導致可切除的病變組織減少。早期病變的形態多樣性使直接區分良性和惡性病變變得更加困難,并引發了過度診斷和過度治療的問題。
近年來,表觀遺傳學研究的進展引起了人們對 DNA 甲基化在癌癥發病機制中作用的極大關注[5-6]。大量研究[7]表明,某些特定區域的異常 DNA 甲基化是人類癌癥中高度確定的表觀遺傳改變。這種特性不僅具有區分癌細胞與正常組織的潛力,還為其在早期癌癥檢測中的應用提供了可能。SHOX2基因被證實是多種癌癥信號通路的調控子或效應子,可促進腫瘤的發生和發展。SHOX2基因異常高甲基化可能發生在肺癌早期并與高甲基化后該基因的失活有關[8]。RASSF1A 是一種常在多種癌癥中缺失的腫瘤抑制基因。RASSF1A 已被廣泛作為肺癌的輔助 DNA 甲基化生物標志物[9]。SHOX2 和 RASSF1A 甲基化檢測已被證明可用于多種腫瘤的診斷,其在提高早期肺癌檢測靈敏度方面的潛力得到驗證[10-11]。既往研究[12]表明,SHOX2 和 RASSF1A 甲基化在早期肺腺癌檢測中發揮了重要作用,特別是在區分 AIS、MIA 和 IA 方面,SHOX2 和 RASSF1A 甲基化可作為病理診斷不明確的早期肺腺癌病例的補充診斷工具。然而,傳統的分類方法難以直接區分所有類型的肺腺癌,這限制了其在臨床中的應用。
近年來,隨著機器學習方法在處理復雜非線性關系方面表現出的顯著優勢,這些方法在醫學領域的應用得到了廣泛關注和認可。尤其是在應對各種環境和疾病條件下的復雜預測任務中,機器學習模型展示出了超越傳統統計學方法的潛力,不僅能夠捕捉數據中的潛在模式,還能提高疾病診斷和預測的準確性[13]。機器學習技術已成功應用于多種醫學預測任務,包括癌癥篩查、疾病進展預測和治療反應評估等。然而,盡管已有許多研究[14]表明機器學習在腫瘤學領域的巨大潛力,其在早期肺腺癌病理類型預測中的應用仍需進一步探索和驗證。本研究旨在整合 SHOX2 和 RASSF1A 的甲基化數據,開發并優化多種機器學習模型,以直接預測早期肺腺癌的病理類型。
1 資料與方法
1.1 臨床資料和分組
回顧性分析2021年1月—2023年1月在南通大學附屬醫院接受肺部腫瘤切除手術患者的石蠟包埋(formalin-fixed paraffin-embedded,FFPE)標本。納入標準:經病理證實,腫瘤組織屬于肺良性腫瘤或者腺癌類型。排除標準:FFPE樣本的保存時間超過2年。由于AIS被歸類為癌前病變,在本研究中,良性腫瘤(benign tumor,BT)與AIS被歸為一類(BT/AIS)。根據腫瘤的病理學類型,將患者分為BT/AIS組、MIA組和IA組。
1.2 DNA提取和處理
使用FFPE DNA提取試劑盒(CWY009S,康為世紀,中國)裂解FFPE的組織材料。在Qubit? 3.0熒光計上使用Qubit dsDNA HS Assay Kit(Life Technologies,加拿大)評估DNA濃度。隨后,使用亞硫酸氫鹽及Tellgen DNA Purification Kit(Tellgen,中國)處理DNA,將未甲基化的胞嘧啶轉化為尿嘧啶。
1.3 DNA甲基化水平的檢測
使用國家藥品監督管理局批準的體外診斷試劑(LungMe,20173403354,透景,中國)測定FFPE樣本中的DNA甲基化水平。亞硫酸氫鹽處理后純化的DNA采用RT-PCR儀(ABI 7500)進行MS-PCR。引物如下:SHOX2,F:5'-TTGTTTTTGGTTCGGGTT-3',R:5'-CATAACGTAAACGCCTATACTC-3';RASSF1A,F:5'-CGGGGTTCGTTTTGTGGTTTC-3',R:5'-CCATTAAATCCGTACTTCGC-3'。甲基化SHOX2、RASSF1A和β-ACTB的相應擴增通道分別為VIC、FAM和CY5。使用以下公式計算每個特定基因的甲基化水平:ΔCt=Ct?Ctβ-ACTB。ΔCt 表示目標基因的循環閾值(Ct)與參考基因(β-ACTB)循環閾值之間的差值。
1.4 模型構建
將數據隨機拆分為訓練集(70%的隨機樣本)與驗證集(30%的隨機樣本)。在訓練集中,將病理類型作為目標變量,即BT/AIS、MIA和IA,將RASSF1A和SHOX2的甲基化水平作為預測變量。首先,使用StandardScaler對預測變量進行標準化處理。由于數據集中存在類別不平衡的問題,使用SMOTE(合成少數類過采樣技術)平衡類別分布。在模型開發過程中,選擇4種機器學習算法:邏輯回歸、XGBoost、隨機森林、樸素貝葉斯。采用一對多策略(OneVsRestClassifier)執行多類別分類任務,以便將原本適用于二分類的模型擴展到多分類問題上。為優化每種模型的性能,通過使用網格搜索策略(GridSearchCV)和10折重復交叉驗證選擇最佳超參數組合,其中評估指標為受試者工作特征(receiver operating characteristic,ROC)曲線下面積(area under the curve,AUC)。超參數范圍設置如下:邏輯回歸模型中對正則化強度(C)和懲罰項(L1和L2),以及類別權重進行調優。XGBoost模型的優化則涉及學習率、樹的最大深度、子采樣比例和列采樣比例超參數。隨機森林模型的超參數優化包括決策樹的數量、最大深度、最大特征數。樸素貝葉斯模型則調優了平滑參數。以上數據預處理及模型本身封裝在管道(pipeline)中,最后將訓練好的最佳模型保存為可重用的模型文件,以供后續分析使用。在驗證集中,通過C統計量(即AUC)、靈敏度(sensitivity)、特異性(specificity)、準確度(accuracy)、精確度(precision)、ROC曲線與決策曲線分析評估每個模型的預測性能。ROC曲線可以提供一個初步的模型性能評估,AUC值越接近1,模型的分類性能越好。決策曲線分析通過在指定的閾值概率范圍內展示模型的凈收益,幫助評估模型在不同臨床情境下的適用性和效用,并具有直接的臨床解釋意義。
1.5 統計學分析
使用Python語言進行統計學分析。符合正態分布的計量資料以均數±標準差(x±s)表示。計算各模型預測性能指標的95%置信區間(confidence interval,CI)。采用DeLong檢驗比較在同一病理分類下參考模型與其他機器學習方法的C統計量的差異。雙側檢驗水準α=0.05。
1.6 倫理審查
本研究已獲得南通大學附屬醫院倫理委員會的批準(2022-L165),所有患者均簽署知情同意書。
2 結果
2.1 納入患者的基線特征
共納入272例患者,其中171例IA、36例MIA、31例AIS和34例BT。總體上,隨著病變侵襲性的增加,患者的平均年齡也有所增加。在性別分布方面,3組患者中女性比例高于男性。SHOX2與RASSF1A的甲基化水平隨著腫瘤惡性程度的增加而降低;見表1。

2.2 模型的診斷效能分析及比較
邏輯回歸模型對肺腺癌病理類型無區分能力,XGBoost模型與隨機森林模型對3種病理類型均表現出更強的區分能力,樸素貝葉斯模型的表現略優于邏輯回歸模型,其對IA的區分能力優于MIA和BT/AIS;見表2。表3顯示了各模型構建所使用的超參數類型及其對應的值。ROC曲線見附件圖1。


2.3 決策曲線分析
通過決策曲線分析評估隨機森林模型在多分類任務中不同病理類型患者的凈收益。在BT/AIS類別中,無論是XGBoost還是隨機森林模型,在較廣泛的閾值概率范圍內均表現出較高的凈收益,尤其是在<20%閾值概率時,模型表現更為優異,顯示出良好的區分能力和臨床適用性。在MIA類別中,XGBoost模型在14%閾值概率以下表現出顯著的凈收益,而隨機森林模型則在低閾值范圍內展現出穩定的區分能力,盡管在較高閾值時凈收益有所下降。這表明在預測MIA病理類型時,兩種模型均能提供一定的臨床幫助,但在較高閾值范圍內需要進一步優化。在IA類別中,XGBoost和隨機森林模型均展現出較高的凈收益,尤其是在較高閾值概率(>54%)時,兩種模型的表現均優于假設所有患者均為IA的基線策略。然而,XGBoost在>70%的閾值概率,凈收益略低于全部患者被分類為IA的基線策略,而隨機森林模型的表現則在>45%的閾值概率仍表現出較高的預測能力。總體來看,隨機森林模型在各病理類型中的表現稍優于XGBoost模型,特別是在IA類別中展現出更高的凈收益。在臨床應用中,這兩種機器學習方法能夠在不同閾值下減少誤診和漏診,從而優化患者的治療方案。XGBoost和隨機森林模型的決策曲線圖見附件圖2。
3 討論
不同病理類型的肺腺癌在生物學行為、預后和治療響應上存在顯著差異。IA通常需要更積極的治療措施,MIA可能需要手術或聯合放化療切除,AIS則只需手術切除,良性腫瘤無需治療或在必要時進行手術切除。IA往往預后較差,需要密切監測和長期管理;而MIA或AIS通常預后較好,治療后復發的風險較低。通過準確的病理分型可以避免對低風險患者過度治療,減少患者的治療負擔以及不必要的手術風險和并發癥。因此,對早期肺腺癌進行病理類型診斷具有重要的臨床意義。
LDCT的廣泛應用顯著促進了肺腺癌的早期發現。盡管LDCT具有高靈敏度,能夠識別大量較小的早期病變,但早期病變的形態多樣性和復雜性也增加了區分良性和惡性病變的難度。近年來,DNA甲基化改變作為癌癥早期預后指標的潛力日益受到關注。SHOX2 的表達在大多數癌癥類型中顯著升高。通過對肺癌和正常組織中 SHOX2 甲基化的比較分析,觀察到 96% 的腫瘤組織表現出甲基化水平升高[15]。此外,SHOX2 高表達或低甲基化表明分化較差且預后不良[8]。RASSF1A 的啟動子區在 63% 的非小細胞肺癌細胞中表現出高甲基化,而在正常上皮細胞中不受影響[16]。此外,RASSF1A 甲基化水平可以預測接受培美曲塞化療的非小細胞肺癌患者的病情進展[17]。在肺癌早期診斷中,SHOX2和RASSF1A基因的甲基化聯合檢測已被證明具有較高的敏感性和特異性[10-11]。研究[18]表明,SHOX2和RASSF1A甲基化水平與早期肺腺癌中Ki-67的表達呈正相關。Ki-67是癌細胞增殖的標志物,較高的Ki-67值意味著腫瘤生長和發展加速,最終導致患者預后較差[19-20]。因此,SHOX2和RASSF1A甲基化陽性可能暗示患者的腫瘤將更快進展。此外,有研究[21]報道,RASSF1A與肺癌高侵襲性之間存在顯著相關性。RASSF1A基因的抑制能夠促進肺癌細胞的侵襲和遷移。因此,腫瘤的侵襲性與SHOX2和RASSF1A甲基化陽性率呈正相關,即侵襲性越高,陽性率越高。我們采用SHOX2和RASSF1A基因的甲基化水平作為標志物,通過分析手術組織樣本,優化了這些標志物的臨界值。SHOX2和RASSF1A聯合檢測的AUC值在區分IA和BT時為0.814,在區分癌癥組(IA和MIA)和非癌癥組(AIS和BT)時為0.770,均超過0.75的閾值,進一步確認了其在早期肺腺癌診斷中的應用價值[12]。然而,傳統的分類方法無法直接區分所有類型的肺腺癌,這限制了其臨床應用前景。
本研究的目的在于展示機器學習模型在肺腺癌病理類型診斷中的顯著優勢。通過整合SHOX2和RASSF1A的甲基化數據,我們開發并優化了多種機器學習模型,能夠直接預測肺腺癌的3種病理類型。相比于線性機器學習算法如邏輯回歸和樸素貝葉斯,非線性機器學習算法如隨機森林和XGBoost在肺腺癌病理分型的預測中展現出更高的特異性和陽性似然比。邏輯回歸和樸素貝葉斯算法具有簡單且容易理解的特點,其輸出可以解釋為事件發生的概率,這種解釋性在許多實際應用中非常有用[22-23]。然而,預測變量與目標變量之間的線性關系在臨床實際中可能不成立,導致線性模型可能無法準確建模。非線性模型(如XGBoost、隨機森林)能夠處理預測變量之間的高階非線性交互作用,這是傳統建模方法(如邏輯回歸模型)難以實現的[24-25]。隨機森林模型在預測肺部腫瘤的病理分型方面達到了更高的特異性和陽性似然比,從而減少了不必要的侵入性活檢,可能會減少誤診率和過度治療的風險。此外,在決策曲線分析中,機器學習方法在考慮假陰性(未檢測到實際存在的腺癌)和假陽性(誤診為腺癌的良性病變)影響的情況下表現出了更高的凈收益。
盡管與傳統方法相比,機器學習方法的預測能力更優,但其預測能力仍然存在一定的局限性。可能的原因包括RASSF1A和SHOX2甲基化水平與肺腺癌病理分型之間的關系可能受其他尚未被納入模型的重要生物標志物的影響。這些未納入的標志物可能與肺腺癌的發生和進展密切相關,但由于當前模型輸入變量的限制,這些標志物未能被充分捕捉和利用,導致模型預測能力的潛在局限性。此外,甲基化水平的測量可能存在一定的變異性,這種生物測量誤差可能進一步影響模型的準確性。再者,盡管機器學習方法能夠處理復雜的數據模式,但其對數據質量和數量的依賴性較強。如果訓練數據集不足或存在噪聲,這可能會限制模型的泛化能力,尤其是在處理新數據時。因此,盡管機器學習方法展示了顯著的預測優勢,但在實際應用中仍需謹慎考慮模型的局限性和改進方向,如整合更多維度的數據或開發更為復雜的模型結構。
在早期肺腺癌病理類型數據分析中,基于RASSF1A和SHOX2甲基化水平的機器學習算法顯著提升了預測肺腺癌病理類型的準確性,相較于傳統的分診方法具有更高的區分能力。機器學習算法增強了臨床醫師在肺部腫瘤病理分型決策中的能力,從而避免對非高風險患者的過度治療,進而實現更精準的臨床護理和資源配置。
利益沖突:無。
作者貢獻:劉益飛負責論文設計、審閱與修改,技術支持;史加海負責論文審閱與修改,資金支持和監督;黃潤棋負責數據收集、整理,論文初稿撰寫;強光亮負責數據整理、分析及可視化,論文討論和修訂。所有作者均已閱讀稿件最終版并同意發表。
本文附件圖1~2見本刊網站電子版(
肺癌是所有癌癥中死亡率最高的類型,每年導致全球 180 萬人死亡[1]。肺腺癌是最常見的肺癌亞型,占所有肺癌的39%,且其發病率正在逐年上升[2-3]。早期肺腺癌的病理演變經歷了從不典型腺瘤樣增生(atypical adenomatous hyperplasia,AAH)到原位腺癌(adenocarcinoma in situ,AIS),再到微浸潤腺癌(minimally invasive adenocarcinoma,MIA)及浸潤性腺癌(invasive adenocarcinoma,IA)的過程。對于 AIS 和 MIA,肺楔形切除、肺段切除已被證明在確保治療效果的同時,能夠最大限度地保留肺功能、縮短手術時間、減少術后并發癥。而對于IA,可能需要進行肺葉切除或全肺切除,且常需聯合放療、化療以及靶向治療[4]。因此,早期肺腺癌病理類型的準確診斷是臨床決策面臨的巨大挑戰。低劑量計算機斷層掃描(low-dose computed tomography,LDCT)具有高敏感性,有助于早期肺腺癌的檢測,能夠識別肺實質中的細微變化,包括一些已確定的肺腺癌典型影像表現,如毛玻璃結節。盡管LDCT篩查顯著提高了早期肺癌的檢測率,但由于可檢出的病變尺寸變得更小,導致可切除的病變組織減少。早期病變的形態多樣性使直接區分良性和惡性病變變得更加困難,并引發了過度診斷和過度治療的問題。
近年來,表觀遺傳學研究的進展引起了人們對 DNA 甲基化在癌癥發病機制中作用的極大關注[5-6]。大量研究[7]表明,某些特定區域的異常 DNA 甲基化是人類癌癥中高度確定的表觀遺傳改變。這種特性不僅具有區分癌細胞與正常組織的潛力,還為其在早期癌癥檢測中的應用提供了可能。SHOX2基因被證實是多種癌癥信號通路的調控子或效應子,可促進腫瘤的發生和發展。SHOX2基因異常高甲基化可能發生在肺癌早期并與高甲基化后該基因的失活有關[8]。RASSF1A 是一種常在多種癌癥中缺失的腫瘤抑制基因。RASSF1A 已被廣泛作為肺癌的輔助 DNA 甲基化生物標志物[9]。SHOX2 和 RASSF1A 甲基化檢測已被證明可用于多種腫瘤的診斷,其在提高早期肺癌檢測靈敏度方面的潛力得到驗證[10-11]。既往研究[12]表明,SHOX2 和 RASSF1A 甲基化在早期肺腺癌檢測中發揮了重要作用,特別是在區分 AIS、MIA 和 IA 方面,SHOX2 和 RASSF1A 甲基化可作為病理診斷不明確的早期肺腺癌病例的補充診斷工具。然而,傳統的分類方法難以直接區分所有類型的肺腺癌,這限制了其在臨床中的應用。
近年來,隨著機器學習方法在處理復雜非線性關系方面表現出的顯著優勢,這些方法在醫學領域的應用得到了廣泛關注和認可。尤其是在應對各種環境和疾病條件下的復雜預測任務中,機器學習模型展示出了超越傳統統計學方法的潛力,不僅能夠捕捉數據中的潛在模式,還能提高疾病診斷和預測的準確性[13]。機器學習技術已成功應用于多種醫學預測任務,包括癌癥篩查、疾病進展預測和治療反應評估等。然而,盡管已有許多研究[14]表明機器學習在腫瘤學領域的巨大潛力,其在早期肺腺癌病理類型預測中的應用仍需進一步探索和驗證。本研究旨在整合 SHOX2 和 RASSF1A 的甲基化數據,開發并優化多種機器學習模型,以直接預測早期肺腺癌的病理類型。
1 資料與方法
1.1 臨床資料和分組
回顧性分析2021年1月—2023年1月在南通大學附屬醫院接受肺部腫瘤切除手術患者的石蠟包埋(formalin-fixed paraffin-embedded,FFPE)標本。納入標準:經病理證實,腫瘤組織屬于肺良性腫瘤或者腺癌類型。排除標準:FFPE樣本的保存時間超過2年。由于AIS被歸類為癌前病變,在本研究中,良性腫瘤(benign tumor,BT)與AIS被歸為一類(BT/AIS)。根據腫瘤的病理學類型,將患者分為BT/AIS組、MIA組和IA組。
1.2 DNA提取和處理
使用FFPE DNA提取試劑盒(CWY009S,康為世紀,中國)裂解FFPE的組織材料。在Qubit? 3.0熒光計上使用Qubit dsDNA HS Assay Kit(Life Technologies,加拿大)評估DNA濃度。隨后,使用亞硫酸氫鹽及Tellgen DNA Purification Kit(Tellgen,中國)處理DNA,將未甲基化的胞嘧啶轉化為尿嘧啶。
1.3 DNA甲基化水平的檢測
使用國家藥品監督管理局批準的體外診斷試劑(LungMe,20173403354,透景,中國)測定FFPE樣本中的DNA甲基化水平。亞硫酸氫鹽處理后純化的DNA采用RT-PCR儀(ABI 7500)進行MS-PCR。引物如下:SHOX2,F:5'-TTGTTTTTGGTTCGGGTT-3',R:5'-CATAACGTAAACGCCTATACTC-3';RASSF1A,F:5'-CGGGGTTCGTTTTGTGGTTTC-3',R:5'-CCATTAAATCCGTACTTCGC-3'。甲基化SHOX2、RASSF1A和β-ACTB的相應擴增通道分別為VIC、FAM和CY5。使用以下公式計算每個特定基因的甲基化水平:ΔCt=Ct?Ctβ-ACTB。ΔCt 表示目標基因的循環閾值(Ct)與參考基因(β-ACTB)循環閾值之間的差值。
1.4 模型構建
將數據隨機拆分為訓練集(70%的隨機樣本)與驗證集(30%的隨機樣本)。在訓練集中,將病理類型作為目標變量,即BT/AIS、MIA和IA,將RASSF1A和SHOX2的甲基化水平作為預測變量。首先,使用StandardScaler對預測變量進行標準化處理。由于數據集中存在類別不平衡的問題,使用SMOTE(合成少數類過采樣技術)平衡類別分布。在模型開發過程中,選擇4種機器學習算法:邏輯回歸、XGBoost、隨機森林、樸素貝葉斯。采用一對多策略(OneVsRestClassifier)執行多類別分類任務,以便將原本適用于二分類的模型擴展到多分類問題上。為優化每種模型的性能,通過使用網格搜索策略(GridSearchCV)和10折重復交叉驗證選擇最佳超參數組合,其中評估指標為受試者工作特征(receiver operating characteristic,ROC)曲線下面積(area under the curve,AUC)。超參數范圍設置如下:邏輯回歸模型中對正則化強度(C)和懲罰項(L1和L2),以及類別權重進行調優。XGBoost模型的優化則涉及學習率、樹的最大深度、子采樣比例和列采樣比例超參數。隨機森林模型的超參數優化包括決策樹的數量、最大深度、最大特征數。樸素貝葉斯模型則調優了平滑參數。以上數據預處理及模型本身封裝在管道(pipeline)中,最后將訓練好的最佳模型保存為可重用的模型文件,以供后續分析使用。在驗證集中,通過C統計量(即AUC)、靈敏度(sensitivity)、特異性(specificity)、準確度(accuracy)、精確度(precision)、ROC曲線與決策曲線分析評估每個模型的預測性能。ROC曲線可以提供一個初步的模型性能評估,AUC值越接近1,模型的分類性能越好。決策曲線分析通過在指定的閾值概率范圍內展示模型的凈收益,幫助評估模型在不同臨床情境下的適用性和效用,并具有直接的臨床解釋意義。
1.5 統計學分析
使用Python語言進行統計學分析。符合正態分布的計量資料以均數±標準差(x±s)表示。計算各模型預測性能指標的95%置信區間(confidence interval,CI)。采用DeLong檢驗比較在同一病理分類下參考模型與其他機器學習方法的C統計量的差異。雙側檢驗水準α=0.05。
1.6 倫理審查
本研究已獲得南通大學附屬醫院倫理委員會的批準(2022-L165),所有患者均簽署知情同意書。
2 結果
2.1 納入患者的基線特征
共納入272例患者,其中171例IA、36例MIA、31例AIS和34例BT。總體上,隨著病變侵襲性的增加,患者的平均年齡也有所增加。在性別分布方面,3組患者中女性比例高于男性。SHOX2與RASSF1A的甲基化水平隨著腫瘤惡性程度的增加而降低;見表1。

2.2 模型的診斷效能分析及比較
邏輯回歸模型對肺腺癌病理類型無區分能力,XGBoost模型與隨機森林模型對3種病理類型均表現出更強的區分能力,樸素貝葉斯模型的表現略優于邏輯回歸模型,其對IA的區分能力優于MIA和BT/AIS;見表2。表3顯示了各模型構建所使用的超參數類型及其對應的值。ROC曲線見附件圖1。


2.3 決策曲線分析
通過決策曲線分析評估隨機森林模型在多分類任務中不同病理類型患者的凈收益。在BT/AIS類別中,無論是XGBoost還是隨機森林模型,在較廣泛的閾值概率范圍內均表現出較高的凈收益,尤其是在<20%閾值概率時,模型表現更為優異,顯示出良好的區分能力和臨床適用性。在MIA類別中,XGBoost模型在14%閾值概率以下表現出顯著的凈收益,而隨機森林模型則在低閾值范圍內展現出穩定的區分能力,盡管在較高閾值時凈收益有所下降。這表明在預測MIA病理類型時,兩種模型均能提供一定的臨床幫助,但在較高閾值范圍內需要進一步優化。在IA類別中,XGBoost和隨機森林模型均展現出較高的凈收益,尤其是在較高閾值概率(>54%)時,兩種模型的表現均優于假設所有患者均為IA的基線策略。然而,XGBoost在>70%的閾值概率,凈收益略低于全部患者被分類為IA的基線策略,而隨機森林模型的表現則在>45%的閾值概率仍表現出較高的預測能力。總體來看,隨機森林模型在各病理類型中的表現稍優于XGBoost模型,特別是在IA類別中展現出更高的凈收益。在臨床應用中,這兩種機器學習方法能夠在不同閾值下減少誤診和漏診,從而優化患者的治療方案。XGBoost和隨機森林模型的決策曲線圖見附件圖2。
3 討論
不同病理類型的肺腺癌在生物學行為、預后和治療響應上存在顯著差異。IA通常需要更積極的治療措施,MIA可能需要手術或聯合放化療切除,AIS則只需手術切除,良性腫瘤無需治療或在必要時進行手術切除。IA往往預后較差,需要密切監測和長期管理;而MIA或AIS通常預后較好,治療后復發的風險較低。通過準確的病理分型可以避免對低風險患者過度治療,減少患者的治療負擔以及不必要的手術風險和并發癥。因此,對早期肺腺癌進行病理類型診斷具有重要的臨床意義。
LDCT的廣泛應用顯著促進了肺腺癌的早期發現。盡管LDCT具有高靈敏度,能夠識別大量較小的早期病變,但早期病變的形態多樣性和復雜性也增加了區分良性和惡性病變的難度。近年來,DNA甲基化改變作為癌癥早期預后指標的潛力日益受到關注。SHOX2 的表達在大多數癌癥類型中顯著升高。通過對肺癌和正常組織中 SHOX2 甲基化的比較分析,觀察到 96% 的腫瘤組織表現出甲基化水平升高[15]。此外,SHOX2 高表達或低甲基化表明分化較差且預后不良[8]。RASSF1A 的啟動子區在 63% 的非小細胞肺癌細胞中表現出高甲基化,而在正常上皮細胞中不受影響[16]。此外,RASSF1A 甲基化水平可以預測接受培美曲塞化療的非小細胞肺癌患者的病情進展[17]。在肺癌早期診斷中,SHOX2和RASSF1A基因的甲基化聯合檢測已被證明具有較高的敏感性和特異性[10-11]。研究[18]表明,SHOX2和RASSF1A甲基化水平與早期肺腺癌中Ki-67的表達呈正相關。Ki-67是癌細胞增殖的標志物,較高的Ki-67值意味著腫瘤生長和發展加速,最終導致患者預后較差[19-20]。因此,SHOX2和RASSF1A甲基化陽性可能暗示患者的腫瘤將更快進展。此外,有研究[21]報道,RASSF1A與肺癌高侵襲性之間存在顯著相關性。RASSF1A基因的抑制能夠促進肺癌細胞的侵襲和遷移。因此,腫瘤的侵襲性與SHOX2和RASSF1A甲基化陽性率呈正相關,即侵襲性越高,陽性率越高。我們采用SHOX2和RASSF1A基因的甲基化水平作為標志物,通過分析手術組織樣本,優化了這些標志物的臨界值。SHOX2和RASSF1A聯合檢測的AUC值在區分IA和BT時為0.814,在區分癌癥組(IA和MIA)和非癌癥組(AIS和BT)時為0.770,均超過0.75的閾值,進一步確認了其在早期肺腺癌診斷中的應用價值[12]。然而,傳統的分類方法無法直接區分所有類型的肺腺癌,這限制了其臨床應用前景。
本研究的目的在于展示機器學習模型在肺腺癌病理類型診斷中的顯著優勢。通過整合SHOX2和RASSF1A的甲基化數據,我們開發并優化了多種機器學習模型,能夠直接預測肺腺癌的3種病理類型。相比于線性機器學習算法如邏輯回歸和樸素貝葉斯,非線性機器學習算法如隨機森林和XGBoost在肺腺癌病理分型的預測中展現出更高的特異性和陽性似然比。邏輯回歸和樸素貝葉斯算法具有簡單且容易理解的特點,其輸出可以解釋為事件發生的概率,這種解釋性在許多實際應用中非常有用[22-23]。然而,預測變量與目標變量之間的線性關系在臨床實際中可能不成立,導致線性模型可能無法準確建模。非線性模型(如XGBoost、隨機森林)能夠處理預測變量之間的高階非線性交互作用,這是傳統建模方法(如邏輯回歸模型)難以實現的[24-25]。隨機森林模型在預測肺部腫瘤的病理分型方面達到了更高的特異性和陽性似然比,從而減少了不必要的侵入性活檢,可能會減少誤診率和過度治療的風險。此外,在決策曲線分析中,機器學習方法在考慮假陰性(未檢測到實際存在的腺癌)和假陽性(誤診為腺癌的良性病變)影響的情況下表現出了更高的凈收益。
盡管與傳統方法相比,機器學習方法的預測能力更優,但其預測能力仍然存在一定的局限性。可能的原因包括RASSF1A和SHOX2甲基化水平與肺腺癌病理分型之間的關系可能受其他尚未被納入模型的重要生物標志物的影響。這些未納入的標志物可能與肺腺癌的發生和進展密切相關,但由于當前模型輸入變量的限制,這些標志物未能被充分捕捉和利用,導致模型預測能力的潛在局限性。此外,甲基化水平的測量可能存在一定的變異性,這種生物測量誤差可能進一步影響模型的準確性。再者,盡管機器學習方法能夠處理復雜的數據模式,但其對數據質量和數量的依賴性較強。如果訓練數據集不足或存在噪聲,這可能會限制模型的泛化能力,尤其是在處理新數據時。因此,盡管機器學習方法展示了顯著的預測優勢,但在實際應用中仍需謹慎考慮模型的局限性和改進方向,如整合更多維度的數據或開發更為復雜的模型結構。
在早期肺腺癌病理類型數據分析中,基于RASSF1A和SHOX2甲基化水平的機器學習算法顯著提升了預測肺腺癌病理類型的準確性,相較于傳統的分診方法具有更高的區分能力。機器學習算法增強了臨床醫師在肺部腫瘤病理分型決策中的能力,從而避免對非高風險患者的過度治療,進而實現更精準的臨床護理和資源配置。
利益沖突:無。
作者貢獻:劉益飛負責論文設計、審閱與修改,技術支持;史加海負責論文審閱與修改,資金支持和監督;黃潤棋負責數據收集、整理,論文初稿撰寫;強光亮負責數據整理、分析及可視化,論文討論和修訂。所有作者均已閱讀稿件最終版并同意發表。
本文附件圖1~2見本刊網站電子版(