非小細胞肺癌為全球癌癥發病率與死亡率最高的癌癥之一,精準的預后模型可指導臨床治療方案。隨著計算機技術的不斷升級,深度學習作為人工智能的突破性技術在非小細胞肺癌預后模型應用中顯示出良好性能與巨大潛力。深度學習在非小細胞肺癌生存及復發預測、療效預測、遠處轉移預測、并發癥預測中的應用研究已取得一定進展,并呈現出多組學、多模態聯合的趨勢,但仍有不足之處,未來仍應深入探索,加強模型驗證,解決臨床實際問題。
引用本文: 鐘睿康, 李靖華, 林熙明, 方雪妮, 胡凱文, 周天. 深度學習在非小細胞肺癌預后模型中的應用進展. 中國胸心血管外科臨床雜志, 2024, 31(9): 1345-1350. doi: 10.7507/1007-4848.202312004 復制
版權信息: ?四川大學華西醫院華西期刊社《中國胸心血管外科臨床雜志》版權所有,未經授權不得轉載、改編
肺癌是全球癌癥死亡的首要原因,也是最常見的新發癌癥類型[1],其中非小細胞肺癌(non-small cell lung cancer,NSCLC)占肺癌的80%~85%[2]。準確的預后分析有助于臨床做出正確、適宜的治療決策,提升臨床療效,延長患者的生存時間。目前,TNM分期系統是預后預測與治療決策的通用指南,然而肺癌的高度異質性導致同一階段的不同患者預后也不同[3]。因此,需要構建更精準的NSCLC患者預后模型,以協助臨床醫生制定更為有效且合適的治療方案。
隨著計算機科學與技術的不斷進步,人工智能(artificial intelligence,AI)得到了巨大發展,并在醫學領域展露頭角[4]。而其重要分支深度學習的出現,更是為AI在圖像處理方面的應用帶來了突破性進展,逐漸受到研究者們的青睞,肺癌領域也不例外。雖然深度學習現已在肺癌預后分析中取得了一些成果,但有關深度學習肺癌預后模型的綜述卻相對較少,且多集中于網絡構建、算法設計等計算機視角。本文將從不同的臨床預后角度對深度學習在NSCLC預后模型中的應用研究進展做一簡要綜述。
1 深度學習概述
AI的核心是機器學習,通過應用數學和統計方法來提高計算機的性能,包括有監督或無監督方法。而深度學習是機器學習廣義上的子領域,是一種基于神經網絡的AI技術,使用含有多隱層感知器的仿真模型來模擬人腦,擁有多個非線性模塊。典型的深度學習模型有深度神經網絡(deep neural networks,DNN)、卷積神經網絡(convolutional neural networks,CNN)、循環神經網絡、自編碼器、深度置信網絡等。相較于傳統的機器學習算法如邏輯回歸、隨機森林、決策樹、支持向量機等,基于深度學習的模型具有更少的模型假設限制,以及更高的魯棒性與適應性,能處理大量復雜、異構的數據,從而解決傳統模型無法解決的問題[5-6]。另外,深度學習具有自動提取特征功能,這大大減少了手工提取特征的人力和物力。有文獻[7-8]指出,手工提取的特征不如深度學習提取的特征有效,這使深度學習在處理大樣本醫學資料中的優勢更加明顯。
2 深度學習在非小細胞肺癌預后模型中的應用
近年來,深度學習憑借其強大的信息處理能力,在輔助肺癌精準診療的應用研究中發展迅速,研究熱點主要集中在肺癌診斷、預測基因表型及基因突變、評估預后等。而在評估預后中,研究者們普遍關注生存及復發、治療療效、遠處轉移、并發癥等,本文將從以上幾個角度簡要介紹深度學習在NSCLC預后模型中的應用研究進展以及存在的問題。
2.1 生存及復發預測
近年來,由于新治療策略的普及,肺癌患者的2年相對生存率有所提高[9],但5年相對生存率仍僅約23%[10]。雖然早期發現和治療可以提高肺癌患者的生存率,但據既往研究[11]報道,惡性腫瘤手術切除后的肺癌復發率仍在30%~60%。因此,生存及復發預測依然是癌癥預后模型的主流。
2.1.1 生存預測
總生存期(overall survival,OS)是肺癌尤其晚期肺癌最關注的結局指標。Chen等[12]納入了來自4個分中心的484例NSCLC患者治療前的胸部CT,以2年OS率為截點進行二分類,設計了A_CNN模型,最終模型內部測試準確率為88.8%,外部測試準確率為80.0%,可有效預測NSCLC患者的長、短期生存率。Lin等[13]基于ResNet-18架構從231例NSCLC患者術前CT中提取了
而當生存期延長使得難以將OS作為主要終點時,無進展生存期(progression-free survival,PFS)可作為重要的終點指標,尤其是在靶向治療和免疫治療中。Lu等[15]基于270例ⅢB~Ⅳ期表皮生長因子受體(epidermal growth factor receptor,EGFR)突變NSCLC患者的CT影像組學和臨床特征,提出了用于EGFR-酪氨酸激酶抑制劑(EGFR-tyrosine kinase inhibitor,EGFR-TKI)治療進展風險分層的深度學習生存神經網絡(DeepSurv)模型。結果顯示個性化PFS曲線在良好(PFS>中位數)和較差(PFS<中位數)組間有顯著差異(P<0.003),有助于對腫瘤進展做出準確、個體化預測,改善EGFR突變NSCLC患者EGFR-TKI治療前的個性化管理。Deng等[16]回顧性納入570例接受EGFR-TKI治療以及
2.1.2 復發預測
復發預測主要關注無復發生存期(recurrence-free survival,RFS)與無病生存期(disease-free survival,DFS)。在文獻中,兩者常混淆。Lu等[18]回顧性收集
除影像圖像外,病理圖像能夠捕獲高分辨率的組織學細節,包含眾多腫瘤微觀信息,亦為腫瘤的變化、進展提供了重要見解。目測檢查是目前病理圖像的主要評估方法,但人工閱片具有效率低、易忽視微觀細節、易出現主觀誤差等缺點。而深度學習憑借強大的圖片處理能力與信息承載能力,使我們看到了基于病理組學的深度學習預后模型的潛力。Wang等[21]開發了基于Mask-RCNN架構的深度學習工具,對標準蘇木精和伊紅染色的LUAD病理圖像進行自動分割、識別和分類,提取出48個描述腫瘤微環境(tumor microenvironment,TME)的細胞空間組織特征。研究團隊利用這些特征集中開發了一個預后模型,并在癌癥基因組圖譜(The Cancer Genome Atlas,TCGA)庫中驗證了該模型,其預測的高危組比低危組顯示出明顯更差的OS,圖像衍生的TME特征也與生物通路的基因表達顯著相關。Guo等[22]分析了作為內部隊列的121例NSCLC患者的1 859張腫瘤微陣列上的10個免疫檢查點,以及作為外部隊列的30例NSCLC患者的214張全切片免疫組織化學(immunohistochemistry,IHC)檢測。使用EfficientUnet分割腫瘤細胞和腫瘤浸潤淋巴細胞,使用ResNet從IHC圖像中提取預后特征。通過多變量LASSO-Cox回歸得到IC-Score和Res-Score兩個預測模型。結果顯示,結合IC-Score、Res-Score和臨床特征建立的綜合評分對OS和RFS的預測性能最高,受試者工作特征曲線下面積(area under the receiver operating characteristic curve,AUC)在內部測試隊列中可分別達0.9和0.85。
2.2 療效預測
在治療效果評價中,實體瘤療效評價標準(Response Evaluation Criteria in Solid Tumours,RECIST)[23]仍是目前NSCLC最常用的評判標準,尤其在新型治療方式或新藥的臨床試驗中。Li等[24]納入了289例接受過免疫治療的肺鱗狀細胞癌(鱗癌)患者,通過神經網絡篩選各項臨床變量,分別以疾病控制率(disease control rate,DCR)與客觀緩解率(objective response rate,ORR)為結局指標建立預測模型。結果顯示,DCR模型內部驗證的AUC為
2.3 遠處轉移預測
遠處轉移是肺癌后期主要的特異性事件,肺癌易轉移至肝、腦、骨及腎上腺,而肺癌轉移相關死亡占全部肺癌死亡的90%[26]。預測腫瘤特異性轉移的可能性,并對患者進行危險分層,可對高危肺癌患者進行有針對性的干預。
此前已有學者[27-28]運用傳統機器學習方法通過影像學特征預測NSCLC遠處轉移,但預測能力普遍有限。隨后學者們也嘗試使用深度學習方法改善預測結果,Tau等[29]納入了264例NSCLC患者的PET/CT,并進行了至少6個月的隨訪,采用CNN DenseNet機器學習架構建立二分類模型,預測患者治療前后的M0/M1分類。對于治療前M分類預測,平均準確率達0.82±0.04,但對于治療結束時M分類預測,平均準確率仍較低,僅為0.63±0.05。Xu等[30]采用時間序列模型,納入268例接受根治性放化療的Ⅲ期NSCLC患者治療前和治療后1、3和6個月隨訪時的胸部CT圖像,使用CNN和循環神經網絡的遷移學習開發模型預測患者預后,發現其可較好地預測生存率(AUC=0.74),但遠處轉移預測性能仍較低(AUC=0.657)。深度學習基于影像組學預測遠處轉移的效果平平,可能與影像學拍攝受部位、體位和分辨率限制有關,提供的信息有限,無法完整體現人體整體狀態從而預測全身性轉移。
大量研究[31-33]表明,腫瘤細胞的增殖、侵襲、轉移、免疫逃逸、血管生成等生物學特性受TME的調控與基因表達變化的影響,因此研究者也十分關注基于基因組學的分析。Albaradei等[34]運用卷積變分自編碼器,對19例LUAD患者的RNA測序、microRNA測序和DNA甲基化數據進行特征提取,建立了一種基于3個異構數據層來區分轉移狀態的深度學習模型,準確率達83.83%±0.44%,AUC達0.91。Liu等[35]進一步探索了來自461個LUAD樣本的
2.4 并發癥預測
NSCLC患者治療后出現并發癥的幾率并不一致,如果能早期判斷并發癥的風險及相關因素,可據此對患者進行危險分層,并指導后期干預與護理。癌癥患者比普通人群有更高的心血管疾病(cardiovascular disease,CVD)死亡風險[36]。Chao等[37]開發的深度學習CVD風險預測模型使用來自全國肺癌篩查試驗的
放射性肺炎(radiation pneumonitis,RP)是胸部放療的主要不良反應之一。Liang等[38]采用3D CNN構建基于劑量分布的RP預測模型,將劑量分布作為預測模型的輸入,經驗證預測模型AUC可達0.842,并通過引導梯度加權類激活圖顯示出與≥2級和<2級RP病例呈強相關的區域分別為對側肺低劑量區和同側肺高劑量區。Cui等[39]則基于精算深度學習神經網絡架構聯合PET/CT、細胞因子、miRNA在內的多組學數據建立模型預測NSCLC患者放療后RP風險,結果表明聯合深度學習模型預測性能優于傳統的layman模型(C-index:0.660 vs. 0.613)。
癌性疼痛在肺癌尤其晚期階段十分常見。Bang等[40]使用馬修斯相關系數研究了不同輸入長度和時間分箱的深度學習模型預測肺癌住院患者癌性疼痛加重的性能。最終基于長短期記憶的模型表現最佳,并在120 h的輸入長度和12 h的時間間隔下取得了最佳的性能(AUC=0.808),表明使用深度學習進行超前癌性疼痛管理可以潛在地改善患者的日常生活。
3 總結與展望
總之,深度學習在NSCLC的各類預后模型中應用越來越廣泛,也展現出其在圖像自動分割、特征提取與篩選、多元化數據處理中的優勢。目前,深度學習在NSCLC預后模型中的應用仍以臨床特征及影像組學特征為主,但也逐漸展示出其在基因組學、病理組學上的應用潛力以及與多組學、多模態聯合的趨勢。但目前基于深度學習的NSCLC預后模型還存在一些不足與局限性。
第一,深度學習需要大樣本量的數據支撐,其在民用領域的自然圖片數要求通常以數十萬、甚至百萬計。如最大的公開人臉圖像數據集之一CelebA包含超過20萬人的圖像;2020年谷歌AI發布的開源3D物體數據集Objectron,包含了
第二,深度學習的端到端特性遮蔽了模型中的數據處理過程,缺乏可解釋性,因此被稱為“黑盒”。盡管目前已提出一些方法如反卷積技術[42]、類別激活映射[43]對深度學習提取的特征進行可視化分析,但仍不能完全代表深度學習特征的內涵并對其進行臨床解釋,在基于深度學習的預后模型投入到臨床使用之前,還應考慮法律責任和患者安全的問題。
第三,由于缺乏共識,研究者們通常無法客觀地確定開發的模型架構是否為最佳案例。而由于數據來源不同,種族、性別、年齡、疾病嚴重程度和采集設備參數等情況不同,所得出的算法差異也較大,因此,還需要就指導方法建立國際共識,并開展國際多中心大樣本研究以驗證模型的準確性。
第四,深度學習算法的復雜度意味著較高的硬件設備要求和計算機專業知識要求,這使得深度學習應用于臨床領域研究與實踐具有較高的門檻。因此,一方面需加強計算機人才與專業醫師的溝通交流,進行高質量的醫工合作;一方面應完善神經網絡架構,優化算法,開展多點分布式計算或云計算等方法緩解圖形處理器壓力,減少計算成本,推動深度學習在醫學領域的廣泛應用與技術下沉。
利益沖突:無。
作者貢獻:鐘睿康負責撰寫論文;李靖華、林熙明協助查閱文獻,整理文章大綱;方雪妮協助文章撰寫與格式修訂;周天和胡凱文負責設計、審閱、修改論文。
肺癌是全球癌癥死亡的首要原因,也是最常見的新發癌癥類型[1],其中非小細胞肺癌(non-small cell lung cancer,NSCLC)占肺癌的80%~85%[2]。準確的預后分析有助于臨床做出正確、適宜的治療決策,提升臨床療效,延長患者的生存時間。目前,TNM分期系統是預后預測與治療決策的通用指南,然而肺癌的高度異質性導致同一階段的不同患者預后也不同[3]。因此,需要構建更精準的NSCLC患者預后模型,以協助臨床醫生制定更為有效且合適的治療方案。
隨著計算機科學與技術的不斷進步,人工智能(artificial intelligence,AI)得到了巨大發展,并在醫學領域展露頭角[4]。而其重要分支深度學習的出現,更是為AI在圖像處理方面的應用帶來了突破性進展,逐漸受到研究者們的青睞,肺癌領域也不例外。雖然深度學習現已在肺癌預后分析中取得了一些成果,但有關深度學習肺癌預后模型的綜述卻相對較少,且多集中于網絡構建、算法設計等計算機視角。本文將從不同的臨床預后角度對深度學習在NSCLC預后模型中的應用研究進展做一簡要綜述。
1 深度學習概述
AI的核心是機器學習,通過應用數學和統計方法來提高計算機的性能,包括有監督或無監督方法。而深度學習是機器學習廣義上的子領域,是一種基于神經網絡的AI技術,使用含有多隱層感知器的仿真模型來模擬人腦,擁有多個非線性模塊。典型的深度學習模型有深度神經網絡(deep neural networks,DNN)、卷積神經網絡(convolutional neural networks,CNN)、循環神經網絡、自編碼器、深度置信網絡等。相較于傳統的機器學習算法如邏輯回歸、隨機森林、決策樹、支持向量機等,基于深度學習的模型具有更少的模型假設限制,以及更高的魯棒性與適應性,能處理大量復雜、異構的數據,從而解決傳統模型無法解決的問題[5-6]。另外,深度學習具有自動提取特征功能,這大大減少了手工提取特征的人力和物力。有文獻[7-8]指出,手工提取的特征不如深度學習提取的特征有效,這使深度學習在處理大樣本醫學資料中的優勢更加明顯。
2 深度學習在非小細胞肺癌預后模型中的應用
近年來,深度學習憑借其強大的信息處理能力,在輔助肺癌精準診療的應用研究中發展迅速,研究熱點主要集中在肺癌診斷、預測基因表型及基因突變、評估預后等。而在評估預后中,研究者們普遍關注生存及復發、治療療效、遠處轉移、并發癥等,本文將從以上幾個角度簡要介紹深度學習在NSCLC預后模型中的應用研究進展以及存在的問題。
2.1 生存及復發預測
近年來,由于新治療策略的普及,肺癌患者的2年相對生存率有所提高[9],但5年相對生存率仍僅約23%[10]。雖然早期發現和治療可以提高肺癌患者的生存率,但據既往研究[11]報道,惡性腫瘤手術切除后的肺癌復發率仍在30%~60%。因此,生存及復發預測依然是癌癥預后模型的主流。
2.1.1 生存預測
總生存期(overall survival,OS)是肺癌尤其晚期肺癌最關注的結局指標。Chen等[12]納入了來自4個分中心的484例NSCLC患者治療前的胸部CT,以2年OS率為截點進行二分類,設計了A_CNN模型,最終模型內部測試準確率為88.8%,外部測試準確率為80.0%,可有效預測NSCLC患者的長、短期生存率。Lin等[13]基于ResNet-18架構從231例NSCLC患者術前CT中提取了
而當生存期延長使得難以將OS作為主要終點時,無進展生存期(progression-free survival,PFS)可作為重要的終點指標,尤其是在靶向治療和免疫治療中。Lu等[15]基于270例ⅢB~Ⅳ期表皮生長因子受體(epidermal growth factor receptor,EGFR)突變NSCLC患者的CT影像組學和臨床特征,提出了用于EGFR-酪氨酸激酶抑制劑(EGFR-tyrosine kinase inhibitor,EGFR-TKI)治療進展風險分層的深度學習生存神經網絡(DeepSurv)模型。結果顯示個性化PFS曲線在良好(PFS>中位數)和較差(PFS<中位數)組間有顯著差異(P<0.003),有助于對腫瘤進展做出準確、個體化預測,改善EGFR突變NSCLC患者EGFR-TKI治療前的個性化管理。Deng等[16]回顧性納入570例接受EGFR-TKI治療以及
2.1.2 復發預測
復發預測主要關注無復發生存期(recurrence-free survival,RFS)與無病生存期(disease-free survival,DFS)。在文獻中,兩者常混淆。Lu等[18]回顧性收集
除影像圖像外,病理圖像能夠捕獲高分辨率的組織學細節,包含眾多腫瘤微觀信息,亦為腫瘤的變化、進展提供了重要見解。目測檢查是目前病理圖像的主要評估方法,但人工閱片具有效率低、易忽視微觀細節、易出現主觀誤差等缺點。而深度學習憑借強大的圖片處理能力與信息承載能力,使我們看到了基于病理組學的深度學習預后模型的潛力。Wang等[21]開發了基于Mask-RCNN架構的深度學習工具,對標準蘇木精和伊紅染色的LUAD病理圖像進行自動分割、識別和分類,提取出48個描述腫瘤微環境(tumor microenvironment,TME)的細胞空間組織特征。研究團隊利用這些特征集中開發了一個預后模型,并在癌癥基因組圖譜(The Cancer Genome Atlas,TCGA)庫中驗證了該模型,其預測的高危組比低危組顯示出明顯更差的OS,圖像衍生的TME特征也與生物通路的基因表達顯著相關。Guo等[22]分析了作為內部隊列的121例NSCLC患者的1 859張腫瘤微陣列上的10個免疫檢查點,以及作為外部隊列的30例NSCLC患者的214張全切片免疫組織化學(immunohistochemistry,IHC)檢測。使用EfficientUnet分割腫瘤細胞和腫瘤浸潤淋巴細胞,使用ResNet從IHC圖像中提取預后特征。通過多變量LASSO-Cox回歸得到IC-Score和Res-Score兩個預測模型。結果顯示,結合IC-Score、Res-Score和臨床特征建立的綜合評分對OS和RFS的預測性能最高,受試者工作特征曲線下面積(area under the receiver operating characteristic curve,AUC)在內部測試隊列中可分別達0.9和0.85。
2.2 療效預測
在治療效果評價中,實體瘤療效評價標準(Response Evaluation Criteria in Solid Tumours,RECIST)[23]仍是目前NSCLC最常用的評判標準,尤其在新型治療方式或新藥的臨床試驗中。Li等[24]納入了289例接受過免疫治療的肺鱗狀細胞癌(鱗癌)患者,通過神經網絡篩選各項臨床變量,分別以疾病控制率(disease control rate,DCR)與客觀緩解率(objective response rate,ORR)為結局指標建立預測模型。結果顯示,DCR模型內部驗證的AUC為
2.3 遠處轉移預測
遠處轉移是肺癌后期主要的特異性事件,肺癌易轉移至肝、腦、骨及腎上腺,而肺癌轉移相關死亡占全部肺癌死亡的90%[26]。預測腫瘤特異性轉移的可能性,并對患者進行危險分層,可對高危肺癌患者進行有針對性的干預。
此前已有學者[27-28]運用傳統機器學習方法通過影像學特征預測NSCLC遠處轉移,但預測能力普遍有限。隨后學者們也嘗試使用深度學習方法改善預測結果,Tau等[29]納入了264例NSCLC患者的PET/CT,并進行了至少6個月的隨訪,采用CNN DenseNet機器學習架構建立二分類模型,預測患者治療前后的M0/M1分類。對于治療前M分類預測,平均準確率達0.82±0.04,但對于治療結束時M分類預測,平均準確率仍較低,僅為0.63±0.05。Xu等[30]采用時間序列模型,納入268例接受根治性放化療的Ⅲ期NSCLC患者治療前和治療后1、3和6個月隨訪時的胸部CT圖像,使用CNN和循環神經網絡的遷移學習開發模型預測患者預后,發現其可較好地預測生存率(AUC=0.74),但遠處轉移預測性能仍較低(AUC=0.657)。深度學習基于影像組學預測遠處轉移的效果平平,可能與影像學拍攝受部位、體位和分辨率限制有關,提供的信息有限,無法完整體現人體整體狀態從而預測全身性轉移。
大量研究[31-33]表明,腫瘤細胞的增殖、侵襲、轉移、免疫逃逸、血管生成等生物學特性受TME的調控與基因表達變化的影響,因此研究者也十分關注基于基因組學的分析。Albaradei等[34]運用卷積變分自編碼器,對19例LUAD患者的RNA測序、microRNA測序和DNA甲基化數據進行特征提取,建立了一種基于3個異構數據層來區分轉移狀態的深度學習模型,準確率達83.83%±0.44%,AUC達0.91。Liu等[35]進一步探索了來自461個LUAD樣本的
2.4 并發癥預測
NSCLC患者治療后出現并發癥的幾率并不一致,如果能早期判斷并發癥的風險及相關因素,可據此對患者進行危險分層,并指導后期干預與護理。癌癥患者比普通人群有更高的心血管疾病(cardiovascular disease,CVD)死亡風險[36]。Chao等[37]開發的深度學習CVD風險預測模型使用來自全國肺癌篩查試驗的
放射性肺炎(radiation pneumonitis,RP)是胸部放療的主要不良反應之一。Liang等[38]采用3D CNN構建基于劑量分布的RP預測模型,將劑量分布作為預測模型的輸入,經驗證預測模型AUC可達0.842,并通過引導梯度加權類激活圖顯示出與≥2級和<2級RP病例呈強相關的區域分別為對側肺低劑量區和同側肺高劑量區。Cui等[39]則基于精算深度學習神經網絡架構聯合PET/CT、細胞因子、miRNA在內的多組學數據建立模型預測NSCLC患者放療后RP風險,結果表明聯合深度學習模型預測性能優于傳統的layman模型(C-index:0.660 vs. 0.613)。
癌性疼痛在肺癌尤其晚期階段十分常見。Bang等[40]使用馬修斯相關系數研究了不同輸入長度和時間分箱的深度學習模型預測肺癌住院患者癌性疼痛加重的性能。最終基于長短期記憶的模型表現最佳,并在120 h的輸入長度和12 h的時間間隔下取得了最佳的性能(AUC=0.808),表明使用深度學習進行超前癌性疼痛管理可以潛在地改善患者的日常生活。
3 總結與展望
總之,深度學習在NSCLC的各類預后模型中應用越來越廣泛,也展現出其在圖像自動分割、特征提取與篩選、多元化數據處理中的優勢。目前,深度學習在NSCLC預后模型中的應用仍以臨床特征及影像組學特征為主,但也逐漸展示出其在基因組學、病理組學上的應用潛力以及與多組學、多模態聯合的趨勢。但目前基于深度學習的NSCLC預后模型還存在一些不足與局限性。
第一,深度學習需要大樣本量的數據支撐,其在民用領域的自然圖片數要求通常以數十萬、甚至百萬計。如最大的公開人臉圖像數據集之一CelebA包含超過20萬人的圖像;2020年谷歌AI發布的開源3D物體數據集Objectron,包含了
第二,深度學習的端到端特性遮蔽了模型中的數據處理過程,缺乏可解釋性,因此被稱為“黑盒”。盡管目前已提出一些方法如反卷積技術[42]、類別激活映射[43]對深度學習提取的特征進行可視化分析,但仍不能完全代表深度學習特征的內涵并對其進行臨床解釋,在基于深度學習的預后模型投入到臨床使用之前,還應考慮法律責任和患者安全的問題。
第三,由于缺乏共識,研究者們通常無法客觀地確定開發的模型架構是否為最佳案例。而由于數據來源不同,種族、性別、年齡、疾病嚴重程度和采集設備參數等情況不同,所得出的算法差異也較大,因此,還需要就指導方法建立國際共識,并開展國際多中心大樣本研究以驗證模型的準確性。
第四,深度學習算法的復雜度意味著較高的硬件設備要求和計算機專業知識要求,這使得深度學習應用于臨床領域研究與實踐具有較高的門檻。因此,一方面需加強計算機人才與專業醫師的溝通交流,進行高質量的醫工合作;一方面應完善神經網絡架構,優化算法,開展多點分布式計算或云計算等方法緩解圖形處理器壓力,減少計算成本,推動深度學習在醫學領域的廣泛應用與技術下沉。
利益沖突:無。
作者貢獻:鐘睿康負責撰寫論文;李靖華、林熙明協助查閱文獻,整理文章大綱;方雪妮協助文章撰寫與格式修訂;周天和胡凱文負責設計、審閱、修改論文。