本文基于影像組學預測胰腺囊性腫瘤(PCN)的 Ki67 分子標記物表達情況。首先手動分割患者術前多排螺旋斷層掃描(MDCT)圖像中的腫瘤區域,然后根據腫瘤特點設計并提取 409 個高通量特征,再利用最小化的絕對收縮與選擇算子(LASSO)回歸模型進行多因素分析篩選特征,最后將篩選后的特征輸入支持向量機(SVM)實現分類判別。通過重復 200 次 LASSO 篩選,記錄每次被選擇的特征,并將特征按照被選擇的次數從高到低排序。使用十折交叉驗證的 SVM,測試不同的特征數量下的分類效果,重復 200 次并將結果取平均值以降低誤差。實驗結果表明,被選擇次數最多的前 20 個特征構成最優特征子集,預測的 AUC 達到 91.54%,準確率達到 85.29%,敏感度為 81.88%,特異性為 86.75%。實驗結果證明了通過影像組學方法預測 Ki67 分子標記物的可行性。
引用本文: 魏然, 林侃如, 郭翌, 李驥, 汪源源. 基于影像組學預測胰腺囊性腫瘤 Ki67 分子標記物的可行性研究. 生物醫學工程學雜志, 2019, 36(1): 1-6. doi: 10.7507/1001-5515.201805014 復制
版權信息: ?四川大學華西醫院華西期刊社《生物醫學工程學雜志》版權所有,未經授權不得轉載、改編
引言
胰腺癌是世界上最致命的惡性腫瘤之一,其五年生存率僅為 8%[1]。常見的胰腺腫瘤中有一類為胰腺囊性腫瘤(pancreas cystic neoplasm,PCN), 包括了導管內乳頭狀黏液瘤(intraductal papillary mucinous neoplasm,IPMN)、黏液性囊腺瘤(mucinous cystic neoplasm,MCN)、實性假乳頭狀腫瘤(solid-pseudopapillary neoplasm,SPN)、漿液性囊腺瘤(serous cystic neoplasm,SCN)等不同類型。其中 SCN 在絕大多數情況下為良性,最近的一項研究發現 2 622 例 SCN 患者中惡變的僅有 3 例[2-3]。而 IPMN 和 MCN 這兩種黏液型腫瘤為惡性或潛在惡性,絕大多數情況下需要手術切除治療,其惡性程度的判斷和預后情況的預測對于制定合理的臨床治療方案至關重要[4]。
研究發現,Ki67 分子標記物的表達情況可以為臨床醫生了解腫瘤增殖活性以及判斷其生物學行為的惡性傾向、預測患者預后情況提供重要依據。Ki67 是一種腫瘤細胞增殖標記物,被廣泛應用于腫瘤疾病的研究和臨床診斷之中[5]。Ki67 使用 100 個細胞中的陽性細胞個數來表示,其數值在 0~100 之間。一般認為 Ki67 小于或等于某閾值的即為 Ki67 陰性表達,而高于該閾值的則為 Ki67 陽性表達,陽性表達通常提示腫瘤的增殖活性高、生物學行為惡性傾向高、復發率高以及預后差[6-7]。胰腺腫瘤的術前 Ki67 檢測一般是通過超聲內窺鏡引導下的細針穿刺(endoscopic ultrasonography-guided fine needle aspiration,EUS-FNA)提取組織切片,再通過免疫組織化學方法得到其指標數值。這種方式得到的結果不如術后腫瘤標本的組織切片所得到的結果準確,且對患者身體有一定的損傷。
胰腺腫瘤的常用影像檢查方法包括超聲內窺鏡成像(endoscopic ultrasonography imaging,EUI)、腹部電子計算機斷層掃描(computed tomography,CT)和磁共振成像(magnetic resonance imaging,MRI)等,這些影像數據在臨床診斷和治療決策中能夠提供非常重要的輔助信息。其中腹部多排螺旋斷層掃描(multi-detector CT,MDCT)是 PCN 早期診斷的首選方法,具有較高的時空分辨率和腫瘤識別準確率[8]。
影像組學(radiomics)是一個新興的研究領域,專注于挖掘醫學圖像中肉眼無法發現的潛在信息[9]。在圖像獲取或重建、分割感興趣區域、提取高通量圖像特征等步驟之后,使用機器學習算法建立數據模型,以實現良惡性診斷、生存期預測以及分子標記物預測等,為醫生的診斷提供輔助參考意見。影像組學提供了一種基于醫學影像預測 Ki67 等分子標記物的思路。目前已有的類似研究多集中在乳腺、前列腺、肺癌等器官,在胰腺腫瘤方面未見相關報道[10-13]。
本文使用影像組學的方法,基于腹部 MDCT 圖像預測 Ki67 分子標記物表達情況。從臨床的需求考慮,選取 PCN 中的 IPMN 和 MCN 兩類黏液型腫瘤,為臨床上初步了解腫瘤的增殖活性、判斷其生物學行為的良惡性傾向、預測患者預后和制定治療方案等提供重要參考信息。通過手工勾勒腫瘤區域、設計并提取針對性的圖像特征以及選用合適的特征篩選算法和機器學習分類器,搭建高效、魯棒的影像組學框架,實現分類預測判別。
1 材料與方法
本文使用影像組學方法,研究基于腹部 MDCT 圖像對胰腺 IPMN 和 MCN 這兩類黏液型腫瘤的 Ki67 分子標記物指數實現術前預測。圖 1 為系統框架,包括 MDCT 圖像輸入、手動分割、特征提取、特征篩選和分類判別。
 圖1
				影像組學系統框架
			
												
				Figure1.
				Diagram of radiomics system
						
				圖1
				影像組學系統框架
			
												
				Figure1.
				Diagram of radiomics system
			
								1.1 數據獲取與圖像預處理
本文的數據采集于復旦大學附屬華山醫院胰腺外科,包括了從 2007 年 3 月至 2016 年 9 月接受手術的 87 例患者。其中 IPMN 患者 59 例,MCN 患者 28 例,年齡在 18 到 86 歲之間。詳細的患者信息如表 1 所示。本文的研究經華山醫院倫理委員會通過,全部患者在接受術前 MDCT 檢查和腫瘤切除手術時簽署了知情同意書。
 表1
                IPMN 和 MCN 腫瘤患者的統計信息
		 	
		 			 				Table1.
    			Statistical information of IPMN and MCN patients
			
						表1
                IPMN 和 MCN 腫瘤患者的統計信息
		 	
		 			 				Table1.
    			Statistical information of IPMN and MCN patients
       		
       				所有患者在手術前都進行了腹部 64 排 MDCT 掃描檢查,擁有平掃、動脈期、靜脈期三個階段的掃描圖像。由于靜脈期圖像中腫瘤與背景區域的對比度更好,故本文的實驗中使用了靜脈期圖像來提取圖像特征[14]。對于每位患者的靜脈期掃描圖像,由一名影像科醫生挑選出一幅腫瘤截面最大的圖像作為后續處理的對象,并手工勾勒出腫瘤的邊界。另外一名影像科醫生則一一檢查了這些圖像以保證腫瘤區域分割的準確性。所有手術中切除的腫瘤標本均由經驗豐富的病理科醫生制作石蠟切片,通過免疫組織化學染色和計數獲得其 Ki67 等分子標記物的數值,并做出明確的病理診斷。
1.2 特征提取
影像組學的核心在于定量地設計和提取有針對性的高通量特征。本文根據國際上通用的 PCN 診斷指南,設計影像組學特征對腫瘤圖像特征實現量化評估[15]。此外,還加入了由影像科醫生記錄的腫瘤位置信息(位于胰頭、胰頸、胰體或胰尾)和從圖像存儲與傳輸系統(picture archiving and communication system,PACS)中獲得的患者的年齡、性別等臨床信息。最終,每個患者圖像中提取的高通量特征數為 409 個,包括臨床信息特征、形態特征、紋理特征、小波特征等幾大類,不同類別的特征及其含義或典型特征如表 2 所示,完整的特征信息見網絡版附錄(www.biomedeng.cn/article/10.7507/1001-5515.201805014)。
 表2
                高通量特征目錄
		 	
		 			 				Table2.
    			Catalogue of high-throughput features
			
						表2
                高通量特征目錄
		 	
		 			 				Table2.
    			Catalogue of high-throughput features
       		
       				除了影像組學常用的紋理和小波特征外,我們在形態特征部分自動設計并提取腫瘤內部囊數量、內部囊平均面積、腫瘤形狀(橢圓/分葉)、囊壁厚度、鈣化區域、中央瘢痕等 PCN 專用特征。首先,給定腫瘤區域輪廓,計算腫瘤面積周長比、腫瘤與凸包的面積比、矩差等參數衡量其形狀;其次,通過自適應閾值分割算法,得到囊壁、鈣化區域、中央瘢痕的信息并且計算囊壁厚度、鈣化區域位置/方差/數量、中央瘢痕面積等各類評價參數特征;然后,腫瘤內部囊相關特征的提取則先去除鈣化點干擾,使用 Canny 算子提取內部邊緣信息,再使用形態學運算填充囊的區域,最后通過計算各點到邊緣的距離確定各囊的中心點,從而提取囊的數量、平均面積、面積的方差等定量特征。在已有的胰腺囊性腫瘤相關研究中,這些特征都是依靠影像科醫生人工辨認和記錄,且只能定性地記錄有無。與之相比,本文的自動定量提取方法更加高效可靠[16-18]。
1.3 特征篩選
影像組學的思想是通過大量特征來深度挖掘圖像信息,因此提取得到的特征向量維度往往很高,甚至遠高于樣本數量。在這種情況下,機器學習算法的訓練時間會大大延長,且容易發生過擬合現象,分類效果通常不理想。特征篩選正是一種尋找特征最佳子集的方法,可以降低特征的維度,提高分類識別的準確率。
特征篩選有基于單變量分析和多變量組合分析等不同的方法。單變量分析的特征篩選方法指對每一個特征計算其與目標值之間的某類指標來衡量相關性,再對指標數值設定某一閾值,篩選出高相關性的特征。這類方法中常見的有相關系數法、卡方檢驗法、互信息法等。該方法原理簡單且易于實現,但無法分析多個特征變量組合后的效果。
多變量組合分析的特征篩選方法著重分析不同特征變量組合與目標值之間的關系,較為常見的是使用帶懲罰項的回歸模型。本文使用了最小絕對收縮選擇算子(the least absolute shrinkage selection operator,LASSO)回歸模型來選擇效果最優的特征組合。LASSO 回歸又稱為 L1 正則化模型,其損失函數可以表示為:
|  | 
其中X為特征矩陣,y為目標值,w為系數向量, 為懲罰系數。與線性回歸相比,LASSO 回歸模型在損失函數中添加了額外的懲罰項,從而使較弱特征所對應的系數收縮到零[19]。此外,LASSO 回歸還可以將幾個高度相關的特征僅保留一個,其他的收縮為零,從而最終選擇出最優的特征子集。
為懲罰系數。與線性回歸相比,LASSO 回歸模型在損失函數中添加了額外的懲罰項,從而使較弱特征所對應的系數收縮到零[19]。此外,LASSO 回歸還可以將幾個高度相關的特征僅保留一個,其他的收縮為零,從而最終選擇出最優的特征子集。
1.4 分類判別
在特征選擇之后需要對 Ki67 的表達情況做分類判別預測。分類問題是機器學習中最常見的問題之一,常用的有樸素貝葉斯、Logistic 回歸、隨機森林、支持向量機(support vector machine,SVM)等算法。本文使用 SVM 分類器來得到分類預測結果。
SVM 是機器學習領域中最受歡迎的有監督學習算法之一,具有收斂速度快、準確率高的優點,在處理二分類問題時有非常好的效果。其核心思想是通過核函數將數據映射到高維空間,使其線性可分;再尋找一個將兩類數據點分開的最優超平面,而支持向量就是到該超平面距離最小的數據點。這樣在計算過程中就可以忽略支持向量以外的樣本點,僅根據為數不多的支持向量就可以求出分類超平面,計算復雜度大為降低。
1.5 Bootstrap 抽樣與重復
本文通過 Bootstrap 抽樣與重復的方法提高特征篩選的效果,降低分類判別的誤差和偶然性。Bootstrap 是現代統計學中常用的估計方法,對于小樣本數據效果很好。從原 87 例樣本的數據集中,隨機抽取一定數量(本文選取樣本總數 90%)的樣本構建樣本集,使用 LASSO 回歸篩選特征,記錄下被選擇的特征。重復隨機抽樣和特征篩選步驟 200 次,以被選擇次數的多少衡量特征的重要程度,將全部特征根據被選擇的次數從多到少排序。
在分類判別實驗中,我們使用基于 Bootstrap 抽樣的十折交叉驗證法。將 87 例樣本隨機抽樣并分成數量接近的 10 個部分。每次使用其中的 9 個部分作為訓練集來訓練 SVM 模型,并用剩下的 1 個部分作為測試集來評估模型的性能,循環 10 次直到每個部分的數據都被測試過。隨機抽樣和十折交叉驗證分類的過程同樣也重復了 200 次。
本文還將特征篩選與分類判別的過程相結合。對于排序之后的全部特征,依次選取前 k 個最重要的特征(k=1, 2, 3,  )作為特征子集,計算其分類判別實驗的效果,并比較使用不同數量特征時的結果好壞,從而選取最優的特征子集。
)作為特征子集,計算其分類判別實驗的效果,并比較使用不同數量特征時的結果好壞,從而選取最優的特征子集。
以上方法均使用 Mathworks 公司 Matlab 軟件(R2015b)實現。
2 實驗與結果
2.1 實驗設計
本文對 87 例胰腺 IPMN 和 MCN 患者數據進行分析研究。數據庫中完整地收集了每位患者的性別、年齡、腹部 MDCT 檢查圖像、手術切除腫瘤后病理科醫生作出的類型診斷以及免疫組織化學得到的 Ki67 分子標記物數值。本文將 Ki67 分子標記物預測問題轉變為分類問題,預測判斷其陽性或陰性表達情況。學界內對于 Ki67 陽性閾值的選取未有統一意見,本文使用了 2 和 5 這兩個較常用的閾值分別進行實驗,探討通過影像組學方法預測 Ki67 表達情況的可行性[6-7]。
實驗按照本文之前所陳述的方法,首先手動分割 MDCT 圖像中的腫瘤區域,然后從圖像中提取 409 個高通量特征,最終通過重復循環特征篩選和分類判別。為客觀地評價特征子集的分類性能,本文計算了多種量化指標。繪制分類器的受試者操作特性(receiver operating characteristic,ROC)曲線,并計算其曲線下面積(area under the ROC curve,AUC)來評價分類性能。此外,還計算了準確度(accuracy,ACC)、靈敏度(sensitivity,SENS)和特異度(specificity,SPEC)來評估模型的分類性能。這些值都選取 200 次重復計算的平均值,還計算了 AUC 指標的 95% 置信區間(confidence interval,CI)。
2.2 結果分析與討論
首先對 87 例患者腹部 MDCT 圖像完成了腫瘤區域的手動分割。作為示例,圖 2 為兩例分割后的圖像,分別來自一位 55 歲的男性 IPMN 患者和一位 82 歲的女性 MCN 患者。
 圖2
				兩例手動分割腫瘤區域后的 MDCT 圖像
			
												
				Figure2.
				Two MDCT images with manually segmented tumor   region
						
				圖2
				兩例手動分割腫瘤區域后的 MDCT 圖像
			
												
				Figure2.
				Two MDCT images with manually segmented tumor   region
			
								接著,將分割后的腫瘤區域圖像和患者的信息輸入特征提取程序,得到了 87 例患者各自的 409 個高通量特征。使用 LASSO 回歸重復進行 200 次特征選擇之后,將這些特征按照被選擇的次數從多到少排序,并且依次選取前 k 個特征(k=1, 2, 3,  )作為特征子集輸入分類器。根據分類的各項評價指標隨特征個數 k 的變化情況,來選取最合適的特征個數 k。圖 3 所示為當 Ki67 的劃分閾值為 2 時的實驗結果。
)作為特征子集輸入分類器。根據分類的各項評價指標隨特征個數 k 的變化情況,來選取最合適的特征個數 k。圖 3 所示為當 Ki67 的劃分閾值為 2 時的實驗結果。
 圖3
				Ki67 閾值為 2 時各項指標隨使用特征數的變化情況
			
												
				Figure3.
				Changes of metrics with the increase of feature number when the threshold is 2
						
				圖3
				Ki67 閾值為 2 時各項指標隨使用特征數的變化情況
			
												
				Figure3.
				Changes of metrics with the increase of feature number when the threshold is 2
			
								由圖中可以看出選取出現頻次最高的前 20 個特征時,獲得了最優的分類效果。此時的 AUC 達到 0.915 4(95%CI,0.913 6~0.917 2),準確率為 0.852 9,敏感度為 0.818 8,特異性為 0.867 5。這些指標表明,本文的分類預測模型可以準確有效地預測 Ki67 處于較低或較高的表達水平。而當特征數由 20 個繼續增加時,各項指標均有下降,說明無關特征和冗余特征帶來了維數災難,導致分類預測效果變差。
為論證本文方法的有效性,我們將結果對比了 Li 等[17]關于胰腺囊性腫瘤計算機輔助診斷的研究。在他們的研究中,共收集了 43 例胰腺囊性腫瘤患者的數據,并且由醫生人工錄入了性別、年齡、腫瘤位置、是否有鈣化、是否有結節以及輪廓形狀等定性特征,并通過 SVM 分類器進行分類判別,最終獲得了 88.37% 的準確率。盡管本文針對的問題與他們的研究有一定差異,但是對特征提取環節進行比較,我們的特征均為自動提取的定量化特征,且多出了紋理和小波特征,提取特征更加高效便捷,研究所包含的患者數量也更大,并且準確率也能達到 85.29%。這充分說明了本文方法自動提取和篩選特征的有效性,以及判別預測 Ki67 分子標記物表達情況的可行性。
此外,我們還比較了 Ki67 的不同閾值劃分所得到的最優實驗結果,各項評價指標的數值如表 3 所示。可以發現在不同閾值劃分下,分類預測結果都比較理想,但有一定差異。兩次實驗的結果中,AUC 均在 0.84 以上,準確率均在 0.77 以上,敏感度均在 0.78 以上,特異性均在 0.77 以上。當劃分閾值為 2 時,達到最佳性能所選取的特征數更少,各指標顯示的性能更好。我們也分析了兩個實驗中所選出的最優特征子集的情況。Ki67 閾值為 2 時,最優特征子集的 20 個特征主要包含 18 個紋理特征和小波紋理特征,以及患者性別和腫瘤位置特征;Ki67 閾值為 5 時,最優特征子集的 26 個特征主要包含 23 個紋理特征和小波紋理特征,以及 3 個形態特征(徑向距離極值點數、圓形度、腫瘤位置)。紋理和小波特征都是通過各類灰度矩陣計算,提取人類肉眼無法捕捉的圖像深度信息,在兩個子集中這些特征所起作用基本相似,但是效果略有差異。而患者性別、徑向距離極值點數、圓形度這三個特征在兩次實驗中都僅出現了一次,說明目前的特征篩選效果還有待改進,隨機性較大,受數據分布的影響較大。
 表3
                不同 Ki67 閾值劃分下的最優實驗結果
		 	
		 			 				Table3.
    			Optimal experiment results in different Ki67 threshold
			
						表3
                不同 Ki67 閾值劃分下的最優實驗結果
		 	
		 			 				Table3.
    			Optimal experiment results in different Ki67 threshold
       		
       				我們還回顧并比較了本文所研究的 87 例患者的術前臨床診斷與病理診斷金標準的符合情況。結果顯示術前正確診斷其腫瘤類型(IPMN/MCN)的準確率為 40.23%(35/87);如果將評判標準放寬到正確診斷其良惡性類型,忽略大概率惡性的 IPMN、MCN、導管腺癌之間的差別,則準確率也僅有 55.17%(48/87)。因此,本文使用影像組學方法在術前預測 IPMN 和 MCN 的 Ki67 表達情況并輔助診斷腫瘤良惡性傾向具有較大的臨床意義,并初步論證了其可行性。對于何種閾值在臨床實際中劃分陰性和陽性表達更有效,學術界尚未達成統一意見,我們也將根據臨床醫學的最新學術成果繼續深入研究,努力將成果用于臨床實踐中。
本文也存在兩方面不足需要在日后的研究中進一步完善。第一,目前圖像中的腫瘤區域均為手工劃定,未來可以設計自動分割腫瘤區域的算法,從而實現全部分析流程的自動化。第二,目前本研究中的 87 例患者數據均來自華山醫院胰腺外科,數據量不足導致特征篩選和分類判別過程中存在一定的偶然性,少數特例患者對整體的結果有較大的干擾。下一步可以收集其他醫院的數據,建立多中心數據庫,從而進一步提升研究的準確率和可靠性。
3 結論
本文論證了基于影像組學思路預測 Ki67 分子標記物表達情況的可行性。在 MDCT 術前影像中,首先手動分割腫瘤區域,然后自動提取 409 個高通量特征,使用 LASSO 回歸實現特征篩選,最終通過 SVM 分類器完成分類預測。通過 200 次重復實驗降低誤差并減少過擬合,最優的結果選擇了 20 個最具統計意義的特征,預測的 AUC 達到 91.54%,準確率達到 85.29%。該結果表明通過影像組學方法挖掘 MDCT 圖像信息并預測 Ki67 分子標記物的可行性,對于用影像組學的方法開展相關腫瘤疾病可重復的術前預測研究有較強的指導意義。
 
			
					 			引言
胰腺癌是世界上最致命的惡性腫瘤之一,其五年生存率僅為 8%[1]。常見的胰腺腫瘤中有一類為胰腺囊性腫瘤(pancreas cystic neoplasm,PCN), 包括了導管內乳頭狀黏液瘤(intraductal papillary mucinous neoplasm,IPMN)、黏液性囊腺瘤(mucinous cystic neoplasm,MCN)、實性假乳頭狀腫瘤(solid-pseudopapillary neoplasm,SPN)、漿液性囊腺瘤(serous cystic neoplasm,SCN)等不同類型。其中 SCN 在絕大多數情況下為良性,最近的一項研究發現 2 622 例 SCN 患者中惡變的僅有 3 例[2-3]。而 IPMN 和 MCN 這兩種黏液型腫瘤為惡性或潛在惡性,絕大多數情況下需要手術切除治療,其惡性程度的判斷和預后情況的預測對于制定合理的臨床治療方案至關重要[4]。
研究發現,Ki67 分子標記物的表達情況可以為臨床醫生了解腫瘤增殖活性以及判斷其生物學行為的惡性傾向、預測患者預后情況提供重要依據。Ki67 是一種腫瘤細胞增殖標記物,被廣泛應用于腫瘤疾病的研究和臨床診斷之中[5]。Ki67 使用 100 個細胞中的陽性細胞個數來表示,其數值在 0~100 之間。一般認為 Ki67 小于或等于某閾值的即為 Ki67 陰性表達,而高于該閾值的則為 Ki67 陽性表達,陽性表達通常提示腫瘤的增殖活性高、生物學行為惡性傾向高、復發率高以及預后差[6-7]。胰腺腫瘤的術前 Ki67 檢測一般是通過超聲內窺鏡引導下的細針穿刺(endoscopic ultrasonography-guided fine needle aspiration,EUS-FNA)提取組織切片,再通過免疫組織化學方法得到其指標數值。這種方式得到的結果不如術后腫瘤標本的組織切片所得到的結果準確,且對患者身體有一定的損傷。
胰腺腫瘤的常用影像檢查方法包括超聲內窺鏡成像(endoscopic ultrasonography imaging,EUI)、腹部電子計算機斷層掃描(computed tomography,CT)和磁共振成像(magnetic resonance imaging,MRI)等,這些影像數據在臨床診斷和治療決策中能夠提供非常重要的輔助信息。其中腹部多排螺旋斷層掃描(multi-detector CT,MDCT)是 PCN 早期診斷的首選方法,具有較高的時空分辨率和腫瘤識別準確率[8]。
影像組學(radiomics)是一個新興的研究領域,專注于挖掘醫學圖像中肉眼無法發現的潛在信息[9]。在圖像獲取或重建、分割感興趣區域、提取高通量圖像特征等步驟之后,使用機器學習算法建立數據模型,以實現良惡性診斷、生存期預測以及分子標記物預測等,為醫生的診斷提供輔助參考意見。影像組學提供了一種基于醫學影像預測 Ki67 等分子標記物的思路。目前已有的類似研究多集中在乳腺、前列腺、肺癌等器官,在胰腺腫瘤方面未見相關報道[10-13]。
本文使用影像組學的方法,基于腹部 MDCT 圖像預測 Ki67 分子標記物表達情況。從臨床的需求考慮,選取 PCN 中的 IPMN 和 MCN 兩類黏液型腫瘤,為臨床上初步了解腫瘤的增殖活性、判斷其生物學行為的良惡性傾向、預測患者預后和制定治療方案等提供重要參考信息。通過手工勾勒腫瘤區域、設計并提取針對性的圖像特征以及選用合適的特征篩選算法和機器學習分類器,搭建高效、魯棒的影像組學框架,實現分類預測判別。
1 材料與方法
本文使用影像組學方法,研究基于腹部 MDCT 圖像對胰腺 IPMN 和 MCN 這兩類黏液型腫瘤的 Ki67 分子標記物指數實現術前預測。圖 1 為系統框架,包括 MDCT 圖像輸入、手動分割、特征提取、特征篩選和分類判別。
 圖1
				影像組學系統框架
			
												
				Figure1.
				Diagram of radiomics system
						
				圖1
				影像組學系統框架
			
												
				Figure1.
				Diagram of radiomics system
			
								1.1 數據獲取與圖像預處理
本文的數據采集于復旦大學附屬華山醫院胰腺外科,包括了從 2007 年 3 月至 2016 年 9 月接受手術的 87 例患者。其中 IPMN 患者 59 例,MCN 患者 28 例,年齡在 18 到 86 歲之間。詳細的患者信息如表 1 所示。本文的研究經華山醫院倫理委員會通過,全部患者在接受術前 MDCT 檢查和腫瘤切除手術時簽署了知情同意書。
 表1
                IPMN 和 MCN 腫瘤患者的統計信息
		 	
		 			 				Table1.
    			Statistical information of IPMN and MCN patients
			
						表1
                IPMN 和 MCN 腫瘤患者的統計信息
		 	
		 			 				Table1.
    			Statistical information of IPMN and MCN patients
       		
       				所有患者在手術前都進行了腹部 64 排 MDCT 掃描檢查,擁有平掃、動脈期、靜脈期三個階段的掃描圖像。由于靜脈期圖像中腫瘤與背景區域的對比度更好,故本文的實驗中使用了靜脈期圖像來提取圖像特征[14]。對于每位患者的靜脈期掃描圖像,由一名影像科醫生挑選出一幅腫瘤截面最大的圖像作為后續處理的對象,并手工勾勒出腫瘤的邊界。另外一名影像科醫生則一一檢查了這些圖像以保證腫瘤區域分割的準確性。所有手術中切除的腫瘤標本均由經驗豐富的病理科醫生制作石蠟切片,通過免疫組織化學染色和計數獲得其 Ki67 等分子標記物的數值,并做出明確的病理診斷。
1.2 特征提取
影像組學的核心在于定量地設計和提取有針對性的高通量特征。本文根據國際上通用的 PCN 診斷指南,設計影像組學特征對腫瘤圖像特征實現量化評估[15]。此外,還加入了由影像科醫生記錄的腫瘤位置信息(位于胰頭、胰頸、胰體或胰尾)和從圖像存儲與傳輸系統(picture archiving and communication system,PACS)中獲得的患者的年齡、性別等臨床信息。最終,每個患者圖像中提取的高通量特征數為 409 個,包括臨床信息特征、形態特征、紋理特征、小波特征等幾大類,不同類別的特征及其含義或典型特征如表 2 所示,完整的特征信息見網絡版附錄(www.biomedeng.cn/article/10.7507/1001-5515.201805014)。
 表2
                高通量特征目錄
		 	
		 			 				Table2.
    			Catalogue of high-throughput features
			
						表2
                高通量特征目錄
		 	
		 			 				Table2.
    			Catalogue of high-throughput features
       		
       				除了影像組學常用的紋理和小波特征外,我們在形態特征部分自動設計并提取腫瘤內部囊數量、內部囊平均面積、腫瘤形狀(橢圓/分葉)、囊壁厚度、鈣化區域、中央瘢痕等 PCN 專用特征。首先,給定腫瘤區域輪廓,計算腫瘤面積周長比、腫瘤與凸包的面積比、矩差等參數衡量其形狀;其次,通過自適應閾值分割算法,得到囊壁、鈣化區域、中央瘢痕的信息并且計算囊壁厚度、鈣化區域位置/方差/數量、中央瘢痕面積等各類評價參數特征;然后,腫瘤內部囊相關特征的提取則先去除鈣化點干擾,使用 Canny 算子提取內部邊緣信息,再使用形態學運算填充囊的區域,最后通過計算各點到邊緣的距離確定各囊的中心點,從而提取囊的數量、平均面積、面積的方差等定量特征。在已有的胰腺囊性腫瘤相關研究中,這些特征都是依靠影像科醫生人工辨認和記錄,且只能定性地記錄有無。與之相比,本文的自動定量提取方法更加高效可靠[16-18]。
1.3 特征篩選
影像組學的思想是通過大量特征來深度挖掘圖像信息,因此提取得到的特征向量維度往往很高,甚至遠高于樣本數量。在這種情況下,機器學習算法的訓練時間會大大延長,且容易發生過擬合現象,分類效果通常不理想。特征篩選正是一種尋找特征最佳子集的方法,可以降低特征的維度,提高分類識別的準確率。
特征篩選有基于單變量分析和多變量組合分析等不同的方法。單變量分析的特征篩選方法指對每一個特征計算其與目標值之間的某類指標來衡量相關性,再對指標數值設定某一閾值,篩選出高相關性的特征。這類方法中常見的有相關系數法、卡方檢驗法、互信息法等。該方法原理簡單且易于實現,但無法分析多個特征變量組合后的效果。
多變量組合分析的特征篩選方法著重分析不同特征變量組合與目標值之間的關系,較為常見的是使用帶懲罰項的回歸模型。本文使用了最小絕對收縮選擇算子(the least absolute shrinkage selection operator,LASSO)回歸模型來選擇效果最優的特征組合。LASSO 回歸又稱為 L1 正則化模型,其損失函數可以表示為:
|  | 
其中X為特征矩陣,y為目標值,w為系數向量, 為懲罰系數。與線性回歸相比,LASSO 回歸模型在損失函數中添加了額外的懲罰項,從而使較弱特征所對應的系數收縮到零[19]。此外,LASSO 回歸還可以將幾個高度相關的特征僅保留一個,其他的收縮為零,從而最終選擇出最優的特征子集。
為懲罰系數。與線性回歸相比,LASSO 回歸模型在損失函數中添加了額外的懲罰項,從而使較弱特征所對應的系數收縮到零[19]。此外,LASSO 回歸還可以將幾個高度相關的特征僅保留一個,其他的收縮為零,從而最終選擇出最優的特征子集。
1.4 分類判別
在特征選擇之后需要對 Ki67 的表達情況做分類判別預測。分類問題是機器學習中最常見的問題之一,常用的有樸素貝葉斯、Logistic 回歸、隨機森林、支持向量機(support vector machine,SVM)等算法。本文使用 SVM 分類器來得到分類預測結果。
SVM 是機器學習領域中最受歡迎的有監督學習算法之一,具有收斂速度快、準確率高的優點,在處理二分類問題時有非常好的效果。其核心思想是通過核函數將數據映射到高維空間,使其線性可分;再尋找一個將兩類數據點分開的最優超平面,而支持向量就是到該超平面距離最小的數據點。這樣在計算過程中就可以忽略支持向量以外的樣本點,僅根據為數不多的支持向量就可以求出分類超平面,計算復雜度大為降低。
1.5 Bootstrap 抽樣與重復
本文通過 Bootstrap 抽樣與重復的方法提高特征篩選的效果,降低分類判別的誤差和偶然性。Bootstrap 是現代統計學中常用的估計方法,對于小樣本數據效果很好。從原 87 例樣本的數據集中,隨機抽取一定數量(本文選取樣本總數 90%)的樣本構建樣本集,使用 LASSO 回歸篩選特征,記錄下被選擇的特征。重復隨機抽樣和特征篩選步驟 200 次,以被選擇次數的多少衡量特征的重要程度,將全部特征根據被選擇的次數從多到少排序。
在分類判別實驗中,我們使用基于 Bootstrap 抽樣的十折交叉驗證法。將 87 例樣本隨機抽樣并分成數量接近的 10 個部分。每次使用其中的 9 個部分作為訓練集來訓練 SVM 模型,并用剩下的 1 個部分作為測試集來評估模型的性能,循環 10 次直到每個部分的數據都被測試過。隨機抽樣和十折交叉驗證分類的過程同樣也重復了 200 次。
本文還將特征篩選與分類判別的過程相結合。對于排序之后的全部特征,依次選取前 k 個最重要的特征(k=1, 2, 3,  )作為特征子集,計算其分類判別實驗的效果,并比較使用不同數量特征時的結果好壞,從而選取最優的特征子集。
)作為特征子集,計算其分類判別實驗的效果,并比較使用不同數量特征時的結果好壞,從而選取最優的特征子集。
以上方法均使用 Mathworks 公司 Matlab 軟件(R2015b)實現。
2 實驗與結果
2.1 實驗設計
本文對 87 例胰腺 IPMN 和 MCN 患者數據進行分析研究。數據庫中完整地收集了每位患者的性別、年齡、腹部 MDCT 檢查圖像、手術切除腫瘤后病理科醫生作出的類型診斷以及免疫組織化學得到的 Ki67 分子標記物數值。本文將 Ki67 分子標記物預測問題轉變為分類問題,預測判斷其陽性或陰性表達情況。學界內對于 Ki67 陽性閾值的選取未有統一意見,本文使用了 2 和 5 這兩個較常用的閾值分別進行實驗,探討通過影像組學方法預測 Ki67 表達情況的可行性[6-7]。
實驗按照本文之前所陳述的方法,首先手動分割 MDCT 圖像中的腫瘤區域,然后從圖像中提取 409 個高通量特征,最終通過重復循環特征篩選和分類判別。為客觀地評價特征子集的分類性能,本文計算了多種量化指標。繪制分類器的受試者操作特性(receiver operating characteristic,ROC)曲線,并計算其曲線下面積(area under the ROC curve,AUC)來評價分類性能。此外,還計算了準確度(accuracy,ACC)、靈敏度(sensitivity,SENS)和特異度(specificity,SPEC)來評估模型的分類性能。這些值都選取 200 次重復計算的平均值,還計算了 AUC 指標的 95% 置信區間(confidence interval,CI)。
2.2 結果分析與討論
首先對 87 例患者腹部 MDCT 圖像完成了腫瘤區域的手動分割。作為示例,圖 2 為兩例分割后的圖像,分別來自一位 55 歲的男性 IPMN 患者和一位 82 歲的女性 MCN 患者。
 圖2
				兩例手動分割腫瘤區域后的 MDCT 圖像
			
												
				Figure2.
				Two MDCT images with manually segmented tumor   region
						
				圖2
				兩例手動分割腫瘤區域后的 MDCT 圖像
			
												
				Figure2.
				Two MDCT images with manually segmented tumor   region
			
								接著,將分割后的腫瘤區域圖像和患者的信息輸入特征提取程序,得到了 87 例患者各自的 409 個高通量特征。使用 LASSO 回歸重復進行 200 次特征選擇之后,將這些特征按照被選擇的次數從多到少排序,并且依次選取前 k 個特征(k=1, 2, 3,  )作為特征子集輸入分類器。根據分類的各項評價指標隨特征個數 k 的變化情況,來選取最合適的特征個數 k。圖 3 所示為當 Ki67 的劃分閾值為 2 時的實驗結果。
)作為特征子集輸入分類器。根據分類的各項評價指標隨特征個數 k 的變化情況,來選取最合適的特征個數 k。圖 3 所示為當 Ki67 的劃分閾值為 2 時的實驗結果。
 圖3
				Ki67 閾值為 2 時各項指標隨使用特征數的變化情況
			
												
				Figure3.
				Changes of metrics with the increase of feature number when the threshold is 2
						
				圖3
				Ki67 閾值為 2 時各項指標隨使用特征數的變化情況
			
												
				Figure3.
				Changes of metrics with the increase of feature number when the threshold is 2
			
								由圖中可以看出選取出現頻次最高的前 20 個特征時,獲得了最優的分類效果。此時的 AUC 達到 0.915 4(95%CI,0.913 6~0.917 2),準確率為 0.852 9,敏感度為 0.818 8,特異性為 0.867 5。這些指標表明,本文的分類預測模型可以準確有效地預測 Ki67 處于較低或較高的表達水平。而當特征數由 20 個繼續增加時,各項指標均有下降,說明無關特征和冗余特征帶來了維數災難,導致分類預測效果變差。
為論證本文方法的有效性,我們將結果對比了 Li 等[17]關于胰腺囊性腫瘤計算機輔助診斷的研究。在他們的研究中,共收集了 43 例胰腺囊性腫瘤患者的數據,并且由醫生人工錄入了性別、年齡、腫瘤位置、是否有鈣化、是否有結節以及輪廓形狀等定性特征,并通過 SVM 分類器進行分類判別,最終獲得了 88.37% 的準確率。盡管本文針對的問題與他們的研究有一定差異,但是對特征提取環節進行比較,我們的特征均為自動提取的定量化特征,且多出了紋理和小波特征,提取特征更加高效便捷,研究所包含的患者數量也更大,并且準確率也能達到 85.29%。這充分說明了本文方法自動提取和篩選特征的有效性,以及判別預測 Ki67 分子標記物表達情況的可行性。
此外,我們還比較了 Ki67 的不同閾值劃分所得到的最優實驗結果,各項評價指標的數值如表 3 所示。可以發現在不同閾值劃分下,分類預測結果都比較理想,但有一定差異。兩次實驗的結果中,AUC 均在 0.84 以上,準確率均在 0.77 以上,敏感度均在 0.78 以上,特異性均在 0.77 以上。當劃分閾值為 2 時,達到最佳性能所選取的特征數更少,各指標顯示的性能更好。我們也分析了兩個實驗中所選出的最優特征子集的情況。Ki67 閾值為 2 時,最優特征子集的 20 個特征主要包含 18 個紋理特征和小波紋理特征,以及患者性別和腫瘤位置特征;Ki67 閾值為 5 時,最優特征子集的 26 個特征主要包含 23 個紋理特征和小波紋理特征,以及 3 個形態特征(徑向距離極值點數、圓形度、腫瘤位置)。紋理和小波特征都是通過各類灰度矩陣計算,提取人類肉眼無法捕捉的圖像深度信息,在兩個子集中這些特征所起作用基本相似,但是效果略有差異。而患者性別、徑向距離極值點數、圓形度這三個特征在兩次實驗中都僅出現了一次,說明目前的特征篩選效果還有待改進,隨機性較大,受數據分布的影響較大。
 表3
                不同 Ki67 閾值劃分下的最優實驗結果
		 	
		 			 				Table3.
    			Optimal experiment results in different Ki67 threshold
			
						表3
                不同 Ki67 閾值劃分下的最優實驗結果
		 	
		 			 				Table3.
    			Optimal experiment results in different Ki67 threshold
       		
       				我們還回顧并比較了本文所研究的 87 例患者的術前臨床診斷與病理診斷金標準的符合情況。結果顯示術前正確診斷其腫瘤類型(IPMN/MCN)的準確率為 40.23%(35/87);如果將評判標準放寬到正確診斷其良惡性類型,忽略大概率惡性的 IPMN、MCN、導管腺癌之間的差別,則準確率也僅有 55.17%(48/87)。因此,本文使用影像組學方法在術前預測 IPMN 和 MCN 的 Ki67 表達情況并輔助診斷腫瘤良惡性傾向具有較大的臨床意義,并初步論證了其可行性。對于何種閾值在臨床實際中劃分陰性和陽性表達更有效,學術界尚未達成統一意見,我們也將根據臨床醫學的最新學術成果繼續深入研究,努力將成果用于臨床實踐中。
本文也存在兩方面不足需要在日后的研究中進一步完善。第一,目前圖像中的腫瘤區域均為手工劃定,未來可以設計自動分割腫瘤區域的算法,從而實現全部分析流程的自動化。第二,目前本研究中的 87 例患者數據均來自華山醫院胰腺外科,數據量不足導致特征篩選和分類判別過程中存在一定的偶然性,少數特例患者對整體的結果有較大的干擾。下一步可以收集其他醫院的數據,建立多中心數據庫,從而進一步提升研究的準確率和可靠性。
3 結論
本文論證了基于影像組學思路預測 Ki67 分子標記物表達情況的可行性。在 MDCT 術前影像中,首先手動分割腫瘤區域,然后自動提取 409 個高通量特征,使用 LASSO 回歸實現特征篩選,最終通過 SVM 分類器完成分類預測。通過 200 次重復實驗降低誤差并減少過擬合,最優的結果選擇了 20 個最具統計意義的特征,預測的 AUC 達到 91.54%,準確率達到 85.29%。該結果表明通過影像組學方法挖掘 MDCT 圖像信息并預測 Ki67 分子標記物的可行性,對于用影像組學的方法開展相關腫瘤疾病可重復的術前預測研究有較強的指導意義。
 
			
					 			 
        

 
                 
				 
																   	
                                                                    
                                                                    
																	 
                                                                    
                                                                        
                                                                        
                                                                         
																   	
                                                                    
                                                                    
																	