注意缺陷多動障礙(ADHD)是一種高發于學齡兒童的行為障礙綜合癥。目前,ADHD 的診斷主要依賴主觀方法,導致漏診率和誤診率較高。基于此,本文提出一種基于卷積神經網絡的 ADHD 客觀分類算法。首先,對腦部磁共振圖像(MRI)進行頭骨剝離、高斯核平滑等預處理;其次,對大腦的右側尾狀核、左側楔前葉和左側額上回部位的MRI進行粗分割;最后,利用 3 層卷積神經網絡進行分類。實驗結果表明:① 本文的算法能有效地對 ADHD 和正常人群進行分類;② 右側尾狀核和左側楔前葉的 ADHD 分類準確率要高于 ADHD-200 全球競賽中所有方法達到的 ADHD 最高分類準確率(62.52%);③ 利用上述 3 個腦區對 ADHD 患者和正常人群進行分類,其中右側尾狀核的分類準確率最高。綜上所述,本文提出了一種利用粗分割和深度學習對 ADHD 患者和正常人群進行分類的方法。本文方法分類準確率高,計算量小,能較好地提取不明顯的圖像特征,改善了傳統 MRI 腦區精確分割耗時長及復雜度高的缺點,為 ADHD 的診斷提供了一種可參照的客觀方法。
引用本文: 朱莉, 張麗英, 韓云濤, 曾佺, 常為科. 基于卷積神經網絡的注意缺陷多動障礙分類研究. 生物醫學工程學雜志, 2017, 34(1): 99-105. doi: 10.7507/1001-5515.201606058 復制
版權信息: ?四川大學華西醫院華西期刊社《生物醫學工程學雜志》版權所有,未經授權不得轉載、改編
引言
注意缺陷多動障礙(attention deficit/hyperactivity disorder,ADHD)是一組帶有情緒與行為的綜合癥群體,其特征主要表現為注意力不集中、過度興奮、做事沖動、行為不可控等,也是兒童期較常見的一種心理障礙 [1]。ADHD 會對患兒產生嚴重影響,比如出現學習障礙、成績不好、與人關系緊張以及道德與行為問題等。國內有報告其發病率大約占學齡兒童的 1.5%~12%,國外報告為 3%~10%[2]。年齡和性別不同,ADHD 的發病率也不相同。男性的發病率要高于女性,比例為 4∶1~9∶1[3]。Cohen 等[4] 發現,兒童期男生患 ADHD 的概率為 17%,女生則為 8%;而青少年期男生患 ADHD 的概率為 11%,女生則為 6%。ADHD 發病通常是始于兒童期,有些家長認為,隨著孩子年齡的增長, ADHD 的癥狀自然會慢慢消失。但最近有研究指出,ADHD 如果得不到及時有效地正確診斷和合理治療,其仍可能持續到青春期或成年期,并將影響個人生活的各個方面,甚至有可能導致違法犯罪行為,從而影響患者終生。我國有研究報道,有 58% 的成人持續存在 ADHD[5]。然而,目前 ADHD 的診斷主要依賴于問卷等主觀形式。臨床診斷主要依據美國精神病學學會制定的精神障礙診斷與統計手冊第 4 版(the diagnostic and statistical manual of mental disorders,DSM-IV)診斷標準 [6],該標準將 ADHD 分為:注意缺陷主導型(ADHD inattentive subtype,ADHD-I)、多動沖動主導型(ADHD hyperactive-impulsive subtype,ADHD-H)和混合型(ADHD combined hyperactive-impul-sive and inattentive subtype,ADHD-C)三種亞型,這三種類型在行為認知損傷方面的表現及其神經機制上都存在著明顯差異。
雖然已有大量研究者對 ADHD 展開研究而且取得了較多的科研成果,但是,目前 ADHD 研究仍存在以下問題:① 缺乏客觀的診斷量化指標。現有 ADHD 研究的診斷標準尚不完善, ADHD 與其他常見的精神障礙類疾病一樣,缺少特異的病理學或病因學研究。現有的診斷主要是通過 DSM-IV、問卷和量表的形式 [7],一般由父母或老師通過觀察兒童的行為來判斷,以上行為都存在主觀性,易造成誤診,所以需要找到可以輔助診斷的客觀體征 [1]。 ② 缺少對 ADHD 臨床腦部磁共振圖像(magnetic resonance images,MRI)的自動診斷研究。 ③ 現有的 ADHD 自動診斷方法分類準確率低,亞型分類精度不高。例如,在 ADHD-200 全球競賽中,利用一維的個人特征數據(年齡,性別,智力等)和邏輯回歸分類器對 ADHD 患者和正常人群進行分類,取得的競賽結果中最高分類準確率只有 62.52% [8],且該方法容易出現欠擬合。因此,如果有準確、量化的 ADHD 的神經影像指標,可以幫助醫生更客觀、更準確地做出診斷。
現有的 MRI 已經包含可用于建立判別模型的很多信息。已有研究表明,腦部 MRI 可以呈現部分 ADHD 患者腦部解剖結構存在的特異性 [9]。例如,ADHD 患兒與正常兒童之間大腦皮層的結構和體積存在很大差異。ADHD 患兒總皮質體積較正常兒童下降超過 7%~8%,兩側皮層表面積減少超過 7%[10]。皮層厚度和折疊指數也存在解剖異常,尤其是在后腦區和前腦區域 [11]。因此, ADHD 患者的腦部 MRI 應該是 ADHD 診斷分類的理想數據形式。但是,由于 ADHD 患者腦部 MRI 的特異性并不明顯,臨床上醫師通常是通過重復看片來確診,非常耗時耗力;同時,有些圖像由于存在偽影,會干擾醫生對病癥的客觀判斷。因此,通過 MRI 診斷 ADHD 雖然能提供客觀指標,但是人工判讀診斷的誤診率和漏診率較高。
本課題組在前期的研究中觀察 ADHD 患兒腦電位發現,可用 P2-N2 峰峰值(P2 成分是 200 ms 左右出現的一個正向腦電波,N2 成分是 P2 成分后的第一個負向腦電波)、頻譜在 11 Hz 左右峰值作為評價 ADHD 患兒認知功能的客觀診斷指標 [12]。然而,課題組前期研究中是采用的一維腦電信號[12],不能準確定位具體的腦區病變,不利于進一步分析 ADHD 患兒的神經機制。
本文在文獻 [12] 的基礎上進一步研究 ADHD 患者的二維腦部結構病變及其自動診斷,提出了基于粗分割和卷積神經網絡(convolutional neural networks,CNNs)的 ADHD 患者腦部 MRI 分類方法。首先,將 MRI 進行預處理,再對大腦的右側尾狀核、左側楔前葉和左側額上回部位的 MRI 進行粗分割,最后提出 3 層深度學習的 CNNs,實現了 ADHD 患者和正常人群的分類。研究結果表明,本文方法分類準確率高、計算量小,能較好地提取不明顯的圖像特征,改善了傳統 MRI 腦區精確分割耗時長及復雜度高的缺點,可為今后開展針對 ADHD 客觀、高效的臨床診斷研究奠定新的思路。
1 實驗數據
本文研究所用 MRI 數據來自 ADHD-200 全球競賽數據集(http://fcon_1000.projects.nitrc.org/ indi/adhd200/)中的北京大學(Peking University,Peking_1和Peking_2)子數據集。本文研究采用了數據集中的結構磁共振圖像(structural magnetic resonance images,SMRI)。MRI 數據經過了三維(3D)解剖掃描,采用了 3.0 T 的 MRI 掃描機(GE Signa,General Electric Healthcare,Milwaukee,WI),掃描范圍為顱底至顱頂。北京大學的子數據集共有 152 個中國人的 MRI 樣本,包括 59 名 ADHD 患者和 93 名正常人。本文從 59 名 ADHD 患者中篩選出了 55 名年齡(11.5±2.8)歲,范圍為 9~14 歲的 ADHD 患者,并從 93 名正常人中篩選出了 55 名年齡為(11.5±2.5)歲,范圍為 9~14 歲的正常兒童。篩選出的 110 名兒童中 88 名用于訓練,22 名用于測試,訓練組中 ADHD 患者和正常兒童數量均為 44,測試組中 ADHD 患者和正常兒童數量均為 11。兩組受試者均排除精神發育遲滯、廣泛性發育障礙、品行障礙、情緒問題、精神病史和物質濫用等情況。均為右利手,均無因頭部外傷引起意識喪失的歷史,經中國兒童修訂版全面韋氏智力量表(full-scale Wechsler intelligence scale for Chinese children-revised,WISCC-R)測試,分數值 ≥80[13]。
2 方法
本文運用 CNNs 算法對前述 ADHD 患者和正常對照組進行分類。該研究方法的整個算法流程圖如圖 1 所示。將 MRI 數據分為訓練集和測試集,兩個數據集的 MRI 均經過圖像預處理和圖像粗分割,作為 CNNs 的輸入。訓練集數據用于訓練 CNNs 網絡,以獲取最優的模型,測試集數據用于測試模型的匹配分類性能。
 圖1
				本文算法流程圖
			
												
				Figure1.
				Flow diagram of algorithm
						
				圖1
				本文算法流程圖
			
												
				Figure1.
				Flow diagram of algorithm
			
								2.1 數據預處理
本文研究的 MRI 數據采用功能性神經影像分析軟件(analysis of functional neuroimaging,AFNI)和功能性磁共振成像軟件庫(functional magnetic resonance images software library,FSL)進行了數據預處理,AFNI 和 FSL 軟件均為針對 MRI 腦部成像的綜合性分析工具。數據預處理包括頭骨剝離,灰質、白質、腦脊液分割,歸一化(1 mm×1 mm×1 mm)和高斯核平滑等。
頭骨剝離:頭骨剝離是將腦部組織從非腦組織中分離出來,去除非腦部組織,確保腦白質、灰質和腦脊液的精確分割。頭骨剝離是腦組織分割中的一個關鍵步驟。本文的數據經過了 AFNI 軟件的三維頭骨剝離,步驟包括:① 體積預處理。消除整個空間圖像的非均勻性,重新定位大腦;② 反復擴大一個球形表面直到它可以包圍整個大腦。使用腦部提取工具(brain extraction tool,BET)刪除整個頭部圖像的非腦組織,消除內外顱骨表面和外頭皮表面。③ 創建大腦模型的表面以及頭骨部分。
灰質、白質、腦脊液分割:本文將大腦的三維圖像分割為灰質、白質、腦脊液,同時還校正了空間強度的變化。基本的方法是基于馬爾可夫隨機場模型和相關聯的最大期望算法,該方法的抗噪性能優于大多數有限混合基于模型的方法。整個過程可以產生一個偏磁場校正輸入圖像和基于概率的部分體積組織分割。
歸一化:將頭骨剝離后的解剖圖像匹配同一個 1 mm×1 mm×1 mm 分辨率的模板空間。
高斯核平滑:用 6 mm 的半高全寬(full width at half maximum,FWHM)高斯濾波器模糊歸一化圖像。
預處理后結果如圖 2 所示。
 圖2
				數據預處理結果圖
			
												
				Figure2.
				Results of data preprocessing
						
				圖2
				數據預處理結果圖
			
												
				Figure2.
				Results of data preprocessing
			
								2.2 MRI 粗分割
據文獻[14-15]介紹,ADHD 患者在左側楔前葉、左側額上回,右側尾狀核處大腦皮質灰質濃度要低于正常人,故本研究通過區域選擇大腦中右側尾狀核、左側楔前葉、左側額上回并粗略分割作為特征區域。以右側尾狀核為例,大腦右側尾狀核定位圖如 圖 3 所示。
 圖3
				正常受試者和 ADHD 受試者右側尾狀核定位圖
			
												
				Figure3.
				MRI location map of right caudate nuclear in ADHD and normal subjects
						
				圖3
				正常受試者和 ADHD 受試者右側尾狀核定位圖
			
												
				Figure3.
				MRI location map of right caudate nuclear in ADHD and normal subjects
			
								已有的基于 MRI 的病類分類的算法均需要對腦區進行圖像分割,分割的結果直接影響分類的準確率和后續的計算量。本文采取粗分割的方式,避免了由于對圖像過度精確分割而帶來的工作量大、耗時較長的繁瑣計算。研究選用大腦矢狀面的特征區域,擴大粗分割區域,以確保右側尾狀核、左側楔前葉、左側額上回分別在各自的待檢測區域內,用以代替精確分割這些特征區域。本文設定的粗分割區域均為固定像素方形區域,像素大小均為 79×79,分割后的灰度圖像數據進行歸一化處理。右側尾狀核、左側楔前葉和左側額上回 3 個腦區的粗分割結果如 圖 4 所示。
 圖4
				ADHD 受試者粗分割矢狀面特征腦區圖
			
												
				Figure4.
				Feature region image of coarse segmentation brain sagittal in ADHD subjects
						
				圖4
				ADHD 受試者粗分割矢狀面特征腦區圖
			
												
				Figure4.
				Feature region image of coarse segmentation brain sagittal in ADHD subjects
			
								2.3 基于 CNNs 的 ADHD 的 MRI 分類
本文采用深度學習方法分析 ADHD 患者的 MRI 圖像,深度學習法能夠更好地提取圖像特征,尤其在特征不明顯的圖像中更能體現其優勢 [16]。在本研究中,采用的是 CNNs 來對圖像進行特征提取和分類。CNNs 由卷積層和采樣層交替構成。本文提出了 3 層 CNNs 結構,基于 CNNs 的 ADHD 分類的整體網絡結構(以右側尾狀核區域為例)如 圖 5 所示,包含 3 個卷積層,2 個采樣層和 1 個全連接層。其中,卷積層用于提取圖像特征,采樣層用于降低圖像相關性并減少運算量,全連接層為分類識別步驟。
 圖5
				基于 CNNs 的 ADHD 分類的整體網絡結構
			
												
				Figure5.
				Network architecture of ADHD classification based on CNNs
						
				圖5
				基于 CNNs 的 ADHD 分類的整體網絡結構
			
												
				Figure5.
				Network architecture of ADHD classification based on CNNs
			
								輸入層:輸入經上述粗略分割的矢狀面右側尾狀核(左側楔前葉、左側額上回)圖像,由 79×79 的像素點組成。
卷積層 C1:在卷積層中進行的是二維卷積運算,卷積的過程實際上就是特征提取的過程。輸入的圖像與卷積核進行卷積,并將運算結果通過激活函數輸出得到卷積層的 66×66 的特征圖。卷積層的輸出可按如下公式計算:
| $ C{1_i} = \left( {\rm {sigm} \rm {oid}\left( {{{{w}}_i} \otimes {{x}}} \right)} \right)\;\;\;\;i = 1:N $ | 
其中 x 為輸入的圖像; 代表卷積;N 為卷積核大小;C1 的卷積核大小為 14×14,核數為 2;wi代表對應于 i 的權值,即卷積核里的每一個數值,wi隨機初始化再用反向傳播(back propagation,BP)梯度算法訓練得到最優化;C1i代表卷積層 1 的輸出特征圖;本研究所用激活函數為概率分布函數 (sigmoid),即 。
采樣層 S2:采樣層進行采樣處理,采樣的過程就是降維,減少了數據量。采樣通常有均值采樣和最大值采樣兩種,本文用的是均值采樣(meanPool),即對特征圖像的全部采樣值求均值。采樣層輸出的特征圖 S2i 是卷積層 C1 輸出的特征圖C1i作為采樣層的輸入經均值采樣的結果。本文采樣步長均為 2,故采樣層的輸出特征圖為輸入特征圖大小的一半。采樣層公式如下:
| $ S{2_i} = {\mathop{\rm meanPool}\nolimits} (C{1_i}) $ | 
卷積層 C3、C5 與卷積層 C1 計算過程一樣,但卷積核的大小以及卷積核的數目各層是不同的;其中,C3 的卷積核大小為 22×22,核數為 3;C5 的卷積核大小為 2×2,核數為 1。采樣層 S4 與采樣層 S2 計算過程一樣,采樣步長也相同。整個網絡上一層的輸出均是下一層的輸入。
全連接層 F6:全連接層是個一維線性排布的網絡節點,與前一層是全連接的網絡,將前一層的最后結果編碼成一維向量。
輸出層 F7:輸出層與前一層是全連接的,它的結點個數與分類數目有關。本文我們要對 MRI 分成 2 類,因此輸出層有 2 個結點。
3 結果及分析
本文選擇右側尾狀核,左側楔前葉,左側額上回 3 個腦區進行研究,探求 ADHD 患者在哪個腦區與正常人存在差異,并探索 CNNs 對 ADHD 分類問題的具體應用。本文算法對 3 個腦區的測試結果如 圖 6 所示,右側尾狀核 22 個測試樣本分類結果中,17 個樣本測試值與真實值相等,有 5 個樣本測試值與真實值不相等;右側尾狀核 ADHD 分類準確率為 77.27%。左側楔前葉 15 個樣本測試值與真實值相等,左側楔前葉 ADHD 分類準確率為 68.18%。左側額上回 13 個樣本測試值與真實值相等,左側額上回 ADHD 分類準確率為 59.09%。
 圖6
				三個特征腦區 CNNs 分類測試結果
			
												
				Figure6.
				Test results of 3 feature brain regions by CNNs.
						
				圖6
				三個特征腦區 CNNs 分類測試結果
			
												
				Figure6.
				Test results of 3 feature brain regions by CNNs.
			
								3 個特征腦區分類結果的各項指標如 表 1 所示。由表可知,右側尾狀核特征腦區分類準確率 77.27%,相比其他特征腦區準確率是最高的;靈敏度 81.82%,相比其他腦區也是最高的。然而特異性左側額上回是最高的,結果為 90.91%;假陽性率左側額上回相比其他腦區是最低的。假陰性率右側尾狀核相比其他腦區是最低的。綜合看來,利用右側尾狀核特征腦區對 ADHD 的分類準確率最高,效果較明顯。
 表1
                特征腦區分類結果比較
		 	
		 			 				Table1.
    			Comparison of the classification results for feature region
			
						表1
                特征腦區分類結果比較
		 	
		 			 				Table1.
    			Comparison of the classification results for feature region
       		
       				目前,在 ADHD-200 全球競賽結果中,所有方法達到的該競賽中最高分類準確率為 62.52% [8]。基于以上研究結果顯示,本文方法可有效地應用于基于 MRI 的 ADHD 診斷;利用右側尾狀核和左側楔前葉進行分類,本文方法取得的結果明顯高于 ADHD-200 競賽的最高分類準確率;與此同時,本文方法利用右側尾狀核診斷的分類準確率最高,可見在該特征區域處 ADHD 患者與正常人有較明顯的差異。目前,MRI 腦部圖像分割主要有基于聚類的算法、基于形變模型的分割方法、圖割算法、形態學分水嶺算法以及基于圖譜的分割方法等,這些方法包含手動操作時間和算法運算時間,耗時均較長,且受制于軟硬件環境 [17],本文所采用的 MRI 數據粗分割屬于固定分割,所有圖像均截取固定區域,速度快,幾乎無計算量損耗。此外,雖然 ADHD-200 競賽中的個人特征數據算法取得了最高分類準確率,但是該方法無法直觀反映病變機制,而本文采用 MRI 圖像,其信息更能反映腦部因神經機制而引起的病變,從而對醫學診斷有基礎性的研究價值。本文采用了深度學習和圖像粗分割的方法分析 ADHD 患者和正常人群的 MRI,深度學習法能夠更好地提取圖像特征,尤其在特征不明顯的圖像中更能體現其優勢;采取粗分割 MRI 的方式,避免了由于對圖像過度精確分割而帶來的工作量大、耗時較長的繁瑣計算。本文方法中 CNNs 只需要 3 層卷積,通常 CNNs 需要很高的層數才能達到較好的分類效果,可見,本文方法減少了計算量,提高了計算效率。
4 討論
本文提出了一種利用 MRI 圖像診斷 ADHD 的新算法,將深度學習的 CNNs 結合預處理和腦區粗分割,能有效地將 ADHD 患者和正常兒童分類,從而實現 ADHD 臨床腦部 MRI 自動分類與診斷。應用本文方法對 3 個腦區進行分析,獲得了較高的分類準確率;其中,利用右側尾狀核區域和左側楔前葉進行分類,準確率高于 ADHD-200 競賽的最高準確率。新算法的分類結果表明,ADHD 患者較正常兒童大腦皮質灰質濃度低,在右側尾狀核、左側楔前葉和左側額上回存在差異,其中在右側尾狀核腦區處的分類最高準確率可達 77.27%,高于 ADHD-200 全球競賽中所達到的 ADHD 最高分類準確率 62.52%[8]。
綜上所述,本文方法具有分類準確率高、訓練速度快、計算耗時小等優點,為 ADHD 的診斷提供了一種可參照的客觀方法。由于本文所采用的 CNNs 與輸入樣本相關,而且不同的年齡和性別的人群其聽覺和視覺注意力的神經機制差異較 大[18-19],因此,下一階段的研究需要將受試對象繼續擴大,在不同的年齡段以及不同的性別組進行進一步的研究[20]。
引言
注意缺陷多動障礙(attention deficit/hyperactivity disorder,ADHD)是一組帶有情緒與行為的綜合癥群體,其特征主要表現為注意力不集中、過度興奮、做事沖動、行為不可控等,也是兒童期較常見的一種心理障礙 [1]。ADHD 會對患兒產生嚴重影響,比如出現學習障礙、成績不好、與人關系緊張以及道德與行為問題等。國內有報告其發病率大約占學齡兒童的 1.5%~12%,國外報告為 3%~10%[2]。年齡和性別不同,ADHD 的發病率也不相同。男性的發病率要高于女性,比例為 4∶1~9∶1[3]。Cohen 等[4] 發現,兒童期男生患 ADHD 的概率為 17%,女生則為 8%;而青少年期男生患 ADHD 的概率為 11%,女生則為 6%。ADHD 發病通常是始于兒童期,有些家長認為,隨著孩子年齡的增長, ADHD 的癥狀自然會慢慢消失。但最近有研究指出,ADHD 如果得不到及時有效地正確診斷和合理治療,其仍可能持續到青春期或成年期,并將影響個人生活的各個方面,甚至有可能導致違法犯罪行為,從而影響患者終生。我國有研究報道,有 58% 的成人持續存在 ADHD[5]。然而,目前 ADHD 的診斷主要依賴于問卷等主觀形式。臨床診斷主要依據美國精神病學學會制定的精神障礙診斷與統計手冊第 4 版(the diagnostic and statistical manual of mental disorders,DSM-IV)診斷標準 [6],該標準將 ADHD 分為:注意缺陷主導型(ADHD inattentive subtype,ADHD-I)、多動沖動主導型(ADHD hyperactive-impulsive subtype,ADHD-H)和混合型(ADHD combined hyperactive-impul-sive and inattentive subtype,ADHD-C)三種亞型,這三種類型在行為認知損傷方面的表現及其神經機制上都存在著明顯差異。
雖然已有大量研究者對 ADHD 展開研究而且取得了較多的科研成果,但是,目前 ADHD 研究仍存在以下問題:① 缺乏客觀的診斷量化指標。現有 ADHD 研究的診斷標準尚不完善, ADHD 與其他常見的精神障礙類疾病一樣,缺少特異的病理學或病因學研究。現有的診斷主要是通過 DSM-IV、問卷和量表的形式 [7],一般由父母或老師通過觀察兒童的行為來判斷,以上行為都存在主觀性,易造成誤診,所以需要找到可以輔助診斷的客觀體征 [1]。 ② 缺少對 ADHD 臨床腦部磁共振圖像(magnetic resonance images,MRI)的自動診斷研究。 ③ 現有的 ADHD 自動診斷方法分類準確率低,亞型分類精度不高。例如,在 ADHD-200 全球競賽中,利用一維的個人特征數據(年齡,性別,智力等)和邏輯回歸分類器對 ADHD 患者和正常人群進行分類,取得的競賽結果中最高分類準確率只有 62.52% [8],且該方法容易出現欠擬合。因此,如果有準確、量化的 ADHD 的神經影像指標,可以幫助醫生更客觀、更準確地做出診斷。
現有的 MRI 已經包含可用于建立判別模型的很多信息。已有研究表明,腦部 MRI 可以呈現部分 ADHD 患者腦部解剖結構存在的特異性 [9]。例如,ADHD 患兒與正常兒童之間大腦皮層的結構和體積存在很大差異。ADHD 患兒總皮質體積較正常兒童下降超過 7%~8%,兩側皮層表面積減少超過 7%[10]。皮層厚度和折疊指數也存在解剖異常,尤其是在后腦區和前腦區域 [11]。因此, ADHD 患者的腦部 MRI 應該是 ADHD 診斷分類的理想數據形式。但是,由于 ADHD 患者腦部 MRI 的特異性并不明顯,臨床上醫師通常是通過重復看片來確診,非常耗時耗力;同時,有些圖像由于存在偽影,會干擾醫生對病癥的客觀判斷。因此,通過 MRI 診斷 ADHD 雖然能提供客觀指標,但是人工判讀診斷的誤診率和漏診率較高。
本課題組在前期的研究中觀察 ADHD 患兒腦電位發現,可用 P2-N2 峰峰值(P2 成分是 200 ms 左右出現的一個正向腦電波,N2 成分是 P2 成分后的第一個負向腦電波)、頻譜在 11 Hz 左右峰值作為評價 ADHD 患兒認知功能的客觀診斷指標 [12]。然而,課題組前期研究中是采用的一維腦電信號[12],不能準確定位具體的腦區病變,不利于進一步分析 ADHD 患兒的神經機制。
本文在文獻 [12] 的基礎上進一步研究 ADHD 患者的二維腦部結構病變及其自動診斷,提出了基于粗分割和卷積神經網絡(convolutional neural networks,CNNs)的 ADHD 患者腦部 MRI 分類方法。首先,將 MRI 進行預處理,再對大腦的右側尾狀核、左側楔前葉和左側額上回部位的 MRI 進行粗分割,最后提出 3 層深度學習的 CNNs,實現了 ADHD 患者和正常人群的分類。研究結果表明,本文方法分類準確率高、計算量小,能較好地提取不明顯的圖像特征,改善了傳統 MRI 腦區精確分割耗時長及復雜度高的缺點,可為今后開展針對 ADHD 客觀、高效的臨床診斷研究奠定新的思路。
1 實驗數據
本文研究所用 MRI 數據來自 ADHD-200 全球競賽數據集(http://fcon_1000.projects.nitrc.org/ indi/adhd200/)中的北京大學(Peking University,Peking_1和Peking_2)子數據集。本文研究采用了數據集中的結構磁共振圖像(structural magnetic resonance images,SMRI)。MRI 數據經過了三維(3D)解剖掃描,采用了 3.0 T 的 MRI 掃描機(GE Signa,General Electric Healthcare,Milwaukee,WI),掃描范圍為顱底至顱頂。北京大學的子數據集共有 152 個中國人的 MRI 樣本,包括 59 名 ADHD 患者和 93 名正常人。本文從 59 名 ADHD 患者中篩選出了 55 名年齡(11.5±2.8)歲,范圍為 9~14 歲的 ADHD 患者,并從 93 名正常人中篩選出了 55 名年齡為(11.5±2.5)歲,范圍為 9~14 歲的正常兒童。篩選出的 110 名兒童中 88 名用于訓練,22 名用于測試,訓練組中 ADHD 患者和正常兒童數量均為 44,測試組中 ADHD 患者和正常兒童數量均為 11。兩組受試者均排除精神發育遲滯、廣泛性發育障礙、品行障礙、情緒問題、精神病史和物質濫用等情況。均為右利手,均無因頭部外傷引起意識喪失的歷史,經中國兒童修訂版全面韋氏智力量表(full-scale Wechsler intelligence scale for Chinese children-revised,WISCC-R)測試,分數值 ≥80[13]。
2 方法
本文運用 CNNs 算法對前述 ADHD 患者和正常對照組進行分類。該研究方法的整個算法流程圖如圖 1 所示。將 MRI 數據分為訓練集和測試集,兩個數據集的 MRI 均經過圖像預處理和圖像粗分割,作為 CNNs 的輸入。訓練集數據用于訓練 CNNs 網絡,以獲取最優的模型,測試集數據用于測試模型的匹配分類性能。
 圖1
				本文算法流程圖
			
												
				Figure1.
				Flow diagram of algorithm
						
				圖1
				本文算法流程圖
			
												
				Figure1.
				Flow diagram of algorithm
			
								2.1 數據預處理
本文研究的 MRI 數據采用功能性神經影像分析軟件(analysis of functional neuroimaging,AFNI)和功能性磁共振成像軟件庫(functional magnetic resonance images software library,FSL)進行了數據預處理,AFNI 和 FSL 軟件均為針對 MRI 腦部成像的綜合性分析工具。數據預處理包括頭骨剝離,灰質、白質、腦脊液分割,歸一化(1 mm×1 mm×1 mm)和高斯核平滑等。
頭骨剝離:頭骨剝離是將腦部組織從非腦組織中分離出來,去除非腦部組織,確保腦白質、灰質和腦脊液的精確分割。頭骨剝離是腦組織分割中的一個關鍵步驟。本文的數據經過了 AFNI 軟件的三維頭骨剝離,步驟包括:① 體積預處理。消除整個空間圖像的非均勻性,重新定位大腦;② 反復擴大一個球形表面直到它可以包圍整個大腦。使用腦部提取工具(brain extraction tool,BET)刪除整個頭部圖像的非腦組織,消除內外顱骨表面和外頭皮表面。③ 創建大腦模型的表面以及頭骨部分。
灰質、白質、腦脊液分割:本文將大腦的三維圖像分割為灰質、白質、腦脊液,同時還校正了空間強度的變化。基本的方法是基于馬爾可夫隨機場模型和相關聯的最大期望算法,該方法的抗噪性能優于大多數有限混合基于模型的方法。整個過程可以產生一個偏磁場校正輸入圖像和基于概率的部分體積組織分割。
歸一化:將頭骨剝離后的解剖圖像匹配同一個 1 mm×1 mm×1 mm 分辨率的模板空間。
高斯核平滑:用 6 mm 的半高全寬(full width at half maximum,FWHM)高斯濾波器模糊歸一化圖像。
預處理后結果如圖 2 所示。
 圖2
				數據預處理結果圖
			
												
				Figure2.
				Results of data preprocessing
						
				圖2
				數據預處理結果圖
			
												
				Figure2.
				Results of data preprocessing
			
								2.2 MRI 粗分割
據文獻[14-15]介紹,ADHD 患者在左側楔前葉、左側額上回,右側尾狀核處大腦皮質灰質濃度要低于正常人,故本研究通過區域選擇大腦中右側尾狀核、左側楔前葉、左側額上回并粗略分割作為特征區域。以右側尾狀核為例,大腦右側尾狀核定位圖如 圖 3 所示。
 圖3
				正常受試者和 ADHD 受試者右側尾狀核定位圖
			
												
				Figure3.
				MRI location map of right caudate nuclear in ADHD and normal subjects
						
				圖3
				正常受試者和 ADHD 受試者右側尾狀核定位圖
			
												
				Figure3.
				MRI location map of right caudate nuclear in ADHD and normal subjects
			
								已有的基于 MRI 的病類分類的算法均需要對腦區進行圖像分割,分割的結果直接影響分類的準確率和后續的計算量。本文采取粗分割的方式,避免了由于對圖像過度精確分割而帶來的工作量大、耗時較長的繁瑣計算。研究選用大腦矢狀面的特征區域,擴大粗分割區域,以確保右側尾狀核、左側楔前葉、左側額上回分別在各自的待檢測區域內,用以代替精確分割這些特征區域。本文設定的粗分割區域均為固定像素方形區域,像素大小均為 79×79,分割后的灰度圖像數據進行歸一化處理。右側尾狀核、左側楔前葉和左側額上回 3 個腦區的粗分割結果如 圖 4 所示。
 圖4
				ADHD 受試者粗分割矢狀面特征腦區圖
			
												
				Figure4.
				Feature region image of coarse segmentation brain sagittal in ADHD subjects
						
				圖4
				ADHD 受試者粗分割矢狀面特征腦區圖
			
												
				Figure4.
				Feature region image of coarse segmentation brain sagittal in ADHD subjects
			
								2.3 基于 CNNs 的 ADHD 的 MRI 分類
本文采用深度學習方法分析 ADHD 患者的 MRI 圖像,深度學習法能夠更好地提取圖像特征,尤其在特征不明顯的圖像中更能體現其優勢 [16]。在本研究中,采用的是 CNNs 來對圖像進行特征提取和分類。CNNs 由卷積層和采樣層交替構成。本文提出了 3 層 CNNs 結構,基于 CNNs 的 ADHD 分類的整體網絡結構(以右側尾狀核區域為例)如 圖 5 所示,包含 3 個卷積層,2 個采樣層和 1 個全連接層。其中,卷積層用于提取圖像特征,采樣層用于降低圖像相關性并減少運算量,全連接層為分類識別步驟。
 圖5
				基于 CNNs 的 ADHD 分類的整體網絡結構
			
												
				Figure5.
				Network architecture of ADHD classification based on CNNs
						
				圖5
				基于 CNNs 的 ADHD 分類的整體網絡結構
			
												
				Figure5.
				Network architecture of ADHD classification based on CNNs
			
								輸入層:輸入經上述粗略分割的矢狀面右側尾狀核(左側楔前葉、左側額上回)圖像,由 79×79 的像素點組成。
卷積層 C1:在卷積層中進行的是二維卷積運算,卷積的過程實際上就是特征提取的過程。輸入的圖像與卷積核進行卷積,并將運算結果通過激活函數輸出得到卷積層的 66×66 的特征圖。卷積層的輸出可按如下公式計算:
| $ C{1_i} = \left( {\rm {sigm} \rm {oid}\left( {{{{w}}_i} \otimes {{x}}} \right)} \right)\;\;\;\;i = 1:N $ | 
其中 x 為輸入的圖像; 代表卷積;N 為卷積核大小;C1 的卷積核大小為 14×14,核數為 2;wi代表對應于 i 的權值,即卷積核里的每一個數值,wi隨機初始化再用反向傳播(back propagation,BP)梯度算法訓練得到最優化;C1i代表卷積層 1 的輸出特征圖;本研究所用激活函數為概率分布函數 (sigmoid),即 。
采樣層 S2:采樣層進行采樣處理,采樣的過程就是降維,減少了數據量。采樣通常有均值采樣和最大值采樣兩種,本文用的是均值采樣(meanPool),即對特征圖像的全部采樣值求均值。采樣層輸出的特征圖 S2i 是卷積層 C1 輸出的特征圖C1i作為采樣層的輸入經均值采樣的結果。本文采樣步長均為 2,故采樣層的輸出特征圖為輸入特征圖大小的一半。采樣層公式如下:
| $ S{2_i} = {\mathop{\rm meanPool}\nolimits} (C{1_i}) $ | 
卷積層 C3、C5 與卷積層 C1 計算過程一樣,但卷積核的大小以及卷積核的數目各層是不同的;其中,C3 的卷積核大小為 22×22,核數為 3;C5 的卷積核大小為 2×2,核數為 1。采樣層 S4 與采樣層 S2 計算過程一樣,采樣步長也相同。整個網絡上一層的輸出均是下一層的輸入。
全連接層 F6:全連接層是個一維線性排布的網絡節點,與前一層是全連接的網絡,將前一層的最后結果編碼成一維向量。
輸出層 F7:輸出層與前一層是全連接的,它的結點個數與分類數目有關。本文我們要對 MRI 分成 2 類,因此輸出層有 2 個結點。
3 結果及分析
本文選擇右側尾狀核,左側楔前葉,左側額上回 3 個腦區進行研究,探求 ADHD 患者在哪個腦區與正常人存在差異,并探索 CNNs 對 ADHD 分類問題的具體應用。本文算法對 3 個腦區的測試結果如 圖 6 所示,右側尾狀核 22 個測試樣本分類結果中,17 個樣本測試值與真實值相等,有 5 個樣本測試值與真實值不相等;右側尾狀核 ADHD 分類準確率為 77.27%。左側楔前葉 15 個樣本測試值與真實值相等,左側楔前葉 ADHD 分類準確率為 68.18%。左側額上回 13 個樣本測試值與真實值相等,左側額上回 ADHD 分類準確率為 59.09%。
 圖6
				三個特征腦區 CNNs 分類測試結果
			
												
				Figure6.
				Test results of 3 feature brain regions by CNNs.
						
				圖6
				三個特征腦區 CNNs 分類測試結果
			
												
				Figure6.
				Test results of 3 feature brain regions by CNNs.
			
								3 個特征腦區分類結果的各項指標如 表 1 所示。由表可知,右側尾狀核特征腦區分類準確率 77.27%,相比其他特征腦區準確率是最高的;靈敏度 81.82%,相比其他腦區也是最高的。然而特異性左側額上回是最高的,結果為 90.91%;假陽性率左側額上回相比其他腦區是最低的。假陰性率右側尾狀核相比其他腦區是最低的。綜合看來,利用右側尾狀核特征腦區對 ADHD 的分類準確率最高,效果較明顯。
 表1
                特征腦區分類結果比較
		 	
		 			 				Table1.
    			Comparison of the classification results for feature region
			
						表1
                特征腦區分類結果比較
		 	
		 			 				Table1.
    			Comparison of the classification results for feature region
       		
       				目前,在 ADHD-200 全球競賽結果中,所有方法達到的該競賽中最高分類準確率為 62.52% [8]。基于以上研究結果顯示,本文方法可有效地應用于基于 MRI 的 ADHD 診斷;利用右側尾狀核和左側楔前葉進行分類,本文方法取得的結果明顯高于 ADHD-200 競賽的最高分類準確率;與此同時,本文方法利用右側尾狀核診斷的分類準確率最高,可見在該特征區域處 ADHD 患者與正常人有較明顯的差異。目前,MRI 腦部圖像分割主要有基于聚類的算法、基于形變模型的分割方法、圖割算法、形態學分水嶺算法以及基于圖譜的分割方法等,這些方法包含手動操作時間和算法運算時間,耗時均較長,且受制于軟硬件環境 [17],本文所采用的 MRI 數據粗分割屬于固定分割,所有圖像均截取固定區域,速度快,幾乎無計算量損耗。此外,雖然 ADHD-200 競賽中的個人特征數據算法取得了最高分類準確率,但是該方法無法直觀反映病變機制,而本文采用 MRI 圖像,其信息更能反映腦部因神經機制而引起的病變,從而對醫學診斷有基礎性的研究價值。本文采用了深度學習和圖像粗分割的方法分析 ADHD 患者和正常人群的 MRI,深度學習法能夠更好地提取圖像特征,尤其在特征不明顯的圖像中更能體現其優勢;采取粗分割 MRI 的方式,避免了由于對圖像過度精確分割而帶來的工作量大、耗時較長的繁瑣計算。本文方法中 CNNs 只需要 3 層卷積,通常 CNNs 需要很高的層數才能達到較好的分類效果,可見,本文方法減少了計算量,提高了計算效率。
4 討論
本文提出了一種利用 MRI 圖像診斷 ADHD 的新算法,將深度學習的 CNNs 結合預處理和腦區粗分割,能有效地將 ADHD 患者和正常兒童分類,從而實現 ADHD 臨床腦部 MRI 自動分類與診斷。應用本文方法對 3 個腦區進行分析,獲得了較高的分類準確率;其中,利用右側尾狀核區域和左側楔前葉進行分類,準確率高于 ADHD-200 競賽的最高準確率。新算法的分類結果表明,ADHD 患者較正常兒童大腦皮質灰質濃度低,在右側尾狀核、左側楔前葉和左側額上回存在差異,其中在右側尾狀核腦區處的分類最高準確率可達 77.27%,高于 ADHD-200 全球競賽中所達到的 ADHD 最高分類準確率 62.52%[8]。
綜上所述,本文方法具有分類準確率高、訓練速度快、計算耗時小等優點,為 ADHD 的診斷提供了一種可參照的客觀方法。由于本文所采用的 CNNs 與輸入樣本相關,而且不同的年齡和性別的人群其聽覺和視覺注意力的神經機制差異較 大[18-19],因此,下一階段的研究需要將受試對象繼續擴大,在不同的年齡段以及不同的性別組進行進一步的研究[20]。
 
        

 
                 
				 
																   	
                                                                    
                                                                    
																	 
																   	
                                                                    
                                                                    
																	 
																   	
                                                                    
                                                                    
																	 
																   	
                                                                    
                                                                    
																	 
																   	
                                                                    
                                                                    
																	 
																   	
                                                                    
                                                                    
																	