基于分段重標定的稠密卷積神經網絡的分帶染色體圖像類型識別_《生物醫學工程學雜志》

作者：

李建明 ^1,2,3 ,  陳斌 ^2,3 , 孫曉飛 ^1,2,3 , 馮濤 ^1,2,3 , 張躍飛 ^1,2,3

1. 中國科學院成都計算機應用研究所（成都 610041）;
2. 中國科學院大學（北京 100049）;
3. 中科院廣州電子技術有限公司（廣州 510070）;

關鍵詞：

染色體識別稠密卷積神經網絡分段重標定染色體核型分析

DOI：

10.7507/1001-5515.201912029

視頻：

導出 下載 收藏 掃碼 引用

摘要 全文 圖表 視頻 參考文獻 施引文獻 補充材料

人類染色體核型分析是診斷遺傳疾病的重要手段，染色體圖像類型識別是分析過程的關鍵步驟，準確高效地識別對自動核型分析具有重大意義。本文提出了一種分段重標定的稠密卷積神經網絡模型（SR-DenseNet），模型各階段先利用稠密連接的網絡層自動提取染色體不同抽象層次的特征，再用壓縮激活（SE）結構對匯集了局部所有特征的層進行特征重標定，對不同特征的重要性顯式地構建可學習的結構；提出了一種模型融合方法，構建了染色體識別模型專家組。在國際公開的哥本哈根染色體識別數據集（G 顯帶）上進行了實驗驗證，該模型的識別錯誤率僅為 1.60%；采用模型融合方法后，識別錯誤率進一步降低到 0.99%。在意大利帕多瓦大學的數據集（Q 顯帶）上，識別錯誤率為 6.67%；模型融合后，進一步降低到 5.98%。實驗結果表明本文所提方法是有效的，具備實現染色體類型識別自動化的潛力。

引用本文： 李建明, 陳斌, 孫曉飛, 馮濤, 張躍飛. 基于分段重標定的稠密卷積神經網絡的分帶染色體圖像類型識別. 生物醫學工程學雜志, 2021, 38(1): 122-130. doi: 10.7507/1001-5515.201912029 復制

引言

染色體是人類遺傳物質的重要載體。正常情況下，體細胞包含 23 對（46 條）無結構改變的染色體。染色體在細胞分裂過程中出現染色體結構或數目異常的疾病，稱為染色體病。如果這種情況出現在胚胎發育階段，嚴重者會停止發育并流產，少數存活者可能出現機體畸變、智力低下、發育遲緩等情況^[1-2]。目前這種疾病無有效的治療方法，因此對染色體病的遺傳分析和產前診斷是重要的預防手段。

染色體核型分析，是臨床上診斷染色體是否存在異常的常用方法。該技術以細胞分裂中期的染色體為研究對象，并借助顯帶技術對染色體進行數字成像。成像后由專業的遺傳學醫師，人工從圖像中分割染色體與其他雜質。再根據圖像中各染色體如長短、染色體帶型、著絲粒位置、有無隨體、長短臂比例特點對染色體半自動分類配對。其中，把分割得到的單條染色體的圖像分為 24 類（0～22 號常染色體和 X/Y 性染色體）之一的工作即為染色體圖像類型識別（以下簡稱染色體識別）。得到配對的染色體圖像后，按國際人類細胞遺傳命名系統（international system for human cytogenetic nomenclature，ISCN）組織排列，再計數、分析以確定是否存在數目和結構異常。

傳統的染色體核型分析主要依靠專業醫師對采集到的染色體圖像進行預處理、識別配對和異常分析^[3]。在分割、識別、計數任務中，以識別配對在臨床操作中最為耗時；且受染色體圖像質量、醫師技術經驗和操作時精力集中程度等一系列因素的影響，識別任務是染色體核型分析效率較低、容易出錯的環節。因而準確高效的染色體識別對自動核型分析具有重大意義。

隨著計算機圖像識別技術的發展，染色體核型自動分析技術受到了國內外眾多研究者的關注^[4-8]。2012 年以前的技術大都采用人工設計的特征或淺層人工神經網絡提取特征再進行分類識別的方式。郭宏宇等^[4]將模糊理論運用到染色體自動識別系統，并與神經網絡相結合，提出了一種模糊神經網絡模型。蔣欣^[5]基于中點法提取染色體中軸，基于幾何特征和灰度分布定位著絲粒，采用了平均灰度投影曲線、灰度梯度投影曲線和形狀投影曲線提取帶紋，再用加權的密度分布（weighted density distribution，WDD）^[5]計算和表示帶紋特征；然后采用兩層分類器進行染色體識別。

深度學習技術的出現，促進了計算機圖像研究領域長足的進步，并在大規模自然圖像識別競賽中取得了優異的成績^[9-14]。很多學者把相關技術應用在染色體識別任務中，自動提取圖像特征并進行識別，取得了較好的結果^[15-20]。Sharma 等^[15]提出了結合眾包、預處理和深度學習技術的方法，分割并識別染色體。該研究使用眾包的方法分割出單條染色體后，對彎曲的染色體進行了預處理，但其預處理方法為填充的部分引入了非真實的像素。Qin 等^[16]提出了變焦網絡（Varifocal-Net）對染色體進行識別。該網絡是一個二階段的網絡結構，包含全局尺度的網絡（global-scale network，G-Net）和局部尺度的網絡（local-scale network，L-Net）。G-Net 提取全局特征并檢測可用于提取精細特征的區域，L-Net 變焦到 G-Net 定位的區域并進一步提取精細的局部特征。譚凱^[19]提出了單條染色體圖像的伸直處理算法，對彎曲染色體圖像進行預處理，以提升后續網絡對染色體的識別效果。Lin 等^[20]為染色體識別任務設計了改進的開端（Inception）網絡，結合提出的數據增強方法，取得了較好的識別效果。

本文充分結合壓縮激活網絡（squeeze-and-excitation networks，SE-Net）^[13]和稠密卷積網絡（dense convolutional network，DenseNet）^[14]的優點，設計了分段重標定（segmental recalibration，SR）的 DenseNet（SR-DenseNet）模型。該網絡利用單條染色體圖像和對應的類別標注信息，自動提取染色體特征，并完成染色體圖像識別任務。然后，本文選擇國際上可公開使用的兩個數據集進行實驗，分別是：哥本哈根染色體數據集（Copenhagen chromosome dataset，CCD）（網址：ftp://ftp.igmm.ed.ac.uk/pub/CromData/gbands/CPR.data/）和意大利帕多瓦大學染色體分類數據集（Padova chromosome dataset for classification，PCDC）（網址：http://bioimlab.dei.unipd.it/Chromosome%20Data%20Set%204Class.htm）^[21]。在這兩個數據集上，本文與先進的通用卷積神經網絡^[9-14]以及 Sharma 等^[15]、Qin 等^[16]設計的染色體識別網絡進行了對比實驗。最后，提出了一種模型融合算法，在兩個數據集上均進行了實驗，進一步降低了染色體識別任務的錯誤率。實驗結果表明，本文所提方法是有效的，具備實現染色體識別自動化的潛力，為進一步實現染色體核型分析的自動化打下基礎。

1 SR-DenseNet 網絡模型

1.1 SE-Net 的壓縮激活結構

傳統的卷積神經網絡，在局部感受野上同時對不同通道進行卷積運算（convolution，conv），以提取空間和通道之間的信息。SE-Net 的壓縮激活結構顯式地對通道之間的相關性進行建模，重新標定了各通道之間特征圖的重要性，提升了網絡的表現能力^[13]。該結構首先進行信息壓縮（squeeze）操作，通過全局平均池化（global average pooling，GAP）得到各通道特征圖的激活平均值，利用統計特性描述了通道的激活程度。然后，作者設計了激活（excitation）操作，以利用通道之間的依賴關系。具體實現時，重標定的網絡支路中，GAP 操作之后得到了 1 × 1 × C（其中，C 為通道數）大小的特征圖，先使用 1 × 1 conv 對特征圖進行降維操作，得到 1 × 1 × C/r（其中，C 為通道數，r 是降維因子）大小的全連接層（fully connected layer，FC）；再使用限制線性單元（rectified linear units，ReLU）激活函數得到 1 × 1 × C/r 大小的特征圖；接著使用 1 × 1 conv 做升維操作，把降維的特征圖還原到 1 × 1 × C 大小；最后使用了 S 狀彎曲函數（sigmoid）作激活函數，實現了參數化的門限機制，得到與每個通道對應的 0～1 之間的激活值，該值重標定了特征圖的重要性^[13]。激活值與對應通道相乘得到重新標定的縮放（scale）層。

1.2 稠密網絡

自 He 等^[12]提出殘差網絡（residual network，ResNet）以來，神經網絡層與層之間的“捷徑”（shortcut）結構被廣泛使用。DenseNet 進一步發展了這種技術，設計了層與層兩兩之間通過捷徑相互連接的局部網絡結構，作者稱之為稠密塊（dense block）^[14]。如圖 1 下部所示，稠密塊中每一層，都匯集其前面各層的特征圖作為輸入。這些特征圖先經批歸一化（batch normalization，BN）^[22]操作之后，再通過卷積層調整其通道數。第 l 層特征圖與前面層的關系如式（1）所示^[14]：

圖1 稠密連接模塊圖示 Figure1. The schema of dense block module

圖選項

模型	染色體編號
模型	0	1	5
模型 A	5.88	2.94	0
模型 B	2.94	5.88	0
模型 C	2.94	5.88	0
模型 D	2.94	2.94	2.86
模型 E	5.88	2.94	2.86

識別模型	總體識別錯誤率（%）	網絡層數/層
Sharma	2.47	11
G-Net	1.36	28
AlexNet	3.45	8
GoogLenet	2.59	22
VGG16	2.47	16
ResNet18	1.97	18
DenseNet	1.97	121
SE-Net	2.34	101
SR-DenseNet	1.60	125
融合	0.99	—

類別	染色體單類別識別錯誤率（%）
類別	Sharma	G-Net	AlexNet	GoogLenet	VGG16	ResNet18	DenseNet	SE-Net	SR-DenseNet	融合
1	2.94	2.94	5.88	2.94	5.88	2.94	5.88	5.88	5.88	2.94
2	2.94	2.94	5.88	5.88	5.88	5.88	5.88	5.88	2.94	2.94
3	0.00	0.00	0.00	0.00	0.00	0.00	0.00	0.00	0.00	0.00
4	8.57	2.86	11.43	5.71	5.71	5.71	5.71	8.57	2.86	2.86
5	0.00	0.00	0.00	0.00	0.00	0.00	0.00	0.00	0.00	0.00
6	5.71	2.86	2.86	0.00	2.86	0.00	0.00	0.00	0.00	0.00
7	0.00	0.00	0.00	0.00	0.00	0.00	0.00	0.00	0.00	0.00
8	5.71	2.86	5.71	8.57	2.86	2.86	2.86	2.86	2.86	2.86
9	0.00	0.00	2.86	5.71	2.86	2.86	0.00	0.00	2.86	0.00
10	2.78	2.78	5.56	5.56	2.78	5.56	5.56	8.33	5.56	2.78
11	0.00	0.00	0.00	0.00	0.00	0.00	0.00	0.00	0.00	0.00
12	2.86	0.00	0.00	0.00	0.00	0.00	2.86	0.00	0.00	0.00
13	2.86	5.71	5.71	5.71	2.86	2.86	2.86	5.71	2.86	2.86
14	2.78	0.00	2.78	2.78	2.78	0.00	0.00	0.00	0.00	0.00
15	0.00	0.00	0.00	0.00	0.00	0.00	0.00	0.00	0.00	0.00
16	0.00	0.00	0.00	0.00	0.00	0.00	0.00	0.00	0.00	0.00
17	0.00	0.00	0.00	0.00	2.78	0.00	0.00	0.00	0.00	0.00
18	5.56	5.56	8.33	2.78	5.56	5.56	2.78	5.56	2.78	2.78
19	2.78	0.00	2.78	2.78	0.00	2.78	2.78	5.56	5.56	0.00
20	0.00	0.00	2.78	2.78	2.78	0.00	0.00	0.00	0.00	0.00
21	2.78	0.00	0.00	0.00	2.78	0.00	0.00	0.00	0.00	0.00
22	2.78	0.00	5.56	2.78	5.56	2.78	0.00	2.78	0.00	0.00
X	7.69	3.85	15.38	7.69	3.85	7.69	3.85	3.85	3.85	3.85
Y	0.00	0.00	0.00	0.00	0.00	0.00	22.22	0.00	0.00	0.00

1.	曾秋伊, 朱素優. 絨毛染色體核型分析在產前診斷及自然流產中的臨床應用. 中國優生與遺傳雜志, 2019, 27(6): 679-681.
2.	閆梅, 李輝, 陳佛蘭, 等. 廣東惠州地區 2117 例孕婦羊水染色體結果分析. 檢驗醫學與臨床, 2019, 16(15): 2171-2174.
3.	Britto A P, Ravindran G. A review of cytogenetics and its automation. J Med Sci, 2007, 7: 1-18.
4.	郭宏宇, 鮑旭東, 蔣春濤. 基于模糊人工神經網絡的染色體識別. 中國生物醫學工程學報, 2004, 23(2): 116-120, 126.
5.	蔣欣. 人類染色體圖像自動分析技術研究. 武漢: 華中科技大學, 2007.
6.	Hu R L, Karnowski J, Fadely R, et al. Image segmentation to distinguish between overlapping human chromosomes. arXiv preprint, 2017. arXiv: 1712.07639.
7.	Munot M V. Development of computerized systems for automated chromosome analysis: current status and future prospects. International Journal of Advanced Research in Computer Science, 2018, 9(1): 782-791.
8.	Qiu Y, Lu X, Yan S, et al. Applying deep learning technology to automatically identify metaphase chromosomes using scanning microscopic images: an initial investigation//Biophotonics and Immune Responses XI. International Society for Optics and Photonics, San Francisco: SPIE, 2016, 9709: 97090K.
9.	Krizhevsky A, Sutskever I, Hinton G E. ImageNet classification with deep convolutional neural networks//Advances in Neural Information Processing Systems. Stateline: NIPS, 2012: 1097-1105.
10.	Szegedy C, Liu W, Jia Y, et al. Going deeper with convolutions//2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Boston: IEEE, 2015: 1-9.
11.	Simonyan K, Zisserman A. Very deep convolutional networks for large-scale image recognition//International Conference on Learning Representations (ICLR), 2015. arXiv: 1409.1556.
12.	He Kaiming, Zhang Xiangyu, Ren Shaoqing, et al. Deep residual learning for image recognition//2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Las Vegas: IEEE, 2016: 770-778.
13.	Hu Jie, Shen Li, Sun Gang. Squeeze-and-Excitation networks//2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition, Salt Lake City: IEEE, 2018: 7132-7141.
14.	Huang G, Liu Z, van der Maaten L, et al. Densely connected convolutional networks//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, Honolulu: IEEE, 2017: 4700-4708.
15.	Sharma M, Saha O, Sriraman A, et al. Crowdsourcing for chromosome segmentation and deep classification//2017 IEEE Conference on Computer Vision and Pattern Recognition Workshops (CVPRW), Honolulu: IEEE, 2017: 786-793.
16.	Qin Y, Wen J, Zheng H, et al. Varifocal-Net: A chromosome classification approach using deep convolutional networks. IEEE Trans Med Imaging, 2019, 38(11): 2569-2581.
17.	Jindal S, Gupta G, Yadav M, et al. Siamese networks for chromosome classification//2017 IEEE International Conference on Computer Vision Workshops (ICCVW), Honolulu: IEEE, 2017: 72-81.
18.	Gagula-Palalic S, Can M. Human chromosome classification using competitive neural network teams (CNNT) and nearest neighbor//IEEE-EMBS International Conference on Biomedical and Health Informatics (BHI), Valencia: IEEE, 2014: 626-629.
19.	譚凱. 染色體圖像智能分析的綜合方法研究及應用. 成都: 電子科技大學, 2020.
20.	Lin C, Zhao G, Yang Z, et al. CIR-net: automatic classification of human chromosome based on Inception-ResNet architecture. IEEE/ACM Trans Comput Biol Bioinform, 2020, PP. DOI: 10.1109/TCBB.2020.3003445.
21.	Poletti E, Grisan E, Ruggeri A. Automatic classification of chromosomes in Q-band images//2008 30th Annual International Conference of the IEEE Engineering in Medicine and Biology Society, Vancouver: IEEE, 2008: 1911-1914.
22.	Ioffe S, Szegedy C. Batch normalization: accelerating deep network training by reducing internal covariate shift//International Conference on Machine Learning. Lille: IMLS, 2015: 448-456.
23.	Lundsteen C, Lind A M, Granum E. Visual classification of banded human chromosomes. I. Karyotyping compared with classification of isolated chromosomes. Ann Hum Genet, 1976, 40(1): 87-97.
24.	Sweeney Jr W P. Musavi M T, Guidi J N Classification of chromosomes using a probabilistic neural network. Cytometry: the Journal of the International Society for Analytical Cytology, 1994, 16(1): 17-24.
25.	Piper J, Granum E. On fully automatic feature measurement for banded chromosome classification. Cytometry, 1989, 10(3): 242-255.

《生物醫學工程學雜志》

基于分段重標定的稠密卷積神經網絡的分帶染色體圖像類型識別

摘要 全文 圖表 視頻 參考文獻 施引文獻 補充材料

引言

1 SR-DenseNet 網絡模型

1.1 SE-Net 的壓縮激活結構

1.2 稠密網絡

1.3 SR-DenseNet 網絡設計

1.4 多模型融合

2 實驗數據集和結果

2.1 數據集

2.1.1 CCD 染色體圖像數據集

2.1.2 PCDC 染色體分類數據集

2.2 實驗結果對比與分析

2.2.1 評價指標

2.2.2 CCD 數據集識別效果對比

2.2.3 PCDC 數據集實驗結果

2.3 多模型融合方法的實驗結果

3 討論

4 結論

引言

1 SR-DenseNet 網絡模型

1.1 SE-Net 的壓縮激活結構

1.2 稠密網絡

1.3 SR-DenseNet 網絡設計

1.4 多模型融合

2 實驗數據集和結果

2.1 數據集

2.1.1 CCD 染色體圖像數據集

2.1.2 PCDC 染色體分類數據集

2.2 實驗結果對比與分析

2.2.1 評價指標

2.2.2 CCD 數據集識別效果對比

2.2.3 PCDC 數據集實驗結果

2.3 多模型融合方法的實驗結果

3 討論

4 結論

上一篇

下一篇

Format

Content

摘要全文圖表視頻參考文獻施引文獻補充材料