圖像特征提取是圖像處理的一個主要環節, 是圖像處理技術研究和應用的一個重要領域。維吾爾醫是我國的傳統醫學, 越來越受到人們的重視, 但大量的維吾爾醫藥材的數據資料沒有得到充分利用。本文針對新疆維吾爾藥材的植物藥和動物藥圖像提取了顏色直方圖特征。先對圖像進行顏色增強、尺寸歸一、空間轉換的預處理, 提取顏色直方圖特征并對顏色直方圖特征進行統計學分析, 最后應用Bayes判別分析法對特征的分類能力進行評價。實驗結果表明顏色直方圖特征對維吾爾藥圖像分類有較高的準確率, 一定程度上有助于基于內容的新疆維吾爾藥材圖像的檢索的研究。
引用本文: 木拉提·哈米提, 員偉康, 嚴傳波, 阿布都艾尼·庫吐魯克, 楊芳, 伊力扎提·阿力甫. 基于顏色直方圖的新疆維吾爾醫藥材圖像特征提取與判別分析. 生物醫學工程學雜志, 2015, 32(3): 588-593. doi: 10.7507/1001-5515.20150107 復制
版權信息: ?四川大學華西醫院華西期刊社《生物醫學工程學雜志》版權所有,未經授權不得轉載、改編
引言
新疆維吾爾醫藥材是祖國傳統醫藥學的重要組成部分,在我國有著悠久的歷史,是維吾爾族人民在長期的生產實踐中,與疾病不斷作斗爭的科學總結和智慧結晶,是中國傳統醫藥寶庫中的瑰寶。新疆幅員遼闊,地理環境的獨特性和生態環境的多樣性,孕育了豐富的藥材資源。按維吾爾醫藥材的來源可將其分為三類:植物藥、動物藥和礦物藥[1-4]。本文將針對植物藥和動物藥進行特征提取和數據分析。
長期以來新疆各地州維吾爾醫院和醫療機構積累了大量的維吾爾醫藥材的數據資料,但是得到充分利用的卻很少。隨著多媒體技術和網絡技術的迅猛發展以及數字圖像的廣泛應用[5-6],數字圖像的數據量迅速增大,基于內容的圖像檢索技術越來越受到人們的重視。為了適應飛速發展的基于內容的圖像檢索技術和充分利用維吾爾藥材數據,建立藥材檢索平臺和藥材資源數據庫以輔助臨床醫師和藥劑師高效快速地查找維吾爾藥材數據是一項迫切的任務。本文就藥材檢索平臺所需的顏色特征提取方法進行了研究與分析。首先以植物藥藿香和動物藥蜥蜴為例,按圖 1所示的實驗步驟進行實驗。
 圖1
				實驗步驟
			
												
				Figure1.
				Experimental procedure
						
				圖1
				實驗步驟
			
												
				Figure1.
				Experimental procedure
			
								1 顏色空間
顏色空間也稱彩色模型,其用途是在某些標準下用通常可接受的方式對彩色加以說明。顏色是圖像的一種重要的視覺特性,是人眼對光的視覺感受。它包括色彩、飽和度和亮度三個要素,完整地表述一種顏色需要至少三個數值。
1.1 常見的顏色空間種類
顏色空間有許多種,常用的有紅(R)綠(G)藍(B)顏色空間(RGB color space)和色調H(Hue)、飽和度S(Saturation)、亮度V(Value)顏色空間(HSV color space)等。
1.1.1 RGB顏色空間
RGB顏色空間由紅色、綠色和藍色三基色組成,以三基色為基礎,進行不同程度的疊加,產生豐富而廣泛的顏色。顏色空間由三維的立方體表示,紅色、綠色和藍色分布在三個坐標軸上。
1.1.2 HSV顏色空間
HSV顏色空間是面向用戶的,代表的是人眼視覺特性中的色調、飽和度和亮度。HSV是一個六角錐形模型:色調用角度度量,取值范圍為0~360°;飽和度取值范圍為0.0~1.0;亮度取值范圍為0.0(黑色)~1.0(白色)。
1.2 顏色空間的選取
基于顏色特征圖像檢索的一個關鍵問題是選取一個符合人眼視覺特性的顏色空間。
RGB顏色空間的應用雖然比較廣泛的,但不符合人眼視覺特性,這是由于RGB顏色空間的顏色不是均勻分布,R、G、B三個分量的數值和色彩的三屬性沒有直接的聯系。
HSV顏色空間比較接近人們的經驗和對色彩感知,每個分量直接作用于人的視覺感受,能較好反映人眼對顏色的感知和鑒別能力,比較適用于顏色特征提取的研究。以人眼對顏色的視覺感知為出發點,HSV空間要比RGB空間更符合人眼的感知和心理。本文采用了HSV顏色空間提取圖像的顏色信息[8]。
1.3 顏色空間的轉換
由于一般情況下獲取的圖像都是在RGB空間描述的,但在圖像檢索的應用中,HSV空間模型更適合于人眼的視覺感知。因此,通過MATLAB軟件將維吾爾醫藥材圖像從RGB空間模型轉換到HSV空間模型。
2 顏色直方圖特征的提取
顏色特征以圖像整體為對象,是一種全局特征,描述圖像或圖像區域對應景物的表面顏色性質。常見的顏色特征有顏色直方圖,顏色矩,顏色集。本文將提取維吾爾醫藥材圖像的顏色直方圖特征。
2.1 預處理
對原始圖像提取特征之前,為了讓后續處理更為方便以及加快運算速度,對維吾爾藥材圖像進行預處理,首先對彩色圖像進行增強,濾除無用信息,加強原圖的細節,使得圖像顏色更加鮮明,更加立體化。接下來對圖像尺寸大小進行歸一化處理,使得圖像的最長邊界為300像素點。預處理后,圖像的質量和尺寸得到統一,系統的運算速度有所提升。在尺寸歸一化的基礎上,還要對藥材圖像進行顏色空間的轉化,也就是RGB顏色空間轉化為HSV顏色空間。預處理結果如圖 2所示。
 圖2
				藿香和蜥蜴圖像預處理結果
						
				圖2
				藿香和蜥蜴圖像預處理結果
			
									(a)原圖像;(b)顏色增強;(c)尺寸歸一化;(d)HSV空間
Figure2. Preprocessing results of agastache and lizard(a) original image; (b) color Enhancement; (c) size normalization; (d) HSV color space
2.2 顏色直方圖
顏色直方圖作為圖像檢索系統中被廣泛應用的顏色特征,能比較直觀地表現顏色[7]。直方圖不考慮每種顏色的空間位置而是表現了不同顏色在整幅圖像中的分布。顏色直方圖多應用于那些不用考慮物體空間位置和不易分割的圖像。
2.3 顏色直方圖特征的提取
RGB顏色空間轉換到HSV顏色空間后,用H、S、V三個分量來表示圖像每一個像素的顏色信息。對于用HSV顏色空間表示的圖像,H、S、V任何一個量都可以構成自己的直方圖,仍然描述了圖像顏色的統計特性,可直觀地看出圖像顏色的統計信息和不同顏色的分布。相比較RGB顏色空間中的顏色直方圖,HSV顏色空間的各個分量相對獨立,三個直方圖像之間幾乎不相互影響。圖像的顏色分布主要由H色調直方圖決定[8]。
2.3.1 顏色特征的量化
根據HSV顏色空間模型的特點,顏色直方圖矢量的維數會相對較多。不加處理直接計算直方圖,運算量相對較大,檢索的速率會相對較慢。由于人眼分辨顏色的能力有限,不需要將每個分量的全部細節進行計算,若計算前對HSV空間進行諸如量化的處理,計算量將會減小很多。因而本文在計算特征量之前對HSV空間進行量化以減少特征矢量的維數。
在本文中,按照人的視覺感知能力的不同,將H、S和V分別分成16、4和4份,并根據每個分量的不同取值范圍進行非等間隔量化,量化模型如下:
| $ H=\left\{ \begin{array}{l} 0\;\; \;\; {\rm{if}}\; \;\; \;h \in \left({345, 15} \right]\\ 1\;\; \;\; {\rm{if}}\; \;\; \;h \in \left({15, 25} \right]\\ 2\;\; \;\; {\rm{if}}\; \;\; \;h \in \left({25, 45} \right]\\ 3\;\; \;\; {\rm{if}}\; \;\; \;h \in \left({45, 55} \right]\\ 4\;\; \;\; {\rm{if}}\; \;\; \;h \in \left({55, 80} \right]\\ 5\;\; \;\; {\rm{if}}\; \;\; \;h \in \left({80, 108} \right]\\ 6\;\; \;\; {\rm{if}}\; \;\; \;h \in \left({108, 140} \right]\\ 7\;\; \;\; {\rm{if}}\; \;\; \;h \in \left({140, 165} \right]\\ 8\;\; \;\; {\rm{if}}\; \;\; \;h \in \left({165, 190} \right]\\ 9\;\; \;\; {\rm{if}}\; \;\; \;h \in \left({190, 220} \right]\\ 10\;\; \;\; {\rm{if}}\; \;\; \;h \in \left({220, 255} \right]\\ 11\;\; \;\; {\rm{if}}\; \;\; \;h \in \left({255, 275} \right]\\ 12\;\; \;\; {\rm{if}}\; \;\; \;h \in \left({275, 290} \right]\\ 13\;\; \;\; {\rm{if}}\; \;\; \;h \in \left({290, 316} \right]\\ 14\;\; \;\; {\rm{if}}\; \;\; \;h \in \left({316, 330} \right]\\ 15\;\; \;\; {\rm{if}}\; \;\; \;h \in \left({330, 345} \right] \end{array} \right.\; \;S=\left\{ \begin{array}{l} 0\;\; \;\; {\rm{if}}\; \;\; \;s \in \left({0.00, 0.15} \right]\\ 1\;\; \;\; {\rm{if}}\; \;\; \;s \in \left({0.15, 0.40} \right]\\ 2\;\; \;\; {\rm{if}}\; \;\; \;s \in \left({0.40, 0.75} \right]\\ 3\;\; \;\; {\rm{if}}\; \;\; \;s \in \left({0.75, 1.00} \right] \end{array} \right.\; \;\; {\rm{V=}}\left\{ \begin{array}{l} {\rm{0}}\; \;\; \;{\rm{if}}\; \;\; \;v \in \left({0.00, 0.15} \right]\\ 1\;\; \;\; {\rm{if}}\; \;\; \;v \in \left({0.15, 0.40} \right]\\ 2\;\; \;\; {\rm{if}}\; \;\; \;v \in \left({0.40, 0.75} \right]\\ 3\;\; \;\; {\rm{if}}\; \;\; \;v \in \left({0.75, 1.00} \right] \end{array} \right. $ | 
2.3.2 HSV三維特征一維化
為了便于計算和檢索,將HSV三維特征矢量取不同的權值而轉換成一維特征矢量。在這三個矢量中,H、S和V影響人眼辨別顏色的能力呈遞減趨勢。根據H、S、V的量化級數和其頻率的不同進行組合,可定義一維矢量L為
| $ {\rm{L}}={\rm{H}}{{\rm{Q}}_s}{{\rm{Q}}_v}+S{{\rm{Q}}_v}+{\rm{V, }} $ | 
其中QS和QV分別是S和V的量化級數,取QS=4,QV=4,可得:
| $ {\rm{ L=16H+4S+V}} $ | 
通過計算得到256柄的一維直方圖。H、S、V三個三維分量就轉換成一個一維矢量。對H、S和V分別取權重為16、4和1,這樣就減小了S和V對計算和檢索結果的影響。進行檢索實驗時,能夠相對較好地檢索出顏色分布不同的圖像,故充分利用圖像的顏色特征的同時也達到了人們對圖像檢索的要求。得到的顏色直方圖結果如圖 3所示。
 圖3
				藿香(左)、蜥蜴(右)顏色直方圖
			
												
				Figure3.
				Color histogram of agastache (left) and lizard (right)
						
				圖3
				藿香(左)、蜥蜴(右)顏色直方圖
			
												
				Figure3.
				Color histogram of agastache (left) and lizard (right)
			
								2.3.3 基于灰度直方圖的圖像特征提取
在顏色直方圖的基礎上,我們通過計算一些統計量來反映圖像的特征值[9]。統計量如下:
均值(mean):反映一幅圖像顏色的平均值。
| $ u{\rm{=}}\sum\limits_{i=0}^{L-1} {iH\left(i \right)} $ | 
方差(variance):反映一幅圖像的顏色在數值上離散分布的情況。
| $ {\sigma ^2}=\sum\limits_{i=0}^{L-1} {{{\left({i-\mu } \right)}^2}H\left(i \right)} $ | 
歪斜度(skewness):是統計數據分布偏斜方向和程度的度量,是統計數據分布非對稱程度的數字特征。
| $ {\mu _s}=\frac{1}{{{\sigma ^3}}}\sum\limits_{i=0}^{L-1} {{{\left({i-\mu } \right)}^3}H\left(i \right)} $ | 
峰態(kurtosis):反映圖像的顏色分布在接近均值時的大致狀態,用以判斷圖像的灰度分布是否非常集中于平均顏色值附近。峰態越大,表示越分散;反之,越集中。
| $ {\mu _k}=\frac{1}{{{\sigma ^4}}}\sum\limits_{i=0}^{L-1} {{{\left({i-\mu } \right)}^4}H\left(i \right)} $ | 
能量(energy):反映顏色分布的均勻程度,顏色分布較均勻時能量較大,反之,較小。
| $ {\mu _N}=\sum\limits_{i=0}^{L-1} {H{{\left(i \right)}^2}} $ | 
3 結果與分析
3.1 實驗結果
本文參考《中華本草-維吾爾藥卷》和《新疆中草藥》(維吾爾文)研究維吾爾藥材中的植物藥和動物藥圖像。通過MATLAB軟件計算圖像數據庫中兩種類型圖像的顏色直方圖特征(均值、方差、歪斜度、峰態、能量)如表 1所示。藿香和蜥蜴的顏色直方圖特征如表 2所示。
 表1
                維吾爾醫藥材植物藥和動物藥的顏色直方圖特征
		 	
		 			 				Table1.
    			Color histogram feature of herbal and animal medicine of Xinjiang Uygur
			
						表1
                維吾爾醫藥材植物藥和動物藥的顏色直方圖特征
		 	
		 			 				Table1.
    			Color histogram feature of herbal and animal medicine of Xinjiang Uygur
       		
       				 表2
                藿香和蜥蜴的顏色直方圖特征
		 	
		 			 				Table2.
    			Color histogram feature of agastache and lizard
			
						表2
                藿香和蜥蜴的顏色直方圖特征
		 	
		 			 				Table2.
    			Color histogram feature of agastache and lizard
       		
       				3.2 結果分析
判別分析是在分類確定的條件下,根據某一研究對象的各種特征值判別其類型歸屬問題的一種多變量統計分析方法,在各個領域應用廣泛。Bayes判別法,作為判別分析的一種方法既可用于計量資料的兩類判別,也可用于多類判別,在實際工作中普遍使用。Bayes法是對特征分類能力的有效性進行評估的重要方式。Robin等[10-11]在不同復雜度的模型非監督分類中使用Bayes法。因此本文使用Bayes法對實驗結果進行分析。
使用SPSS17.0軟件對數據進行處理,隨機取圖像數據庫中的100張植物藥圖像和100張動物藥圖像進行判別分析,其中包含植物藥八十余種,動物藥五十余種。植物藥中的大多數藥材具有一張圖片,部分藥材具有兩張圖片;動物藥材相對于植物藥材種類較少,故只有五十余種,每種一到三張不等。
判別分析得到貝葉斯線性判別式函數:
| $ \begin{array}{l} {y_1}={0.419_{x1}}-{0.003_{x2}}-{0.041_{x3}}-{0.009_{x4}}+{32.409_{x5}}-13.955\\ {y_2}={0.497_{x1}}-{0.004_{x2}}+{0.24_{x3}}-{0.007_{x4}}+{26.357_{x5}}-11.912 \end{array} $ | 
其中y1、y2表示植物藥和動物藥,x1、x2、x3、x4、x5分別表示均值、方差、歪斜度、峰態、能量。y1、y2的先驗概率同為0.5,即一張藥材圖片,被判別為植物藥材和動物藥材的概率是相等的。
再根據上述判別函數式和先驗概率進行判別分析,進而得到后驗概率,即每個樣品歸屬于每一類的概率,判別準則是按后驗概率的大小歸類[12-13]。
實驗結果顯示,對植物藥圖像的分類準確率達90%,錯判率為10%;對動物藥圖像的分類準確率達70%,錯判率為30%。這初步說明顏色直方圖對于植物藥的分類能力相對較好,對于基于內容的圖像檢索具有一定的意義,結果的差異可能和植物藥的顏色分布較廣有關。但顏色直方圖特征為單一特征,對于圖像的分類有一定的局限性,考慮到可以結合如形狀特征、紋理特征等特征進行研究,故本次研究為今后的研究打下了良好的基礎。
4 結論
圖像特征提取是基于內容檢索的重要環節之一。本文以維吾爾藥圖像為研究對象,從圖像整體入手,提取圖像的顏色直方圖特征,構建了基于維吾爾醫藥材圖像顏色直方圖特征數據庫。根據新疆維吾爾藥材中植物藥圖像和動物藥圖像在顏色分布上的差異,結合藥材圖像的顏色特點,使用顏色直方圖特征提取方法,并且通過統計分析。從實驗結果可以看出,使用顏色直方圖特征對植物藥和動物藥圖像進行分類判別具有較高的準確率。這表明,顏色直方圖特征對維吾爾醫藥材的判別效果相對較好。這為進一步研究維吾爾藥材特征奠定了一定的基礎,也為后續基于內容的新疆維吾爾醫藥材圖像檢索系統研究提供了一定的理論依據。
引言
新疆維吾爾醫藥材是祖國傳統醫藥學的重要組成部分,在我國有著悠久的歷史,是維吾爾族人民在長期的生產實踐中,與疾病不斷作斗爭的科學總結和智慧結晶,是中國傳統醫藥寶庫中的瑰寶。新疆幅員遼闊,地理環境的獨特性和生態環境的多樣性,孕育了豐富的藥材資源。按維吾爾醫藥材的來源可將其分為三類:植物藥、動物藥和礦物藥[1-4]。本文將針對植物藥和動物藥進行特征提取和數據分析。
長期以來新疆各地州維吾爾醫院和醫療機構積累了大量的維吾爾醫藥材的數據資料,但是得到充分利用的卻很少。隨著多媒體技術和網絡技術的迅猛發展以及數字圖像的廣泛應用[5-6],數字圖像的數據量迅速增大,基于內容的圖像檢索技術越來越受到人們的重視。為了適應飛速發展的基于內容的圖像檢索技術和充分利用維吾爾藥材數據,建立藥材檢索平臺和藥材資源數據庫以輔助臨床醫師和藥劑師高效快速地查找維吾爾藥材數據是一項迫切的任務。本文就藥材檢索平臺所需的顏色特征提取方法進行了研究與分析。首先以植物藥藿香和動物藥蜥蜴為例,按圖 1所示的實驗步驟進行實驗。
 圖1
				實驗步驟
			
												
				Figure1.
				Experimental procedure
						
				圖1
				實驗步驟
			
												
				Figure1.
				Experimental procedure
			
								1 顏色空間
顏色空間也稱彩色模型,其用途是在某些標準下用通常可接受的方式對彩色加以說明。顏色是圖像的一種重要的視覺特性,是人眼對光的視覺感受。它包括色彩、飽和度和亮度三個要素,完整地表述一種顏色需要至少三個數值。
1.1 常見的顏色空間種類
顏色空間有許多種,常用的有紅(R)綠(G)藍(B)顏色空間(RGB color space)和色調H(Hue)、飽和度S(Saturation)、亮度V(Value)顏色空間(HSV color space)等。
1.1.1 RGB顏色空間
RGB顏色空間由紅色、綠色和藍色三基色組成,以三基色為基礎,進行不同程度的疊加,產生豐富而廣泛的顏色。顏色空間由三維的立方體表示,紅色、綠色和藍色分布在三個坐標軸上。
1.1.2 HSV顏色空間
HSV顏色空間是面向用戶的,代表的是人眼視覺特性中的色調、飽和度和亮度。HSV是一個六角錐形模型:色調用角度度量,取值范圍為0~360°;飽和度取值范圍為0.0~1.0;亮度取值范圍為0.0(黑色)~1.0(白色)。
1.2 顏色空間的選取
基于顏色特征圖像檢索的一個關鍵問題是選取一個符合人眼視覺特性的顏色空間。
RGB顏色空間的應用雖然比較廣泛的,但不符合人眼視覺特性,這是由于RGB顏色空間的顏色不是均勻分布,R、G、B三個分量的數值和色彩的三屬性沒有直接的聯系。
HSV顏色空間比較接近人們的經驗和對色彩感知,每個分量直接作用于人的視覺感受,能較好反映人眼對顏色的感知和鑒別能力,比較適用于顏色特征提取的研究。以人眼對顏色的視覺感知為出發點,HSV空間要比RGB空間更符合人眼的感知和心理。本文采用了HSV顏色空間提取圖像的顏色信息[8]。
1.3 顏色空間的轉換
由于一般情況下獲取的圖像都是在RGB空間描述的,但在圖像檢索的應用中,HSV空間模型更適合于人眼的視覺感知。因此,通過MATLAB軟件將維吾爾醫藥材圖像從RGB空間模型轉換到HSV空間模型。
2 顏色直方圖特征的提取
顏色特征以圖像整體為對象,是一種全局特征,描述圖像或圖像區域對應景物的表面顏色性質。常見的顏色特征有顏色直方圖,顏色矩,顏色集。本文將提取維吾爾醫藥材圖像的顏色直方圖特征。
2.1 預處理
對原始圖像提取特征之前,為了讓后續處理更為方便以及加快運算速度,對維吾爾藥材圖像進行預處理,首先對彩色圖像進行增強,濾除無用信息,加強原圖的細節,使得圖像顏色更加鮮明,更加立體化。接下來對圖像尺寸大小進行歸一化處理,使得圖像的最長邊界為300像素點。預處理后,圖像的質量和尺寸得到統一,系統的運算速度有所提升。在尺寸歸一化的基礎上,還要對藥材圖像進行顏色空間的轉化,也就是RGB顏色空間轉化為HSV顏色空間。預處理結果如圖 2所示。
 圖2
				藿香和蜥蜴圖像預處理結果
						
				圖2
				藿香和蜥蜴圖像預處理結果
			
									(a)原圖像;(b)顏色增強;(c)尺寸歸一化;(d)HSV空間
Figure2. Preprocessing results of agastache and lizard(a) original image; (b) color Enhancement; (c) size normalization; (d) HSV color space
2.2 顏色直方圖
顏色直方圖作為圖像檢索系統中被廣泛應用的顏色特征,能比較直觀地表現顏色[7]。直方圖不考慮每種顏色的空間位置而是表現了不同顏色在整幅圖像中的分布。顏色直方圖多應用于那些不用考慮物體空間位置和不易分割的圖像。
2.3 顏色直方圖特征的提取
RGB顏色空間轉換到HSV顏色空間后,用H、S、V三個分量來表示圖像每一個像素的顏色信息。對于用HSV顏色空間表示的圖像,H、S、V任何一個量都可以構成自己的直方圖,仍然描述了圖像顏色的統計特性,可直觀地看出圖像顏色的統計信息和不同顏色的分布。相比較RGB顏色空間中的顏色直方圖,HSV顏色空間的各個分量相對獨立,三個直方圖像之間幾乎不相互影響。圖像的顏色分布主要由H色調直方圖決定[8]。
2.3.1 顏色特征的量化
根據HSV顏色空間模型的特點,顏色直方圖矢量的維數會相對較多。不加處理直接計算直方圖,運算量相對較大,檢索的速率會相對較慢。由于人眼分辨顏色的能力有限,不需要將每個分量的全部細節進行計算,若計算前對HSV空間進行諸如量化的處理,計算量將會減小很多。因而本文在計算特征量之前對HSV空間進行量化以減少特征矢量的維數。
在本文中,按照人的視覺感知能力的不同,將H、S和V分別分成16、4和4份,并根據每個分量的不同取值范圍進行非等間隔量化,量化模型如下:
| $ H=\left\{ \begin{array}{l} 0\;\; \;\; {\rm{if}}\; \;\; \;h \in \left({345, 15} \right]\\ 1\;\; \;\; {\rm{if}}\; \;\; \;h \in \left({15, 25} \right]\\ 2\;\; \;\; {\rm{if}}\; \;\; \;h \in \left({25, 45} \right]\\ 3\;\; \;\; {\rm{if}}\; \;\; \;h \in \left({45, 55} \right]\\ 4\;\; \;\; {\rm{if}}\; \;\; \;h \in \left({55, 80} \right]\\ 5\;\; \;\; {\rm{if}}\; \;\; \;h \in \left({80, 108} \right]\\ 6\;\; \;\; {\rm{if}}\; \;\; \;h \in \left({108, 140} \right]\\ 7\;\; \;\; {\rm{if}}\; \;\; \;h \in \left({140, 165} \right]\\ 8\;\; \;\; {\rm{if}}\; \;\; \;h \in \left({165, 190} \right]\\ 9\;\; \;\; {\rm{if}}\; \;\; \;h \in \left({190, 220} \right]\\ 10\;\; \;\; {\rm{if}}\; \;\; \;h \in \left({220, 255} \right]\\ 11\;\; \;\; {\rm{if}}\; \;\; \;h \in \left({255, 275} \right]\\ 12\;\; \;\; {\rm{if}}\; \;\; \;h \in \left({275, 290} \right]\\ 13\;\; \;\; {\rm{if}}\; \;\; \;h \in \left({290, 316} \right]\\ 14\;\; \;\; {\rm{if}}\; \;\; \;h \in \left({316, 330} \right]\\ 15\;\; \;\; {\rm{if}}\; \;\; \;h \in \left({330, 345} \right] \end{array} \right.\; \;S=\left\{ \begin{array}{l} 0\;\; \;\; {\rm{if}}\; \;\; \;s \in \left({0.00, 0.15} \right]\\ 1\;\; \;\; {\rm{if}}\; \;\; \;s \in \left({0.15, 0.40} \right]\\ 2\;\; \;\; {\rm{if}}\; \;\; \;s \in \left({0.40, 0.75} \right]\\ 3\;\; \;\; {\rm{if}}\; \;\; \;s \in \left({0.75, 1.00} \right] \end{array} \right.\; \;\; {\rm{V=}}\left\{ \begin{array}{l} {\rm{0}}\; \;\; \;{\rm{if}}\; \;\; \;v \in \left({0.00, 0.15} \right]\\ 1\;\; \;\; {\rm{if}}\; \;\; \;v \in \left({0.15, 0.40} \right]\\ 2\;\; \;\; {\rm{if}}\; \;\; \;v \in \left({0.40, 0.75} \right]\\ 3\;\; \;\; {\rm{if}}\; \;\; \;v \in \left({0.75, 1.00} \right] \end{array} \right. $ | 
2.3.2 HSV三維特征一維化
為了便于計算和檢索,將HSV三維特征矢量取不同的權值而轉換成一維特征矢量。在這三個矢量中,H、S和V影響人眼辨別顏色的能力呈遞減趨勢。根據H、S、V的量化級數和其頻率的不同進行組合,可定義一維矢量L為
| $ {\rm{L}}={\rm{H}}{{\rm{Q}}_s}{{\rm{Q}}_v}+S{{\rm{Q}}_v}+{\rm{V, }} $ | 
其中QS和QV分別是S和V的量化級數,取QS=4,QV=4,可得:
| $ {\rm{ L=16H+4S+V}} $ | 
通過計算得到256柄的一維直方圖。H、S、V三個三維分量就轉換成一個一維矢量。對H、S和V分別取權重為16、4和1,這樣就減小了S和V對計算和檢索結果的影響。進行檢索實驗時,能夠相對較好地檢索出顏色分布不同的圖像,故充分利用圖像的顏色特征的同時也達到了人們對圖像檢索的要求。得到的顏色直方圖結果如圖 3所示。
 圖3
				藿香(左)、蜥蜴(右)顏色直方圖
			
												
				Figure3.
				Color histogram of agastache (left) and lizard (right)
						
				圖3
				藿香(左)、蜥蜴(右)顏色直方圖
			
												
				Figure3.
				Color histogram of agastache (left) and lizard (right)
			
								2.3.3 基于灰度直方圖的圖像特征提取
在顏色直方圖的基礎上,我們通過計算一些統計量來反映圖像的特征值[9]。統計量如下:
均值(mean):反映一幅圖像顏色的平均值。
| $ u{\rm{=}}\sum\limits_{i=0}^{L-1} {iH\left(i \right)} $ | 
方差(variance):反映一幅圖像的顏色在數值上離散分布的情況。
| $ {\sigma ^2}=\sum\limits_{i=0}^{L-1} {{{\left({i-\mu } \right)}^2}H\left(i \right)} $ | 
歪斜度(skewness):是統計數據分布偏斜方向和程度的度量,是統計數據分布非對稱程度的數字特征。
| $ {\mu _s}=\frac{1}{{{\sigma ^3}}}\sum\limits_{i=0}^{L-1} {{{\left({i-\mu } \right)}^3}H\left(i \right)} $ | 
峰態(kurtosis):反映圖像的顏色分布在接近均值時的大致狀態,用以判斷圖像的灰度分布是否非常集中于平均顏色值附近。峰態越大,表示越分散;反之,越集中。
| $ {\mu _k}=\frac{1}{{{\sigma ^4}}}\sum\limits_{i=0}^{L-1} {{{\left({i-\mu } \right)}^4}H\left(i \right)} $ | 
能量(energy):反映顏色分布的均勻程度,顏色分布較均勻時能量較大,反之,較小。
| $ {\mu _N}=\sum\limits_{i=0}^{L-1} {H{{\left(i \right)}^2}} $ | 
3 結果與分析
3.1 實驗結果
本文參考《中華本草-維吾爾藥卷》和《新疆中草藥》(維吾爾文)研究維吾爾藥材中的植物藥和動物藥圖像。通過MATLAB軟件計算圖像數據庫中兩種類型圖像的顏色直方圖特征(均值、方差、歪斜度、峰態、能量)如表 1所示。藿香和蜥蜴的顏色直方圖特征如表 2所示。
 表1
                維吾爾醫藥材植物藥和動物藥的顏色直方圖特征
		 	
		 			 				Table1.
    			Color histogram feature of herbal and animal medicine of Xinjiang Uygur
			
						表1
                維吾爾醫藥材植物藥和動物藥的顏色直方圖特征
		 	
		 			 				Table1.
    			Color histogram feature of herbal and animal medicine of Xinjiang Uygur
       		
       				 表2
                藿香和蜥蜴的顏色直方圖特征
		 	
		 			 				Table2.
    			Color histogram feature of agastache and lizard
			
						表2
                藿香和蜥蜴的顏色直方圖特征
		 	
		 			 				Table2.
    			Color histogram feature of agastache and lizard
       		
       				3.2 結果分析
判別分析是在分類確定的條件下,根據某一研究對象的各種特征值判別其類型歸屬問題的一種多變量統計分析方法,在各個領域應用廣泛。Bayes判別法,作為判別分析的一種方法既可用于計量資料的兩類判別,也可用于多類判別,在實際工作中普遍使用。Bayes法是對特征分類能力的有效性進行評估的重要方式。Robin等[10-11]在不同復雜度的模型非監督分類中使用Bayes法。因此本文使用Bayes法對實驗結果進行分析。
使用SPSS17.0軟件對數據進行處理,隨機取圖像數據庫中的100張植物藥圖像和100張動物藥圖像進行判別分析,其中包含植物藥八十余種,動物藥五十余種。植物藥中的大多數藥材具有一張圖片,部分藥材具有兩張圖片;動物藥材相對于植物藥材種類較少,故只有五十余種,每種一到三張不等。
判別分析得到貝葉斯線性判別式函數:
| $ \begin{array}{l} {y_1}={0.419_{x1}}-{0.003_{x2}}-{0.041_{x3}}-{0.009_{x4}}+{32.409_{x5}}-13.955\\ {y_2}={0.497_{x1}}-{0.004_{x2}}+{0.24_{x3}}-{0.007_{x4}}+{26.357_{x5}}-11.912 \end{array} $ | 
其中y1、y2表示植物藥和動物藥,x1、x2、x3、x4、x5分別表示均值、方差、歪斜度、峰態、能量。y1、y2的先驗概率同為0.5,即一張藥材圖片,被判別為植物藥材和動物藥材的概率是相等的。
再根據上述判別函數式和先驗概率進行判別分析,進而得到后驗概率,即每個樣品歸屬于每一類的概率,判別準則是按后驗概率的大小歸類[12-13]。
實驗結果顯示,對植物藥圖像的分類準確率達90%,錯判率為10%;對動物藥圖像的分類準確率達70%,錯判率為30%。這初步說明顏色直方圖對于植物藥的分類能力相對較好,對于基于內容的圖像檢索具有一定的意義,結果的差異可能和植物藥的顏色分布較廣有關。但顏色直方圖特征為單一特征,對于圖像的分類有一定的局限性,考慮到可以結合如形狀特征、紋理特征等特征進行研究,故本次研究為今后的研究打下了良好的基礎。
4 結論
圖像特征提取是基于內容檢索的重要環節之一。本文以維吾爾藥圖像為研究對象,從圖像整體入手,提取圖像的顏色直方圖特征,構建了基于維吾爾醫藥材圖像顏色直方圖特征數據庫。根據新疆維吾爾藥材中植物藥圖像和動物藥圖像在顏色分布上的差異,結合藥材圖像的顏色特點,使用顏色直方圖特征提取方法,并且通過統計分析。從實驗結果可以看出,使用顏色直方圖特征對植物藥和動物藥圖像進行分類判別具有較高的準確率。這表明,顏色直方圖特征對維吾爾醫藥材的判別效果相對較好。這為進一步研究維吾爾藥材特征奠定了一定的基礎,也為后續基于內容的新疆維吾爾醫藥材圖像檢索系統研究提供了一定的理論依據。
 
        

 
                 
				 
																   	
                                                                    
                                                                    
																	 
																   	
                                                                    
                                                                    
																	 
																   	
                                                                    
                                                                    
																	