前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇神經網絡提取特征范文,相信會為您的寫作帶來幫助,發現更多的寫作思路和靈感。
關鍵詞 數字識別;圖像預處理;特征提??;神經網絡
引言
目前,識別技術已經廣泛地應用到了各個領域中。為了達到對一幅圖像中的數字進行識別的目的,我們要對圖像進行一些處理,這些處理工作的好壞直接決定了識別的質量,這些處理技術依次為圖像的讀取、對讀取的圖像進行灰度變換、按照量化指標對灰度變換后的圖像進行二值化、然后對二值化后的圖像中的字符信息進行切分等。在進行完上述預處理工作后進行特征提取,再輸入到已經訓練好的BP網絡進行識別。
1 識別的流程
識別的流程按照引言中的步驟進行,主要分為兩大部分,第一部分為圖像的預處理、第二部分為通過神經網絡進行印刷體數字的識別。預處理部分的流程:圖像輸入-灰度變換-圖像二值化-緊縮重排-歸一化調整-圖像分割-特征提取。神經網絡數字識別的具體流程:樣本訓練-字符特征輸入-識別并給出結果。
2 基于神經網絡的特征提取算法概述
圖像在經過了前期的預處理后,由原來雜亂無章的字符變為了整齊排列的、大小相同的一列字符,在這里圖像歸一化后的寬度為8像素,高度為16像素,這樣就大大方便了對字符特征的提取。我們把提取的特征存儲在特征向量里,然后把特征向量輸入到神經網絡中,這樣就可以對字符進行識別了。由以上的論述我們可以得出結論,特征提取的算法是整個識別過程的關鍵,它的好壞直接決定了識別的成敗。對圖像中的字符進行特征提取的算法有很多,下面對幾種重要的分別進行介紹。
2.1骨架特征提取法
由于圖像的來源不同,這就使得圖像的線條所使用的像素不同,在圖像上表現出來就是線條的粗細的不同,這樣就使得它們的差別很大。如果我們將不同的圖像統一到相同的像素水平,那么它們的差別也就不那么明顯了。我們使用骨架特征提取算法,就會使得識別具有一定的適應廣度和寬度。
2.2逐像素特征提取法
這種圖像的特征提取算法是最為常用的方法,它的特點是能夠保留圖像中的全部特征信息,不過這種特征提取算法對圖像的噪聲較為敏感,對原始圖像的質量要求較高,它采用逐行掃描的辦法,對圖像進行掃描,為整個圖像建立一個以圖像中的像素個數相同的特征向量矩陣。矩陣值為0或1,圖像中的黑色像素記為1,白色像素記為0。
2.3垂直方向數據統計特征提取法
此算法是對逐像素提取算法的改進,他使得特征向量矩陣的維數降低,便于后期的識別。該算法首先對圖像進行水平掃描,在這一過程中,統計沒一列的黑色像素數,然后進行對圖像進行垂直掃描,并記錄每一行上的黑色像素數,對于一個字符寬度和長度為W和H的字符,他的特征向量的維數就為W+H。
2.4特征點提取法
這一特征提取算法首先對字符進行分割,利用實現設定的四條線將字符分為八個部分,分別統計每個部分中黑色像素的數目,可以得到八個特征。然后統計水平和垂直兩個方向上,穿過四條線的黑色像素數,得到四個特征,最后將整個圖像中黑色像素的數目作為一個特征,一共得到十三個特征。該方法具有很強的適應性,但是由于特征點較少,使得在樣本的訓練過程中很難收斂。
可以看出,識別算法各有特點,根據實踐需要,本識別算法中的特征提取算法采用逐像素特征提取法。原因是這種算法的執行效率高,方法簡單容易實現,且對于神經網絡來說有很快的收斂性,具有較好的訓練效果。
3 BP網絡進行數字識別算法設計
BP網中中各層中的節點數是設計BP網絡最基本的一點,對于神經網絡的輸入層而言,其節點數為經過圖像預處理里后特征向量的維數??梢灾苯永妹總€點的像素值作為特征,這里特征提取采用逐像素提取法,歸一化后圖像的寬度為8,高度為16,因此對于輸入樣本來說,每一個樣本都會由128個特征,因此神經網絡的輸入層的特征數為128。
對于神經網絡內部隱藏層的節點數來說,其節點數沒有特別的規定,總的來說,隱藏層的神經元的數目與神經網絡的精度成正比,與訓練時間成反比。如果神經網絡的神經元設置的過多,會對識別率造成較大影響,使得識別率大幅下降。因此在這里根據多年的實踐經驗在神經網絡的隱藏層選取10神經單元。 對于輸出層而言,要根據設定的輸出標準來確定輸入層的節點數。在本算法中采用8421的編碼進行編碼。對于0-9這十個數字,分別對應十個8421碼,例如,0的8421碼為(0,0,0,0),1的8421碼為(0,0,0,1),依次類推,因此神經元的數目選定為4,就可以表示這十個數字,然而,因為神經元的激勵函數(傳輸函數)是S型函數,期望輸出只能是大于0小于1的數,而不能是1或者0,因此用0.1來代表0,0.9代表1,否則算法將不能收斂。
神經網絡搭建好后,要對神經網絡進行訓練,也就是確定神經網絡中各個參數的權值。本程序的訓練樣為圖片。首先將圖片進行預處理,然后提取特征,將特征值輸入到神經網絡中進行訓練。在這里使用10個字符的圖片進行訓練,在圖片里包含了ARIAL字體0-9十個數字。
通過50個相關訓練樣本進行訓練后,BP網絡對于數字字體的識別率能夠達到百分之九十以上。訓練好的神經網絡就可以對數數據進行識別了。
4結論
本文以VC為平臺,運用人工神經網絡的思想(主要采用BP神經網絡),實現了對印刷體數字識別。系統實現分為圖像預處理和神經網絡識別兩大模塊。首先,掃描進入電腦的圖像需保存為256色位圖或者是256級灰度圖像。首先對圖像進行預處理,然后進行特征提取,再輸入BP網絡進行識別。BP神經網絡進行字符識別的過程主要包括網絡的訓練、數據的讀取、字符的判定、結果的輸出等。本系統通過對樣本數據進行學習和訓練,形成了具有良好識別能力的網絡,對印刷體數字進行識別檢測,達到了一定的準確度,滿足了設計要求。
參考文獻
【關鍵詞】PCA神經網絡算法閾值區低功耗低面積積分器
一、引言
本文中為實現植入式的腦電信號特征提取,而設計的一種基于模擬模塊的硬件實現方法,實現對神經spike信號的神經網絡算法的特征提取的PCA2-1網絡,本文的神經網絡算法的硬件完全采用模擬電路來實現,以滿足植入式的芯片,需要具有低功耗,低面積的特點。本文中的特征提取選擇了主成分分析法(PCA),采用基于PCA算法的全模擬電路實現架構,由具有足夠線性范圍的模擬乘法器,基于亞閾值區的積分器,合理的加法器模塊,來實現設計低功耗,低面積的神經信號處理電路。最終驗證通過模擬電路實現的神經特征提取電路的權值變化和MATLAB計算出的權值變化相一致,以此來證明該系統的正確性。
二、PCA神經網絡
主分量分析的目的在于減少數據維數。其基本思想是提取出空間數據中的主要特征(主分量),減少數據冗余,去掉數據相關性,使得數據能夠在一個低維空間來處理。它確定一個方向向量w,使得輸入向量x在該方向上的投影y=wTx的方差最大。PCA神經網絡克服了傳統方法的缺點,它通過學習自動收斂到主分量方向而不用計算相關矩陣[2]。本文中的實現PCA的神經網絡為一個單層的前向網絡。
本文中的基于神經網絡的PCA的算法實現步驟如下:
(1)在t=1時,用小的隨機數賦給主元神經網絡的權值,另權值修正系數為一小的正數;
(2)對于在t=1,從訓練樣本集中選取樣本輸入網絡,計算:
由于積分器的輸出是權值w,所以對輸出幅度有較高要求。本文采用的積分器的OTA為兩個單端輸出的鏡像電流源結構。這樣輸出的幅度是全差分雙端輸出的2倍。而且兩個單端輸出很好的提高了電路的共模抑制比CMRR。OTA的輸出級為共源共柵的結構,這讓OTA的輸出
圖3為對輸入數據進行長時間的仿真后數據的圖像特性,可以看出w的值有很好的收斂特性。
三、總結
PCA算法在噪聲比較大的情況下容易聚類失敗,而本文中的系統是作為已經實現的低噪聲放大器和NEO信號去噪檢測之后的一級,所以選取PCA作為特征提取的方法是可行的。本文設計了一種基于神經網絡算法的信號特征提取的硬件實現,采用了完全的模擬電路來實現。并根據算法的特點,合理的選擇和改進積分器電路和乘法器電路的拓撲結構,來實現電路的功能。并實現了系統的低功耗,低面積的特點。有利于集成于植入式系統的實現。通過對輸入一組方波數據的仿真,通過短時間來驗證瞬態輸出的準確性,而長時間的仿真來驗證該系統可有效的讓權值w收斂。
參考文獻
[1] Hongge Li, Zhao Wei, Zhang Youguang. Micropower fully integrated CMOS readout interface for neural recording application[J]. 2010, 50(2): 273-281.
[2] Oja E. Principal Components, Minor Components, and Linear Neural Networks[J]. Neural Networks, 1992,5(6):927-935.
關鍵詞關鍵詞:深度學習;卷積神經網絡;古玩圖片;圖像識別
DOIDOI:10.11907/rjdk.162768
中圖分類號:TP317.4
文獻標識碼:A文章編號文章編號:16727800(2017)005017405
0引言
隨著電子商務的發展,大批藝術品交易網站隨之興起,藏品交易規模也越來越大。而當前的古玩網上交易平臺還不能夠實現對現有藏品圖片的自動分類,客戶在尋找目標藏品時不得不在眾多圖片中一一瀏覽。因此需要一種有效的方法來完成面向圖像內容的分類。
在基于內容的圖像檢索領域,常使用人工設計的特征-如根據花瓶、碗、盤子的不同形態特征:目標輪廓的圓度、質心、寬高比等[1],繼而使用BP神經網絡、SVM分類器等對特征進行學習分類。文獻[2]基于植物葉片的形狀特征,如葉片形狀的狹長度、矩形度、球狀性、圓形度、偏心率、周長直徑比等,利用BP神經網絡實現對植物葉片進行分類。文獻[3]研究印品圖像的各類形狀缺陷,利用圖像缺陷形狀的輪廓長度、面積和圓形度等幾何特征,導入SVM分類器進行訓練,得到分類器模型實現分類。文獻[4]提出了一種基于Zernike矩的水果形狀分類方法,通過提取圖像中具有旋轉不變性的Zernike矩特征,并運用PCA方法確定分類需要的特征數目,最后將這些特征輸入到SVM分類器中,完成水果形狀的分類。上述方法都要求對目標形狀分割的準確性,而分割過程中由于存在目標陰影、目標分割不完整問題,會影響到人工特征的準確選取。除了上述人工特征外,最常用的特征是HOG[5,6]、SIFT[7,8]等。HOG的核心思想是所檢測的局部物體外形能夠被光強梯度或邊緣方向的分布所描述。HOG表示的是邊緣結構特征,因此可以描述局部形狀信息。SIFT在圖像的空間尺度中尋找極值點,并提取出其位置、尺度、旋轉不變量。SIFT特征對于旋轉、尺度縮放、亮度變化保持不變。但是,這兩種特征在實際應用中,描述子生成過程冗長、計算量太大。而且在上述方法征設計需要啟發式的方法和專業知識,很大程度上依靠個人經驗。
卷積神經網絡不需要手動設計提取特征,可以直接將圖片作為輸入,隱式地學習多層次特征,進而實現分類[9]。相比目前常用的人工設計特征然后利用各分類器,具有明顯的優勢。近年來,卷積神經網絡已成為語音、圖像識別領域研究熱點。它的權值共享特點使得網絡復雜度降低,權值數量減少。而且,卷積神經網絡直接將圖片作為輸入,避免了復雜的特征設計和提取,具有一定的平移、縮放和扭曲不變性[10]。本文采用卷積神經網絡對古玩圖片進行分類。首先,將背景分離后的圖片作為網絡的輸入,相比原圖作為輸入,此方法的網絡結構更加簡單。然后,卷積層通過不同的卷積核對輸入圖片進行卷積得到不同特征圖,采樣層進一步對特征圖進行二次提取,最終提取到合適的特征輸入分類器進行分類,而在卷積層、采樣層征圖的大小、數目都會影響到網絡的分類能力。因此,本文通過優化網絡參數,使網絡達到較好的分類效果。
1卷積神經網絡
1989年,LECUN等[11]提出了卷積神經網絡(Convolution Neural Networks,CNN),CNN是一種帶有卷積結構的深度神經網絡,一般至少有2個非線性可訓練的卷積層、2個非線性的固定采樣層和1個全連接層,一共至少5個隱含層[12]。百度于2012年底將深度學習技術成功應用于自然圖像OCR識別和人臉識別,此后深度學習模型被成功應用于一般圖片的識別和理解。從百度經驗來看,深度學習應用于圖像識別不但大大提升了準確性,而且避免了人工特征抽取的時間消耗,從而大大提高了在線計算效率[13]。
卷積神經網絡作為一種高效的深度學習方法[14],在許多圖像識別方面取得了很好的成效[1519]。該網絡作為一種多隱層神經網絡,可以提取圖像的多層次特征進行識別。
卷積神經網絡主要包括卷積層和采樣層,卷積層通過可學習的卷積核對輸入圖片進行卷積得到特征圖,卷積操作即加強了輸入圖片的某種特征,并且降低噪聲。卷積之后的結果通過激活函數(通常選擇Sigmoid函數或Tanh函數)作用輸出構成該層的特征圖。特征圖上的每一個神經元只與輸入圖片的一個局部區域連接,每個神經元提取的是該局部區域的特征,所有神經元綜合起來就得到了全局特征,與神經元相連接的局部區域即為局部感受野[20]。而在卷積層中一般存在多張特征圖,同一張特征圖使用相同的卷積核,不同特征圖使用不同的卷積核[21],此特點稱為權值共享,即同一張特征圖上的所有神經元通過相同的卷積核連接局部感受野。卷積神經網絡的局部感受野和嘀倒蠶硤氐憒蟠蠹跎倭送絡訓練的參數個數,降低了網絡模型的復雜度。
采樣層對卷積層提取到的特征圖進行局部非重疊采樣,即把特征圖分為互不重疊的N×N個子區域,對每個子區域進行采樣。卷積神經網絡的采樣方式一般有兩種:最大值采樣和均值采樣。最大值采樣即選取區域內所有神經元的最大值作為采樣值,均值采樣為區域內所有神經元的平均值作為采樣值。最大值采樣偏向于提取目標的特征信息,而均值采樣偏向于提取背景的特征信息[22]。采樣后的特征平面在保留了區分度高特征的同時大大減少了數據量,它對一定程度的平移、比例縮放和扭曲具有不變性。
卷積神經網絡通過卷積層和采樣層的循環往復提取到圖像由低層次到高層次的特征,最后一般通過全連接層將所有特征圖展開得到一維向量,然后輸入到分類器進行分類。
卷積神經網絡在處理二維圖像時,卷積層中每個神經元的輸入與上一層的局部感受野相連接,并提取該局部的特征,權值共享特點又使得各神經元保持了原來的空間關系,將這些感受不同局部區域的神經元綜合起來就得到了全局信息。采樣層對特征圖進行局部特征提取,不會改變神經元之間的空間關系,即二維圖像經過卷積層、采樣層仍然保持二維形式。因此,卷積神經網絡有利于提取形狀方面的特征。雖然卷積神經網絡的局部感受野、權值共享和子采樣使網絡大大減少了需要訓練參數的個數,但是該網絡作為多隱層神經網絡還是十分復雜的。對于不同的數據庫,為了達到比較好的分類效果,網絡的層數、卷積層特征圖個數以及其它參數的設置都需要探究。
2基于卷積神經網絡的古玩圖片分類
2.1特征提取及傳遞
不同古玩的主要區別在于形狀不同,而花瓶、盤子和碗在古玩中最常見,因此將這3類圖片作為實驗對象,對于其它種類的古玩圖片的分類,該網絡同樣適用。卷積神經網絡采用如下圖所示的5層網絡結構,并對網絡各層的特征圖數目、大小均作了修改。對于網絡的輸入,先將原圖像進行目標與背景分割,然后進行灰度化、統一分辨率的處理,最后輸入到卷積神經網絡。由于訓練卷積神經網絡的根本目的是提取不同古玩的特征,而背景不是目標的一部分,對古玩識別來說并不提供任何有用的信息,反而對特征的提取造成干擾,所以去除背景噪聲后,網絡結構會更加簡單,同時也利于網絡對特征的學習。但是因為進行了去背景的預處理,網絡也失去了對復雜背景下圖片的識別能力,所以使用該網絡進行古玩圖片分類前都要進行目標分割的預處理過程。
卷積神經網絡對古玩圖片的特征提取過程如下:
(1)輸入網絡的圖片為100×100大小的預處理圖,卷積神經網絡的輸入層之后為卷積層,卷積層通過卷積核與輸入圖像進行卷積得到特征平面,卷積核大小為5×5。如圖2所示,特征平面上每個神經元與原圖像5×5大小的局部感受野連接。卷積核移動步長為1個像素,因此卷積層C1的特征平面大小為96×96。這種卷積操作在提取到輸入圖像的某一方面特征時,必然會損失掉圖像的其他特征,而采取多個卷積核卷積圖像得到多個特征平面則會一定程度上彌補這個缺陷。因此,在卷積層C1中使用了6個不同的卷積核與輸入圖像進行卷積,得到6種不同的特征平面圖。如圖3所示,同一張特征圖上的所有神經元共享一個卷積核(權值共享),圖中連接到同一個特征圖的連接線表示同一個卷積核,6個不同的卷積核卷積輸入圖片得到6張不同的特征平面圖。卷積之后的結果并非直接儲存到C1層特征圖中,而是通過激活函數將神經元非線性化,從而使網絡具有更強的特征表達能力。激活函數選擇Sigmoid函數。
卷積層中所使用的卷積核尺寸若過小,就無法提取有效表達的特征,過大則提取到的特征過于復雜。對于卷積層征圖個數的設置,在一定范圍內,特征圖的個數越多,卷積層提取到越多有效表達原目標信息的特征,但是特征圖個數如果過多,會使提取到的特征產生冗余,最終使分類效果變差。卷積層的各平面由式(1)決定: Xlj=f(∑i∈MjXl-1j*klij+blj)(1)
式(1)中,Mj表示選擇輸入的特征圖集合,l是當前層數,f是激活函數,klij表示不同輸入特征圖對應的卷積核,blj為輸出特征圖對應的加性偏置。
(2)卷積層C1后的采樣層S1由6個特征平面組成,采樣層對上一層特征圖進行局部平均和二次特征提取。采樣過程如圖4所示,特征平面上的每個神經元與上一層4×4大小的互不重合的鄰域連接進行均值采樣,最終每個平面的大小為24×24。采樣層的各平面由式(2)決定:
Xlj=f(βljdown(Xl-1j)+blj)(2)
式(2)中,down(.)表示一個下采樣函數,l是當前層數,f是激活函數,βlj表示輸出特征圖對應的乘性偏置,blj為輸出特征圖對應的加性偏置。
(3)卷積層C2與C1層操作方式一樣,唯一區別的是C2層每個特征圖由6個不同的卷積核與上一層6個特征圖分別卷積求和得到,因此C2層一共有6×6個不同的卷積核,卷積核大小為5×5,C2層每個平面大小為20×20,共6個特征平面。
(4)采樣層S2與S1層操作一樣,對上一層4×4大小鄰域進行均值采樣,輸出6個5×5大小的特征平面。本文所用的網絡共包括2個卷積層、2個采樣層、1個全連接層,由于輸入圖片已經過背景分離的預處理,采樣層S2特征圖大小為5×5,所以圖1所示5層網絡已經有很好的表達能力。如果直接將原圖作為輸入,那么網絡的層數以及特征圖的個數將比圖1所示的網絡更加復雜。
(5)全連接層將上一層6個5×5大小的二維平面展開成為1×150大小的一維向量輸入Softmax[23]分類器,輸出層一共有3個神經元(即分類的種類數目),分類器將提取到的特征向量映射到輸出層的3個神經元上,即實現分類。
2.2網絡訓練
訓練方式為有監督地訓練,網絡對盤子、花瓶和碗共三類圖片進行分類,所以分類器輸出一個3維向量,稱為分類標簽。在分類標簽的第k維中1表示分類結果,否則為0。訓練過程主要分為兩個階段:
第一階段:向前傳播A段。
將預處理過的圖片輸入卷積神經網絡計算得到分類標簽。
第二階段:向后傳播階段。
計算輸出的分類標簽和實際分類標簽之間的誤差。根據誤差最小化的原則調整網絡中的各個權值。分類個數為3,共有N個訓練樣本。那么第n個樣本的誤差為:
En=12∑3k=1(tnk-ynk)2(3)
式(3)中,tn表示第n個樣本的網絡輸出標簽,tnk對應標簽的第k維,yn表示第n個樣本的實際分類標簽,ynk對應標簽的第k維。為了使誤差變小,利用權值更新公式(4)更新各層神經元的權值,一直訓練直到網絡誤差曲線收斂。
W(t+1)=W(t)+η?δ(t)?X(t)(4)
式(4)中,W(t)表示算第n個樣本時的權值,W(t+1)表示計算第n+1個樣本的權值,η為學習速率,選取經驗值,δ為神經元的誤差項,X表示神經元的輸入。
3實驗結果及分析
實驗在MatlabR2012a平臺上完成,CPU 2.30GHz,內存4GB,所采用的圖像由相關古玩網站提供,分辨率統一格式化為100×100。由于盤子、花瓶和碗在各種古玩種類中它們之間的形狀差別比較明顯,本文實驗對這三類古玩圖片進行分類。對古玩圖片進行了水平翻轉處理,增加圖片數據量,以加強網絡對古玩圖片分類的魯棒性。實驗數據如表1所示,圖5列出了3類圖片的部分樣本,實驗所用圖片均與圖5所示圖片類似,背景比較單一,少數圖片下方有類似陰影。
為了形象表示網絡各層提取的不同特征,圖6展示了當網絡輸入為盤子時的各層特征圖。卷積層C1中6張特征圖分別提取到了輸入圖片的不同特征,而由于權值共享,同一張特征圖中神經元的空間關系保持不變,所以6張特征圖都抓住了盤子的圓形特征。采樣層S1對C1進行均值采樣,相當于模糊濾波,所以S1層各特征圖看起來模糊了一些。卷積層C2中每張特征圖由6個不同的卷積核卷積S1層各特征圖疊加而成,S2層與S1層處理方式相同。
為了說明將背景分離后的圖片作為輸入的網絡與原圖輸入的網絡之間的差異,設計了如表3所示的兩種網絡結構,網絡CNN4只需要4層網絡層就可以達到0.19%的錯誤率,而原圖作為輸入的CNN8共6層網絡層,在網絡達到收斂的情況下,錯誤率為5.24%。由此可以說明,將背景分離后圖片作為輸入的網絡結構更加簡單。
網絡的訓練采用了批量訓練方式,即將樣本分多批,當一批樣本前向傳播完之后才進行權值更新,每批大小為100,訓練集共2 200張圖片,網絡迭代次數為1時共進行22次權值更新,所以權值更新的計算次數與迭代次數有如下關系:
計算次數=22×迭代次數(5)
圖7為網絡在訓練集上的誤差曲線圖,橫坐標為誤差反向傳播的計算次數,縱坐標為訓練集上的均方誤差。可以看出,當網絡訓練次數達到270次(計算次數約6 000)時,訓練集誤差趨于平緩,網絡已經基本擬合。訓練好的網絡可以用來對測試集圖片進行分類,表4為不同迭代次數下訓練的網絡在測試集上的分類錯誤率,可以看出迭代次數在達到270次后,網絡在測試集的錯誤率收斂,此時只有2張圖片出現分類錯誤。
表5給出了圖像分類算法中常用的人工特征+BP神經網絡、人工特征+SVM分類器以及Hog特征+SVM分類器與CNN方法的性能比較。人工設計的特征包括圖片中目標輪廓的最大長寬比、質心、圓度等特征。從準確率方面來看,CNN方法的準確率高于其他方法,Hog特征方法的準確率遠遠高于人工特征的方法,說明了特征的好壞對圖像分類效果有著很大程度上的影響,CNN提取到的特征比Hog和人工設計的特征更具代表性。從測試時間來看,Hog方法與CNN方法相差不多,采用人工特征的方法時間最長。綜合兩個方面,CNN方法在測試時間和HOG方法相近的情況下,準確率最高。
4結語
針對網上古玩圖片分類問題,為了克服現有算法中人工設計特征困難以及往往依賴個人專業經驗的不足,提出一種基于卷積神經網絡的方法。將背景分離后的目標圖片作為網絡輸入,可以實現自動提取特征進行分類,背景分離后圖片作為網絡輸入使得網絡結構更加簡單,并且設置了合適的特征圖個數以使網絡在古玩圖片集上取得較好的分類準確率。實驗數據表明,該方法能夠解決網上古玩圖片的分類問題,并且分類準確率達到99%,其準確率優于常用的Hog特征以及人工特征方法。另外該方法不僅可以應用于網上古玩圖片,還可應用于鞋類、服裝等其它商品圖像的分類。
參考文獻參考文獻:
[1]K KAVITHA,M.V.SUDHAMANI.Object based image retrieval from database using combined features[C].in Signal and Image Processing (ICSIP),2014.
[2]董紅霞,郭斯羽,一種結合形狀與紋理特征的植物葉片分類方法[J].計算機工程與應用,2014,50(23):185188.
[3]舒文娉,劉全香,基于支持向量機的印品缺陷分類方法[J].包裝工程,2014,35(23):138142.
[4]應義斌,桂江生,饒秀勤,基于Zernike矩的水果形狀分類[J].江蘇大學學報:自然科學版,2007,28(1):3639.
[5]ZHU Q,YEH M C,CHENG K T,et al.Fast human detection using acascade of histograms of oriented gradients[C].Proceedings of the 2006 IEEE Computer Society Conference on Computer Vision and Pattern Recognition,2006.
[6]M VILLAMIZAR,J SCANDALIANS,A SANFELIU bining colorbased invariant gradient detector with Hog descriptors for robust image detection in scenes under cast shadows[C].In Robotics and Automation,ICRA IEEE International Conference on.Barcelona,Spain:IEEE,2009.
[7]CHEN J,LI Q,PENG Q,et al.CSIFT based localityconstrained linear coding for image classification[J].Formal Pattern Analysis & Applications,2015,18(2):441450.
[8]AHMAD YOUSEF K M,ALTABANJAH M,HUDAIB E,et al.SIFT based automatic number plate recognition[C].International Conference on Information and Communication Systems.IEEE,2015.
[9]LAWRENCE S,GLIES C L,TSOI A C,et al.Face recognition:a convolutional neuralnetwork approach[J].IEEE Transactions on Neural Networks,1997,8(1):98113.
[10]TREVOR HASTIE,ROBERT TIBSHIRANI,J FRIEDMAN.The elements of statistical learning[M].New York:Springer,2001.
[11]Y LECUN,L BOUOU,Y BENGIO.Gradientbased learning applied to document recognition[J].Proceedings of the IEEE,1998,86(11):22782324.
[12]DAHL J V,KOCH K C,KLEINHANS E,et al.Convolutional networks and applications in vision[C].International Symposium on Circuits and Systems (ISCAS 2010),2010:253256.
[13]余凱,賈磊,陳雨強,等.深度學習的昨天、今天和明天[J].計算機研究與發展,2013(09):17991804.
[14]MAIRAL J,KONIUSZ P,HARCHAOUI Z,et al.Convolutional kernel networks[DB/OL].http:///pdf/1406.3332v2.pdf.
[15]Z世杰,楊東坡與劉金環,基于卷積神經網絡的商品圖像精細分類[J].山東科技大學學報:自然科學版,2014(6):9196.
[16]程文博等,基于卷積神經網絡的注塑制品短射缺陷識別[J].塑料工業,2015(7):3134,38.
[17]鄧柳,汪子杰,基于深度卷積神經網絡的車型識別研究[J].計算機應用研究,2016(4):14.
[18]T JONATAN,S MURPHY,Y LECUN,et al.Realtime continuous pose recovery of human hands using convolutional networks[J].ACM Transaction on Graphics,2014,33(5):3842.
[19]S SKITTANON,A C SURENARAN,J C PLATT,et al.Convolutional networks for speech detection[C].Interspeech.Lisbon,Portugal:ISCA,2004.
[20]HUBEL D H,WIESEL T N.Integrative action in the cat's lateral geniculate body[J].Journal of Physiology,1961,155(2):385398.
[21]JAKE BOUVRIE.Notes on convolutional neural networks[DB/OL].http:///5869/1/cnn_tutorial.pdf.
關鍵詞 滾動軸承 狀態監測 MATLAB BP神經網絡
中圖分類號:TH133 文獻標識碼:A
1 監測軸承的意義和重要性
滾動軸承是各種旋轉機械中應用最廣泛的一種通用機械部件,它們在旋轉機械中起著關鍵的作用,旋轉機械的故障30%是由滾動軸承故障引起的,其運行狀態的正常與否直接影響到整臺機器的性能(包括精度、可靠性及壽命等)。因此,及時發現滾動軸承的故障并消除,能有效保證機器正常運轉,提高使用壽命。
2 常見軸承故障
滾動軸承在工作過程中,常見的軸承故障可總結為損傷和磨損兩大類。損傷類故障有疲勞剝落、塑性變形、軸承燒傷、銹蝕 、斷裂、膠合六種;磨損類故障為軸承長期正常工作引起的漸變性故障。
(1)疲勞剝落
在工作中,軸承滾子和滾道接觸面相對滾動的同時又互相擠壓,軸承部件接觸面將產生小的剝落坑,最終發展為大面積剝落,該現象稱作疲勞剝落。
(2)塑性變形
當工作載荷過重時,由于滾 動 軸 承 承受 的 過 大 的 沖 擊 力 和 靜 載 荷 的 原 因 ,軸承滾道的表面上形成的不均勻凹坑,這種現象主要發生在低速旋轉的軸承上。
(3)斷裂
過大的負荷和工作過程中摩擦產生的熱應力過大時能引起軸承零件斷裂。
(4)軸承燒傷
軸承不良、應用變質的油、裝配過緊或存在較大偏斜量能引起軸承的燒傷。
(5)膠合
軸承在高速高負荷和欠缺的情況下,摩擦產生的熱量能使軸承部件迅速升溫,到達一定溫度時能引起軸承部件接觸的金屬表面相互粘接,該現象稱作膠合。
3 常用的滾動軸承監測數據分析手段
利用振動信號對故障進行診斷,是設備故障診斷方法中有效且常用的方法。機械設備和機構系統在運行過程中的振動及其特征信息是反映系統狀態及其變化規律的主要信號。通過各種動態測試儀器提取、記錄和分析動態信息,是進行系統狀態監測和故障的主要選徑。常用的信號處理方法主要有時域分析、頻域分析和小波分析等。
4 信號采集和特征值提取
通過加速度傳感器可提取到振動信號。滾動軸承的振動信號的特征包括時域和頻域特征,這些特征的合理組合能夠很好的反應滾動軸承的運行狀態,實現對其的監測,并能通過進一步處理實現故障的識別。時域特征可包含信號的能量、波動性等信息,但遠遠不足以準確判斷故障所在;頻域的特征則是更加明顯。然而只有兩累特征綜合來判斷才能對故障進行準確識別。
對時域和頻域的各個參數分別進行分析,從中抽取特征,可用作模式識別的輸入量。特征選取依據以下原則:(1)同種狀態信號的特征重復性好;(2)不同種狀態信號的特征差異性好,即當被監測對象狀態發生改變時,特征值會明顯改變。
5 神經網絡的模式識別
5.1 人工神經網絡的基本原理
(1)人工神經元模型
最早提出神經元模型并且影響較人的是1943年心理學家在分析總結神經元基本特性的基礎上首先提出的MP模型。人工神經元模型是由大量處理單元廣泛互連而成的網絡,是人腦的抽象、簡化、模擬,反映人腦的基本特性。
(2)人工神經網絡結構。
神經網絡常分成兩大類:沒有反饋的前向神經網絡和相互結合型網絡,如圖4.1所示。
前向神經網絡由輸入層、一層或多層的隱含層和輸出層組成,每一層的神經元只接受前一層神經元的輸出。相互連接是指網絡中任意兩個單元之間都是可達的,即存在連接路徑。
5.2 BP神經網絡
(1)BP神經網絡的結構
BP神經網絡,即多層前饋式誤差反傳神經網絡,通常由輸入層、輸出層和若干隱含層構成:每一層都由若干個節點組成,每一個節點表示一個神經元,上層節點與下層節點之間通過權值連接,層與層之間的節點采用全互聯的連接方式。神經網絡的結構圖如下所示:
(2)網絡參數的確定
①網絡層數的確定
BP網絡是通過輸入層到輸出層的計算來完成的。多一層的隱含層雖然能提高網絡的訓練速度,但是需要較多的訓練時間,而訓練速度可以用增加隱含層節點個數來實現,因此在應用BP神經網絡時,選取只有一個隱含層的三層BP神經網絡就足夠了。
②輸入、輸出層神經元個數的確定
輸入層的神經元個數就是提取到的有效特征值的個數;輸出層神經元的個數要看問題模式的種類數,監測軸承的好壞有正常與故障兩種模式,故輸出層神經元的個數為1。當輸出為1時表示該軸承為正常軸承,輸出為0時表示該軸承為故障軸承。
③隱層神經元個數的確定
隱層神經元個數的確定比較復雜。在具體設計時,首先根據經驗公式初步確定隱含層神經元個數,然后通過對網絡進行訓練對比,再最終確定神經元數。通用的隱含層神經元數的確定經驗公式有:
其中為隱含層神經元的個數,n為輸入層神經元的個數,m為輸出層神經元的個數,a為常數且1 < a < 10。
6 結束語
通過對軸承特征值的提取,提取到了重復性好、差異性好的有效特征值。利用神經網絡模式對軸承的工作狀態進行有效的識別,將歸一化處理后的有效特征值作為神經網絡的輸入參數輸入,用實驗所測得的數據對BP神經網絡進行訓練,從而達到軸承狀態識別的目標。
參考文獻
[1] 雷建中,張增岐.國內外軸承廢品及失效分析.NSTL期刊,2010.7.
[2] 武棟梁.滾動軸承常見故障及其振動信號特征.中國航空導彈研究院,2012.6
[3] 蘇寶定.滾動軸承振動檢測與智能診斷系統研究.大連理工大學,2008.12
[4] 常文龍,胡朋.滾動軸承運行狀態智能化監測.科教導刊,2013.3
【關鍵詞】 RBF 混沌 模糊 指紋識別 模式識別
指紋識別技術,可稱為人體密碼,是模式識別領域中使用最早的,也是最為成熟的生物鑒定技術,它是集傳感器技術、生物技術、電子技術、數字圖像處理、模式識別于一體的高新技術[1]微軟公司在新一代操作系統Windows Vista中,把指紋識別作為身份驗證方式之一。指紋識別技術的核心是指紋識別算法,可以把識別算法大致分為3個步驟:圖像預處理、指紋特征提取和指紋特征比對[2](包括驗證和辨識[3])。目前不少研究將神經網絡用于指紋識別,提高了指紋識別性能。文獻[4]提出了一種基于LVQ神經網絡指紋識別方法,由于LVQ神經網絡自身的自組織和聚類特性,可以很好地給出模式在多維空間的概率分布估計,從而可較好地完成指紋的識別。文獻[5]介紹了一種基于DHNN(離散型Hopfield 神經網絡)的識別技術,運用DHNN的聯想記憶功能來識別指紋特征。不少研究將神經網絡與模糊理論相結合[6,8],提高了神經網絡在指紋識別領域的研究水平。本文提出一種基于混沌模糊RBF神經網絡的算法,并應用到指紋識別中。將混沌理論引入神經網絡的構造,利用混沌對初值的極端敏感依賴性,從而可能對僅有微小差別的模式進行識別,由于引入了混沌噪聲,可使網絡具有很強的抗干擾能力,有效避免了復雜的特征提取工作。將模糊理論應用于RBF神經網絡設計,提高了神經網絡的學習泛化能力,能較好地逼近實際模型。應用混沌模糊RBF網絡進行指紋識別,結合了模糊函數、混沌和神經網絡的各自優點,得到了較滿意的識別效果。仿真實驗表明,該算法精度高、迭代步驟少、收斂快,混沌模糊RBF神經網絡應用于指紋識別是有效的,能提高識別率。該算法不僅可以保證對指紋樣本的正確分析,同時可以保證識別速度。將算法應用于電力企業集成管理,保證了安全生產和優化管理的目標,獲得了良好的應用價值。
1 RBF神經網絡
徑向基網絡是前饋網絡中完成映射功能最優的網絡,具有很好的模式分類和函數逼近能力。典型結構為兩層網絡。