- 相關(guān)推薦
人工免疫系統在手寫(xiě)希臘字符識別中的應用
摘 要:基于自然免疫系統的人工免疫系統是人工神經(jīng)網(wǎng)絡(luò )和進(jìn)化計算之后的新型計算智能,以其強大的信息處理和問(wèn)題解決能力被廣泛應用到眾多領(lǐng)域。本文提出了基于人工免疫系統的手寫(xiě)希臘字符識別策略并進(jìn)行了實(shí)驗仿真。利用3*3子網(wǎng)格算法對24*24字符圖像樣本提取64個(gè)特征參數,通過(guò)人工免疫算法訓練圖像樣本,建立24個(gè)抗體庫用于識別手寫(xiě)希臘字符。另外,利用BP神經(jīng)網(wǎng)絡(luò )進(jìn)行了對比實(shí)驗。實(shí)驗結果表明,人工免疫系統模型在手寫(xiě)希臘字符識別中較BP神經(jīng)網(wǎng)絡(luò )具有更大的優(yōu)勢。
【關(guān)鍵詞】模式識別 人工免疫系統 BP神經(jīng)網(wǎng)絡(luò ) 子網(wǎng)格
1 引言
希臘字母廣泛應用于數學(xué)、物理、生物和天文學(xué)中,手寫(xiě)希臘字母的識別對于手寫(xiě)公式識別是非常重要的。然而,目前手寫(xiě)識別的相關(guān)研究主要集中在數字、英文字符、中文字符、阿拉伯字符的手寫(xiě)識別中,手寫(xiě)希臘字母還沒(méi)有很好的識別算法。因此,它的研究具有重要的理論和實(shí)踐價(jià)值。
人工免疫系統是基于脊椎動(dòng)物免疫系統處理過(guò)程的計算系統,通過(guò)改變系統結構和函數增強其適應性。免疫算法應用了免疫系統的學(xué)習和記憶特征,因此廣泛用于解決數學(xué)、工程、信息技術(shù)等領(lǐng)域的計算問(wèn)題。
本文將人工免疫系統用于識別手寫(xiě)希臘字符識別并取得了較好的效果。
2 手寫(xiě)希臘字符預處理
預處理是字符識別重要過(guò)程,有助于特征提取、提高識別正確率和識別效率。
本文對24個(gè)手寫(xiě)希臘字母進(jìn)行了初步識別。1680個(gè)原始字符圖像由70個(gè)學(xué)生完成,即每個(gè)字符類(lèi)別為70個(gè)樣本。
預處理被應用于圖像樣本以消除與字符分類(lèi)不相關(guān)因素的影響。首先,利用3*3 KNN 平滑濾波器進(jìn)行去噪,使圖像的特征信息更加突出。其次,對手寫(xiě)圖像樣本進(jìn)行歸一化。歸一化方式包括位置、大小和灰度,使用線(xiàn)性拉伸與壓縮算法,將字符圖像歸一化為24*24。歸一化后,利用Pavlidis 算法盡可能地將字符比劃的寬度降低到一個(gè)像素。最后,使用閾值算法將圖像進(jìn)行二值化。
3 手寫(xiě)希臘字符特征提取
目前存在很多圖像特征提取方式,提取方式的選擇對于識別效果是至關(guān)重要的。本文采用了網(wǎng)格特征提取用于手寫(xiě)希臘字符識別。
網(wǎng)格特征廣泛應用于字符識別。網(wǎng)格有兩種應用方式:彈性網(wǎng)格和固定網(wǎng)格。對于固定網(wǎng)格,字幅圖像被分割為多個(gè)固定大小的子網(wǎng)格。彈性網(wǎng)格中,根據像素分布概率動(dòng)態(tài)決定網(wǎng)格線(xiàn)的位置,該方式被廣泛應用于漢字識別。
本文采用固定網(wǎng)格進(jìn)行特征參數的提取,子網(wǎng)格的大小分別為2*2、3*3 和 4*4,并進(jìn)行了編程實(shí)驗測試。根據實(shí)驗結果、AIS的自適應性、學(xué)習能力和計算效率,3*3子網(wǎng)格被用于特征提取更有利于實(shí)現字符分類(lèi),即使用3*3子網(wǎng)格從左到右、從上到下對24*24二進(jìn)制手寫(xiě)字符圖像進(jìn)行掃描,系數即為3*3網(wǎng)格內的像素值之和,由此可得到64個(gè)特征系數。圖1即為從α、β、ε、Ψ和φ的350個(gè)字符樣本中隨機抽取的5個(gè)字符樣本的64個(gè)特征系數。圖a為在灰度值小于128時(shí)像素值為1、否則為0的二值化后子網(wǎng)格內像素值的累加,圖b則為在灰度值小于128時(shí)像素值為0、否則為1的二值化后子網(wǎng)格內像素值的累加。
由圖可知,以灰度值小于128時(shí)像素值為1、否則為0的二值化后的3*3子網(wǎng)格提取的64個(gè)系數可較好地實(shí)現字符分類(lèi)。
4 基于A(yíng)IS的手寫(xiě)希臘字符識別
基于A(yíng)IS的手寫(xiě)希臘字符識別中,經(jīng)人工免疫算法訓練,可得到24個(gè)字符識別模式庫,即抗體庫?贵w和抗原由源自3*3子網(wǎng)格的64個(gè)特征系數構成,抗體是AIS訓練樣本,抗原是需要識別的字符。所有的抗體庫都可用于識別輸入樣本。
4.1 親和度函數
抗體與抗原的親和度函數描述的是兩者的匹配性,親和度與它們的距離成反比。本文將歐氏距離的倒數被定義為親和度函數。
抗體之間的親和度函數指的是抗體之間的相似性,表明抗體的多樣性。其親和度函數同上。
4.2 利用人工免疫算法構建抗體庫
模擬生物免疫系統的抗體與抗原識別關(guān)系的人工免疫算法用于建立抗體庫以識別手寫(xiě)希臘字符。每個(gè)分類(lèi)庫的建立步驟如下:
步驟1初始化:從每個(gè)字符類(lèi)別的70個(gè)樣本中隨機抽取50個(gè)樣本作為抗原和抗體,其中,20個(gè)為初始抗體庫A,30個(gè)為抗原集;剩余的樣本用于測試。最大重復步數為50。
步驟2 親和度計算、交叉與變異概率的確定:依據定義的親和度函數,抗體與抗原、抗體與抗體的親和度分別計算出來(lái)。由于抗體庫中的兩個(gè)抗體不可能完全匹配,因此親和度不可能為1。如果親和度為1,一個(gè)抗體必須被剔除,重新選擇抗體補充到抗體庫中。如果抗體與相似字符的抗原的平均親和度大于設定的閾值,該抗體就會(huì )被刪除,新樣本就會(huì )被隨機選擇作為新的抗體以提高相似字符識別的正確率。
交叉與變異概率和抗體、抗原的親和度有關(guān)。親和度越高,概率則越低。大概率將加速親和度成熟,而低概率則有助于防止良好抗體中單一重要基因的丟失。因此,采用動(dòng)態(tài)策略決定交叉與變異概率以提高運算效率和準確性。
步驟3 克隆算子:20個(gè)抗體子代通過(guò)克隆、交叉、變異獲得。
抗體克隆的規模與抗體與抗原、抗體與抗體的親和度有關(guān),其隨著(zhù)抗體間相似度的降低、抗體與抗原相似度的增加而增大,動(dòng)態(tài)策略被用于設定克隆規模。20個(gè)克隆子代通過(guò)克隆得到。
交叉操作在一個(gè)克隆子代的所有抗體中執行。不同子代的抗體采用不同的交叉概率。交叉概率越高,執行的交叉操作越多;反之,相應的操作越少。另外,相對目標抗體而言,具有更高的親和度的抗體通常被用來(lái)與目標抗體執行交叉操作,每個(gè)交叉操作如下:
Two antibodies are selected from the different clone descendants and c1 is the object antibody.
從子代中任選兩個(gè)抗體,c1為目標抗體,
c1={x1, x2…xj-1, xj, xj+1…..x64}
c2={y1, y2…yj-1, yj, yj+1…..y64}
隨機選擇一個(gè)位置 j進(jìn)行交叉操作,ci 轉換為di。
d1={x1,x2…,xj,yj+1…..y64},
20個(gè)交叉子代通過(guò)交叉操作獲得。
交叉操作之后,多點(diǎn)變異操作以相同的變異概率在同一個(gè)交叉子代中進(jìn)行變異操作,不同的交叉子代具有不同的變異概率,變異操作為某一抗體的隨機特征系數隨機比特單點(diǎn)按位邏輯變異。變異概率越高,執行變異的特征系數越多;反之,越少。在變異操作之后,獲得了20個(gè)變異子代。
步驟4 重新計算20個(gè)變異子代的抗體與抗原的親和度。
步驟5 克隆選擇:在克隆選擇中,從變異子代中選擇最好的個(gè)體去替代初始抗體,從而形成新的抗體群。如果變異子代的抗體與抗原的親和度大于來(lái)自于抗體庫A的ai抗體的親和度,ai就會(huì )被新抗體替代,形成下一代抗體庫A(k+1)。
步驟6 重復上述步驟,直到50次算法結束;否則將返回到第二步。
5 實(shí)驗結果
由50個(gè)學(xué)生完成的33個(gè)字符類(lèi)別的1650個(gè)字符樣本用于字符識別。針對每個(gè)字符類(lèi)別,隨機選擇20個(gè)樣本作為抗體庫,30個(gè)作為抗原,20個(gè)用于測試。本文還利用BP神經(jīng)網(wǎng)絡(luò )做了對比實(shí)驗。表1列示了AIS和BP網(wǎng)絡(luò )的平均識別正確率。根據實(shí)驗結果,AIS的字符識別平均正確率要優(yōu)于BP網(wǎng)絡(luò )。另外,人工免疫系統較BP網(wǎng)絡(luò )具有更高的靈活性。如果現行的網(wǎng)絡(luò )無(wú)法識別新樣本,對于A(yíng)IS只需要對新樣本的抗體進(jìn)行訓練后添加到現行的抗體庫中即可;然而,對于BP網(wǎng)絡(luò ),所有的新舊樣本必須進(jìn)行重新訓練以獲得新的網(wǎng)絡(luò )拓撲結構和權重系數。
6 結論
本文提出了一種新的手寫(xiě)希臘字符識別系統,免疫算法被用于構建字符分類(lèi)器。實(shí)驗結果表明該算法可實(shí)現希臘字符準確分類(lèi)。
作為一種新型的識別方式,需要更深入的研究以提高在實(shí)踐中應用能力,包括增加訓練樣本量、圖像描述標準化及系數優(yōu)化。隨著(zhù)上述因素的不斷改進(jìn),該識別系統將會(huì )逐步優(yōu)化。
參考文獻
[1]J.D.Farmer,N.Packard and A.Perelson, (1986)"The immune system,adaptation and machine learning",Physica D, vol.2,pp.187-204.
[2]D.Dasgupta (Editor),Artificial Immune Systems and Their Applications, Springer-Verlag,Inc. Berlin,January 1999,ISBN 3-540-64390-7.
[3]V.Cutello and G.Nicosia(2002) "An Immunological Approach to Combinatorial Optimization Problems" Lecture Notes in Computer Science, Springer vol.2527,pp.361-370.
[4]L.N.de Castro and F.J.Von Zuben,(1999)"Artificial Immune Systems:Part I -Basic Theory and Applications",School of Computing and Electrical Engineering,State University of Campinas,Brazil,No. DCA-RT 01/99.
[5]A lessand ro V in ciarell.i A Survey on Off-line Cursive Word,Recognition[J].Pattern Recognition,2002(35):1433-1446.
[6]Trie O D,J ain A K,Taxt T.Feature Extraction Methods for Character Recognition-A Survey[J].Pattern Recognition,1996,29(4):6412662.
[7]Gonzalez RC,Woods RE,"Digital image processing",312-315,1992.
[8]Hecht-Nielson,R,"Theory of the back propagation Neural Network",In Proceedings of the International Joint Conference on Neural Networks, 593-611,1989.
【人工免疫系統在手寫(xiě)希臘字符識別中的應用】相關(guān)文章:
手寫(xiě)簽名技術(shù)在銀行無(wú)紙化業(yè)務(wù)中的應用研究09-03
線(xiàn)條在面塑中的應用07-14
稀土在電鍍中的應用分析09-17
ERP在LNG工廠(chǎng)中的應用10-30
服飾語(yǔ)言在電影中的應用09-28
沉井施工在工程中的應用10-08
NUFFT在ISAR成像中的應用05-23
竹子在設計中的應用價(jià)值07-10
淺析力學(xué)在機械中的應用05-19