<center id="r3vq0"><ol id="r3vq0"></ol></center>

  1. <tr id="r3vq0"><sup id="r3vq0"><mark id="r3vq0"></mark></sup></tr><strike id="r3vq0"><menu id="r3vq0"></menu></strike>
  2. <big id="r3vq0"><s id="r3vq0"></s></big>

      <tr id="r3vq0"></tr>
      <big id="r3vq0"><s id="r3vq0"></s></big>
      • 用戶(hù)名
      • 密碼
      • 產(chǎn)品
      供應
      求購
      公司
      資訊
      展會(huì )
      評論訪(fǎng)談專(zhuān)題話(huà)題印搜動(dòng)態(tài)
      國內國際環(huán)保視頻產(chǎn)品導購
      活動(dòng)展會(huì )設備印品世界
      行業(yè)動(dòng)態(tài)企業(yè)動(dòng)態(tài)營(yíng)銷(xiāo)電子商務(wù)政策法規統計商機
      印前印中印后包裝器材耗材油墨
      膠印數碼標簽CTP紙箱創(chuàng )意絲印柔印其他
      展會(huì )專(zhuān)題企業(yè)專(zhuān)題資訊專(zhuān)題技術(shù)專(zhuān)題
      文化人物社會(huì )
      展會(huì )預告會(huì )議預告展會(huì )資訊國內展會(huì )國際展會(huì )推薦展會(huì )
      印刷包裝絲印
      印刷包裝絲印
      印刷包裝絲印
      您當前位置: CPP114首頁(yè)> 正文

      • 今日排行
      • 本周排行
      • 本月排行

      膠印油墨
      膠印材料
      絲印材料

      印刷體文字的識別研究方法分類(lèi)介紹

      2010-12-06 15:17 來(lái)源:中國中部印刷網(wǎng) 責編:江佳

      摘要:
       識別方法是整個(gè)系統的核心。用于漢字識別的模式識別方法可以大致分為結構模式識別、統計模式識別及兩者的結合。下面分別進(jìn)行介紹。
         【CPP114】訊:識別方法是整個(gè)系統的核心。用于漢字識別的模式識別方法可以大致分為結構模式識別、統計模式識別及兩者的結合。下面分別進(jìn)行介紹。

        結構模式識別

        漢字是一種特殊的模式,其結構雖然比較復雜,但具有相當嚴格的規律性。換言之,漢字圖形含有豐富的結構信息,可以設法提取含有這種信息的結構特征及其組字規律,作為識別漢字的依據,這就是結構模式識別。

        結構模式識別是早期漢字識別研究的主要方法。其主要出發(fā)點(diǎn)是漢字的組成結構。從漢字的構成上講,漢字是由筆劃(點(diǎn)橫豎撇捺等)、偏旁部首構成的;還可以認為漢字是由更小的結構基元構成的。由這些結構基元及其相互關(guān)系完全可以精確地對漢字加以描述,就像一篇文章由單字、詞、短語(yǔ)和句子按語(yǔ)法規律所組成一樣。所以這種方法也叫句法模式識別。識別時(shí),利用上述結構信息及句法分析的方法進(jìn)行識別,類(lèi)似一個(gè)邏輯推理器。

        用這種方法來(lái)描述漢字字形結構在理論上是比較恰當的,其主要優(yōu)點(diǎn)在于對字體變化的適應性強,區分相似字能力強;但是,在實(shí)際應用中,面臨的主要問(wèn)題是抗干擾能力差,因為在實(shí)際得到的文本圖象中存在著(zhù)各種干擾,如傾斜,扭曲,斷裂,粘連,紙張上的污點(diǎn),對比度差等等。這些因素直接影響到結構基元的提取,假如結構基元不能準確地得到,后面的推理過(guò)程就成了無(wú)源之水。此外結構模式識別的描述比較復雜,匹配過(guò)程的復雜度因而也較高。所以在印刷體漢字識別領(lǐng)域中,純結構模式識別方法已經(jīng)逐漸衰落,句法識別的方法正日益受到挑戰。

        統計模式識別

        統計決策論發(fā)展較早,理論也較成熟。其要點(diǎn)是提取待識別模式的的一組統計特征,然后按照一定準則所確定的決策函數進(jìn)行分類(lèi)判決。

        漢字的統計模式識別是將字符點(diǎn)陣看作一個(gè)整體,其所用的特征是從這個(gè)整體上經(jīng)過(guò)大量的統計而得到的。統計特征的特點(diǎn)是抗干擾性強,匹配與分類(lèi)的算法簡(jiǎn)單,易于實(shí)現。不足之處在于細分能力較弱,區分相似字的能力差一些。常見(jiàn)的統計模式識別方法有:

        (1) 模板匹配。模板匹配并不需要特征提取過(guò)程。字符的圖象直接作為特征,與字典中的模板相比,相似度最高的模板類(lèi)即為識別結果。這種方法簡(jiǎn)單易行,可以并行處理;但是一個(gè)模板只能識別同樣大小、同種字體的字符,對于傾斜、筆劃變粗變細均無(wú)良好的適應能力。

        (2)利用變換特征的方法。對字符圖象進(jìn)行二進(jìn)制變換(如Walsh, Hardama變換)或更復雜的變換(如Karhunen-Loeve, Fourier,Cosine,Slant變換等),變換后的特征的維數大大降低。但是這些變換不是旋轉不變的,因此對于傾斜變形的字符的識別會(huì )有較大的偏差。二進(jìn)制變換的計算雖然簡(jiǎn)單,但變換后的特征沒(méi)有明顯的物理意義。K-L變換雖然從最小均方誤差角度來(lái)說(shuō)是最佳的,但是運算量太大,難以實(shí)用?傊,變換特征的運算復雜度較高。

        (3)投影直方圖法。利用字符圖象在水平及垂直方向的投影作為特征。該方法對傾斜旋轉非常敏感,細分能力差。

        (4)幾何矩(Geometric Moment)特征。M. K. Hu提出利用矩不變量作為特征的想法,引起了研究矩的熱潮。研究人員又確定了數十個(gè)移不變、比例不變的矩。我們都希望找到穩定可靠的、對各種干擾適應能力很強的特征,在幾何矩方面的研究正反映了這一愿望。以上所涉及到的幾何矩均在線(xiàn)性變換下保持不變。但在實(shí)際環(huán)境中,很難保證線(xiàn)性變換這一前提條件。

        (5)Spline曲線(xiàn)近似與傅立葉描繪子(Fourier Descriptor)。兩種方法都是針對字符圖象輪廓的。Spline曲線(xiàn)近似是在輪廓上找到曲率大的折點(diǎn),利用Spline曲線(xiàn)來(lái)近似相鄰折點(diǎn)之間的輪廓線(xiàn)。而傅立葉描繪子則是利用傅立葉函數模擬封閉的輪廓線(xiàn),將傅立葉函數的各個(gè)系數作為特征的。前者對于旋轉很敏感。后者對于輪廓線(xiàn)不封閉的字符圖象不適用,因此很難用于筆劃斷裂的字符的識別。

        (6)筆劃密度特征。筆劃密度的描述有許多種,這里采用如下定義:字符圖象某一特定范圍的筆劃密度是在該范圍內,以固定掃描次數沿水平、垂直或對角線(xiàn)方向掃描時(shí)的穿透次數。這種特征描述了漢字的各部分筆劃的疏密程度,提供了比較完整的信息。在圖象質(zhì)量可以保證的情況下,這種特征相當穩定。在脫機手寫(xiě)體的識別中也經(jīng)常用到這種特征。但是在字符內部筆劃粘連時(shí)誤差較大。

        (7)外圍特征。漢字的輪廓包含了豐富的特征,即使在字符內部筆劃粘連的情況下,輪廓部分的信息也還是比較完整的。這種特征非常適合于作為粗分類(lèi)的特征。

        (8)基于微結構特征的方法。這種方法的出發(fā)點(diǎn)在于,漢字是由筆劃組成的,而筆劃是由一定方向,一定位置關(guān)系與長(cháng)寬比的矩形段組成的。這些矩形段則稱(chēng)為微結構。利用微結構及微結構之間的關(guān)系組成的特征對漢字進(jìn)行識別,尤其是對于多體漢字的識別,獲得了良好的效果。其不足之處是,在內部筆劃粘連時(shí),微結構的提取會(huì )遇到困難。
      • 【我要印】印刷廠(chǎng)與需方印務(wù)對接,海量印刷訂單供您任意選擇。
      • 【cpp114】印刷機械、零配件供求信息對接,讓客戶(hù)方便找到您。
      • 【我的耗材】采購低于市場(chǎng)價(jià)5%-20%的印刷耗材,為您節省成本。
      • 【印東印西】全國領(lǐng)先的印刷品網(wǎng)上采購商城,讓印刷不花錢(qián)。
      天天操天天添天天插 久久久久综合日本亚洲 五月99久久婷婷国产综合亚洲 国产精品视频免费一区二区

        <center id="r3vq0"><ol id="r3vq0"></ol></center>

      1. <tr id="r3vq0"><sup id="r3vq0"><mark id="r3vq0"></mark></sup></tr><strike id="r3vq0"><menu id="r3vq0"></menu></strike>
      2. <big id="r3vq0"><s id="r3vq0"></s></big>

          <tr id="r3vq0"></tr>
          <big id="r3vq0"><s id="r3vq0"></s></big>