包装网-99精品欧美一区二区三区综合在线-包装e线,99精品欧美一区二区三区,包装设计,99精品欧美一区二区,包装材料,包装设备,包装盒制作,包装盒设计,产品包装设计网

分享到:

包裝網(wǎng)全國直通: 北京  上海  天津  重慶  河北  山西  內(nèi)蒙  遼寧  吉林  黑龍江  湖北  湖南  河南  山東  浙江  江西  江蘇  安徽  福建

更多>>
首頁 > 學(xué)習(xí)園地 > 制作工藝 > 印刷體文字的識別研究方法分類介紹

印刷體文字的識別研究方法分類介紹
2012-06-11 10:56:40   作者:   來源:   評論:0 點(diǎn)擊:

  識別方法是整個(gè)系統(tǒng)的核心。用于漢字識別的模式識別方法可以大致分為結(jié)構(gòu)模式識別、統(tǒng)計(jì)模式識別及兩者的結(jié)合。下面分別進(jìn)行介紹。

  結(jié)構(gòu)模式識別

  漢字是一種特殊的模式,其結(jié)構(gòu)雖然比較復(fù)雜,但具有相當(dāng)嚴(yán)格的規(guī)律性。換言之,漢字圖形含有豐富的結(jié)構(gòu)信息,可以設(shè)法提取含有這種信息的結(jié)構(gòu)特征及其組字規(guī)律,作為識別漢字的依據(jù),這就是結(jié)構(gòu)模式識別。

  結(jié)構(gòu)模式識別是早期漢字識別研究的主要方法。其主要出發(fā)點(diǎn)是漢字的組成結(jié)構(gòu)。從漢字的構(gòu)成上講,漢字是由筆劃(點(diǎn)橫豎撇捺等)、偏旁部首構(gòu)成的;還可以認(rèn)為漢字是由更小的結(jié)構(gòu)基元構(gòu)成的。由這些結(jié)構(gòu)基元及其相互關(guān)系完全可以精確地對漢字加以描述,就像一篇文章由單字、詞、短語和句子按語法規(guī)律所組成一樣。所以這種方法也叫句法模式識別。識別時(shí),利用上述結(jié)構(gòu)信息及句法分析的方法進(jìn)行識別,類似一個(gè)邏輯推理器。

  用這種方法來描述漢字字形結(jié)構(gòu)在理論上是比較恰當(dāng)?shù)模渲饕獌?yōu)點(diǎn)在于對字體變化的適應(yīng)性強(qiáng),區(qū)分相似字能力強(qiáng);但是,在實(shí)際應(yīng)用中,面臨的主要問題是抗干擾能力差,因?yàn)樵趯?shí)際得到的文本圖象中存在著各種干擾,如傾斜,扭曲,斷裂,粘連,紙張上的污點(diǎn),對比度差等等。這些因素直接影響到結(jié)構(gòu)基元的提取,假如結(jié)構(gòu)基元不能準(zhǔn)確地得到,后面的推理過程就成了無源之水。此外結(jié)構(gòu)模式識別的描述比較復(fù)雜,匹配過程的復(fù)雜度因而也較高。所以在印刷體漢字識別領(lǐng)域中,純結(jié)構(gòu)模式識別方法已經(jīng)逐漸衰落,句法識別的方法正日益受到挑戰(zhàn)。

  統(tǒng)計(jì)模式識別

  統(tǒng)計(jì)決策論發(fā)展較早,理論也較成熟。其要點(diǎn)是提取待識別模式的的一組統(tǒng)計(jì)特征,然后按照一定準(zhǔn)則所確定的決策函數(shù)進(jìn)行分類判決。

  漢字的統(tǒng)計(jì)模式識別是將字符點(diǎn)陣看作一個(gè)整體,其所用的特征是從這個(gè)整體上經(jīng)過大量的統(tǒng)計(jì)而得到的。統(tǒng)計(jì)特征的特點(diǎn)是抗干擾性強(qiáng),匹配與分類的算法簡單,易于實(shí)現(xiàn)。不足之處在于細(xì)分能力較弱,區(qū)分相似字的能力差一些。常見的統(tǒng)計(jì)模式識別方法有:

  (1) 模板匹配。模板匹配并不需要特征提取過程。字符的圖象直接作為特征,與字典中的模板相比,相似度最高的模板類即為識別結(jié)果。這種方法簡單易行,可以并行處理;但是一個(gè)模板只能識別同樣大小、同種字體的字符,對于傾斜、筆劃變粗變細(xì)均無良好的適應(yīng)能力。

  (2)利用變換特征的方法。對字符圖象進(jìn)行二進(jìn)制變換(如Walsh, Hardama變換)或更復(fù)雜的變換(如Karhunen-Loeve, Fourier,Cosine,Slant變換等),變換后的特征的維數(shù)大大降低。但是這些變換不是旋轉(zhuǎn)不變的,因此對于傾斜變形的字符的識別會有較大的偏差。二進(jìn)制變換的計(jì)算雖然簡單,但變換后的特征沒有明顯的物理意義。K-L變換雖然從最小均方誤差角度來說是最佳的,但是運(yùn)算量太大,難以實(shí)用。總之,變換特征的運(yùn)算復(fù)雜度較高。

  (3)投影直方圖法。利用字符圖象在水平及垂直方向的投影作為特征。該方法對傾斜旋轉(zhuǎn)非常敏感,細(xì)分能力差。

  (4)幾何矩(Geometric Moment)特征。M. K. Hu提出利用矩不變量作為特征的想法,引起了研究矩的熱潮。研究人員又確定了數(shù)十個(gè)移不變、比例不變的矩。我們都希望找到穩(wěn)定可靠的、對各種干擾適應(yīng)能力很強(qiáng)的特征,在幾何矩方面的研究正反映了這一愿望。以上所涉及到的幾何矩均在線性變換下保持不變。但在實(shí)際環(huán)境中,很難保證線性變換這一前提條件。

  (5)Spline曲線近似與傅立葉描繪子(Fourier Descriptor)。兩種方法都是針對字符圖象輪廓的。Spline曲線近似是在輪廓上找到曲率大的折點(diǎn),利用Spline曲線來近似相鄰折點(diǎn)之間的輪廓線。而傅立葉描繪子則是利用傅立葉函數(shù)模擬封閉的輪廓線,將傅立葉函數(shù)的各個(gè)系數(shù)作為特征的。前者對于旋轉(zhuǎn)很敏感。后者對于輪廓線不封閉的字符圖象不適用,因此很難用于筆劃斷裂的字符的識別。

  (6)筆劃密度特征。筆劃密度的描述有許多種,這里采用如下定義:字符圖象某一特定范圍的筆劃密度是在該范圍內(nèi),以固定掃描次數(shù)沿水平、垂直或?qū)蔷方向掃描時(shí)的穿透次數(shù)。這種特征描述了漢字的各部分筆劃的疏密程度,提供了比較完整的信息。在圖象質(zhì)量可以保證的情況下,這種特征相當(dāng)穩(wěn)定。在脫機(jī)手寫體的識別中也經(jīng)常用到這種特征。但是在字符內(nèi)部筆劃粘連時(shí)誤差較大。

  (7)外圍特征。漢字的輪廓包含了豐富的特征,即使在字符內(nèi)部筆劃粘連的情況下,輪廓部分的信息也還是比較完整的。這種特征非常適合于作為粗分類的特征。

  (8)基于微結(jié)構(gòu)特征的方法。這種方法的出發(fā)點(diǎn)在于,漢字是由筆劃組成的,而筆劃是由一定方向,一定位置關(guān)系與長寬比的矩形段組成的。這些矩形段則稱為微結(jié)構(gòu)。利用微結(jié)構(gòu)及微結(jié)構(gòu)之間的關(guān)系組成的特征對漢字進(jìn)行識別,尤其是對于多體漢字的識別,獲得了良好的效果。其不足之處是,在內(nèi)部筆劃粘連時(shí),微結(jié)構(gòu)的提取會遇到困難。

  (9)特征點(diǎn)特征。早在1957年,Solatron Electronics Group公司發(fā)布了第一個(gè)利用窺視孔(peephole)方法的OCR系統(tǒng)。其主要思想是利用字符點(diǎn)陣中一些有代表性的黑點(diǎn)(筆劃),白點(diǎn)(背景)作為特征來區(qū)分不同的字符。后有人又將這種方法運(yùn)用到漢字識別中,對其中的黑點(diǎn)又增加了屬性的描述,如端點(diǎn)、折點(diǎn)、交叉點(diǎn)等。也獲得了比較好的效果。其特點(diǎn)是對于內(nèi)部筆劃粘連的字符的識別的適應(yīng)性較強(qiáng),直觀性好,但是不易表示為矢量形式,不適合作為粗分類的特征,匹配難度大。

  當(dāng)然還有許多種不同的統(tǒng)計(jì)特征,諸如圖描述法、包含配選法、脫殼透視法、差筆劃法等,這里就不一一介紹了。

  統(tǒng)計(jì)識別與結(jié)構(gòu)識別的結(jié)合

  結(jié)構(gòu)模式識別與統(tǒng)計(jì)模式識別各有優(yōu)缺點(diǎn),隨著我們對于兩種方法認(rèn)識的深入,這兩種方法正在逐漸融合。網(wǎng)格化特征就是這種結(jié)合的產(chǎn)物。字符圖象被均勻地或非均勻地劃分為若干區(qū)域,稱之為“網(wǎng)格”。在每一個(gè)網(wǎng)格內(nèi)尋找各種特征,如筆劃點(diǎn)與背景點(diǎn)的比例,交叉點(diǎn)、筆劃端點(diǎn)的個(gè)數(shù),細(xì)化后的筆劃的長度、網(wǎng)格部分的筆劃密度等等。特征的統(tǒng)計(jì)以網(wǎng)格為單位,即使個(gè)別點(diǎn)的統(tǒng)計(jì)有誤差也不會造成大的影響,增強(qiáng)了特征的抗干擾性。這種方法正得到日益廣泛的應(yīng)用。

  人工神經(jīng)網(wǎng)絡(luò)

  人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,以下稱ANN)是一種模擬人腦神經(jīng)元細(xì)胞的網(wǎng)絡(luò)結(jié)構(gòu),它是由大量簡單的基本元件-神經(jīng)元相互連接成的自適應(yīng)非線性動態(tài)系統(tǒng)。雖然目前對于人腦神經(jīng)元的研究還很不完善,我們無法確定ANN的工作方式是否與人腦神經(jīng)元的運(yùn)作方式相同,但是ANN正在吸引著越來越多的注意力。

  ANN中的各個(gè)神經(jīng)元的結(jié)構(gòu)與功能較為簡單,但大量的簡單神經(jīng)元的組合卻可以非常復(fù)雜,我們從而可以通過調(diào)整神經(jīng)元間的連接系數(shù)完成分類、識別等復(fù)雜的功能。ANN還具有一定的自適應(yīng)的學(xué)習(xí)與組織能力,組成網(wǎng)絡(luò)的各個(gè)“細(xì)胞”可以并行工作,并可以通過調(diào)整“細(xì)胞”間的連接系數(shù)完成分類、識別等復(fù)雜的功能。這是馮·諾依曼的計(jì)算機(jī)無法做到的。

  ANN可以作為單純的分類器(不包含特征提取,選擇),也可以用作功能完善的分類器。在英文字母與數(shù)字的識別等類別數(shù)目較少的分類問題中,常常將字符的圖象點(diǎn)陣直接作為神經(jīng)網(wǎng)絡(luò)的輸入。不同于傳統(tǒng)的模式識別方法,在這種情況下,神經(jīng)網(wǎng)絡(luò)所“提取”的特征并無明顯的物理含義,而是儲存在神經(jīng)物理中各個(gè)神經(jīng)元的連接之中,省去了由人來決定特征提取的方法與實(shí)現(xiàn)過程。從這個(gè)意義上來說,ANN提供了一種“字符自動識別”的可能性。此外,ANN分類器是一種非線性的分類器,它可以提供我們很難想象到的復(fù)雜的類間分界面,這也為復(fù)雜分類問題的解決提供了一種可能的解決方式。

  目前,在對于象漢字識別這樣超多類的分類問題,ANN的規(guī)模會很大,結(jié)構(gòu)也很復(fù)雜,現(xiàn)在還遠(yuǎn)未達(dá)到實(shí)用的程度。其中的原因很多,主要的原因還在于我們對人腦的工作方式以及ANN本身的許多問題還沒有找到完美的答案。

相關(guān)熱詞搜索:包裝 印刷 模式識別

上一篇:絲印龜裂問題的解決方法
下一篇:環(huán)境溫濕度對煙標(biāo)平整度的影響

分享到: 收藏
主站蜘蛛池模板: 山东万通液压股份有限公司-自卸车专用油缸,能源采掘设备油缸,机械装备用油缸,油气弹簧,工程机械油缸,液压元件 | 天然气车船展、氢能装备展、氢燃料汽车展、核电装备展、国防信息化装备展---北京企发展览服务有限公司 | 青岛除甲醛公司|青岛甲醛治理|青岛除甲醛|甲醛检测|光触媒除甲醛|装修除味除甲醛|新房除甲醛|青岛室内环境污染检测治理|青岛闪洁环保科技有限公司官网 | 葫芦岛装修公司,兴城装修家装公司,葫芦岛鑫昕装饰 | 济南晨阳科技有限公司-锅巴生产设备-夹心米果设备-膨化食品机械 集装箱零配件_不锈钢丝绳厂家_镀锌铁链条_合页非标件定制_上海英鑫多实业有限公司 | 天然气车船展、氢能装备展、氢燃料汽车展、核电装备展、国防信息化装备展---北京企发展览服务有限公司 | 泊头市鸿海泵业有限公司--导热油泵,高温油泵,沥青保温泵,圆弧泵,齿轮油泵,高粘度泵,自吸离心油泵,罗茨油泵为主的专业生产厂家 | 长沙网站建设,网站设计制作,长沙小程序开发,公众号开发,长沙叶老设计 | 潍坊沃林机械设备有限公司-牵引式风送果园打药机,悬挂式风送果园喷雾机,自走式果树喷药机,车载式风送远程喷雾机-潍坊沃林机械设备有限公司-牵引式风送果园打药机,悬挂式风送果园喷雾机,自走式果树喷药机,车载式风送远程喷雾机 潍坊网络推广,临沂360推广,东营360推广,枣庄360推广,潍坊网站建设,潍坊网络公司,潍坊360搜索,潍坊APP开发,潍坊360推广,潍坊360代理,潍坊点睛网络科技有限公司 | 联系我们-99公司开户电话-99厅 | 三叶罗茨鼓风机_三叶罗茨风机厂家_山东九洲四海机械有限公司 | 汽车标签|医疗标签|电子标签|手机电池标签|电脑电池标签|电源标签|耐高温标签|防静电标签|手机出厂膜|手机全裹膜|手机包裹膜|手机卖点膜|热转印标签|遮阳板标签|天势科技|-标签印制专家! | 亚克力游泳池_透明/空中/无边泳池_别墅亚克力泳池设计生产厂家_瑞地格乐-深圳他拍档 | 停车场收费管理系统,通道闸系统,门禁系统,东莞停车场收费管理系统,东莞通道闸系统,-东莞市骄阳交通设备有限公司 | 激光焊接不锈钢翅片管,不锈钢翅片管,激光焊接复合翅片管,南通拓帆换热设备有限公司 | 智能电磁流量计-超声波流量计-涡街流量计-液体涡轮流量计-大连计测机器有限公司 | 鹰潭代理记账公司_鹰潭代理记账_鹰潭注册公司-鹰潭市新知会计服务有限公司 | 武汉印刷厂_为企业提供宣传单页彩页印刷_武汉折页印刷_海报设计印刷与制作 - 武汉泽雅印刷公司 | 耐磨焊丝厂-堆焊焊材研发-修复工程-天津舜荣焊材官网 | 铸铁平台-铸铁平板平台厂家-加工优质高精度检验划线装配T型槽平台-尺寸规格全供应-建新铸造 | 耀美软瓷施工队-13638350103-专注于软瓷施工勾缝的贴软瓷施工队 - 软瓷,软瓷施工,软瓷勾缝,软瓷怎么施工,软瓷怎么勾缝,贴软瓷,软瓷施工队 | 影像测量仪|检测设备定制|平面度测量仪|三坐标测量机|广州市海科思自动化设备有限公司-400-0528-668 | 太原万通汽车学校[官网]-太原好的汽修培训学校,学新能源汽车技术,学汽修,学汽车检测与维修技术 | 南通市科脉电子科技有限公司 | 郑州编织袋厂_郑州塑料编织袋_河南塑料编织袋厂-河南宏旺塑料编织袋厂家 | 欧派板材官网 | 全屋定制板材 专业供应商 | 西安生殖医学医院_陕西省老医协生殖医学医院【官方网站】 | 自动隔油提升设备,消防稳压一体设备,苏州不锈钢消防水箱,污水提升设备厂家,无负压变频供水设备厂家-苏州脉泉供水设备有限公司 | 景德镇芳然装饰有限公司 | 扬州华工电气有限公司|环氧树脂管|金刚石绝缘板|U型绝缘槽|电解槽绝缘材料 | 智汇工业-智慧工业、智能制造及工业智能、工业互联门户网站,专业的工业“互联网+”传媒 | 金属网帘|金属帘|装饰网帘|金属环网|金属幕墙网|金属垂帘|金属扣帘-安平县名图金属丝网制品有限公司 | 噪声治理_噪音治理公司「杭州创雅环境科技」 | 全国家博会_2025家博会时间表_家博会门票_免费索票入口 | 抛丸机-通过式抛丸机-履带吊钩式抛丸机厂家-青岛泓霖智能设备公司 | 河北热风机,电热暖风机,燃油暖风机,工业暖风机厂家安装,批发-河北嘉鹏冷暖风机有限公司 | 销售系统_营销系统_自动营销软件_b2b营销系统_数字营销平台_AI销售 | 铸铁平台-焊接平台-划线平台-三维焊接平台厂家-泊头市溪海冶金机械设备有限公司 | 宁波必沃纺织机械有限公司—优质针织电脑横机专业制造商 | 烟台真空包装,烟台木包装,烟台熏蒸木箱-烟台福岭木制品有限公司 烟台通风管道,烟台风机风管,烟台风阀-烟台福莱通风设备有限公司 | 偏光显微镜-金相抛光机|预磨机|磨抛机|镶嵌机|切割机-上海蔡康光学仪器厂 |