
發(fā)布
注冊(cè)
/
登錄字符識(shí)別
關(guān)注創(chuàng)建者:匿名 創(chuàng)建時(shí)間:2021-08-04
字符識(shí)別的視頻教程
1-114基于MATLAB的車牌識(shí)別模型
基于MATLAB的車牌識(shí)別模型。包括車牌識(shí)別系統(tǒng),完成車牌定位、車牌字符分割和車牌字符識(shí)別。用到灰度化、圖像增強(qiáng)、邊緣檢測(cè)、車輛定位、分割車牌、車輛預(yù)處理、字符分割最后得到識(shí)別結(jié)果。程序已調(diào)通,可直接運(yùn)行。
¥35.9 1分鐘 16播放
查看
字符識(shí)別的實(shí)例教程
圖9 字符識(shí)別界面
利用窗口上方的模塊,對(duì)文件內(nèi)字符進(jìn)行框選,調(diào)整字體坐標(biāo),標(biāo)準(zhǔn)為一字一框,并對(duì)識(shí)別的字符進(jìn)行修正,最后點(diǎn)擊 save。
在輸入命令后創(chuàng)建字體特征文件,之后開(kāi)始對(duì)字符文件進(jìn)行訓(xùn)練,并把生成的文件合并,即得到訓(xùn)練文件(如圖 10)。
圖10 字符集訓(xùn)練界面
字符識(shí)別的正確率受前期圖片處理的程度和字符庫(kù)的影響,訓(xùn)練集中包含英文、中文和數(shù)字三種字符,為了驗(yàn)明三種字符的單獨(dú)測(cè)試效果,從以下四個(gè)方向進(jìn)行觀察測(cè)試:
1)中文字符正確率
2)英文字符正確率
3)數(shù)字字符正確率
4)全部字符正確率
表1 字符識(shí)別正確率測(cè)試
通過(guò)測(cè)試顯示,錯(cuò)誤率最高為 5.00% 的中文字符,Tesseract 對(duì)于英文和數(shù)字字符還是比較精準(zhǔn)的,錯(cuò)誤主要在于字符“期”容易識(shí)別為分開(kāi)的兩個(gè)字“其”和“月”,接下來(lái)對(duì)字符偏旁部首誤分割的判定準(zhǔn)確率進(jìn)行研究?jī)?yōu)化。
04
結(jié)束語(yǔ)
本文基于 OpenCV 和開(kāi)源庫(kù) Tesseract,在 Python平臺(tái)根據(jù)現(xiàn)有的完善字符識(shí)別算法,利用訓(xùn)練出的專屬字符庫(kù)初步實(shí)現(xiàn)了在簡(jiǎn)單環(huán)境下對(duì)商品生產(chǎn)日期的識(shí)別功能。
本實(shí)驗(yàn)項(xiàng)目?jī)H針對(duì)普通場(chǎng)景下的圖像進(jìn)行商品標(biāo)簽日期字符的識(shí)別,對(duì)于復(fù)雜場(chǎng)景下或復(fù)雜字體、混合字體或彎曲識(shí)別界面的圖像文字識(shí)別還有待研究。后續(xù)將在圖像預(yù)處理和字符識(shí)別方面進(jìn)行優(yōu)化,即將著手的工作如下:
1)研究生產(chǎn)日期標(biāo)簽污損情況下的字符識(shí)別。
2)識(shí)別結(jié)果僅顯示于界面,未能聯(lián)系產(chǎn)品進(jìn)行操控。
展開(kāi) 光學(xué)字符識(shí)別技術(shù):讓電腦“讀”懂世界
把手機(jī)攝像頭對(duì)準(zhǔn)菜單上的法語(yǔ)菜名,屏幕上實(shí)時(shí)顯示出翻譯好的中文菜名;批量掃描書籍,將全世界圖書館的藏書轉(zhuǎn)化為電子書;街景車游走于大街小巷,拍攝街景的同時(shí)也從圖像中自動(dòng)提取文字標(biāo)識(shí),讓地圖信息更豐富準(zhǔn)確……這些場(chǎng)景的背后,是一項(xiàng)共同的關(guān)鍵技術(shù)——光學(xué)字符識(shí)別(Optical Character Recognition,OCR)。
慧眼讀世界
鼠標(biāo)發(fā)明人道格拉斯·恩格爾巴特(Douglas Engelbart)曾經(jīng)針對(duì)人工智能的簡(jiǎn)稱“AI”提出了另一個(gè)理念——Augmented Intelligence,增強(qiáng)智能。在他看來(lái),人已經(jīng)足夠聰明,我們無(wú)需再去復(fù)制人類,而是可以從更加實(shí)用的角度,將人類的智能進(jìn)一步延伸,讓機(jī)器去增強(qiáng)人的智能。智能眼鏡就是這樣的產(chǎn)品:去超市的時(shí)候戴上一副,看到心儀商品上的文字,自動(dòng)搜索出詳細(xì)信息:生產(chǎn)商情況、在不同電商平臺(tái)的價(jià)格等等。
讓智能眼鏡“讀懂”文字的,正是OCR技術(shù)。OCR本質(zhì)上是利用光學(xué)設(shè)備去捕獲圖像,無(wú)論是今天的手機(jī)、照相機(jī),還是未來(lái)的智能可穿戴設(shè)備,只要有文字,就能去認(rèn)出來(lái)。設(shè)想一下,在未來(lái)的工作會(huì)議中,只要手機(jī)等智能設(shè)備給會(huì)議白板拍照,系統(tǒng)便能自動(dòng)識(shí)別白板上的討論內(nèi)容,分檢出相關(guān)人員的后續(xù)工作,并將待辦事項(xiàng)自動(dòng)存放到各自的電子日歷中。在OCR技術(shù)的支持下,這樣的場(chǎng)景將不是夢(mèng)想。
微軟去年推出的Office Lens應(yīng)用就向夢(mèng)想的實(shí)現(xiàn)邁進(jìn)了一小步。在研究院語(yǔ)音團(tuán)隊(duì)的核心支持下,這一技術(shù)已經(jīng)可以通過(guò)視覺(jué)計(jì)算技術(shù)實(shí)現(xiàn)對(duì)圖像的自動(dòng)清理,并利用基于云端的OCR技術(shù)將對(duì)圖片進(jìn)行文字識(shí)別,最終返還給用戶一個(gè)可編輯、可搜索的數(shù)字文件。
圖片來(lái)源:research.microsoft.com
輝煌與挑戰(zhàn)
OCR技術(shù)的應(yīng)用經(jīng)歷了超過(guò)半個(gè)世紀(jì)的摸索優(yōu)化。
展開(kāi) 有利于后期的圖片分割及圖像識(shí)別。
二值化圖像處理
將得到車牌區(qū)域進(jìn)行二值化,然后利用bwmorph函數(shù)對(duì)二值圖像應(yīng)用形態(tài)學(xué)操作,經(jīng)過(guò)擦除,再次裁剪,得到更好只具有黑白色彩的車牌圖像
字符分割
將計(jì)算得到車牌區(qū)域的彩色分割后的圖象,對(duì)白色進(jìn)行水平垂直投影,計(jì)算水平垂直峰,檢測(cè)合理的字符高寬比。可用與區(qū)域分割相同的方法進(jìn)行峰值的刪除和合并對(duì)白色進(jìn)行水平垂直投影,計(jì)算水平垂直黑點(diǎn)數(shù),根據(jù)黑點(diǎn)數(shù)分割出字符模塊。。但在字符切割時(shí),往往由于閾值取得不好,導(dǎo)致字符切割不準(zhǔn)確,針對(duì)這種情況,可以由車牌格式的先驗(yàn)知識(shí),對(duì)切割出的字符寬度進(jìn)行統(tǒng)計(jì)分析,用以指導(dǎo)切割,對(duì)因錯(cuò)誤切割過(guò)寬的字符進(jìn)行分裂處理。對(duì)‘桂’字經(jīng)常出現(xiàn)的是把木字旁和右邊的部首分割開(kāi)。系統(tǒng)針對(duì)這種問(wèn)題對(duì)分割出來(lái)的字體的寬度與整個(gè)車牌的寬度對(duì)比,對(duì)誤操作字符進(jìn)行合并。一個(gè)智能的識(shí)別系統(tǒng)應(yīng)減少系統(tǒng)對(duì)閾值的過(guò)分依賴。
字體識(shí)別
常用做法是采用神經(jīng)網(wǎng)絡(luò)模型對(duì)系統(tǒng)進(jìn)行訓(xùn)練。但是這種做法增加了系統(tǒng)的復(fù)雜度,對(duì)實(shí)時(shí)性要求較高的場(chǎng)合不適應(yīng)。這里采用簡(jiǎn)單模版匹配算法。由于在前期的有效處理使得分割后的字體清晰度完整度都能保持較高的水平。有利于提高模版匹配的成功率。經(jīng)驗(yàn)證對(duì)非傾斜圖片,識(shí)別率可達(dá)95%,對(duì)傾斜圖片亦可以達(dá)到90%以上。D--0,6--8,2--Z,A—4是比較容易識(shí)別出錯(cuò)的字符。
語(yǔ)音播報(bào)
對(duì)字符正確識(shí)別之后,用事先對(duì)對(duì)每一個(gè)字符的錄音根據(jù)對(duì)應(yīng)字符順序播放。在對(duì)車牌區(qū)域識(shí)別出錯(cuò)、字體分割出錯(cuò)時(shí)程序暫停,并有語(yǔ)音提醒。
存儲(chǔ)數(shù)據(jù)
播放結(jié)束之后對(duì)相應(yīng)的識(shí)別出來(lái)的字符存儲(chǔ)到指定文件夾的txt文件內(nèi)。并同時(shí)存儲(chǔ)對(duì)應(yīng)時(shí)間。
最后,有需要?dú)g迎通過(guò)微信公眾號(hào)聯(lián)系我們。
展開(kāi) // OCR識(shí)別(應(yīng)用二)
通過(guò)字符訓(xùn)練可以完成自定義字符類型識(shí)別,靈活度更高。
// 缺陷檢測(cè):
無(wú)需訓(xùn)練,即可完成多種標(biāo)準(zhǔn)字體字符識(shí)別,精準(zhǔn)度高,環(huán)境適應(yīng)性廣。
本次GIVS AI深度學(xué)習(xí)訓(xùn)練平臺(tái)的發(fā)布,為行業(yè)用戶提供了更多更優(yōu)質(zhì)的選擇,中科行智也將始終緊跟時(shí)代浪潮,不斷迭代更新、開(kāi)拓發(fā)展,以高端、強(qiáng)大的產(chǎn)品和細(xì)致、貼心的服務(wù)提升用戶體驗(yàn),創(chuàng)造更大價(jià)值!
不過(guò),如果你的算法對(duì)圖像應(yīng)用了一些像濾波器、邊緣檢測(cè)和形態(tài)學(xué)處理等等高大上的技術(shù)后,模式識(shí)別社區(qū)肯定就會(huì)對(duì)它感興趣。光學(xué)字符識(shí)別就是從這個(gè)社區(qū)誕生的。因此,把模式識(shí)別稱為70年代,80年代和90年代初的“智能”信號(hào)處理是合適的。決策樹(shù)、啟發(fā)式和二次判別分析等全部誕生于這個(gè)時(shí)代。而且,在這個(gè)時(shí)代,模式識(shí)別也成為了計(jì)算機(jī)科學(xué)領(lǐng)域的小伙伴搞的東西,而不是電子工程。從這個(gè)時(shí)代誕生的模式識(shí)別領(lǐng)域最著名的書之一是由Duda & Hart執(zhí)筆的“模式識(shí)別(Pattern Classification)”。對(duì)基礎(chǔ)的研究者來(lái)說(shuō),仍然是一本不錯(cuò)的入門教材。不過(guò)對(duì)于里面的一些詞匯就不要太糾結(jié)了,因?yàn)檫@本書已經(jīng)有一定的年代了,詞匯會(huì)有點(diǎn)過(guò)時(shí)。
圖2 一個(gè)字符“3”的圖像被劃分為16個(gè)子塊。
自定義規(guī)則、自定義決策,以及自定義“智能”程序在這個(gè)任務(wù)上,曾經(jīng)都風(fēng)靡一時(shí)
小測(cè)試:計(jì)算機(jī)視覺(jué)領(lǐng)域最著名的會(huì)議叫CVPR,這個(gè)PR就是模式識(shí)別。你能猜出第一屆CVPR會(huì)議是哪年召開(kāi)的嗎?
2. 機(jī)器學(xué)習(xí):從樣本中學(xué)習(xí)的智能程序
在90年代初,人們開(kāi)始意識(shí)到一種可以更有效地構(gòu)建模式識(shí)別算法的方法,那就是用數(shù)據(jù)(可以通過(guò)廉價(jià)勞動(dòng)力采集獲得)去替換專家(具有很多圖像方面知識(shí)的人)。因此,我們搜集大量的人臉和非人臉圖像,再選擇一個(gè)算法,然后沖著咖啡、曬著太陽(yáng),等著計(jì)算機(jī)完成對(duì)這些圖像的學(xué)習(xí)。這就是機(jī)器學(xué)習(xí)的思想。“機(jī)器學(xué)習(xí)”強(qiáng)調(diào)的是,在給計(jì)算機(jī)程序(或者機(jī)器)輸入一些數(shù)據(jù)后,它必須做一些事情,那就是學(xué)習(xí)這些數(shù)據(jù),而這個(gè)學(xué)習(xí)的步驟是明確的。相信我,就算計(jì)算機(jī)完成學(xué)習(xí)要耗上一天的時(shí)間,也會(huì)比你邀請(qǐng)你的研究伙伴來(lái)到你家然后專門手工得為這個(gè)任務(wù)設(shè)計(jì)一些分類規(guī)則要好。
圖3 典型的機(jī)器學(xué)習(xí)流程(圖來(lái)源于 Natalia Konstantinova 博士的博客)。
展開(kāi) 
字符識(shí)別的相關(guān)專題、標(biāo)簽、搜索
字符識(shí)別的最新內(nèi)容
機(jī)器視覺(jué)輔件:
圖像處理系統(tǒng):光學(xué)文字、識(shí)別系統(tǒng)、自動(dòng)化/機(jī)器人技術(shù)、紅外圖像系統(tǒng);
機(jī)器視覺(jué)集成:字符處理和識(shí)別系統(tǒng)、自動(dòng)化/機(jī)器人技術(shù)、紅外圖像系統(tǒng)、煙草、印鈔、電子組裝、質(zhì)量檢測(cè)、自動(dòng)識(shí)別(OCR/OCV)、測(cè)量、智能視覺(jué)、表面檢測(cè)、印刷、包裝、復(fù)雜工業(yè)對(duì)象視覺(jué)在線、汽車制造、車牌、智能交通、生物特征識(shí)別、監(jiān)控、醫(yī)療檢測(cè)、光學(xué)檢查等系統(tǒng)。
定位雜散月光:布局圖分析
有了過(guò)濾字符串,不僅很容易確定有多少來(lái)自月球的光線到達(dá)探測(cè)器,而且我們還可以利用這個(gè)字符串直觀地識(shí)別光線是否來(lái)自月球的某個(gè)“優(yōu)先區(qū)域”。也就是說(shuō),我們可以確定雜散光是否來(lái)自月球的特定區(qū)域。
你可以想象,第11號(hào)探測(cè)器并不適合回答這個(gè)問(wèn)題。然而,正如前面提到的,過(guò)濾字符串也可以應(yīng)用于布局圖。
它還支持光學(xué)字符識(shí)別(OCR)引擎,幫助驗(yàn)證文本和數(shù)字是否按預(yù)期顯示在屏幕上。
深圳市優(yōu)飛迪科技有限公司成立于2010年,是一家專注于產(chǎn)品開(kāi)發(fā)平臺(tái)解決方案與物聯(lián)網(wǎng)技術(shù)開(kāi)發(fā)的國(guó)家級(jí)高新技術(shù)企業(yè)。
物流標(biāo)簽讀取和字符識(shí)別是比較常見(jiàn)的應(yīng)用場(chǎng)景,顏色識(shí)別也越來(lái)越多的應(yīng)用到機(jī)器視覺(jué)。在電氣行業(yè),對(duì)于電線電纜顏色有一定要求,錯(cuò)誤的線纜顏色會(huì)影響后期的故障判斷與維護(hù),因此借助機(jī)器視覺(jué)實(shí)現(xiàn)顏色識(shí)別非常重要(見(jiàn)下圖)。
定位雜散月光:布局圖分析
有了過(guò)濾字符串,不僅很容易確定有多少來(lái)自月球的光線到達(dá)探測(cè)器,而且我們還可以利用這個(gè)字符串直觀地識(shí)別光線是否來(lái)自月球的某個(gè)“優(yōu)先區(qū)域”。也就是說(shuō),我們可以確定雜散光是否來(lái)自月球的特定區(qū)域。
你可以想象,第11號(hào)探測(cè)器并不適合回答這個(gè)問(wèn)題。
定位雜散月光:布局圖分析
有了過(guò)濾字符串,不僅很容易確定有多少來(lái)自月球的光線到達(dá)探測(cè)器,而且我們還可以利用這個(gè)字符串直觀地識(shí)別光線是否來(lái)自月球的某個(gè)“優(yōu)先區(qū)域”。也就是說(shuō),我們可以確定雜散光是否來(lái)自月球的特定區(qū)域。
你可以想象,第11號(hào)探測(cè)器并不適合回答這個(gè)問(wèn)題。然而,正如前面提到的,過(guò)濾字符串也可以應(yīng)用于布局圖。
測(cè)試檢查&驗(yàn)證
-確認(rèn)可見(jiàn)的數(shù)據(jù)、驗(yàn)證底層對(duì)象和對(duì)象屬性是否符合預(yù)期值;
-兩大手段:檢查點(diǎn)和Spy工具;
-檢查點(diǎn)類型:屬性、截圖、表格、可視化檢查點(diǎn)、圖片搜索和OCR(光學(xué)字符識(shí)別);
-支持在初始錄制期間,錄制片段或手動(dòng)編寫腳本時(shí)創(chuàng)建檢查點(diǎn)。
定位雜散月光:布局圖分析
有了過(guò)濾字符串,不僅很容易確定有多少來(lái)自月球的光線到達(dá)探測(cè)器,而且我們還可以利用這個(gè)字符串直觀地識(shí)別光線是否來(lái)自月球的某個(gè)“優(yōu)先區(qū)域”。也就是說(shuō),我們可以確定雜散光是否來(lái)自月球的特定區(qū)域。
你可以想象,第11號(hào)探測(cè)器并不適合回答這個(gè)問(wèn)題。然而,正如前面提到的,過(guò)濾字符串也可以應(yīng)用于布局圖。
光學(xué)字符識(shí)別(OCR)
使用基于AI的OCR引擎輕松識(shí)別和驗(yàn)證屏幕上的文本,并將其與基于對(duì)象或圖像的測(cè)試相結(jié)合。
測(cè)試驗(yàn)證與確認(rèn)
插入驗(yàn)證點(diǎn)以確認(rèn)測(cè)試腳本的預(yù)期行為。Squish支持對(duì)象屬性、屏幕截圖、視覺(jué)和基于OCR的驗(yàn)證點(diǎn)。
代碼覆蓋率分析概述
*COCO:來(lái)自FROGLOGIC收購(gòu)
Coco是一個(gè)多語(yǔ)言、多平臺(tái)的代碼覆蓋率分析和剖析工具。
車牌識(shí)別單元對(duì)圖像進(jìn)行處理,定位出車牌位置,再將車牌中的字符分割出來(lái)進(jìn)行識(shí)別,之后組成車牌號(hào)碼輸出。
相對(duì)傳統(tǒng)取卡入場(chǎng),車牌識(shí)別通行免停車、免開(kāi)窗,提升了B端用戶體驗(yàn),降低了停車場(chǎng)IC卡片遺失耗損的成本,提升了C端車主的通行效率,實(shí)現(xiàn)了車輛快捷的進(jìn)出停車場(chǎng)。