www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當前位置:首頁 > > 充電吧
[導讀]關于中文的識別,效果比較好而且開源的應該就是Tesseract-OCR了,所以自己親身試用一下,分享讓有同樣興趣的人少走彎路。一、準備工作1、下載Tesseract-OCR引擎,注意要3.0以上才支持

關于中文的識別,效果比較好而且開源的應該就是Tesseract-OCR了,所以自己親身試用一下,分享讓有同樣興趣的人少走彎路。


一、準備工作

1、下載Tesseract-OCR引擎,注意要3.0以上才支持中文哦,按照提示安裝就行。

2、下載chi_sim.traindata字庫。要有這個才能識別中文。下好后,放到Tesseract-OCR項目的tessdata文件夾里面。

3、下載jTessBoxEditor,這個是用來訓練字庫的。

以上的幾個在百度都能找到下載,就不詳細講了。

?

?

二、識別

1、進入cmd,進入到要識別的圖片的路徑下。

2、輸入命令

1tesseract 圖片名稱 生成的結果文件的名稱 字庫

例如我的圖片識別就是:

1tesseract test.jpg result -l chi_sim

識別完后會生成result.txt文件

當然啦效果不太理想。所以我們要訓練自己的字庫。

?

三、訓練

1、將圖片轉換成tif格式,用于后面生成box文件??梢酝ㄟ^畫圖,然后另存為tif即可。

更改圖片名字,這個是有要求的=。=

tif文面命名格式[lang].[fontname].exp[num].tif
lang是語言 fontname是字體?
比如我們要訓練自定義字庫 mjorcen字體名normal
那么我們把圖片文件重命名 mjorcen.normal.exp0.jpg在轉tif。

?

2、生成box文件。

1tesseract mjorcen.normal.exp0.jpg mjorcen.normal.exp0 -l chi_sim batch.nochop makebox

box文件和對應的tif一定要在相同的目錄下,不然后面打不開。

?

3、打開jTessBoxEditor矯正錯誤并訓練

打開train.bat

找到tif圖,打開,并校正。

?

4、訓練。

只要在命令行輸入命令即可。

1tesseract? mjorcen.normal.exp0.jpg mjorcen.normal.exp0? nobatch box.train1unicharset_extractor mjorcen.normal.exp0.box

?

在這我明明已經(jīng)矯正好了,但是還是有1個字符不能識別出來,報的錯跟實際上完全沒有相關性,不知道是不是bug,到后面的結果就是“園”字沒有識別出來。

先不管,畢竟只有一個樣本。

?

新建一個font_properties文件

里面內(nèi)容寫入 normal 0 0 0 0 0 表示默認普通字體

?

繼續(xù)敲命令

1 2 3 4 5 6 7 8 9shapeclustering -F font_properties -U unicharset mjorcen.normal.exp0.tr? ? ?mftraining -F font_properties -U unicharset -O unicharset mjorcen.normal.exp0.tr? ? ?cntraining mjorcen.normal.exp0.tr

?

最后會生成五個文件,把目錄下的unicharset、inttemp、pffmtable、shapetable、normproto這五個文件前面都加上normal.

如圖:

?

命令行輸入,合并五個文件:

1combine_tessdata normal.

得到訓練好的字庫。

?

四、測試

1、把 normal.traineddata 復制到Tesseract-OCR 安裝目錄下的tessdata文件夾中

?

2、識別命令:

1tesseract mjorcen.normal.exp0.jpg mjorcen.normal.exp0 -l normal

?

3、效果

?

對比:

?

?

總結:肯定要自己訓練過后的字庫識別效果好,接下來要把整個項目弄進android,還要研究怎么將多個字庫合并成一個字庫,因為我不可能一次訓練完所有的圖片文字的。到時候有什么成果了再分享。

?

更新:沒有錯誤的話命令行的提示應該是這樣的


本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

納祥科技推出太陽能+Type-C雙充電自行車前燈方案,方案核心模塊包含太陽能板、單片機、三極管、3顆LED燈珠與1200mAh電池,通過低功耗單片機與三極管驅(qū)動,支持強光/弱光/爆閃3種模式,高流明遠射程,適配多種車型

關鍵字: 方案開發(fā) 電子方案 自行車前燈方案 納祥科技

慕尼黑2025年9月11日 /美通社/ -- 當?shù)貢r間9月9日,賽力斯動力在德國慕尼黑國際車展期間舉辦技術發(fā)布與交流會,正式在海外市場推出全新一代賽力斯超級增程、高效發(fā)動機和新一代分布式電驅(qū)動系統(tǒng),同時與來自全球的汽車產(chǎn)...

關鍵字: 慕尼黑 分布式 發(fā)動機 新能源汽車

慕尼黑2025年9月11日 /美通社/ -- 高端智能電動汽車品牌問界(AITO)在2025年德國國際汽車及智慧出行博覽會(IAA MOBILITY)上,正式發(fā)布了其最新全球產(chǎn)品陣容——專為中東市場深度本地化打造的AIT...

關鍵字: AI 智能駕駛 測試 生態(tài)系統(tǒng)

舍弗勒首次為中國頭部車企大規(guī)模生產(chǎn)高壓逆變磚 天津工廠一年內(nèi)完成量產(chǎn)準備,逆變器模塊性能參數(shù)顯著提升 與合作伙伴羅姆半導體共研尖端碳化硅技術,效率更高、性能更優(yōu) 模塊化可擴展設計使逆變磚易于集成,可廣泛...

關鍵字: 逆變 高壓 逆變器 集成

舍弗勒以"專注驅(qū)動技術的科技公司"為主題亮相IAA MOBILITY 2025(B3館B40展臺) 合并緯湃科技后首次亮相IAA MOBILITY,展示拓展后的汽車產(chǎn)品組合 憑借在軟件、...

關鍵字: 電氣 軟件 驅(qū)動技術 BSP

拉斯維加斯2025年9月11日 /美通社/ -- 在9月8日至11日舉辦的RE+ 2025展會上,全球綜合儲能解決方案供應商德賽電池(Desay Battery)全面展示了其創(chuàng)新成果,并宣布與深圳市華寶新能源股份有限公司...

關鍵字: 電池 電芯 人工智能 鋰電

香港2025年 9月12日 /美通社/ -- 全球領先的互聯(lián)網(wǎng)社區(qū)創(chuàng)建者 - 網(wǎng)龍網(wǎng)絡控股有限公司 ("網(wǎng)龍"或"本公司",香港交易所股票代碼:777)欣然宣布,其子公司My...

關鍵字: AI 遠程控制 控制技術 BSP

慕尼黑2025年9月12日 /美通社/ -- 慕尼黑當?shù)貢r間9月10日,在2025德國國際汽車及智慧出行博覽會(IAA MOBILITY)上,國際獨立第三方檢測、檢驗和認證機...

關鍵字: 測試 慕尼黑 模型 HUBER

上海2025年9月12日 /美通社/ -- 近日,國際獨立第三方檢測、檢驗和認證機構德國萊茵TÜV大中華區(qū)(簡稱"TÜV萊茵")為上海...

關鍵字: 測試 信息安全 安全管理 開關

廣州2025年9月12日 /美通社/ -- 9月11日,由國際獨立第三方檢測、檢驗和認證機構德國萊茵TÜV大中華區(qū)(簡稱"TÜV萊茵"...

關鍵字: 數(shù)字化 供應鏈 控制 電子
關閉