摘要:計算機的發(fā)展令文字傳播愈發(fā)廣泛,生活中越來越多的文字需要錄入電腦,以方便轉發(fā)、記錄,為此需要耗費大量勞動力,盡管當今已經(jīng)有許多文字識別錄入方式,但仍難以達到日常生活中低精度圖片識別的標準?,F(xiàn)主要采用卷積神經(jīng)網(wǎng)絡(CNN)解決問題,輔以區(qū)域識別,減少圖片本身帶來的影響,再用多分類方式,實現(xiàn)部分區(qū)域生成,拆分任務一一對應識別,令任務更加高效。也就是說,當拿到需要處理的圖片后,先將其用不同大小的卷積核處理,進行特征的初提取,再將數(shù)據(jù)放入池化層進行特征的進一步提取,如此往復循環(huán)后將數(shù)據(jù)進行分類,后經(jīng)處理完成識別。該方法解決了日常生活中書寫文字識別的部分難點,讓文字錄入更為方便高效,減少了大量的時間浪費。
近年來,計算機圖形圖像處理技術獲得突破性的進展,個人PC中也涌現(xiàn)出越來越多令人驚嘆的圖形處理軟件,憑借著數(shù)學界領域的最新研究,個人電腦已經(jīng)開始學會了“看”圖,讀懂文字
12月4日,深度學習算法的發(fā)展,使得人工智能技術得以廣泛應用于生活的各個領域。 借助圖像識別、OCR等技術,把一張圖片或書本上的文字,通過“拍一拍、掃一掃”轉化成“電子版”文件,已經(jīng)不是難事。比如百度