成人无码视频,亚洲精品久久久久av无码,午夜精品久久久久久毛片,亚洲 中文字幕 日韩 无码

資訊專欄INFORMATION COLUMN

Android OCR之tesseract

AWang / 1512人閱讀

摘要:開(kāi)始之旅相關(guān)常量設(shè)置訓(xùn)練數(shù)據(jù)路徑,必須包含文件夾識(shí)別語(yǔ)言英文識(shí)別語(yǔ)言簡(jiǎn)體中文英文識(shí)別設(shè)置圖片可以緩存獲取緩存的初始化的訓(xùn)練數(shù)據(jù)路徑與語(yǔ)言設(shè)置識(shí)別模式設(shè)置要識(shí)別的圖片簡(jiǎn)體中文識(shí)別與英文識(shí)別類似。

Android OCR之tesseract 1. 開(kāi)源工具簡(jiǎn)介

tesseract是非常有名的開(kāi)源OCR工具,但是要將它配置到Android開(kāi)發(fā)環(huán)境中可能要費(fèi)點(diǎn)功夫,別擔(dān)心,github上面有好人幫助我們封裝了Android開(kāi)發(fā)環(huán)境的tesseract配置,這就是Android平臺(tái)上OCR開(kāi)源項(xiàng)目tess-two。

2. 環(huán)境配置

利用tess-two配置OCR環(huán)境非常簡(jiǎn)單。

首先,設(shè)置工程的ndk路徑。

其次,在模塊中添加依賴:compile "com.rmtheis:tess-two:6.0.0"

3. 數(shù)據(jù)準(zhǔn)備

要進(jìn)行OCR還要獲取訓(xùn)練數(shù)據(jù)tessdata,下載該訓(xùn)練數(shù)據(jù),到時(shí)候?qū)⒂?xùn)練數(shù)據(jù)弄到自己的Android設(shè)備上就行了。

注意:不要把所有訓(xùn)練數(shù)據(jù)都弄到Android設(shè)備上,因?yàn)橛?xùn)練數(shù)據(jù)比較大,需要用到什么語(yǔ)言的數(shù)據(jù)就只把這些語(yǔ)言對(duì)應(yīng)的數(shù)據(jù)弄到Android設(shè)備上。

比如,我一般識(shí)別只用到識(shí)別英文與簡(jiǎn)體中文,因此只需要將eng.traineddata,chi_sim.traineddata弄到Android設(shè)備上就行了。

4. 開(kāi)始Android OCR之旅

相關(guān)常量設(shè)置:

    //訓(xùn)練數(shù)據(jù)路徑,必須包含tesseract文件夾
    static final String TESSBASE_PATH = "/storage/emulated/0/Download/tesseract/";
    //識(shí)別語(yǔ)言英文
    static final String DEFAULT_LANGUAGE = "eng";
    //識(shí)別語(yǔ)言簡(jiǎn)體中文
    static final String CHINESE_LANGUAGE = "chi_sim";  

英文識(shí)別:

     public void EnglishOCR(){
        //設(shè)置圖片可以緩存
        english.setDrawingCacheEnabled(true);
        //獲取緩存的bitmap
        final Bitmap bmp = english.getDrawingCache();
        final TessBaseAPI baseApi = new TessBaseAPI();
        //初始化OCR的訓(xùn)練數(shù)據(jù)路徑與語(yǔ)言
        baseApi.init(TESSBASE_PATH, DEFAULT_LANGUAGE);
        //設(shè)置識(shí)別模式
        baseApi.setPageSegMode(TessBaseAPI.PageSegMode.PSM_SINGLE_LINE);
        //設(shè)置要識(shí)別的圖片
        baseApi.setImage(bmp);
        english.setImageBitmap(bmp);
        englishtext.setText(baseApi.getUTF8Text());
        baseApi.clear();
        baseApi.end();
     }  

簡(jiǎn)體中文識(shí)別與英文識(shí)別類似。

5. 程序界面

程序源代碼下載:https://github.com/lavor-zl/FunctionsDemo

歡迎關(guān)注我的微信公眾號(hào):Android技術(shù)漫談

文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址:http://m.hztianpu.com/yun/65958.html

相關(guān)文章

  • Python圖像處理圖片文字識(shí)別(OCR

    摘要:與介紹將圖片翻譯成文字一般被稱為光學(xué)文字識(shí)別,。是目前公認(rèn)最優(yōu)秀最精確的開(kāi)源系統(tǒng)。我們以圖片為例輸入命令識(shí)別結(jié)果如下只識(shí)別錯(cuò)了一個(gè)字,識(shí)別率還是不錯(cuò)的。最后加一句,對(duì)于彩色圖片的識(shí)別效果沒(méi)有黑白圖片的效果好。 OCR與Tesseract介紹 ??將圖片翻譯成文字一般被稱為光學(xué)文字識(shí)別(Optical Character Recognition,OCR)??梢詫?shí)現(xiàn)OCR 的底層庫(kù)并不多,...

    W4n9Hu1 評(píng)論0 收藏0
  • 識(shí)別圖片中的文字 - Tesseract 和 百度云OCR的對(duì)比

    摘要:一個(gè)簡(jiǎn)單的圖片轉(zhuǎn)文字的函數(shù)實(shí)現(xiàn)如下。百度云這是偶然的發(fā)現(xiàn),百度云提供了一定額度的免費(fèi)的,目前是每日次,做做研究或者小應(yīng)用還勉強(qiáng)夠用,本文主要為了測(cè)試其效果。論中文,還是百度比谷歌更懂一點(diǎn)。 當(dāng)今時(shí)代人工智能都已經(jīng)是爛大街的詞了,OCR應(yīng)該也很多人都知道。 OCR (Optical Character Recognition,光學(xué)字符識(shí)別)是指電子設(shè)備(例如掃描儀或數(shù)碼相機(jī))檢查紙上打印...

    mushang 評(píng)論0 收藏0
  • [譯]OpenCV OCR and text recognition with Tesseract

    摘要:納入深度學(xué)習(xí)模型來(lái)進(jìn)一步提升準(zhǔn)確率只是時(shí)間問(wèn)題,事實(shí)上,這個(gè)時(shí)間已經(jīng)到來(lái)。最新版本支持基于深度學(xué)習(xí)的,準(zhǔn)確率顯著提高。該函數(shù)使用基于深度學(xué)習(xí)的文本檢測(cè)器來(lái)檢測(cè)不是識(shí)別圖像中的文本區(qū)域。高效使用概率最高的文本區(qū)域,刪除其他重疊區(qū)域。 By Adrian Rosebrock on September 17, 2018 in Deep Learning, Optical Character ...

    gnehc 評(píng)論0 收藏0

發(fā)表評(píng)論

0條評(píng)論

閱讀需要支付1元查看
<