国产成人精品亚洲777人妖,欧美日韩精品一区视频,最新亚洲国产,国产乱码精品一区二区亚洲

您的位置:首頁技術文章
文章詳情頁

SpringBoot+Tess4j實現牛逼的OCR識別工具的示例代碼

瀏覽:111日期:2023-03-30 09:16:05
前言

“ 等不到風中你的臉頰

眼淚都美到很融洽

等不到掩飾的雨落下

我的眼淚被你察覺 ”

聽著循環的歌曲,寫著久違的bug。好吧,還是一天。正好一個小伙伴說,要不要做個工具站玩一下。我就隨意的找了個工具站,看了下,發現很多都有文字的OCR識別功能。因此,我想起來之前了解的非常流行的開源的OCR大神級別的項目,Tesseract OCR。

簡單介紹

官網如下所示

SpringBoot+Tess4j實現牛逼的OCR識別工具的示例代碼

tesseract-ocr.github.io/

簡潔明了,掛在github上的網站。

SpringBoot+Tess4j實現牛逼的OCR識別工具的示例代碼

詳細的不再介紹,感興趣的,可以進入同志網站:https://github.com/tesseract-ocr/tesseract ,觀摩學習。

實操準備

要想在開發中使用,還是需要接入對應的API。

SpringBoot+Tess4j實現牛逼的OCR識別工具的示例代碼

對于開發者來說,提供了眾多的Wrapper,來實現Api調用。

SpringBoot+Tess4j實現牛逼的OCR識別工具的示例代碼

對于Java一名小開發,來講,還是使用tess4j,作為Api來使用。官網如下:

tess4j.sourceforge.net/

可以直接下載jar包,或者采用Maven依賴下載。

<!-- https://mvnrepository.com/artifact/net.sourceforge.tess4j/tess4j --><dependency> <groupId>net.sourceforge.tess4j</groupId> <artifactId>tess4j</artifactId> <version>4.5.3</version></dependency>開發實現First 創建工程

SpringBoot+Tess4j實現牛逼的OCR識別工具的示例代碼

Second 添加依賴

<?xml version='1.0' encoding='UTF-8'?><project xmlns='http://maven.apache.org/POM/4.0.0' xmlns:xsi='http://www.w3.org/2001/XMLSchema-instance' xsi:schemaLocation='http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd'> <modelVersion>4.0.0</modelVersion> <groupId>org.example</groupId> <artifactId>test-textocr</artifactId> <version>1.0-SNAPSHOT</version> <dependencies> <!-- https://mvnrepository.com/artifact/net.sourceforge.tess4j/tess4j --> <dependency> <groupId>net.sourceforge.tess4j</groupId> <artifactId>tess4j</artifactId> <version>4.5.3</version> </dependency> </dependencies></project>Third 填寫類文件

package ocr;import net.sourceforge.tess4j.ITesseract;import net.sourceforge.tess4j.Tesseract;import net.sourceforge.tess4j.TesseractException;import javax.imageio.ImageIO;import java.awt.image.BufferedImage;import java.io.IOException;/*** ocr測試.** @author huc_逆天* @since 2021/1/12 17:42*/public class TestTextOcr { public static void main(String[] args) throws IOException { // 創建實例 ITesseract instance = new Tesseract(); // 設置識別語言 instance.setLanguage('chi_sim'); // 設置識別引擎 instance.setOcrEngineMode(1); // 讀取文件 BufferedImage image = ImageIO.read(TestTextOcr.class.getResourceAsStream('/2.jpg')); try { // 識別 String result = instance.doOCR(image); System.out.println(result); } catch (TesseractException e) { System.err.println(e.getMessage()); } }}

SpringBoot+Tess4j實現牛逼的OCR識別工具的示例代碼

Fifth 添加訓練語言環境配置

SpringBoot+Tess4j實現牛逼的OCR識別工具的示例代碼

TESSDATA_PREFIX=F:tessdata ,變量名,固定,值為官網下載文件 https://github.com/tesseract-ocr/tessdata

Sixth 運行

結果如下:

SpringBoot+Tess4j實現牛逼的OCR識別工具的示例代碼

可能識別模式,不是很合適,切換下

instance.setOcrEngineMode(0);

SpringBoot+Tess4j實現牛逼的OCR識別工具的示例代碼

是不是舒服多了,哈哈。識別率瞬間上漲。

大家可以自行測試。

總結

好了,今天就到這了。技術在于折騰。多學習,讓自己武裝起來,變強大。

到此這篇關于SpringBoot+Tess4j實現牛逼的OCR識別工具的示例代碼的文章就介紹到這了,更多相關SpringBoot Tess4j OCR識別內容請搜索好吧啦網以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持好吧啦網!

標簽: Spring
相關文章:
主站蜘蛛池模板: 茌平县| 子长县| 太保市| 浠水县| 鹤壁市| 肇州县| 夏河县| 拉孜县| 桦川县| 农安县| 武邑县| 大姚县| 二连浩特市| 和平区| 赫章县| 玉屏| 张家口市| 九台市| 潢川县| 临洮县| 桐城市| 保定市| 宁阳县| 从化市| 故城县| 镶黄旗| 望谟县| 弥勒县| 辽阳县| 榆树市| 长子县| 左云县| 和政县| 凤翔县| 平罗县| 横山县| 方正县| 长治县| 土默特左旗| 富源县| 区。|