一、 Window 安装 Tesseract-OCR
1.安装 tesseract-ocr-w64-setup-5.3.1.20230401.exe
下载地址:https://digi.bib.uni-mannheim.de/tesseract/
2. 配置 PATH 环境变量
3. 配置TESSDATA_PREFIX 环境变量
4. 在 cmd 中查询是否安装成功
5. 在安装的目录 tessdata 下可以看到不同的语言包
如果不够用,可以去 github 上面下载自己所属的语言包
地址:https://gitcode.net/mirrors/tesseract-ocr/tessdata?utm_source=csdn_github_accelerator
6. 如果可以查询到版本号,但是使用时候还是提示查询不到系统参数 TESSDATA_PREFIX,试一下重启电脑
二、 Linux 安装 Tesseract-OCR
1.升级 gcc 版本
yum install -y centos-release-scl
yum install devtoolset-8-gcc*
替换旧的gcc
mv /usr/bin/gcc /usr/bin/gcc-4.8.5
ln -s /opt/rh/devtoolset-8/root/bin/gcc /usr/bin/gcc
mv /usr/bin/g++ /usr/bin/g++-4.8.5
ln -s /opt/rh/devtoolset-8/root/bin/g++ /usr/bin/g++
2.安装 libpng 和 libtiff
yum install libjpeg-devel libpng-devel libtiff-devel
3.下载 tesseract-ocr 压缩包
https://codeload.github.com/tesseract-ocr/tesseract/tar.gz/4.0.0
下载 leptonica 压缩包
http://www.leptonica.org/source/leptonica-1.78.0.tar.gz
4.创建目录 /usr/local/tesseract
5.安装 tesseract-ocr
将 tesseract-ocr 压缩包解压到 /usr/local/tesseract 目录下
进入 /usr/local/tesseract/tesseract-5.3.1
中
分别执行
./autogen.sh
./configure
make
make install
执行 ldconfig,查看是否安装成功
6.配置 tesseract-ocr 环境变量
执行 vim /etc/profile
在结尾添加配置
PATH=$PATH:/usr/local/tesseract/bin
export PATH
export TESSDATA_PREFIX=/usr/local/share/tessdata
export PATH=$PATH:$TESSDATA_PREFIX
执行以下命令使配置生效
source /etc/profile
7.查看 tesseract-ocr 的版本号
tesseract -v
8. 安装 leptonica
将 tesseract-ocr 压缩包解压到 /usr/local/tesseract 目录下
进入 /usr/local/tesseract/leptonica-1.78.0
中
分别执行
./configure
make
make install
安装 automake 和 libtool
yum install automake
yum install libtool
9.配置leptonica环境变量
执行 vim /etc/profile
在结尾添加配置
export LD_LIBRARY_PATH=/usr/local/lib
export LIBLEPT_HEADERSDIR=/usr/local/include
export PKG_CONFIG_PATH=/usr/local/lib/pkgconfig
执行以下命令使配置生效
source /etc/profile
10.将语言包放到指定目录下
将语言包复制到 /usr/local/share/tessdata