トップページ -> インストール,設定,利用 -> Ubuntu, Debian ソフトウエア -> Tesseract OCR のビルドとインストール(ソースコードを使用)(Ubuntu 上)
[サイトマップへ], [サイト内検索へ]

Tesseract OCR のビルドとインストール(ソースコードを使用)(Ubuntu 上)

tesseract-ocrは文字認識のソフトウエア

ユースケース.Tesseract OCR は,apt コマンドでインストールできる (その手順は,別ページで説明している). Tesseract OCR の最新版を追いかけたい場合は,ソースコードからビルドする.


前準備

OS のシステム更新

Ubuntu, Debian で OS のシステム更新を行うときは, 端末で,次のコマンドを実行.

sudo apt update
sudo apt -yV upgrade
sudo /sbin/shutdown -r now

git, cmake, wget, p7zip-full のインストール

端末で,次のコマンドを実行.

sudo apt -yV install git cmake cmake-curses-gui cmake-gui wget p7zip-full

GNU コンパイラ・コレクション(C, C++ 処理系),make のインストール

端末で,次のコマンドを実行.

sudo apt -yV install build-essential gcc g++ make 

ダウンロードとビルドとインストール

  1. Leptonica は画像処理、画像解析ソフトウエア・ライブラリ
    sudo apt -yV install zlib1g-dev
    sudo apt -yV install libpng-dev libjpeg-dev libtiff5-dev libsdl-gfx1.2-dev libsdl-image1.2-dev libsdl1.2-dev libavcodec-dev libavdevice-dev libavformat-dev libavutil-dev 
    sudo apt -yV install python-enchant python-poppler 
    
    cd /tmp
    rm leptonica-1.79.0.tar.gz
    wget http://www.leptonica.org/source/leptonica-1.79.0.tar.gz
    tar -xvzof leptonica-1.79.0.tar.gz
    cd leptonica-1.79.0
    ./configure
    make
    sudo make install
    sudo /sbin/ldconfig
    
  2. Tesseract は OCR エンジン・ソフトウエア
    sudo apt -yV install automake
    cd /tmp
    git clone https://github.com/tesseract-ocr/tesseract
    cd tesseract
    ./autogen.sh
    ./configure
    sudo rm -f /usr/local/share/tessdata
    sudo mkdir /usr/local/share/tessdata
    make
    sudo make install
    sudo /sbin/ldconfig
    
    cd /tmp
    wget http://tesseract-ocr.googlecode.com/files/eng.traineddata.gz
    wget http://tesseract-ocr.googlecode.com/files/jpn.traineddata.gz
    cd /usr/local/share/tessdata
    gzip -d /tmp/eng.traineddata.gz
    gzip -d /tmp/jpn.traineddata.gz
    sudo cp /tmp/eng.traineddata /usr/local/share/tessdata
    sudo cp /tmp/jpn.traineddata /usr/local/share/tessdata
    
  3. gImageReader

    gImageReader は Tesseract OCR の GUI フロントエンド

    sudo apt -yV install gimagereader
    
  4. OCRopus は文書解析とOCRの機能を持ったソフトウエア
    sudo apt-get install mercurial
    hg clone -r ocropus-0.6 https://code.google.com/p/ocropus
    cd ocropus/ocropy
    sudo apt-get install $(cat PACKAGES)
    python setup.py download_models
    sudo python setup.py install
    ./run-test
    

本サイトのサイトマップは,サイトマップのページをご覧下さい. 本サイト内の検索は,サイト内検索のページをご利用下さい.

問い合わせ先: 金子邦彦(かねこ くにひこ) [image]