トップページ -> コンピュータ -> Linux で開発環境やツールを整備 -> Ubuntu で Tesseract のインストール
[サイトマップへ], サイト内検索:

Ubuntu で Tesseract のインストール

サイト構成 連絡先,業績など 実践知識 データの扱い コンピュータ 教材 サポートページ

Tesseract は OCR ソフトウエア


事前準備


手動でのダウンロードとビルドとインストール

  1. Leptonica は画像処理、画像解析ソフトウエア・ライブラリ
    sudo apt-get install zlib1g-dev
    sudo apt-get install libpng12-dev libjpeg62-dev libtiff4-dev libsdl-gfx1.2-dev libsdl-image1.2-dev libsdl1.2-dev libavcodec-dev libavdevice-dev libavformat-dev libavutil-dev 
    sudo apt-get install python-enchant python-poppler 
    
    cd /tmp
    wget http://www.leptonica.com/source/leptonica-1.69.tar.gz
    tar -xvzof leptonica-1.69.tar.gz
    cd leptonica-1.69
    ./configure
    make 
    sudo make install
    sudo /sbin/ldconfig
    

  2. Tesseract は OCR エンジン・ソフトウエア
    cd /tmp
    wget http://tesseract-ocr.googlecode.com/files/tesseract-3.02.02.tar.gz
    tar -xvzof tesseract-3.02.02.tar.gz
    cd tesseract-3.02.02
    automake
    ./configure 
    sudo rm -f /usr/local/share/tessdata
    sudo mkdir /usr/local/share/tessdata
    make 
    sudo make install
    sudo /sbin/ldconfig
    
    cd /tmp
    wget http://tesseract-ocr.googlecode.com/files/eng.traineddata.gz
    wget http://tesseract-ocr.googlecode.com/files/jpn.traineddata.gz
    cd /usr/local/share/tessdata
    gzip -d /tmp/eng.traineddata.gz
    gzip -d /tmp/jpn.traineddata.gz
    sudo cp /tmp/eng.traineddata /usr/local/share/tessdata
    sudo cp /tmp/jpn.traineddata /usr/local/share/tessdata
    

  3. gImageReader
    cd /tmp
    wget http://sourceforge.net/projects/gimagereader/files/0.9/gimagereader_0.9-1_all.deb
    sudo dpkg -i gimagereader_0.9-1_all.deb
    

  4. OCRopus は文書解析とOCRの機能を持ったソフトウエア
    sudo apt-get install mercurial
    hg clone -r ocropus-0.6 https://code.google.com/p/ocropus
    cd ocropus/ocropy
    sudo apt-get install $(cat PACKAGES)
    python setup.py download_models
    sudo python setup.py install
    ./run-test