トップページインストール,運用Ubuntu ソフトウエアTesseract OCR のインストール(Ubuntu 上)

Tesseract OCR のインストール(Ubuntu 上)

tesseract-ocrは文字認識のソフトウエア

【サイト内の関連ページ】

● 実演ビデオ(YouTube)「Tesseract OCR 5 のインストール(Ubuntu 上)」

動画リンク: https://youtu.be/dQu4GHy754o

前準備

Ubuntu で OS のシステム更新を行うときは, 端末で,次のコマンドを実行.

Ubuntu のインストールは別ページで説明している

sudo apt -y update
sudo apt -yV upgrade
sudo /sbin/shutdown -r now

apt コマンドを用いて Tesseract OCR システムをインストール

  1. インストール操作
    sudo apt -y update
    sudo apt -y install tesseract-ocr tesseract-ocr-jpn libtesseract-dev libleptonica-dev tesseract-ocr-script-jpan tesseract-ocr-script-jpan-vert 
    
  2. 使用できる言語の確認
    tesseract --list-langs
    

    [image]
  3. テスト実行

    画像ファイルを用意し、テスト実行してみる

    tesseract 48.png outbase -l jpn
    cat outbase.txt 
    

    [image]

関連ソフトウエアのインストール

gImageReader は Tesseract OCR の GUI フロントエンド

sudo apt -y update
sudo apt -y install gimagereader