ocropy のインストール(Ubuntu 上)(書きかけ)

Tesseract OCRは文字認識のソフトウェア

前準備

Ubuntu のシステム更新

Ubuntu で OS のシステム更新を行うときは, 端末で,次のコマンドを実行する.

Ubuntu で OS のシステム更新を行うときは, 端末で,次のコマンドを実行する。これは、パッケージ情報を最新の状態に保ち、インストール済みのパッケージをセキュリティアップデートやバグ修正を含めて更新するためである。

Ubuntu のインストールはこちらの別ページで説明する。

# パッケージリストの情報を更新
sudo apt update
# インストール済みのパッケージを包括的に更新 (依存関係も考慮)
sudo apt full-upgrade
# カーネル更新等で実際に再起動が必要な場合のみ実行を推奨
# sudo shutdown -r now

ocropy のインストール

OCRopus は文書解析とOCR の機能を持ったソフトウェア

https://github.com/ocropus/ocropy に記載の手順でインストールする.

cd /tmp
git clone --recursive https://github.com/ocropus/ocropy
sudo apt -y install python-scipy python-matplotlib python-lxml
cd ocropy
wget -nd https://github.com/zuphilip/ocropy-models/raw/master/en-default.pyrnn.gz
mv en-default.pyrnn.gz models/
sudo python setup.py install