Tesseract OCR システムを用いた複数画像の一括処理例(Ubuntu 上)

複数の画像ファイルを1度に文字認識させたいとする.

Ubuntu を利用

画像 ファイルは png

次のプログラムを実行

echo 
for i in *.png; do
  echo $i
  tesseract $i outbase -l jpn -psm 10 & /dev/null
  nkf -s outbase.txt
  rm -f outbase.txt;
done

金子研究室サポート:

次の手順で演習用データをダウンロード

wget https://www.kkaneko.jp/lab/vehicle_registration/licenseplate_tile-2018-04-19.tar.gz
tar -xvzof licenseplate_tile-2018-04-19.tar.gz