トップページ情報工学を学ぶ人工知能の実行,Python プログラム (Windows 上)OpenCV を用いたテキスト検知(Text Detection)(dnn の EAST を使用)(Windows 上)

OpenCV を用いたテキスト検知(Text Detection)(dnn の EAST を使用)(Windows 上)

OpenCV を用いたテキスト検知(Text Detection)を行う. テキスト検知は,画像中のテキストの場所を検知するもの.

OpenCV のサンプルプログラムの dnn にある EAST の Python のプログラム)を実行する. 使用するソースコード等の利用条件等は利用者で確認すること。

EAST のテキスト検知モデルの URL:

https://github.com/argman/EAST

学習済みモデルのダウンロード

URL: https://www.dropbox.com/s/r2ingd0l3zt8hxs/frozen_east_text_detection.tar.gz?dl=1

onnx 形式のテキスト検知モデルのダウンロード

URL: https://drive.google.com/drive/folders/1cTbQ3nuZG-EKWak6emD_s8_hHXWz7lAr?usp=sharing

前準備

Python 3.10 64 ビット版のインストール,pip と setuptools の更新

① Python 3.10 64 ビット版のインストール(Windows 上)

インストールでの注意点

インストール手順

Windows での Python 3.10 のインストール(あとのトラブルが起きにくいような手順を定めている)

  1. TensorFlow のインストール予定がある場合には, 次のページで,必要な Python のバージョンを確認

    URL: https://pypi.org/project/tensorflow-gpu/#files

  2. Python の URL を開く

    URL: https://www.python.org

  3. Windows 版の Python 3.10 をダウンロード

    ページの上の方にある「Downloads」をクリック. 「Downloads」の下にメニューが出るので,その中の「Windows」をクリック

    [image]
  4. Stable Releases」から,Python のバージョンを選ぶ

    ここでは,Python 3.10.x (x は数字)を探して,選ぶ.

    [image]

    以下,Python 3.10.5 を選んだとして説明を続ける.他のバージョンでも以下の手順はほぼ同じである.

    TensorFlow を使う予定がある場合は,https://pypi.org/project/tensorflow-gpu/#filesで,必要な Python のバージョンを確認しておく. 2022/7 時点では,TensorFlow バージョン 2.9 が動くのは,Python 3.10 または Python 3.9 または Python 3.8 または Python 3.7 (https://pypi.org/project/tensorflow/2.9/#files)

  5. ファイルの種類を選ぶ.

    Windows の 64ビット版のインストーラをダウンロードしたいので、「Windows Installer (64-bit)」を選ぶ

    [image]
  6. ダウンロードが始まる

    [image]
  7. インストール時の設定
    1. いまダウンロードした .exe ファイルを右クリック, 右クリックメニューで「管理者として実行」を選ぶ.

      [image]
    2. Python ランチャーをインストールするために,「Install launcher for all users (recommended)」をチェック.

      [image]

      ※ すでに Python ランチャーをインストール済みのときは, 「Install launcher for all users (recommended)」がチェックできないようになっている場合がある.そのときは,チェックせずに進む.

      [image]
    3. Add Python 3.10 to PATH」をチェック.

      [image]
    4. Customize installation」をクリック.

      [image]
    5. オプションの機能 (Optional Features)は,既定(デフォルト)のままでよい. 「Next」をクリック

      [image]
    6. Install for all users」を選ぶ.

      Install for all users」を選ぶ理由.

      ユーザ名が日本語のときのトラブルを防ぐため.

      [image]
    7. そして,Python のインストールディレクトリは,「C:\Program Files\Python310」のように自動設定されることを確認.

      [image]
    8. Install」をクリック

      [image]
    9. インストールが始まる
    10. Disable path length limit」が表示される場合がある.クリックして、パス長の制限を解除する

      表示されない場合は問題ない.そのまま続行.

      [image]
    11. インストールが終了したら,「Close」をクリック

      [image]
  8. インストールのあと,Windows のスタートメニューに「Python 3.10」が増えていることを確認.
  9. システムの環境変数 Path の確認のため,新しくコマンドプロンプトを開き,次のコマンドを実行.

    pypipパスが通っていることの確認である.

    where py
    where pip
    

    where py では「C:\Windows\py.exe」 が表示され, where pip では「C:\Program Files\Python310\Scripts\pip.exe」 が表示されることを確認. (「310」のところは使用する Python のバージョンに読み替えること).

    [image]

    表示されないときは, システムの環境変数Pathに,C:\Program Files\Python310C:\Program Files\Python310\Scripts が追加済みであることを確認(「310」のところは使用する Python のバージョンに読み替えること).無ければ追加し,再度コマンドプロンプトを開いて,再度「where py」,「where pip」を実行して確認.

    それでもうまく行かない場合は,いろいろ原因が考えられる.対処としては,Python のアンインストールを行う.過去,アンインストールがうまく行かなかった可能性を疑う(Python の Scripts の中のファイルで,アンインストール操作により削除されるべきファイルが残っている可能性があるなど)

② pip と setuptools の更新

  1. Windows で,コマンドプロンプト管理者として実行

    Windowspip を実行するときは,コマンドプロンプト管理者として実行し,それを使って pip を実行することにする.

    コマンドプロンプトを管理者として実行: 別ページで説明している.

  2. 次のコマンドを実行.
    python -m pip install -U pip setuptools
    

    [image]

Python 用 OpenCV, OpenCV-Contrib のインストール

OpenCV,OpenCV-Contrib のソースコードのダウンロード

  1. Windows で,コマンドプロンプト管理者として実行する.
  2. OpenCV,OpenCV-Contrib のソースコードのダウンロード
    cd c:\
    rmdir /s /q opencv
    rmdir /s /q opencv_contrib
    git clone --recursive https://github.com/opencv/opencv.git
    git clone --recursive https://github.com/opencv/opencv_contrib.git
    

テキスト検知(OpenCV の dnn の EAST を使用)

OpenCV のサンプルプログラムの dnn にある EAST の Python のプログラム)を実行する. 使用するソースコード等の利用条件等は利用者で確認すること。

Windows の場合

  1. 学習済みモデルのダウンロード

    次の URL から .pb 形式ファイルをダウンロードする. ダウンロードしたファイルを,c:\opencv\samples\dnn に置く.

    URL: https://www.dropbox.com/s/r2ingd0l3zt8hxs/frozen_east_text_detection.tar.gz?dl=1

  2. onnx 形式のテキスト検知モデルのダウンロード

    次の URL から CRNN_VGG_BiLSTM_CTC.onnx をダウンロードする.

    URL: https://drive.google.com/drive/folders/1cTbQ3nuZG-EKWak6emD_s8_hHXWz7lAr?usp=sharing

    そして,ダウンロードしたファイルのファイル名を,crnn.onnx に変更し, c:\opencv\samples\dnn に置く.

  3. 実行してみる

    端末で,次のコマンドを実行. 「73.png」のところには,画像ファイル名を指定すること.

    cd c:\opencv\samples\dnn
    python text_detection.py --model frozen_east_text_detection.pb --input 73.png
    

    [image]

Ubuntu の場合

  1. 学習済みモデルのダウンロード

    次の URL から .pb 形式ファイルをダウンロードする. ダウンロードしたファイルを,/usr/local/opencv/samples/dnn に置く.

    URL: https://www.dropbox.com/s/r2ingd0l3zt8hxs/frozen_east_text_detection.tar.gz?dl=1

  2. onnx 形式のテキスト検知モデルのダウンロード

    次の URL から CRNN_VGG_BiLSTM_CTC.onnx をダウンロードする.

    URL: https://drive.google.com/drive/folders/1cTbQ3nuZG-EKWak6emD_s8_hHXWz7lAr?usp=sharing

    そして,ダウンロードしたファイルのファイル名を,crnn.onnx に変更し, /usr/local/opencv/samples/dnn に置く.

  3. 実行してみる

    端末で,次のコマンドを実行. 「73.png」のところには,画像ファイル名を指定すること.

    cd /usr/local/opencv/samples/dnn
    python3 text_detection.py --model frozen_east_text_detection.pb --input 73.png
    

    [image]

    [image]