OpenCV を用いたテキスト検知(Text Detection)(dnn の EAST を使用)(Windows 上)

OpenCV を用いたテキスト検知(Text Detection)を行う. テキスト検知は,画像中のテキストの場所を検知するもの.

OpenCV のサンプルプログラムの dnn にある EAST の Python のプログラム)を実行する. 使用するソースコード等の利用条件等は利用者で確認すること。

EAST のテキスト検知モデルの URL:

https://github.com/argman/EAST

学習済みモデルのダウンロード

URL: https://www.dropbox.com/s/r2ingd0l3zt8hxs/frozen_east_text_detection.tar.gz?dl=1

onnx 形式のテキスト検知モデルのダウンロード

URL: https://drive.google.com/drive/folders/1cTbQ3nuZG-EKWak6emD_s8_hHXWz7lAr?usp=sharing

前準備

Python のインストールと必要なPythonライブラリのインストール(Windows上)

  1. Python のインストール

    注:既にPython(バージョン3.12を推奨)がインストール済みの場合は,この手順は不要である.

    winget(Windowsパッケージマネージャー)を使用してインストールを行う

    1. Windowsで,コマンドプロンプト管理者権限で起動する(例:Windowsキーを押し,「cmd」と入力し,「管理者として実行」を選択)
    2. winget(Windowsパッケージマネージャー)が利用可能か確認する:
      winget --version
      
    3. Pythonのインストール(下のコマンドにより Python 3.12 がインストールされる).
      winget install --scope machine Python.Launcher
      winget install --scope machine Python.Python.3.12
      
  2. 必要なPythonライブラリのインストール
    1. Windowsで,コマンドプロンプト管理者権限で起動する(例:Windowsキーを押し,「cmd」と入力し,「管理者として実行」を選択)
    2. 以下のコマンドを実行し,必要なライブラリをインストールする.
      pip install -U opencv-python opencv-contrib-python
      

【関連する外部ページ】

【サイト内の関連ページ】

OpenCV,OpenCV-Contrib のソースコードのダウンロード

  1. Windows で,コマンドプロンプト管理者権限で起動する(例:Windowsキーを押し,「cmd」と入力し,「管理者として実行」を選択).

    コマンドプロンプトを管理者として実行: 別ページ »で説明

  2. OpenCV,OpenCV-Contrib のソースコードのダウンロード
    cd c:\
    rmdir /s /q opencv
    rmdir /s /q opencv_contrib
    git clone --recursive https://github.com/opencv/opencv.git
    git clone --recursive https://github.com/opencv/opencv_contrib.git
    

テキスト検知(OpenCV の dnn の EAST を使用)

OpenCV のサンプルプログラムの dnn にある EAST の Python のプログラム)を実行する. 使用するソースコード等の利用条件等は利用者で確認すること。

Windows の場合

Windows を使用する場合は,次のように操作する.

  1. 学習済みモデルのダウンロード

    次の URL から .pb 形式ファイルをダウンロードする. ダウンロードしたファイルを,c:\opencv\samples\dnn に置く.

    URL: https://www.dropbox.com/s/r2ingd0l3zt8hxs/frozen_east_text_detection.tar.gz?dl=1

  2. onnx 形式のテキスト検知モデルのダウンロード

    次の URL から CRNN_VGG_BiLSTM_CTC.onnx をダウンロードする.

    URL: https://drive.google.com/drive/folders/1cTbQ3nuZG-EKWak6emD_s8_hHXWz7lAr?usp=sharing

    そして,ダウンロードしたファイルのファイル名を,crnn.onnx に変更し, c:\opencv\samples\dnn に置く.

  3. 実行してみる

    次のコマンドを実行. 「73.png」のところには,画像ファイル名を指定すること.

    cd c:\opencv\samples\dnn
    python text_detection.py --model frozen_east_text_detection.pb --input 73.png
    

Ubuntu の場合

Ubuntu を使用する場合は,次のように操作する.

  1. 学習済みモデルのダウンロード

    次の URL から .pb 形式ファイルをダウンロードする. ダウンロードしたファイルを,/usr/local/opencv/samples/dnn に置く.

    URL: https://www.dropbox.com/s/r2ingd0l3zt8hxs/frozen_east_text_detection.tar.gz?dl=1

  2. onnx 形式のテキスト検知モデルのダウンロード

    次の URL から CRNN_VGG_BiLSTM_CTC.onnx をダウンロードする.

    URL: https://drive.google.com/drive/folders/1cTbQ3nuZG-EKWak6emD_s8_hHXWz7lAr?usp=sharing

    そして,ダウンロードしたファイルのファイル名を,crnn.onnx に変更し, /usr/local/opencv/samples/dnn に置く.

  3. 実行してみる

    次のコマンドを実行. 「73.png」のところには,画像ファイル名を指定すること.

    cd /usr/local/opencv/samples/dnn
    python3 text_detection.py --model frozen_east_text_detection.pb --input 73.png