OpenCV を用いたテキスト検知（Text Detection）（dnn の EAST を使用）（Windows 上）

OpenCV を用いたテキスト検知（Text Detection）を行う．テキスト検知は，画像中のテキストの場所を検知するもの．

OpenCV のサンプルプログラムの dnn にある EAST の Python のプログラム）を実行する．使用するソースコード等の利用条件等は利用者で確認すること。

EAST のテキスト検知モデルの URL:

https://github.com/argman/EAST

学習済みモデルのダウンロード

URL: https://www.dropbox.com/s/r2ingd0l3zt8hxs/frozen_east_text_detection.tar.gz?dl=1

onnx 形式のテキスト検知モデルのダウンロード

URL: https://drive.google.com/drive/folders/1cTbQ3nuZG-EKWak6emD_s8_hHXWz7lAr?usp=sharing

前準備

Python のインストールと必要なPythonライブラリのインストール（Windows上）

Python のインストール
注：既にPython（バージョン3.12を推奨）がインストール済みの場合は，この手順は不要である．

winget（Windowsパッケージマネージャー）を使用してインストールを行う
1. Windowsで，管理者権限でコマンドプロンプトを起動（手順：Windowsキーまたはスタートメニュー > cmd と入力 > 右クリック > 「管理者として実行」）。
2. winget（Windowsパッケージマネージャー）が利用可能か確認する：
  winget --version
3. Pythonのインストール（下のコマンドにより Python 3.12 がインストールされる）．
  reg add "HKLM\SYSTEM\CurrentControlSet\Control\FileSystem" /v LongPathsEnabled /t REG_DWORD /d 1 /f REM Python をシステム領域にインストール winget install --scope machine --id Python.Python.3.12 -e --silent REM Python のパス set "INSTALL_PATH=C:\Program Files\Python312" echo %PATH% | find /i "%INSTALL_PATH%" >nul if errorlevel 1 setx PATH "%PATH%;%INSTALL_PATH%" /M >nul echo %PATH% | find /i "%INSTALL_PATH%\Scripts" >nul if errorlevel 1 setx PATH "%PATH%;%INSTALL_PATH%\Scripts" /M >nul
必要なPythonライブラリのインストール
1. Windowsで，管理者権限でコマンドプロンプトを起動（手順：Windowsキーまたはスタートメニュー > cmd と入力 > 右クリック > 「管理者として実行」）。
2. 以下のコマンドを実行し，必要なライブラリをインストールする．
  pip install -U opencv-python opencv-contrib-python

【関連する外部ページ】

Python公式サイト：https://www.python.org/

【サイト内の関連ページ】

Python詳細ガイド：別ページ »

OpenCV，OpenCV-Contrib のソースコードのダウンロード

Windows で，管理者権限でコマンドプロンプトを起動（手順：Windowsキーまたはスタートメニュー > cmd と入力 > 右クリック > 「管理者として実行」）。．

コマンドプロンプトを管理者として実行: 別ページ »で説明

OpenCV，OpenCV-Contrib のソースコードのダウンロード

cd c:\
rmdir /s /q opencv
rmdir /s /q opencv_contrib
git clone --recursive https://github.com/opencv/opencv.git
git clone --recursive https://github.com/opencv/opencv_contrib.git

テキスト検知（OpenCV の dnn の EAST を使用）

OpenCV のサンプルプログラムの dnn にある EAST の Python のプログラム）を実行する．使用するソースコード等の利用条件等は利用者で確認すること。

Windows の場合

Windows を使用する場合は，次のように操作する．

学習済みモデルのダウンロード
次の URL から .pb 形式ファイルをダウンロードする．ダウンロードしたファイルを，c:\opencv\samples\dnn に置く．
URL: https://www.dropbox.com/s/r2ingd0l3zt8hxs/frozen_east_text_detection.tar.gz?dl=1
onnx 形式のテキスト検知モデルのダウンロード
次の URL から CRNN_VGG_BiLSTM_CTC.onnx をダウンロードする．
URL: https://drive.google.com/drive/folders/1cTbQ3nuZG-EKWak6emD_s8_hHXWz7lAr?usp=sharing
そして，ダウンロードしたファイルのファイル名を，crnn.onnx に変更し， c:\opencv\samples\dnn に置く．
実行してみる
次のコマンドを実行．「73.png」のところには，画像ファイル名を指定すること．
cd c:\opencv\samples\dnn python text_detection.py --model frozen_east_text_detection.pb --input 73.png

Ubuntu の場合

Ubuntu を使用する場合は，次のように操作する．

学習済みモデルのダウンロード
次の URL から .pb 形式ファイルをダウンロードする．ダウンロードしたファイルを，/usr/local/opencv/samples/dnn に置く．
URL: https://www.dropbox.com/s/r2ingd0l3zt8hxs/frozen_east_text_detection.tar.gz?dl=1
onnx 形式のテキスト検知モデルのダウンロード
次の URL から CRNN_VGG_BiLSTM_CTC.onnx をダウンロードする．
URL: https://drive.google.com/drive/folders/1cTbQ3nuZG-EKWak6emD_s8_hHXWz7lAr?usp=sharing
そして，ダウンロードしたファイルのファイル名を，crnn.onnx に変更し， /usr/local/opencv/samples/dnn に置く．
実行してみる
次のコマンドを実行．「73.png」のところには，画像ファイル名を指定すること．
cd /usr/local/opencv/samples/dnn python3 text_detection.py --model frozen_east_text_detection.pb --input 73.png