OpenCV を用いたテキスト検知(Text Detection)(dnn の EAST を使用)(Windows 上)
OpenCV を用いたテキスト検知(Text Detection)を行う. テキスト検知は,画像中のテキストの場所を検知するもの.
OpenCV のサンプルプログラムの dnn にある EAST の Python のプログラム)を実行する. 使用するソースコード等の利用条件等は利用者で確認すること。
EAST のテキスト検知モデルの URL:
https://github.com/argman/EAST
学習済みモデルのダウンロード
URL: https://www.dropbox.com/s/r2ingd0l3zt8hxs/frozen_east_text_detection.tar.gz?dl=1
onnx 形式のテキスト検知モデルのダウンロード
URL: https://drive.google.com/drive/folders/1cTbQ3nuZG-EKWak6emD_s8_hHXWz7lAr?usp=sharing
前準備
Python のインストールと必要なPythonライブラリのインストール(Windows上)
- Python のインストール
注:既にPython(バージョン3.12を推奨)がインストール済みの場合は,この手順は不要である.
winget(Windowsパッケージマネージャー)を使用してインストールを行う
- Windowsで,コマンドプロンプトを管理者権限で起動する(手順:Windowsキーまたはスタートメニュー,「cmd」と入力,右クリックメニューなどで「管理者として実行」を選択)
- winget(Windowsパッケージマネージャー)が利用可能か確認する:
winget --version
- Pythonのインストール(下のコマンドにより Python 3.12 がインストールされる).
reg add "HKLM\SYSTEM\CurrentControlSet\Control\FileSystem" /v LongPathsEnabled /t REG_DWORD /d 1 /f REM Python をシステム領域にインストール winget install --scope machine --id Python.Python.3.12 --id Python.Launcher -e --silent REM Python のパス set "INSTALL_PATH=C:\Program Files\Python312" echo %PATH% | find /i "%INSTALL_PATH%" >nul if errorlevel 1 setx PATH "%PATH%;%INSTALL_PATH%" /M >nul echo %PATH% | find /i "%INSTALL_PATH%\Scripts" >nul if errorlevel 1 setx PATH "%PATH%;%INSTALL_PATH%\Scripts" /M >nul
- 必要なPythonライブラリのインストール
【関連する外部ページ】
【サイト内の関連ページ】
OpenCV,OpenCV-Contrib のソースコードのダウンロード
- Windows で,コマンドプロンプトを管理者権限で起動する(手順:Windowsキーまたはスタートメニュー,「cmd」と入力,右クリックメニューなどで「管理者として実行」を選択).
コマンドプロンプトを管理者として実行: 別ページ »で説明
- OpenCV,OpenCV-Contrib のソースコードのダウンロード
テキスト検知(OpenCV の dnn の EAST を使用)
OpenCV のサンプルプログラムの dnn にある EAST の Python のプログラム)を実行する. 使用するソースコード等の利用条件等は利用者で確認すること。
Windows の場合
Windows を使用する場合は,次のように操作する.
- 学習済みモデルのダウンロード
次の URL から .pb 形式ファイルをダウンロードする. ダウンロードしたファイルを,c:\opencv\samples\dnn に置く.
URL: https://www.dropbox.com/s/r2ingd0l3zt8hxs/frozen_east_text_detection.tar.gz?dl=1
- onnx 形式のテキスト検知モデルのダウンロード
次の URL から CRNN_VGG_BiLSTM_CTC.onnx をダウンロードする.
URL: https://drive.google.com/drive/folders/1cTbQ3nuZG-EKWak6emD_s8_hHXWz7lAr?usp=sharing
そして,ダウンロードしたファイルのファイル名を,crnn.onnx に変更し, c:\opencv\samples\dnn に置く.
- 実行してみる
次のコマンドを実行. 「73.png」のところには,画像ファイル名を指定すること.
cd c:\opencv\samples\dnn python text_detection.py --model frozen_east_text_detection.pb --input 73.png
Ubuntu の場合
Ubuntu を使用する場合は,次のように操作する.
- 学習済みモデルのダウンロード
次の URL から .pb 形式ファイルをダウンロードする. ダウンロードしたファイルを,/usr/local/opencv/samples/dnn に置く.
URL: https://www.dropbox.com/s/r2ingd0l3zt8hxs/frozen_east_text_detection.tar.gz?dl=1
- onnx 形式のテキスト検知モデルのダウンロード
次の URL から CRNN_VGG_BiLSTM_CTC.onnx をダウンロードする.
URL: https://drive.google.com/drive/folders/1cTbQ3nuZG-EKWak6emD_s8_hHXWz7lAr?usp=sharing
そして,ダウンロードしたファイルのファイル名を,crnn.onnx に変更し, /usr/local/opencv/samples/dnn に置く.
- 実行してみる
次のコマンドを実行. 「73.png」のところには,画像ファイル名を指定すること.
cd /usr/local/opencv/samples/dnn python3 text_detection.py --model frozen_east_text_detection.pb --input 73.png