金子邦彦研究室人工知能Windows でのインストールと動作確認(人工知能関係)EasyOCR のインストールと動作確認(多言語の文字認識)(Python,PyTorch を使用)(Windows 上)

EasyOCR のインストールと動作確認(多言語の文字認識)(Python,PyTorch を使用)(Windows 上)

EasyOCR は,多言語の文字認識のソフトウエア. テキスト検出に CRAFT を使用.

[image]

[image]

学習用のソースコードも公開されている.

関連する外部ページ

前準備

Git のインストール(Windows 上)

Windows での Git のインストール: 別ページ »で説明

関連する外部ページ

Git の公式ページ: https://git-scm.com/

Python のインストール(Windows 上)

Windows での Python 3.10,関連パッケージ,Python 開発環境のインストール: 別ページ »で説明

サイト内の関連ページ

Python のまとめ: 別ページ »にまとめ

関連する外部ページ

Python の公式ページ: https://www.python.org/

Build Tools for Visual Studio 2022,NVIDIA ドライバ,NVIDIA CUDA ツールキット,NVIDIA cuDNN のインストール(Windows 上)

Windows での Build Tools for Visual Studio 2022NVIDIA ドライバNVIDIA CUDA ツールキット 11.8,NVIDIA cuDNN v8.6 のインストールと動作確認: 別ページ »で説明

関連する外部ページ

PyTorch のインストール(Windows 上)

  1. Windows で,コマンドプロンプト管理者として実行

    コマンドプロンプトを管理者として実行: 別ページ »で説明

  2. PyTorch のページを確認

    PyTorch のページ: https://pytorch.org/index.html

  3. 次のようなコマンドを実行(実行するコマンドは,PyTorch のページの表示されるコマンドを使う).

    次のコマンドは, PyTorch 2.0 (NVIDIA CUDA 11.8 用) をインストールする. 事前に NVIDIA CUDA のバージョンを確認しておくこと(ここでは,NVIDIA CUDA ツールキット 11.8 が前もってインストール済みであるとする).

    PyTorch で,GPU が動作している場合には,「torch.cuda.is_available()」により,True が表示される.

    python -m pip install -U pip
    python -m pip install -U torch torchvision torchaudio numpy --index-url https://download.pytorch.org/whl/cu118
    python -c "import torch; print(torch.__version__, torch.cuda.is_available())" 
    

    [image]

EasyOCR のインストール

  1. Windows で,コマンドプロンプト管理者として実行

    コマンドプロンプトを管理者として実行: 別ページ »で説明

  2. インストール

    試してみたが,「pip install easyocr」でインストールするよりも,下の手順の方がトラブルが少なそう.

    cd %HOMEPATH%
    rmdir /s /q EasyOCR
    git clone --recursive https://github.com/JaidedAI/EasyOCR
    cd EasyOCR
    pip install -e .
    

    [image]
    (以下省略)
  3. 動作確認(日本語に英語が混ざっているもの)

    easyocr コマンドを使用.

    cd %HOMEPATH%
    cd EasyOCR
    cd examples
    easyocr -l ja en -f japanese.jpg --detail=1 --gpu=True
    

    [image]

    これは,次の画像についての文字認識結果である.

    [image]
  4. 動作確認(英語)

    easyocr コマンドを使用.

    cd %HOMEPATH%
    cd EasyOCR
    cd examples
    easyocr -l en -f easyocr_framework.jpeg --detail=1 --gpu=True
    

    [image]

    これは,次の画像についての文字認識結果である.

    [image]