金子邦彦研究室人工知能Windows で動く人工知能関係 Pythonアプリケーション,オープンソースソフトウエア)HierText データセットのインストール(テキスト検出,文字認識のデータセット)(Windows 上)

HierText データセットのインストール(テキスト検出,文字認識のデータセット)(Windows 上)

前準備

Git のインストール(Windows 上)

Gitは,バージョン管理システム.ソースコードの管理や複数人での共同に役立つ.

サイト内の関連ページ

Windows での Git のインストール: 別ページ »で説明している.

関連する外部ページ

Git の公式ページ: https://git-scm.com/

Python のインストール(Windows 上)

サイト内の関連ページ

関連する外部ページ

Python の公式ページ: https://www.python.org/

HierText のインストール(Windows 上)

AWS コマンドラインツールのインストール

  1. Windows で,コマンドプロンプト管理者として実行

    コマンドプロンプトを管理者として実行: 別ページ »で説明

  2. AWS コマンドラインツールのインストール

    次のコマンドを実行し,その後,画面の指示に従う.

    msiexec.exe /i https://awscli.amazonaws.com/AWSCLIV2.msi
    

    [image]

7-Zip 22.01 のインストール(Windows 上)

Windows では, コマンドプロンプトを管理者として開き, 次のコマンドを実行することにより, 7-Zip 23.01 のインストールを行うことができる.

mkdir %HOMEPATH%\7zip
cd %HOMEPATH%\7zip
curl -O https://www.7-zip.org/a/7z2301-x64.exe
.\7z2301-x64.exe
powershell -command "$oldpath = [System.Environment]::GetEnvironmentVariable(\"Path\", \"Machine\"); $oldpath += \";c:\Program Files\7-Zip\"; [System.Environment]::SetEnvironmentVariable(\"Path\", $oldpath, \"Machine\")"

HierText のインストール

  1. Windows で,コマンドプロンプト管理者として実行
  2. 次のコマンドを実行

    cd %HOMEPATH%
    rmdir /s /q hiertext
    git clone https://github.com/google-research-datasets/hiertext.git
    cd hiertext
    python -m pip install -r requirements.txt
    "c:\Program Files\7-Zip\7z.exe" x sample_output.jsonl.gz
    cd gt
    "c:\Program Files\7-Zip\7z.exe" x validation.jsonl.gz
    "c:\Program Files\7-Zip\7z.exe" x train.jsonl.gz
    cd %HOMEPATH%\hiertext
    aws s3 --no-sign-request cp s3://open-images-dataset/ocr/train.tgz .
    aws s3 --no-sign-request cp s3://open-images-dataset/ocr/validation.tgz .
    aws s3 --no-sign-request cp s3://open-images-dataset/ocr/test.tgz .
    move train.tgz train.tar.gz
    move validation.tgz validation.tar.gz
    move test.tgz test.tar.gz
    "c:\Program Files\7-Zip\7z.exe" x train.tar.gz
    "c:\Program Files\7-Zip\7z.exe" x validation.tar.gz
    "c:\Program Files\7-Zip\7z.exe" x test.tar.gz
    "c:\Program Files\7-Zip\7z.exe" x train.tar
    "c:\Program Files\7-Zip\7z.exe" x validation.tar
    "c:\Program Files\7-Zip\7z.exe" x test.tar
    

    [image]
    (以下省略)