金子邦彦研究室人工知能Windows でのインストールと動作確認(人工知能関係)Whisper のインストールと動作確認(音声からの文字起こし,翻訳)(Python,PyTorch を使用)(Windows 上)

Whisper のインストールと動作確認(音声からの文字起こし,翻訳)(Python,PyTorch を使用)(Windows 上)

WindowsWhisper のインストールを行う.

Whisper

音声からの文字起こし,翻訳

関連する外部ページ

前準備

Git のインストール(Windows 上)

Windows での Git のインストール: 別ページ »で説明

関連する外部ページ

Git の公式ページ: https://git-scm.com/

Python のインストール(Windows 上)

Windows での Python 3.10,関連パッケージ,Python 開発環境のインストール: 別ページ »で説明

サイト内の関連ページ

Python のまとめ: 別ページ »にまとめ

関連する外部ページ

Python の公式ページ: https://www.python.org/

Build Tools for Visual Studio 2022,NVIDIA ドライバ,NVIDIA CUDA ツールキット,NVIDIA cuDNN のインストール(Windows 上)

Windows での Build Tools for Visual Studio 2022NVIDIA ドライバNVIDIA CUDA ツールキット 11.8,NVIDIA cuDNN v8.6 のインストールと動作確認: 別ページ »で説明

関連する外部ページ

PyTorch のインストール(Windows 上)

  1. Windows で,コマンドプロンプト管理者として実行

    コマンドプロンプトを管理者として実行: 別ページ »で説明

  2. PyTorch のページを確認

    PyTorch のページ: https://pytorch.org/index.html

  3. 次のようなコマンドを実行(実行するコマンドは,PyTorch のページの表示されるコマンドを使う).

    次のコマンドは, PyTorch 2.0 (NVIDIA CUDA 11.8 用) をインストールする. 事前に NVIDIA CUDA のバージョンを確認しておくこと(ここでは,NVIDIA CUDA ツールキット 11.8 が前もってインストール済みであるとする).

    python -m pip install -U pip
    python -m pip install -U torch torchvision torchaudio numpy numba --index-url https://download.pytorch.org/whl/cu118
    python -c "import torch; print(torch.__version__, torch.cuda.is_available())" 
    

    (途中省略)
    [image]

FFmpeg のインストール(Windows 上)

Windows での FFmpeg のインストール(Windows 上): 別ページ »で説明

Whisper のインストール(Windows 上)

  1. Windows で,コマンドプロンプト管理者として実行

    コマンドプロンプトを管理者として実行: 別ページ »で説明

  2. ダウンロードとインストール

    python -m pip install -U git+https://github.com/openai/whisper.git
    

    [image]
  3. 関連ファイルをダウンロード

    cd %HOMEPATH%
    rmdir /s /q whisper
    git clone --recursive https://github.com/openai/whisper.git
    

    [image]
  4. 音声ファイルからの文字起こしを実行してみる.

    次のコマンドの実行により,結果が表示され,テキストファイルにも保存される.

    whisper %HOMEPATH%/whisper/tests/jfk.flac --model small --language English
    

    [image]

    次のコマンドの実行により,音声ファイルの再生が行われる.

    %HOMEPATH%\whisper\tests\jfk.flac
    

    [image]