● Whisper
音声からの文字起こし,翻訳
【関連する外部ページ】
Windows での Git のインストール: 別ページ »で説明
【関連する外部ページ】
Git の公式ページ: https://git-scm.com/
Windows での Python 3.10,関連パッケージ,Python 開発環境のインストール: 別ページ »で説明
【サイト内の関連ページ】
Python のまとめ: 別ページ »にまとめ
【関連する外部ページ】
Python の公式ページ: https://www.python.org/
Windows での Build Tools for Visual Studio 2022,NVIDIA ドライバ,NVIDIA CUDA ツールキット 11.8,NVIDIA cuDNN v8.6 のインストールと動作確認: 別ページ »で説明
【関連する外部ページ】
コマンドプロンプトを管理者として実行: 別ページ »で説明
PyTorch のページ: https://pytorch.org/index.html
次のコマンドは, PyTorch 2.0 (NVIDIA CUDA 11.8 用) をインストールする. 事前に NVIDIA CUDA のバージョンを確認しておくこと(ここでは,NVIDIA CUDA ツールキット 11.8 が前もってインストール済みであるとする).
python -m pip install -U pip python -m pip install -U torch torchvision torchaudio numpy numba --index-url https://download.pytorch.org/whl/cu118 python -c "import torch; print(torch.__version__, torch.cuda.is_available())"
Windows での FFmpeg のインストール(Windows 上): 別ページ »で説明
コマンドプロンプトを管理者として実行: 別ページ »で説明
python -m pip install -U git+https://github.com/openai/whisper.git
cd %HOMEPATH% rmdir /s /q whisper git clone --recursive https://github.com/openai/whisper.git
次のコマンドの実行により,結果が表示され,テキストファイルにも保存される.
whisper %HOMEPATH%/whisper/tests/jfk.flac --model small --language English
次のコマンドの実行により,音声ファイルの再生が行われる.
%HOMEPATH%\whisper\tests\jfk.flac