次を利用して,マイクに話しかけた言葉を,リアルタイムにAIが認識することを実現
● Whisper
音声からの文字起こし,翻訳
【関連する外部ページ】
● mallorbc の whisper_mic
Whisper でのマイクの使用を可能にする. 利用可能な言語モデルは,tiny,base,small,medium,large
Windows での Git のインストール: 別ページ »で説明
【関連する外部ページ】
Git の公式ページ: https://git-scm.com/
Windows での Python 3.10,関連パッケージ,Python 開発環境のインストール: 別ページ »で説明
【サイト内の関連ページ】
Python のまとめ: 別ページ »にまとめ
【関連する外部ページ】
Python の公式ページ: https://www.python.org/
Windows での Whisper のインストール: 別ページ »で説明
pip install -U SpeechRecognition numpy tqdm more-itertools transformers ffmpeg-python click pyaudio pydub
Windows で,コマンドプロンプトを開き,次のコマンドを実行
cd %HOMEPATH% rmdir /s /q whisper_mic git clone https://github.com/mallorbc/whisper_mic
コマンドプロンプトで,次のコマンドを実行
cd %HOMEPATH% cd whisper_mic notepad mic.py
実行し,マイクに話しかけてみる
コマンドプロンプトで,次のコマンドを実行
グラフィックスボードのメモリに余裕があるときは,より高い精度を得るために,「python mic.py --model medium」や「python mic.py --model largeを実行できる
cd %HOMEPATH% cd whisper_mic python mic.py --model large
cd %HOMEPATH% cd whisper_mic python mic.py --model small