マイクに話しかけた言葉を,リアルタイムにAIが認識(whisper, whisper_mic, Python を使用)(Windows 上)
【要約】 Windows のパソコンで,マイクに話しかけた言葉を,リアルタイムにAIが認識する方法を紹介する.Whisperとmallorbcのwhisper_micを使用することで,マイクからの音声をテキストに変換することができる.Whisperは音声からの文字起こしや翻訳に利用されるものであり,whisper_micはマイクの使用を可能にするものである.Windows上でのインストール手順やファイルの書き換え方法を説明し,実行することでマイクに話しかけることができるようになる.必要に応じて高精度のモデルを使用することも可能でである.実際に実行した結果として、夏目漱石の「こころ」の冒頭を読み上げたテキストが得られた結果を示している.
次を利用して,マイクに話しかけた言葉を,リアルタイムにAIが認識することを実現
- Python
- Whisper
- mallorbc の whisper_mic

(夏目漱石の「こころ」の冒頭を読み上げた結果)
● Whisper
音声からの文字起こし,翻訳
【関連する外部ページ】
- Introducing Whisper のページ: https://openai.com/index/whisper/
- GitHub のページ: https://github.com/openai/whisper
● mallorbc の whisper_mic
Whisper でのマイクの使用を可能にする. 利用可能な言語モデルは,tiny,base,small,medium,large
- GitHub のページ: https://github.com/mallorbc/whisper_mic
前準備
Python のインストール(Windows上)
注:既にPython(バージョン3.12を推奨)がインストール済みの場合は,この手順は不要である.
winget(Windowsパッケージマネージャー)を使用してインストールを行う
- Windowsで,コマンドプロンプトを管理者権限で起動する(例:Windowsキーを押し,「cmd」と入力し,「管理者として実行」を選択)
- winget(Windowsパッケージマネージャー)が利用可能か確認する:
winget --version
- Pythonのインストール(下のコマンドにより Python 3.12 がインストールされる).
- Python詳細ガイド:Pythonまとめ »
- whisper_mic の前提ソフトウエアのインストール
- Windows で,コマンドプロンプトを管理者として開き,次のコマンドを実行
pip install -U SpeechRecognition numpy tqdm more-itertools transformers ffmpeg-python click pyaudio pydub
- whisper_mic のダウンロード
Windows で,コマンドプロンプトを開き,次のコマンドを実行
cd /d c:%HOMEPATH% rmdir /s /q whisper_mic git clone https://github.com/mallorbc/whisper_mic
- whisper_mic のファイル mic.py の書き換え
コマンドプロンプトで,次のコマンドを実行
cd /d c:%HOMEPATH% cd whisper_mic notepad mic.py
【関連する外部サイト】
【サイト内の関連ページ】
Git のインストール(Windows 上)
Gitは,バージョン管理システム.ソースコードの管理や複数人での共同に役立つ.
【サイト内の関連ページ】 Windows での Git のインストール: 別ページ »で説明
【関連する外部ページ】 Git の公式ページ: https://git-scm.com/
Whisper のインストール(Windows 上)
Windows での Whisper のインストール: 別ページ »で説明
whisper_mic のインストール(Windows 上)
マイクに話しかけた言葉を,リアルタイムにAIが認識(Windwos 上)
実行し,マイクに話しかけてみる
コマンドプロンプトで,次のコマンドを実行
グラフィックスボードのメモリに余裕があるときは,より高い精度を得るために,「python mic.py --model medium」や「python mic.py --model largeを実行できる
cd /d c:%HOMEPATH%
cd whisper_mic
python mic.py --model large

(夏目漱石の「こころ」の冒頭を読み上げた結果)
cd /d c:%HOMEPATH%
cd whisper_mic
python mic.py --model small

(夏目漱石の「こころ」の冒頭を読み上げた結果)