マイクに話しかけた言葉を，リアルタイムにAIが認識（whisper, whisper_mic, Python を使用）（Windows 上）

【要約】 Windows のパソコンで，マイクに話しかけた言葉を，リアルタイムにAIが認識する方法を紹介する．Whisperとmallorbcのwhisper_micを使用することで，マイクからの音声をテキストに変換することができる．Whisperは音声からの文字起こしや翻訳に利用されるものであり，whisper_micはマイクの使用を可能にするものである．Windows上でのインストール手順やファイルの書き換え方法を説明し，実行することでマイクに話しかけることができるようになる．必要に応じて高精度のモデルを使用することも可能でである．実際に実行した結果として、夏目漱石の「こころ」の冒頭を読み上げたテキストが得られた結果を示している．

次を利用して，マイクに話しかけた言葉を，リアルタイムにAIが認識することを実現

Python
Whisper
mallorbc の whisper_mic

（夏目漱石の「こころ」の冒頭を読み上げた結果）

● Whisper

音声からの文字起こし，翻訳

【関連する外部ページ】

Introducing Whisper のページ: https://openai.com/index/whisper/
GitHub のページ: https://github.com/openai/whisper

● mallorbc の whisper_mic

Whisper でのマイクの使用を可能にする．利用可能な言語モデルは，tiny，base，small，medium，large

GitHub のページ: https://github.com/mallorbc/whisper_mic

前準備

Python のインストール（Windows上）

注：既にPython（バージョン3.12を推奨）がインストール済みの場合は，この手順は不要である．

winget（Windowsパッケージマネージャー）を使用してインストールを行う

Windowsで，コマンドプロンプトを管理者権限で起動する（手順：Windowsキーまたはスタートメニュー，「cmd」と入力，右クリックメニューなどで「管理者として実行」を選択）
winget（Windowsパッケージマネージャー）が利用可能か確認する：
winget --version

Pythonのインストール（下のコマンドにより Python 3.12 がインストールされる）．

reg add "HKLM\SYSTEM\CurrentControlSet\Control\FileSystem" /v LongPathsEnabled /t REG_DWORD /d 1 /f
REM Python をシステム領域にインストール
winget install --scope machine --id Python.Python.3.12 --id Python.Launcher -e --silent
REM Python のパス
set "INSTALL_PATH=C:\Program Files\Python312"
echo %PATH% | find /i "%INSTALL_PATH%" >nul
if errorlevel 1 setx PATH "%PATH%;%INSTALL_PATH%" /M >nul
echo %PATH% | find /i "%INSTALL_PATH%\Scripts" >nul
if errorlevel 1 setx PATH "%PATH%;%INSTALL_PATH%\Scripts" /M >nul

【関連する外部サイト】

Python公式サイト：https://www.python.org/

【サイト内の関連ページ】

Python詳細ガイド：Pythonまとめ »

Git のインストール（Windows 上）

Gitは，バージョン管理システム．ソースコードの管理や複数人での共同に役立つ．

【サイト内の関連ページ】 Windows での Git のインストール: 別ページ »で説明

【関連する外部ページ】 Git の公式ページ: https://git-scm.com/

Whisper のインストール（Windows 上）

Windows での Whisper のインストール: 別ページ »で説明

whisper_mic のインストール（Windows 上）

whisper_mic の前提ソフトウエアのインストール

Windows で，コマンドプロンプトを管理者として開き，次のコマンドを実行

pip install -U SpeechRecognition numpy tqdm more-itertools transformers ffmpeg-python click pyaudio pydub

whisper_mic のダウンロード
Windows で，コマンドプロンプトを開き，次のコマンドを実行
cd /d c:%HOMEPATH% rmdir /s /q whisper_mic git clone https://github.com/mallorbc/whisper_mic
whisper_mic のファイル mic.py の書き換え
コマンドプロンプトで，次のコマンドを実行
cd /d c:%HOMEPATH% cd whisper_mic notepad mic.py
「, language='japanese'」を追加して，上書き保存

マイクに話しかけた言葉を，リアルタイムにAIが認識（Windwos 上）

実行し，マイクに話しかけてみる

コマンドプロンプトで，次のコマンドを実行

グラフィックスボードのメモリに余裕があるときは，より高い精度を得るために，「python mic.py --model medium」や「python mic.py --model largeを実行できる

cd /d c:%HOMEPATH%
cd whisper_mic
python mic.py --model large

（夏目漱石の「こころ」の冒頭を読み上げた結果）

cd /d c:%HOMEPATH%
cd whisper_mic
python mic.py --model small

（夏目漱石の「こころ」の冒頭を読み上げた結果）