金子邦彦研究室人工知能プログラム例(人工知能関係)マイクに話しかけた言葉を,リアルタイムにAIが認識(whisper, whisper_mic, Python を使用)(Windows 上)

マイクに話しかけた言葉を,リアルタイムにAIが認識(whisper, whisper_mic, Python を使用)(Windows 上)

要約】 Windows のパソコンで,マイクに話しかけた言葉を,リアルタイムにAIが認識する方法を紹介する.Whisperとmallorbcのwhisper_micを使用することで,マイクからの音声をテキストに変換することができる.Whisperは音声からの文字起こしや翻訳に利用されるものであり,whisper_micはマイクの使用を可能にするものである.Windows上でのインストール手順やファイルの書き換え方法を説明し,実行することでマイクに話しかけることができるようになる.必要に応じて高精度のモデルを使用することも可能でである.実際に実行した結果として、夏目漱石の「こころ」の冒頭を読み上げたテキストが得られた結果を示している.

次を利用して,マイクに話しかけた言葉を,リアルタイムにAIが認識することを実現

[image]
(夏目漱石の「こころ」の冒頭を読み上げた結果)

Whisper

音声からの文字起こし,翻訳

関連する外部ページ

mallorbc の whisper_mic

Whisper でのマイクの使用を可能にする. 利用可能な言語モデルは,tiny,base,small,medium,large

前準備

Git のインストール(Windows 上)

Gitは,バージョン管理システム.ソースコードの管理や複数人での共同に役立つ.

サイト内の関連ページ

Windows での Git のインストール: 別ページ »で説明している.

関連する外部ページ

Git の公式ページ: https://git-scm.com/

Python のインストール(Windows 上)

サイト内の関連ページ

関連する外部ページ

Python の公式ページ: https://www.python.org/

Whisper のインストール(Windows 上)

Windows での Whisper のインストール: 別ページ »で説明している.

whisper_mic のインストール(Windows 上)

  1. whisper_mic の前提ソフトウエアのインストール

  2. Windows で,コマンドプロンプト管理者として開き,次のコマンドを実行
    pip install -U SpeechRecognition numpy tqdm more-itertools transformers ffmpeg-python click pyaudio pydub
    

    [image]
  3. whisper_mic のダウンロード

    Windows で,コマンドプロンプトを開き,次のコマンドを実行

    cd %HOMEPATH% 
    rmdir /s /q whisper_mic
    git clone https://github.com/mallorbc/whisper_mic
    

    [image]
  4. whisper_mic のファイル mic.py の書き換え

    コマンドプロンプトで,次のコマンドを実行

    cd %HOMEPATH% 
    cd whisper_mic
    notepad mic.py
    

    [image]
    「, language='japanese'」を追加して,上書き保存

    [image]

マイクに話しかけた言葉を,リアルタイムにAIが認識(Windwos 上)

実行し,マイクに話しかけてみる

コマンドプロンプトで,次のコマンドを実行

グラフィックスボードのメモリに余裕があるときは,より高い精度を得るために,「python mic.py --model medium」や「python mic.py --model largeを実行できる

cd %HOMEPATH% 
cd whisper_mic
python mic.py --model large

[image]
(夏目漱石の「こころ」の冒頭を読み上げた結果)
cd %HOMEPATH% 
cd whisper_mic
python mic.py --model small

[image]
(夏目漱石の「こころ」の冒頭を読み上げた結果)