SpeechRecognizer のインストールと動作確認(音声認識)(Python を使用)(Windows 上)

Python の SpeechRecognizer (https://github.com/Uberi/speech_recognition) を用いて音声認識

先人に感謝

キーワード: 音声認識, Google API, Python, SpeechRecognition

前準備

Python 3.12 のインストール(Windows 上) [クリックして展開]

以下のいずれかの方法で Python 3.12 をインストールする。Python がインストール済みの場合、この手順は不要である。

方法1:winget によるインストール

管理者権限コマンドプロンプトで以下を実行する。管理者権限のコマンドプロンプトを起動するには、Windows キーまたはスタートメニューから「cmd」と入力し、表示された「コマンドプロンプト」を右クリックして「管理者として実行」を選択する。

winget install --scope machine --id Python.Python.3.12 -e --silent --disable-interactivity --force --accept-source-agreements --accept-package-agreements --override "/quiet InstallAllUsers=1 PrependPath=1 Include_pip=1 Include_test=0 Include_launcher=1 InstallLauncherAllUsers=1"

--scope machine を指定することで、システム全体(全ユーザー向け)にインストールされる。このオプションの実行には管理者権限が必要である。インストール完了後、コマンドプロンプトを再起動すると PATH が自動的に設定される。

方法2:インストーラーによるインストール

  1. Python 公式サイト(https://www.python.org/downloads/)にアクセスし、「Download Python 3.x.x」ボタンから Windows 用インストーラーをダウンロードする。
  2. ダウンロードしたインストーラーを実行する。
  3. 初期画面の下部に表示される「Add python.exe to PATH」に必ずチェックを入れてから「Customize installation」を選択する。このチェックを入れ忘れると、コマンドプロンプトから python コマンドを実行できない。
  4. 「Install Python 3.xx for all users」にチェックを入れ、「Install」をクリックする。

インストールの確認

コマンドプロンプトで以下を実行する。

python --version

バージョン番号(例:Python 3.12.x)が表示されればインストール成功である。「'python' は、内部コマンドまたは外部コマンドとして認識されていません。」と表示される場合は、インストールが正常に完了していない。

Python のSpeechRecognition、pyaudioライブラリのインストール(Windows 上)

  1. Windows では,コマンドプロンプトを管理者として実行する.
  2. 次のコマンドを実行する.

    * Windows では「python」,Ubuntu では「sudo python3 -m pip」

    python -m pip install -U SpeechRecognition
    

    引き続き,次のコマンドを実行

    pip install -U pyaudio
    

SpeechRecognizer のインストールと動作確認(音声認識)(Python を使用)(Windows 上)してみる

  1. まずは,入った .wav ファイルを準備する

    * 手元に .wav ファイルがないよ,というときは http://www.wavsource.com(インターネットでは,下品な広告が付いている可能性があるので,必要もないのにクリックしないこと) などから入手できる(.wav ファイルをダウンロードするときは、利用条件などを確認すること)

  2. Python プログラムの実行
    import os
    print(os.getcwd())
    

    実行結果例

  3. 先ほどの .wav ファイルはカレントディレクトリに移しておく(あとの作業を楽にするため)
  4. 英語の音声認識してみる

    次の Python プログラムを実行

    「"coincidence.wav" 」のところは,ファイル名を書き換えること.

    import speech_recognition
    r = speech_recognition.Recognizer()
    with speech_recognition.AudioFile("coincidence.wav") as source:
        audio = r.record(source)
    r.recognize_google(audio)
    

    実行結果の例

  5. 日本語の音声認識をしたい場合には「language='ja-JP'」を指定する

    次の Python プログラムを実行

    「"1.wav" 」のところは,ファイル名を書き換えること.

    import speech_recognition
    r = speech_recognition.Recognizer()
    with speech_recognition.AudioFile("1.wav") as source:
        audio = r.record(source)
    r.recognize_google(audio, language='ja-JP')
    

    実行結果の例