SpeechRecognizer のインストールと動作確認(音声認識)(Python を使用)(Windows 上)
先人に感謝
キーワード: 音声認識, Google API, Python, SpeechRecognition
前準備
Python 3.12 のインストール(Windows 上) [クリックして展開]
以下のいずれかの方法で Python 3.12 をインストールする。Python がインストール済みの場合、この手順は不要である。
方法1:winget によるインストール
管理者権限のコマンドプロンプトで以下を実行する。管理者権限のコマンドプロンプトを起動するには、Windows キーまたはスタートメニューから「cmd」と入力し、表示された「コマンドプロンプト」を右クリックして「管理者として実行」を選択する。
winget install --scope machine --id Python.Python.3.12 -e --silent --disable-interactivity --force --accept-source-agreements --accept-package-agreements --override "/quiet InstallAllUsers=1 PrependPath=1 Include_pip=1 Include_test=0 Include_launcher=1 InstallLauncherAllUsers=1"
--scope machine を指定することで、システム全体(全ユーザー向け)にインストールされる。このオプションの実行には管理者権限が必要である。インストール完了後、コマンドプロンプトを再起動すると PATH が自動的に設定される。
方法2:インストーラーによるインストール
- Python 公式サイト(https://www.python.org/downloads/)にアクセスし、「Download Python 3.x.x」ボタンから Windows 用インストーラーをダウンロードする。
- ダウンロードしたインストーラーを実行する。
- 初期画面の下部に表示される「Add python.exe to PATH」に必ずチェックを入れてから「Customize installation」を選択する。このチェックを入れ忘れると、コマンドプロンプトから
pythonコマンドを実行できない。 - 「Install Python 3.xx for all users」にチェックを入れ、「Install」をクリックする。
インストールの確認
コマンドプロンプトで以下を実行する。
python --version
バージョン番号(例:Python 3.12.x)が表示されればインストール成功である。「'python' は、内部コマンドまたは外部コマンドとして認識されていません。」と表示される場合は、インストールが正常に完了していない。
Python のSpeechRecognition、pyaudioライブラリのインストール(Windows 上)
- Windows では,コマンドプロンプトを管理者として実行する.
- 次のコマンドを実行する.
* Windows では「python」,Ubuntu では「sudo python3 -m pip」
python -m pip install -U SpeechRecognition
引き続き,次のコマンドを実行
pip install -U pyaudio
SpeechRecognizer のインストールと動作確認(音声認識)(Python を使用)(Windows 上)してみる
- まずは,入った .wav ファイルを準備する
* 手元に .wav ファイルがないよ,というときは http://www.wavsource.com(インターネットでは,下品な広告が付いている可能性があるので,必要もないのにクリックしないこと) などから入手できる(.wav ファイルをダウンロードするときは、利用条件などを確認すること)
- Python プログラムの実行
import os print(os.getcwd())実行結果例
- 先ほどの .wav ファイルはカレントディレクトリに移しておく(あとの作業を楽にするため)
- 英語の音声認識してみる
次の Python プログラムを実行
「"coincidence.wav" 」のところは,ファイル名を書き換えること.
import speech_recognition r = speech_recognition.Recognizer() with speech_recognition.AudioFile("coincidence.wav") as source: audio = r.record(source) r.recognize_google(audio)実行結果の例
- 日本語の音声認識をしたい場合には「language='ja-JP'」を指定する
次の Python プログラムを実行
「"1.wav" 」のところは,ファイル名を書き換えること.
import speech_recognition r = speech_recognition.Recognizer() with speech_recognition.AudioFile("1.wav") as source: audio = r.record(source) r.recognize_google(audio, language='ja-JP')実行結果の例