Dlib による顔検出を行う Python プログラム(Dlib, Python を使用)(Windows 上)

1. エグゼクティブサマリー

本記事では,Windows 上で Dlib と Python を用いた顔検出プログラムの環境構築から実行までの手順を扱う.

Dlibは,機械学習,数値計算,画像処理,スレッド,通信,GUI など数多くの機能を持つ C++ ライブラリである.Python API もある.

Dlib には,Convolutional Neural Network (CNN) による顔検出の機能がある.

Dlib による顔検出の例

顔検出が行われ,顔を囲むバウンディングボックス (bounding box) が表示される.

バウンディングボックスの座標値が数値データとして得られる.

本記事で扱う内容は以下のとおりである.

  1. Dlib 付属のプログラム(cnn_face_detector.py)を用いた顔検出
  2. 手持ちの画像ファイルで顔検出を行う Python プログラムの作成と実行
  3. パソコンのカメラでリアルタイムに顔検出を行う Python プログラムの作成と実行

サイト内の関連ページ

2. 前準備(必要ソフトウェアの入手)

ここでは、最低限の事前準備について説明する。機械学習や深層学習を行う場合は、NVIDIA CUDA、Visual Studio、Cursorなどを追加でインストールすると便利である。これらについては別ページ https://www.kkaneko.jp/cc/dev/aiassist.htmlで詳しく解説しているので、必要に応じて参照してください。

Build Tools for Visual Studio 2026 のインストール(Windows 上) [クリックして展開]

Build Tools for Visual Studio は,Visual Studio の IDE を含まない C/C++ コンパイラ,ライブラリ,ビルドツール等のコマンドライン向け開発ツールセットである。インストール済みの場合、この手順は不要である。

管理者権限コマンドプロンプトで以下を実行する。管理者権限のコマンドプロンプトを起動するには、Windows キーまたはスタートメニューから「cmd」と入力し、表示された「コマンドプロンプト」を右クリックして「管理者として実行」を選択する。

REM VC++ ランタイム
winget install --scope machine --id Microsoft.VCRedist.2015+.x64 -e --silent --disable-interactivity --force --accept-source-agreements --accept-package-agreements --override "/quiet /norestart"

REM Build Tools + Desktop development with C++(VCTools)+ 追加コンポーネント(一括)
winget install --scope machine --id Microsoft.VisualStudio.BuildTools -e --silent --disable-interactivity --force --accept-source-agreements --accept-package-agreements --override "--quiet --wait --norestart --nocache --add Microsoft.VisualStudio.Workload.VCTools --includeRecommended --add Microsoft.VisualStudio.Workload.MSBuildTools --add Microsoft.VisualStudio.Component.VC.CMake.Project --add Microsoft.VisualStudio.Component.VC.Llvm.Clang --add Microsoft.VisualStudio.Component.VC.Llvm.ClangToolset --add Microsoft.VisualStudio.Component.Windows11SDK.26100"

--add で追加されるコンポーネント

上記のコマンドでは,まず Build Tools 本体と Visual C++ 再頒布可能パッケージをインストールし,次に setup.exe を用いて以下のコンポーネントを追加している。

インストール完了の確認

winget list Microsoft.VisualStudio.BuildTools

上記以外の追加のコンポーネントが必要になった場合は Visual Studio Installer で個別にインストールできる。

Visual Studio の機能を必要とする場合は、追加インストールできる。

Python 3.12 のインストール(Windows 上) [クリックして展開]

以下のいずれかの方法で Python 3.12 をインストールする。Python がインストール済みの場合、この手順は不要である。

方法1:winget によるインストール

管理者権限コマンドプロンプトで以下を実行する。管理者権限のコマンドプロンプトを起動するには、Windows キーまたはスタートメニューから「cmd」と入力し、表示された「コマンドプロンプト」を右クリックして「管理者として実行」を選択する。

winget install --scope machine --id Python.Python.3.12 -e --silent --disable-interactivity --force --accept-source-agreements --accept-package-agreements --override "/quiet InstallAllUsers=1 PrependPath=1 Include_pip=1 Include_test=0 Include_launcher=1 InstallLauncherAllUsers=1"

--scope machine を指定することで、システム全体(全ユーザー向け)にインストールされる。このオプションの実行には管理者権限が必要である。インストール完了後、コマンドプロンプトを再起動すると PATH が自動的に設定される。

方法2:インストーラーによるインストール

  1. Python 公式サイト(https://www.python.org/downloads/)にアクセスし、「Download Python 3.x.x」ボタンから Windows 用インストーラーをダウンロードする。
  2. ダウンロードしたインストーラーを実行する。
  3. 初期画面の下部に表示される「Add python.exe to PATH」に必ずチェックを入れてから「Customize installation」を選択する。このチェックを入れ忘れると、コマンドプロンプトから python コマンドを実行できない。
  4. 「Install Python 3.xx for all users」にチェックを入れ、「Install」をクリックする。

インストールの確認

コマンドプロンプトで以下を実行する。

python --version

バージョン番号(例:Python 3.12.x)が表示されればインストール成功である。「'python' は、内部コマンドまたは外部コマンドとして認識されていません。」と表示される場合は、インストールが正常に完了していない。

AIエディタ Windsurf のインストール(Windows 上) [クリックして展開]

Pythonプログラムの編集・実行には、AIエディタの利用を推奨する。ここでは、Windsurfのインストールを説明する。Windsurf がインストール済みの場合、この手順は不要である。

管理者権限コマンドプロンプトで以下を実行する。管理者権限のコマンドプロンプトを起動するには、Windows キーまたはスタートメニューから「cmd」と入力し、表示された「コマンドプロンプト」を右クリックして「管理者として実行」を選択する。

winget install --scope machine --id Codeium.Windsurf -e --silent --disable-interactivity --force --accept-source-agreements --accept-package-agreements --custom "/SP- /SUPPRESSMSGBOXES /NORESTART /CLOSEAPPLICATIONS /DIR=""C:\Program Files\Windsurf"" /MERGETASKS=!runcode,addtopath,associatewithfiles,!desktopicon"
powershell -Command "$env:Path=[System.Environment]::GetEnvironmentVariable('Path','Machine')+';'+[System.Environment]::GetEnvironmentVariable('Path','User'); windsurf --install-extension MS-CEINTL.vscode-language-pack-ja --force; windsurf --install-extension ms-python.python --force; windsurf --install-extension Codeium.windsurfPyright --force"

--scope machine を指定することで、システム全体(全ユーザー向け)にインストールされる。このオプションの実行には管理者権限が必要である。インストール完了後、コマンドプロンプトを再起動すると PATH が自動的に設定される。

関連する外部ページ

Windsurf の公式ページ: https://windsurf.com/

Git のインストール(Windows 上) [クリックして展開]

管理者権限コマンドプロンプトで以下を実行する。管理者権限のコマンドプロンプトを起動するには、Windows キーまたはスタートメニューから「cmd」と入力し、表示された「コマンドプロンプト」を右クリックして「管理者として実行」を選択する。

REM Git をシステム領域にインストール
winget install --scope machine --id Git.Git -e --silent --disable-interactivity --force --accept-source-agreements --accept-package-agreements --override "/VERYSILENT /NORESTART /NOCANCEL /SP- /CLOSEAPPLICATIONS /RESTARTAPPLICATIONS /COMPONENTS=""icons,ext\reg\shellhere,assoc,assoc_sh"" /o:PathOption=Cmd /o:CRLFOption=CRLFCommitAsIs /o:BashTerminalOption=MinTTY /o:DefaultBranchOption=main /o:EditorOption=VIM /o:SSHOption=OpenSSH /o:UseCredentialManager=Enabled /o:PerformanceTweaksFSCache=Enabled /o:EnableSymlinks=Disabled /o:EnableFSMonitor=Disabled"

7-Zip のインストール(Windows 上) [クリックして展開]

管理者権限コマンドプロンプトで以下を実行する。管理者権限のコマンドプロンプトを起動するには、Windows キーまたはスタートメニューから「cmd」と入力し、表示された「コマンドプロンプト」を右クリックして「管理者として実行」を選択する。

REM 7-Zip をシステム領域にインストール
winget install --scope machine --id 7zip.7zip -e --silent --installer-type msi --disable-interactivity --force --accept-source-agreements --accept-package-agreements --override "/qn /norestart"
REM 7-Zip のパス設定
powershell -NoProfile -Command "$p='C:\Program Files\7-Zip'; $c=[Environment]::GetEnvironmentVariable('Path','Machine'); if((Test-Path $p) -and $c -notlike \"*$p*\"){[Environment]::SetEnvironmentVariable('Path',\"$p;$c\",'Machine')}"

Dlib ライブラリのインストールと学習済みモデルのダウンロード [クリックして展開]

管理者権限コマンドプロンプトで以下を実行する。管理者権限のコマンドプロンプトを起動するには、Windows キーまたはスタートメニューから「cmd」と入力し、表示された「コマンドプロンプト」を右クリックして「管理者として実行」を選択する。

Dlib ライブラリのインストール

python -m pip uninstall -y dlib
cd C:\
rmdir /s /q dlib
git clone https://github.com/davisking/dlib
cd C:\dlib
python setup.py build --no DLIB_GIF_SUPPORT
python setup.py install --no DLIB_GIF_SUPPORT

インストールの確認

バージョン番号が表示されれば OK である.下の図とは異なるバージョンが表示されることがある.
python -c "import dlib; print( dlib.__version__ )"

Dlib のソースコード等のダウンロード

cd C:\
rmdir /s /q dlib
git clone https://github.com/davisking/dlib

学習済みモデルのダウンロード

cd C:\dlib
cd python_examples
curl -O http://dlib.net/files/mmod_human_face_detector.dat.bz2
curl -O http://dlib.net/files/dlib_face_recognition_resnet_model_v1.dat.bz2
curl -O http://dlib.net/files/shape_predictor_5_face_landmarks.dat.bz2
curl -O http://dlib.net/files/shape_predictor_68_face_landmarks.dat.bz2
"c:\Program Files\7-Zip\7z.exe" x mmod_human_face_detector.dat.bz2
"c:\Program Files\7-Zip\7z.exe" x dlib_face_recognition_resnet_model_v1.dat.bz2
"c:\Program Files\7-Zip\7z.exe" x shape_predictor_5_face_landmarks.dat.bz2
"c:\Program Files\7-Zip\7z.exe" x shape_predictor_68_face_landmarks.dat.bz2
del mmod_human_face_detector.dat.bz2
del dlib_face_recognition_resnet_model_v1.dat.bz2
del shape_predictor_5_face_landmarks.dat.bz2
del shape_predictor_68_face_landmarks.dat.bz2

Dlib の動作確認

次を実行し,エラーメッセージが出ずに顔検出の結果が表示されれば OK とする.

cd C:\dlib
cd python_examples
python cnn_face_detector.py mmod_human_face_detector.dat ..\examples\faces\2007_007763.jpg

opencv-python ライブラリのインストール [クリックして展開]

管理者権限コマンドプロンプトで以下を実行する。管理者権限のコマンドプロンプトを起動するには、Windows キーまたはスタートメニューから「cmd」と入力し、表示された「コマンドプロンプト」を右クリックして「管理者として実行」を選択する。

python -m pip install -U opencv-python opencv-contrib-python

3. 実行のための準備とその確認手順(Windows 前提)

3.1 プログラムファイルの準備

本記事では2つの Python プログラムを扱う.

hoge.py(画像ファイルで顔検出を行うプログラム)

第5章のソースコードをテキストエディタ(メモ帳等)に貼り付け,hoge.py として C:\dlib\python_examples に保存する(文字コード:UTF-8).

notepad hoge.py

処理対象の画像ファイルを準備する.ファイル名は a.png とし,C:\dlib\python_examples に置く.

cd C:\dlib\python_examples
curl -O https://www.kkaneko.jp/sample/face/126.png
move 126.png a.png

hoge2.py(パソコンのカメラで顔検出を行うプログラム)

第5章のソースコードをテキストエディタ(メモ帳等)に貼り付け,hoge2.py として C:\dlib\python_examples に保存する(文字コード:UTF-8).

notepad hoge2.py

3.2 実行コマンド

コマンドプロンプトで C:\dlib\python_examples に移動し,以下を実行する.

hoge.py の実行(画像ファイルで顔検出)

cd C:\dlib\python_examples
python hoge.py

hoge2.py の実行(カメラで顔検出)

cd C:\dlib\python_examples
python hoge2.py

3.3 動作確認チェックリスト

確認項目期待される結果
Dlib の動作確認(cnn_face_detector.py の実行)エラーメッセージが出ずに,顔検出の結果が表示される
dlib ライブラリのバージョン確認python -c "import dlib; print(dlib.__version__)" でバージョン番号が表示される
hoge.py の実行検出された顔にバウンディングボックスが描画された画面が表示され,検出数がコンソールに出力される
hoge.py の結果ファイル保存result.png にバウンディングボックス付きの画像が保存される
hoge2.py の実行カメラ映像が表示され,検出された顔にバウンディングボックスが描画され,FPS が画面左上に表示される
hoge2.py の終了操作画面の中をクリックしてから「q」キーを押すと,プログラムが終了する

4. 概要・使い方・実行上の注意

Dlib 付属のプログラム(cnn_face_detector.py)による顔検出

Dlib による顔検出 を行う.

まず,Dlib に同梱の顔画像ファイルを確認する. %HOMEPATH%\dlib\examples\faces の下の顔画像のファイルを確認する.

cnn_face_detector.py をエディタで開き,中身を確認する. Dlib には Convolutional Network による顔検出の機能があり,顔検出のプログラムは実質2行である. 画面を開く,画像ファイルを読み込む,画像データを表示する,顔部分を四角で描くといった操作も簡単なコマンドで実現できる.

アップサンプルによる小さな顔の検出

Dlib の学習済みデータは,顔のサイズを 80 x 80 として配布されている. より小さな顔を検出したいときはアップサンプルを行う.アップサンプルを行うと動作は遅くなる.

cnn_face_detector.py の「dets = cnn_face_detector(img, 1)」の「1」を「2」や「3」に変えて再実行する.

上で使用した画像を縦横 0.4 倍した画像で試した結果を以下に示す.

「dets = cnn_face_detector(img, 1)」のとき

「dets = cnn_face_detector(img, 2)」のとき

「dets = cnn_face_detector(img, 3)」のとき

画像ファイルでの顔検出(hoge.py)

Dlib 付属の「face_detector.py」を参考に作成したプログラムである.

CNN 顔検出モデル(mmod_human_face_detector.dat)を使用し,指定した画像ファイル(a.png)に対して顔検出を行う.検出された顔それぞれにバウンディングボックスを描画して画面に表示し,result.png に保存する.検出された顔の数はコンソールに出力される.

ソースコードは第5章に掲載している.

カメラでの顔検出(hoge2.py)

Dlib 付属の「face_detector.py」を参考に作成したプログラムである.

dlib.get_frontal_face_detector() を使用する.これはディープラーニングを使わない顔検出器であり,精度は低下するが処理速度は向上する.パソコンのカメラからリアルタイムに映像を取得し,顔検出を行ってバウンディングボックスを描画する.FPS(1秒あたりのフレーム数)も画面上に表示する.

* 途中で止めたいとき,右上の「x」をクリックしない.画面の中をクリックしてから,「q」キーを押して閉じる

ソースコードは第5章に掲載している.

5. ソースコード

hoge.py(画像ファイルで顔検出を行うプログラム)

import dlib
import cv2

def box_label(img, x1, y1, x2, y2, label):
    cv2.rectangle(img, (x1, y1), (x2, y2), (255, 0, 0), 1, 1)
    cv2.rectangle(img, (x1, y1 - 25), (x2, y1), (255, 255, 255), -1)
    cv2.putText(img, label, (x1, y1 - 5), cv2.FONT_HERSHEY_COMPLEX, 0.7, (0, 0, 0), 1)

# 「mmod_human_face_detector.dat」のところは,学習済みモデルのファイル名
face_detector = dlib.cnn_face_detection_model_v1('mmod_human_face_detector.dat')

# 画像ファイル名を a.png のところに設定
img = cv2.imread('a.png')

# 顔検出を行う
faces = face_detector(img, 1)
print("検出された顔の数:", len(faces))

# 顔検出で得られた顔(複数あり得る)それぞれについて,四角を書く
for i, f in enumerate(faces):
    box_label(img, f.rect.left(), f.rect.top(), f.rect.right(), f.rect.bottom(), 'face')

# 画面に描画
cv2.imshow('', img)
cv2.waitKey(0)
cv2.destroyAllWindows()

# ファイルに保存
cv2.imwrite("result.png", img)

hoge2.py(パソコンのカメラで顔検出を行うプログラム)

import dlib
import cv2
import time

def box_label(img, x1, y1, x2, y2, label):
    cv2.rectangle(img, (x1, y1), (x2, y2), (255, 0, 0), 1, 1)
    cv2.rectangle(img, (x1, y1 - 25), (x2, y1), (255, 255, 255), -1)
    cv2.putText(img, label, (x1, y1 - 5), cv2.FONT_HERSHEY_COMPLEX, 0.7, (0, 0, 0), 1)

# ディープラーニングを使わない.精度は低下し,処理速度は向上するとされている.
face_detector = dlib.get_frontal_face_detector()

# ビデオカメラ
v = cv2.VideoCapture(0)
prev_time = time.time()

while v.isOpened():
    r, img = v.read()
    # 顔検出を行う
    faces = face_detector(img, 1)
    for i, f in enumerate(faces):
        # 四角を書く
        box_label(img, f.left(), f.top(), f.right(), f.bottom(), 'face')
    # FPS(1秒あたりのフレーム数)を計算して表示する
    curr_time = time.time()
    fps = 1.0 / (curr_time - prev_time)
    prev_time = curr_time
    cv2.putText(img, "FPS: {:.1f}".format(fps), (10, 30), cv2.FONT_HERSHEY_SIMPLEX, 1.0, (0, 255, 0), 2)
    cv2.imshow("", img)
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

v.release()
cv2.destroyAllWindows()

6. まとめ

本記事で扱った主要概念を以下に整理する.

Dlib による CNN 顔検出

Dlib には CNN による顔検出の機能がある.顔を囲むバウンディングボックスが表示され,その座標値が数値データとして得られる.

アップサンプルによる検出精度の調整

Dlib の学習済みデータは顔サイズ 80 x 80 を前提としている.アップサンプルの値を大きくすると小さな顔も検出できるが,動作は遅くなる.

CNN 顔検出器と非ディープラーニング顔検出器の使い分け

hoge.py では dlib.cnn_face_detection_model_v1 を,hoge2.py では dlib.get_frontal_face_detector() を使用している.後者はディープラーニングを使わないため,精度は低下するが処理速度は向上する.

OpenCV との連携

Dlib で顔検出を行った結果を OpenCV(cv2)で画面に描画し,ファイルに保存する.cv2.VideoCapture によりカメラからリアルタイムに映像を取得し,顔検出結果を重畳表示することもできる.

バウンディングボックスの描画

検出された顔それぞれに対し,cv2.rectangle でバウンディングボックスを描画し,cv2.putText でラベルを付与する.これにより検出結果を視覚的に確認できる.