Dlib での画像分類,物体検出,顔検出,トラッキング・ビジョン,顔のランドマーク検出(Dlib 付属のプログラムを実行)

参考Webページ

https://github.com/davisking/dlib-models

前準備

curl のインストール

Git のインストール

Git のページ https://git-scm.com/ からダウンロードしてインストール:

CMake のインストール

Ubuntu では bzip2 のインストール

Dlib のインストール

Dlib に付属のサンプルプログラムのビルド

Dlib に付属のサンプルプログラムは,examplesの下にある.次の手順でビルドする.

http://dlib.net/compile.html の記述に従う

画像分類

画像分類:画像(1つ)から、所定のラベル(複数)のうち1つを推定すること。あるいは、複数を推定すること。推定するとき、その確率とともに得ることもある

Ubuntu の場合

Ubuntu を使用する場合は,次のように操作する.

  1. 学習済みモデルのダウンロード
    cd /usr/local/dlib/examples
    sudo curl -O http://dlib.net/files/resnet34_1000_imagenet_classifier.dnn.bz2
    sudo bzip2 -d resnet34_1000_imagenet_classifier.dnn.bz2
    
  2. 画像分類の実行

    画像分類される画像は,「faces/*.jpg」で指定している.

    cd /usr/local/dlib/examples
    ./build/dnn_imagenet_ex faces/*.jpg
    

画像分類される画像

物体検出(Max-Margin Object Detection by Davis E. King を使用)

物体検出:画像から、ある種類の物体を検出し、その位置と大きさを得る。1つの画像の中に、物体が複数あることもある。

Max-Margin 物体検出法が利用されている(文献は次の通り) それにより,Dlib による文体検出が行われる.

Davis E. King, Max-Margin Object Detection, CoRR, abs/1502.00046, 2015.

Ubuntu の場合

Ubuntu を使用する場合は,次\ のように操作する.

学習済みモデルのダウンロード

cd /usr/local/dlib/examples
cd build
sudo curl -O http://dlib.net/files/mmod_rear_end_vehicle_detector.dat.bz2
sudo bzip2 -d mmod_rear_end_vehicle_detector.dat.bz2

物体検出の実行(車の正面)

cd /usr/local/dlib/examples/build
./dnn_mmod_find_cars_ex

学習済みモデルのダウンロード

cd /usr/local/dlib/examples
cd build
sudo curl -O http://dlib.net/files/mmod_front_and_rear_end_vehicle_detector.dat.bz2
sudo bzip2 -d mmod_front_and_rear_end_vehicle_detector.dat.bz2

物体検出の実行(車の正面と背面)

cd /usr/local/dlib/examples/build
./dnn_mmod_find_cars2_ex

顔検出

Dlib による顔検出 は次の仕組みで行われる.

Dlib には,ディープラーニングの CNN (convolutional neural network) を用いた物体検出が実装されている.

Max-Margin 物体検出法が利用されている(文献は次の通り) それにより,Dlib による顔検出が行われる.

Davis E. King, Max-Margin Object Detection, CoRR, abs/1502.00046, 2015.

トラッキング・ビジョン(correlation_tracker を使用)

Windows の場合

Windows を使用する場合は,次のように操作する.

cd C:\dlib
cd examples\build
.\release\video_tracking_ex ..\video_frames

犬の顔画像について眼鏡をあてはめる,顔のランドマーク検出

Ubuntu の場合

Ubuntu を使用する場合は,次\ のように操作する.

学習済みモデルのダウンロード

cd /usr/local/dlib/examples
sudo curl -O http://dlib.net/files/mmod_dog_hipsterizer.dat.bz2
sudo bzip2 -d mmod_dog_hipsterizer.dat.bz2

実行してみる

cd /usr/local/dlib/examples
./build/dnn_mmod_dog_hipsterizer mmod_dog_hipsterizer.dat faces/dogs.jpg