Dlib での画像分類，物体検出，顔検出，トラッキング・ビジョン，顔のランドマーク検出（Dlib 付属のプログラムを実行）

参考Webページ

https://github.com/davisking/dlib-models

前準備

curl のインストール

Ubuntu での curl のインストール

# パッケージリストの情報を更新
sudo apt update
sudo apt -y install curl

Git のインストール

Git のページ https://git-scm.com/ からダウンロードしてインストール:

Ubuntu では，端末で，次のコマンドを実行して，Git をインストールする．
# パッケージリストの情報を更新 sudo apt update sudo apt -y install git

CMake のインストール

Ubuntu では，端末で，次のコマンドを実行して，cmake をインストールする．

# パッケージリストの情報を更新
sudo apt update
sudo apt -y install cmake cmake-curses-gui

Ubuntu では bzip2 のインストール

Ubuntu での bzip2 のインストール

# パッケージリストの情報を更新
sudo apt update
sudo apt -y install bzip2

Dlib のインストール

Ubuntu での Dlib のインストール: 別ページ »で説明

Dlib に付属のサンプルプログラムのビルド

Dlib に付属のサンプルプログラムは，examplesの下にある．次の手順でビルドする．

http://dlib.net/compile.html の記述に従う

画像分類

画像分類：画像（１つ）から、所定のラベル（複数）のうち１つを推定すること。あるいは、複数を推定すること。推定するとき、その確率とともに得ることもある

Ubuntu の場合

Ubuntu を使用する場合は，次のように操作する．

学習済みモデルのダウンロード

cd /usr/local/dlib/examples
sudo curl -O http://dlib.net/files/resnet34_1000_imagenet_classifier.dnn.bz2
sudo bzip2 -d resnet34_1000_imagenet_classifier.dnn.bz2

画像分類の実行
画像分類される画像は，「faces/*.jpg」で指定している．
cd /usr/local/dlib/examples ./build/dnn_imagenet_ex faces/*.jpg

画像分類される画像

物体検出（Max-Margin Object Detection by Davis E. King を使用）

物体検出：画像から、ある種類の物体を検出し、その位置と大きさを得る。１つの画像の中に、物体が複数あることもある。

Max-Margin 物体検出法が利用されている（文献は次の通り）それにより，Dlib による文体検出が行われる．

Davis E. King, Max-Margin Object Detection, CoRR, abs/1502.00046, 2015.

Ubuntu の場合

Ubuntu を使用する場合は，次\ のように操作する．

学習済みモデルのダウンロード

cd /usr/local/dlib/examples
cd build
sudo curl -O http://dlib.net/files/mmod_rear_end_vehicle_detector.dat.bz2
sudo bzip2 -d mmod_rear_end_vehicle_detector.dat.bz2

物体検出の実行（車の正面）

cd /usr/local/dlib/examples/build
./dnn_mmod_find_cars_ex

学習済みモデルのダウンロード

cd /usr/local/dlib/examples
cd build
sudo curl -O http://dlib.net/files/mmod_front_and_rear_end_vehicle_detector.dat.bz2
sudo bzip2 -d mmod_front_and_rear_end_vehicle_detector.dat.bz2

物体検出の実行（車の正面と背面）

cd /usr/local/dlib/examples/build
./dnn_mmod_find_cars2_ex

顔検出

Dlib による顔検出は次の仕組みで行われる．

Dlib には，ディープラーニングの CNN (convolutional neural network) を用いた物体検出が実装されている．

Max-Margin 物体検出法が利用されている（文献は次の通り）それにより，Dlib による顔検出が行われる．

Davis E. King, Max-Margin Object Detection, CoRR, abs/1502.00046, 2015.

トラッキング・ビジョン（correlation_tracker を使用）

Windows の場合

Windows を使用する場合は，次のように操作する．

cd C:\dlib
cd examples\build
.\release\video_tracking_ex ..\video_frames

犬の顔画像について眼鏡をあてはめる，顔のランドマーク検出

Ubuntu の場合

Ubuntu を使用する場合は，次\ のように操作する．

学習済みモデルのダウンロード

cd /usr/local/dlib/examples
sudo curl -O http://dlib.net/files/mmod_dog_hipsterizer.dat.bz2
sudo bzip2 -d mmod_dog_hipsterizer.dat.bz2

実行してみる

cd /usr/local/dlib/examples
./build/dnn_mmod_dog_hipsterizer mmod_dog_hipsterizer.dat faces/dogs.jpg