トップページ -> コンピュータ実習 -> 顔検出、顔識別 -> ビデオを扱ってみる(mpatacchiola/DeepGaze を使用)
[サイトマップへ]

ビデオを扱ってみる(mpatacchiola/DeepGaze を使用)

サイト構成 連絡先,業績など コンピュータ実習 データの扱い コンピュータ設定 教材(公開) サポートページ

目次

利用条件などは利用者において確認してください

サイト内の関連Webページ:

謝辞:DeepGaze の作者に感謝します

参考Webページ https://www.github.com/mpatacchiola/DeepGaze


前準備

Python, virtualenv, git, cmake, Dlib のインストール

以下,Windows でインストール済みであるものとして説明を続ける.

Dlib は C:\pytools\dlib にインストールされているとする

(GPU を使うときに限り) NVIDIA グラフィックスカード・ドライバのインストール

GPU 版の TensorFlow を使うには, CUDA Compute Capability 3.5 以上に適合するグラフィックスカード、NVIDIA グラフィックスカードのドライバのインストールが必要である.

Windows でのインストール手順は,「別のページ」で説明している

(GPU を使うときに限り) NVIDIA CUDA ツールキット,NVIDIA cuDNN のインストール

GPU 版の TensorFlow を使うときについては,次のページに記載がある.

https://www.tensorflow.org/install/gpu#pip_package


mpatacchiola/DeepGaze のインストール

隔離された Python 環境の新規作成と,TensorFlow 1.15,Python 用 OpenCV,Dlib のインストール

  1. 今から作成するPython 環境の名前と、Pythonのバージョンを決めておく

  2. Windows で,コマンドプロンプトを管理者として実行

  3. virtualenv隔離された Python 環境新規作成し,有効化

    下の例では,Python 環境名をtf1に設定している

    mkvirtualenv tf1
    lsvirtualenv 
    

  4. TenforFlow 1.15,Python 用 OpenCV, Dlib,scikit-image のインストール

    このとき,virtualenv のPython 仮想環境を有効化する(「tf1」のところは、Python仮想環境の名前)

    ※ 「pip install」は,Python パッケージをインストールするためのコマンド

    ※ Windows で,「python」の代わりに,「py」(Windows のPythonランチャー)を使うと,Anaconda 3 内の Python が実行されることはない(Anaconda を使いたくないときは「py」)

    workon tf1
    py -m pip install --upgrade pip
    pip install -U tensorflow==1.15 opencv-python dlib
    pip install -U scikit-image  
    
    


    (途中省略)

    GPU版の TensorFlow を使いたいとき

    ※ TensorFlow 1.15 では CPU 版と GPU版が 1つのパッケージに統合されている.

    GPU 版 TensorFlow 1.15 を使うために,https://developer.nvidia.com/cuda-10.0-download-archiveから CUDA 10.0 を入手し,インストールしておくこと

    そして,https://developer.nvidia.com/cudnn から cuDNN を入手し,C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0 などに展開(解凍)し,パスを通しておくこと

mpatacchiola/DeepGaze のインストール

  1. Windows で,コマンドプロンプトを管理者として実行

  2. DeepGaze のインストールディレクトリを空にしておく

    mkdir c:\pytools
    cd c:\pytools
    rmdir /s /q deepgaze
    

  3. DeepGaze のインストール

    このとき,virtualenv のPython 仮想環境を有効化する(「tf1」のところは、Python仮想環境の名前)

    workon tf1
    git clone https://github.com/mpatacchiola/deepgaze
    cd deepgaze
    python setup.py build
    python setup.py install 
    



このページで説明のために使用するビデオ、写真

  1. C:\face-image のような作業用のディレクトリ(フォルダ)を作る

  2. mp4 形式ビデオファイル: sample2.mp4 を、C:\face-image の下にダウンロード

ビデオカメラで動かしてみる

  1. Window でコマンドプロンプトを実行

  2. このとき,virtualenv のPython 仮想環境を有効化する(「tf1」のところは、Python仮想環境の名前)

    workon tf1
    

  3. Python プログラムを動かす.

    ※ そのために, Windows では,「python」コマンドやPythonランチャーである「py」を使う. Ubuntu では「python3」コマンドを使う. あるいは, PyCharmなどにある Python コンソールも便利である.

    import numpy as np
    import cv2
    from deepgaze.saliency_map import FasaSaliencyMapping 
    
    # Using OpenCV the resolution of the webcam is set to these values.
    # You must check which resolution your webcam support and adjust the values in accordance.
    RESOLUTION_WIDTH = 320
    RESOLUTION_HEIGHT = 180
    
    # Open the video stream and set the webcam resolution.
    # It may give problem if your webcam does not support the particular resolution used.
    video_capture = cv2.VideoCapture(0)
    
    # Create the main window and move it
    cv2.namedWindow('Video')
    
    # Obtaining the CAM dimension
    cam_w = int(video_capture.get(3))
    cam_h = int(video_capture.get(4))
    
    # Defining the FASA object using the camera resolution
    my_map = FasaSaliencyMapping(cam_h, cam_w)
    
    while True:
        # Capture frame-by-frame
        ret, frame = video_capture.read()
        image_salient = my_map.returnMask(frame, tot_bins=8, format='BGR2LAB')
        cv2.imshow('Video', image_salient)
        # Press Q to exit
        if cv2.waitKey(1) & 0xFF == ord('q'):
            break
    



問い合わせ先: 金子邦彦(かねこ くにひこ)