トップページ -> コンピュータ実習 -> Keras の体験,応用例 -> SSD による物体認識(pierluigiferrari / ssd_keras, TensorFlow 1.15, Keras 2.2.4 を使用)
[サイトマップへ]  

SSD による物体認識(pierluigiferrari / ssd_keras, TensorFlow 1.15, Keras 2.2.4 を使用)

サイト構成 連絡先,業績など コンピュータ実習 データの扱い コンピュータ設定 教材(公開) サポートページ
画像の物体認識を行ってみる. 学習については,学習結果のファイルを所定のサイトからダウンロードしてみる. Keras 2, Python を使うのが前提である.

先人に感謝.

参考Webページ: https://github.com/pierluigiferrari/ssd_keras


前準備

Python, virtualenv のインストール

git のインストール

以下,Windows でこれらをインストール済みであるとして,説明を続ける.

隔離された Python 環境の新規作成と,TensorFlow 1.15(旧バージョン), Keras 2.2.4 (旧バージョン), 各種パッケージのインストール

最新版の TensorFlow, Keras では動作しない.virtualenv隔離された Python 環境を作り,そこに,TensorFlow と Keras をインストール

  1. 今から作成するPython 環境の名前と、Pythonのバージョンを決めておく

  2. Windows で,コマンドプロンプトを管理者として実行

  3. virtualenv隔離された Python 環境新規作成し,有効化

    下の例では,Python 環境名をtf1keras22に設定している

    mkvirtualenv tf1keras22
    lsvirtualenv 
    

  4. TenforFlow 1.15, Keras 2.2.4 のインストール

    このとき,virtualenv のPython 仮想環境を有効化する(「tf1keras22」のところは、Python仮想環境の名前)

    ※ 「pip install」は,Python パッケージをインストールするためのコマンド

    ※ Windows で,「python」の代わりに,「py」(Windows のPythonランチャー)を使うと,Anaconda 3 内の Python が実行されることはない(Anaconda を使いたくないときは「py」)

    workon tf1keras22
    py -m pip install --upgrade pip
    pip install -U tensorflow==1.15 keras==2.2.4
    

    GPU版の TensorFlow を使いたいとき

    ※ TensorFlow 1.15 では CPU 版と GPU版が 1つのパッケージに統合されている.

    GPU 版 TensorFlow 1.15 を使うために,https://developer.nvidia.com/cuda-10.0-download-archiveから CUDA 10.0 を入手し,インストールしておくこと

    そして,https://developer.nvidia.com/cudnn から cuDNN を入手し,C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0 などに展開(解凍)し,パスを通しておくこと

  5. 各種パッケージのインストール

    pip install -U ipython opencv-python matplotlib numpy imageio tqdm beautifulsoup4 scikit-learn
    


pierluigiferrari / ssd_keras のインストール手順

  1. Windows で,コマンドプロンプトを管理者として実行

  2. 以前に,このWebページの手順でインストールしたことがあれば,次の手順で消去

    mkdir c:\pytools
    cd c:\pytools
    rmdir /s /q ssd_keras
    

  3. pierluigiferrari/ssd_keras のインストール

    git clone https://github.com/pierluigiferrari/ssd_keras
    


テスト実行

参考Webページ: https://github.com/pierluigiferrari/ssd_keras

予測(PASCAL VOC07+12, SSD512による)

Python コンソールで,https://github.com/pierluigiferrari/ssd_keras/blob/master/ssd512_inference.ipynbを実行しながら結果を確認したい.

結果は,画像などでプロットされる場合がある. Python でプロットを行いたい.

  1. IPython シェルで,virtualenv のPython 仮想環境「tf1keras22」を有効化する.

    PyCharm を使う場合は,次の手順である

    1. PyCharm で 「File」→ 「Settings」と操作する

    2. Project: <プロジェクト名>」を展開。 「Project Interpreter」をクリック。

    3. 右上の設定ボタンをクリック。 「Add ...」を選ぶ。

    4. System Interpreter」をクリック。

    5. ホームディレクトリの下の「\Envs\tf1keras22\Scripts\python.exe」を設定

      そのために,まず,ホームディレクトリのアイコンをクリック

      次に,「\Envs\tf1keras22\Scripts\python.exe」を設定.「OK」をクリック。

      virtualenv 配下の python.exe を設定している

    6. 今度は、「Build, Execution, Deployment」を展開。 そして「Concole」を展開。 「Python Concole」をクリック。

    7. Python interpreter」のプルダウンメニューで, 先ほど設定した python.exeを選ぶ。「OK」をクリック。

    8. PyCharm の Python コンソール(Python のシェル)を起動しなおす(あるいは PyCharm を起動し直す).

  2. PASCAL VOC07+12 の訓練(学習)済みの重みデータをダウンロード
    1. pierluigiferrari/ssd_keras のページを開く

      https://github.com/pierluigiferrari/ssd_keras

    2. ページをスクロール. 「Download the original trained model weight」のところの 「PASCAL VOC models 07+12」の「SSD512*」をダウンロード

    3. ダウンロードしたファイルを C:\pytools\ssd_kerasに置く

  3. IPython シェルで,さきほど展開(解凍)したディレクトリに移動

    ssd.py というファイルがあるディレクトリに移動.

    cd C:\pytools\ssd_keras
    sys.path.append("C:\pytools\ssd_keras")
    

  4. 使用する GPU のメモリ量を制限したい場合のみ

    次を実行.「1024」のところは,適切に調整すること.

    https://www.tensorflow.org/guide/gpu に記載の手順による.

    from __future__ import absolute_import, division, print_function, unicode_literals
    import tensorflow as tf
    
    gpus = tf.config.experimental.list_physical_devices('GPU')
    if gpus:
      # Restrict TensorFlow to only allocate 1GB of memory on the first GPU
      try:
        tf.config.experimental.set_virtual_device_configuration(
            gpus[0],
            [tf.config.experimental.VirtualDeviceConfiguration(memory_limit=1024)])
        logical_gpus = tf.config.experimental.list_logical_devices('GPU')
        print(len(gpus), "Physical GPUs,", len(logical_gpus), "Logical GPUs")
      except RuntimeError as e:
        # Virtual devices must be set before GPUs have been initialized
        print(e)
    

  5. ステップ 1 (初期設定)

    https://github.com/pierluigiferrari/ssd_keras/blob/master/ssd512_inference.ipynbによる

    次の Python プログラムを実行

    from __future__ import absolute_import, division, print_function, unicode_literals
    
    from keras import backend as K
    from keras.models import load_model
    from keras.preprocessing import image
    from keras.optimizers import Adam
    from imageio import imread
    import numpy as np
    from matplotlib import pyplot as plt
    
    from models.keras_ssd512 import ssd_512
    from keras_loss_function.keras_ssd_loss import SSDLoss
    from keras_layers.keras_layer_AnchorBoxes import AnchorBoxes
    from keras_layers.keras_layer_DecodeDetections import DecodeDetections
    from keras_layers.keras_layer_DecodeDetectionsFast import DecodeDetectionsFast
    from keras_layers.keras_layer_L2Normalization import L2Normalization
    
    from ssd_encoder_decoder.ssd_output_decoder import decode_detections, decode_detections_fast
    
    from data_generator.object_detection_2d_data_generator import DataGenerator
    from data_generator.object_detection_2d_photometric_ops import ConvertTo3Channels
    from data_generator.object_detection_2d_geometric_ops import Resize
    from data_generator.object_detection_2d_misc_utils import apply_inverse_transforms
    

  6. ステップ 2 (画像サイズの設定)

    https://github.com/pierluigiferrari/ssd_keras/blob/master/ssd512_inference.ipynbによる

    次の Python プログラムを実行

    # Set the image size.
    img_height = 512
    img_width = 512
    

  7. ステップ 3 (訓練(学習)済みの重みデータの読み込み

    https://github.com/pierluigiferrari/ssd_keras/blob/master/ssd512_inference.ipynbによる

    次の Python プログラムを実行

    # 1: Build the Keras model
    
    K.clear_session() # Clear previous models from memory.
    
    model = ssd_512(image_size=(img_height, img_width, 3),
                    n_classes=20,
                    mode='inference',
                    l2_regularization=0.0005,
                    scales=[0.07, 0.15, 0.3, 0.45, 0.6, 0.75, 0.9, 1.05], # The scales for MS COCO are [0.04, 0.1, 0.26, 0.42, 0.58, 0.74, 0.9, 1.06]
                    aspect_ratios_per_layer=[[1.0, 2.0, 0.5],
                                             [1.0, 2.0, 0.5, 3.0, 1.0/3.0],
                                             [1.0, 2.0, 0.5, 3.0, 1.0/3.0],
                                             [1.0, 2.0, 0.5, 3.0, 1.0/3.0],
                                             [1.0, 2.0, 0.5, 3.0, 1.0/3.0],
                                             [1.0, 2.0, 0.5],
                                             [1.0, 2.0, 0.5]],
                   two_boxes_for_ar1=True,
                   steps=[8, 16, 32, 64, 128, 256, 512],
                   offsets=[0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5],
                   clip_boxes=False,
                   variances=[0.1, 0.1, 0.2, 0.2],
                   normalize_coords=True,
                   subtract_mean=[123, 117, 104],
                   swap_channels=[2, 1, 0],
                   confidence_thresh=0.5,
                   iou_threshold=0.45,
                   top_k=200,
                   nms_max_output_size=400)
    
    # 2: Load the trained weights into the model.
    
    # TODO: Set the path of the trained weights.
    weights_path = 'VGG_VOC0712_SSD_512x512_iter_120000.h5'
    
    model.load_weights(weights_path, by_name=True)
    
    # 3: Compile the model so that Keras won't complain the next time you load it.
    
    adam = Adam(lr=0.001, beta_1=0.9, beta_2=0.999, epsilon=1e-08, decay=0.0)
    
    ssd_loss = SSDLoss(neg_pos_ratio=3, alpha=1.0)
    
    model.compile(optimizer=adam, loss=ssd_loss.compute_loss)
    


    (以下省略)

  8. ステップ 4 (入力画像ファイル)

    https://github.com/pierluigiferrari/ssd_keras/blob/master/ssd512_inference.ipynbによる

    次の Python プログラムを実行

    orig_images = [] # Store the images here.
    input_images = [] # Store resized versions of the images here.
    
    # We'll only load one image in this example.
    img_path = 'examples/fish_bike.jpg'
    
    orig_images.append(imread(img_path))
    img = image.load_img(img_path, target_size=(img_height, img_width))
    img = image.img_to_array(img)
    input_images.append(img)
    input_images = np.array(input_images)
    

  9. ステップ 5 (予測処理)

    https://github.com/pierluigiferrari/ssd_keras/blob/master/ssd512_inference.ipynbによる

    次の Python プログラムを実行

    y_pred = model.predict(input_images)
    

  10. ステップ 6 (予測結果の表示)

    https://github.com/pierluigiferrari/ssd_keras/blob/master/ssd512_inference.ipynbによる

    次の Python プログラムを実行

    confidence_threshold = 0.5
    
    y_pred_thresh = [y_pred[k][y_pred[k,:,1] > confidence_threshold] for k in range(y_pred.shape[0])]
    
    np.set_printoptions(precision=2, suppress=True, linewidth=90)
    print("Predicted boxes:\n")
    print('   class   conf xmin   ymin   xmax   ymax')
    print(y_pred_thresh[0])
    

  11. ステップ 7 (予測結果を画像として表示)

    https://github.com/pierluigiferrari/ssd_keras/blob/master/ssd512_inference.ipynbによる

    次の Python プログラムを実行

    # Display the image and draw the predicted boxes onto it.
    
    # Set the colors for the bounding boxes
    colors = plt.cm.hsv(np.linspace(0, 1, 21)).tolist()
    classes = ['background',
               'aeroplane', 'bicycle', 'bird', 'boat',
               'bottle', 'bus', 'car', 'cat',
               'chair', 'cow', 'diningtable', 'dog',
               'horse', 'motorbike', 'person', 'pottedplant',
               'sheep', 'sofa', 'train', 'tvmonitor']
    
    plt.figure(figsize=(20,12))
    plt.imshow(orig_images[0])
    
    current_axis = plt.gca()
    
    for box in y_pred_thresh[0]:
        # Transform the predicted bounding boxes for the 512x512 image to the original image dimensions.
        xmin = box[-4] * orig_images[0].shape[1] / img_width
        ymin = box[-3] * orig_images[0].shape[0] / img_height
        xmax = box[-2] * orig_images[0].shape[1] / img_width
        ymax = box[-1] * orig_images[0].shape[0] / img_height
        color = colors[int(box[0])]
        label = '{}: {:.2f}'.format(classes[int(box[0])], box[1])
        current_axis.add_patch(plt.Rectangle((xmin, ymin), xmax-xmin, ymax-ymin, color=color, fill=False, linewidth=2))  
        current_axis.text(xmin, ymin, label, size='x-large', color='white', bbox={'facecolor':color, 'alpha':1.0})
    

    実行結果