【目次】
InsightFace は,顔検出 (face detection),顔のアラインメント, 顔検証 (face verification), 顔識別 (face identification)の機能を持つ.
InsightFace の GitHub のページ: https://github.com/deepinsight/insightface
Gitは,バージョン管理システム.ソースコードの管理や複数人での共同に役立つ.
【サイト内の関連ページ】
Windows での Git のインストール: 別ページ »で説明している.
【関連する外部ページ】
Git の公式ページ: https://git-scm.com/
【サイト内の関連ページ】
【関連する外部ページ】
Python の公式ページ: https://www.python.org/
【サイト内の関連ページ】
NVIDIA グラフィックスボードを搭載しているパソコンの場合には, NVIDIA ドライバ, NVIDIA CUDA ツールキット, NVIDIA cuDNN のインストールを行う.
【関連する外部ページ】
コマンドプロンプトを管理者として実行: 別ページ »で説明
PyTorch のページ: https://pytorch.org/index.html
次のコマンドは, PyTorch 2.0 (NVIDIA CUDA 11.8 用) をインストールする. 但し,Anaconda3を使いたい場合には別手順になる.
事前に NVIDIA CUDA のバージョンを確認しておくこと(ここでは,NVIDIA CUDA ツールキット 11.8 が前もってインストール済みであるとする).
PyTorch で,GPU が動作している場合には,「torch.cuda.is_available()」により,True が表示される.
python -m pip install -U --ignore-installed pip python -m pip install -U torch torchvision torchaudio numpy --index-url https://download.pytorch.org/whl/cu118 python -c "import torch; print(torch.__version__, torch.cuda.is_available())"
Anaconda3を使いたい場合には, Anaconda プロンプト (Anaconda Prompt) を管理者として実行し, 次のコマンドを実行する. (PyTorch と NVIDIA CUDA との連携がうまくいかない可能性があるため,Anaconda3を使わないことも検討して欲しい).
conda install -y pytorch torchvision torchaudio pytorch-cuda=11.8 cudnn -c pytorch -c nvidia py -c "import torch; print(torch.__version__, torch.cuda.is_available())"
【サイト内の関連ページ】
【関連する外部ページ】
起動は,Windows のメニューで「Visual Studio 20..」の下の「x64 Native Tools コマンドプロンプト (x64 Native Tools Command Prompt)」を選ぶ.「x64」は,64ビット版の意味である.
「x64 Native Tools コマンドプロンプト (x64 Native Tools Command Prompt)」がないとき:
C++ ビルドツール (Build Tools) のインストールを行うことで, 「x64 Native Tools コマンドプロンプト (x64 Native Tools Command Prompt)」がインストールされる.その手順は,別ページ »で説明
GPU を使わない場合には「onnxruntime-gpu」でなく,「onnxruntime」をインストールすること.
python -m pip install -U numpy==1.23.5 insightface onnxruntime-gpu
公式ページ (https://github.com/deepinsight/insightface/tree/master/python-package) に記載の,顔検出及び年齢と性別の予測のプログラムを実行する.
このプログラムは buffalo_l という名前の事前学習済みモデルを使用している.
mkdir %HOMEPATH%\insightface cd %HOMEPATH%\insightface notepad a.py
先の太さや文字の大きさを調整したいときは app/face_analysis.py を調整。
import cv2 import numpy as np import matplotlib.pyplot as plt import insightface from insightface.app import FaceAnalysis from insightface.data import get_image as ins_get_image app = FaceAnalysis(providers=['CUDAExecutionProvider', 'CPUExecutionProvider']) app.prepare(ctx_id=0, det_size=(640, 640)) import tkinter as tk from tkinter import filedialog import os from PIL import Image root = tk.Tk() root.withdraw() fpaths = filedialog.askopenfilenames() for fpath in root.tk.splitlist(fpaths): print("file name: ", fpath) img = cv2.imread(fpath) faces = app.get(img) rimg = app.draw_on(img, faces) cv2.imwrite("result_" + os.path.basename(fpath), rimg) Image.open("result_" + os.path.basename(fpath)).show() print("bbox, age, gender") for j in faces: print(j['bbox'], j['age'], j['gender'])
Python プログラムの実行
Python 開発環境(Jupyter Qt Console, Jupyter ノートブック (Jupyter Notebook), Jupyter Lab, Nteract, Spyder, PyCharm, PyScripterなど)も便利である.
Python のまとめ: 別ページ »にまとめ
プログラムを a.pyのようなファイル名で保存したので, 「python a.py」のようなコマンドで行う.
python a.py
ファイル選択画面が出るので,画像ファイルを選択する.ファイルは複数選択可能である.
それぞれのファイルについて,ファイル名と,検出された顔の bounding box(バウンディングボックス),年齢,性別が表示される.
Python プログラムを実行する
import cv2 import numpy as np import insightface from insightface.app import FaceAnalysis from insightface.data import get_image as ins_get_image app = FaceAnalysis() app.prepare(ctx_id=0, det_size=(640, 640)) v = cv2.VideoCapture(0) while(v.isOpened()): r, f = v.read() if ( r == False ): break faces = app.get(f) rimg = app.draw_on(f, faces) cv2.imshow("", rimg) # Press Q to exit if cv2.waitKey(1) & 0xFF == ord('q'): break
このプログラムは buffalo_l という名前の事前学習済みモデルを使用している.
mkdir %HOMEPATH%\insightface cd %HOMEPATH%\insightface notepad c.py
先の太さや文字の大きさを調整したいときは app/face_analysis.py を調整。
import cv2 import numpy as np import matplotlib.pyplot as plt import insightface from insightface.app import FaceAnalysis from insightface.data import get_image as ins_get_image app = FaceAnalysis(providers=['CUDAExecutionProvider', 'CPUExecutionProvider']) app.prepare(ctx_id=0, det_size=(640, 640)) import tkinter as tk from tkinter import filedialog import os from PIL import Image # first face root = tk.Tk() root.withdraw() fpath = filedialog.askopenfilename() print("file name: ", fpath) img = cv2.imread(fpath) faces = app.get(img) rimg = app.draw_on(img, faces) cv2.imwrite("result_" + os.path.basename(fpath), rimg) Image.open("result_" + os.path.basename(fpath)).show() print("filename, ", fpath) print("bbox, age, gender") for j in faces: print(j['bbox'], j['age'], j['gender']) embedding = faces[0]['embedding'] print(embedding) root = tk.Tk() root.withdraw() fpaths = filedialog.askopenfilenames() for fpath in root.tk.splitlist(fpaths): print("file name: ", fpath) img = cv2.imread(fpath) faces = app.get(img) rimg = app.draw_on(img, faces) cv2.imwrite("result_" + os.path.basename(fpath), rimg) Image.open("result_" + os.path.basename(fpath)).show() print("filename, ", fpath) print("bbox, age, gender") for j in faces: print(j['bbox'], j['age'], j['gender'], np.dot(j['embedding'], embedding.T))
Python プログラムの実行
Python 開発環境(Jupyter Qt Console, Jupyter ノートブック (Jupyter Notebook), Jupyter Lab, Nteract, Spyder, PyCharm, PyScripterなど)も便利である.
Python のまとめ: 別ページ »にまとめ
プログラムを c.pyのようなファイル名で保存したので, 「python c.py」のようなコマンドで行う.
python c.py
ファイル選択画面が出るので,画像ファイルを選択する.このとき,画像は1つ選択する.
処理が終わると,画像と, ファイル名と,検出された顔の bounding box(バウンディングボックス),年齢,性別が表示される.
再びファイル選択画面が出る.画像ファイルを選択する.今後は,画像を複数選択可能である.
処理が終わると,画像と, ファイル名と,検出された顔の bounding box(バウンディングボックス),年齢,性別が表示される. そして,最初に選んだ顔との類似度が数字で表示される.類似度の値が大きいほど本人に似ていると判定されている.
公式ページ (https://github.com/deepinsight/insightface/blob/master/examples/person_detection/scrfd_person.py) に記載の,人体検出のプログラムを実行する.
mkdir %HOMEPATH%\insightface cd %HOMEPATH%\insightface notepad b.py
先の太さや文字の大きさを調整したいときは app/face_analysis.py を調整。
import datetime import numpy as np import os import os.path as osp import glob import cv2 import insightface assert insightface.__version__>='0.4' def detect_person(img, detector): bboxes, kpss = detector.detect(img) bboxes = np.round(bboxes[:,:4]).astype(np.int) kpss = np.round(kpss).astype(np.int) kpss[:,:,0] = np.clip(kpss[:,:,0], 0, img.shape[1]) kpss[:,:,1] = np.clip(kpss[:,:,1], 0, img.shape[0]) vbboxes = bboxes.copy() vbboxes[:,0] = kpss[:, 0, 0] vbboxes[:,1] = kpss[:, 0, 1] vbboxes[:,2] = kpss[:, 4, 0] vbboxes[:,3] = kpss[:, 4, 1] return bboxes, vbboxes detector = insightface.model_zoo.get_model('scrfd_person_2.5g.onnx', download=True) detector.prepare(0, nms_thresh=0.5, input_size=(640, 640)) import tkinter as tk from tkinter import filedialog from PIL import Image root = tk.Tk() root.withdraw() fpaths = filedialog.askopenfilenames() for fpath in root.tk.splitlist(fpaths): print("file name: ", fpath) img = cv2.imread(fpath) bboxes, vbboxes = detect_person(img, detector) for i in range(bboxes.shape[0]): bbox = bboxes[i] vbbox = vbboxes[i] x1,y1,x2,y2 = bbox vx1,vy1,vx2,vy2 = vbbox cv2.rectangle(img, (x1,y1) , (x2,y2) , (0,255,0) , 1) alpha = 0.8 color = (255, 0, 0) for c in range(3): img[vy1:vy2,vx1:vx2,c] = img[vy1:vy2, vx1:vx2, c]*alpha + color[c]*(1.0-alpha) cv2.circle(img, (vx1,vy1) , 1, color , 2) cv2.circle(img, (vx1,vy2) , 1, color , 2) cv2.circle(img, (vx2,vy1) , 1, color , 2) cv2.circle(img, (vx2,vy2) , 1, color , 2) cv2.imwrite("result_" + os.path.basename(fpath), img) Image.open("result_" + os.path.basename(fpath)).show() print(bboxes)
Python プログラムの実行
Python 開発環境(Jupyter Qt Console, Jupyter ノートブック (Jupyter Notebook), Jupyter Lab, Nteract, Spyder, PyCharm, PyScripterなど)も便利である.
Python のまとめ: 別ページ »にまとめ
プログラムを b.pyのようなファイル名で保存したので, 「python b.py」のようなコマンドで行う.
python b.py
ファイル選択画面が出るので,画像ファイルを選択する.ファイルは複数選択可能である.
このとき, bbox の情報が得られる. これは,検出された人物の bounding box である.