ORB特徴点検出カメラキャプチャプログラム

1. 概要

主要技術：ORB（Oriented FAST and Rotated BRIEF）特徴点検出

プログラム概要：
Webカメラからリアルタイム映像を取得し、ORB特徴点検出により画像間の重なり面積を自動計算、設定した閾値（80%）以下になった時点で新しい視点のフレームとして自動保存するカメラキャプチャプログラ

技術の論文：

論文名：「ORB: An efficient alternative to SIFT or SURF」
出典：Rublee, E., Rabaud, V., Konolige, K., & Bradski, G. (2011). ORB: An efficient alternative to SIFT or SURF. In Proceedings of the 2011 International Conference on Computer Vision (pp. 2564-2571). IEEE.

技術の新規性・特徴：
ORBは従来のSIFT・SURFと比較して高速な特徴点検出・記述子計算を実現する。FAST（Features from Accelerated Segment Test）はコーナー検出に特化したアルゴリズムであり、BRIEF（Binary Robust Independent Elementary Features）はバイナリ形式（0と1）で特徴を表現するため計算量が少ない。従来手法が浮動小数点記述子を使用するのに対し、ORBはハミング距離によるマッチングを可能にする。

活用可能なアプリケーション例：
リアルタイム物体認識、SLAM（Simultaneous Localization and Mapping）、AR（拡張現実）、画像マッチング、カメラトラッキング

技術的制約：
テクスチャの少ない平面では特徴点検出が困難である。照明変化や視点変化に対する耐性に限界がある。リアルタイム処理と精度にはトレードオフ関係が存在する。

体験価値：
リアルタイムカメラ映像から特徴点を自動検出し、重なり面積に基づいて新しい視点のフレームを自動保存するプログラムを確認

2. 事前準備

Python, Windsurfをインストールしていない場合の手順（インストール済みの場合は実行不要）。

管理者権限でコマンドプロンプトを起動する（手順：Windowsキーまたはスタートメニュー > cmd と入力 > 右クリック > 「管理者として実行」）
以下のコマンドをそれぞれ実行する（wingetコマンドは1つずつ実行）

REM Python をシステム領域にインストール
winget install --scope machine --id Python.Python.3.12 -e --silent
REM Windsurf をシステム領域にインストール
winget install --scope machine --id Codeium.Windsurf -e --silent
REM Python のパス設定
set "PYTHON_PATH=C:\Program Files\Python312"
set "PYTHON_SCRIPTS_PATH=C:\Program Files\Python312\Scripts"
echo "%PATH%" | find /i "%PYTHON_PATH%" >nul
if errorlevel 1 setx PATH "%PATH%;%PYTHON_PATH%" /M >nul
echo "%PATH%" | find /i "%PYTHON_SCRIPTS_PATH%" >nul
if errorlevel 1 setx PATH "%PATH%;%PYTHON_SCRIPTS_PATH%" /M >nul
REM Windsurf のパス設定
set "WINDSURF_PATH=C:\Program Files\Windsurf"
if exist "%WINDSURF_PATH%" (
    echo "%PATH%" | find /i "%WINDSURF_PATH%" >nul
    if errorlevel 1 setx PATH "%PATH%;%WINDSURF_PATH%" /M >nul
)

必要ライブラリのインストール

コマンドプロンプトを管理者として実行（手順：Windowsキーまたはスタートメニュー > cmd と入力 > 右クリック > 「管理者として実行」）し、以下を実行する


pip install opencv-python numpy pillow

3. 動作原理

基本概念：
特徴点とは画像内の特徴的な点（コーナー、エッジ等）である。記述子は特徴点周辺の画像パターンを数値化した情報であり、マッチングは異なる画像間で対応する特徴点を見つける処理である。

処理手順：
ORBは特徴点を検出し記述子を計算、マッチングを行う。ホモグラフィ行列（画像間の幾何学的変換を表す行列）で画像変換を計算し、グリッドベースで重なり面積を算出する。重なり面積が閾値以下の場合に新しい視点として判断する。

4. プログラムコード


# ORB特徴点検出カメラキャプチャプログラム
# Webカメラから重なり面積が閾値以下のフレームを自動保存
# 論文: Rublee, E., Rabaud, V., Konolige, K., & Bradski, G. (2011). ORB: An efficient alternative to SIFT or SURF. ICCV 2011.
# GitHub: https://github.com/opencv/opencv
# 特徴: ORBは特徴点検出・記述子計算手法、リアルタイム処理対応
#       FAST+BRIEF組み合わせ、バイナリ記述子による効率性
# 学習済モデル: 使用なし（手作りアルゴリズム）
# 前準備: pip install opencv-python numpy pillow (管理者権限のコマンドプロンプトで実行)

import cv2
import numpy as np
from PIL import Image, ImageDraw, ImageFont

# 定数定義
OVERLAP_THRESHOLD = 0.8
GRID_RATIO = 0.02  # 画像サイズに対するグリッド間隔の比率
HOMOGRAPHY_RANSAC_THRESHOLD = 5.0
FONT_PATH = 'C:/Windows/Fonts/meiryo.ttc'
FONT_SIZE = 20

# カメラ初期化
cap = cv2.VideoCapture(0, cv2.CAP_DSHOW)
if not cap.isOpened():
    cap = cv2.VideoCapture(0)

if not cap.isOpened():
    print("エラー: カメラを開けません")
    exit()

cap.set(cv2.CAP_PROP_BUFFERSIZE, 1)

# 変数初期化
frame_count = 0
ref_frame = None
ref_kp = None
ref_desc = None
orb = cv2.ORB_create()

# ガイダンス表示
print("=" * 60)
print("ORB特徴点検出カメラキャプチャプログラム")
print("=" * 60)
print("【概要】")
print("  カメラ映像から特徴点を検出し、基準フレームとの重なりが")
print("  80%以下になった場合に自動的にフレームを保存します")
print("")
print("【操作方法】")
print("  - カメラを動かすと自動的に新しい領域を検出して保存")
print("  - 'q'キー: プログラム終了")
print("")
print("【注意事項】")
print("  - 十分な特徴点が検出できる被写体を映してください")
print("  - 急激なカメラ移動は避けてください")
print("=" * 60)
print("")

# フォント設定
try:
    font = ImageFont.truetype(FONT_PATH, FONT_SIZE)
except:
    font = None
    print("日本語フォントの読み込みに失敗しました。英語表示になります。")

# メイン処理
while True:
    # 最新フレーム取得
    cap.grab()
    ret, frame = cap.retrieve()
    if not ret:
        break
    gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
    h, w = gray.shape

    # 解像度に応じたグリッドサイズ計算
    grid_size = max(1, int(min(w, h) * GRID_RATIO))

    # 初回フレーム処理
    if ref_frame is None:
        ref_frame = gray.copy()
        ref_kp, ref_desc = orb.detectAndCompute(ref_frame, None)

        if ref_desc is not None:
            cv2.imwrite(f"frame_{frame_count:03d}.jpg", frame)
            print(f"基準フレーム保存: frame_{frame_count:03d}.jpg")
            frame_count += 1
    else:
        # 特徴点抽出とマッチング
        curr_kp, curr_desc = orb.detectAndCompute(gray, None)

        if (curr_desc is not None and ref_desc is not None and
            len(ref_desc) >= 4 and len(curr_desc) >= 4):

            bf = cv2.BFMatcher(cv2.NORM_HAMMING, crossCheck=True)
            matches = bf.match(ref_desc, curr_desc)

            if len(matches) >= 4:
                # ホモグラフィ計算（現在→基準への変換）
                ref_pts = np.float32([ref_kp[m.queryIdx].pt for m in matches]).reshape(-1, 1, 2)
                curr_pts = np.float32([curr_kp[m.trainIdx].pt for m in matches]).reshape(-1, 1, 2)

                H, mask = cv2.findHomography(curr_pts, ref_pts, cv2.RANSAC, HOMOGRAPHY_RANSAC_THRESHOLD)

                if H is not None:
                    # 重なり面積計算：現在フレームの点を基準フレーム座標系に変換
                    total = 0
                    inside = 0
                    for x in range(0, w, grid_size):
                        for y in range(0, h, grid_size):
                            total += 1
                            # 現在フレームの点を基準フレーム座標系に変換
                            pt = np.float32([[[x, y]]])
                            transformed_pt = cv2.perspectiveTransform(pt, H)
                            # 変換後の点が基準フレーム内にあるか判定
                            tx, ty = transformed_pt[0, 0]
                            if 0 <= tx < w and 0 <= ty < h:
                                inside += 1

                    overlap = inside / total if total > 0 else 0

                    if overlap < OVERLAP_THRESHOLD:
                        cv2.imwrite(f"frame_{frame_count:03d}.jpg", frame)
                        print(f"保存: frame_{frame_count:03d}.jpg (重なり: {overlap:.2%})")
                        frame_count += 1

                        # 基準更新
                        ref_frame = gray.copy()
                        ref_kp, ref_desc = orb.detectAndCompute(ref_frame, None)

    # 画面表示（日本語テキスト付き）
    display_frame = frame.copy()
    if font is not None:
        img_pil = Image.fromarray(cv2.cvtColor(display_frame, cv2.COLOR_BGR2RGB))
        draw = ImageDraw.Draw(img_pil)
        draw.text((10, 10), f"保存数: {frame_count}", font=font, fill=(0, 255, 0))
        draw.text((10, 40), "終了: 'q'", font=font, fill=(0, 255, 0))
        display_frame = cv2.cvtColor(np.array(img_pil), cv2.COLOR_RGB2BGR)
    else:
        cv2.putText(display_frame, f"Saved: {frame_count}", (10, 30),
                    cv2.FONT_HERSHEY_SIMPLEX, 0.7, (0, 255, 0), 2)
        cv2.putText(display_frame, "Press 'q' to quit", (10, 60),
                    cv2.FONT_HERSHEY_SIMPLEX, 0.7, (0, 255, 0), 2)

    cv2.imshow('Camera', display_frame)

    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# 終了処理
cap.release()
cv2.destroyAllWindows()
print(f"\n終了。保存フレーム数: {frame_count}")

5. 使用方法

実行手順

上記のプログラムを実行する

操作方法

プログラム実行後、カメラ映像が表示される
カメラを動かし、視点を変更する
重なり面積が80%以下になった場合、自動的にフレームが保存される
'q'キーを押すとプログラムが終了する

出力結果

保存されたフレームは「frame_000.jpg」「frame_001.jpg」などの形式で保存される
コンソールに保存されたフレームの情報と重なり面積が表示される

6. 実験・探求のアイデア

AIモデル選択の実験

ORB以外の特徴点検出手法との比較を行う。代表的な手法にはSIFT、SURF、AKAZE、BRISKがある。各手法の検出速度、検出精度、マッチング精度を比較し、手法間の性能差と適用場面の違いを理解する。

実験要素の調整

閾値パラメータの調整
- OVERLAP_THRESHOLDを0.5、0.7、0.9に変更して保存頻度の変化を観察（閾値と保存タイミングの関係を理解）
- GRID_SIZEを5、15、20に変更して計算精度と速度の関係を確認（精度と処理速度のトレードオフを学習）
ORBパラメータの調整
- nfeatures（特徴点数）を500、1000、2000に変更して検出性能を比較（特徴点数と認識精度の関係を分析）
- scaleFactor（スケール係数）を1.1、1.3、1.5に変更してマルチスケール性能を確認（スケール変化への対応能力を評価）