ステレオマッチング

MeshLab とは, ステレオ画像から,奥行き情報を取り出す.

キーワード: Depth Map

前準備

Python 3.12 のインストール

以下のいずれかの方法で Python 3.12 をインストールする。

方法1:winget によるインストール

Python がインストール済みの場合、この手順は不要である。管理者権限コマンドプロンプトで以下を実行する。管理者権限のコマンドプロンプトを起動するには、Windows キーまたはスタートメニューから「cmd」と入力し、表示された「コマンドプロンプト」を右クリックして「管理者として実行」を選択する。

winget install -e --id Python.Python.3.12 --scope machine --silent --accept-source-agreements --accept-package-agreements --override "/quiet InstallAllUsers=1 PrependPath=1 AssociateFiles=1 InstallLauncherAllUsers=1"

--scope machine を指定することで、システム全体(全ユーザー向け)にインストールされる。このオプションの実行には管理者権限が必要である。インストール完了後、コマンドプロンプトを再起動すると PATH が自動的に設定される。

方法2:インストーラーによるインストール

  1. Python 公式サイト(https://www.python.org/downloads/)にアクセスし、「Download Python 3.x.x」ボタンから Windows 用インストーラーをダウンロードする。
  2. ダウンロードしたインストーラーを実行する。
  3. 初期画面の下部に表示される「Add python.exe to PATH」に必ずチェックを入れてから「Customize installation」を選択する。このチェックを入れ忘れると、コマンドプロンプトから python コマンドを実行できない。
  4. 「Install Python 3.xx for all users」にチェックを入れ、「Install」をクリックする。

インストールの確認

コマンドプロンプトで以下を実行する。

python --version

バージョン番号(例:Python 3.12.x)が表示されればインストール成功である。「'python' は、内部コマンドまたは外部コマンドとして認識されていません。」と表示される場合は、インストールが正常に完了していない。

AIエディタ Windsurf のインストール

Pythonプログラムの編集・実行には、AIエディタの利用を推奨する。ここでは、Windsurfのインストールを説明する。

Windsurf がインストール済みの場合、この手順は不要である。管理者権限コマンドプロンプトで以下を実行する。管理者権限のコマンドプロンプトを起動するには、Windows キーまたはスタートメニューから「cmd」と入力し、表示された「コマンドプロンプト」を右クリックして「管理者として実行」を選択する。

winget install -e --id Codeium.Windsurf --scope machine --accept-source-agreements --accept-package-agreements --override "/VERYSILENT /NORESTART /MERGETASKS=!runcode,addtopath,associatewithfiles,!desktopicon"
powershell -Command "$env:Path=[System.Environment]::GetEnvironmentVariable('Path','Machine')+';'+[System.Environment]::GetEnvironmentVariable('Path','User'); windsurf --install-extension MS-CEINTL.vscode-language-pack-ja --force; windsurf --install-extension ms-python.python --force"

--scope machine を指定することで、システム全体(全ユーザー向け)にインストールされる。このオプションの実行には管理者権限が必要である。インストール完了後、コマンドプロンプトを再起動すると PATH が自動的に設定される。

関連する外部ページ

Windsurf の公式ページ: https://windsurf.com/

前準備として,ステレオ画像を準備

  1. 次のWebページを使う(感謝)

    http://vision.middlebury.edu/stereo/data/scenes2014/

  2. Playtableの右横の「Perf」をクリック
  3. 2つの画像ファイル im0.pngim1.png を分かりやすいディレクトリに保存する.

    * 以下「D:\」 (D: の直下) に保存したものとして説明を続ける.

  4. ダウンロードした 2つの画像ファイルを確認
  5. Python プログラムの実行
    Python プログラムの実行: 別ページ »で説明

    Python のまとめ: 別ページ »にまとめ

  6. 2つの画像の横方向の連結

    横方向に連結して,1つのオブジェクト gを作っている.

    import cv2
    im0 = cv2.imread("D:/im0.png")
    im1 = cv2.imread("D:/im1.png")
    g = cv2.hconcat([im0, im1])
    cv2.imshow("hoge", g)
    cv2.waitKey(0)
    cv2.destroyAllWindows()
    
  7. 巨大な画面が表示されるので確認.(別のウインドウの陰になっているかもしれないので探す).

    このあと,右上の「x」をクリックしない.画面の中をクリックしてから,何かのキーを押して閉じる

  8. 2つの画像の横方向の連結画像の縮小

    resize で縮小している.

    Python」で次を実行.

    import cv2
    im0 = cv2.imread("D:/im0.png")
    im1 = cv2.imread("D:/im1.png")
    g = cv2.hconcat([im0, im1])
    h, w = g.shape[:2]
    g2 = cv2.resize(g, (int(w/8), int(h/8)))
    cv2.imshow("hoge3", g2)
    cv2.waitKey(0)
    cv2.destroyAllWindows()
    
  9. 画面が表示されるので確認.(別のウインドウの陰になっているかもしれないので探す).

    このあと,右上の「x」をクリックしない.画面の中をクリックしてから,何かのキーを押して閉じる

  10. 2つのカラー画像の差(RGB成分の差)の絶対値画像の縮小

    Python」で次を実行.

    import cv2
    im0 = cv2.imread("D:/im0.png")
    im1 = cv2.imread("D:/im1.png")
    g = abs(im0 - im1)
    h, w = g.shape[:2]
    g2 = cv2.resize(g, (int(w/8), int(h/8)))
    cv2.imshow("hoge4", g2)
    cv2.waitKey(0)
    cv2.destroyAllWindows()
    
  11. 画面が表示されるので確認.(別のウインドウの陰になっているかもしれないので探す).

    2つのカラー画像の差の絶対値なので,結果もカラー画像

    こうして表示してみると,確かに,画像がずれていることが確認できる.

    このあと,右上の「x」をクリックしない.画面の中をクリックしてから,何かのキーを押して閉じる

    Depth Map

    Depth Map」とは 距離を画素の濃淡で示したもの.以下の実習では

    • 近いものは白
    • 遠いものは黒

    で表示する.

    ブロックマッチング (Block Matching) 法による DepthMap の生成

    Python」で次を実行.

    import cv2
    import numpy as np
    im0 = cv2.imread("D:/im0.png")
    im1 = cv2.imread("D:/im1.png")
    mono0 = cv2.cvtColor(im0, cv2.COLOR_BGR2GRAY)
    mono1 = cv2.cvtColor(im1, cv2.COLOR_BGR2GRAY)
    stereo = cv2.StereoBM_create(numDisparities=256, blockSize=15)
    disparity = stereo.compute(mono0, mono1)
    map = ( disparity - np.min(disparity) ) / ( np.max(disparity) - np.min(disparity) )
    h, w = map.shape[:2]
    g2 = cv2.resize(map, (int(w/4), int(h/4)))
    cv2.imshow("hoge5", g2)
    cv2.waitKey(0)
    cv2.destroyAllWindows()
    
  12. 画面が表示されるので確認.(別のウインドウの陰になっているかもしれないので探す).

    結果をみると,あまり,うまくいっていない.

    このあと,右上の「x」をクリックしない.画面の中をクリックしてから,何かのキーを押して閉じる

    セミグローバルブロックマッチング (Semi Global Block Matching) 法による DepthMap の生成

    Python」で次を実行.

    import cv2
    import numpy as np
    im0 = cv2.imread("D:/im0.png")
    im1 = cv2.imread("D:/im1.png")
    mono0 = cv2.cvtColor(im0, cv2.COLOR_BGR2GRAY)
    mono1 = cv2.cvtColor(im1, cv2.COLOR_BGR2GRAY)
    stereo = cv2.StereoSGBM_create(minDisparity = 10, numDisparities=256, blockSize=22)
    disparity = stereo.compute(mono0, mono1)
    map = ( disparity - np.min(disparity) ) / ( np.max(disparity) - np.min(disparity) )
    h, w = map.shape[:2]
    g2 = cv2.resize(map, (int(w/4), int(h/4)))
    cv2.imshow("hoge9", g2)
    cv2.waitKey(0)
    cv2.destroyAllWindows()
    
  13. 画面が表示されるので確認.(別のウインドウの陰になっているかもしれないので探す).

    結果をみると,あまり,うまくいっていない.

    このあと,右上の「x」をクリックしない.画面の中をクリックしてから,何かのキーを押して閉じる

youtube で配布されている side by side 形式動画ファイル

  1. 次のWebページを開く

    http://www.dreamscene.org/s3dvideo.php?Cmd=Show&site=all

  2. Voyager_3d_sbs.wmv をダウンロード
  3. 1/4倍に縮小+再生

    Python」で次を実行.

    OpenCV による動画表示を行う.

    import cv2
    v = cv2.VideoCapture("D:/Voyager_3D_sbs.wmv")
    while(v.isOpened()):
        r, f = v.read()
        if ( r == False ):
            break
        h, w = f.shape[:2]
        g2 = cv2.resize(f, (int(w/4), int(h/4)))
        cv2.imshow("", g2)
        # Press Q to exit
        if cv2.waitKey(1) & 0xFF == ord('q'):
            break
    
    v.release()
    cv2.destroyAllWindows()
    
  4. 結果を確認する

    途中で止めたいとき,右上の「x」をクリックしない.画面の中をクリックしてから,「q」のキーを押して閉じる

  5. セミグローバルブロックマッチング (Semi Global Block Matching) 法による DepthMap の生成

    Python」で次を実行.

    import cv2
    import numpy as np
    v = cv2.VideoCapture("D:/Voyager_3D_sbs.wmv")
    while(v.isOpened()):
        r, f = v.read()
        if ( r == False ):
            break
        h, w = f.shape[:2]
        im0 = f[0:h, 0:int(w/2), 0:3]
        im1 = f[0:h, int(w/2):w, 0:3]
        mono0 = cv2.cvtColor(im0, cv2.COLOR_BGR2GRAY)
        mono1 = cv2.cvtColor(im1, cv2.COLOR_BGR2GRAY)
        stereo = cv2.StereoSGBM_create(minDisparity = 5, numDisparities=16, blockSize=10)
        disparity = stereo.compute(mono0, mono1)
        map = ( disparity - np.min(disparity) ) / ( np.max(disparity) - np.min(disparity) )
        h, w = map.shape[:2]
        g2 = cv2.resize(map, (int(w/4), int(h/4)))
        cv2.imshow("", g2)
        # Press Q to exit
        if cv2.waitKey(1) & 0xFF == ord('q'):
            break
    
    v.release()
    cv2.destroyAllWindows()
    
  6. 結果を確認する

    途中で止めたいとき,右上の「x」をクリックしない.画面の中をクリックしてから,「q」のキーを押して閉じる