ステレオマッチング
MeshLab とは, ステレオ画像から,奥行き情報を取り出す.
キーワード: Depth Map
前準備
Python 3.12 のインストール
インストール済みの場合は実行不要。
管理者権限でコマンドプロンプトを起動(手順:Windowsキーまたはスタートメニュー > cmd と入力 > 右クリック > 「管理者として実行」)し、以下を実行する。管理者権限は、wingetの--scope machineオプションでシステム全体にソフトウェアをインストールするために必要である。
REM Python をシステム領域にインストール
winget install --scope machine --id Python.Python.3.12 -e --silent
REM Python のパス設定
set "PYTHON_PATH=C:\Program Files\Python312"
set "PYTHON_SCRIPTS_PATH=C:\Program Files\Python312\Scripts"
echo "%PATH%" | find /i "%PYTHON_PATH%" >nul
if errorlevel 1 setx PATH "%PATH%;%PYTHON_PATH%" /M >nul
echo "%PATH%" | find /i "%PYTHON_SCRIPTS_PATH%" >nul
if errorlevel 1 setx PATH "%PATH%;%PYTHON_SCRIPTS_PATH%" /M >nul
【関連する外部ページ】
Python の公式ページ: https://www.python.org/
AI エディタ Windsurf のインストール
Pythonプログラムの編集・実行には、AI エディタの利用を推奨する。ここでは,Windsurfのインストールを説明する。
管理者権限でコマンドプロンプトを起動(手順:Windowsキーまたはスタートメニュー > cmd と入力 > 右クリック > 「管理者として実行」)し、以下を実行して、Windsurfをシステム全体にインストールする。管理者権限は、wingetの--scope machineオプションでシステム全体にソフトウェアをインストールするために必要となる。
winget install --scope machine Codeium.Windsurf -e --silent
【関連する外部ページ】
Windsurf の公式ページ: https://windsurf.com/
前準備として,ステレオ画像を準備
- 次のWebページを使う(感謝)
- Playtableの右横の「
Perf」をクリック - 2つの画像ファイル im0.png と im1.png を分かりやすいディレクトリに保存する.
* 以下「D:\」 (D: の直下) に保存したものとして説明を続ける.
- ダウンロードした 2つの画像ファイルを確認
- Python プログラムの実行
- 2つの画像の横方向の連結
横方向に連結して,1つのオブジェクト gを作っている.
import cv2 im0 = cv2.imread("D:/im0.png") im1 = cv2.imread("D:/im1.png") g = cv2.hconcat([im0, im1]) cv2.imshow("hoge", g) cv2.waitKey(0) cv2.destroyAllWindows()
- 巨大な画面が表示されるので確認.(別のウインドウの陰になっているかもしれないので探す).
このあと,右上の「x」をクリックしない.画面の中をクリックしてから,何かのキーを押して閉じる
- 2つの画像の横方向の連結と画像の縮小
resize で縮小している.
「Python」で次を実行.
import cv2 im0 = cv2.imread("D:/im0.png") im1 = cv2.imread("D:/im1.png") g = cv2.hconcat([im0, im1]) h, w = g.shape[:2] g2 = cv2.resize(g, (int(w/8), int(h/8))) cv2.imshow("hoge3", g2) cv2.waitKey(0) cv2.destroyAllWindows()
- 画面が表示されるので確認.(別のウインドウの陰になっているかもしれないので探す).
このあと,右上の「x」をクリックしない.画面の中をクリックしてから,何かのキーを押して閉じる
- 2つのカラー画像の差(RGB成分の差)の絶対値と画像の縮小
「Python」で次を実行.
import cv2 im0 = cv2.imread("D:/im0.png") im1 = cv2.imread("D:/im1.png") g = abs(im0 - im1) h, w = g.shape[:2] g2 = cv2.resize(g, (int(w/8), int(h/8))) cv2.imshow("hoge4", g2) cv2.waitKey(0) cv2.destroyAllWindows()
- 画面が表示されるので確認.(別のウインドウの陰になっているかもしれないので探す).
2つのカラー画像の差の絶対値なので,結果もカラー画像
こうして表示してみると,確かに,画像がずれていることが確認できる.
このあと,右上の「x」をクリックしない.画面の中をクリックしてから,何かのキーを押して閉じる
Depth Map
「
Depth Map」とは 距離を画素の濃淡で示したもの.以下の実習では - 近いものは白
- 遠いものは黒
で表示する.
ブロックマッチング (Block Matching) 法による DepthMap の生成
「Python」で次を実行.
import cv2 import numpy as np im0 = cv2.imread("D:/im0.png") im1 = cv2.imread("D:/im1.png") mono0 = cv2.cvtColor(im0, cv2.COLOR_BGR2GRAY) mono1 = cv2.cvtColor(im1, cv2.COLOR_BGR2GRAY) stereo = cv2.StereoBM_create(numDisparities=256, blockSize=15) disparity = stereo.compute(mono0, mono1) map = ( disparity - np.min(disparity) ) / ( np.max(disparity) - np.min(disparity) ) h, w = map.shape[:2] g2 = cv2.resize(map, (int(w/4), int(h/4))) cv2.imshow("hoge5", g2) cv2.waitKey(0) cv2.destroyAllWindows()
- 画面が表示されるので確認.(別のウインドウの陰になっているかもしれないので探す).
結果をみると,あまり,うまくいっていない.
このあと,右上の「x」をクリックしない.画面の中をクリックしてから,何かのキーを押して閉じる
セミグローバルブロックマッチング (Semi Global Block Matching) 法による DepthMap の生成
「Python」で次を実行.
import cv2 import numpy as np im0 = cv2.imread("D:/im0.png") im1 = cv2.imread("D:/im1.png") mono0 = cv2.cvtColor(im0, cv2.COLOR_BGR2GRAY) mono1 = cv2.cvtColor(im1, cv2.COLOR_BGR2GRAY) stereo = cv2.StereoSGBM_create(minDisparity = 10, numDisparities=256, blockSize=22) disparity = stereo.compute(mono0, mono1) map = ( disparity - np.min(disparity) ) / ( np.max(disparity) - np.min(disparity) ) h, w = map.shape[:2] g2 = cv2.resize(map, (int(w/4), int(h/4))) cv2.imshow("hoge9", g2) cv2.waitKey(0) cv2.destroyAllWindows()
- 画面が表示されるので確認.(別のウインドウの陰になっているかもしれないので探す).
結果をみると,あまり,うまくいっていない.
このあと,右上の「x」をクリックしない.画面の中をクリックしてから,何かのキーを押して閉じる
- 2つの画像ファイル im0.png と im1.png を分かりやすいディレクトリに保存する.
youtube で配布されている side by side 形式動画ファイル
- 次のWebページを開く
- Voyager_3d_sbs.wmv をダウンロード
- 1/4倍に縮小+再生
「Python」で次を実行.
OpenCV による動画表示を行う.
import cv2 v = cv2.VideoCapture("D:/Voyager_3D_sbs.wmv") while(v.isOpened()): r, f = v.read() if ( r == False ): break h, w = f.shape[:2] g2 = cv2.resize(f, (int(w/4), int(h/4))) cv2.imshow("", g2) # Press Q to exit if cv2.waitKey(1) & 0xFF == ord('q'): break v.release() cv2.destroyAllWindows()
- 結果を確認する
途中で止めたいとき,右上の「x」をクリックしない.画面の中をクリックしてから,「q」のキーを押して閉じる
- セミグローバルブロックマッチング (Semi Global Block Matching) 法による DepthMap の生成
「Python」で次を実行.
import cv2 import numpy as np v = cv2.VideoCapture("D:/Voyager_3D_sbs.wmv") while(v.isOpened()): r, f = v.read() if ( r == False ): break h, w = f.shape[:2] im0 = f[0:h, 0:int(w/2), 0:3] im1 = f[0:h, int(w/2):w, 0:3] mono0 = cv2.cvtColor(im0, cv2.COLOR_BGR2GRAY) mono1 = cv2.cvtColor(im1, cv2.COLOR_BGR2GRAY) stereo = cv2.StereoSGBM_create(minDisparity = 5, numDisparities=16, blockSize=10) disparity = stereo.compute(mono0, mono1) map = ( disparity - np.min(disparity) ) / ( np.max(disparity) - np.min(disparity) ) h, w = map.shape[:2] g2 = cv2.resize(map, (int(w/4), int(h/4))) cv2.imshow("", g2) # Press Q to exit if cv2.waitKey(1) & 0xFF == ord('q'): break v.release() cv2.destroyAllWindows()
- 結果を確認する
途中で止めたいとき,右上の「x」をクリックしない.画面の中をクリックしてから,「q」のキーを押して閉じる