OpenCV で適応的 2値化(OpenCV,Python を使用)
1. エグゼクティブサマリー
本記事では,OpenCV と Python を使用して適応的2値化を行う方法を説明する.
処理前
|
|
処理後
|
|
【サイト内の OpenCV 関連ページ】
- OpenCV について [PDF] , [パワーポイント]
- OpenCV のインストール,画像表示を行う C++ プログラムの実行手順: 別ページ »で説明
- OpenCV と Python を活用した画像・ビデオ処理プログラム: 別ページ »にまとめ
- OpenCV 4 の C/C++ プログラム: 別ページ »にまとめている.
【OpenCV の公式情報】
- OpenCV の公式ページ: https://opencv.org
- GitHub の OpenCV のページ: https://github.com/opencv/opencv/releases
2. 前準備(必要ソフトウェアの入手)
ここでは、最低限の事前準備について説明する。機械学習や深層学習を行う場合は、NVIDIA CUDA、Visual Studio、Cursorなどを追加でインストールすると便利である。これらについては別ページ https://www.kkaneko.jp/cc/dev/aiassist.htmlで詳しく解説しているので、必要に応じて参照してください。
Python 3.12 のインストール(Windows 上) [クリックして展開]
以下のいずれかの方法で Python 3.12 をインストールする。Python がインストール済みの場合、この手順は不要である。
方法1:winget によるインストール
管理者権限のコマンドプロンプトで以下を実行する。管理者権限のコマンドプロンプトを起動するには、Windows キーまたはスタートメニューから「cmd」と入力し、表示された「コマンドプロンプト」を右クリックして「管理者として実行」を選択する。
winget install --scope machine --id Python.Python.3.12 -e --silent --disable-interactivity --force --accept-source-agreements --accept-package-agreements --override "/quiet InstallAllUsers=1 PrependPath=1 Include_pip=1 Include_test=0 Include_launcher=1 InstallLauncherAllUsers=1"
--scope machine を指定することで、システム全体(全ユーザー向け)にインストールされる。このオプションの実行には管理者権限が必要である。インストール完了後、コマンドプロンプトを再起動すると PATH が自動的に設定される。
方法2:インストーラーによるインストール
- Python 公式サイト(https://www.python.org/downloads/)にアクセスし、「Download Python 3.x.x」ボタンから Windows 用インストーラーをダウンロードする。
- ダウンロードしたインストーラーを実行する。
- 初期画面の下部に表示される「Add python.exe to PATH」に必ずチェックを入れてから「Customize installation」を選択する。このチェックを入れ忘れると、コマンドプロンプトから
pythonコマンドを実行できない。 - 「Install Python 3.xx for all users」にチェックを入れ、「Install」をクリックする。
インストールの確認
コマンドプロンプトで以下を実行する。
python --version
バージョン番号(例:Python 3.12.x)が表示されればインストール成功である。「'python' は、内部コマンドまたは外部コマンドとして認識されていません。」と表示される場合は、インストールが正常に完了していない。
AIエディタ Windsurf のインストール(Windows 上) [クリックして展開]
Pythonプログラムの編集・実行には、AIエディタの利用を推奨する。ここでは、Windsurfのインストールを説明する。Windsurf がインストール済みの場合、この手順は不要である。
管理者権限のコマンドプロンプトで以下を実行する。管理者権限のコマンドプロンプトを起動するには、Windows キーまたはスタートメニューから「cmd」と入力し、表示された「コマンドプロンプト」を右クリックして「管理者として実行」を選択する。
winget install --scope machine --id Codeium.Windsurf -e --silent --disable-interactivity --force --accept-source-agreements --accept-package-agreements --custom "/SP- /SUPPRESSMSGBOXES /NORESTART /CLOSEAPPLICATIONS /DIR=""C:\Program Files\Windsurf"" /MERGETASKS=!runcode,addtopath,associatewithfiles,!desktopicon"
powershell -Command "$env:Path=[System.Environment]::GetEnvironmentVariable('Path','Machine')+';'+[System.Environment]::GetEnvironmentVariable('Path','User'); windsurf --install-extension MS-CEINTL.vscode-language-pack-ja --force; windsurf --install-extension ms-python.python --force; windsurf --install-extension Codeium.windsurfPyright --force"
--scope machine を指定することで、システム全体(全ユーザー向け)にインストールされる。このオプションの実行には管理者権限が必要である。インストール完了後、コマンドプロンプトを再起動すると PATH が自動的に設定される。
【関連する外部ページ】
Windsurf の公式ページ: https://windsurf.com/
必要なライブラリのインストール [クリックして展開]
管理者権限のコマンドプロンプトで以下を実行する。管理者権限のコマンドプロンプトを起動するには、Windows キーまたはスタートメニューから「cmd」と入力し、表示された「コマンドプロンプト」を右クリックして「管理者として実行」を選択する。
次のコマンドは,旧バージョンを削除し,Python 用 opencv-python のインストールを行う. 最終行はバージョン表示によるインストール確認である.
python -m pip uninstall -y opencv-python
python -m pip uninstall -y opencv-python-headless
python -m pip uninstall -y opencv-contrib-python
python -m pip install -U opencv-python opencv-contrib-python numpy
python -c "import sys, cv2; print(f'Python version: {sys.version}\nOpenCV version: {cv2.__version__}')"
画像ファイル fruits.jpg, home.jpg のダウンロード [クリックして展開]
次のコマンドを実行する.
cd /d c:%HOMEPATH%
curl -L https://github.com/opencv/opencv/blob/master/samples/data/fruits.jpg?raw=true -o fruits.jpg
curl -L https://github.com/opencv/opencv/blob/master/samples/data/home.jpg?raw=true -o home.jpg
3. 実行のための準備とその確認手順(Windows 前提)
3.1 プログラムファイルの準備
第5章のソースコードをテキストエディタ(メモ帳,Windsurf 等)に貼り付け,adaptive_threshold.py として保存する(文字コード:UTF-8).対話モードで1ブロックずつ実行する場合は,ファイルへの保存は不要である.
3.2 実行コマンド
コマンドプロンプトでファイルの保存先ディレクトリに移動し,以下を実行する.
python adaptive_threshold.py
対話モードで実行する場合は,以下を実行し,第5章のコードを順に入力する.
python
3.3 動作確認チェックリスト
| 確認項目 | 期待される結果 |
|---|---|
| fruits.jpg の読み込み | グレースケール画像のウィンドウ「gray」が表示される |
| Gaussian 適応的2値化(fruits.jpg) | 2値化画像のウィンドウ「adaptive_gaussian」が表示される |
| キー押下によるウィンドウ終了 | 画面の中をクリックしてからキーを押すと,すべてのウィンドウが閉じる |
| home.jpg の読み込みと2値化 | fruits.jpg と同様に「gray」と「adaptive_gaussian」のウィンドウが表示される |
| Mean 適応的2値化と大津の2値化 | 「gray」「adaptive_mean」「otsu」の3つのウィンドウが表示される |
| 適応的2値化と大津の2値化の結果比較 | 適応的2値化は局所的な細部を保持し,大津の2値化は画像全体の単一閾値で2値化した結果となる |
4. 概要・使い方・実行上の注意
本プログラムは,OpenCV の cv2.adaptiveThreshold 関数を使用してグレースケール画像の適応的2値化を行う.適応的2値化では,画像の局所領域(blockSize × blockSize の近傍)ごとに閾値を計算するため,照明が不均一な画像でも細部を保持しやすい.
本プログラムでは以下の3種類の2値化を実行する.
- Gaussian 適応的2値化(ADAPTIVE_THRESH_GAUSSIAN_C):近傍のガウス重み付き平均から閾値を計算する
- Mean 適応的2値化(ADAPTIVE_THRESH_MEAN_C):近傍の平均値から閾値を計算する
- 大津の方法(Otsu's method):画像全体から最適な単一閾値を自動決定する
使用する画像は OpenCV のサンプルデータに含まれる fruits.jpg と home.jpg である.ソースコードは第5章に掲載している.
- Windows では python(Python ランチャーは py)
Python 開発環境(Jupyter Qt Console, Jupyter ノートブック (Jupyter Notebook), Jupyter Lab, Nteract, Spyder, PyCharm, PyScripterなど)も便利である.
Python のまとめ: 別ページ »にまとめ
画像が表示されたら確認する.ウインドウの右上の「x」をクリックしない.画面の中をクリックしてから,何かのキーを押して閉じる
5. ソースコード
画像の表示(Gaussian 適応的2値化:fruits.jpg)
import os, cv2
IMROOT = os.path.expanduser('~') + '/'
bgr = cv2.imread(IMROOT + "fruits.jpg")
mono = cv2.cvtColor(bgr, cv2.COLOR_BGR2GRAY)
cv2.imshow("gray", mono)
dst = cv2.adaptiveThreshold(mono, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 7, 8)
cv2.imshow("adaptive_gaussian", dst)
cv2.waitKey(0)
cv2.destroyAllWindows()
別の画像の表示(Gaussian 適応的2値化:home.jpg)
import os, cv2
IMROOT = os.path.expanduser('~') + '/'
bgr = cv2.imread(IMROOT + "home.jpg")
mono = cv2.cvtColor(bgr, cv2.COLOR_BGR2GRAY)
cv2.imshow("gray", mono)
dst = cv2.adaptiveThreshold(mono, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 7, 8)
cv2.imshow("adaptive_gaussian", dst)
cv2.waitKey(0)
cv2.destroyAllWindows()
Mean 適応的2値化と大津の2値化との比較
適応的2値化には ADAPTIVE_THRESH_GAUSSIAN_C のほか ADAPTIVE_THRESH_MEAN_C がある.ここでは Mean 適応的2値化と大津の方法による2値化を並べて表示し,結果を比較する.
import os, cv2
IMROOT = os.path.expanduser('~') + '/'
bgr = cv2.imread(IMROOT + "fruits.jpg")
mono = cv2.cvtColor(bgr, cv2.COLOR_BGR2GRAY)
cv2.imshow("gray", mono)
dst_mean = cv2.adaptiveThreshold(mono, 255, cv2.ADAPTIVE_THRESH_MEAN_C, cv2.THRESH_BINARY, 7, 8)
cv2.imshow("adaptive_mean", dst_mean)
_, dst_otsu = cv2.threshold(mono, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)
cv2.imshow("otsu", dst_otsu)
cv2.waitKey(0)
cv2.destroyAllWindows()
3つのウィンドウ(グレースケール画像,Mean 適応的2値化,大津の2値化)が表示される.適応的2値化は局所領域ごとに閾値を計算するため,照明が不均一な画像でも細部を保持しやすい.一方,大津の2値化は画像全体から最適な単一閾値を自動決定する手法であり,照明が均一な画像に適している.
6. まとめ
適応的2値化
画像の局所領域(blockSize × blockSize の近傍)ごとに閾値を計算して2値化を行う手法である.照明が不均一な画像でも細部を保持しやすい.
Gaussian 適応的2値化(ADAPTIVE_THRESH_GAUSSIAN_C)
近傍のガウス重み付き平均から閾値を計算する方式である.本記事では fruits.jpg と home.jpg に対して blockSize=7,C=8 で適用した.
Mean 適応的2値化(ADAPTIVE_THRESH_MEAN_C)
近傍の平均値から閾値を計算する方式である.Gaussian 方式と異なり,近傍の全画素を等しい重みで扱う.
大津の方法(Otsu's method)
画像全体から最適な単一閾値を自動決定する手法である.照明が均一な画像に適しているが,局所的な輝度変化には対応しない.
cv2.adaptiveThreshold 関数
OpenCV が提供する適応的2値化の関数である.入力画像,最大値,適応的手法,閾値タイプ,ブロックサイズ,定数 C をパラメータとして受け取る.