2. 画像データベース
(マルチメディアデータベース序論,全6回)
1
金子邦彦
https://www.kkaneko.jp/de/multimediadb/index.html
今日のトピックス
画像データの特徴量の例
色ヒストグラム
テクスチャ
など
画像データ内容検索のための技術の例
画像を(m×n)個の「セル」に分割し,セル単位で内
容情報(色ヒストグラム等)を取り出す
ものの形を近似する
画素値から取り出される
特徴的な情報
2
特徴量
特徴量は,「多次元のベクトル」データ
多次元ベクトル空間
データ1
データ2
データ3
3
特徴量の課題
「内容検索」が出来るだけの十分な情報を含むこ
多次元ベクトルの長さが,十分に長い
特徴量の取り出し方が十分に吟味されている
データの類似性が考慮されていること
似ているデータは,多次元ベクトル空間の「近く」の
ベクトルに写像される
4
画像データベースの内容検索
問い合わせの入力として、画像が与えられる
ユーザは、似ている画像を得たい
システムは、入力画像とデータベース内の画像と
のマッチングを行う
5
画像データベースでの内容検索
ユーザの手元に、1枚の写真があって、「この写真に
写っている人に似ている写真」を、データベースの中
から探す
6
画像の性質 (1/2)
画像には、「もの」が写っている
場所
色、明るさ
色や明るさは、「画素」が持つ性質
しかし、「画素」は、直接扱うのは手間がかかる
「ものが写っている長方形領域(セル)」を単位として扱うと
、扱いやすい
7
画像の性質 (2/2)
領域: XLB=20, XUB=60, YLB=30, YUB=70
色: RED=5, GREEN=3, BLUE=1
20 60
30
70
8
画像の内容情報
(color)
テクスチャ (textute)
shape)
エッジ edge)
9
色情報
明るさの平均 (mean brightness)
色ヒストグラム (color histogram)
色のばらつき具合 (statistical moments)
主に登場する色の種類 (dominant colors)
10
色ヒストグラム
色空間
頻度
数十個程度の
クラスタ
11
色ヒストグラムの類似度
ヒストグラム I
ヒストグラム Q
aij : Ii 番目の色と,
Qj番目の色の類
似度
0 < aij 1
Ii, Qi: 頻度
ΣΣ aij IiQi)(IjQj
i j
N N
12
主に登場する色の種類
ヒストグラムを使って求める
一般に,おおむね数個の色で,画像の大部分を埋
めつくすことができる
「あまり登場しない色」を無視する
13
Tamura feature
Contrast
画素の明るさの分散
Directionality
画素のグラディエントの向き
Coarseness
テクスチャの粗さ.
14
画像のセル分割
画像
セル
15
セルの扱い
画像を (m×n)個のセルに分割
セルは、すべて同じ大きさ
セル分割した画像を image grid という
各セルには、属性付けを行う
2値画像の属性: ({b,w}, bwalgo)
画素は {b,w} の値をとる
プロシージャ bwalgo は、セル番号を入力として、{b,w} の割
合を返すようなプロシージャ
濃淡画像の属性: ([0,1], grayalgo)
16
画像のセル分割での
形と場所の扱い
場所: セル番号(の集まり)
形: セルの集まり方
17
セルの隣接
4隣接 8隣接
セル
18
ものの形 画素の集まり
画素
19
セグメント分割
「画像に写っているもの」を,人手でコンピュー
タに教えるのは,しばしば困難.
画像処理(セグメント分割)を使って, 「画像に
写っているもの」 の「形」の候補を取り出すこと
は可能
20
セグメント分割(1/2)
画像を、互いに素ないくつかの部分に分割
21
セグメント分割(2/2)
0.1
0.2
0.5 0.5
0.0
0.3
0.6 0.6
0.3
0.3
0.5
0.8
0.6
0.6
0.8
0.9
22
セグメントの意味
ある「規則」でセグメントを作る
「平均値からの誤差0.05以内」など
Ri ∩ Rj = 0 i, j は異なる)
I = R1 ・・・ Rk
23
split アルゴリズム
画像全体から始める
R1 = I
それぞれの領域 Ri が「規則」を満たしいるか?
満たしていれば終了
満たしていなければ Ri を分割
全ての領域が、規則を満たすようになるまで続け
24
merge アルゴリズム
split が終了したら、Ri Rj がマージできな
いか、判定する
マージしても規則が満たされるならマージする
25
画像データの単位
画素
セル
セグメント
フレーム(1枚の画像)
これら単位ごとに「特徴量」を取り出し,内容検索を
行う
26
ベクトルデータのオペレーショ
特徴量は,一般に多次元のベクトル
多次元ベクトルのオペレーション
基準値との比較
区間との比較
距離
など
広がりを持ったベクトルデータのオペレーション
基準値との比較
区間との比較
など
27
Cの比較演算子
演算子 意味
左辺が右辺より小さい
<= 左辺が右辺以下
左辺が右辺より大きい
>= 左辺が右辺以上
== 左辺が右辺と等しい
!= 左辺が右辺と等しくない
28
より小さい 等しい より大きい
数値,文字,文字列は比較可能
より小さい 等しい より大きい
×
<= × ×
×
>= × ×
== ×
!= × ×
比較可能な値の演算
29
「多次元の値」について,ある軸に投影して,比較を行う
query point はスカラー値
より小さい 等しい より大きい
ある
1つの属性
query
point
多次元
データ
30
「多次元の値」を,そのまま扱う
query point は多次元
query
point
より大
より小
31
「区間」データの述語
より小さい 等しい より大きい
区間と,ある値との関係
P1 P2
P1<Q P2<Q
P1<Q P2=Q
P1<Q P2>Q
P1=Q P2<Q
ありえない
P1=Q P2=Q
ありえない
P1=Q P2>Q
P1>Q P2<Q
ありえない
P1>Q P2=Q
ありえない
P1>Q P2>Q
Q
P1 < P2
32
「区間」データの述語
P1<Q P2<Q
P1<Q P2=Q
P1<Q P2>Q
P1=Q P2>Q
P1>Q P2>Q
P1 P2
Q
P1 P2
Q
P1 P2
Q
P1 P2
Q
P1 P2
Q
33
「領域」について,ある軸に投影して,比較を行う
query point はスカラー値
より小さい 等しい より大きい
ある
1つの属性
query
point
34
「多次元の値」を,そのまま扱う
query point は多次元
query
point
より大
より小
最小包含矩形
領域内のすべての
点が「より大」の中に
ある
最小包含矩形で
の近似に意味がある
35