スライド 1: 2. 画像データベース
スライド 2: 今日のトピックス
スライド 3: 特徴量
スライド 4: 特徴量の課題
スライド 5: 画像データベースの内容検索
スライド 6:
スライド 7: 画像の性質 (1/2)
スライド 8: 画像の性質 (2/2)
スライド 9: 画像の内容情報
スライド 10: 色情報
スライド 11: 色ヒストグラム
スライド 12: 色ヒストグラムの類似度
スライド 13: 主に登場する色の種類
スライド 14: Tamura feature
スライド 15: 画像のセル分割
スライド 16: セルの扱い
スライド 17: 画像のセル分割での 形と場所の扱い
スライド 18: セルの隣接
スライド 19: 形
スライド 20: セグメント分割
スライド 21: セグメント分割(1/2)
スライド 22: セグメント分割(2/2)
スライド 23: セグメントの意味
スライド 24: split アルゴリズム
スライド 25: merge アルゴリズム
スライド 26:
スライド 27: ベクトルデータのオペレーション
スライド 28: Cの比較演算子
スライド 29: 比較可能な値の演算
スライド 30
スライド 31
スライド 32: 「区間」データの述語
スライド 33: 「区間」データの述語
スライド 34
スライド 35
2.
画像データベース
(マルチメディアデータベース序論,全6回)
1
金子邦彦
https://www
.kkaneko.jp/de/multimediadb/index
.html
今日のトピックス
•
画像データの特徴量の例
•
色ヒストグラム
•
テクスチャ
•
など
•
画像データ内容検索のための技術の例
•
画像を(m×n)個の「セル」に分割し,セル単位で内
容情報(色ヒストグラム等)を取り出す
•
ものの形を近似する
画素値から取り出される
特徴的な情報
2
特徴量
•
特徴量は,「多次元のベクトル」データ
多次元ベクトル空間
データ1
データ2
データ3
3
特徴量の課題
•
「内容検索」が出来るだけの十分な情報を含むこ
と
•
多次元ベクトルの長さが,十分に長い
•
特徴量の取り出し方が十分に吟味されている
•
データの類似性が考慮されていること
•
似ているデータは,多次元ベクトル空間の「近く」の
ベクトルに写像される
4
画像データベースの内容検索
•
問い合わせの入力として、画像が与えられる
•
ユーザは、似ている画像を得たい
•
システムは、入力画像とデータベース内の画像と
のマッチングを行う
5
•
画像データベースでの内容検索
•
ユーザの手元に、1枚の写真があって、「この写真に
写っている人に似ている写真」を、データベースの中
から探す
6
画像の性質
(1/2)
•
画像には、「もの」が写っている
•
形
•
場所
•
色、明るさ
•
色や明るさは、「画素」が持つ性質
•
しかし、「画素」は、直接扱うのは手
間がかかる
•
「ものが写っている長方形領域(セル
)」を単位と
して扱うと
、扱いやすい
7
画像の性質
(2/2)
•
領域:
XLB=20,
XUB=60, YLB=30,
YUB=70
•
色:
RED=5, GREEN=3, BLUE=1
20
60
30
70
8
画像の内容情報
•
色
(color)
•
テクスチャ
(textute)
•
形
(
shape)
•
エッジ
(
edge)
9
色情報
•
明るさの平均
(mean brightn
ess)
•
色ヒストグラム
(color hi
stogram)
•
色のばらつき具合
(statistical moments)
•
主に登場する色の種類
(dominan
t colors
)
10
色ヒストグラム
色空間
頻度
数十個程度の
クラスタ
11
色ヒストグラムの類似度
ヒストグラム
I
ヒストグラム
Q
a
ij :
I
の
i
番目の色と,
Q
の
j
番目の色の類
似度
0 <
a
ij
<
1
Ii, Qi:
頻度
ΣΣ
a
ij
(
Ii
-
Qi
)(
Ij
-
Qj
)
i
j
N
N
12
主に登場する色の種類
•
ヒストグラムを使って求める
•
一般に,おおむね数個の色で,画像の大部分を埋
めつくすことができる
•
「あまり登場しない色」を無視する
13
T
amura
feat
ure
•
Contrast
•
画素の明るさの分散
•
Directionality
•
画素のグラディエントの向き
•
Coarseness
•
テクスチャの粗さ.
14
画像のセル分割
画像
セル
15
セルの扱い
•
画像を
(m
×n)個のセルに分割
•
セルは、すべて同じ大きさ
•
セル分割した画像を
image grid
という
•
各セルには、属性付けを行う
•
2
値画像の属性:
({b,w}, bwalgo)
•
画素は
{b,w}
の値をとる
•
プロシージャ
bwalgo
は、セル番号を入力として、
{
b,w}
の割
合を返すようなプロシージャ
•
濃淡画像の属性:
([0,1]
,
grayalgo)
16
画像のセル分割での
形と場所の扱い
•
場所:
セル番号(の集まり)
•
形:
セルの集まり方
17
セルの隣接
•
4隣接
8隣接
セル
18
形
•
ものの形
⇒
画素の集まり
画素
19
セグメント分割
•
「画像に写っているもの」を,人手でコンピュー
タに教えるのは,しばしば困難
.
•
画像処理(セグメント分割)を使って,
「画像に
写っているもの」
の「形」の候補を取り出すこと
は可能
20
セグメント分割(1/2)
•
画像を、互いに素ないくつかの部分に分割
21
セグメント分割(2/2)
0.1
0.2
5
0.5
0.5
0.0
5
0.3
0
0.6
0.6
0.3
5
0.3
0
0.5
5
0.8
0.6
0.6
3
0.8
5
0.9
0
22
セグメントの意味
•
ある「規則」でセグメントを作る
「平均値からの誤差0.05以内」など
•
Ri ∩
Rj
= 0
(
i, j
は異なる)
•
I = R1
∪
・・・
∪
Rk
23
split
アルゴリズム
•
画像全体から始める
R1 = I
•
それぞれの領域
Ri
が「規則」を満たしいるか?
•
満たしていれば終了
•
満たしていなければ
Ri
を分割
•
全ての領域が、規則を満たすようになるまで続け
る
24
merge
アルゴリズム
•
split
が終了したら、
Ri
と
Rj
がマージできな
いか、判定する
•
マージしても規則が満たされるならマージする
25
•
画像データの単位
•
画素
•
セル
•
セグメント
•
フレーム(1枚の画像)
•
これら単位ごとに「特徴量」を取り出し,内容検索を
行う
26
ベクトルデータのオペレーショ
ン
•
特徴量は,一般に多次元のベクトル
•
多次元ベクトルのオペレーション
•
基準値との比較
•
区間との比較
•
距離
•
など
•
広がりを持ったベクトルデータのオペレーション
•
基準値との比較
•
区間との比較
•
など
27
C
の比較演算子
•
演算子
意味
<
左辺が右辺より小さい
<=
左辺が右辺以下
>
左辺が右辺より大きい
>=
左辺が右辺以上
==
左辺が右辺と等しい
!=
左辺が右辺と等しくない
28
より小さい
等しい
より大きい
数値,文字,文字列は比較可能
より小さい
等しい
より大きい
<
×
<=
×
×
>
×
>=
×
×
==
×
!=
×
×
比較可能な値の演算
29
•
「多次元の値」について,ある軸に投影して,比較を行う
•
query point
はスカラー値
より小さい
等しい
より大きい
ある
1つの属性
query
point
多次元
データ
30
•
「多次元の値」を,そのまま扱う
•
query point
は多次元
query
point
より大
より小
31
「区間」データの述語
より小さい
等しい
より大きい
区間と,ある値との関係
P1
P2
P1<Q
P2<Q
P1<Q
P2=Q
P1<Q
P2>Q
P1=Q
P2<Q
ありえない
P1=Q
P2=Q
ありえない
P1=Q
P2>Q
P1>Q
P2<Q
ありえない
P1>Q
P2=Q
ありえない
P1>Q
P2>Q
Q
P1 < P2
32
「区間」データの述語
P1<Q
P2<Q
P1<Q
P2=Q
P1<Q
P2>Q
P1=Q
P2>Q
P1>Q
P2>Q
P1
P2
Q
P1
P2
Q
P1
P2
Q
P1
P2
Q
P1
P2
Q
33
•
「領域」について,ある軸に投影して,比較を行う
•
query point
はスカラー値
より小さい
等しい
より大きい
ある
1つの属性
query
point
34
•
「多次元の値」を,そのまま扱う
•
query point
は多次元
query
point
より大
より小
最小包含矩形
領域内のすべての
点が「より大」の中に
ある
→
最小包含矩形で
の近似に意味がある
35