画像処理論
第10回
佐藤 洋一
生産技術研究所
情報理工学系研究科電子情報学専攻/情報学環
http://www.hci.iis.u-tokyo.ac.jp/~ysato/
前回講義の内容
画像復元
劣化プロセスと復元プロセス
ノイズ低減のためのフィルタ
劣化関数の推定に基づいた画像復元
劣化プロセスと復元プロセス
劣化関数がlinear & position-invariantとすると
実空間領域 : g ( x, y ) = h( x, y ) * f ( x, y ) + η ( x, y )
周波数領域 : G (u , v) = H (u , v) F (u, v) + N (u , v)
Bandreject filterによる画像復元
Optimal Notch Filtering
1.
2.
−1
ノイズ信号を抽出 η ( x, y ) = ℑ {R(u, v)G (u, v)}
ノイズ成分を除去 fˆ ( x, y ) = g ( x, y ) − w( x, y )η ( x, y )
重みw(x,y)を調整
spikeを抽出
Optimal Notch Filterによるノイズ除去
劣化関数の推定に基づいた画像復元
劣化関数を取り扱うにはどうすればよいか?
実空間領域 : g ( x, y ) = h( x, y ) * f ( x, y ) + η ( x, y )
周波数領域 : G (u, v) = H (u, v) F (u, v) + N (u, v)
劣化関数の推定を伴う画像復元はblind deconvolutionと
呼ばれる
Estimation of H(u,v) by
Experimentation
Mathematical modeling
Estimation by Experimentation
劣化画像を撮影した撮影システムに関して、事前に劣化プロ
セスを観察
インパルス応答を直接計測
G (u , v)
H (u , v) =
A
劣化画像のみを与えられた場合には不可能
Estimation by Mathematical
Modeling
手振れによる劣化の例:
H (u, v) =
x0 (t ) =
bt
at
, y0 (t ) = の場合
T
T
T
sin[π (ua + vb)]exp(− jπ (ua + vb))
π (ua + vb)
劣化関数を用いた画像復元
推定された劣化関数を用いて画像を復元
G (u , v)
N (u , v)
ˆ
F (u , v) =
= F (u , v) +
H (u , v)
H (u , v)
H(u,v)が0に近くなる場合、解が不安定
高周波成分を除外して処理
G (u , v)
Fˆ (u , v) =
H (u , v)
劣化画像
Wiener Filter
元画像と復元画像との最小2乗誤差基準から導出
2
1
(
,
)
u
v
H
ˆ
F (u , v) =
G (u , v)
2
2
2
H (u , v) H (u , v) + N (u , v) / F (u , v)
ノイズ信号と元画像のパワースペクトラムが既知なことは稀
であるため、定数Kで代用することも多い
2
1
H
u
v
(
,
)
ˆ
F (u , v) =
G (u , v)
2
H (u , v) H (u , v) + K
Wiener Filterによる画像復元
Motion blurによる劣化画像の場合
H (u, v) =
劣化画像
inverse filtering
Wiener filtering
T
sin[π (ua + vb)]exp(− jπ (ua + vb))
π (ua + vb)
本日の講義の内容
テクスチャ
テクスチャとは?
テクスチャの表現方法
テクスチャモデル獲得のための線形フィルタ
テクスチャの合成
テクスチャによる形状推定
テクスチャ
テクスチャとは?
画像中に観察される“模様”のパターン
小さな物体が大量に集まったもの
葉→木、草→藪、小石→地面、毛→毛皮、など
単体で“小さな物体が大量に集まったように見える”もの
トラ、シマウマなどの模様、木目や人の肌、など
単体のテクスチャの例
表面形状(面法線方向など)の変動によるもの
表面反射特性の変動によるもの
テクスチャとスケール
テクスチャは観察されるスケールに依存
テクスチャとスケール
A bar in the big images
is a hair on the zebra’s
nose; in smaller images,
a stripe; in the smallest,
the animal’s nose
テクスチャ解析の応用分野
テクスチャ分割(texture segmentation)
テクスチャ合成(texture synthesis)
テクスチャによる領域分割
小さいテクスチャサンプルから大きなテクスチャ領域の合成
テクスチャによる形状推定(shape from texture)
テクスチャを手掛かりにして物体表面の形状を推定
テクスチャの表現
基本的考え方
基本となる要素がある程度規則的に分布
このような要素をテクストン(texton)と呼ぶ
テクスチャ表現のアプローチ
基本要素テクストンを定義
テクストンの分布を求める
テクスチャ表現の問題
テクストンを如何にして決定するかが問題
“普遍的なテクストンセット”? テクスチャのアルファベット?
テクストンが決められないと、その分布も求められない
アプローチ
単純な図形要素(特に、点と棒)をテクストンとして利用
線形フィルタの組(filter banks)により分布を計算可能
線形フィルタを用いたテクストン分布の計算
線形フィルタの利用
基本テクストン(点と棒)をさまざまなスケールで求める
どのような線形フィルタを使うべきか?
さまざまな線形フィルタを経験的に利用
動物の大脳視覚野に模倣したフィルタ
点フィルタ
例) ある大きさの棒に対応する線形フィルタの適用
スケール
棒フィルタ
方向、スケール、フェーズ
フェーズの違い
フィルタ出力の例
入力画像に各フィルタを適用した結果の例
異なるスケールのフィルタ出力の例
スケールの違いにより出力結果も変化
スケール大
スケール小
ガウシアン加重平均フィルタ
ガウシアンフィルタの加重平均により点フィルタと棒フィルタを
構成 [Malik&Perona 90]
点フィルタ:3つの等方性ガウシアンの加重平均
棒フィルタ:3つの非等方性ガウシアンの加重平均
Malik and Perona, “Preattentive texture discrimination with early vision mechanisms”, JOSA, 1990.
Gabor Filters
脳内視覚処理で観察されるフィルタ
x′ 2 + γ 2 y ′ 2
x′
} cos(2π + φ )
g ( x, y ) = exp{−
2
2σ
λ
x′ = x cos θ + y sin θ
y′ = − x sin θ + y cos θ
大阪大学 大学院生命機能研究科 大澤五住教授
幾つのフィルタが必要か?
方向に関して、幾つのフィルタが必要か?
最適な数は不明。アプリケーションに依存
経験的に6方向以上のフィルタがあれば十分
テクストンの複雑さについて
点と棒以外のテクストンに対するフィルタの利用
メリットよりもデメリット(計算コスト増加、冗長な情報)が大きい傾向
フィルタ出力にもとづくテクスチャの表現
フィルタ出力からテクストンの分布を求める
テクストンの分布としてのテクスチャ表現
「フィルタの大きさ」と「近傍領域の大きさ」に依存
あるスケールの縦横2方向の棒の
分布に基づく単純な分類の例
どのような統計量を用いるか?
テクスチャを表現するために、テクストンの分布をどう記述?
テクストンの選択と同様に、アプリケーションに依存
例)近傍領域における各フィルタの出力の平均と分散
I ( x, y ) ∗ ( F1 , , Fn ) → f1 ( x, y ), , f n ( x, y )
( µ 0 , µ1 , , µ n ) ( µ 0 , σ 0 , , µ n , σ n )
テクスチャ表現のための特徴ベクトル
異なるフィルタ出力間の相関の考慮も有効
など
統計量によるテクスチャ表現の例
学習データからテクスチャのモデル(各フィルタの平均と分
散)を獲得
f tex = ( µ 0 , σ 0 , , µ n , σ n )
同様の特徴をもつ画像を検索
近傍領域の大きさ
どの大きさの近傍領域を考慮すればよいか?
分布の変化量
小さな領域から徐々に領域を拡大
テクストン分布の変化が小さくなるところを探す
Polarityにもとづく判断
領域内における主勾配方向と各勾配ベクトルの内積
正の内積値と負の内積値の加重平均の差に変化が
なくまるまでスケールを拡大
画像ピラミッドによるテクストン解析
スケールを変えながら線形フィルタを適用した結果の組
ガウシアンピラミッド
ガウシアンフィルタによる平滑化+サブサンプリング
ガウシアンピラミッドの例
ラプラシアンピラミッド
ガウシアンピラミッドのレベル間の差による表現
最上位のガウシアン画像(最も解像度の低い画像)
各レベル間のガウシアン画像の差(ラプラシアン画像)
Laplacian Pyramidの例
各レベルで強い出力が得られている周波数が異なる
Laplacian Pyramidの生成
PLaplacian ( I ) m = PGaussian ( I ) m
最も高いレベル(解像度の低い)の画像
PLaplacian ( I ) k = PGaussian ( I ) k − S ↑ ( PGaussian ( I ) k +1 )
= ( I d − S ↑ S ↓ Gσ ) PGaussian ( I ) k
S ↑ : アップサンプリング操作
S ↓ : ダウンサンプリング操作
Gσ : ガウシアン平滑オペレータ
バンドパスフィルタとしての振る舞い
Gaussian Pyramidにおける各画像はあるレベルの平滑化
の結果→ローパスフィルタ
Laplacian Pyramidの各画像は2つのローパスフィルタの
出力画像の差分→バンドパスフィルタ
ラプラシアンピラミッドからの画像の再構成
低解像度画像をアップサンプリングした画像+残差成分(ラ
プラシアン画像)として再構成
新たに再構成された
1レベル解像度の高い画像
Laplacian Pyramidで保存された画像
Oriented Pyramid
バンドパス特性に方向選択性を加えたもの
Laplacian Pyramidの各出力を方向成分で分解
Oriented Pyramidの例
テクスチャの合成
サンプルテクスチャ画像から大きい画像を合成
CGにおけるテクスチャマッピングなどへの利用
如何にしてテクスチャを合成するか?
テクスチャ画像の貼りあわせ?→ ×タイルのような結果
テクスチャ合成のアプローチ
基本的な考え方
サンプル画像からテクスチャに関するモデル(e.g., テクスチャに関す
る統計量、テクストンの分布など)を獲得し、そのモデルにもとづきテ
クスチャ画像を合成する
仮定
テクスチャのモデルは画像中の位置に依存しない
テクスチャのモデルはその近傍によってのみ決定される
モデルに応じて色々な手法が提案されている
Efros-Leungの方法
基本的な考え方
新たに求めたい画素の周辺領域が類似した領域群をサンプル画像
中で求め、その領域群からランダムに選んだ領域の中心の画素値を
用いる
合成画像における周辺領域で画素値がないものは除外
近似領域の検索
中心画素値の選択
合成画像
サンプル画像
Non-parametric Texture
Synthesis
合成されたテクスチャの例
サンプル画像
合成画像
周辺領域の大きさの影響
どの範囲の近傍まで考慮するかによりテクスチャ合成の振る
舞いが変わる
応用例(Video Texture)
http://www.cc.gatech.edu/cpl/projects/videotexture/SIGGRAPH2000/ind
ex.htm
テクスチャによる形状推定
テクスチャは物体表面形状を反映している
テクスチャを手掛かりとした形状(法線方向)推定
→Shape from Texture
Shape from Textureの一例
等方性のテクスチャを仮定し、再投影画像のテクスチャ分布
が等方性となるような角度を探す
1.
tiltとslant角を仮定し、画像を再投影
2.
方向フィルタ出力のばらつきを評価関数とする最適化
Slant
Shape from Textureの例
本日の講義内容のまとめ
テクスチャ
テクスチャとは?
テクスチャの表現方法
テクスチャモデル獲得のための線形フィルタ
テクスチャの合成
テクスチャによる形状推定
参考資料
Chapter 9, Computer Vision: A Modern Approach, D. A.
Forsyth and J. Ponce, Prentice Hall
© Copyright 2025