画像処理論 第10回 佐藤 洋一 生産技術研究所 情報理工学系研究科電子情報学専攻/情報学環 http://www.hci.iis.u-tokyo.ac.jp/~ysato/ 前回講義の内容 画像復元 劣化プロセスと復元プロセス ノイズ低減のためのフィルタ 劣化関数の推定に基づいた画像復元 劣化プロセスと復元プロセス 劣化関数がlinear & position-invariantとすると 実空間領域 : g ( x, y ) = h( x, y ) * f ( x, y ) + η ( x, y ) 周波数領域 : G (u , v) = H (u , v) F (u, v) + N (u , v) Bandreject filterによる画像復元 Optimal Notch Filtering 1. 2. −1 ノイズ信号を抽出 η ( x, y ) = ℑ {R(u, v)G (u, v)} ノイズ成分を除去 fˆ ( x, y ) = g ( x, y ) − w( x, y )η ( x, y ) 重みw(x,y)を調整 spikeを抽出 Optimal Notch Filterによるノイズ除去 劣化関数の推定に基づいた画像復元 劣化関数を取り扱うにはどうすればよいか? 実空間領域 : g ( x, y ) = h( x, y ) * f ( x, y ) + η ( x, y ) 周波数領域 : G (u, v) = H (u, v) F (u, v) + N (u, v) 劣化関数の推定を伴う画像復元はblind deconvolutionと 呼ばれる Estimation of H(u,v) by Experimentation Mathematical modeling Estimation by Experimentation 劣化画像を撮影した撮影システムに関して、事前に劣化プロ セスを観察 インパルス応答を直接計測 G (u , v) H (u , v) = A 劣化画像のみを与えられた場合には不可能 Estimation by Mathematical Modeling 手振れによる劣化の例: H (u, v) = x0 (t ) = bt at , y0 (t ) = の場合 T T T sin[π (ua + vb)]exp(− jπ (ua + vb)) π (ua + vb) 劣化関数を用いた画像復元 推定された劣化関数を用いて画像を復元 G (u , v) N (u , v) ˆ F (u , v) = = F (u , v) + H (u , v) H (u , v) H(u,v)が0に近くなる場合、解が不安定 高周波成分を除外して処理 G (u , v) Fˆ (u , v) = H (u , v) 劣化画像 Wiener Filter 元画像と復元画像との最小2乗誤差基準から導出 2 1 ( , ) u v H ˆ F (u , v) = G (u , v) 2 2 2 H (u , v) H (u , v) + N (u , v) / F (u , v) ノイズ信号と元画像のパワースペクトラムが既知なことは稀 であるため、定数Kで代用することも多い 2 1 H u v ( , ) ˆ F (u , v) = G (u , v) 2 H (u , v) H (u , v) + K Wiener Filterによる画像復元 Motion blurによる劣化画像の場合 H (u, v) = 劣化画像 inverse filtering Wiener filtering T sin[π (ua + vb)]exp(− jπ (ua + vb)) π (ua + vb) 本日の講義の内容 テクスチャ テクスチャとは? テクスチャの表現方法 テクスチャモデル獲得のための線形フィルタ テクスチャの合成 テクスチャによる形状推定 テクスチャ テクスチャとは? 画像中に観察される“模様”のパターン 小さな物体が大量に集まったもの 葉→木、草→藪、小石→地面、毛→毛皮、など 単体で“小さな物体が大量に集まったように見える”もの トラ、シマウマなどの模様、木目や人の肌、など 単体のテクスチャの例 表面形状(面法線方向など)の変動によるもの 表面反射特性の変動によるもの テクスチャとスケール テクスチャは観察されるスケールに依存 テクスチャとスケール A bar in the big images is a hair on the zebra’s nose; in smaller images, a stripe; in the smallest, the animal’s nose テクスチャ解析の応用分野 テクスチャ分割(texture segmentation) テクスチャ合成(texture synthesis) テクスチャによる領域分割 小さいテクスチャサンプルから大きなテクスチャ領域の合成 テクスチャによる形状推定(shape from texture) テクスチャを手掛かりにして物体表面の形状を推定 テクスチャの表現 基本的考え方 基本となる要素がある程度規則的に分布 このような要素をテクストン(texton)と呼ぶ テクスチャ表現のアプローチ 基本要素テクストンを定義 テクストンの分布を求める テクスチャ表現の問題 テクストンを如何にして決定するかが問題 “普遍的なテクストンセット”? テクスチャのアルファベット? テクストンが決められないと、その分布も求められない アプローチ 単純な図形要素(特に、点と棒)をテクストンとして利用 線形フィルタの組(filter banks)により分布を計算可能 線形フィルタを用いたテクストン分布の計算 線形フィルタの利用 基本テクストン(点と棒)をさまざまなスケールで求める どのような線形フィルタを使うべきか? さまざまな線形フィルタを経験的に利用 動物の大脳視覚野に模倣したフィルタ 点フィルタ 例) ある大きさの棒に対応する線形フィルタの適用 スケール 棒フィルタ 方向、スケール、フェーズ フェーズの違い フィルタ出力の例 入力画像に各フィルタを適用した結果の例 異なるスケールのフィルタ出力の例 スケールの違いにより出力結果も変化 スケール大 スケール小 ガウシアン加重平均フィルタ ガウシアンフィルタの加重平均により点フィルタと棒フィルタを 構成 [Malik&Perona 90] 点フィルタ:3つの等方性ガウシアンの加重平均 棒フィルタ:3つの非等方性ガウシアンの加重平均 Malik and Perona, “Preattentive texture discrimination with early vision mechanisms”, JOSA, 1990. Gabor Filters 脳内視覚処理で観察されるフィルタ x′ 2 + γ 2 y ′ 2 x′ } cos(2π + φ ) g ( x, y ) = exp{− 2 2σ λ x′ = x cos θ + y sin θ y′ = − x sin θ + y cos θ 大阪大学 大学院生命機能研究科 大澤五住教授 幾つのフィルタが必要か? 方向に関して、幾つのフィルタが必要か? 最適な数は不明。アプリケーションに依存 経験的に6方向以上のフィルタがあれば十分 テクストンの複雑さについて 点と棒以外のテクストンに対するフィルタの利用 メリットよりもデメリット(計算コスト増加、冗長な情報)が大きい傾向 フィルタ出力にもとづくテクスチャの表現 フィルタ出力からテクストンの分布を求める テクストンの分布としてのテクスチャ表現 「フィルタの大きさ」と「近傍領域の大きさ」に依存 あるスケールの縦横2方向の棒の 分布に基づく単純な分類の例 どのような統計量を用いるか? テクスチャを表現するために、テクストンの分布をどう記述? テクストンの選択と同様に、アプリケーションに依存 例)近傍領域における各フィルタの出力の平均と分散 I ( x, y ) ∗ ( F1 , , Fn ) → f1 ( x, y ), , f n ( x, y ) ( µ 0 , µ1 , , µ n ) ( µ 0 , σ 0 , , µ n , σ n ) テクスチャ表現のための特徴ベクトル 異なるフィルタ出力間の相関の考慮も有効 など 統計量によるテクスチャ表現の例 学習データからテクスチャのモデル(各フィルタの平均と分 散)を獲得 f tex = ( µ 0 , σ 0 , , µ n , σ n ) 同様の特徴をもつ画像を検索 近傍領域の大きさ どの大きさの近傍領域を考慮すればよいか? 分布の変化量 小さな領域から徐々に領域を拡大 テクストン分布の変化が小さくなるところを探す Polarityにもとづく判断 領域内における主勾配方向と各勾配ベクトルの内積 正の内積値と負の内積値の加重平均の差に変化が なくまるまでスケールを拡大 画像ピラミッドによるテクストン解析 スケールを変えながら線形フィルタを適用した結果の組 ガウシアンピラミッド ガウシアンフィルタによる平滑化+サブサンプリング ガウシアンピラミッドの例 ラプラシアンピラミッド ガウシアンピラミッドのレベル間の差による表現 最上位のガウシアン画像(最も解像度の低い画像) 各レベル間のガウシアン画像の差(ラプラシアン画像) Laplacian Pyramidの例 各レベルで強い出力が得られている周波数が異なる Laplacian Pyramidの生成 PLaplacian ( I ) m = PGaussian ( I ) m 最も高いレベル(解像度の低い)の画像 PLaplacian ( I ) k = PGaussian ( I ) k − S ↑ ( PGaussian ( I ) k +1 ) = ( I d − S ↑ S ↓ Gσ ) PGaussian ( I ) k S ↑ : アップサンプリング操作 S ↓ : ダウンサンプリング操作 Gσ : ガウシアン平滑オペレータ バンドパスフィルタとしての振る舞い Gaussian Pyramidにおける各画像はあるレベルの平滑化 の結果→ローパスフィルタ Laplacian Pyramidの各画像は2つのローパスフィルタの 出力画像の差分→バンドパスフィルタ ラプラシアンピラミッドからの画像の再構成 低解像度画像をアップサンプリングした画像+残差成分(ラ プラシアン画像)として再構成 新たに再構成された 1レベル解像度の高い画像 Laplacian Pyramidで保存された画像 Oriented Pyramid バンドパス特性に方向選択性を加えたもの Laplacian Pyramidの各出力を方向成分で分解 Oriented Pyramidの例 テクスチャの合成 サンプルテクスチャ画像から大きい画像を合成 CGにおけるテクスチャマッピングなどへの利用 如何にしてテクスチャを合成するか? テクスチャ画像の貼りあわせ?→ ×タイルのような結果 テクスチャ合成のアプローチ 基本的な考え方 サンプル画像からテクスチャに関するモデル(e.g., テクスチャに関す る統計量、テクストンの分布など)を獲得し、そのモデルにもとづきテ クスチャ画像を合成する 仮定 テクスチャのモデルは画像中の位置に依存しない テクスチャのモデルはその近傍によってのみ決定される モデルに応じて色々な手法が提案されている Efros-Leungの方法 基本的な考え方 新たに求めたい画素の周辺領域が類似した領域群をサンプル画像 中で求め、その領域群からランダムに選んだ領域の中心の画素値を 用いる 合成画像における周辺領域で画素値がないものは除外 近似領域の検索 中心画素値の選択 合成画像 サンプル画像 Non-parametric Texture Synthesis 合成されたテクスチャの例 サンプル画像 合成画像 周辺領域の大きさの影響 どの範囲の近傍まで考慮するかによりテクスチャ合成の振る 舞いが変わる 応用例(Video Texture) http://www.cc.gatech.edu/cpl/projects/videotexture/SIGGRAPH2000/ind ex.htm テクスチャによる形状推定 テクスチャは物体表面形状を反映している テクスチャを手掛かりとした形状(法線方向)推定 →Shape from Texture Shape from Textureの一例 等方性のテクスチャを仮定し、再投影画像のテクスチャ分布 が等方性となるような角度を探す 1. tiltとslant角を仮定し、画像を再投影 2. 方向フィルタ出力のばらつきを評価関数とする最適化 Slant Shape from Textureの例 本日の講義内容のまとめ テクスチャ テクスチャとは? テクスチャの表現方法 テクスチャモデル獲得のための線形フィルタ テクスチャの合成 テクスチャによる形状推定 参考資料 Chapter 9, Computer Vision: A Modern Approach, D. A. Forsyth and J. Ponce, Prentice Hall
© Copyright 2024