SlideShare a Scribd company logo
1 of 83
Download to read offline
Guided Filterとその周辺

    名古屋工業大学
     福嶋慶繁



         2012/7/21 第18回 名古屋CV・PRML勉強会
紹介論文
• J. Lu, K. Shi, D. Min, L. Lin, and M. N. Do,
  “Cross-Based Local Multipoint Filtering,”
  CVPR2012.
• 内容:
  高速なエッジキープ型のフィルタの
                    拡張とアプリケーション例

  – 注)細かいところはカットしています
  –   なかなか本題にはいりません.
関連論文
•   Bilateral Filterの論文
     –   C. Tomasi and R. Manduchi, “Bilateral Filtering for Gray and Color Images,” ICCV’98.
•   Joint/Cross Bilarater Filterによるデノイズ
     –   G. Petschnigg, M. Agrawala, H. Hoppe, R. Szeliski, M. Cohen, K. Toyama, “Digital Photography with
         Fash and No-flash Image Pairs,” SIGGRAPH’04.
     –   E. Eisemann and F. Durand, “Flash Photography Enhancement via Intrinsic Relighting,” SIGGRAPH’04.
•   Joint Bilateral Filterを~mapに適用して解像度やノイズ除去
     –   J. Kopf,M. F. Cohen,D. Lischinski and M. Uyttendaele, “Joint bilateral upsampling,” SIGGRAPH’07
•   NLFによるデノイズ
     –   A. Buades, B. Coll, J.M. Morel, “A Non-local Algorithm for Image Denoising,” CVPR’05.
•   Guided Filterの論文
     –   K. He, J. Sun and X. Tang, “Guided Image Filtering,” ECCV’10.
•   Guided Filterをコストボリュームに適用することによる応用の拡張
     –   C. Rhemann, A. Hosni, M. Bleyer, C. Rother, and M. Gelautz, ”Fast Cost-volume Filtering for Visual
         Correspondence and Beyond,” CVPR’11.
•   クロススケルトンによる適用的インテグラルイメージ
     –   K. Zhang, J. Lu, and G. Lafruit, “Cross-Based Local Stereo Matching Using Orthogonal Integral
         Images,” IEEE Trans. CSVT’09.
エッジキープ型のフィルタって
      何?
ぼけないフィルタ
ボケすぎないフィルタ
エッジキープ型のフィルタの例
•   Median Filter
•   (joint/cross) Bilateral Filter
•   Non-local Means Filter
•   BM3D
•   Guided Filter
•   (Cross-Orthogonal integral Image)
エッジキープ型のフィルタの応用
• ノイズ除去
• 輪郭強調
 – 上記組み合わせの画像処理


• HDR
• 超解像
• MRFによる奥行き推定,背景差分,オプティカ
  ルフローの最適化の近似
Bilateral Filter
Joint/Cross Bilateral Filter



image




 IR image/Flash image
Joint/Cross Bilateral Filter



image




 IR image/Flash image
median
• Joint/Cross Filterの本当の効果
  – ノイズ除去...それだけ?


Graph cut ? Belief Propagation ?
           そんな重たいもの使わなくても!?
  – Ex:
    C. Rhemann, A. Hosni, M. Bleyer, C. Rother, and M. Gelautz,
    ”Fast Cost-volume Filtering for Visual Correspondence   and Beyond,”
    CVPR’11.
Joint/cross filterの使い方
• 結果にフィルタ
 – ~ map refinement/enhancement
 – 計算結果のポストフィルタとして利用


• 尤度にフィルタ
 – Cost volume filtering
 – 尤度を量子化してその尤度mapを各量子化ス
   テップでフィルタしてその最小値・最大値を取る
Joint/Cross Filtering for BF Map




            + thresholdingで背景差分のrefinementにもなります.
Joint/Cross Filtering for Depth Map
Joint/Cross Filtering for Haze Map
Cost-Volume Filtering
• Markov Random Field(MRF)などのエネルギー関数は,
  データ項とスムース項が,有る値(ただし量子化ステップ内
  の離散値)を取るときの値を最小化,最大化する(p:画素
  位置,l:ラベルor階調値)
     E(p,l) = Ed(p,l) + λEs(p,l)
• これをスムース項の代わりにフィルタとしてほぼ同じ意味
  になるように表現(w:重み)
     E(p,l) = ΣW(p,q) Ed(p,l)
• つまり,データ項が滑らかに変化するように&参照画像の
  エッジをキープするように平滑化する.
• どちらかというとCRFに近い結果
• もうちょっと抽象的に説明すると,MRF最適化はコストボ
  リュームにIIRフィルタをかけているのに近い.
Cost-Volume Filtering
• マルチラベル問題全般に使用可能
 – ステレオ,背景差分オプティカルフロー,アルファマッティング,顕著
   性マップ,xx map, etc…すべてに使用可能
• ステレオマッチングを例に説明
Cost-Volume Filtering
• マッチングコストの計算
• COST(p,d) = L(p) – R(p-d) :d=0




             d=0                   -
Cost-Volume Filtering
• マッチングコストの計算
• COST(p,d) = L(p) – R(p-d) :d=1




             d=1                   -
Cost-Volume Filtering
• マッチングコストの計算
• COST(p,d) = L(p) – R(p-d) :d=2




             d=2                   -
Cost-Volume Filtering
• マッチングコストの計算
• COST(p,d) = L(p) – R(p-d) :d=3




             d=3                   -
Cost-Volume Filtering
• マッチングコストの計算
• COST(p,d) = L(p) – R(p-d) :d=4




             d=4                   -
Cost-Volume Filtering
• マッチングコストの計算
• COST(p,d) = L(p) – R(p-d) :d=5




             d=5                   -
Cost-Volume Filtering
• マッチングコストの計算
• COST(p,d) = L(p) – R(p-d) :d=6




             d=6                   -
Cost-Volume Filtering
• マッチングコストの計算
• COST(p,d) = L(p) – R(p-d) :d=0




             d=7                   -
Cost-Volume Filtering
     マッチングスコア,尤度マップ




  d=6
  d=5
  d=4   マッチングスコアボリューム
  d=3
  d=2   別名: Disparity Space Volume DSV
  d=1
  d=0
Cost-Volume Filtering
もっともスコアの低いもしくは尤度の高いものをその値として採用




       d=6
       d=5
       d=4       安定度が低い
       d=3
       d=2
       d=1
       d=0   DMAP(p) = argmindCOST(p,d)
Cost-Volume Filtering
argmin: もっちもスコアの低いもしくは尤度の高いものをその値として採用




           d=6
           d=5
           d=4    マッチングスコアにフィルタする
           d=3
           d=2    (Box Filterで→Block Matching)
           d=1
           d=0    安定するが境界がおかしい
Cost-Volume Filtering
argmin: もっちもスコアの低いもしくは尤度の高いものをその値として採用




           d=6
           d=5
           d=4    マッチングスコアにフィルタする
           d=3
           d=2    (Joint Bilateral Filterで)
           d=1    エッジもきれいに!
           d=0
フィルタの欠点
• フィルタって,基本的なものだけど大きなカー
  ネルだと計算は重たい.
• カーネルサイズ分の計算コスト!O(K)
• 特にバイラテラルフィルタは重たいことで有名

• ただし,いろいろ高速化方法はある!
本題の一歩手前
Guided Filter
• エッジ保持型のO(1)フィルタ
• バイラテラルフィルタに似た効果

• FullHDの画像をCore i7を使って30fpsでフィル
  タ可能

• GPUならさらにその十倍!?
Guided Filter詳細
• 入力画像pはガイド画像Iのカーネル内の適当な
  係数の線形変換であると仮定
 –   カーネル内にエッジは一つ
 –   ∇q = a∇I
 –   マッティングや超解像などに使われる
 –   (係数a,bに入力画像pを用いる)

       qi  ak I i  bk , i  k
 ある画像を線形変換(ax+b)すると目的の画像へ変わる
qi  ak I i  bk , i  k の図解

                      ak                         カーネル   k


      qi
                  =   coefficient Image: a
                                             ・          Ii


                      bk

Output Image: q                                   Guidance Image: I




                      coefficient Image: b
qi  ak I i  bk , i  k の図解

                                   ak            カーネル   k


      qi
                  =   coefficient Image: a
                                             ・          Ii


                                  bk

Output Image: q                                   Guidance Image: I




                      coefficient Image: b
qi  ak I i  bk , i  k の図解

                      ak
                                                 カーネル   k


      qi
                  =   coefficient Image: a
                                             ・          Ii



                      bk
Output Image: q                                   Guidance Image: I




                      coefficient Image: b
qi  ak I i  bk , i  k の図解

                                   ak
                                                 カーネル   k


      qi
                  =   coefficient Image: a
                                             ・          Ii



                                  bk
Output Image: q                                   Guidance Image: I




                      coefficient Image: b
qi  ak I i  bk , i  k の図解

                                                 カーネル   k
                      ak


      qi
                  =   coefficient Image: a
                                             ・          Ii




Output Image: q                                   Guidance Image: I


                      bk

                      coefficient Image: b
qi  ak I i  bk , i  k の図解

                                                 カーネル   k
                                   ak


      qi
                  =   coefficient Image: a
                                             ・          Ii




Output Image: q                                   Guidance Image: I


                                  bk

                      coefficient Image: b
カーネル内の全ての係数で,q=aI+bが成り立つように係数を決定




つまり,あるカーネル内での線形最小二乗

   qi   a1 I i  b1   a1        b1   I i     1
   q   a I  b   a              b2   I i     1
    i  2 i 2   2                              
   qi                           Ii     1
                                              
   qi  ak 1 I i  bk   ak 1 bk 1   I i   1
   qi   ak I i  bk   ak
                                bk   I i
                                                  1
                                                     
線形回帰



入力画素値pと出力qを誤差εのもとに線形回帰




                 μ:Iのカーネル内平均
                 σ:Iのカーネル内分散

上の解析解
元の式に戻ると,a,bはもちろんノイズを含み,どのkを選ぶかによって出力が違う


     qi  ak I i  bk , i  k

こういうときはとりあえず平均!
バイラテラルフィルタのように変形



Ex:バイラテラルフィルタの場合




                   赤点中心のカーネル.
                   左:参照画像
                   中:guided kernel
                   右:bilateral kernel

                   白いほど重みが大きい
カーネルの意味


       エッジが1つしかないと仮定しているため左の図解となる.

       画素iをフィルタ位置としたときの参照画素jの重み:
       右辺は,概ね,I,jの画素値が同じなら1をとり,
       逆ならー1を取る.つまり重みは大体0~2.
       εの値が大きいと重みはほぼ1になる.




※この変形した様子から天下り的に理解したほうが分かりやすいかも
このフィルタ実は非常に高速
• フィルタ計算が全てボックスフィルタと1画素
  同士の加減算,乗算で出来ている.
• つまり,全てO(1)計算.
• イメージ:下のような処理を何回かやるだけ
 – 画像1と画像2を掛ける
 – それをボックスフィルタ
 – それを画像1と画像2のボックスフィルタをしたも
   のどうしをかけたものから引く
復習:インテグラルイメージ(1/2)
• フィルタとは?
    カーネルのたたみこみ
  普通,O(k)(kはカーネルサイズ)だけ計算時
  間が必要
復習:インテグラルイメージ(1/2)
• フィルタとは?
    カーネルのたたみこみ
  普通,O(k)(kはカーネルサイズ)だけ計算時
  間が必要
復習:インテグラルイメージ(1/2)
• フィルタとは?
    カーネルのたたみこみ
  普通,O(k)(kはカーネルサイズ)だけ計算時
  間が必要
復習:インテグラルイメージ(1/2)
• フィルタとは?
    カーネルのたたみこみ
  普通,O(k)(kはカーネルサイズ)だけ計算時
  間が必要
        5x5のカーネルの場合1画素ごとに25回の演算が必要

        ただし,ボックスフィルタのカーネルは全て1.
             (バイラテラルフィルタなどは画素ごとに違う)

               1   1   1   1   1
               1   1   1   1   1
               1   1   1   1   1
               1   1   1   1   1
               1   1   1   1   1
復習:インテグラルイメージ(2/2)
1.積分画像を作成
(サイズは(x+1,y+1)で左上を0でパディング
積分画像とは?
左上から注目画素までの矩形の値の
総和を保持した画像
左上から順々に足していくだけ
                     積分値




2.4つの値の加減算で矩形の面積を求める
復習:インテグラルイメージ(2/2)
1.積分画像を作成
(サイズは(x+1,y+1)で左上を0でパディング
積分画像とは?
左上から注目画素までの矩形の値の
総和を保持した画像
左上から順々に足していくだけ
                     積分値




2.4つの値の加減算で矩形の面積を求める
復習:インテグラルイメージ(2/2)
1.積分画像を作成
(サイズは(x+1,y+1)で左上を0でパディング
積分画像とは?
左上から注目画素までの矩形の値の
総和を保持した画像
左上から順々に足していくだけ
                     積分値




2.4つの値の加減算で矩形の面積を求める
復習:インテグラルイメージ(2/2)
1.積分画像を作成
(サイズは(x+1,y+1)で左上を0でパディング
積分画像とは?
左上から注目画素までの矩形の値の
総和を保持した画像
左上から順々に足していくだけ
                     積分値




2.4つの値の加減算で矩形の面積を求める
復習:インテグラルイメージ(2/2)
1.積分画像を作成
(サイズは(x+1,y+1)で左上を0でパディング
積分画像とは?
左上から注目画素までの矩形の値の
総和を保持した画像
左上から順々に足していくだけ
                     積分値




2.4つの値の加減算で矩形の面積を求める
復習:インテグラルイメージ(2/2)
1.積分画像を作成
(サイズは(x+1,y+1)で左上を0でパディング
積分画像とは?
左上から注目画素までの矩形の値の
総和を保持した画像
左上から順々に足していくだけ
                     積分値




2.4つの値の加減算で矩形の面積を求める
復習:インテグラルイメージ(2/2)
1.積分画像を作成
(サイズは(x+1,y+1)で左上を0でパディング
積分画像とは?
左上から注目画素までの矩形の値の
総和を保持した画像
左上から順々に足していくだけ
                     積分値




2.4つの値の加減算で矩形の面積を求める
やっと本題
Guided Filterの制限
• フラットな平滑化が出来ない(L0のような)
 – つまりエッジと勾配を維持するフィルタ


• 勾配はほとんどないと仮定できるときはエッジの
  み維持したフィルタにしたい
 – BFやNLFはエッジ保持のみのフィルタで勾配は保持さ
   れない


• ハイコントラストエッジ周辺は実はうまくいかない
ハイコントラストエッジ周辺の問題
今回の論文の拡張部分!
• とりあえず平均が気に食わない!全領域で線形回帰
  はあり得ない!
  – 係数a,bはオブジェクトの属する領域によって大きく変化す
    るはず!

• Cross-Based Local Multipoint Filtering(CLMF)
                                       と名付けよう

• 同一領域以外は平均に使わないようにしたい
• でも同一領域を決めるために,セグメンテーションした
  ら,このフィルタの高速性が生きない...
カーネル内の全ての係数で,q=aI+bが成り立つように係数を決定
    条件を満たす場所だけで
あるカーネル内での重み付き線形最小二乗
重みwik(画素位置iの時のカーネル位置kの時の重み)
※厳密に調べていないが,ほぼWLSと同じ式?
A. Levin, D. Lischinski, Y. Weiss, “Colorization using optimization,” SIGGRAPH’04.
Z. Farbman, R. Fattal, D. Lischinski, R. Szeliski, “Edge-preserving decompositions for multi-scale tone
                                                            and detail manipulation,” SIGGRAPH’08.



    qi   a1 I i  b1   wi1                          wi1   a1      b1   I i                1
    q   a I  b   i                                   i  
                                                                   a2    b2   I i                1
     i  2 i 2   w 2                                w2                                      
    qi                                                           Ii                1
                           i                                                               
    qi  ak 1 I i  bk    w k 1
                                                         i
                                                        w k 1  ak 1 bk 1   I i              1
    qi   ak I i  bk   wi k
                                                   wi k   a k
                                                                       bk   I i
                                                                                                 1
                                                                                                    
• 1画素ごとに重み付き最小二乗を解いていた
  らとてもじゃないけど計算が複雑.

• 重みを0/1にしたら簡単な解法が!
カーネル内の全ての係数で,q=aI+bが成り立つように係数を決定
    条件を満たす場所だけで

あるカーネル内での重み付き線形最小二乗
※重みwik(画素位置iの時のカーネル位置kの時の重み)
          は,0 or 1のhard thresholding

 qi   a1 I i  b1   wi1           wi1   a1      b1   I i     1
 q   a I  b   i                    i  
                                                 a2    b2   I i     1
  i  2 i 2   w 2                 w2                           
 qi                                            Ii     1
                        i                                     
 qi  ak 1 I i  bk    w k 1
                                       i
                                      w k 1  ak 1 bk 1   I i   1
 qi   ak I i  bk   wi k
                                 wi k   a k
                                                     bk   I i
                                                                    1
                                                                       
Cross based local filter (CLF)
• 形が適応的なジョイントボックスフィルタ
  Integral Imageを使用
                      普通のボックスフィルタ
                      重みが一定の矩形フィルタ

                      Integral image によりO(1)で計算可能



           p
Cross based local filter (CLF)
• 形が適応的なジョイントボックスフィルタ
 – Cross Based Orthogonal Integral Imageを使用
                               OIIを使った適応的ボックスフィルタ
                               重みが0or1と適応的に変化するフィルタ

                               通常ならフィルタ半径内の係数を
                               計算しなければならないが...
Cross based local filter (CLF)
• 形が適応的なジョイントボックスフィルタ
 – Cross Based Orthogonal Integral Imageを使用
                               下記手順でO(1)化

                               フィルタターゲットのエッジなどの情報を
                               用いてクロス(十字)を作成

                               まず,水平にインテグラルイメージ作成
                               各画素のクロスの水平成分に沿った
                               積分値を計算.

                               最後に縦方向に同様の処理

                               セパレータブルフィルタと同じような原理
クロスの計算方法
• argmax r
• for r = 0:max r V(p) < V(p-r)
クロスとカーネルの例




(a) クロス
(b) 積分領域拡大図
(c) さまざまな積分区間の例
GF→CLMFへの式変形
• Σの係数の平均・分散の計算(つまりボックスフィ
  ルタ)を全部COIIに変換するだけの簡単なお仕
  事.
• 最後の係数a,bについては有効な画素の多さに
  応じて重み付き平均
 – Weighted averageもO(1)で計算可能
 – ex) 重み画像W,入力画像Iとしてその重み付き平均
 – W-Average(W,I) = 1/ΣW * ΣI*W
• 計算コストはO(1)のまま
GF→CLMFへの式変形
• ついでにGuided Filterをより一般化
 – aX+bで変換する1次変換
 – X+bで変換する0次変換
                      に拡張
フィルタの効果まとめ



バイラテラル:     点ベースでエッジのみを保持.
                速度は遅い.かなり遅い.
CLF:            点ベースでエッジのみを保持.
                速度は最高速.ただし,クロスの計算がO(W+H)
CLMF-0(提案): 多点ベースでエッジのみを保持.
                速度は最高速(2番目)
GF(従来):     多点ベースでエッジと勾配を保持.
                速度はそこそこ高速(3番目)core i7FulHD→30fps
CLMF-1(提案): 多点ベースでエッジと勾配みを保持.
                速度はそこそこ高速(4番目)おそらくGFの2倍以内
結果
•   平滑化結果
•   ノイズリダクション
•   ステレオ
•   Flash-no-flashイメージ
エッジ保持平滑化結果
ノイズリダクション
Depth estimation over CVF
Depth upsampling(x8) &
 Depth noise reduntion
Flash/No-Flash
まとめ
• エッジ保持型のフィルタBilateral FilterのJoint
  bilateral filterへの拡張とその応用例の解説

• 高速なエッジ保持フィルタGuided Filter(GF)
  の解説

• GFの拡張CLMFの解説(ここが主題)

More Related Content

What's hot

Tensorflow Liteの量子化アーキテクチャ
Tensorflow Liteの量子化アーキテクチャTensorflow Liteの量子化アーキテクチャ
Tensorflow Liteの量子化アーキテクチャHitoshiSHINABE1
 
CVPR2018 pix2pixHD論文紹介 (CV勉強会@関東)
CVPR2018 pix2pixHD論文紹介 (CV勉強会@関東)CVPR2018 pix2pixHD論文紹介 (CV勉強会@関東)
CVPR2018 pix2pixHD論文紹介 (CV勉強会@関東)Tenki Lee
 
【DL輪読会】StyleCLIP: Text-Driven Manipulation of StyleGAN Imagery
【DL輪読会】StyleCLIP: Text-Driven Manipulation of StyleGAN Imagery【DL輪読会】StyleCLIP: Text-Driven Manipulation of StyleGAN Imagery
【DL輪読会】StyleCLIP: Text-Driven Manipulation of StyleGAN ImageryDeep Learning JP
 
【DL輪読会】"Instant Neural Graphics Primitives with a Multiresolution Hash Encoding"
【DL輪読会】"Instant Neural Graphics Primitives with a Multiresolution Hash Encoding"【DL輪読会】"Instant Neural Graphics Primitives with a Multiresolution Hash Encoding"
【DL輪読会】"Instant Neural Graphics Primitives with a Multiresolution Hash Encoding"Deep Learning JP
 
[DL輪読会]Learning Transferable Visual Models From Natural Language Supervision
[DL輪読会]Learning Transferable Visual Models From Natural Language Supervision[DL輪読会]Learning Transferable Visual Models From Natural Language Supervision
[DL輪読会]Learning Transferable Visual Models From Natural Language SupervisionDeep Learning JP
 
backbone としての timm 入門
backbone としての timm 入門backbone としての timm 入門
backbone としての timm 入門Takuji Tahara
 
BRDFモデルの変遷
BRDFモデルの変遷BRDFモデルの変遷
BRDFモデルの変遷Teppei Kurita
 
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料Yusuke Uchida
 
Automatic Mixed Precision の紹介
Automatic Mixed Precision の紹介Automatic Mixed Precision の紹介
Automatic Mixed Precision の紹介Kuninobu SaSaki
 
モデル高速化百選
モデル高速化百選モデル高速化百選
モデル高速化百選Yusuke Uchida
 
画像生成・生成モデル メタサーベイ
画像生成・生成モデル メタサーベイ画像生成・生成モデル メタサーベイ
画像生成・生成モデル メタサーベイcvpaper. challenge
 
[DLHacks]StyleGANとBigGANのStyle mixing, morphing
[DLHacks]StyleGANとBigGANのStyle mixing, morphing[DLHacks]StyleGANとBigGANのStyle mixing, morphing
[DLHacks]StyleGANとBigGANのStyle mixing, morphingDeep Learning JP
 
【DL輪読会】ViT + Self Supervised Learningまとめ
【DL輪読会】ViT + Self Supervised Learningまとめ【DL輪読会】ViT + Self Supervised Learningまとめ
【DL輪読会】ViT + Self Supervised LearningまとめDeep Learning JP
 
深層学習によるHuman Pose Estimationの基礎
深層学習によるHuman Pose Estimationの基礎深層学習によるHuman Pose Estimationの基礎
深層学習によるHuman Pose Estimationの基礎Takumi Ohkuma
 
ICCV 2019 論文紹介 (26 papers)
ICCV 2019 論文紹介 (26 papers)ICCV 2019 論文紹介 (26 papers)
ICCV 2019 論文紹介 (26 papers)Hideki Okada
 
GAN(と強化学習との関係)
GAN(と強化学習との関係)GAN(と強化学習との関係)
GAN(と強化学習との関係)Masahiro Suzuki
 
【メタサーベイ】数式ドリブン教師あり学習
【メタサーベイ】数式ドリブン教師あり学習【メタサーベイ】数式ドリブン教師あり学習
【メタサーベイ】数式ドリブン教師あり学習cvpaper. challenge
 
Introduction to YOLO detection model
Introduction to YOLO detection modelIntroduction to YOLO detection model
Introduction to YOLO detection modelWEBFARMER. ltd.
 

What's hot (20)

Tensorflow Liteの量子化アーキテクチャ
Tensorflow Liteの量子化アーキテクチャTensorflow Liteの量子化アーキテクチャ
Tensorflow Liteの量子化アーキテクチャ
 
CVPR2018 pix2pixHD論文紹介 (CV勉強会@関東)
CVPR2018 pix2pixHD論文紹介 (CV勉強会@関東)CVPR2018 pix2pixHD論文紹介 (CV勉強会@関東)
CVPR2018 pix2pixHD論文紹介 (CV勉強会@関東)
 
【DL輪読会】StyleCLIP: Text-Driven Manipulation of StyleGAN Imagery
【DL輪読会】StyleCLIP: Text-Driven Manipulation of StyleGAN Imagery【DL輪読会】StyleCLIP: Text-Driven Manipulation of StyleGAN Imagery
【DL輪読会】StyleCLIP: Text-Driven Manipulation of StyleGAN Imagery
 
実装レベルで学ぶVQVAE
実装レベルで学ぶVQVAE実装レベルで学ぶVQVAE
実装レベルで学ぶVQVAE
 
【DL輪読会】"Instant Neural Graphics Primitives with a Multiresolution Hash Encoding"
【DL輪読会】"Instant Neural Graphics Primitives with a Multiresolution Hash Encoding"【DL輪読会】"Instant Neural Graphics Primitives with a Multiresolution Hash Encoding"
【DL輪読会】"Instant Neural Graphics Primitives with a Multiresolution Hash Encoding"
 
[DL輪読会]Learning Transferable Visual Models From Natural Language Supervision
[DL輪読会]Learning Transferable Visual Models From Natural Language Supervision[DL輪読会]Learning Transferable Visual Models From Natural Language Supervision
[DL輪読会]Learning Transferable Visual Models From Natural Language Supervision
 
backbone としての timm 入門
backbone としての timm 入門backbone としての timm 入門
backbone としての timm 入門
 
BRDFモデルの変遷
BRDFモデルの変遷BRDFモデルの変遷
BRDFモデルの変遷
 
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
 
Automatic Mixed Precision の紹介
Automatic Mixed Precision の紹介Automatic Mixed Precision の紹介
Automatic Mixed Precision の紹介
 
Semantic segmentation
Semantic segmentationSemantic segmentation
Semantic segmentation
 
モデル高速化百選
モデル高速化百選モデル高速化百選
モデル高速化百選
 
画像生成・生成モデル メタサーベイ
画像生成・生成モデル メタサーベイ画像生成・生成モデル メタサーベイ
画像生成・生成モデル メタサーベイ
 
[DLHacks]StyleGANとBigGANのStyle mixing, morphing
[DLHacks]StyleGANとBigGANのStyle mixing, morphing[DLHacks]StyleGANとBigGANのStyle mixing, morphing
[DLHacks]StyleGANとBigGANのStyle mixing, morphing
 
【DL輪読会】ViT + Self Supervised Learningまとめ
【DL輪読会】ViT + Self Supervised Learningまとめ【DL輪読会】ViT + Self Supervised Learningまとめ
【DL輪読会】ViT + Self Supervised Learningまとめ
 
深層学習によるHuman Pose Estimationの基礎
深層学習によるHuman Pose Estimationの基礎深層学習によるHuman Pose Estimationの基礎
深層学習によるHuman Pose Estimationの基礎
 
ICCV 2019 論文紹介 (26 papers)
ICCV 2019 論文紹介 (26 papers)ICCV 2019 論文紹介 (26 papers)
ICCV 2019 論文紹介 (26 papers)
 
GAN(と強化学習との関係)
GAN(と強化学習との関係)GAN(と強化学習との関係)
GAN(と強化学習との関係)
 
【メタサーベイ】数式ドリブン教師あり学習
【メタサーベイ】数式ドリブン教師あり学習【メタサーベイ】数式ドリブン教師あり学習
【メタサーベイ】数式ドリブン教師あり学習
 
Introduction to YOLO detection model
Introduction to YOLO detection modelIntroduction to YOLO detection model
Introduction to YOLO detection model
 

More from Norishige Fukushima

計算スケジューリングの効果~もし,Halideがなかったら?~
計算スケジューリングの効果~もし,Halideがなかったら?~計算スケジューリングの効果~もし,Halideがなかったら?~
計算スケジューリングの効果~もし,Halideがなかったら?~Norishige Fukushima
 
多チャンネルバイラテラルフィルタの高速化
多チャンネルバイラテラルフィルタの高速化多チャンネルバイラテラルフィルタの高速化
多チャンネルバイラテラルフィルタの高速化Norishige Fukushima
 
計算機アーキテクチャを考慮した高能率画像処理プログラミング
計算機アーキテクチャを考慮した高能率画像処理プログラミング計算機アーキテクチャを考慮した高能率画像処理プログラミング
計算機アーキテクチャを考慮した高能率画像処理プログラミングNorishige Fukushima
 
デプスセンサとその応用
デプスセンサとその応用デプスセンサとその応用
デプスセンサとその応用Norishige Fukushima
 
複数台のKinectV2の使い方
複数台のKinectV2の使い方複数台のKinectV2の使い方
複数台のKinectV2の使い方Norishige Fukushima
 
Comparison between Blur Transfer and Blur Re-Generation in Depth Image Based ...
Comparison between Blur Transfer and Blur Re-Generation in Depth Image Based ...Comparison between Blur Transfer and Blur Re-Generation in Depth Image Based ...
Comparison between Blur Transfer and Blur Re-Generation in Depth Image Based ...Norishige Fukushima
 
Non-essentiality of Correlation between Image and Depth Map in Free Viewpoin...
Non-essentiality of Correlation between Image and Depth Map in Free Viewpoin...Non-essentiality of Correlation between Image and Depth Map in Free Viewpoin...
Non-essentiality of Correlation between Image and Depth Map in Free Viewpoin...Norishige Fukushima
 
マルチコアを用いた画像処理
マルチコアを用いた画像処理マルチコアを用いた画像処理
マルチコアを用いた画像処理Norishige Fukushima
 
Popcntによるハミング距離計算
Popcntによるハミング距離計算Popcntによるハミング距離計算
Popcntによるハミング距離計算Norishige Fukushima
 
OpenCVの拡張ユーティリティ関数群
OpenCVの拡張ユーティリティ関数群OpenCVの拡張ユーティリティ関数群
OpenCVの拡張ユーティリティ関数群Norishige Fukushima
 
組み込み関数(intrinsic)によるSIMD入門
組み込み関数(intrinsic)によるSIMD入門組み込み関数(intrinsic)によるSIMD入門
組み込み関数(intrinsic)によるSIMD入門Norishige Fukushima
 

More from Norishige Fukushima (14)

画像処理の高性能計算
画像処理の高性能計算画像処理の高性能計算
画像処理の高性能計算
 
計算スケジューリングの効果~もし,Halideがなかったら?~
計算スケジューリングの効果~もし,Halideがなかったら?~計算スケジューリングの効果~もし,Halideがなかったら?~
計算スケジューリングの効果~もし,Halideがなかったら?~
 
多チャンネルバイラテラルフィルタの高速化
多チャンネルバイラテラルフィルタの高速化多チャンネルバイラテラルフィルタの高速化
多チャンネルバイラテラルフィルタの高速化
 
計算機アーキテクチャを考慮した高能率画像処理プログラミング
計算機アーキテクチャを考慮した高能率画像処理プログラミング計算機アーキテクチャを考慮した高能率画像処理プログラミング
計算機アーキテクチャを考慮した高能率画像処理プログラミング
 
デプスセンサとその応用
デプスセンサとその応用デプスセンサとその応用
デプスセンサとその応用
 
複数台のKinectV2の使い方
複数台のKinectV2の使い方複数台のKinectV2の使い方
複数台のKinectV2の使い方
 
Libjpeg turboの使い方
Libjpeg turboの使い方Libjpeg turboの使い方
Libjpeg turboの使い方
 
Comparison between Blur Transfer and Blur Re-Generation in Depth Image Based ...
Comparison between Blur Transfer and Blur Re-Generation in Depth Image Based ...Comparison between Blur Transfer and Blur Re-Generation in Depth Image Based ...
Comparison between Blur Transfer and Blur Re-Generation in Depth Image Based ...
 
Non-essentiality of Correlation between Image and Depth Map in Free Viewpoin...
Non-essentiality of Correlation between Image and Depth Map in Free Viewpoin...Non-essentiality of Correlation between Image and Depth Map in Free Viewpoin...
Non-essentiality of Correlation between Image and Depth Map in Free Viewpoin...
 
マルチコアを用いた画像処理
マルチコアを用いた画像処理マルチコアを用いた画像処理
マルチコアを用いた画像処理
 
Popcntによるハミング距離計算
Popcntによるハミング距離計算Popcntによるハミング距離計算
Popcntによるハミング距離計算
 
OpenCVの拡張ユーティリティ関数群
OpenCVの拡張ユーティリティ関数群OpenCVの拡張ユーティリティ関数群
OpenCVの拡張ユーティリティ関数群
 
WebP入門
WebP入門WebP入門
WebP入門
 
組み込み関数(intrinsic)によるSIMD入門
組み込み関数(intrinsic)によるSIMD入門組み込み関数(intrinsic)によるSIMD入門
組み込み関数(intrinsic)によるSIMD入門
 

Recently uploaded

クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfFumieNakayama
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案sugiuralab
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfFumieNakayama
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成Hiroshi Tomioka
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)Hiroki Ichikura
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)UEHARA, Tetsutaro
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineerYuki Kikuchi
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?akihisamiyanaga1
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...博三 太田
 

Recently uploaded (9)

クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
 

ガイデットフィルタとその周辺