SlideShare a Scribd company logo
1 of 31
Download to read offline
2014/07/26 CV勉強会@関東
CVPR2014読み会(前編) 発表資料
takmin
自己紹介
2
テクニカル・ソリューション・アーキテクト
皆川 卓也(みながわ たくや)
フリーエンジニア(ビジョン&ITラボ)
「コンピュータビジョン勉強会@関東」主催
博士(工学)
テクニカル・ソリューション・アーキテクト
皆川 卓也(みながわ たくや)
フリーエンジニア(ビジョン&ITラボ)
「コンピュータビジョン勉強会@関東」主催
博士(工学)
略歴:
1999-2003年
日本HP(後にアジレント・テクノロジーへ分社)にて、ITエンジニアとしてシステム構築、プリ
セールス、プロジェクトマネジメント、サポート等の業務に従事
2004-2009年
コンピュータビジョンを用いたシステム/アプリ/サービス開発等に従事
2007-2010年
慶應義塾大学大学院 後期博士課程にて、コンピュータビジョンを専攻
単位取得退学後、博士号取得(2014年)
2009年-現在
フリーランスとして、コンピュータビジョンのコンサル/研究/開発等に従事
紹介する研究
 “BING: Binarized Normed Gradients for
Objectness Estimation at 300fps”
 Ming-Ming Cheng
 Ziming Zhang
 Wen-Yan Lin
 Philip Torr
Objectness検出
4
 画像から「物体っぽい」ものを検出する。(それがどんな
物体かまでは判別しない。)
 一般物体検出の前処理として使われる。
Objectness検出
要件:
 高い検出率
 一度検出できなかったものは、後処理で取り返せない。
 Objectnessの候補数は少ないほうが望ましい
 計算時間に影響
 計算が早い
 応用範囲を広げるため
 汎用的に使える
 学習していないカテゴリにも対応
Objectness検出
 従来法:
 顕著性とかセグメンテーションとか識
別器とかカスケード使って処理速度を
改善しつつ検出率を高めようとしてき
た
 本手法:
 従来法よりもアルゴリズムがシンプル
で高速で検出率が高い
Objectの特徴
 輪郭が閉じた形状を持っている。
それぞれの画像勾配を計算し、8x8にリサイズ
Normed Gradient (NG) Feature
NG特徴を用いたObjectness検出
 勾配画像を様々なサイズにリサイズし、フィルターを畳み込む
だけ!
フィルター
NG特徴を用いたObjectness検出
 勾配画像を様々なサイズにリサイズし、フィルターを畳み込む
だけ!
NG特徴
フィルター
𝑠𝑙 = 𝒘, 𝒈𝑙 (1)
SVMで学習
NG特徴を用いたObjectness検出
 サイズごとにスコアを補正
𝑜𝑙 = 𝑣𝑖 ∙ 𝑠𝑙 + 𝑡𝑖 (3)
𝑠𝑙 = 𝒘, 𝒈𝑙 (1)
最終スコア サイズごとの補正値
𝑖
SVMで学習
BING: Binarized normed gradients
 NG特徴をバイナリ化することで検出を高速化
𝑠𝑙 = 𝒘, 𝒈𝑙 (1)
バイナリ化
𝒘 ≈
𝑗=1
𝑁 𝑤
𝛽𝒋 𝒂𝑗 𝒈𝑙 ≈
𝑘=1
𝑁 𝑔
28−𝑘
𝒃 𝑘,𝑙 (5)
𝒂𝑗 ∈ −1, +1 8×8
𝒃 𝑘,𝑙 ∈ 0,1 8×8
フィルターのバイナリ化
 NG特徴をバイナリ化することで検出を高速化
𝑠𝑙 = 𝒘, 𝒈𝑙 (1)
バイナリ化
𝒘 ≈
𝑗=1
𝑁 𝑤
𝛽𝒋 𝒂𝑗 𝒈𝑙 ≈
𝑘=1
𝑁 𝑔
28−𝑘
𝒃 𝑘,𝑙 (5)
𝒂𝑗 ∈ −1, +1 8×8
𝒃 𝑘,𝑙 ∈ 0,1 8×8
フィルターのバイナリ化
𝒘 ≈
𝑗=1
𝑁 𝑤
𝛽𝒋 𝒂𝑗 𝒂𝑗 ∈ −1, +1 8×8
フィルターのバイナリ化
𝒘, 𝒈𝑙 ≈
𝑗=1
𝑁 𝑤
𝛽𝑗 2 𝒂𝑗
+
, 𝒈𝑙 − 𝒈𝑙
𝒘 ≈
𝑗=1
𝑁 𝑤
𝛽𝒋 𝒂𝑗 𝒂𝑗 ∈ −1, +1 8×8
𝒂𝑗
+
= 0, +1 8×8
𝒂𝑗 = 2𝒂𝑗
+
− 𝟏
(4)
NG特徴のバイナリ化
 NG特徴をバイナリ化することで検出を高速化
𝑠𝑙 = 𝒘, 𝒈𝑙 (1)
バイナリ化
𝒘 ≈
𝑗=1
𝑁 𝑤
𝛽𝒋 𝒂𝑗 𝒈𝑙 ≈
𝑘=1
𝑁 𝑔
28−𝑘
𝒃 𝑘,𝑙 (5)
𝒂𝑗 ∈ −1, +1 8×8
𝒃 𝑘,𝑙 ∈ 0,1 8×8
NG特徴のバイナリ化
𝒈𝑙 ≈
𝑘=1
𝑁 𝑔
28−𝑘
𝒃 𝑘,𝑙 (5)
𝒃 𝑘,𝑙 ∈ 0,1 8×8
𝒈𝑙 ∈ 0, ⋯ , 255 8×8
グレースケール バイナリ
210
𝑁𝑔 = 4 の時
11010010 1101
画素値
bit列 頭4bit
NG特徴のバイナリ化
𝒈𝑙 ≈
𝑘=1
𝑁 𝑔
28−𝑘
𝒃 𝑘,𝑙 (5)
𝒃 𝑘,𝑙 ∈ 0,1 8×8
𝒈𝑙 ∈ 0, ⋯ , 255 8×8
グレースケール バイナリ
210 ≈ 𝑘=1
𝑁 𝑔
28−𝑘
𝒃 𝑘,𝑙 = 1 ∗ 28−1
+ 1 ∗ 28−2
+0 ∗ 28−3
+1 ∗ 28−4
210
𝑁𝑔 = 4 の時
11010010 1101bit列 頭4bit
NG特徴のバイナリ化
𝒃 𝑘,𝑙 ∈ 0,1 8×8
𝒈𝑙 ∈ 0, ⋯ , 255 8×8
グレースケール バイナリ
210
𝑁𝑔 = 4 の時
11010010 1101bit列 頭4bit
0 0 1 0 1 0 0 0
0 0 1 0 0 1 1 0
1 1 0 0 0 0 1 0
1 0 0 0 0 0 1 0
1 0 0 0 0 0 1 1
1 0 0 0 0 0 0 0
0 0 0 0 0 0 1 0
0 0 0 1 1 0 0 0
0 1 1 1 0 1 0 0
0 0 1 0 0 1 1 0
1 1 0 0 0 0 1 0
1 0 0 0 0 0 1 0
1 0 0 0 0 0 1 1
1 0 0 0 0 0 0 0
0 0 0 0 0 0 1 0
0 0 0 1 1 0 0 0
0 0 1 0 1 0 0 0
0 0 1 0 0 1 1 0
1 1 0 0 0 0 1 0
1 0 0 0 0 0 1 0
1 0 0 0 0 0 1 0
1 0 0 0 0 0 0 1
0 0 0 0 0 0 1 1
0 0 0 1 1 0 0 1
0 0 1 0 1 1 0 0
0 0 1 0 0 1 1 0
1 1 0 0 0 0 1 0
1 0 0 0 0 0 1 0
1 0 0 0 0 0 1 0
1 0 0 0 0 0 0 1
0 0 0 0 0 0 1 1
0 0 0 1 1 0 0 1
𝑁𝑔
バイナリフィルタとBING特徴の統合
𝒘, 𝒈𝑙 ≈
𝑗=1
𝑁 𝑤
𝛽𝑗 2 𝒂𝑗
+
, 𝒈𝑙 − 𝒈𝑙
𝒈𝑙 ≈
𝑘=1
𝑁 𝑔
28−𝑘
𝒃 𝑘,𝑙 (5)
𝒘, 𝒈𝑙
≈
𝑗=1
𝑁 𝑤
𝛽𝑗
𝑘=1
𝑁 𝑔
28−𝑘
2 𝒂𝑗
+
, 𝒃 𝑘,𝑙 − 𝒃 𝑘,𝑙
(4)
(6)
バイナリフィルタの畳み込み
BING特徴
バイナリフィルタとBING特徴の統合
𝒘, 𝒈𝑙 ≈
𝑗=1
𝑁 𝑤
𝛽𝑗 2 𝒂𝑗
+
, 𝒈𝑙 − 𝒈𝑙
𝒈𝑙 ≈
𝑘=1
𝑁 𝑔
28−𝑘
𝒃 𝑘,𝑙 (5)
𝒘, 𝒈𝑙
≈
𝑗=1
𝑁 𝑤
𝛽𝑗
𝑘=1
𝑁 𝑔
28−𝑘
2 𝒂𝑗
+
, 𝒃 𝑘,𝑙 − 𝒃 𝑘,𝑙
(4)
(6)
バイナリフィルタの畳み込み
BING特徴
POPCNTANDBIT SHIFTADD
高速なBING特徴の取得
𝒘, 𝒈𝑙
≈
𝑗=1
𝑁 𝑤
𝛽𝑗
𝑘=1
𝑁 𝑔
28−𝑘
2 𝒂𝑗
+
, 𝒃 𝑘,𝑙 − 𝒃 𝑘,𝑙 (6)
000010000111……
00000…
000010000111……
00000…000010000111……
00000…
000010000111……
00000…
…
リサイズされた勾配画像 バイナリ化された画像
BING特徴
(8x8)
各場所で取得
高速なBING特徴の取得
0 0 1 0 1 1 0 0 1 0 0
0 0 1 0 0 1 1 0 0 0 0
1 1 0 0 0 0 1 0 0 0 1
0 1 1 0 0 0 0 1 1 1 0
1 0 0 0 0 0 1 1 0 0 0
1 0 0 0 0 0 1 0 0 0 1
1 0 0 0 0 0 0 0 0 1 0
0 0 0 0 1 1 0 0 1 0 0
0 0 0 0 0 0 1 0 1 1 1
0 0 0 1 1 0 0 0 0 1 1
0 0 1 1 0 0 0 0 0 0 1
ラスタスキャンでBING特徴を取得
𝒃 𝑥,𝑦: 64 bit
を高速に求める
高速なBING特徴の取得
0 0 1 0 1 1 0 0 1 0 0
0 0 1 0 0 1 1 0 0 0 0
1 1 0 0 0 0 1 0 0 0 1
0 1 1 0 0 0 0 1 1 1 0
1 0 0 0 0 0 1 1 0 0 0
1 0 0 0 0 0 1 0 0 0 1
1 0 0 0 0 0 0 0 0 1 0
0 0 0 0 1 1 0 0 1 0 0
0 0 0 0 0 0 1 0 1 1 1
0 0 0 1 1 0 0 0 0 1 1
0 0 1 1 0 0 0 0 0 0 1
ラスタスキャンでBING特徴を取得
𝒃 𝑥,𝑦: 64 bit
を高速に求める
𝒓 𝑥,𝑦: 8 bit
𝑏 𝑥,𝑦: 1 bit
高速なBING特徴の取得
0 0 1 0 1 1 0 0 1 0 0
0 0 1 0 0 1 1 0 0 0 0
1 1 0 0 0 0 1 0 0 0 1
0 1 1 0 0 0 0 1 1 1 0
1 0 0 0 0 0 1 1 0 0 0
1 0 0 0 0 0 1 0 0 0 1
1 0 0 0 0 0 0 0 0 1 0
0 0 0 0 1 1 0 0 1 0 0
0 0 0 0 0 0 1 0 1 1 1
0 0 0 1 1 0 0 0 0 1 1
0 0 1 1 0 0 0 0 0 0 1
ラスタスキャンでBING特徴を取得
𝒃 𝑥,𝑦: 64 bit
を高速に求める
𝒓 𝑥,𝑦: 8 bit
𝑏 𝑥,𝑦: 1 bit
𝒓 𝑥−1,𝑦
高速なBING特徴の取得
0 0 1 0 1 1 0 0 1 0 0
0 0 1 0 0 1 1 0 0 0 0
1 1 0 0 0 0 1 0 0 0 1
0 1 1 0 0 0 0 1 1 1 0
1 0 0 0 0 0 1 1 0 0 0
1 0 0 0 0 0 1 0 0 0 1
1 0 0 0 0 0 0 0 0 1 0
0 0 0 0 1 1 0 0 1 0 0
0 0 0 0 0 0 1 0 1 1 1
0 0 0 1 1 0 0 0 0 1 1
0 0 1 1 0 0 0 0 0 0 1
ラスタスキャンでBING特徴を取得
𝒃 𝑥,𝑦: 64 bit
を高速に求める
𝒓 𝑥,𝑦 =
(𝒓 𝑥−1,𝑦 ≪ 1)|𝑏 𝑥,𝑦
高速なBING特徴の取得
0 0 1 0 1 1 0 0 1 0 0
0 0 1 0 0 1 1 0 0 0 0
1 1 0 0 0 0 1 0 0 0 1
0 1 1 0 0 0 0 1 1 1 0
1 0 0 0 0 0 1 1 0 0 0
1 0 0 0 0 0 1 0 0 0 1
1 0 0 0 0 0 0 0 0 1 0
0 0 0 0 1 1 0 0 1 0 0
0 0 0 0 0 0 1 0 1 1 1
0 0 0 1 1 0 0 0 0 1 1
0 0 1 1 0 0 0 0 0 0 1
ラスタスキャンでBING特徴を取得
𝒃 𝑥,𝑦: 64 bit
𝒓 𝑥,𝑦 =
(𝒓 𝑥−1,𝑦 ≪ 1)|𝑏 𝑥,𝑦
𝒃 𝑥,𝑦−1
高速なBING特徴の取得
0 0 1 0 1 1 0 0 1 0 0
0 0 1 0 0 1 1 0 0 0 0
1 1 0 0 0 0 1 0 0 0 1
0 1 1 0 0 0 0 1 1 1 0
1 0 0 0 0 0 1 1 0 0 0
1 0 0 0 0 0 1 0 0 0 1
1 0 0 0 0 0 0 0 0 1 0
0 0 0 0 1 1 0 0 1 0 0
0 0 0 0 0 0 1 0 1 1 1
0 0 0 1 1 0 0 0 0 1 1
0 0 1 1 0 0 0 0 0 0 1
ラスタスキャンでBING特徴を取得
𝒃 𝑥,𝑦 =
(𝒃 𝑥,𝑦−1 ≪ 8)|𝒓 𝑥,𝑦
𝒓 𝑥,𝑦 =
(𝒓 𝑥−1,𝑦 ≪ 1)|𝑏 𝑥,𝑦
実験
 PASCAL VOC 2007での成功例
他の手法との比較(PASCAL VOC2007)
計算時間
 処理時間:300fps
 トレーニング:2501枚の訓練データで20秒
 ラップトップ Intel i7-3940XM CPU
オペレーションの平均回数
まとめ
 閉じた輪郭を持つものを物体と仮定して、勾配画像より
NG特徴を学習
 NG特徴を用いたObjectness検出を高速に行うために、
バイナリ化(=BING特徴)
 従来法と比べて性能が良いだけでなく、処理速度も3桁
近く早い
 プロジェクトページ
 http://mmcheng.net/bing/
 ソースコードあり

More Related Content

What's hot

画像認識の初歩、SIFT,SURF特徴量
画像認識の初歩、SIFT,SURF特徴量画像認識の初歩、SIFT,SURF特徴量
画像認識の初歩、SIFT,SURF特徴量
takaya imai
 
パターン認識第9章 学習ベクトル量子化
パターン認識第9章 学習ベクトル量子化パターン認識第9章 学習ベクトル量子化
パターン認識第9章 学習ベクトル量子化
Miyoshi Yuya
 

What's hot (20)

SSII2020 [OS2-02] 教師あり事前学習を凌駕する「弱」教師あり事前学習
SSII2020 [OS2-02] 教師あり事前学習を凌駕する「弱」教師あり事前学習SSII2020 [OS2-02] 教師あり事前学習を凌駕する「弱」教師あり事前学習
SSII2020 [OS2-02] 教師あり事前学習を凌駕する「弱」教師あり事前学習
 
深層生成モデルを用いたマルチモーダル学習
深層生成モデルを用いたマルチモーダル学習深層生成モデルを用いたマルチモーダル学習
深層生成モデルを用いたマルチモーダル学習
 
AHC-Lab M1勉強会 論文の読み方・書き方
AHC-Lab M1勉強会 論文の読み方・書き方AHC-Lab M1勉強会 論文の読み方・書き方
AHC-Lab M1勉強会 論文の読み方・書き方
 
クラシックな機械学習の入門 3. 線形回帰および識別
クラシックな機械学習の入門 3. 線形回帰および識別クラシックな機械学習の入門 3. 線形回帰および識別
クラシックな機械学習の入門 3. 線形回帰および識別
 
動作認識の最前線:手法,タスク,データセット
動作認識の最前線:手法,タスク,データセット動作認識の最前線:手法,タスク,データセット
動作認識の最前線:手法,タスク,データセット
 
画像認識の初歩、SIFT,SURF特徴量
画像認識の初歩、SIFT,SURF特徴量画像認識の初歩、SIFT,SURF特徴量
画像認識の初歩、SIFT,SURF特徴量
 
Transformer メタサーベイ
Transformer メタサーベイTransformer メタサーベイ
Transformer メタサーベイ
 
How Much Position Information Do Convolutional Neural Networks Encode?
How Much Position Information Do Convolutional Neural Networks Encode?How Much Position Information Do Convolutional Neural Networks Encode?
How Much Position Information Do Convolutional Neural Networks Encode?
 
Superpixel Sampling Networks
Superpixel Sampling NetworksSuperpixel Sampling Networks
Superpixel Sampling Networks
 
[DL輪読会]相互情報量最大化による表現学習
[DL輪読会]相互情報量最大化による表現学習[DL輪読会]相互情報量最大化による表現学習
[DL輪読会]相互情報量最大化による表現学習
 
[DL輪読会]Revisiting Deep Learning Models for Tabular Data (NeurIPS 2021) 表形式デー...
[DL輪読会]Revisiting Deep Learning Models for Tabular Data  (NeurIPS 2021) 表形式デー...[DL輪読会]Revisiting Deep Learning Models for Tabular Data  (NeurIPS 2021) 表形式デー...
[DL輪読会]Revisiting Deep Learning Models for Tabular Data (NeurIPS 2021) 表形式デー...
 
「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation 「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
 
CV分野におけるサーベイ方法
CV分野におけるサーベイ方法CV分野におけるサーベイ方法
CV分野におけるサーベイ方法
 
【論文読み会】Self-Attention Generative Adversarial Networks
【論文読み会】Self-Attention Generative  Adversarial Networks【論文読み会】Self-Attention Generative  Adversarial Networks
【論文読み会】Self-Attention Generative Adversarial Networks
 
10分でわかる主成分分析(PCA)
10分でわかる主成分分析(PCA)10分でわかる主成分分析(PCA)
10分でわかる主成分分析(PCA)
 
パターン認識第9章 学習ベクトル量子化
パターン認識第9章 学習ベクトル量子化パターン認識第9章 学習ベクトル量子化
パターン認識第9章 学習ベクトル量子化
 
3次元レジストレーション(PCLデモとコード付き)
3次元レジストレーション(PCLデモとコード付き)3次元レジストレーション(PCLデモとコード付き)
3次元レジストレーション(PCLデモとコード付き)
 
[DL輪読会]Reward Augmented Maximum Likelihood for Neural Structured Prediction
[DL輪読会]Reward Augmented Maximum Likelihood for Neural Structured Prediction[DL輪読会]Reward Augmented Maximum Likelihood for Neural Structured Prediction
[DL輪読会]Reward Augmented Maximum Likelihood for Neural Structured Prediction
 
3次元計測とフィルタリング
3次元計測とフィルタリング3次元計測とフィルタリング
3次元計測とフィルタリング
 
【チュートリアル】コンピュータビジョンによる動画認識 v2
【チュートリアル】コンピュータビジョンによる動画認識 v2【チュートリアル】コンピュータビジョンによる動画認識 v2
【チュートリアル】コンピュータビジョンによる動画認識 v2
 

More from Takuya Minagawa

More from Takuya Minagawa (20)

Machine Learning Operations (MLOps): Overview, Definition, and Architecture
Machine Learning Operations (MLOps): Overview, Definition, and ArchitectureMachine Learning Operations (MLOps): Overview, Definition, and Architecture
Machine Learning Operations (MLOps): Overview, Definition, and Architecture
 
MobileNeRF
MobileNeRFMobileNeRF
MobileNeRF
 
点群SegmentationのためのTransformerサーベイ
点群SegmentationのためのTransformerサーベイ点群SegmentationのためのTransformerサーベイ
点群SegmentationのためのTransformerサーベイ
 
Learning to Solve Hard Minimal Problems
Learning to Solve Hard Minimal ProblemsLearning to Solve Hard Minimal Problems
Learning to Solve Hard Minimal Problems
 
ConditionalPointDiffusion.pdf
ConditionalPointDiffusion.pdfConditionalPointDiffusion.pdf
ConditionalPointDiffusion.pdf
 
楽しいコンピュータビジョンの受託仕事
楽しいコンピュータビジョンの受託仕事楽しいコンピュータビジョンの受託仕事
楽しいコンピュータビジョンの受託仕事
 
20210711 deepI2P
20210711 deepI2P20210711 deepI2P
20210711 deepI2P
 
20201010 personreid
20201010 personreid20201010 personreid
20201010 personreid
 
20200910コンピュータビジョン今昔物語(JPTA講演資料)
20200910コンピュータビジョン今昔物語(JPTA講演資料)20200910コンピュータビジョン今昔物語(JPTA講演資料)
20200910コンピュータビジョン今昔物語(JPTA講演資料)
 
2020/07/04 BSP-Net (CVPR2020)
2020/07/04 BSP-Net (CVPR2020)2020/07/04 BSP-Net (CVPR2020)
2020/07/04 BSP-Net (CVPR2020)
 
20200704 bsp net
20200704 bsp net20200704 bsp net
20200704 bsp net
 
20190825 vins mono
20190825 vins mono20190825 vins mono
20190825 vins mono
 
20190706cvpr2019_3d_shape_representation
20190706cvpr2019_3d_shape_representation20190706cvpr2019_3d_shape_representation
20190706cvpr2019_3d_shape_representation
 
20190307 visualslam summary
20190307 visualslam summary20190307 visualslam summary
20190307 visualslam summary
 
Visual slam
Visual slamVisual slam
Visual slam
 
20190131 lidar-camera fusion semantic segmentation survey
20190131 lidar-camera fusion semantic segmentation survey20190131 lidar-camera fusion semantic segmentation survey
20190131 lidar-camera fusion semantic segmentation survey
 
2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation
2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation
2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation
 
run Keras model on opencv
run Keras model on opencvrun Keras model on opencv
run Keras model on opencv
 
20181130 lidar object detection survey
20181130 lidar object detection survey20181130 lidar object detection survey
20181130 lidar object detection survey
 
object detection with lidar-camera fusion: survey (updated)
object detection with lidar-camera fusion: survey (updated)object detection with lidar-camera fusion: survey (updated)
object detection with lidar-camera fusion: survey (updated)
 

Recently uploaded

Recently uploaded (12)

NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
 

[CVPR読み会]BING:Binarized normed gradients for objectness estimation at 300fps