SlideShare a Scribd company logo
CV勉強会@関東「CVPR2015読み会」 発表資料
Show and Tell: A Neural Image Caption
Generator
2015/07/20 takmin
自己紹介
テクニカル・ソリューション・アーキテクト
皆川 卓也(みながわ たくや)
フリーエンジニア(ビジョン&ITラボ)
「コンピュータビジョン勉強会@関東」主催
博士(工学)
テクニカル・ソリューション・アーキテクト
皆川 卓也(みながわ たくや)
フリーエンジニア(ビジョン&ITラボ)
「コンピュータビジョン勉強会@関東」主催
博士(工学)
略歴:
1999-2003年
日本HP(後にアジレント・テクノロジーへ分社)にて、ITエンジニアとしてシステム構築、プリ
セールス、プロジェクトマネジメント、サポート等の業務に従事
2004-2009年
コンピュータビジョンを用いたシステム/アプリ/サービス開発等に従事
2007-2010年
慶應義塾大学大学院 後期博士課程にて、コンピュータビジョンを専攻
単位取得退学後、博士号取得(2014年)
2009年-現在
フリーランスとして、コンピュータビジョンのコンサル/研究/開発等に従事
2
http://visitlab.jp
紹介する論文
3
 Show and Tell: A Neural Image Caption Generator
 O.Vinyals, A.Toshev, S.Bengio, D.Erhan
 “複雑な画像のキャプション(説明文)を自動生成するシ
ステムをGoogleが研究開発中”, TechCrunch 2014-11-
19
 http://jp.techcrunch.com/2014/11/19/20141118new-
google-research-project-can-auto-caption-complex-
images/
前回の勉強会の@peisukeさんのRNN / LSTMに関する資料が大変参考になりま
す。
• http://www.slideshare.net/FujimotoKeisuke/learning-to-forget-continual-
prediction-with-lstm
概要
4
 1枚の静止画像から説明文を生成
 近年のReccurent Neural Networks (RNN)を用いた機械
翻訳の手法をベースに、その入力をDeep Convolutional
Neural Networksで生成した特徴ベクトルに置き換え
 Neural Image Caption (NIC)
 従来手法を大きく上回る精度
Convolutional Neural Networks (CNN)
5
 詳細は割愛。ここでは、「学習データから認識に有効な
特徴量を自動で学習するネットワーク」程度の理解でOK。
 ここではGoogLeNetを改良した以下の論文を使用。
 S.Ioffe and C.Szegedy, “Batch Normalization: Accelerating
Deep Network Training by Reducing Internal Covariate Shift”,
arXiv 2015
Reccurent Neural Networks (RNN)
6
 時系列データなどの「連続したデータ」を扱うための
ニューラルネットワーク
 音声認識、機械翻訳、動画像認識
 予測先の次元数が可変
 時刻tの隠れ層の出力が時刻t+1の隠れ層の入力になる
・・・
・・・
・・・
入力
出力
隠れ層
Reccurent Neural Networks (RNN)
7
 展開すると、静的なネットワークで表せる
・・・
・・・
・・・
入力
出力
隠れ層
・・・
・・・
・・・
・・・
・・・
・・・
t-1 t t+1
Reccurent Neural Networks (RNN)
8
 展開すると、静的なネットワークで表せる
 通常の誤差逆伝播法でパラメータを学習できる
・・・
・・・
・・・
入力
出力
隠れ層
・・・
・・・
・・・
・・・
・・・
・・・
t-1 t t+1
教師データ 教師データ 教師データ
Long-Short Term Memory (LSTM)
9
 RNNは系列が大きくなると階層が深くなり、伝播した誤差
の勾配が発散してしまう
 各データの入出力および過去のデータの使用/不使用を
制御して、長い系列を扱えるようにする。
Long-Short Term Memory (LSTM)
Long-Short Term Memory (LSTM)
10
RNN
・・・
・・・
・・・
入力
出力
隠れ層
𝑥
𝑚 𝑡
𝑐𝑡−1
𝑐𝑡
Long-Short Term Memory (LSTM)
11
LSTM
・・・
・・・
・・・
入力
出力
隠れ層
ℎ
𝜎
𝜎
Input Gate
Output Gate
Forget Gate
𝜎
Updating Term
𝑥
𝑚 𝑡
𝑐𝑡
𝑐𝑡−1
𝑚 𝑡−1
Long-Short Term Memory (LSTM)
12
LSTM
・・・
・・・
・・・
入力
出力
隠れ層
ℎ
𝜎
𝜎
Input Gate
Output Gate
Forget Gate
𝜎
Updating Term
𝑥
𝑚 𝑡
𝑐𝑡
𝑐𝑡−1
𝑚 𝑡−1
Long-Short Term Memory (LSTM)
13
ℎ
𝑥 𝑡𝑚 𝑡−1
𝑖 𝑡
𝑦𝑡
𝜎
𝑚 𝑡−1
𝑥 𝑡
 Input Gate
 入力データの使用/不使用を制御
Long-Short Term Memory (LSTM)
14
𝑦𝑡 = 𝑖 𝑡⨀ℎ 𝑊𝑐𝑥 𝑥 𝑡 + 𝑊𝑐𝑚 𝑚 𝑡−1
ℎ
𝑥 𝑡𝑚 𝑡−1
𝑖 𝑡
𝑦𝑡
𝜎
𝑚 𝑡−1
𝑥 𝑡
 Input Gate
 入力データの使用/不使用を制御
hyperbolic tangent関数
𝑖 𝑡 = 1の時信号を通し
𝑖 𝑡 = 0 の時通さない
Long-Short Term Memory (LSTM)
15
𝑦𝑡 = 𝑖 𝑡⨀ℎ 𝑊𝑐𝑥 𝑥 𝑡 + 𝑊𝑐𝑚 𝑚 𝑡−1
ℎ
𝑥 𝑡𝑚 𝑡−1
𝑖 𝑡
𝑦𝑡
𝜎
𝑚 𝑡−1
𝑥 𝑡
𝑖 𝑡 = 𝜎 𝑊𝑖𝑥 𝑥 𝑡 + 𝑊𝑖𝑚 𝑚 𝑡−1 Sigmoid関数
 Input Gate
 入力データの使用/不使用を制御
hyperbolic tangent関数
𝑖 𝑡 = 1の時信号を通し
𝑖 𝑡 = 0 の時通さない
Long-Short Term Memory (LSTM)
16
𝑦𝑡 = 𝑖 𝑡⨀ℎ 𝑊𝑐𝑥 𝑥 𝑡 + 𝑊𝑐𝑚 𝑚 𝑡−1
ℎ
𝑥 𝑡𝑚 𝑡−1
𝑖 𝑡
𝑦𝑡
𝜎
𝑚 𝑡−1
𝑥 𝑡
𝑖 𝑡 = 𝜎 𝑊𝑖𝑥 𝑥 𝑡 + 𝑊𝑖𝑚 𝑚 𝑡−1 Sigmoid関数
 Input Gate
 入力データの使用/不使用を制御
hyperbolic tangent関数
学習するパラメータ
Long-Short Term Memory (LSTM)
17
LSTM
・・・
・・・
・・・
入力
出力
隠れ層
ℎ
𝜎
𝜎
Input Gate
Output Gate
Forget Gate
𝜎
Updating Term
𝑥
𝑚 𝑡
𝑐𝑡
𝑐𝑡−1
𝑚 𝑡−1
Long-Short Term Memory (LSTM)
18
𝑓𝑡
𝑐𝑡
𝜎
𝑚 𝑡−1
𝑥 𝑡・・・𝑦𝑡
𝑐𝑡−1
 Forget Gate
 過去の系列データの使用/不使用を制御
Long-Short Term Memory (LSTM)
19
𝑓𝑡
𝑐𝑡
𝜎
𝑚 𝑡−1
𝑥 𝑡・・・
𝑐𝑡 = 𝑓𝑡⨀𝑐𝑡−1 + 𝑦𝑡
𝑦𝑡
𝑐𝑡−1
 Forget Gate
 過去の系列データの使用/不使用を制御
𝑓𝑡 = 1の時信号を通し
𝑓𝑡 = 0 の時通さない
Long-Short Term Memory (LSTM)
20
𝑓𝑡
𝑐𝑡
𝜎
𝑚 𝑡−1
𝑥 𝑡・・・
𝑓𝑡 = 𝜎 𝑊𝑓𝑥 𝑥 𝑡 + 𝑊𝑓𝑚 𝑚 𝑡−1
𝑐𝑡 = 𝑓𝑡⨀𝑐𝑡−1 + 𝑦𝑡
𝑦𝑡
𝑐𝑡−1
 Forget Gate
 過去の系列データの使用/不使用を制御
Long-Short Term Memory (LSTM)
21
LSTM
・・・
・・・
・・・
入力
出力
隠れ層
ℎ
𝜎
𝜎
Input Gate
Output Gate
Forget Gate
𝜎
Updating Term
𝑥
𝑚 𝑡
𝑐𝑡
𝑐𝑡−1
𝑚 𝑡−1
Long-Short Term Memory (LSTM)
22
𝑐𝑡
𝑜𝑡
𝑚 𝑡
𝜎
𝑚 𝑡−1
𝑥 𝑡
 Output Gate
 出力データの使用/不使用を制御
Long-Short Term Memory (LSTM)
23
𝑐𝑡
𝑜𝑡
𝑚 𝑡
𝜎
𝑚 𝑡−1
𝑥 𝑡
 Output Gate
 出力データの使用/不使用を制御
𝑜𝑡 = 1の時信号を通し
𝑜𝑡 = 0 の時通さない
𝑜𝑡 = 𝜎 𝑊𝑜𝑥 𝑥 𝑡 + 𝑊𝑜𝑚 𝑚 𝑡−1
𝑚 𝑡 = 𝑜𝑡⨀𝑐𝑡
Neural Image Caption (NIC)
24
 静止画から説明文を生成
𝑆∗
= argmax
𝑆
𝑝 𝑆|𝐼
画像説明文
𝑆 = 𝑆0, 𝑆1, ⋯
単語
可変長の系列データ
Neural Image Caption (NIC)
25
 静止画から説明文を生成
𝑆∗
= argmax
𝑆
𝑝 𝑆|𝐼
画像説明文
𝑝 𝑆|𝐼; 𝜃 =
𝑡=0
𝑁
𝑝 𝑆𝑡|𝐼, 𝑆0, ⋯ , 𝑆𝑡−1 ; 𝜃
𝑆 = 𝑆0, 𝑆1, ⋯
単語数
各単語はその前の単語列
の影響を受ける。
Neural Image Caption (NIC)
26
 静止画から説明文を生成
𝑝 𝑆|𝐼; 𝜃 =
𝑡=0
𝑁
𝑝 𝑆𝑡|𝐼, 𝑆0, ⋯ , 𝑆𝑡−1 ; 𝜃
パラメータ
単語数
学習データ 𝐼, 𝑆 から学習
Neural Image Caption (NIC)
27
LSTM
・・・
・・・
・・・
入力
出力
隠れ層
ℎ
𝜎
𝜎
Input Gate
Output Gate
Forget Gate
𝜎
Updating Term
𝑥
𝑚 𝑡
𝑐𝑡
𝑐𝑡−1
𝑚 𝑡−1
𝑥 𝑡 = 𝑊𝑒 𝑆𝑡
𝑝𝑡 𝑆𝑡+1 = softmax 𝑚 𝑡
Neural Image Caption (NIC)
28
Neural Image Caption (NIC)
29
画像からDeep CNNで
特徴ベクトルを取得
LSTMへの最初の入
力(𝒙−𝟏)
Neural Image Caption (NIC)
30
単語𝑺 𝟎を入力
次の単語が𝑺 𝟏で
ある確率
Neural Image Caption (NIC)
31
𝒎 𝟎, 𝒄 𝟎
NICの学習
32
ImageNet + Drop out
でPretraining
ランダムにパラメータ
を初期化
NICの学習
33
学習データ
予測確率
NICの学習
34
学習データ
予測確率
誤差逆
伝播
NICで予測 (Sampling)
35
Deep CNNで特徴ベク
トルを取得
入力画像を与える
NICで予測 (Sampling)
36
Special Start Word
最も確率の高い
単語𝑺 𝟏を選択
NICで予測 (Sampling)
37
選択した単語
𝑺 𝟏を入力
end-of-sentence
tokenが現れるま
で続ける
NICで予測 (BeamSearch)
38
Best kの単語を
保持
NICで予測 (BeamSearch)
39
Best kの文章を
保持
k個の単語入力
NICで予測 (BeamSearch)
40
Best kの文章を
保持
k個の単語入力
以下の実験では
BeamSearchを使用
Dataset
41
 実験に使用したデータセット
実験結果
42
 3つの指標でMSCOCOデータセットに対し定量評価
 人が評価した性能に近い値を出すことができた
他の手法との比較
43
 既存手法より大幅な精度改善
上位N個の文章例
44
 同じ画像に対し異なる表現を得られる
 学習データにない新しい表現が生成された。
Ranking Results
45
人間による評価
46
 Amazon Mechanical Turkで1枚の画像につき2人、4段階評価
 Ground Truthには遠く及ばなかった(→BLEUなどの評価指標に課
題)
人間による評価
47
Analysis of Embedding
48
 Word Embedding Vector [20]という手法を用いて、ある
単語の近傍を取得
まとめ
49
 Deep CNNとRNNを用いて、画像から
説明文を生成する手法を提案。
 1つのネットワークとして誤差逆伝播
でパラメータを学習
 RNNにはLSTMを用い、長い文でも
学習時に伝播した誤差が発散しない
 従来法と比較し、大幅な精度改善

More Related Content

What's hot

Semantic segmentation2
Semantic segmentation2Semantic segmentation2
Semantic segmentation2
Takuya Minagawa
 
LiDAR点群と画像とのマッピング
LiDAR点群と画像とのマッピングLiDAR点群と画像とのマッピング
LiDAR点群と画像とのマッピング
Takuya Minagawa
 
「コンピュータビジョン勉強会@関東」紹介資料
「コンピュータビジョン勉強会@関東」紹介資料「コンピュータビジョン勉強会@関東」紹介資料
「コンピュータビジョン勉強会@関東」紹介資料
Takuya Minagawa
 
20140131 R-CNN
20140131 R-CNN20140131 R-CNN
20140131 R-CNN
Takuya Minagawa
 
run Keras model on opencv
run Keras model on opencvrun Keras model on opencv
run Keras model on opencv
Takuya Minagawa
 
How to feed myself with computer vision
How to feed myself with computer visionHow to feed myself with computer vision
How to feed myself with computer vision
Takuya Minagawa
 
ORB-SLAMを動かしてみた
ORB-SLAMを動かしてみたORB-SLAMを動かしてみた
ORB-SLAMを動かしてみた
Takuya Minagawa
 
Pn learning takmin
Pn learning takminPn learning takmin
Pn learning takmin
Takuya Minagawa
 
LiDAR点群とSfM点群との位置合わせ
LiDAR点群とSfM点群との位置合わせLiDAR点群とSfM点群との位置合わせ
LiDAR点群とSfM点群との位置合わせ
Takuya Minagawa
 
20180424 orb slam
20180424 orb slam20180424 orb slam
20180424 orb slam
Takuya Minagawa
 
3DFeat-Net
3DFeat-Net3DFeat-Net
3DFeat-Net
Takuya Minagawa
 
CVPR2018のPointCloudのCNN論文とSPLATNet
CVPR2018のPointCloudのCNN論文とSPLATNetCVPR2018のPointCloudのCNN論文とSPLATNet
CVPR2018のPointCloudのCNN論文とSPLATNet
Takuya Minagawa
 
Cvpr2017事前読み会
Cvpr2017事前読み会Cvpr2017事前読み会
Cvpr2017事前読み会
Takuya Minagawa
 
Large-Scale Object Classification Using Label Relation Graphs
Large-Scale Object Classification Using Label Relation GraphsLarge-Scale Object Classification Using Label Relation Graphs
Large-Scale Object Classification Using Label Relation Graphs
Takuya Minagawa
 
object detection with lidar-camera fusion: survey (updated)
object detection with lidar-camera fusion: survey (updated)object detection with lidar-camera fusion: survey (updated)
object detection with lidar-camera fusion: survey (updated)
Takuya Minagawa
 
2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation
2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation
2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation
Takuya Minagawa
 
20190307 visualslam summary
20190307 visualslam summary20190307 visualslam summary
20190307 visualslam summary
Takuya Minagawa
 
20181130 lidar object detection survey
20181130 lidar object detection survey20181130 lidar object detection survey
20181130 lidar object detection survey
Takuya Minagawa
 
20200910コンピュータビジョン今昔物語(JPTA講演資料)
20200910コンピュータビジョン今昔物語(JPTA講演資料)20200910コンピュータビジョン今昔物語(JPTA講演資料)
20200910コンピュータビジョン今昔物語(JPTA講演資料)
Takuya Minagawa
 
20180527 ORB SLAM Code Reading
20180527 ORB SLAM Code Reading20180527 ORB SLAM Code Reading
20180527 ORB SLAM Code Reading
Takuya Minagawa
 

What's hot (20)

Semantic segmentation2
Semantic segmentation2Semantic segmentation2
Semantic segmentation2
 
LiDAR点群と画像とのマッピング
LiDAR点群と画像とのマッピングLiDAR点群と画像とのマッピング
LiDAR点群と画像とのマッピング
 
「コンピュータビジョン勉強会@関東」紹介資料
「コンピュータビジョン勉強会@関東」紹介資料「コンピュータビジョン勉強会@関東」紹介資料
「コンピュータビジョン勉強会@関東」紹介資料
 
20140131 R-CNN
20140131 R-CNN20140131 R-CNN
20140131 R-CNN
 
run Keras model on opencv
run Keras model on opencvrun Keras model on opencv
run Keras model on opencv
 
How to feed myself with computer vision
How to feed myself with computer visionHow to feed myself with computer vision
How to feed myself with computer vision
 
ORB-SLAMを動かしてみた
ORB-SLAMを動かしてみたORB-SLAMを動かしてみた
ORB-SLAMを動かしてみた
 
Pn learning takmin
Pn learning takminPn learning takmin
Pn learning takmin
 
LiDAR点群とSfM点群との位置合わせ
LiDAR点群とSfM点群との位置合わせLiDAR点群とSfM点群との位置合わせ
LiDAR点群とSfM点群との位置合わせ
 
20180424 orb slam
20180424 orb slam20180424 orb slam
20180424 orb slam
 
3DFeat-Net
3DFeat-Net3DFeat-Net
3DFeat-Net
 
CVPR2018のPointCloudのCNN論文とSPLATNet
CVPR2018のPointCloudのCNN論文とSPLATNetCVPR2018のPointCloudのCNN論文とSPLATNet
CVPR2018のPointCloudのCNN論文とSPLATNet
 
Cvpr2017事前読み会
Cvpr2017事前読み会Cvpr2017事前読み会
Cvpr2017事前読み会
 
Large-Scale Object Classification Using Label Relation Graphs
Large-Scale Object Classification Using Label Relation GraphsLarge-Scale Object Classification Using Label Relation Graphs
Large-Scale Object Classification Using Label Relation Graphs
 
object detection with lidar-camera fusion: survey (updated)
object detection with lidar-camera fusion: survey (updated)object detection with lidar-camera fusion: survey (updated)
object detection with lidar-camera fusion: survey (updated)
 
2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation
2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation
2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation
 
20190307 visualslam summary
20190307 visualslam summary20190307 visualslam summary
20190307 visualslam summary
 
20181130 lidar object detection survey
20181130 lidar object detection survey20181130 lidar object detection survey
20181130 lidar object detection survey
 
20200910コンピュータビジョン今昔物語(JPTA講演資料)
20200910コンピュータビジョン今昔物語(JPTA講演資料)20200910コンピュータビジョン今昔物語(JPTA講演資料)
20200910コンピュータビジョン今昔物語(JPTA講演資料)
 
20180527 ORB SLAM Code Reading
20180527 ORB SLAM Code Reading20180527 ORB SLAM Code Reading
20180527 ORB SLAM Code Reading
 

Similar to Show and tell takmin

ADVENTUREの他のモジュール・関連プロジェクトの紹介
ADVENTUREの他のモジュール・関連プロジェクトの紹介ADVENTUREの他のモジュール・関連プロジェクトの紹介
ADVENTUREの他のモジュール・関連プロジェクトの紹介
ADVENTURE Project
 
kagami_comput2015_1
kagami_comput2015_1kagami_comput2015_1
kagami_comput2015_1swkagami
 
SORACOM Technology Camp 2018 アドバンストラック4 | スモールスタートの次の一手は?成長できるIoTシステムの実例と回避した...
SORACOM Technology Camp 2018 アドバンストラック4 | スモールスタートの次の一手は?成長できるIoTシステムの実例と回避した...SORACOM Technology Camp 2018 アドバンストラック4 | スモールスタートの次の一手は?成長できるIoTシステムの実例と回避した...
SORACOM Technology Camp 2018 アドバンストラック4 | スモールスタートの次の一手は?成長できるIoTシステムの実例と回避した...
SORACOM,INC
 
ストリーム処理とSensorBee
ストリーム処理とSensorBeeストリーム処理とSensorBee
ストリーム処理とSensorBee
Daisuke Tanaka
 
Matrix signal controller and BrainPad overview
Matrix signal controller and BrainPad overviewMatrix signal controller and BrainPad overview
Matrix signal controller and BrainPad overview
Kouji Matsui
 
kagami_comput2016_01
kagami_comput2016_01kagami_comput2016_01
kagami_comput2016_01
swkagami
 
【メタサーベイ】基盤モデル / Foundation Models
【メタサーベイ】基盤モデル / Foundation Models【メタサーベイ】基盤モデル / Foundation Models
【メタサーベイ】基盤モデル / Foundation Models
cvpaper. challenge
 
Power BI のいろいろな活用パターン
Power BI のいろいろな活用パターンPower BI のいろいろな活用パターン
Power BI のいろいろな活用パターン
Yugo Shimizu
 
Iot algyan jhirono 20190111
Iot algyan jhirono 20190111Iot algyan jhirono 20190111
Iot algyan jhirono 20190111
Hirono Jumpei
 
0610 TECH & BRIDGE MEETING
0610 TECH & BRIDGE MEETING0610 TECH & BRIDGE MEETING
0610 TECH & BRIDGE MEETING
健司 亀本
 
Power Automate の他では聞けない使い方 (UI flows は除く)
Power Automate の他では聞けない使い方 (UI flows は除く)Power Automate の他では聞けない使い方 (UI flows は除く)
Power Automate の他では聞けない使い方 (UI flows は除く)
Yugo Shimizu
 
kagamicomput201801
kagamicomput201801kagamicomput201801
kagamicomput201801
swkagami
 
2014-01-28 Operation in the future
2014-01-28 Operation in the future2014-01-28 Operation in the future
2014-01-28 Operation in the future
Operation Lab, LLC.
 
[db tech showcase Tokyo 2014] D25: 今を分析する日立の「CEP」、知るなら今でしょ! by 株式会社日立製作所 村上順一
 [db tech showcase Tokyo 2014] D25: 今を分析する日立の「CEP」、知るなら今でしょ!  by 株式会社日立製作所 村上順一 [db tech showcase Tokyo 2014] D25: 今を分析する日立の「CEP」、知るなら今でしょ!  by 株式会社日立製作所 村上順一
[db tech showcase Tokyo 2014] D25: 今を分析する日立の「CEP」、知るなら今でしょ! by 株式会社日立製作所 村上順一
Insight Technology, Inc.
 
Pact言語によるセキュアなスマートコントラクト開発
Pact言語によるセキュアなスマートコントラクト開発Pact言語によるセキュアなスマートコントラクト開発
Pact言語によるセキュアなスマートコントラクト開発
Nagato Kasaki
 
IoT ALGYAN ハンズオンのソースコード解説します
IoT ALGYAN ハンズオンのソースコード解説しますIoT ALGYAN ハンズオンのソースコード解説します
IoT ALGYAN ハンズオンのソースコード解説します
Yoshitaka Seo
 
2023_freshman
2023_freshman2023_freshman
2023_freshman
TakaakiYonekura
 
「スプラトゥーン」リアルタイム画像解析ツール 「IkaLog」の裏側
「スプラトゥーン」リアルタイム画像解析ツール 「IkaLog」の裏側「スプラトゥーン」リアルタイム画像解析ツール 「IkaLog」の裏側
「スプラトゥーン」リアルタイム画像解析ツール 「IkaLog」の裏側
Takeshi HASEGAWA
 
190904FIT情報処理学会の量子コンピュータ
190904FIT情報処理学会の量子コンピュータ190904FIT情報処理学会の量子コンピュータ
190904FIT情報処理学会の量子コンピュータ
Yuichiro MInato
 
Portable RT-Middleware environment on a USB memory for the robot programing ...
Portable RT-Middleware environment on a USB memory  for the robot programing ...Portable RT-Middleware environment on a USB memory  for the robot programing ...
Portable RT-Middleware environment on a USB memory for the robot programing ...
s15mh218
 

Similar to Show and tell takmin (20)

ADVENTUREの他のモジュール・関連プロジェクトの紹介
ADVENTUREの他のモジュール・関連プロジェクトの紹介ADVENTUREの他のモジュール・関連プロジェクトの紹介
ADVENTUREの他のモジュール・関連プロジェクトの紹介
 
kagami_comput2015_1
kagami_comput2015_1kagami_comput2015_1
kagami_comput2015_1
 
SORACOM Technology Camp 2018 アドバンストラック4 | スモールスタートの次の一手は?成長できるIoTシステムの実例と回避した...
SORACOM Technology Camp 2018 アドバンストラック4 | スモールスタートの次の一手は?成長できるIoTシステムの実例と回避した...SORACOM Technology Camp 2018 アドバンストラック4 | スモールスタートの次の一手は?成長できるIoTシステムの実例と回避した...
SORACOM Technology Camp 2018 アドバンストラック4 | スモールスタートの次の一手は?成長できるIoTシステムの実例と回避した...
 
ストリーム処理とSensorBee
ストリーム処理とSensorBeeストリーム処理とSensorBee
ストリーム処理とSensorBee
 
Matrix signal controller and BrainPad overview
Matrix signal controller and BrainPad overviewMatrix signal controller and BrainPad overview
Matrix signal controller and BrainPad overview
 
kagami_comput2016_01
kagami_comput2016_01kagami_comput2016_01
kagami_comput2016_01
 
【メタサーベイ】基盤モデル / Foundation Models
【メタサーベイ】基盤モデル / Foundation Models【メタサーベイ】基盤モデル / Foundation Models
【メタサーベイ】基盤モデル / Foundation Models
 
Power BI のいろいろな活用パターン
Power BI のいろいろな活用パターンPower BI のいろいろな活用パターン
Power BI のいろいろな活用パターン
 
Iot algyan jhirono 20190111
Iot algyan jhirono 20190111Iot algyan jhirono 20190111
Iot algyan jhirono 20190111
 
0610 TECH & BRIDGE MEETING
0610 TECH & BRIDGE MEETING0610 TECH & BRIDGE MEETING
0610 TECH & BRIDGE MEETING
 
Power Automate の他では聞けない使い方 (UI flows は除く)
Power Automate の他では聞けない使い方 (UI flows は除く)Power Automate の他では聞けない使い方 (UI flows は除く)
Power Automate の他では聞けない使い方 (UI flows は除く)
 
kagamicomput201801
kagamicomput201801kagamicomput201801
kagamicomput201801
 
2014-01-28 Operation in the future
2014-01-28 Operation in the future2014-01-28 Operation in the future
2014-01-28 Operation in the future
 
[db tech showcase Tokyo 2014] D25: 今を分析する日立の「CEP」、知るなら今でしょ! by 株式会社日立製作所 村上順一
 [db tech showcase Tokyo 2014] D25: 今を分析する日立の「CEP」、知るなら今でしょ!  by 株式会社日立製作所 村上順一 [db tech showcase Tokyo 2014] D25: 今を分析する日立の「CEP」、知るなら今でしょ!  by 株式会社日立製作所 村上順一
[db tech showcase Tokyo 2014] D25: 今を分析する日立の「CEP」、知るなら今でしょ! by 株式会社日立製作所 村上順一
 
Pact言語によるセキュアなスマートコントラクト開発
Pact言語によるセキュアなスマートコントラクト開発Pact言語によるセキュアなスマートコントラクト開発
Pact言語によるセキュアなスマートコントラクト開発
 
IoT ALGYAN ハンズオンのソースコード解説します
IoT ALGYAN ハンズオンのソースコード解説しますIoT ALGYAN ハンズオンのソースコード解説します
IoT ALGYAN ハンズオンのソースコード解説します
 
2023_freshman
2023_freshman2023_freshman
2023_freshman
 
「スプラトゥーン」リアルタイム画像解析ツール 「IkaLog」の裏側
「スプラトゥーン」リアルタイム画像解析ツール 「IkaLog」の裏側「スプラトゥーン」リアルタイム画像解析ツール 「IkaLog」の裏側
「スプラトゥーン」リアルタイム画像解析ツール 「IkaLog」の裏側
 
190904FIT情報処理学会の量子コンピュータ
190904FIT情報処理学会の量子コンピュータ190904FIT情報処理学会の量子コンピュータ
190904FIT情報処理学会の量子コンピュータ
 
Portable RT-Middleware environment on a USB memory for the robot programing ...
Portable RT-Middleware environment on a USB memory  for the robot programing ...Portable RT-Middleware environment on a USB memory  for the robot programing ...
Portable RT-Middleware environment on a USB memory for the robot programing ...
 

More from Takuya Minagawa

Machine Learning Operations (MLOps): Overview, Definition, and Architecture
Machine Learning Operations (MLOps): Overview, Definition, and ArchitectureMachine Learning Operations (MLOps): Overview, Definition, and Architecture
Machine Learning Operations (MLOps): Overview, Definition, and Architecture
Takuya Minagawa
 
MobileNeRF
MobileNeRFMobileNeRF
MobileNeRF
Takuya Minagawa
 
点群SegmentationのためのTransformerサーベイ
点群SegmentationのためのTransformerサーベイ点群SegmentationのためのTransformerサーベイ
点群SegmentationのためのTransformerサーベイ
Takuya Minagawa
 
Learning to Solve Hard Minimal Problems
Learning to Solve Hard Minimal ProblemsLearning to Solve Hard Minimal Problems
Learning to Solve Hard Minimal Problems
Takuya Minagawa
 
ConditionalPointDiffusion.pdf
ConditionalPointDiffusion.pdfConditionalPointDiffusion.pdf
ConditionalPointDiffusion.pdf
Takuya Minagawa
 
楽しいコンピュータビジョンの受託仕事
楽しいコンピュータビジョンの受託仕事楽しいコンピュータビジョンの受託仕事
楽しいコンピュータビジョンの受託仕事
Takuya Minagawa
 
20210711 deepI2P
20210711 deepI2P20210711 deepI2P
20210711 deepI2P
Takuya Minagawa
 
20201010 personreid
20201010 personreid20201010 personreid
20201010 personreid
Takuya Minagawa
 
2020/07/04 BSP-Net (CVPR2020)
2020/07/04 BSP-Net (CVPR2020)2020/07/04 BSP-Net (CVPR2020)
2020/07/04 BSP-Net (CVPR2020)
Takuya Minagawa
 
20200704 bsp net
20200704 bsp net20200704 bsp net
20200704 bsp net
Takuya Minagawa
 
20190825 vins mono
20190825 vins mono20190825 vins mono
20190825 vins mono
Takuya Minagawa
 
20190706cvpr2019_3d_shape_representation
20190706cvpr2019_3d_shape_representation20190706cvpr2019_3d_shape_representation
20190706cvpr2019_3d_shape_representation
Takuya Minagawa
 
Visual slam
Visual slamVisual slam
Visual slam
Takuya Minagawa
 
20190131 lidar-camera fusion semantic segmentation survey
20190131 lidar-camera fusion semantic segmentation survey20190131 lidar-camera fusion semantic segmentation survey
20190131 lidar-camera fusion semantic segmentation survey
Takuya Minagawa
 
object detection with lidar-camera fusion: survey
object detection with lidar-camera fusion: surveyobject detection with lidar-camera fusion: survey
object detection with lidar-camera fusion: survey
Takuya Minagawa
 
車載カメラの映像から歩行者に関わる危険を予測する技術
車載カメラの映像から歩行者に関わる危険を予測する技術車載カメラの映像から歩行者に関わる危険を予測する技術
車載カメラの映像から歩行者に関わる危険を予測する技術
Takuya Minagawa
 

More from Takuya Minagawa (16)

Machine Learning Operations (MLOps): Overview, Definition, and Architecture
Machine Learning Operations (MLOps): Overview, Definition, and ArchitectureMachine Learning Operations (MLOps): Overview, Definition, and Architecture
Machine Learning Operations (MLOps): Overview, Definition, and Architecture
 
MobileNeRF
MobileNeRFMobileNeRF
MobileNeRF
 
点群SegmentationのためのTransformerサーベイ
点群SegmentationのためのTransformerサーベイ点群SegmentationのためのTransformerサーベイ
点群SegmentationのためのTransformerサーベイ
 
Learning to Solve Hard Minimal Problems
Learning to Solve Hard Minimal ProblemsLearning to Solve Hard Minimal Problems
Learning to Solve Hard Minimal Problems
 
ConditionalPointDiffusion.pdf
ConditionalPointDiffusion.pdfConditionalPointDiffusion.pdf
ConditionalPointDiffusion.pdf
 
楽しいコンピュータビジョンの受託仕事
楽しいコンピュータビジョンの受託仕事楽しいコンピュータビジョンの受託仕事
楽しいコンピュータビジョンの受託仕事
 
20210711 deepI2P
20210711 deepI2P20210711 deepI2P
20210711 deepI2P
 
20201010 personreid
20201010 personreid20201010 personreid
20201010 personreid
 
2020/07/04 BSP-Net (CVPR2020)
2020/07/04 BSP-Net (CVPR2020)2020/07/04 BSP-Net (CVPR2020)
2020/07/04 BSP-Net (CVPR2020)
 
20200704 bsp net
20200704 bsp net20200704 bsp net
20200704 bsp net
 
20190825 vins mono
20190825 vins mono20190825 vins mono
20190825 vins mono
 
20190706cvpr2019_3d_shape_representation
20190706cvpr2019_3d_shape_representation20190706cvpr2019_3d_shape_representation
20190706cvpr2019_3d_shape_representation
 
Visual slam
Visual slamVisual slam
Visual slam
 
20190131 lidar-camera fusion semantic segmentation survey
20190131 lidar-camera fusion semantic segmentation survey20190131 lidar-camera fusion semantic segmentation survey
20190131 lidar-camera fusion semantic segmentation survey
 
object detection with lidar-camera fusion: survey
object detection with lidar-camera fusion: surveyobject detection with lidar-camera fusion: survey
object detection with lidar-camera fusion: survey
 
車載カメラの映像から歩行者に関わる危険を予測する技術
車載カメラの映像から歩行者に関わる危険を予測する技術車載カメラの映像から歩行者に関わる危険を予測する技術
車載カメラの映像から歩行者に関わる危険を予測する技術
 

Recently uploaded

This is the company presentation material of RIZAP Technologies, Inc.
This is the company presentation material of RIZAP Technologies, Inc.This is the company presentation material of RIZAP Technologies, Inc.
This is the company presentation material of RIZAP Technologies, Inc.
chiefujita1
 
ReonHata_便利の副作用に気づかせるための発想支援手法の評価---行為の増減の提示による気づきへの影響---
ReonHata_便利の副作用に気づかせるための発想支援手法の評価---行為の増減の提示による気づきへの影響---ReonHata_便利の副作用に気づかせるための発想支援手法の評価---行為の増減の提示による気づきへの影響---
ReonHata_便利の副作用に気づかせるための発想支援手法の評価---行為の増減の提示による気づきへの影響---
Matsushita Laboratory
 
CS集会#13_なるほどわからん通信技術 発表資料
CS集会#13_なるほどわからん通信技術 発表資料CS集会#13_なるほどわからん通信技術 発表資料
CS集会#13_なるほどわからん通信技術 発表資料
Yuuitirou528 default
 
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
harmonylab
 
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
Matsushita Laboratory
 
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdfFIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
FIDO Alliance
 
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdfFIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
FIDO Alliance
 
JSAI_類似画像マッチングによる器への印象付与手法の妥当性検証_ver.3_高橋りさ
JSAI_類似画像マッチングによる器への印象付与手法の妥当性検証_ver.3_高橋りさJSAI_類似画像マッチングによる器への印象付与手法の妥当性検証_ver.3_高橋りさ
JSAI_類似画像マッチングによる器への印象付与手法の妥当性検証_ver.3_高橋りさ
0207sukipio
 
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdfFIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
FIDO Alliance
 
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアルLoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
CRI Japan, Inc.
 
FIDO Alliance Osaka Seminar: CloudGate.pdf
FIDO Alliance Osaka Seminar: CloudGate.pdfFIDO Alliance Osaka Seminar: CloudGate.pdf
FIDO Alliance Osaka Seminar: CloudGate.pdf
FIDO Alliance
 
FIDO Alliance Osaka Seminar: Welcome Slides.pdf
FIDO Alliance Osaka Seminar: Welcome Slides.pdfFIDO Alliance Osaka Seminar: Welcome Slides.pdf
FIDO Alliance Osaka Seminar: Welcome Slides.pdf
FIDO Alliance
 
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
Toru Tamaki
 
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
Fukuoka Institute of Technology
 

Recently uploaded (14)

This is the company presentation material of RIZAP Technologies, Inc.
This is the company presentation material of RIZAP Technologies, Inc.This is the company presentation material of RIZAP Technologies, Inc.
This is the company presentation material of RIZAP Technologies, Inc.
 
ReonHata_便利の副作用に気づかせるための発想支援手法の評価---行為の増減の提示による気づきへの影響---
ReonHata_便利の副作用に気づかせるための発想支援手法の評価---行為の増減の提示による気づきへの影響---ReonHata_便利の副作用に気づかせるための発想支援手法の評価---行為の増減の提示による気づきへの影響---
ReonHata_便利の副作用に気づかせるための発想支援手法の評価---行為の増減の提示による気づきへの影響---
 
CS集会#13_なるほどわからん通信技術 発表資料
CS集会#13_なるほどわからん通信技術 発表資料CS集会#13_なるほどわからん通信技術 発表資料
CS集会#13_なるほどわからん通信技術 発表資料
 
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
 
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
 
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdfFIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
 
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdfFIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
 
JSAI_類似画像マッチングによる器への印象付与手法の妥当性検証_ver.3_高橋りさ
JSAI_類似画像マッチングによる器への印象付与手法の妥当性検証_ver.3_高橋りさJSAI_類似画像マッチングによる器への印象付与手法の妥当性検証_ver.3_高橋りさ
JSAI_類似画像マッチングによる器への印象付与手法の妥当性検証_ver.3_高橋りさ
 
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdfFIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
 
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアルLoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
 
FIDO Alliance Osaka Seminar: CloudGate.pdf
FIDO Alliance Osaka Seminar: CloudGate.pdfFIDO Alliance Osaka Seminar: CloudGate.pdf
FIDO Alliance Osaka Seminar: CloudGate.pdf
 
FIDO Alliance Osaka Seminar: Welcome Slides.pdf
FIDO Alliance Osaka Seminar: Welcome Slides.pdfFIDO Alliance Osaka Seminar: Welcome Slides.pdf
FIDO Alliance Osaka Seminar: Welcome Slides.pdf
 
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
 
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
 

Show and tell takmin