Submit Search
Upload
Globally and Locally Consistent Image Completion
•
Download as PPTX, PDF
•
0 likes
•
7,848 views
H
harmonylab
Follow
Generative Adversarial Networkを使った画像補完手法.
Read less
Read more
Technology
Report
Share
Report
Share
1 of 35
Download now
Recommended
【DL輪読会】An Image is Worth One Word: Personalizing Text-to-Image Generation usi...
【DL輪読会】An Image is Worth One Word: Personalizing Text-to-Image Generation usi...
Deep Learning JP
【DL輪読会】How Much Can CLIP Benefit Vision-and-Language Tasks?
【DL輪読会】How Much Can CLIP Benefit Vision-and-Language Tasks?
Deep Learning JP
畳み込みLstm
畳み込みLstm
tak9029
backbone としての timm 入門
backbone としての timm 入門
Takuji Tahara
動作認識の最前線:手法,タスク,データセット
動作認識の最前線:手法,タスク,データセット
Toru Tamaki
Semi supervised, weakly-supervised, unsupervised, and active learning
Semi supervised, weakly-supervised, unsupervised, and active learning
Yusuke Uchida
[DL輪読会]DropBlock: A regularization method for convolutional networks
[DL輪読会]DropBlock: A regularization method for convolutional networks
Deep Learning JP
ConvNetの歴史とResNet亜種、ベストプラクティス
ConvNetの歴史とResNet亜種、ベストプラクティス
Yusuke Uchida
Recommended
【DL輪読会】An Image is Worth One Word: Personalizing Text-to-Image Generation usi...
【DL輪読会】An Image is Worth One Word: Personalizing Text-to-Image Generation usi...
Deep Learning JP
【DL輪読会】How Much Can CLIP Benefit Vision-and-Language Tasks?
【DL輪読会】How Much Can CLIP Benefit Vision-and-Language Tasks?
Deep Learning JP
畳み込みLstm
畳み込みLstm
tak9029
backbone としての timm 入門
backbone としての timm 入門
Takuji Tahara
動作認識の最前線:手法,タスク,データセット
動作認識の最前線:手法,タスク,データセット
Toru Tamaki
Semi supervised, weakly-supervised, unsupervised, and active learning
Semi supervised, weakly-supervised, unsupervised, and active learning
Yusuke Uchida
[DL輪読会]DropBlock: A regularization method for convolutional networks
[DL輪読会]DropBlock: A regularization method for convolutional networks
Deep Learning JP
ConvNetの歴史とResNet亜種、ベストプラクティス
ConvNetの歴史とResNet亜種、ベストプラクティス
Yusuke Uchida
画像局所特徴量と特定物体認識 - SIFTと最近のアプローチ -
画像局所特徴量と特定物体認識 - SIFTと最近のアプローチ -
MPRG_Chubu_University
0から理解するニューラルネットアーキテクチャサーチ(NAS)
0から理解するニューラルネットアーキテクチャサーチ(NAS)
MasanoriSuganuma
SSII2022 [OS3-03] スケーラブルなロボット学習システムに向けて
SSII2022 [OS3-03] スケーラブルなロボット学習システムに向けて
SSII
[DL輪読会]Dense Captioning分野のまとめ
[DL輪読会]Dense Captioning分野のまとめ
Deep Learning JP
[DL輪読会]SlowFast Networks for Video Recognition
[DL輪読会]SlowFast Networks for Video Recognition
Deep Learning JP
関西CVPRML勉強会2018 岡本大和 Unsupervised Feature Learning Via Non-Parametric Instanc...
関西CVPRML勉強会2018 岡本大和 Unsupervised Feature Learning Via Non-Parametric Instanc...
Yamato OKAMOTO
SPACE: Unsupervised Object-Oriented Scene Representation via Spatial Attentio...
SPACE: Unsupervised Object-Oriented Scene Representation via Spatial Attentio...
Hideki Tsunashima
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向
SSII
【メタサーベイ】Video Transformer
【メタサーベイ】Video Transformer
cvpaper. challenge
[DL輪読会]“Spatial Attention Point Network for Deep-learning-based Robust Autono...
[DL輪読会]“Spatial Attention Point Network for Deep-learning-based Robust Autono...
Deep Learning JP
【DL輪読会】GET3D: A Generative Model of High Quality 3D Textured Shapes Learned f...
【DL輪読会】GET3D: A Generative Model of High Quality 3D Textured Shapes Learned f...
Deep Learning JP
【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features
【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features
ARISE analytics
物体検知(Meta Study Group 発表資料)
物体検知(Meta Study Group 発表資料)
cvpaper. challenge
【DL輪読会】Semi-Parametric Neural Image Synthesis
【DL輪読会】Semi-Parametric Neural Image Synthesis
Deep Learning JP
BERT+XLNet+RoBERTa
BERT+XLNet+RoBERTa
禎晃 山崎
【DL輪読会】DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Dri...
【DL輪読会】DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Dri...
Deep Learning JP
[DL輪読会]“SimPLe”,“Improved Dynamics Model”,“PlaNet” 近年のVAEベース系列モデルの進展とそのモデルベース...
[DL輪読会]“SimPLe”,“Improved Dynamics Model”,“PlaNet” 近年のVAEベース系列モデルの進展とそのモデルベース...
Deep Learning JP
物体検出の歴史(R-CNNからSSD・YOLOまで)
物体検出の歴史(R-CNNからSSD・YOLOまで)
HironoriKanazawa
動画認識サーベイv1(メタサーベイ )
動画認識サーベイv1(メタサーベイ )
cvpaper. challenge
深層学習によるHuman Pose Estimationの基礎
深層学習によるHuman Pose Estimationの基礎
Takumi Ohkuma
Deep Forest: Towards An Alternative to Deep Neural Networks
Deep Forest: Towards An Alternative to Deep Neural Networks
harmonylab
Colorful image colorization
Colorful image colorization
harmonylab
More Related Content
What's hot
画像局所特徴量と特定物体認識 - SIFTと最近のアプローチ -
画像局所特徴量と特定物体認識 - SIFTと最近のアプローチ -
MPRG_Chubu_University
0から理解するニューラルネットアーキテクチャサーチ(NAS)
0から理解するニューラルネットアーキテクチャサーチ(NAS)
MasanoriSuganuma
SSII2022 [OS3-03] スケーラブルなロボット学習システムに向けて
SSII2022 [OS3-03] スケーラブルなロボット学習システムに向けて
SSII
[DL輪読会]Dense Captioning分野のまとめ
[DL輪読会]Dense Captioning分野のまとめ
Deep Learning JP
[DL輪読会]SlowFast Networks for Video Recognition
[DL輪読会]SlowFast Networks for Video Recognition
Deep Learning JP
関西CVPRML勉強会2018 岡本大和 Unsupervised Feature Learning Via Non-Parametric Instanc...
関西CVPRML勉強会2018 岡本大和 Unsupervised Feature Learning Via Non-Parametric Instanc...
Yamato OKAMOTO
SPACE: Unsupervised Object-Oriented Scene Representation via Spatial Attentio...
SPACE: Unsupervised Object-Oriented Scene Representation via Spatial Attentio...
Hideki Tsunashima
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向
SSII
【メタサーベイ】Video Transformer
【メタサーベイ】Video Transformer
cvpaper. challenge
[DL輪読会]“Spatial Attention Point Network for Deep-learning-based Robust Autono...
[DL輪読会]“Spatial Attention Point Network for Deep-learning-based Robust Autono...
Deep Learning JP
【DL輪読会】GET3D: A Generative Model of High Quality 3D Textured Shapes Learned f...
【DL輪読会】GET3D: A Generative Model of High Quality 3D Textured Shapes Learned f...
Deep Learning JP
【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features
【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features
ARISE analytics
物体検知(Meta Study Group 発表資料)
物体検知(Meta Study Group 発表資料)
cvpaper. challenge
【DL輪読会】Semi-Parametric Neural Image Synthesis
【DL輪読会】Semi-Parametric Neural Image Synthesis
Deep Learning JP
BERT+XLNet+RoBERTa
BERT+XLNet+RoBERTa
禎晃 山崎
【DL輪読会】DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Dri...
【DL輪読会】DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Dri...
Deep Learning JP
[DL輪読会]“SimPLe”,“Improved Dynamics Model”,“PlaNet” 近年のVAEベース系列モデルの進展とそのモデルベース...
[DL輪読会]“SimPLe”,“Improved Dynamics Model”,“PlaNet” 近年のVAEベース系列モデルの進展とそのモデルベース...
Deep Learning JP
物体検出の歴史(R-CNNからSSD・YOLOまで)
物体検出の歴史(R-CNNからSSD・YOLOまで)
HironoriKanazawa
動画認識サーベイv1(メタサーベイ )
動画認識サーベイv1(メタサーベイ )
cvpaper. challenge
深層学習によるHuman Pose Estimationの基礎
深層学習によるHuman Pose Estimationの基礎
Takumi Ohkuma
What's hot
(20)
画像局所特徴量と特定物体認識 - SIFTと最近のアプローチ -
画像局所特徴量と特定物体認識 - SIFTと最近のアプローチ -
0から理解するニューラルネットアーキテクチャサーチ(NAS)
0から理解するニューラルネットアーキテクチャサーチ(NAS)
SSII2022 [OS3-03] スケーラブルなロボット学習システムに向けて
SSII2022 [OS3-03] スケーラブルなロボット学習システムに向けて
[DL輪読会]Dense Captioning分野のまとめ
[DL輪読会]Dense Captioning分野のまとめ
[DL輪読会]SlowFast Networks for Video Recognition
[DL輪読会]SlowFast Networks for Video Recognition
関西CVPRML勉強会2018 岡本大和 Unsupervised Feature Learning Via Non-Parametric Instanc...
関西CVPRML勉強会2018 岡本大和 Unsupervised Feature Learning Via Non-Parametric Instanc...
SPACE: Unsupervised Object-Oriented Scene Representation via Spatial Attentio...
SPACE: Unsupervised Object-Oriented Scene Representation via Spatial Attentio...
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向
【メタサーベイ】Video Transformer
【メタサーベイ】Video Transformer
[DL輪読会]“Spatial Attention Point Network for Deep-learning-based Robust Autono...
[DL輪読会]“Spatial Attention Point Network for Deep-learning-based Robust Autono...
【DL輪読会】GET3D: A Generative Model of High Quality 3D Textured Shapes Learned f...
【DL輪読会】GET3D: A Generative Model of High Quality 3D Textured Shapes Learned f...
【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features
【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features
物体検知(Meta Study Group 発表資料)
物体検知(Meta Study Group 発表資料)
【DL輪読会】Semi-Parametric Neural Image Synthesis
【DL輪読会】Semi-Parametric Neural Image Synthesis
BERT+XLNet+RoBERTa
BERT+XLNet+RoBERTa
【DL輪読会】DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Dri...
【DL輪読会】DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Dri...
[DL輪読会]“SimPLe”,“Improved Dynamics Model”,“PlaNet” 近年のVAEベース系列モデルの進展とそのモデルベース...
[DL輪読会]“SimPLe”,“Improved Dynamics Model”,“PlaNet” 近年のVAEベース系列モデルの進展とそのモデルベース...
物体検出の歴史(R-CNNからSSD・YOLOまで)
物体検出の歴史(R-CNNからSSD・YOLOまで)
動画認識サーベイv1(メタサーベイ )
動画認識サーベイv1(メタサーベイ )
深層学習によるHuman Pose Estimationの基礎
深層学習によるHuman Pose Estimationの基礎
Viewers also liked
Deep Forest: Towards An Alternative to Deep Neural Networks
Deep Forest: Towards An Alternative to Deep Neural Networks
harmonylab
Colorful image colorization
Colorful image colorization
harmonylab
勉強会用スライド
勉強会用スライド
harmonylab
DLゼミ20170522
DLゼミ20170522
harmonylab
Generating Videos with Scene Dynamics
Generating Videos with Scene Dynamics
harmonylab
Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Network
Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Network
harmonylab
AI勉強会用スライド
AI勉強会用スライド
harmonylab
Deeply-Recursive Convolutional Network for Image Super-Resolution
Deeply-Recursive Convolutional Network for Image Super-Resolution
harmonylab
Deep voice
Deep voice
harmonylab
Mobilenet
Mobilenet
harmonylab
勉強会用スライド
勉強会用スライド
harmonylab
Ai勉強会20170127
Ai勉強会20170127
harmonylab
DeepLoco
DeepLoco
harmonylab
7月10日(月)dl
7月10日(月)dl
harmonylab
A simple neural network mnodule for relation reasoning
A simple neural network mnodule for relation reasoning
harmonylab
Densely Connected Convolutional Networks
Densely Connected Convolutional Networks
harmonylab
A3C解説
A3C解説
harmonylab
【2016.04】cvpaper.challenge2016
【2016.04】cvpaper.challenge2016
cvpaper. challenge
【2016.01】(2/3)cvpaper.challenge2016
【2016.01】(2/3)cvpaper.challenge2016
cvpaper. challenge
【2016.01】(3/3)cvpaper.challenge2016
【2016.01】(3/3)cvpaper.challenge2016
cvpaper. challenge
Viewers also liked
(20)
Deep Forest: Towards An Alternative to Deep Neural Networks
Deep Forest: Towards An Alternative to Deep Neural Networks
Colorful image colorization
Colorful image colorization
勉強会用スライド
勉強会用スライド
DLゼミ20170522
DLゼミ20170522
Generating Videos with Scene Dynamics
Generating Videos with Scene Dynamics
Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Network
Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Network
AI勉強会用スライド
AI勉強会用スライド
Deeply-Recursive Convolutional Network for Image Super-Resolution
Deeply-Recursive Convolutional Network for Image Super-Resolution
Deep voice
Deep voice
Mobilenet
Mobilenet
勉強会用スライド
勉強会用スライド
Ai勉強会20170127
Ai勉強会20170127
DeepLoco
DeepLoco
7月10日(月)dl
7月10日(月)dl
A simple neural network mnodule for relation reasoning
A simple neural network mnodule for relation reasoning
Densely Connected Convolutional Networks
Densely Connected Convolutional Networks
A3C解説
A3C解説
【2016.04】cvpaper.challenge2016
【2016.04】cvpaper.challenge2016
【2016.01】(2/3)cvpaper.challenge2016
【2016.01】(2/3)cvpaper.challenge2016
【2016.01】(3/3)cvpaper.challenge2016
【2016.01】(3/3)cvpaper.challenge2016
Similar to Globally and Locally Consistent Image Completion
Unity道場08「絵づくりの基礎」ライティング虎の巻
Unity道場08「絵づくりの基礎」ライティング虎の巻
小林 信行
Unity道場08 Unityとアセットツールで学ぶ「絵づくり」の基礎 ライティング虎の巻
Unity道場08 Unityとアセットツールで学ぶ「絵づくり」の基礎 ライティング虎の巻
小林 信行
2012-03-08 MSS研究会
2012-03-08 MSS研究会
Kimikazu Kato
SSII2022 [TS3] コンテンツ制作を支援する機械学習技術〜 イラストレーションやデザインの基礎から最新鋭の技術まで 〜
SSII2022 [TS3] コンテンツ制作を支援する機械学習技術〜 イラストレーションやデザインの基礎から最新鋭の技術まで 〜
SSII
【DL輪読会】Drag Your GAN: Interactive Point-based Manipulation on the Generative ...
【DL輪読会】Drag Your GAN: Interactive Point-based Manipulation on the Generative ...
Deep Learning JP
女子美術大学メディアアート演習ⅡB 2012 Spring 第10回 2/2
女子美術大学メディアアート演習ⅡB 2012 Spring 第10回 2/2
Satoru Tokuhisa
CEDEC 2007 ゲーム開発者向け最新技術論文の解説・実装講座
CEDEC 2007 ゲーム開発者向け最新技術論文の解説・実装講座
Silicon Studio Corporation
画像処理の高性能計算
画像処理の高性能計算
Norishige Fukushima
ICCV2019読み会「Learning Meshes for Dense Visual SLAM」
ICCV2019読み会「Learning Meshes for Dense Visual SLAM」
Sho Kagami
Or seminar2011final
Or seminar2011final
Mikio Kubo
Kaggle参加報告: Champs Predicting Molecular Properties
Kaggle参加報告: Champs Predicting Molecular Properties
Kazuki Fujikawa
Image net classification with Deep Convolutional Neural Networks
Image net classification with Deep Convolutional Neural Networks
Shingo Horiuchi
(文献紹介)深層学習による動被写体ロバストなカメラの動き推定
(文献紹介)深層学習による動被写体ロバストなカメラの動き推定
Morpho, Inc.
Auto encoder
Auto encoder
kentaro-fujita
(文献紹介)エッジ保存フィルタ:Side Window Filter, Curvature Filter
(文献紹介)エッジ保存フィルタ:Side Window Filter, Curvature Filter
Morpho, Inc.
教師なしオブジェクトマッチング(第2回ステアラボ人工知能セミナー)
教師なしオブジェクトマッチング(第2回ステアラボ人工知能セミナー)
STAIR Lab, Chiba Institute of Technology
[DL輪読会]Differentiable Mapping Networks: Learning Structured Map Representatio...
[DL輪読会]Differentiable Mapping Networks: Learning Structured Map Representatio...
Deep Learning JP
自然言語処理に適した ニューラルネットのフレームワーク - - - DyNet - - -
自然言語処理に適した ニューラルネットのフレームワーク - - - DyNet - - -
Ogushi Masaya
[DL輪読会]Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
[DL輪読会]Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
Deep Learning JP
Unity名古屋セミナー [Shadowgun]
Unity名古屋セミナー [Shadowgun]
MakotoItoh
Similar to Globally and Locally Consistent Image Completion
(20)
Unity道場08「絵づくりの基礎」ライティング虎の巻
Unity道場08「絵づくりの基礎」ライティング虎の巻
Unity道場08 Unityとアセットツールで学ぶ「絵づくり」の基礎 ライティング虎の巻
Unity道場08 Unityとアセットツールで学ぶ「絵づくり」の基礎 ライティング虎の巻
2012-03-08 MSS研究会
2012-03-08 MSS研究会
SSII2022 [TS3] コンテンツ制作を支援する機械学習技術〜 イラストレーションやデザインの基礎から最新鋭の技術まで 〜
SSII2022 [TS3] コンテンツ制作を支援する機械学習技術〜 イラストレーションやデザインの基礎から最新鋭の技術まで 〜
【DL輪読会】Drag Your GAN: Interactive Point-based Manipulation on the Generative ...
【DL輪読会】Drag Your GAN: Interactive Point-based Manipulation on the Generative ...
女子美術大学メディアアート演習ⅡB 2012 Spring 第10回 2/2
女子美術大学メディアアート演習ⅡB 2012 Spring 第10回 2/2
CEDEC 2007 ゲーム開発者向け最新技術論文の解説・実装講座
CEDEC 2007 ゲーム開発者向け最新技術論文の解説・実装講座
画像処理の高性能計算
画像処理の高性能計算
ICCV2019読み会「Learning Meshes for Dense Visual SLAM」
ICCV2019読み会「Learning Meshes for Dense Visual SLAM」
Or seminar2011final
Or seminar2011final
Kaggle参加報告: Champs Predicting Molecular Properties
Kaggle参加報告: Champs Predicting Molecular Properties
Image net classification with Deep Convolutional Neural Networks
Image net classification with Deep Convolutional Neural Networks
(文献紹介)深層学習による動被写体ロバストなカメラの動き推定
(文献紹介)深層学習による動被写体ロバストなカメラの動き推定
Auto encoder
Auto encoder
(文献紹介)エッジ保存フィルタ:Side Window Filter, Curvature Filter
(文献紹介)エッジ保存フィルタ:Side Window Filter, Curvature Filter
教師なしオブジェクトマッチング(第2回ステアラボ人工知能セミナー)
教師なしオブジェクトマッチング(第2回ステアラボ人工知能セミナー)
[DL輪読会]Differentiable Mapping Networks: Learning Structured Map Representatio...
[DL輪読会]Differentiable Mapping Networks: Learning Structured Map Representatio...
自然言語処理に適した ニューラルネットのフレームワーク - - - DyNet - - -
自然言語処理に適した ニューラルネットのフレームワーク - - - DyNet - - -
[DL輪読会]Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
[DL輪読会]Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
Unity名古屋セミナー [Shadowgun]
Unity名古屋セミナー [Shadowgun]
More from harmonylab
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究 千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究 千坂知也
harmonylab
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
harmonylab
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
harmonylab
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
harmonylab
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
harmonylab
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
harmonylab
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
harmonylab
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
harmonylab
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
harmonylab
Voyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language Models
harmonylab
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
harmonylab
ReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language Models
harmonylab
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
harmonylab
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
harmonylab
灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究
harmonylab
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
harmonylab
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
harmonylab
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
harmonylab
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
harmonylab
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
harmonylab
More from harmonylab
(20)
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究 千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究 千坂知也
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
Voyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language Models
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
ReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language Models
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
Recently uploaded
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
sugiuralab
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
akihisamiyanaga1
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
FumieNakayama
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
UEHARA, Tetsutaro
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成
Hiroshi Tomioka
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
FumieNakayama
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
Yuki Kikuchi
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
Hiroki Ichikura
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
博三 太田
Recently uploaded
(9)
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
Globally and Locally Consistent Image Completion
1.
Globally and Locally Consistent
Image Completion SATOSHI IIZUKA , EDGAR SIMO-SERRA, HIROSHI ISHIKAWA Waseda University SIGGRAPH 2017 accepted http://hi.cs.waseda.ac.jp/~iizuka/projects/completion/data/completion_sig2017.pdf
2.
論文情報 • SIGGRAPH:主にコンピュータグラフィックの技術や研究を発表する学会 • 何万人もの専門家が参加する世界有数のカンファレンス •
First Author: 飯塚里志(早稲田大学 理工学術院総合研究所) • DLを用いて、画像補完や自動着色などの研究を行なっている。 - AI勉強会 - 2 HP:http://hi.cs.waseda.ac.jp/~iizuka/
3.
概要 • 局所的にも大域的にも整合性のとれた画像を生成する画像補完 (inpainting)
手 法の提案 • GAN (Generative Adversarial Networks) をベースとした補完画像生成 • 2つのDiscriminatorによる局所性と大域性の実現 - AI勉強会 - 3
4.
関連研究 • 提案手法と関連研究との比較 - AI勉強会
- 4 パッチベース Context encoder 提案手法 Image size 任意 固定 任意 Local Consistency ◯ × ◯ Semantics × ◯ ◯ Novel objects × ◯ ◯ • Image size • 画像サイズ • Local Consistency • 局所的な一貫性があるか • Semantics • 風景の意味を反映しているか • Novel objects • 新たなオブジェクトを生成できるか パッチベース,Context encoder, それぞれの欠点を克服した
5.
関連研究 • パッチベース手法 • Barnes
et al. 2009; Darabi et al. 2012; Huang et al. 2014; Simakov et al. 2008; Wexler et al. 2007 • 欠損領域以外から類似度の高いパッチをコピー.これを繰り返す. - AI勉強会 - 5 パッチ (小さな矩形領域) 補完したい画像 欠損領域(ホール)
6.
関連研究 • パッチベース手法 • Barnes
et al. 2009; Darabi et al. 2012; Huang et al. 2014; Simakov et al. 2008; Wexler et al. 2007 • 欠損領域以外から類似度の高いパッチをコピー.これを繰り返す. - AI勉強会 - 6 パッチ (小さな矩形領域) 補完したい画像 欠損領域(ホール)
7.
関連研究 • パッチベース手法 • 利点 •
任意のサイズと欠損領域に対して補完を行える • 欠点 • 局所的にはよくできているように見えるものの,風景の意味を反映させていない • ex) 建物の部分か,空の部分か,など • コピーしているだけなので,新たなオブジェクトは生成できない - AI勉強会 - 7
8.
関連研究 • Context Encoders •
Context Encoders: Feature Learning by Inpainting • Pathak et al. 2016, CVPR2016 • AutoEncoderとGANを用いた画像補完 - AI勉強会 - 8
9.
関連研究 • Context Encoders •
AutoEncoderによる補完画像生成 - AI勉強会 - 9 欠損画像 補完画像 本物の画像 AlexNetをベースにした AutoEncoder ピクセルごとの平均二乗誤差 を誤差関数とする 問題点: 単純なL2やL1誤差では画像がぼやける
10.
関連研究 • Context Encoders •
GANの導入 - AI勉強会 - 10 欠損画像 補完画像 本物の画像 AlexNetをベースにした AutoEncoder ピクセルごとの平均二乗誤差 Generator Discriminator 本物の画像である確率 GANの誤差関数を組み合わせることで, 鮮明な画像を生成可能に
11.
関連研究 • Context Encoders •
L2 Loss • 画像 𝑥 ,エンコーダ 𝐹 ,二値マスク 𝑀 , • 𝐿 𝑟𝑒𝑐 𝑥 = 𝑀 (𝑥 − 𝐹 ( 1 − 𝑀 𝑥)) 2 (1) • は要素ごとの積 • 一般的なGANの誤差関数 • Generator 𝐺 ,Discriminator 𝐷 , 画像の分布 𝒳,ノイズ 𝑧 ,ノイズの分布 𝒵 • min 𝐺 max 𝐷 Ε 𝑥∈𝒳 log 𝐷 𝑥 + Ε 𝑧∈𝒵[log 1 − 𝐷 𝐺 𝑧 ] (2) • Adversarial Loss • 𝐿 𝑎𝑑𝑣 = max 𝐷 Ε 𝑥∈𝒳 log 𝐷 𝑥 + log 1 − 𝐷( 𝐹 ( 1 − 𝑀 𝑥 )) (3) • 最終的な誤差関数 • 𝐿 = 𝜆 𝑟𝑒𝑐 𝐿 𝑟𝑒𝑐 + 𝐿 𝑎𝑑𝑣 𝜆 𝑎𝑑𝑣 (4) - AI勉強会 - 11
12.
関連研究 • Context Encoders •
利点 • 新たなオブジェクトの生成 • 欠点 • 画像サイズとマスクが固定 • 周辺領域との連続性が考慮されていないため,不自然な画像になる可能性がある - AI勉強会 - 12
13.
提案手法 • Globally and
Locally Consistent Image Completion (GLCIC) • Context Encoder をベースとした研究 • Context Encoderの欠点である,周辺領域との連続性を反映させるために, • 拡張畳み込み層を使った,補完ネットワークの構築 • 局所識別ネットワークの導入 - AI勉強会 - 13
14.
拡張畳み込み層 • 拡張畳み込み層 (dilated
convolution layers [Yu and Koltun 2016]) • 各層が入力として使用できる領域を広げる • なおかつパラメータを増やさない • 入力チャネル数 C,出力チャネル数C’とすると, • 𝜎 活性化関数 • x 𝑢,𝑣 入力.C次元ベクトル • 𝑦𝑢,𝑣 出力.C’次元ベクトル • 𝑊𝑠,𝑡 重み.C x C’行列. • 𝑘 𝑤, 𝑘ℎ カーネルの幅,高さ (奇数) • 𝑏 バイアス. • 𝜂 膨張係数 (𝜂 = 1 で一般的な畳み込み層になる.ここでは𝜂 > 1) • 𝑦𝑢,𝑣 = 𝜎 𝑏 + 𝑖=−𝑘ℎ ′ 𝑘ℎ ′ 𝑗=−𝑘 𝑤 ′ 𝑘 𝑤 ′ 𝑊 𝑘ℎ ′ +𝑖,𝑘 𝑤 ′ +𝑗 𝑥 𝑢+𝜂𝑖,𝑣+𝜂𝑗 (5) • 𝑘ℎ ′ = 𝑘ℎ−1 2 ,𝑘 𝑤 ′ = 𝑘 𝑤−1 2 - AI勉強会 - 14
15.
補完ネットワーク 1. マスクを掛けた画像を入力,元の次元に復元 (AutoEncoder) 2.
マスクを掛けた以外の領域を元の画像で上書き • 低解像度の層で拡張畳み込み層を用いることで,大域的な特徴を獲得 - AI勉強会 - 15
16.
補完ネットワーク • 欠損領域 (Hole)が大きいほど,補完するピクセルを計算するために参照する 領域も広い必要がある •
提案モデルでは307x307の入力画像に対し,欠損領域は99x99以内まで - AI勉強会 - 16
17.
大域識別ネットワークと局所識別ネットワーク • 大域識別ネットワーク • 補完画像全体を入力 •
局所識別ネットワーク • 補完された領域を中心とした,128 x 128の画像を入力 • 学習の際は,ランダムな位置とする - AI勉強会 - 17 • Concatenation 層 • それぞれの出力 1024次元ベクトルを 結合した2048次元ベクトルを入力 • 1つの値を出力 • sigmoid関数で [0, 1]に
18.
誤差関数 • C 補完ネットワーク •
𝛼 重み • min 𝐺 max 𝐷 Ε[ 𝐿 𝑥, 𝑀𝑐 + log 𝐷 𝑥, 𝑀 𝑑 + 𝛼 log(1 − 𝐷 𝐶 𝑥, 𝑀𝑐 , 𝑀𝑐 ) ] (6) • Context Encoders との違い • Adversarial Lossで補完画像を入力とした際に重みを掛けている - AI勉強会 - 18
19.
学習の流れ • 1つのミニバッチによる学習を1回として,現在の繰り返し回数をtとする • t
< TC • L2 Loss のみを使い補完ネットワークを最適化 • TC < t < TC + TD • 識別ネットワークのみを最適化 • t > TC + TD • 補完ネットワークと識別ネットワークの両方を最適化 • t = Ttrain • 終了 • TC = 90,000,TD = 10,000,Ttrain = 500,000,ミニバッチサイズ: 96 • 最適化手法: AdaDelta - AI勉強会 - 19
20.
データセット • Places2 (http://places2.csail.mit.edu/) •
400カテゴリ、1000万枚以上の画像セット • 学習データ8097967(800万枚)使用 • 前処理 • 入力画像を短い方の辺が [256, 384]ピクセルになるようにリサイズ • 補完領域マスクは、[96, 128]ピクセルの範囲にランダムな穴(99x99ピクセル以下の サイズ)を生成 • 補完領域は学習データの平均ピクセル値で埋める • 後処理 • 生成された領域は、周辺の領域と色に微妙な違いがある可能性がある • fast marching method [Telea 2004] - AI勉強会 - 20
21.
実験結果 - AI勉強会 -
21 周辺領域との整合性がとれている ex) 壁や,机などが完成している
22.
実験結果 他の手法より優れている 例 -
AI勉強会 - 22
23.
実験結果 他の手法と変わらない例 - AI勉強会
- 23
24.
実験結果 他の手法より劣っている 例 -
AI勉強会 - 24
25.
実験結果 提案手法の誤差関数の有用性 - AI勉強会
- 25
26.
実験結果 後処理の効果 - AI勉強会
- 26
27.
実験結果 学習に使用するデータセットによる違い - AI勉強会
- 27 • ImageNet: 1万枚 • Places2: 8万枚 • ほとんど同じが,Places2の方が多様性があり良い結果
28.
実験結果 物体除去 - AI勉強会
- 28
29.
実験結果 顔画像の補完 - AI勉強会
- 29 • 顔画像を使って FineTuning • CelebFaces Attributes Dataset (CelebA) • lCMP Facade Dataset
30.
実験結果 顔画像の補完 - AI勉強会
- 30
31.
実験結果 顔画像の補完 - AI勉強会
- 31 FineTuning 後 FineTuning パッチベース 入力
32.
実験結果 建物の窓の補完 - AI勉強会
- 32
33.
実験結果 失敗例 - AI勉強会
- 33
34.
実験結果 画像の自然さ • CelebA
データセット (顔画像) • 10人のユーザが画像の自然さを評価 • 補完画像か自然な画像かを推測 • 画像はランダムに表示 - AI勉強会 - 34
35.
まとめ • 局所的にも大域的にも整合性のとれた画像を生成する画像補完手法の提案 • 従来同時に達成できなかった, •
任意の画像サイズ,補完領域 • 周辺領域との整合性 • 新しいオブジェクトの生成 これら全てを見たした画像補完の実現 • 顔のパーツの補完はできるものの,頭ごと無い場合は失敗 • 77%の確率で通常の画像と見分けられなかった - AI勉強会 - 35
Download now