SlideShare a Scribd company logo
1 of 34
Kyonggi Univ. AI Lab.
STYLE GAN 시리즈
2021.3.8
정규열
Artificial Intelligence Lab
Kyonggi Univiersity
Kyonggi Univ. AI Lab.
Index
 도입 배경
 Style GAN
 Style GAN2
 평가 지표
 실험
 결론
Kyonggi Univ. AI Lab.
도입 배경
Kyonggi Univ. AI Lab.
도입 배경
 Style GAN
 GAN을 Style에 기반하여 변형 하고 자함.
 Generator 구조를 변경하였다.
 기존의 Latent(z) 를 효과적으로 이용하도록 변형함.
Kyonggi Univ. AI Lab.
도입 배경
 Style GAN 2
 Style GAN 에서 발생한 몇가지 문제점들을 해결 하고자 제안하였다.
Kyonggi Univ. AI Lab.
도입 배경
 FFHQ Dataset
나이, 민족, 밝기, 배경등 모두 포함하는 사람 얼굴의 Dataset!
Kyonggi Univ. AI Lab.
STYLE GAN
Kyonggi Univ. AI Lab.
Style GAN
 Style transferring을 위한 GAN 모델
 Latent를 직접 사용하지 않고 Style Mapping을 먼저 진행한다.
과거 현재
Kyonggi Univ. AI Lab.
Style GAN
 Mapping Network
 Latent(z)를 그대로 사용하면 Dataset의
확률분포를 따라야 한다.
 이럴 경우 원하는 Style을 낼 수 없다..
 Entanglement를 피할 수 없다.
이런 이유로 Style Mapping을 먼저 진행하는게 훨씬 효과적이다.
Entangle : 서로 얽혀 있어 특징 구분이 어렵다
Disentangle : style들이 잘 구분 되어 있다.
Kyonggi Univ. AI Lab.
Style GAN
 Mapping Network
 Ex)
• 일반적인 latent(z)를 사용하면 비선형으로 접근해야 한다.
• 그러나 W를 사용하면 선형으로도 접근이 가능하다.
Kyonggi Univ. AI Lab.
Style GAN
 Mapping Network
Kyonggi Univ. AI Lab.
Style GAN
 Style 적용하기
단계별로 이미지의 해상도를 키우며 Style을 적용해간다!
X : 컨볼루션의 아웃풋
𝑦𝑠 : style의 강도(0 ~ 100)
𝑦𝑏: style의 Bias
Kyonggi Univ. AI Lab.
Style GAN
 Style 적용하기 – AdaIN
 Adaptive Instance Normalization
X : 컨볼루션의 아웃풋
𝑦𝑠 : style의 강도(0 ~ 100)
𝑦𝑏: style의 Bias
단계별로 Style 강도에 따라 조절하여 이미지를 생성한다.
Kyonggi Univ. AI Lab.
Style GAN
 Noise
 몇가지 요소들 중 Style에 영향 주면 안되는 것들이 있다.
 머리스타일, 피부의 모공, 수염 등등
 이런 부분들은 일정 부분 확률 분포를 따른다.
 이에 가우시안 Noise를 추가한다.
Kyonggi Univ. AI Lab.
Style GAN
 Noise
 적용 위치에 따른 변화
(a) : 모든 레이어에 적용
(b) : 적용 안함
(c) : 저해상도 레이어에 적용
(d) : 고해상도 레이어에 적용
머리 스타일이 Noise 적용 위치에 따라
다르게 생성됨을 확인 할 수 있다.
Kyonggi Univ. AI Lab.
STYLE GAN2
Kyonggi Univ. AI Lab.
Style GAN2
 Style GAN의 결함 - Artifacts 가 발생함
물방울 같은 검은 점(artifact)이 나타남
Kyonggi Univ. AI Lab.
Style GAN2
 Style GAN의 결함 - progressive growing
• 얼굴은 옆모습으로 변화되고 있는데 치아는 그대로 유지됨.
• 이런 부자연스러운 상황이 발생하는 이유는 progressive growing 때문
임.
Kyonggi Univ. AI Lab.
Style GAN2
 Artifacts의 원인
 AdaIN이 Artifacts를 발생시킨다.
 정규화 부분이 이를 발생 시킴.
 정규화를 제거했더니 이런 현상이 사라졌다.
정규화
위 구조를 Artifacts 발생을 개선하도록 구조를 변경한다.
Kyonggi Univ. AI Lab.
Style GAN2
 Artifacts의 개선을 위한 구조 변경
 AdaIN의 구조 분석
 콘텐츠 자체를 정규화 한다.
 Norm mean/std
 정규화된 컨텐츠를 선형변환 한다.
 Mod mean/std
이러한 기법이 Artifacts를 발생 시켰다.
Kyonggi Univ. AI Lab.
Style GAN2
 Artifacts의 개선을 위한 구조 변경
 Convolution Layer의 weight 자체를 정규화 시키자!
Mod
Demod
Kyonggi Univ. AI Lab.
Style GAN2
 progressive growing을 변경함.
 MSG GAN의 구조를 변경함.
 저해상도 이미지를 고 해상도 이미지로 변환하는 새로운 기법!
Kyonggi Univ. AI Lab.
평가 지표
Kyonggi Univ. AI Lab.
평가 지표
 Perceptual Path Length(PPL)
 스타일의 변화를 주면서 어떤 특징들만 변화 되었는지 잘 구분 할 수 있는
지표
PPL 수치가 낮을 수록 잘 구분함!
Kyonggi Univ. AI Lab.
평가 지표
 Perceptual Path Length(PPL)
 Ex)
PPL 수치가 높다.
PPL 수치가 낮다.
Kyonggi Univ. AI Lab.
평가 지표
 Linear separability
 특징들을 얼마나 잘 분리되었지 판단하는 지표
이 지표 또한 낮을수록 잘 분리 된 것임.
Kyonggi Univ. AI Lab.
실험
Kyonggi Univ. AI Lab.
실험
 정량적 평가 – StyleGAN
• Style Mapping을 수행할 경우 성능이 좋은 편이다.
• Mapping 네트워크가 Deep 할수록 성능이 좋다는 것도 알 수
있다.
Kyonggi Univ. AI Lab.
실험
 정량적 평가 – StyleGAN2(progressive growing)
새롭게 적용한 (a), (b)에 의해서 FID와 PPL 지표의 수치가 개선 되었다.
Kyonggi Univ. AI Lab.
실험
 정량적 평가 – StyleGAN2(progressive growing)
• (a)를 보면 학습이 진행될 수록 고해상도의 기여도가 커진다.
• (b)를 보면 학습이 종료될 때 고해상도의 기여도가 크게 증가 하였다.
새롭게 적용한 네트워크가 고해상도 이미지를 잘 만들어 낸
Kyonggi Univ. AI Lab.
실험
 정성적 평가 – StyleGAN2(progressive growing)
부자연스러움이 사라졌다.
Kyonggi Univ. AI Lab.
실험
 정성적 평가 – StyleGAN2(Artifacts 개선)
 구조 변경 후 결과
Artifacts가 발생하지 않았다.!
Kyonggi Univ. AI Lab.
결론
Kyonggi Univ. AI Lab.
결론
 Style transfer를 GAN을 이용하여 접근 하였다.
 Mapping Network와 AdaIN을 제안함.
 Style GAN의 문제점을 개선하였다.
 Artifacts와 progressive growing 문제를 개선 하였다.
 학습시간은 상당히 길다 – 모델이 상당히 무겁다. (GPU 8대)
 성능은 나쁘지 않지만 모델이 무거운 편이다.
 FFHQ 데이터셋은 9일이 소요됨.
 LSUN CAR 데이터셋은 13일이 소요 됨.
 그래도 개인 PC 정도에서 다룰 수 있어 기쁘다.
 저자 개인의 주장

More Related Content

Similar to Style gan

Machine Learning Model for Gender Detection
Machine Learning Model for Gender DetectionMachine Learning Model for Gender Detection
Machine Learning Model for Gender Detection
TecnoIncentive
 
Andrii Belas "Overview of object detection approaches: cases, algorithms and...
Andrii Belas  "Overview of object detection approaches: cases, algorithms and...Andrii Belas  "Overview of object detection approaches: cases, algorithms and...
Andrii Belas "Overview of object detection approaches: cases, algorithms and...
Lviv Startup Club
 

Similar to Style gan (20)

IRJET- Face Detection and Tracking Algorithm using Open CV with Raspberry Pi
IRJET- Face Detection and Tracking Algorithm using Open CV with Raspberry PiIRJET- Face Detection and Tracking Algorithm using Open CV with Raspberry Pi
IRJET- Face Detection and Tracking Algorithm using Open CV with Raspberry Pi
 
DriveBuild: Automation of Tests in the Field of Autonomous Cars
DriveBuild: Automation of Tests in the Field of Autonomous CarsDriveBuild: Automation of Tests in the Field of Autonomous Cars
DriveBuild: Automation of Tests in the Field of Autonomous Cars
 
An Introduction to Face Detection
An Introduction to Face DetectionAn Introduction to Face Detection
An Introduction to Face Detection
 
Style gan2 review
Style gan2 reviewStyle gan2 review
Style gan2 review
 
Machine Learning Model for Gender Detection
Machine Learning Model for Gender DetectionMachine Learning Model for Gender Detection
Machine Learning Model for Gender Detection
 
Marl의 개념 및 군사용 적용방안
Marl의 개념 및 군사용 적용방안Marl의 개념 및 군사용 적용방안
Marl의 개념 및 군사용 적용방안
 
A Smart Target Detection System using Fuzzy Logic and Background Subtraction
A Smart Target Detection System using Fuzzy Logic and Background SubtractionA Smart Target Detection System using Fuzzy Logic and Background Subtraction
A Smart Target Detection System using Fuzzy Logic and Background Subtraction
 
Human-Centered AI: Scalable, Interactive Tools for Interpretation and Attribu...
Human-Centered AI: Scalable, Interactive Tools for Interpretation and Attribu...Human-Centered AI: Scalable, Interactive Tools for Interpretation and Attribu...
Human-Centered AI: Scalable, Interactive Tools for Interpretation and Attribu...
 
Using Bayesian Optimization to Tune Machine Learning Models
Using Bayesian Optimization to Tune Machine Learning ModelsUsing Bayesian Optimization to Tune Machine Learning Models
Using Bayesian Optimization to Tune Machine Learning Models
 
Using Bayesian Optimization to Tune Machine Learning Models
Using Bayesian Optimization to Tune Machine Learning ModelsUsing Bayesian Optimization to Tune Machine Learning Models
Using Bayesian Optimization to Tune Machine Learning Models
 
An Efficient Algorithm for Edge Detection of Corroded Surface
An Efficient Algorithm for Edge Detection of Corroded SurfaceAn Efficient Algorithm for Edge Detection of Corroded Surface
An Efficient Algorithm for Edge Detection of Corroded Surface
 
An Efficient Algorithm for Edge Detection of Corroded Surface
An Efficient Algorithm for Edge Detection of Corroded SurfaceAn Efficient Algorithm for Edge Detection of Corroded Surface
An Efficient Algorithm for Edge Detection of Corroded Surface
 
IRJET - Deep Learning Approach to Inpainting and Outpainting System
IRJET -  	  Deep Learning Approach to Inpainting and Outpainting SystemIRJET -  	  Deep Learning Approach to Inpainting and Outpainting System
IRJET - Deep Learning Approach to Inpainting and Outpainting System
 
N046047780
N046047780N046047780
N046047780
 
Myth vs Reality: Understanding AI/ML for QA Automation - w/ Jonathan Lipps
Myth vs Reality: Understanding AI/ML for QA Automation - w/ Jonathan LippsMyth vs Reality: Understanding AI/ML for QA Automation - w/ Jonathan Lipps
Myth vs Reality: Understanding AI/ML for QA Automation - w/ Jonathan Lipps
 
[CVPR2020] Simple but effective image enhancement techniques
[CVPR2020] Simple but effective image enhancement techniques[CVPR2020] Simple but effective image enhancement techniques
[CVPR2020] Simple but effective image enhancement techniques
 
Robust Tracking Via Feature Mapping Method and Support Vector Machine
Robust Tracking Via Feature Mapping Method and Support Vector MachineRobust Tracking Via Feature Mapping Method and Support Vector Machine
Robust Tracking Via Feature Mapping Method and Support Vector Machine
 
Seeing what a gan cannot generate: paper review
Seeing what a gan cannot generate: paper reviewSeeing what a gan cannot generate: paper review
Seeing what a gan cannot generate: paper review
 
Andrii Belas "Overview of object detection approaches: cases, algorithms and...
Andrii Belas  "Overview of object detection approaches: cases, algorithms and...Andrii Belas  "Overview of object detection approaches: cases, algorithms and...
Andrii Belas "Overview of object detection approaches: cases, algorithms and...
 
JAM23-24 session 2 .pptx
JAM23-24 session 2 .pptxJAM23-24 session 2 .pptx
JAM23-24 session 2 .pptx
 

More from KyuYeolJung (6)

Cpgan content-parsing generative
Cpgan   content-parsing generativeCpgan   content-parsing generative
Cpgan content-parsing generative
 
MARL based on role
MARL based on roleMARL based on role
MARL based on role
 
Rethinking attention with performers
Rethinking attention with performersRethinking attention with performers
Rethinking attention with performers
 
Attn-gan : fine-grained text to image generation
Attn-gan :  fine-grained text to image generationAttn-gan :  fine-grained text to image generation
Attn-gan : fine-grained text to image generation
 
Language gans falling short
Language gans falling shortLanguage gans falling short
Language gans falling short
 
COMA(counterfactual multi-agent policy gradients)
COMA(counterfactual multi-agent policy gradients)COMA(counterfactual multi-agent policy gradients)
COMA(counterfactual multi-agent policy gradients)
 

Recently uploaded

TrustArc Webinar - Unified Trust Center for Privacy, Security, Compliance, an...
TrustArc Webinar - Unified Trust Center for Privacy, Security, Compliance, an...TrustArc Webinar - Unified Trust Center for Privacy, Security, Compliance, an...
TrustArc Webinar - Unified Trust Center for Privacy, Security, Compliance, an...
TrustArc
 
Harnessing Passkeys in the Battle Against AI-Powered Cyber Threats.pptx
Harnessing Passkeys in the Battle Against AI-Powered Cyber Threats.pptxHarnessing Passkeys in the Battle Against AI-Powered Cyber Threats.pptx
Harnessing Passkeys in the Battle Against AI-Powered Cyber Threats.pptx
FIDO Alliance
 
Easier, Faster, and More Powerful – Alles Neu macht der Mai -Wir durchleuchte...
Easier, Faster, and More Powerful – Alles Neu macht der Mai -Wir durchleuchte...Easier, Faster, and More Powerful – Alles Neu macht der Mai -Wir durchleuchte...
Easier, Faster, and More Powerful – Alles Neu macht der Mai -Wir durchleuchte...
panagenda
 
CORS (Kitworks Team Study 양다윗 발표자료 240510)
CORS (Kitworks Team Study 양다윗 발표자료 240510)CORS (Kitworks Team Study 양다윗 발표자료 240510)
CORS (Kitworks Team Study 양다윗 발표자료 240510)
Wonjun Hwang
 

Recently uploaded (20)

Introduction to FIDO Authentication and Passkeys.pptx
Introduction to FIDO Authentication and Passkeys.pptxIntroduction to FIDO Authentication and Passkeys.pptx
Introduction to FIDO Authentication and Passkeys.pptx
 
الأمن السيبراني - ما لا يسع للمستخدم جهله
الأمن السيبراني - ما لا يسع للمستخدم جهلهالأمن السيبراني - ما لا يسع للمستخدم جهله
الأمن السيبراني - ما لا يسع للمستخدم جهله
 
TrustArc Webinar - Unified Trust Center for Privacy, Security, Compliance, an...
TrustArc Webinar - Unified Trust Center for Privacy, Security, Compliance, an...TrustArc Webinar - Unified Trust Center for Privacy, Security, Compliance, an...
TrustArc Webinar - Unified Trust Center for Privacy, Security, Compliance, an...
 
Generative AI Use Cases and Applications.pdf
Generative AI Use Cases and Applications.pdfGenerative AI Use Cases and Applications.pdf
Generative AI Use Cases and Applications.pdf
 
AI+A11Y 11MAY2024 HYDERBAD GAAD 2024 - HelloA11Y (11 May 2024)
AI+A11Y 11MAY2024 HYDERBAD GAAD 2024 - HelloA11Y (11 May 2024)AI+A11Y 11MAY2024 HYDERBAD GAAD 2024 - HelloA11Y (11 May 2024)
AI+A11Y 11MAY2024 HYDERBAD GAAD 2024 - HelloA11Y (11 May 2024)
 
Harnessing Passkeys in the Battle Against AI-Powered Cyber Threats.pptx
Harnessing Passkeys in the Battle Against AI-Powered Cyber Threats.pptxHarnessing Passkeys in the Battle Against AI-Powered Cyber Threats.pptx
Harnessing Passkeys in the Battle Against AI-Powered Cyber Threats.pptx
 
Top 10 CodeIgniter Development Companies
Top 10 CodeIgniter Development CompaniesTop 10 CodeIgniter Development Companies
Top 10 CodeIgniter Development Companies
 
Easier, Faster, and More Powerful – Alles Neu macht der Mai -Wir durchleuchte...
Easier, Faster, and More Powerful – Alles Neu macht der Mai -Wir durchleuchte...Easier, Faster, and More Powerful – Alles Neu macht der Mai -Wir durchleuchte...
Easier, Faster, and More Powerful – Alles Neu macht der Mai -Wir durchleuchte...
 
How we scaled to 80K users by doing nothing!.pdf
How we scaled to 80K users by doing nothing!.pdfHow we scaled to 80K users by doing nothing!.pdf
How we scaled to 80K users by doing nothing!.pdf
 
Easier, Faster, and More Powerful – Notes Document Properties Reimagined
Easier, Faster, and More Powerful – Notes Document Properties ReimaginedEasier, Faster, and More Powerful – Notes Document Properties Reimagined
Easier, Faster, and More Powerful – Notes Document Properties Reimagined
 
CORS (Kitworks Team Study 양다윗 발표자료 240510)
CORS (Kitworks Team Study 양다윗 발표자료 240510)CORS (Kitworks Team Study 양다윗 발표자료 240510)
CORS (Kitworks Team Study 양다윗 발표자료 240510)
 
2024 May Patch Tuesday
2024 May Patch Tuesday2024 May Patch Tuesday
2024 May Patch Tuesday
 
WebAssembly is Key to Better LLM Performance
WebAssembly is Key to Better LLM PerformanceWebAssembly is Key to Better LLM Performance
WebAssembly is Key to Better LLM Performance
 
Event-Driven Architecture Masterclass: Challenges in Stream Processing
Event-Driven Architecture Masterclass: Challenges in Stream ProcessingEvent-Driven Architecture Masterclass: Challenges in Stream Processing
Event-Driven Architecture Masterclass: Challenges in Stream Processing
 
Oauth 2.0 Introduction and Flows with MuleSoft
Oauth 2.0 Introduction and Flows with MuleSoftOauth 2.0 Introduction and Flows with MuleSoft
Oauth 2.0 Introduction and Flows with MuleSoft
 
Design and Development of a Provenance Capture Platform for Data Science
Design and Development of a Provenance Capture Platform for Data ScienceDesign and Development of a Provenance Capture Platform for Data Science
Design and Development of a Provenance Capture Platform for Data Science
 
WebRTC and SIP not just audio and video @ OpenSIPS 2024
WebRTC and SIP not just audio and video @ OpenSIPS 2024WebRTC and SIP not just audio and video @ OpenSIPS 2024
WebRTC and SIP not just audio and video @ OpenSIPS 2024
 
Cyber Insurance - RalphGilot - Embry-Riddle Aeronautical University.pptx
Cyber Insurance - RalphGilot - Embry-Riddle Aeronautical University.pptxCyber Insurance - RalphGilot - Embry-Riddle Aeronautical University.pptx
Cyber Insurance - RalphGilot - Embry-Riddle Aeronautical University.pptx
 
Working together SRE & Platform Engineering
Working together SRE & Platform EngineeringWorking together SRE & Platform Engineering
Working together SRE & Platform Engineering
 
Continuing Bonds Through AI: A Hermeneutic Reflection on Thanabots
Continuing Bonds Through AI: A Hermeneutic Reflection on ThanabotsContinuing Bonds Through AI: A Hermeneutic Reflection on Thanabots
Continuing Bonds Through AI: A Hermeneutic Reflection on Thanabots
 

Style gan

  • 1. Kyonggi Univ. AI Lab. STYLE GAN 시리즈 2021.3.8 정규열 Artificial Intelligence Lab Kyonggi Univiersity
  • 2. Kyonggi Univ. AI Lab. Index  도입 배경  Style GAN  Style GAN2  평가 지표  실험  결론
  • 3. Kyonggi Univ. AI Lab. 도입 배경
  • 4. Kyonggi Univ. AI Lab. 도입 배경  Style GAN  GAN을 Style에 기반하여 변형 하고 자함.  Generator 구조를 변경하였다.  기존의 Latent(z) 를 효과적으로 이용하도록 변형함.
  • 5. Kyonggi Univ. AI Lab. 도입 배경  Style GAN 2  Style GAN 에서 발생한 몇가지 문제점들을 해결 하고자 제안하였다.
  • 6. Kyonggi Univ. AI Lab. 도입 배경  FFHQ Dataset 나이, 민족, 밝기, 배경등 모두 포함하는 사람 얼굴의 Dataset!
  • 7. Kyonggi Univ. AI Lab. STYLE GAN
  • 8. Kyonggi Univ. AI Lab. Style GAN  Style transferring을 위한 GAN 모델  Latent를 직접 사용하지 않고 Style Mapping을 먼저 진행한다. 과거 현재
  • 9. Kyonggi Univ. AI Lab. Style GAN  Mapping Network  Latent(z)를 그대로 사용하면 Dataset의 확률분포를 따라야 한다.  이럴 경우 원하는 Style을 낼 수 없다..  Entanglement를 피할 수 없다. 이런 이유로 Style Mapping을 먼저 진행하는게 훨씬 효과적이다. Entangle : 서로 얽혀 있어 특징 구분이 어렵다 Disentangle : style들이 잘 구분 되어 있다.
  • 10. Kyonggi Univ. AI Lab. Style GAN  Mapping Network  Ex) • 일반적인 latent(z)를 사용하면 비선형으로 접근해야 한다. • 그러나 W를 사용하면 선형으로도 접근이 가능하다.
  • 11. Kyonggi Univ. AI Lab. Style GAN  Mapping Network
  • 12. Kyonggi Univ. AI Lab. Style GAN  Style 적용하기 단계별로 이미지의 해상도를 키우며 Style을 적용해간다! X : 컨볼루션의 아웃풋 𝑦𝑠 : style의 강도(0 ~ 100) 𝑦𝑏: style의 Bias
  • 13. Kyonggi Univ. AI Lab. Style GAN  Style 적용하기 – AdaIN  Adaptive Instance Normalization X : 컨볼루션의 아웃풋 𝑦𝑠 : style의 강도(0 ~ 100) 𝑦𝑏: style의 Bias 단계별로 Style 강도에 따라 조절하여 이미지를 생성한다.
  • 14. Kyonggi Univ. AI Lab. Style GAN  Noise  몇가지 요소들 중 Style에 영향 주면 안되는 것들이 있다.  머리스타일, 피부의 모공, 수염 등등  이런 부분들은 일정 부분 확률 분포를 따른다.  이에 가우시안 Noise를 추가한다.
  • 15. Kyonggi Univ. AI Lab. Style GAN  Noise  적용 위치에 따른 변화 (a) : 모든 레이어에 적용 (b) : 적용 안함 (c) : 저해상도 레이어에 적용 (d) : 고해상도 레이어에 적용 머리 스타일이 Noise 적용 위치에 따라 다르게 생성됨을 확인 할 수 있다.
  • 16. Kyonggi Univ. AI Lab. STYLE GAN2
  • 17. Kyonggi Univ. AI Lab. Style GAN2  Style GAN의 결함 - Artifacts 가 발생함 물방울 같은 검은 점(artifact)이 나타남
  • 18. Kyonggi Univ. AI Lab. Style GAN2  Style GAN의 결함 - progressive growing • 얼굴은 옆모습으로 변화되고 있는데 치아는 그대로 유지됨. • 이런 부자연스러운 상황이 발생하는 이유는 progressive growing 때문 임.
  • 19. Kyonggi Univ. AI Lab. Style GAN2  Artifacts의 원인  AdaIN이 Artifacts를 발생시킨다.  정규화 부분이 이를 발생 시킴.  정규화를 제거했더니 이런 현상이 사라졌다. 정규화 위 구조를 Artifacts 발생을 개선하도록 구조를 변경한다.
  • 20. Kyonggi Univ. AI Lab. Style GAN2  Artifacts의 개선을 위한 구조 변경  AdaIN의 구조 분석  콘텐츠 자체를 정규화 한다.  Norm mean/std  정규화된 컨텐츠를 선형변환 한다.  Mod mean/std 이러한 기법이 Artifacts를 발생 시켰다.
  • 21. Kyonggi Univ. AI Lab. Style GAN2  Artifacts의 개선을 위한 구조 변경  Convolution Layer의 weight 자체를 정규화 시키자! Mod Demod
  • 22. Kyonggi Univ. AI Lab. Style GAN2  progressive growing을 변경함.  MSG GAN의 구조를 변경함.  저해상도 이미지를 고 해상도 이미지로 변환하는 새로운 기법!
  • 23. Kyonggi Univ. AI Lab. 평가 지표
  • 24. Kyonggi Univ. AI Lab. 평가 지표  Perceptual Path Length(PPL)  스타일의 변화를 주면서 어떤 특징들만 변화 되었는지 잘 구분 할 수 있는 지표 PPL 수치가 낮을 수록 잘 구분함!
  • 25. Kyonggi Univ. AI Lab. 평가 지표  Perceptual Path Length(PPL)  Ex) PPL 수치가 높다. PPL 수치가 낮다.
  • 26. Kyonggi Univ. AI Lab. 평가 지표  Linear separability  특징들을 얼마나 잘 분리되었지 판단하는 지표 이 지표 또한 낮을수록 잘 분리 된 것임.
  • 27. Kyonggi Univ. AI Lab. 실험
  • 28. Kyonggi Univ. AI Lab. 실험  정량적 평가 – StyleGAN • Style Mapping을 수행할 경우 성능이 좋은 편이다. • Mapping 네트워크가 Deep 할수록 성능이 좋다는 것도 알 수 있다.
  • 29. Kyonggi Univ. AI Lab. 실험  정량적 평가 – StyleGAN2(progressive growing) 새롭게 적용한 (a), (b)에 의해서 FID와 PPL 지표의 수치가 개선 되었다.
  • 30. Kyonggi Univ. AI Lab. 실험  정량적 평가 – StyleGAN2(progressive growing) • (a)를 보면 학습이 진행될 수록 고해상도의 기여도가 커진다. • (b)를 보면 학습이 종료될 때 고해상도의 기여도가 크게 증가 하였다. 새롭게 적용한 네트워크가 고해상도 이미지를 잘 만들어 낸
  • 31. Kyonggi Univ. AI Lab. 실험  정성적 평가 – StyleGAN2(progressive growing) 부자연스러움이 사라졌다.
  • 32. Kyonggi Univ. AI Lab. 실험  정성적 평가 – StyleGAN2(Artifacts 개선)  구조 변경 후 결과 Artifacts가 발생하지 않았다.!
  • 33. Kyonggi Univ. AI Lab. 결론
  • 34. Kyonggi Univ. AI Lab. 결론  Style transfer를 GAN을 이용하여 접근 하였다.  Mapping Network와 AdaIN을 제안함.  Style GAN의 문제점을 개선하였다.  Artifacts와 progressive growing 문제를 개선 하였다.  학습시간은 상당히 길다 – 모델이 상당히 무겁다. (GPU 8대)  성능은 나쁘지 않지만 모델이 무거운 편이다.  FFHQ 데이터셋은 9일이 소요됨.  LSUN CAR 데이터셋은 13일이 소요 됨.  그래도 개인 PC 정도에서 다룰 수 있어 기쁘다.  저자 개인의 주장