SlideShare a Scribd company logo
1 of 22
Download to read offline
Artistic Sentence
You & AI
김영민, 유의선, 김영훈, 신우탁
Introduction
Introduce Our Teams, Project Motivation & Goal
A
B Applied Technologies
Our Full Architecture, Our Technique
C Our Application Demonstration
App Demonstration
Context
D Conclusion & Future Work
Conclusion and Future work
Introduction
김영훈
Our Team
python generate.py –p “$Member_name”
유의선
Application
Programmer
신우탁
Programmer
김영민
AI Programmer
& Team Leader
Application
Programmer
유의선
Application
Programmer
신우탁
AI Programmer
Motivation
01
03
02
04
최근 AI Top-tier 학회(CVPR, ECCV, etc)
에 Multimodal에 대한 많은 연구가 진행되고
있다.
Multimodal에 대한 연구 증가
그림을 처음 접하는 아이들에게 어떻게 어떤
단어는 어떻게 그려야하는지 도움을 줄 수 있
다.
그림을 처음 접하는 아이들에
게 도움
웹툰 등의 작가들에게 어떠한 글이 어떠한 그
림으로 나타낼지에 대한 아이디어 제공
글 및 그림 작가에게 그림
가이드라인 제공
마음에 드는 그림 스타일을 추천 받아서 자신
이 좋아하는 그림 스타일을 찾을 수 있다.
자신만의 그림 스타일을 찾을
수 있음
Our Goal
Input Text Select Style Generate Image
반 고흐 초상화가
걸려있는 침실
Pop Art
Recommend Text, Image
and Style
꿈꾸는 버스와 로고
Picasso
ex
Applied Technologies
User 데이터
및 평가 데이터
저장
TCP/IP
Socket
통신
Image, 추천 데이터 전송
입력값 전송, Image 요청
User
Download
Text, Style,
Quality
App Server
DB
평가
로그인 정보
입력
Image 출력
추천 데이터 선택
Text,
Style,
Quality
수신
Image
생성
AI Technology
Text2Image
CLIP
Create a Dataset classifier from label-text Zero-shot Prediction
Contrastive Pre-training
Similarity-Learning Various Combinations
AI Technology
Text2Image
VQGAN
High-Resolution Image Generator
AI Technology
Text2Image
CLIP + VQGAN (Perceptor + Generator)
CLIP
Latent
Vector
VQGAN
AI Technology
Image Recommendation System
Similar Image Recommendation based on Image Feature
EfficientNet
Image Feature
Vector
ID Age Eval Sex Style
1 32 3.5 M 0
3 18 5.0 W 1
4 49 2.5 M 2
5 69 3.5 W 2
6 52 3 M 0
User DataBase
Similarity Table
Recommend
Image
Application Technology
클라이언트
소켓 서버 데이터베이스
TCP/IP 소켓 통신
Firebase ML Kit 번역 기능
Firebase Authentication : (구글) 로그인 기능 구현
Firebase Realtime Database : 회원정보 관리
사용자 평점 데이터
회원정보
회원정보 요청
회원정보 전송
Google STT API 음성입력 기능
사용자
Demonstration
Login
Login and Sign up
로그인을 통한 회원 관리
(비회원으로도 가능)
Login
회원 가입을 통한 회원
정보 수집
Sign Up
Google 과 연동하여
로그인 가능
Google Login
How to Artistic Sentence?
Select Option
그림으로 생성할 문장 입력
(음성 인식 기능 추가)
Enter Text
그림체 선택
Select Style
그림의 퀄리티 선택
(퀄리티와 생성 시간은 반비례)
Select Quality
Image Generation
Result
- 이미지 저장 기능
- 같은 텍스트 다른 이미지 재생성
- 비슷한 이미지 추천 받기
Evaluation
Picture
- 문장 추천
- 이미지 추천
- 그림체 추천
이미지 추천
Conclusion &
Future Work
Conclusion
- Firebase ML Kit, Google STT API를 통해
번역, 음성입력 기능 구현
- Firebase를 통한 소셜 로그인 기능 구현과 데이
터베이스 구축
Firebase를 이용하여 빠른 앱 개발 실현
- CLIP과 VQGAN을 합친 AI 모델 구현을 통해
Multi-modal AI system을 적용
- EfficientNet를 이용하여 이미지와 DB에 있는
사용자 정보를 통한 Image
Recommendation system Algorithm 구축
Multi-modal AI 구현 및 Image
Recommendation System 구축
01 02
Future Work
- SOTA 모델을 사용 및 응
용하여 모델 고도화
- 맞춤형 이미지 훈련하여
사용
- Image Generation 시
간 단축
AI 모델의 고도화
01
- 이미지 유사도 뿐만 아니
라 개인의 특성을 통한
더욱 고도화된 알고리즘
구축
- 정밀한 이미지 유사도 계
산 알고리즘 구축
정교화된 초개인화 이
미지 추천 알고리즘
02
- 로그인 인증방식 추가로
소셜 로그인 기능 고도화
- Firebase Database 위
치 변경으로 데이터 조회 시
간 단축
모바일 앱의 고도화
03
Thank you

More Related Content

Similar to Artistic Sentence

하이퍼커넥트에서 자동 광고 측정 서비스 구현하기 - PyCon Korea 2018
하이퍼커넥트에서 자동 광고 측정 서비스 구현하기 - PyCon Korea 2018하이퍼커넥트에서 자동 광고 측정 서비스 구현하기 - PyCon Korea 2018
하이퍼커넥트에서 자동 광고 측정 서비스 구현하기 - PyCon Korea 2018승호 박
 
Rightbrain UX Academy 교육 소개서
Rightbrain UX Academy 교육 소개서Rightbrain UX Academy 교육 소개서
Rightbrain UX Academy 교육 소개서RightBrain inc.
 
딥러닝 세계에 입문하기 위반 분투
딥러닝 세계에 입문하기 위반 분투딥러닝 세계에 입문하기 위반 분투
딥러닝 세계에 입문하기 위반 분투Ubuntu Korea Community
 
챗GPT 활용팁
챗GPT 활용팁챗GPT 활용팁
챗GPT 활용팁훈주 윤
 
판교 개발자 데이 – AWS 인공지능 서비스를 활용하여 스마트 애플리케이션 개발하기 – 박철수
판교 개발자 데이 – AWS 인공지능 서비스를 활용하여 스마트 애플리케이션 개발하기 – 박철수판교 개발자 데이 – AWS 인공지능 서비스를 활용하여 스마트 애플리케이션 개발하기 – 박철수
판교 개발자 데이 – AWS 인공지능 서비스를 활용하여 스마트 애플리케이션 개발하기 – 박철수Amazon Web Services Korea
 
Image 2 Torrent 발표자료
Image 2 Torrent 발표자료Image 2 Torrent 발표자료
Image 2 Torrent 발표자료재영 이
 
웹디자인 과정 훈련안내
웹디자인 과정 훈련안내웹디자인 과정 훈련안내
웹디자인 과정 훈련안내진환 김
 
AWS CLOUD 2018-AWS의 새로운 언어, 음성, 텍스트 처리 인공지능 서비스 (남궁영환 솔루션즈 아키텍트)
AWS CLOUD 2018-AWS의 새로운 언어, 음성, 텍스트 처리 인공지능 서비스 (남궁영환 솔루션즈 아키텍트)AWS CLOUD 2018-AWS의 새로운 언어, 음성, 텍스트 처리 인공지능 서비스 (남궁영환 솔루션즈 아키텍트)
AWS CLOUD 2018-AWS의 새로운 언어, 음성, 텍스트 처리 인공지능 서비스 (남궁영환 솔루션즈 아키텍트)Amazon Web Services Korea
 
Spiral 모델 기반 실무 AI 교육.pdf
Spiral 모델 기반 실무 AI 교육.pdfSpiral 모델 기반 실무 AI 교육.pdf
Spiral 모델 기반 실무 AI 교육.pdfMyungHoKim10
 
수화 인식 자동 번역 iOS 앱 프로젝트 제안서
수화 인식 자동 번역 iOS 앱 프로젝트 제안서수화 인식 자동 번역 iOS 앱 프로젝트 제안서
수화 인식 자동 번역 iOS 앱 프로젝트 제안서Anna Kim
 
[Rightbrain] AI서비스와 UX의 역할 - 챗봇/AI스피커 사업소개서
[Rightbrain] AI서비스와 UX의 역할 - 챗봇/AI스피커 사업소개서[Rightbrain] AI서비스와 UX의 역할 - 챗봇/AI스피커 사업소개서
[Rightbrain] AI서비스와 UX의 역할 - 챗봇/AI스피커 사업소개서RightBrain inc.
 
제품소개서 (Pastel editor)
제품소개서 (Pastel editor)제품소개서 (Pastel editor)
제품소개서 (Pastel editor)Kevin Hyun
 
제품소개서( Pastel Editor)
제품소개서( Pastel Editor)제품소개서( Pastel Editor)
제품소개서( Pastel Editor)Kevin Hyun
 
음성인식 기반의 지역 캐릭터 시스템
음성인식 기반의 지역 캐릭터 시스템음성인식 기반의 지역 캐릭터 시스템
음성인식 기반의 지역 캐릭터 시스템JUNGHUN LEE
 
유비온 스마트플래시 소개자료
유비온 스마트플래시 소개자료유비온 스마트플래시 소개자료
유비온 스마트플래시 소개자료Byung Seok Kang
 
와이어프레임
와이어프레임와이어프레임
와이어프레임Sinyoung Lim
 
[Partner TechForum] 딥러닝 기반의 챗봇 기술을 활용한 구축 사례
[Partner TechForum] 딥러닝 기반의 챗봇 기술을 활용한 구축 사례[Partner TechForum] 딥러닝 기반의 챗봇 기술을 활용한 구축 사례
[Partner TechForum] 딥러닝 기반의 챗봇 기술을 활용한 구축 사례Amazon Web Services Korea
 
이야기를 서비스로 바꾸는 체계적인 방법: 디자인 모델 시스템 (SLADER Design Model System) (정상혁)
이야기를 서비스로 바꾸는 체계적인 방법: 디자인 모델 시스템 (SLADER Design Model System) (정상혁)이야기를 서비스로 바꾸는 체계적인 방법: 디자인 모델 시스템 (SLADER Design Model System) (정상혁)
이야기를 서비스로 바꾸는 체계적인 방법: 디자인 모델 시스템 (SLADER Design Model System) (정상혁)Sanghyuk Jung
 
[메조미디어] 미디어&마켓 리포트 / Media&Market Report_2024.03
[메조미디어] 미디어&마켓 리포트 / Media&Market Report_2024.03[메조미디어] 미디어&마켓 리포트 / Media&Market Report_2024.03
[메조미디어] 미디어&마켓 리포트 / Media&Market Report_2024.03MezzoMedia
 
Rightbrain UX DISCOVERY 4th-part1
Rightbrain UX DISCOVERY 4th-part1Rightbrain UX DISCOVERY 4th-part1
Rightbrain UX DISCOVERY 4th-part1RightBrain inc.
 

Similar to Artistic Sentence (20)

하이퍼커넥트에서 자동 광고 측정 서비스 구현하기 - PyCon Korea 2018
하이퍼커넥트에서 자동 광고 측정 서비스 구현하기 - PyCon Korea 2018하이퍼커넥트에서 자동 광고 측정 서비스 구현하기 - PyCon Korea 2018
하이퍼커넥트에서 자동 광고 측정 서비스 구현하기 - PyCon Korea 2018
 
Rightbrain UX Academy 교육 소개서
Rightbrain UX Academy 교육 소개서Rightbrain UX Academy 교육 소개서
Rightbrain UX Academy 교육 소개서
 
딥러닝 세계에 입문하기 위반 분투
딥러닝 세계에 입문하기 위반 분투딥러닝 세계에 입문하기 위반 분투
딥러닝 세계에 입문하기 위반 분투
 
챗GPT 활용팁
챗GPT 활용팁챗GPT 활용팁
챗GPT 활용팁
 
판교 개발자 데이 – AWS 인공지능 서비스를 활용하여 스마트 애플리케이션 개발하기 – 박철수
판교 개발자 데이 – AWS 인공지능 서비스를 활용하여 스마트 애플리케이션 개발하기 – 박철수판교 개발자 데이 – AWS 인공지능 서비스를 활용하여 스마트 애플리케이션 개발하기 – 박철수
판교 개발자 데이 – AWS 인공지능 서비스를 활용하여 스마트 애플리케이션 개발하기 – 박철수
 
Image 2 Torrent 발표자료
Image 2 Torrent 발표자료Image 2 Torrent 발표자료
Image 2 Torrent 발표자료
 
웹디자인 과정 훈련안내
웹디자인 과정 훈련안내웹디자인 과정 훈련안내
웹디자인 과정 훈련안내
 
AWS CLOUD 2018-AWS의 새로운 언어, 음성, 텍스트 처리 인공지능 서비스 (남궁영환 솔루션즈 아키텍트)
AWS CLOUD 2018-AWS의 새로운 언어, 음성, 텍스트 처리 인공지능 서비스 (남궁영환 솔루션즈 아키텍트)AWS CLOUD 2018-AWS의 새로운 언어, 음성, 텍스트 처리 인공지능 서비스 (남궁영환 솔루션즈 아키텍트)
AWS CLOUD 2018-AWS의 새로운 언어, 음성, 텍스트 처리 인공지능 서비스 (남궁영환 솔루션즈 아키텍트)
 
Spiral 모델 기반 실무 AI 교육.pdf
Spiral 모델 기반 실무 AI 교육.pdfSpiral 모델 기반 실무 AI 교육.pdf
Spiral 모델 기반 실무 AI 교육.pdf
 
수화 인식 자동 번역 iOS 앱 프로젝트 제안서
수화 인식 자동 번역 iOS 앱 프로젝트 제안서수화 인식 자동 번역 iOS 앱 프로젝트 제안서
수화 인식 자동 번역 iOS 앱 프로젝트 제안서
 
[Rightbrain] AI서비스와 UX의 역할 - 챗봇/AI스피커 사업소개서
[Rightbrain] AI서비스와 UX의 역할 - 챗봇/AI스피커 사업소개서[Rightbrain] AI서비스와 UX의 역할 - 챗봇/AI스피커 사업소개서
[Rightbrain] AI서비스와 UX의 역할 - 챗봇/AI스피커 사업소개서
 
제품소개서 (Pastel editor)
제품소개서 (Pastel editor)제품소개서 (Pastel editor)
제품소개서 (Pastel editor)
 
제품소개서( Pastel Editor)
제품소개서( Pastel Editor)제품소개서( Pastel Editor)
제품소개서( Pastel Editor)
 
음성인식 기반의 지역 캐릭터 시스템
음성인식 기반의 지역 캐릭터 시스템음성인식 기반의 지역 캐릭터 시스템
음성인식 기반의 지역 캐릭터 시스템
 
유비온 스마트플래시 소개자료
유비온 스마트플래시 소개자료유비온 스마트플래시 소개자료
유비온 스마트플래시 소개자료
 
와이어프레임
와이어프레임와이어프레임
와이어프레임
 
[Partner TechForum] 딥러닝 기반의 챗봇 기술을 활용한 구축 사례
[Partner TechForum] 딥러닝 기반의 챗봇 기술을 활용한 구축 사례[Partner TechForum] 딥러닝 기반의 챗봇 기술을 활용한 구축 사례
[Partner TechForum] 딥러닝 기반의 챗봇 기술을 활용한 구축 사례
 
이야기를 서비스로 바꾸는 체계적인 방법: 디자인 모델 시스템 (SLADER Design Model System) (정상혁)
이야기를 서비스로 바꾸는 체계적인 방법: 디자인 모델 시스템 (SLADER Design Model System) (정상혁)이야기를 서비스로 바꾸는 체계적인 방법: 디자인 모델 시스템 (SLADER Design Model System) (정상혁)
이야기를 서비스로 바꾸는 체계적인 방법: 디자인 모델 시스템 (SLADER Design Model System) (정상혁)
 
[메조미디어] 미디어&마켓 리포트 / Media&Market Report_2024.03
[메조미디어] 미디어&마켓 리포트 / Media&Market Report_2024.03[메조미디어] 미디어&마켓 리포트 / Media&Market Report_2024.03
[메조미디어] 미디어&마켓 리포트 / Media&Market Report_2024.03
 
Rightbrain UX DISCOVERY 4th-part1
Rightbrain UX DISCOVERY 4th-part1Rightbrain UX DISCOVERY 4th-part1
Rightbrain UX DISCOVERY 4th-part1
 

Artistic Sentence

  • 1. Artistic Sentence You & AI 김영민, 유의선, 김영훈, 신우탁
  • 2. Introduction Introduce Our Teams, Project Motivation & Goal A B Applied Technologies Our Full Architecture, Our Technique C Our Application Demonstration App Demonstration Context D Conclusion & Future Work Conclusion and Future work
  • 4. 김영훈 Our Team python generate.py –p “$Member_name” 유의선 Application Programmer 신우탁 Programmer 김영민 AI Programmer & Team Leader Application Programmer 유의선 Application Programmer 신우탁 AI Programmer
  • 5. Motivation 01 03 02 04 최근 AI Top-tier 학회(CVPR, ECCV, etc) 에 Multimodal에 대한 많은 연구가 진행되고 있다. Multimodal에 대한 연구 증가 그림을 처음 접하는 아이들에게 어떻게 어떤 단어는 어떻게 그려야하는지 도움을 줄 수 있 다. 그림을 처음 접하는 아이들에 게 도움 웹툰 등의 작가들에게 어떠한 글이 어떠한 그 림으로 나타낼지에 대한 아이디어 제공 글 및 그림 작가에게 그림 가이드라인 제공 마음에 드는 그림 스타일을 추천 받아서 자신 이 좋아하는 그림 스타일을 찾을 수 있다. 자신만의 그림 스타일을 찾을 수 있음
  • 6. Our Goal Input Text Select Style Generate Image 반 고흐 초상화가 걸려있는 침실 Pop Art Recommend Text, Image and Style 꿈꾸는 버스와 로고 Picasso ex
  • 8. User 데이터 및 평가 데이터 저장 TCP/IP Socket 통신 Image, 추천 데이터 전송 입력값 전송, Image 요청 User Download Text, Style, Quality App Server DB 평가 로그인 정보 입력 Image 출력 추천 데이터 선택 Text, Style, Quality 수신 Image 생성
  • 9. AI Technology Text2Image CLIP Create a Dataset classifier from label-text Zero-shot Prediction Contrastive Pre-training Similarity-Learning Various Combinations
  • 11. AI Technology Text2Image CLIP + VQGAN (Perceptor + Generator) CLIP Latent Vector VQGAN
  • 12. AI Technology Image Recommendation System Similar Image Recommendation based on Image Feature EfficientNet Image Feature Vector ID Age Eval Sex Style 1 32 3.5 M 0 3 18 5.0 W 1 4 49 2.5 M 2 5 69 3.5 W 2 6 52 3 M 0 User DataBase Similarity Table Recommend Image
  • 13. Application Technology 클라이언트 소켓 서버 데이터베이스 TCP/IP 소켓 통신 Firebase ML Kit 번역 기능 Firebase Authentication : (구글) 로그인 기능 구현 Firebase Realtime Database : 회원정보 관리 사용자 평점 데이터 회원정보 회원정보 요청 회원정보 전송 Google STT API 음성입력 기능 사용자
  • 15. Login Login and Sign up 로그인을 통한 회원 관리 (비회원으로도 가능) Login 회원 가입을 통한 회원 정보 수집 Sign Up Google 과 연동하여 로그인 가능 Google Login
  • 16. How to Artistic Sentence? Select Option 그림으로 생성할 문장 입력 (음성 인식 기능 추가) Enter Text 그림체 선택 Select Style 그림의 퀄리티 선택 (퀄리티와 생성 시간은 반비례) Select Quality
  • 17. Image Generation Result - 이미지 저장 기능 - 같은 텍스트 다른 이미지 재생성 - 비슷한 이미지 추천 받기 Evaluation Picture
  • 18. - 문장 추천 - 이미지 추천 - 그림체 추천 이미지 추천
  • 20. Conclusion - Firebase ML Kit, Google STT API를 통해 번역, 음성입력 기능 구현 - Firebase를 통한 소셜 로그인 기능 구현과 데이 터베이스 구축 Firebase를 이용하여 빠른 앱 개발 실현 - CLIP과 VQGAN을 합친 AI 모델 구현을 통해 Multi-modal AI system을 적용 - EfficientNet를 이용하여 이미지와 DB에 있는 사용자 정보를 통한 Image Recommendation system Algorithm 구축 Multi-modal AI 구현 및 Image Recommendation System 구축 01 02
  • 21. Future Work - SOTA 모델을 사용 및 응 용하여 모델 고도화 - 맞춤형 이미지 훈련하여 사용 - Image Generation 시 간 단축 AI 모델의 고도화 01 - 이미지 유사도 뿐만 아니 라 개인의 특성을 통한 더욱 고도화된 알고리즘 구축 - 정밀한 이미지 유사도 계 산 알고리즘 구축 정교화된 초개인화 이 미지 추천 알고리즘 02 - 로그인 인증방식 추가로 소셜 로그인 기능 고도화 - Firebase Database 위 치 변경으로 데이터 조회 시 간 단축 모바일 앱의 고도화 03