SlideShare a Scribd company logo
1 of 11
다중 레이블 이미지를 활용한 CNN기반 이미지
어노테이션 시스템의 개선
김택수 , 김상범 네이버
taeksoo.kim@navercorp.com,
sangbum.kim@navercorp.com
제27회 한글 및 한국어 정보처리 학술대회 논문집 (2015년)
발표 자료 박천덕 한림대학교
요약
• 제목을 간단히 하면
– 다중 레이블 이미지를 활용한 CNN기반 이미지 어노테이션 시스템의 개선 ( x )
– 딥러닝을 이용한 자동 태그 생성 알고리즘 ( o )
• 데이터? SNS 인스타그램, 해시태그(#)!
• 학습 알고리즘 분리
– 단 한 개의 해시 태그일 때
– 여~러개의 해시 태그일 때 다르게 학습
레이블 시스템
• 뉴럴 네트워크를 이용해 구한 레이블 확률
– 어노테이션 예측
네트워크 구조
• 입력 : 컬러 이미지 (224x224x3)
• 출력 : 100개의 레이블 확률
– {0.0001 , 0.002 , 0.003 , … 0.7, 0.11 }
태그
• SNS에서 사진을 대표하는 단어
태그s
네트워크 구조 변경
선택적 학습 방법
• 왼쪽) 해시 태그 여러 개 : W1, W2 모두 학습
• 오른쪽) 해시 태그 한 개 : W1 만 학습
• 녹색 중간 층 : 1,000 개 노드
• 마지막 층 : 22,808 개 노드
학습
• 데이터
– 40만장의 SNS이미지(다중 레이블)
– 380개 클래스의 34,221장(단일 레이블)
• 파라미터 FineTuning
1. 기존 AlexNet에서 학습시킨 가중치 사용 (Caffe Zoo model)
• 학습률을 0으로 두어 변경시키지 않음
2. 다중 레이블 데이터 학습(W1,W2 모두 학습)
3. 단일 레이블 데이터 학습(W1만 학습, W2 고정)
성능
• hit@k
– 평가 이미 지에 대한 상위 k개의 어노테이션 중 정답
이 존재한 비율
• #뉴욕 #우드버리 #아울렛 #생로랑 #가방 #갖고싶다 #탐난다 #비싸
다
성능
• 단일 레이블 학습 데이터가 성능을 높이게 도와
주었다
– 단일 레이블은 이미지를 대표하는 단어이기 때문

More Related Content

Viewers also liked

김대호 포트포리오
김대호 포트포리오 김대호 포트포리오
김대호 포트포리오 KimDaeho
 
Caffe - A deep learning framework (Ramin Fahimi)
Caffe - A deep learning framework (Ramin Fahimi)Caffe - A deep learning framework (Ramin Fahimi)
Caffe - A deep learning framework (Ramin Fahimi)irpycon
 
CV2015. Лекция 7. Поиск изображений по содержанию.
CV2015. Лекция 7. Поиск изображений по содержанию.CV2015. Лекция 7. Поиск изображений по содержанию.
CV2015. Лекция 7. Поиск изображений по содержанию.Anton Konushin
 
AWS Summit Seoul 2015 - 게임 서비스 혁신을 위한 데이터 분석
AWS Summit Seoul 2015 - 게임 서비스 혁신을 위한 데이터 분석AWS Summit Seoul 2015 - 게임 서비스 혁신을 위한 데이터 분석
AWS Summit Seoul 2015 - 게임 서비스 혁신을 위한 데이터 분석Amazon Web Services Korea
 
[2012널리세미나] 네이버의 웹 접근성 개선 방향
[2012널리세미나] 네이버의 웹 접근성 개선 방향[2012널리세미나] 네이버의 웹 접근성 개선 방향
[2012널리세미나] 네이버의 웹 접근성 개선 방향Nts Nuli
 
오픈 소스를 활용한 게임 배치 플랫폼 개선 사례
오픈 소스를 활용한 게임 배치 플랫폼 개선 사례오픈 소스를 활용한 게임 배치 플랫폼 개선 사례
오픈 소스를 활용한 게임 배치 플랫폼 개선 사례형석 김
 
KAP 업종별기술세미나 12년06월 발표자료2
KAP 업종별기술세미나 12년06월 발표자료2KAP 업종별기술세미나 12년06월 발표자료2
KAP 업종별기술세미나 12년06월 발표자료2chasarang
 
기계 학습의 현재와 미래
기계 학습의 현재와 미래기계 학습의 현재와 미래
기계 학습의 현재와 미래Joon Kim
 
AWS CLOUD 2017 - Amazon Redshift 기반 DW 와 비지니스 인텔리전스 구현 방법 (김일호 솔루션즈 아키텍트)
AWS CLOUD 2017 - Amazon Redshift 기반 DW 와 비지니스 인텔리전스 구현 방법 (김일호 솔루션즈 아키텍트)AWS CLOUD 2017 - Amazon Redshift 기반 DW 와 비지니스 인텔리전스 구현 방법 (김일호 솔루션즈 아키텍트)
AWS CLOUD 2017 - Amazon Redshift 기반 DW 와 비지니스 인텔리전스 구현 방법 (김일호 솔루션즈 아키텍트)Amazon Web Services Korea
 
AWS CLOUD 2017 - Amazon Athena 및 Glue를 통한 빠른 데이터 질의 및 처리 기능 소개 (김상필 솔루션즈 아키텍트)
AWS CLOUD 2017 - Amazon Athena 및 Glue를 통한 빠른 데이터 질의 및 처리 기능 소개 (김상필 솔루션즈 아키텍트)AWS CLOUD 2017 - Amazon Athena 및 Glue를 통한 빠른 데이터 질의 및 처리 기능 소개 (김상필 솔루션즈 아키텍트)
AWS CLOUD 2017 - Amazon Athena 및 Glue를 통한 빠른 데이터 질의 및 처리 기능 소개 (김상필 솔루션즈 아키텍트)Amazon Web Services Korea
 
AWS CLOUD 2017 - Amazon Aurora를 통한 고성능 데이터베이스 운용하기 (박선용 솔루션즈 아키텍트)
AWS CLOUD 2017 - Amazon Aurora를 통한 고성능 데이터베이스 운용하기 (박선용 솔루션즈 아키텍트)AWS CLOUD 2017 - Amazon Aurora를 통한 고성능 데이터베이스 운용하기 (박선용 솔루션즈 아키텍트)
AWS CLOUD 2017 - Amazon Aurora를 통한 고성능 데이터베이스 운용하기 (박선용 솔루션즈 아키텍트)Amazon Web Services Korea
 
AWS CLOUD 2017 - 인공 지능과 클라우드와의 만남: Amazon의 신규 AI 서비스 (김무현 솔루션즈 아키텍트)
AWS CLOUD 2017 - 인공 지능과 클라우드와의 만남: Amazon의 신규 AI 서비스 (김무현 솔루션즈 아키텍트)AWS CLOUD 2017 - 인공 지능과 클라우드와의 만남: Amazon의 신규 AI 서비스 (김무현 솔루션즈 아키텍트)
AWS CLOUD 2017 - 인공 지능과 클라우드와의 만남: Amazon의 신규 AI 서비스 (김무현 솔루션즈 아키텍트)Amazon Web Services Korea
 
AWS re:Invent 특집(3) – Amazon 인공 지능(AI) 서비스 및 AWS 딥러닝 프레임웍 활용 (윤석찬)
AWS re:Invent 특집(3) – Amazon 인공 지능(AI) 서비스 및 AWS 딥러닝 프레임웍 활용 (윤석찬)AWS re:Invent 특집(3) – Amazon 인공 지능(AI) 서비스 및 AWS 딥러닝 프레임웍 활용 (윤석찬)
AWS re:Invent 특집(3) – Amazon 인공 지능(AI) 서비스 및 AWS 딥러닝 프레임웍 활용 (윤석찬)Amazon Web Services Korea
 
딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기 DEVIEW 2016
딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기 DEVIEW 2016딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기 DEVIEW 2016
딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기 DEVIEW 2016Taehoon Kim
 
지적 대화를 위한 깊고 넓은 딥러닝 PyCon APAC 2016
지적 대화를 위한 깊고 넓은 딥러닝 PyCon APAC 2016지적 대화를 위한 깊고 넓은 딥러닝 PyCon APAC 2016
지적 대화를 위한 깊고 넓은 딥러닝 PyCon APAC 2016Taehoon Kim
 
DIY Deep Learning with Caffe Workshop
DIY Deep Learning with Caffe WorkshopDIY Deep Learning with Caffe Workshop
DIY Deep Learning with Caffe Workshopodsc
 

Viewers also liked (17)

김대호 포트포리오
김대호 포트포리오 김대호 포트포리오
김대호 포트포리오
 
Caffe - A deep learning framework (Ramin Fahimi)
Caffe - A deep learning framework (Ramin Fahimi)Caffe - A deep learning framework (Ramin Fahimi)
Caffe - A deep learning framework (Ramin Fahimi)
 
CV2015. Лекция 7. Поиск изображений по содержанию.
CV2015. Лекция 7. Поиск изображений по содержанию.CV2015. Лекция 7. Поиск изображений по содержанию.
CV2015. Лекция 7. Поиск изображений по содержанию.
 
AWS Summit Seoul 2015 - 게임 서비스 혁신을 위한 데이터 분석
AWS Summit Seoul 2015 - 게임 서비스 혁신을 위한 데이터 분석AWS Summit Seoul 2015 - 게임 서비스 혁신을 위한 데이터 분석
AWS Summit Seoul 2015 - 게임 서비스 혁신을 위한 데이터 분석
 
[2012널리세미나] 네이버의 웹 접근성 개선 방향
[2012널리세미나] 네이버의 웹 접근성 개선 방향[2012널리세미나] 네이버의 웹 접근성 개선 방향
[2012널리세미나] 네이버의 웹 접근성 개선 방향
 
오픈 소스를 활용한 게임 배치 플랫폼 개선 사례
오픈 소스를 활용한 게임 배치 플랫폼 개선 사례오픈 소스를 활용한 게임 배치 플랫폼 개선 사례
오픈 소스를 활용한 게임 배치 플랫폼 개선 사례
 
KAP 업종별기술세미나 12년06월 발표자료2
KAP 업종별기술세미나 12년06월 발표자료2KAP 업종별기술세미나 12년06월 발표자료2
KAP 업종별기술세미나 12년06월 발표자료2
 
기계 학습의 현재와 미래
기계 학습의 현재와 미래기계 학습의 현재와 미래
기계 학습의 현재와 미래
 
AWS CLOUD 2017 - Amazon Redshift 기반 DW 와 비지니스 인텔리전스 구현 방법 (김일호 솔루션즈 아키텍트)
AWS CLOUD 2017 - Amazon Redshift 기반 DW 와 비지니스 인텔리전스 구현 방법 (김일호 솔루션즈 아키텍트)AWS CLOUD 2017 - Amazon Redshift 기반 DW 와 비지니스 인텔리전스 구현 방법 (김일호 솔루션즈 아키텍트)
AWS CLOUD 2017 - Amazon Redshift 기반 DW 와 비지니스 인텔리전스 구현 방법 (김일호 솔루션즈 아키텍트)
 
AWS CLOUD 2017 - Amazon Athena 및 Glue를 통한 빠른 데이터 질의 및 처리 기능 소개 (김상필 솔루션즈 아키텍트)
AWS CLOUD 2017 - Amazon Athena 및 Glue를 통한 빠른 데이터 질의 및 처리 기능 소개 (김상필 솔루션즈 아키텍트)AWS CLOUD 2017 - Amazon Athena 및 Glue를 통한 빠른 데이터 질의 및 처리 기능 소개 (김상필 솔루션즈 아키텍트)
AWS CLOUD 2017 - Amazon Athena 및 Glue를 통한 빠른 데이터 질의 및 처리 기능 소개 (김상필 솔루션즈 아키텍트)
 
AWS CLOUD 2017 - Amazon Aurora를 통한 고성능 데이터베이스 운용하기 (박선용 솔루션즈 아키텍트)
AWS CLOUD 2017 - Amazon Aurora를 통한 고성능 데이터베이스 운용하기 (박선용 솔루션즈 아키텍트)AWS CLOUD 2017 - Amazon Aurora를 통한 고성능 데이터베이스 운용하기 (박선용 솔루션즈 아키텍트)
AWS CLOUD 2017 - Amazon Aurora를 통한 고성능 데이터베이스 운용하기 (박선용 솔루션즈 아키텍트)
 
Deep Dive on Amazon S3
Deep Dive on Amazon S3Deep Dive on Amazon S3
Deep Dive on Amazon S3
 
AWS CLOUD 2017 - 인공 지능과 클라우드와의 만남: Amazon의 신규 AI 서비스 (김무현 솔루션즈 아키텍트)
AWS CLOUD 2017 - 인공 지능과 클라우드와의 만남: Amazon의 신규 AI 서비스 (김무현 솔루션즈 아키텍트)AWS CLOUD 2017 - 인공 지능과 클라우드와의 만남: Amazon의 신규 AI 서비스 (김무현 솔루션즈 아키텍트)
AWS CLOUD 2017 - 인공 지능과 클라우드와의 만남: Amazon의 신규 AI 서비스 (김무현 솔루션즈 아키텍트)
 
AWS re:Invent 특집(3) – Amazon 인공 지능(AI) 서비스 및 AWS 딥러닝 프레임웍 활용 (윤석찬)
AWS re:Invent 특집(3) – Amazon 인공 지능(AI) 서비스 및 AWS 딥러닝 프레임웍 활용 (윤석찬)AWS re:Invent 특집(3) – Amazon 인공 지능(AI) 서비스 및 AWS 딥러닝 프레임웍 활용 (윤석찬)
AWS re:Invent 특집(3) – Amazon 인공 지능(AI) 서비스 및 AWS 딥러닝 프레임웍 활용 (윤석찬)
 
딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기 DEVIEW 2016
딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기 DEVIEW 2016딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기 DEVIEW 2016
딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기 DEVIEW 2016
 
지적 대화를 위한 깊고 넓은 딥러닝 PyCon APAC 2016
지적 대화를 위한 깊고 넓은 딥러닝 PyCon APAC 2016지적 대화를 위한 깊고 넓은 딥러닝 PyCon APAC 2016
지적 대화를 위한 깊고 넓은 딥러닝 PyCon APAC 2016
 
DIY Deep Learning with Caffe Workshop
DIY Deep Learning with Caffe WorkshopDIY Deep Learning with Caffe Workshop
DIY Deep Learning with Caffe Workshop
 

다중 레이블을 이용한 Ccn 이미지 어노테이션시스템 개선

  • 1. 다중 레이블 이미지를 활용한 CNN기반 이미지 어노테이션 시스템의 개선 김택수 , 김상범 네이버 taeksoo.kim@navercorp.com, sangbum.kim@navercorp.com 제27회 한글 및 한국어 정보처리 학술대회 논문집 (2015년) 발표 자료 박천덕 한림대학교
  • 2. 요약 • 제목을 간단히 하면 – 다중 레이블 이미지를 활용한 CNN기반 이미지 어노테이션 시스템의 개선 ( x ) – 딥러닝을 이용한 자동 태그 생성 알고리즘 ( o ) • 데이터? SNS 인스타그램, 해시태그(#)! • 학습 알고리즘 분리 – 단 한 개의 해시 태그일 때 – 여~러개의 해시 태그일 때 다르게 학습
  • 3. 레이블 시스템 • 뉴럴 네트워크를 이용해 구한 레이블 확률 – 어노테이션 예측
  • 4. 네트워크 구조 • 입력 : 컬러 이미지 (224x224x3) • 출력 : 100개의 레이블 확률 – {0.0001 , 0.002 , 0.003 , … 0.7, 0.11 }
  • 5. 태그 • SNS에서 사진을 대표하는 단어
  • 8. 선택적 학습 방법 • 왼쪽) 해시 태그 여러 개 : W1, W2 모두 학습 • 오른쪽) 해시 태그 한 개 : W1 만 학습 • 녹색 중간 층 : 1,000 개 노드 • 마지막 층 : 22,808 개 노드
  • 9. 학습 • 데이터 – 40만장의 SNS이미지(다중 레이블) – 380개 클래스의 34,221장(단일 레이블) • 파라미터 FineTuning 1. 기존 AlexNet에서 학습시킨 가중치 사용 (Caffe Zoo model) • 학습률을 0으로 두어 변경시키지 않음 2. 다중 레이블 데이터 학습(W1,W2 모두 학습) 3. 단일 레이블 데이터 학습(W1만 학습, W2 고정)
  • 10. 성능 • hit@k – 평가 이미 지에 대한 상위 k개의 어노테이션 중 정답 이 존재한 비율 • #뉴욕 #우드버리 #아울렛 #생로랑 #가방 #갖고싶다 #탐난다 #비싸 다
  • 11. 성능 • 단일 레이블 학습 데이터가 성능을 높이게 도와 주었다 – 단일 레이블은 이미지를 대표하는 단어이기 때문