제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Find Your Style 팀] : 사용자 이미지 라벨링을 통한 의류 추천 시스템
데이터 분석 프로젝트를 진행한 Find Your Style 팀에서는 사용자가 좋아하는 룩의 사진을 올리면 이에 맞는 스타일을 찾아 어울리는 여성 패션 상품을 추천해주는 프로젝트를 진행했습니다.
16기 강하영 동덕여자대학교 정보통계학과
16기 김지수 성신여자대학교 통계학과
16기 남유지 숙명여자대학교 컴퓨터과학전공
15기 김희현 성균관대학교 데이터사이언스융합전공
16기 박은지 숙명여자대학교 소비자경제학과
모델 소개
Mask Rcnn
이미지를입력으로 받아 각 객체에 대해 bounding box와 segmentation mask를 생성
• Mask rcnn = Faster R-CNN + mask branch
• Mask: 각 object에 대한 픽셀 단위 segmentation mask
선택 이유
1. 다양한 형태의 의류 → 다양한 형태에도 정교한 객체 탐지 기대
2. Bbox detection과 pixel 단위 segmentation 두가지 task를 동시에 사용 가능
3. COCO 2016 challenge 1등
8.
학습데이터
AI Hub K-fashion
이미지에서패션 영역과 속성, 스타일 정보를 인식 및 도출 가능한 한국형 패션 이미지 데이터 셋
• 총 1,200,000건 데이터
• 대분류 10가지, 세부속성 186가지, 스타일 23가지 레이블링 정보
학습 환경
• Train data 29만개
• 스타일: 스트리트, 모던, 매니시, 리조트, 로맨틱, 레트로
• 100 에폭 학습
9.
입력&출력
입력
• 원본 이미지
•입력 피클 파일: json 파싱
• 좌표, item, item_id, image_id, image_name,
width, height
출력
• 아이템 별 크롭 이미지
• 출력 피클 파일
• Rois, class_id, class_name, original, image_id
모델소개
의류 특징
Item dress,top, bottom, outer
색상 골드, 그레이, 그린,…
카테고리 가디건, 니트웨어, 드레스,…
옷깃 밴드칼라, 보우칼라, 세일러칼라,…
소매기장 7부소매, 긴팔, 민소매,…
핏 노멀, 루즈, 벨보텀,…
기장 노멀, 니렝스, 롱,…
넥라인 노카라, 라운드넥, 보트넥,…
스타일 레트로, 로맨틱, 리조트,…
멀티 라벨 분류를 위해
pre-trained ResNet50
딥러닝 모델 사용
13.
모델소개
Multi-Head Deep LearningModels
각 라벨에 대해 두 개 이상의 값을 가질 수 있어 신경망의 각 출력 헤드에 두개 이상
의 출력 feature 가 있음
• ImageNet dataset 으로 사전 학습된 Resnet50 사용
선택 이유
1. K-fashion 데이터: Multi-label 데이터
2. Multi-label 분류: multi-head 또는 multi-output
딥러닝 모델이 적합
상품데이터구축
• 패션 플랫폼‘무신사’에서 여성 의류 코디 사진 7천여건 크롤링
• 해당 코디 상품의 아이템 링크 크롤링
코디이미지 (7344건) 상품 정보 (14277건) 실제 상품 데이터셋 구축
image_id item_id item_link
1000 1001
https://store.musinsa.com/app/good
s/2200957/0
1000 1002
https://store.musinsa.com/app/good
s/2195282/0
1000 1003
https://store.musinsa.com/app/good
s/2228297/0
서비스한계&비전
Segmentation
• 하드웨어 한계→ k-fashion 데이터의 일부만 사용하여 학습. 실제 시장에는 훨씬 많은 스타일이 존재
Multi-label classification
• Feature의 많은 조합 → 모든 조합을 학습시키지 못해 loss가 크다
Recommendation
• 아이템 임베딩 방식의 한계 → 오토인코더 등 이미지 및 특성 기반 임베딩으로 발전 가능