위 자료는 BOAZ 2016 하반기 프로젝트 주제의 하나로, Advanced 정규세션 동안 Base 정규세션에서 배웠던 다양한 이론들과 기본 지식들, 그리고 툴 활용능력들을 직접 실행하며 진행한 결과물입니다.
*** 워드임베딩과 인공신경망을 이용한 개인 맞춤형 레시피 추천 ***
추천 시스템의 Cold start Problem에 대처하기 위해, 대량의 레시피 텍스트로부터 각 레시피의 특징을 추출하고 이를 인공신경망에 매핑하여 복잡미묘한 입맛의 선호를 예측, 봇 인터페이스를 통해 피드백을 받는 Online learning 형태의 추천 시스템을 제안함.
6기 김성동 숭실대학교 경영학부
6기 김수연 동덕여자대학교 정보통계학과
6기 노우영 한양대학교 ERICA 응용수학과
6기 박소영 건국대학교 응용통계학과
6기 박소현 연세대학교 응용통계학과
6기 이지원 고려대학교 통계학과
** 국내 최초 대학생 빅데이터 연합동아리 BOAZ **
Blog : http://BOAZbigdata.com
Facebook : http://fb.com/BOAZbigdata
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [쇼미더뮤직 팀] : 텍스트 감정추출을 통한 노래 추천BOAZ Bigdata
데이터 분석 프로젝트를 짆애한 쇼미더뮤직 팀에서는 아래와 같은 프로젝트를 진행했습니다.
내 하루의 감정을 통해 노래를 추천받을 수 있다면 얼마나 좋을까?
자연어처리와 추천시스템 기법의 collaboration..
여러분의 감정을 추출하고, 어울리는 노래를 추천해드립니다.
**쇼미더뮤직!**
16기 김양경 건국대학교 기술경영학과
15기 김은선 세종대학교 데이터사이언스학과
16기 유수빈 동덕여자대학교 정보통계학과
16기 이상민 경희대학교 소프트웨어융합학과
16기 조하늘 동덕여자대학교 국제경영학과, 정보통계학과
16기 최 리 건국대학교 응용통계학과
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [YouPlace 팀] : 카프카와 스파크를 활용한 유튜브 영상 속 제주 명소 검색 BOAZ Bigdata
데이터 엔지니어링 프로젝트를 진행한 YouPlace팀에서는 아래와 같은 프로젝트를 진행했습니다.
<aside>
이젠 검색도 유튜브 시대
제주여행을 계획할 때 브이로그 영상을 많이 참고하실텐데요
수많은 영상들과 영상 속 분산된 명소들을 하나 하나 찾으려 생각하면 막막하지 않으셨나요?
이러한 고민을 갖고 계신 분들을 위해, 유튜브 브이로거들이 찾아간 여행 명소들을 지도에서 한 눈에 파악할 수 있도록 만들었어요
(github : https://github.com/Boaz-Youplace)
16기 엔지니어링 고은서 | 중앙대학교 소프트웨어학부
16기 엔지니어링 류정화 | 성신여자대학교 융합보안공학과
16기 엔지니어링 송경민 | 국민대학교 소프트웨어학과
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Hands-on 팀] : 수어 번역을 통한 위험 상황 속 의사소통 시스템 구축BOAZ Bigdata
데이터 분석 프로젝트를 진행한 Hands-on 팀에서는 아래와 같은 프로젝트를 진행했습니다.
'수어 번역 프로젝트'는 재난 상황 속 소외되는 농인들에게 소통의 문을 열어주자는 목표를 가지고 시작되었습니다. Hands-on팀의 수어 번역 모델을 통해 농인들은 위험 상황 속에서 도움을 요청하는 등 소통의 한계를 극복할 수 있습니다.
16기 곽민지 (동덕여자대학교 정보통계학과)
16기 김영민 (인천대학교 경제학/컴퓨터공학)
16기 김영은 (건국대학교 응용통계학과)
16기 이다인 (이화여자대학교 휴먼기계바이오공학)
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [쇼미더뮤직 팀] : 텍스트 감정추출을 통한 노래 추천BOAZ Bigdata
데이터 분석 프로젝트를 짆애한 쇼미더뮤직 팀에서는 아래와 같은 프로젝트를 진행했습니다.
내 하루의 감정을 통해 노래를 추천받을 수 있다면 얼마나 좋을까?
자연어처리와 추천시스템 기법의 collaboration..
여러분의 감정을 추출하고, 어울리는 노래를 추천해드립니다.
**쇼미더뮤직!**
16기 김양경 건국대학교 기술경영학과
15기 김은선 세종대학교 데이터사이언스학과
16기 유수빈 동덕여자대학교 정보통계학과
16기 이상민 경희대학교 소프트웨어융합학과
16기 조하늘 동덕여자대학교 국제경영학과, 정보통계학과
16기 최 리 건국대학교 응용통계학과
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [YouPlace 팀] : 카프카와 스파크를 활용한 유튜브 영상 속 제주 명소 검색 BOAZ Bigdata
데이터 엔지니어링 프로젝트를 진행한 YouPlace팀에서는 아래와 같은 프로젝트를 진행했습니다.
<aside>
이젠 검색도 유튜브 시대
제주여행을 계획할 때 브이로그 영상을 많이 참고하실텐데요
수많은 영상들과 영상 속 분산된 명소들을 하나 하나 찾으려 생각하면 막막하지 않으셨나요?
이러한 고민을 갖고 계신 분들을 위해, 유튜브 브이로거들이 찾아간 여행 명소들을 지도에서 한 눈에 파악할 수 있도록 만들었어요
(github : https://github.com/Boaz-Youplace)
16기 엔지니어링 고은서 | 중앙대학교 소프트웨어학부
16기 엔지니어링 류정화 | 성신여자대학교 융합보안공학과
16기 엔지니어링 송경민 | 국민대학교 소프트웨어학과
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Hands-on 팀] : 수어 번역을 통한 위험 상황 속 의사소통 시스템 구축BOAZ Bigdata
데이터 분석 프로젝트를 진행한 Hands-on 팀에서는 아래와 같은 프로젝트를 진행했습니다.
'수어 번역 프로젝트'는 재난 상황 속 소외되는 농인들에게 소통의 문을 열어주자는 목표를 가지고 시작되었습니다. Hands-on팀의 수어 번역 모델을 통해 농인들은 위험 상황 속에서 도움을 요청하는 등 소통의 한계를 극복할 수 있습니다.
16기 곽민지 (동덕여자대학교 정보통계학과)
16기 김영민 (인천대학교 경제학/컴퓨터공학)
16기 김영은 (건국대학교 응용통계학과)
16기 이다인 (이화여자대학교 휴먼기계바이오공학)
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [SiZoAH] : 리뷰 기반 의류 사이즈 추천시스템BOAZ Bigdata
데이터 분석 프로젝트를 진행한 SiZoAH 팀에서는 아래와 같은 프로젝트를 진행했습니다.
리뷰 기반 의류 사이즈 추천시스템
18기 박태남 고려대학교 산업경영공학과
18기 김주은 성균관대학교 문헌정보학과
18기 문다정 단국대학교 응용통계학과
18기 박희준 명지대학교 산업공학과
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [개미야 뭐하니?팀] : 투자자의 반응을 이용한 실시간 등락 예측(feat. 카프카)BOAZ Bigdata
데이터 엔지니어링 프로젝트를 진행한 개미야 뭐하니? 팀에서는 아래와 같은 프로젝트를 진행했습니다.
[Web 발신] 5분 후, 당신이 투자한 주식이 떨어집니다!
실시간으로 내 주식의 등락을 알려주는 ai가 있다?
이것만 있으면 나도 주린이 탈출
개미와 함께하는 최적의 매도 매수 타이밍
지금 이 순간, 내 주식의 미래를 볼 수 있다
(신청: https://github.com/jayleenym/AYOA)
16기 강지수 동덕여자대학교 정보통계학과
16기 김서민 숙명여자대학교 컴퓨터과학과
16기 김윤기 한양대학교 대학원 컴퓨터소프트웨어학과
16기 문예진 서강대학교 경제학과 / 빅데이터 사이언스
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [기린그림 팀] : 사용자의 손글씨가 담긴 그림 일기 생성 서비스BOAZ Bigdata
데이터 분석 프로젝트를 진행한 기린그림 팀에서는 아래와 같은 프로젝트를 진행했습니다.
기린그림 팀은 사용자의 글씨체를 학습하여 나만의 폰트로 일기를 쓰고, 사진을 업로드 하면 직접 그림을 그린 것처럼 변환하여 그림일기를 쓸 수 있도록 하는 프로젝트를 진행 했습니다.
16기 김유진 이화여자대학교 과학교육과
17기 김송성 고려대학교 통계학과
17기 박종은 연세대학교 언더우드국제학부
17기 여해인 동덕여자대학교 컴퓨터학과
17기 이보림 중앙대학교 소프트웨어학부
최보경 : 실무자를 위한 인과추론 활용 - Best Practices
발표영상 https://youtu.be/wTPEZDc6fw4
---
PAP가 준비한 팝콘 시즌1에서 프로덕트와 함께 성장하는 데이터 실무자들의 이야기를 담았습니다.
---
PAP(Product Analytics Playground)는 프로덕트 데이터 분석에 대해 편안하게 이야기할 수 있는 커뮤니티입니다.
우리는 데이터 드리븐 프로덕트 문화를 더 많은 분들이 각자의 자리에서 이끌어갈 수 있도록 하는 것을 목표로 합니다.
다양한 직군의 사람들이 모여 프로덕트를 만들듯 PAP 역시 다양한 멤버로 구성되어 있으며, 여러분들의 참여로 만들어집니다.
---
공식 페이지 : https://playinpap.oopy.io
페이스북 그룹 : https://www.facebook.com/groups/talkinpap
팀블로그 : https://playinpap.github.io
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Find Your Style 팀] : 사용자 이미지 라벨링을 통한 의류 추천 시스템BOAZ Bigdata
데이터 분석 프로젝트를 진행한 Find Your Style 팀에서는 사용자가 좋아하는 룩의 사진을 올리면 이에 맞는 스타일을 찾아 어울리는 여성 패션 상품을 추천해주는 프로젝트를 진행했습니다.
16기 강하영 동덕여자대학교 정보통계학과
16기 김지수 성신여자대학교 통계학과
16기 남유지 숙명여자대학교 컴퓨터과학전공
15기 김희현 성균관대학교 데이터사이언스융합전공
16기 박은지 숙명여자대학교 소비자경제학과
[NDC18] 야생의 땅 듀랑고의 데이터 엔지니어링 이야기: 로그 시스템 구축 경험 공유 (2부)Hyojun Jeon
NDC18에서 발표하였습니다. 현재 보고 계신 슬라이드는 2부 입니다.(총 2부)
- 1부 링크: https://goo.gl/3v4DAa
- 2부 링크: https://goo.gl/wpoZpY
(SlideShare에 슬라이드 300장 제한으로 2부로 나누어 올렸습니다. 불편하시더라도 양해 부탁드립니다.)
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Cm:)e팀] : 이커머스 고객경험 관리 분석BOAZ Bigdata
시각화 프로젝트를 진행한 Cm:)e팀에서는 고객의 입장에서 고객이 원하는 방식으로 소통할 수 있도록 기존 고객 관리 방식의 터치포인트에 관한 분석과 고객의 소리를 함께 분석할 수 있는 통합 대시보드를 구상했습니다.
16기 김수민 숙명여자대학교 경영학부
16기 김정아 고려대학교 통계학과
16기 이지혜 숙명여자대학교 소비자경제학과
14기 유가연 한양대학교 관광학부 빅데이터 융합 전공
16기 전유정 세종대학교 호텔관광경영학과
코끼리(BOAZ) 사서의 도서 추천 솔루션
: 이 책 내용이 내 취향인데, 비슷한 내용의 책은 어떻게 찾지?’
줄거리를 바탕으로 책을 고르시는 분, 관심 작가의 책을 읽고 싶은 분들께
코끼리 사서가 취향저격 책을 제안해 드립니다.
12기 강호석 고은비 고은지 양태일 이지인 전준수 정해원
[국내 최초 빅데이터 연합동아리 BOAZ]
유튜브 - https://www.youtube.com/channel/UCSniI26A56n2QZ71opJtTUg
페이스북 - https://www.facebook.com/BOAZbigdata
인스타그램 - http://www.instagram.com/boaz_bigdata
블로그 - https://blog.naver.com/boazbigdata
라이트브레인의 UX 트렌드 리포트 ‘UX Discovery - Metaverse’ 요약본 공개
Metaverse is Coming
다가올 새로운 미래상, 현실과 디지털화된 가상세계가 공존하는 세상인 메타버스를 라이트브레인 CX 컨설팅 그룹에서 분야별 주요 사례와 주목할만한 사례들을 세분류로 나누어 소개해 드립니다.
해당 자료는 세미나용으로 제작된 요약 버전이며 Rightbrain lab 독자분들 대상으로 별도의 다운로드 과정 없이 바로 보실 수 있도록 슬라이드쉐어를 통해 공개합니다.
1. 가상정보를 통해 사용자에게 새로운 경험 가치를 제안
- 시공간을 초월하는 상호작용하는 몰입감 높은 엔터테인먼트
- 현장에 있는 것처럼 실재감 높은 안전한 교육/훈련
- Tech + 실재감, 몰입감 경험
2. 가상 세계의 초월성에 기반해 새로운 삶의 방식을 제안
- 무한한 공간에서 제약 없이 모이고, 교류하고, 살아가는 사회
- Tech + 사용자 트래킹, 상호작용, 프라이버시
3. 기존 현실의 삶과 새로운 가상세계의 연결로 새로운 가치를 창출
- 현실과 가상세계를 부드럽게 연결해주는 Physital Retail & Digital Twin
- Tech + Digital Twin, 현실과 가상의 상호작용 기술
---------------------------------
* 공개해드린 자료는 요약 버전으로 메타버스 관련 아래 본 자료는 유료 판매 예정입니다.
- Metaverse commerce
- Metaverse tech 시청 촉각 기술
- Metaverse tech 트래킹 기술
-----------------------------------
* UX 트렌드 리포트 구독 문의 : jkl@rightbrain.co.kr
* UX 디자인 및 CX 컨설팅 프로젝트 문의 : support@rightbrain.co.kr
* 라이트브레인 ‘UX Discovery’는 라이트브레인의 등록상표입니다.
책 읽어주는 딥러닝: 배우 유인나가 해리포터를 읽어준다면 DEVIEW 2017Taehoon Kim
발표 영상 : https://youtu.be/klnfWhPGPRs
코드 : https://github.com/carpedm20/multi-speaker-tacotron-tensorflow
음성 합성 데모 : http://carpedm20.github.io/tacotron
발표 소개 : https://deview.kr/2017/schedule/182
딥러닝을 활용한 음성 합성 기술을 소개하고 개발 경험과 그 과정에서 얻었던 팁을 공유하고자 합니다.
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [나만 없어 범고래] : 스니커즈 중심의 리셀 시장 및 플랫폼 KREAM 분석BOAZ Bigdata
데이터 시각화 프로젝트를 진행한 '나만 없어 범고래' 팀에서는 아래와 같은 프로젝트를 진행했습니다.
스니커즈를 중심으로 현재 리셀 트렌드와 리셀 플랫폼 KREAM 을 분석하고, 기업, 서비스 등을 비교해주는 대시보드를 만들었습니다.
18기 강채현 고려대학교 산업경영공학부
17기 김민채 한국외국어대학교 스페인어과
17기 이서영 이화여자대학교 통계학과
18기 백은수 인하대학교 경영학과
18기 이해림 동덕여자대학교 정보통계학과
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [BAOBAB 팀] : 반려동물 미용업 모바일 서비스 분석BOAZ Bigdata
데이터 시각화 프로젝트를 진행한 BAOBAB 팀에서는 아래와 같은 프로젝트를 진행했습니다.
반려동물 미용업 모바일 서비스 분석
17기 강지민 숙명여자대학교 통계학과
17기 김나연 고려대학교 통계학과
17기 김지윤 성신여자대학교 융합보안공학과
17기 박이정 인하대학교 경영학과
17기 이세영 동덕여자대학교 국제경영/정보통계학과
[분석]서울시내 상권분석/폐업률을 기준으로 한 서울시 창업기업의 생존률 분석BOAZ Bigdata
위 자료는 BOAZ 2016 하반기 프로젝트 주제의 하나로, Advanced 정규세션 동안 Base 정규세션에서 배웠던 다양한 이론들과 기본 지식들, 그리고 툴 활용능력들을 직접 실행하며 진행한 결과물입니다.
*** 서울시내 상권분석/폐업률을 기준으로 한 서울시 창업기업의 생존률 분석 ***
스타벅스 옆에 있는 이디야 카페가 생존율이 높은 것에 착안하여 서울시 강남구 상권 데이터를 생존분석과 접목하여 분석해 음식점 입지 선정 전략에 대해 고찰함.
6기 김상엽 중앙대학교 영어영문학부
6기 김동환 서울과학기술대학교 산업공학과
6기 임재성 광운대학교 산업심리학과
6기 전현우 서울시립대학교 통계학과
** 국내 최초 대학생 빅데이터 연합동아리 BOAZ **
Blog : http://BOAZbigdata.com
Facebook : http://fb.com/BOAZbigdata
위 자료는 BOAZ 2016 프로젝트 주제의 하나로, 시각화 세션에서 배웠던 다양한 이론들과 기본 지식들, 그리고 툴 활용능력들을 직접 실행하며 진행한 결과물입니다.
*** 통계로 본 서울시 유기동물 정보 시각화 ***
서울시의 최근 발생한 유기동물에 대한 정보를 통계로 나타내고 이를 시각화하여 사람들에게 유기동물의 현황을 알리고 심각성 및 행동요령 정보에 대한 접근성을 향상시킴. 시각화된 정보 자료를 팜플릿으로 제작해 동물병원 및 동물보호단체에 제공하고자 함.
장민경 이화여자대학교 시각디자인전공
박슬기 서울과학기술대학교 디자인학부
김동환 서울과학기술대학교 산업공학과
** 국내 최초 대학생 빅데이터 연합동아리 BOAZ **
Blog : http://BOAZbigdata.com
Facebook : http://fb.com/BOAZbigdata
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [SiZoAH] : 리뷰 기반 의류 사이즈 추천시스템BOAZ Bigdata
데이터 분석 프로젝트를 진행한 SiZoAH 팀에서는 아래와 같은 프로젝트를 진행했습니다.
리뷰 기반 의류 사이즈 추천시스템
18기 박태남 고려대학교 산업경영공학과
18기 김주은 성균관대학교 문헌정보학과
18기 문다정 단국대학교 응용통계학과
18기 박희준 명지대학교 산업공학과
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [개미야 뭐하니?팀] : 투자자의 반응을 이용한 실시간 등락 예측(feat. 카프카)BOAZ Bigdata
데이터 엔지니어링 프로젝트를 진행한 개미야 뭐하니? 팀에서는 아래와 같은 프로젝트를 진행했습니다.
[Web 발신] 5분 후, 당신이 투자한 주식이 떨어집니다!
실시간으로 내 주식의 등락을 알려주는 ai가 있다?
이것만 있으면 나도 주린이 탈출
개미와 함께하는 최적의 매도 매수 타이밍
지금 이 순간, 내 주식의 미래를 볼 수 있다
(신청: https://github.com/jayleenym/AYOA)
16기 강지수 동덕여자대학교 정보통계학과
16기 김서민 숙명여자대학교 컴퓨터과학과
16기 김윤기 한양대학교 대학원 컴퓨터소프트웨어학과
16기 문예진 서강대학교 경제학과 / 빅데이터 사이언스
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [기린그림 팀] : 사용자의 손글씨가 담긴 그림 일기 생성 서비스BOAZ Bigdata
데이터 분석 프로젝트를 진행한 기린그림 팀에서는 아래와 같은 프로젝트를 진행했습니다.
기린그림 팀은 사용자의 글씨체를 학습하여 나만의 폰트로 일기를 쓰고, 사진을 업로드 하면 직접 그림을 그린 것처럼 변환하여 그림일기를 쓸 수 있도록 하는 프로젝트를 진행 했습니다.
16기 김유진 이화여자대학교 과학교육과
17기 김송성 고려대학교 통계학과
17기 박종은 연세대학교 언더우드국제학부
17기 여해인 동덕여자대학교 컴퓨터학과
17기 이보림 중앙대학교 소프트웨어학부
최보경 : 실무자를 위한 인과추론 활용 - Best Practices
발표영상 https://youtu.be/wTPEZDc6fw4
---
PAP가 준비한 팝콘 시즌1에서 프로덕트와 함께 성장하는 데이터 실무자들의 이야기를 담았습니다.
---
PAP(Product Analytics Playground)는 프로덕트 데이터 분석에 대해 편안하게 이야기할 수 있는 커뮤니티입니다.
우리는 데이터 드리븐 프로덕트 문화를 더 많은 분들이 각자의 자리에서 이끌어갈 수 있도록 하는 것을 목표로 합니다.
다양한 직군의 사람들이 모여 프로덕트를 만들듯 PAP 역시 다양한 멤버로 구성되어 있으며, 여러분들의 참여로 만들어집니다.
---
공식 페이지 : https://playinpap.oopy.io
페이스북 그룹 : https://www.facebook.com/groups/talkinpap
팀블로그 : https://playinpap.github.io
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Find Your Style 팀] : 사용자 이미지 라벨링을 통한 의류 추천 시스템BOAZ Bigdata
데이터 분석 프로젝트를 진행한 Find Your Style 팀에서는 사용자가 좋아하는 룩의 사진을 올리면 이에 맞는 스타일을 찾아 어울리는 여성 패션 상품을 추천해주는 프로젝트를 진행했습니다.
16기 강하영 동덕여자대학교 정보통계학과
16기 김지수 성신여자대학교 통계학과
16기 남유지 숙명여자대학교 컴퓨터과학전공
15기 김희현 성균관대학교 데이터사이언스융합전공
16기 박은지 숙명여자대학교 소비자경제학과
[NDC18] 야생의 땅 듀랑고의 데이터 엔지니어링 이야기: 로그 시스템 구축 경험 공유 (2부)Hyojun Jeon
NDC18에서 발표하였습니다. 현재 보고 계신 슬라이드는 2부 입니다.(총 2부)
- 1부 링크: https://goo.gl/3v4DAa
- 2부 링크: https://goo.gl/wpoZpY
(SlideShare에 슬라이드 300장 제한으로 2부로 나누어 올렸습니다. 불편하시더라도 양해 부탁드립니다.)
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Cm:)e팀] : 이커머스 고객경험 관리 분석BOAZ Bigdata
시각화 프로젝트를 진행한 Cm:)e팀에서는 고객의 입장에서 고객이 원하는 방식으로 소통할 수 있도록 기존 고객 관리 방식의 터치포인트에 관한 분석과 고객의 소리를 함께 분석할 수 있는 통합 대시보드를 구상했습니다.
16기 김수민 숙명여자대학교 경영학부
16기 김정아 고려대학교 통계학과
16기 이지혜 숙명여자대학교 소비자경제학과
14기 유가연 한양대학교 관광학부 빅데이터 융합 전공
16기 전유정 세종대학교 호텔관광경영학과
코끼리(BOAZ) 사서의 도서 추천 솔루션
: 이 책 내용이 내 취향인데, 비슷한 내용의 책은 어떻게 찾지?’
줄거리를 바탕으로 책을 고르시는 분, 관심 작가의 책을 읽고 싶은 분들께
코끼리 사서가 취향저격 책을 제안해 드립니다.
12기 강호석 고은비 고은지 양태일 이지인 전준수 정해원
[국내 최초 빅데이터 연합동아리 BOAZ]
유튜브 - https://www.youtube.com/channel/UCSniI26A56n2QZ71opJtTUg
페이스북 - https://www.facebook.com/BOAZbigdata
인스타그램 - http://www.instagram.com/boaz_bigdata
블로그 - https://blog.naver.com/boazbigdata
라이트브레인의 UX 트렌드 리포트 ‘UX Discovery - Metaverse’ 요약본 공개
Metaverse is Coming
다가올 새로운 미래상, 현실과 디지털화된 가상세계가 공존하는 세상인 메타버스를 라이트브레인 CX 컨설팅 그룹에서 분야별 주요 사례와 주목할만한 사례들을 세분류로 나누어 소개해 드립니다.
해당 자료는 세미나용으로 제작된 요약 버전이며 Rightbrain lab 독자분들 대상으로 별도의 다운로드 과정 없이 바로 보실 수 있도록 슬라이드쉐어를 통해 공개합니다.
1. 가상정보를 통해 사용자에게 새로운 경험 가치를 제안
- 시공간을 초월하는 상호작용하는 몰입감 높은 엔터테인먼트
- 현장에 있는 것처럼 실재감 높은 안전한 교육/훈련
- Tech + 실재감, 몰입감 경험
2. 가상 세계의 초월성에 기반해 새로운 삶의 방식을 제안
- 무한한 공간에서 제약 없이 모이고, 교류하고, 살아가는 사회
- Tech + 사용자 트래킹, 상호작용, 프라이버시
3. 기존 현실의 삶과 새로운 가상세계의 연결로 새로운 가치를 창출
- 현실과 가상세계를 부드럽게 연결해주는 Physital Retail & Digital Twin
- Tech + Digital Twin, 현실과 가상의 상호작용 기술
---------------------------------
* 공개해드린 자료는 요약 버전으로 메타버스 관련 아래 본 자료는 유료 판매 예정입니다.
- Metaverse commerce
- Metaverse tech 시청 촉각 기술
- Metaverse tech 트래킹 기술
-----------------------------------
* UX 트렌드 리포트 구독 문의 : jkl@rightbrain.co.kr
* UX 디자인 및 CX 컨설팅 프로젝트 문의 : support@rightbrain.co.kr
* 라이트브레인 ‘UX Discovery’는 라이트브레인의 등록상표입니다.
책 읽어주는 딥러닝: 배우 유인나가 해리포터를 읽어준다면 DEVIEW 2017Taehoon Kim
발표 영상 : https://youtu.be/klnfWhPGPRs
코드 : https://github.com/carpedm20/multi-speaker-tacotron-tensorflow
음성 합성 데모 : http://carpedm20.github.io/tacotron
발표 소개 : https://deview.kr/2017/schedule/182
딥러닝을 활용한 음성 합성 기술을 소개하고 개발 경험과 그 과정에서 얻었던 팁을 공유하고자 합니다.
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [나만 없어 범고래] : 스니커즈 중심의 리셀 시장 및 플랫폼 KREAM 분석BOAZ Bigdata
데이터 시각화 프로젝트를 진행한 '나만 없어 범고래' 팀에서는 아래와 같은 프로젝트를 진행했습니다.
스니커즈를 중심으로 현재 리셀 트렌드와 리셀 플랫폼 KREAM 을 분석하고, 기업, 서비스 등을 비교해주는 대시보드를 만들었습니다.
18기 강채현 고려대학교 산업경영공학부
17기 김민채 한국외국어대학교 스페인어과
17기 이서영 이화여자대학교 통계학과
18기 백은수 인하대학교 경영학과
18기 이해림 동덕여자대학교 정보통계학과
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [BAOBAB 팀] : 반려동물 미용업 모바일 서비스 분석BOAZ Bigdata
데이터 시각화 프로젝트를 진행한 BAOBAB 팀에서는 아래와 같은 프로젝트를 진행했습니다.
반려동물 미용업 모바일 서비스 분석
17기 강지민 숙명여자대학교 통계학과
17기 김나연 고려대학교 통계학과
17기 김지윤 성신여자대학교 융합보안공학과
17기 박이정 인하대학교 경영학과
17기 이세영 동덕여자대학교 국제경영/정보통계학과
[분석]서울시내 상권분석/폐업률을 기준으로 한 서울시 창업기업의 생존률 분석BOAZ Bigdata
위 자료는 BOAZ 2016 하반기 프로젝트 주제의 하나로, Advanced 정규세션 동안 Base 정규세션에서 배웠던 다양한 이론들과 기본 지식들, 그리고 툴 활용능력들을 직접 실행하며 진행한 결과물입니다.
*** 서울시내 상권분석/폐업률을 기준으로 한 서울시 창업기업의 생존률 분석 ***
스타벅스 옆에 있는 이디야 카페가 생존율이 높은 것에 착안하여 서울시 강남구 상권 데이터를 생존분석과 접목하여 분석해 음식점 입지 선정 전략에 대해 고찰함.
6기 김상엽 중앙대학교 영어영문학부
6기 김동환 서울과학기술대학교 산업공학과
6기 임재성 광운대학교 산업심리학과
6기 전현우 서울시립대학교 통계학과
** 국내 최초 대학생 빅데이터 연합동아리 BOAZ **
Blog : http://BOAZbigdata.com
Facebook : http://fb.com/BOAZbigdata
위 자료는 BOAZ 2016 프로젝트 주제의 하나로, 시각화 세션에서 배웠던 다양한 이론들과 기본 지식들, 그리고 툴 활용능력들을 직접 실행하며 진행한 결과물입니다.
*** 통계로 본 서울시 유기동물 정보 시각화 ***
서울시의 최근 발생한 유기동물에 대한 정보를 통계로 나타내고 이를 시각화하여 사람들에게 유기동물의 현황을 알리고 심각성 및 행동요령 정보에 대한 접근성을 향상시킴. 시각화된 정보 자료를 팜플릿으로 제작해 동물병원 및 동물보호단체에 제공하고자 함.
장민경 이화여자대학교 시각디자인전공
박슬기 서울과학기술대학교 디자인학부
김동환 서울과학기술대학교 산업공학과
** 국내 최초 대학생 빅데이터 연합동아리 BOAZ **
Blog : http://BOAZbigdata.com
Facebook : http://fb.com/BOAZbigdata
[시각화]서울시내 간선도로 교통량을 활용한 주요지점 간 이동시간 시각화BOAZ Bigdata
위 자료는 BOAZ 2016 하반기 프로젝트 주제의 하나로, Advanced 정규세션 동안 Base 정규세션에서 배웠던 다양한 이론들과 기본 지식들, 그리고 툴 활용능력들을 직접 실행하며 진행한 결과물입니다.
*** 서울시내 간선도로 교통량을 활용한 주요지점 간 이동시간 시각화 ***
서울시 주요 지점의 교통량 데이터를 이용하여 관측되지 않은 지점의 교통량을 추정하고, 카토그램을 이용하여 시각화함. 구현되는 지도는 차가 많이 밀리는 곳이 넓게 보여지기 때문에 사람들의 체감 이동거리를 나타낼 수 있음.
7기 조수민 숭실대학교 경제학과
6기 박슬기 서울과학기술대학교 디자인학과
** 국내 최초 대학생 빅데이터 연합동아리 BOAZ **
Blog : http://BOAZbigdata.com
Facebook : http://fb.com/BOAZbigdata
위 자료는 BOAZ 2016 하반기 프로젝트 주제의 하나로, Advanced 정규세션 동안 Base 정규세션에서 배웠던 다양한 이론들과 기본 지식들, 그리고 툴 활용능력들을 직접 실행하며 진행한 결과물입니다.
*** 웹툰의 OSMU 가능성 예측을 위한 통계적 모델링 ***
웹툰시장에서 활발히 이루어지고 있는 OSMU(One Source Multi Use)에 대해서 다양한 통계적 기법을 통해 모델링함. 또한, 현재 미완결 웹툰 중 OSMU 가능성이 높은 웹툰을 예측함.
6기 조규원 홍익대학교 경영학과
6기 이신원 덕성여자대학교 문헌정보학과
6기 이하영 중앙대학교 응용통계학과
6기 최기준 인하대학교 통계학과
** 국내 최초 대학생 빅데이터 연합동아리 BOAZ **
Blog : http://BOAZbigdata.com
Facebook : http://fb.com/BOAZbigdata
위 자료는 BOAZ 2016 프로젝트 주제의 하나로, Advanced 정규세션 동안 Base 정규세션에서 배웠던 다양한 이론들과 기본 지식들, 그리고 툴 활용능력들을 직접 실행하며 진행한 결과물입니다.
*** CNN 이미지 인식 알고리즘을 활용한 사칙 연산 수행 ***
기존의 MNIST 이미지에 직접 수집한 숫자와 부호 이미지 데이터를 활용하여 연산이 포함된 이미지를 인식하고 계산하는 알고리즘 개발.
김현수 이화여자대학교 컴퓨터공학과
이혜진 덕성여자대학교 철학과
조혜선 단국대학교 통계학과
이은지 이화여자대학교 영문학과
** 국내 최초 대학생 빅데이터 연합동아리 BOAZ **
Blog : http://BOAZbigdata.com
Facebook : http://fb.com/BOAZbigdata
위 자료는 BOAZ 2016 하반기 프로젝트 주제의 하나로, Advanced 정규세션 동안 Base 정규세션에서 배웠던 다양한 이론들과 기본 지식들, 그리고 툴 활용능력들을 직접 실행하며 진행한 결과물입니다.
*** 서울시 2030 나홀로족을 위한 라이프 가이드북 ***
서울에 거주하는 2030 나홀로족을 위해 제작된 라이프 가이드북. 이 가이드북의 주목적은 먹는 것(식) 그리고 사는 것(주)에 대해서 그에 관한 정보를 주는 것임.
6기 김승효 중앙대학교 응용통계학과
6기 김재은 이화여자대학교 시각디자인과
7기 박다혜 한국외국어대학교 통계학과
** 국내 최초 대학생 빅데이터 연합동아리 BOAZ **
Blog : http://BOAZbigdata.com
Facebook : http://fb.com/BOAZbigdata
위 자료는 BOAZ 2016 프로젝트 주제의 하나로, Advanced 정규세션 동안 Base 정규세션에서 배웠던 다양한 이론들과 기본 지식들, 그리고 툴 활용능력들을 직접 실행하며 진행한 결과물입니다.
*** 모바일 SNS 사용자들의 감성 용어 사전 제작 및 공인대상 감성 분석 ***
트위터의 모바일 기기 사용자들이 게시한 트윗들을 분석해서 명사, 형용사로 구성된 감성 사전 제작. 이를 통해 정치, 연예 등 다양한 분야의 공인들을 대상으로 해당 서비스 사용자들의 감성 수치화 및 시간에 따른 변화 분석.
방진현 서울대학교 산업공학과
김원현 성균관대학교 수학과
허승 중앙대학교 응용통계학과
장한솔 숙명여자대학교 한국어문학부
최원빈 이화여자대학교 사회교육과
** 국내 최초 대학생 빅데이터 연합동아리 BOAZ **
Blog : http://BOAZbigdata.com
Facebook : http://fb.com/BOAZbigdata
위 자료는 BOAZ 2016 프로젝트 주제의 하나로, Advanced 정규세션 동안 Base 정규세션에서 배웠던 다양한 이론들과 기본 지식들, 그리고 툴 활용능력들을 직접 실행하며 진행한 결과물입니다.
*** 회귀 분석 및 시뮬레이션 모델에 기반한 웹서비스 제작 ***
카페의 지점별 데이터를 바탕으로 시간당 판매량에 대한 회귀식을 도출하고, 이를 대기행렬 시뮬레이션에 반영하여 예상 대기시간 및 대기인원을 실시간으로 분석하는 프로그램 제공
박경록 서강대학교 경영학과
김도연 단국대학교 응용통계학과
이창준 성균관대학교 통계학과
임수만 서울시립대학교 통계학과
홍성근 중앙대학교 컴퓨터공학과
** 국내 최초 대학생 빅데이터 연합동아리 BOAZ **
Blog : http://BOAZbigdata.com
Facebook : http://fb.com/BOAZbigdata
위 자료는 BOAZ 2016 프로젝트 주제의 하나로, Advanced 정규세션 동안 Base 정규세션에서 배웠던 다양한 이론들과 기본 지식들, 그리고 툴 활용능력들을 직접 실행하며 진행한 결과물입니다.
*** 음성데이터를 활용한 화자인식 구현 및 보안에서의 활용 ***
개인 목소리의 특징을 통계적인 방법으로 추출하여 음성데이터의 차원을 획기적으로 줄임과 동시에 데이터의 차원을 고정시켜 데이터를 화자인식과 보안문제에 응용
김형주 서울시립대학교 자연과학대학 통계학과
유재용 서울시립대학교 일반대학원 통계학과
이재환 한양대학교 일반대학원 산업공학과
조현선 이화여자대학교 일반대학원 통계학과
** 국내 최초 대학생 빅데이터 연합동아리 BOAZ **
Blog : http://BOAZbigdata.com
Facebook : http://fb.com/BOAZbigdata
[06_미국보다 한국시장에서 상대적으로 더 흥행할 영화의 사전 예측]
위 자료는 BOAZ 2016 프로젝트 주제의 하나로, Advanced 정규세션 동안 Base 정규세션에서 배웠던 다양한 이론들과 기본 지식들, 그리고 툴 활용능력들을 직접 실행하며 진행한 결과물입니다.
*** 미국보다 한국시장에서 상대적으로 더 흥행할 영화의 사전 예측 ***
영화 배급 결정이나 개봉 이후의 영화흥행도를 예측하는 것이 아닌 영화마켓(영화를 상품으로서 사고파는 시장)에서 미국영화를 수입하는 시점에서 의사결정을 돕는 분류 모델 구현 및 모델 성능 저하 요인을 분석한 자료 전시.
송석민 서울대학교 대학원 산업공학과
이주경 국민대학교 대학원 데이터사이언스학과
신재춘 단국대학교 경제학과
신재학 단국대학교 응용통계학과
강윤영 숙명여자대학교 통계학과
** 국내 최초 대학생 빅데이터 연합동아리 BOAZ **
Blog : http://BOAZbigdata.com
Facebook : http://fb.com/BOAZbigdata
위 자료는 BOAZ 2015 프로젝트 주제의 하나로, Advanced 정규세션 동안 Base 정규세션에서 배웠던 다양한 이론들과 기본 지식들, 그리고 툴 활용능력들을 직접 실행하며 진행한 결과물입니다.
*** 기상레이더를 활용한 강우 확률분포 예측 ***
Kaggle에서 제공하는 미국 NEXRAD의 이중편파 기상레이더 데이터 및 MADIS의 우량계 데이터를 활용한 시간 당 강우량 확률분포 예측
- 이중편파 기상레이더 소개, 데이터 탐색 및 분석 과정, 강우량 확률분포 예측 모델 소개
건국대학교 응용통계학과 박민식
단국대학교 정보통계학과 박인성
서울과학기술대학교 산업공학과 신현리
중앙대학교 응용통계학과 최준
** 국내 최초 대학생 빅데이터 연합동아리 BOAZ **
Blog : http://BOAZbigdata.com
Facebook : http://fb.com/BOAZbigdata
위 자료는 BOAZ 2014 프로젝트 주제의 하나로, Advanced 정규세션 동안 Base 정규세션에서 배웠던 다양한 이론들과 기본 지식들, 그리고 툴 활용능력들을 직접 실행하며 진행한 결과물입니다.
*** 애니메이션 영화 포스터 색채분석 ***
2000년 이후의 '미국과 일본 애니메이션 영화 포스터'와 '주요 애니메이션 제작사(5개 제작사)'의 애니메이션 영화 포스터 색채분석과 감정 형용사 분석
- 애니메이션 영화 포스터 주제 선정 배경
- 포스터 색상 데이터 분석 및 시각화 과정
- 색상별 감정 형용사 추출 및 시각화 과정
- 디자인 컨셉 설명 및 결과물 소개
이화여자대학교 영상디자인 박소영
아주대학교 미디어학과 최아름
단국대학교 정보통계학과 박인성
홍익대학교 시각디자인과 김나현
** 국내 최초 대학생 빅데이터 연합동아리 BOAZ **
Blog : http://BOAZbigdata.com
Facebook : http://fb.com/BOAZbigdata
위 자료는 BOAZ 2015 프로젝트 주제의 하나로, Advanced 정규세션 동안 Base 정규세션에서 배웠던 다양한 이론들과 기본 지식들, 그리고 툴 활용능력들을 직접 실행하며 진행한 결과물입니다.
*** 프리미어리그 축구팀 승자 예측 ***
프리미어리그 2014/2015 시즌 데이터를 기초한 본 프로젝트는 데이터베이스 테이블을 구축하고 예측 모형을 모델링하고 남은 경기로 예측을 실시. 이 예측 모델을 기반으로 경기 예측 어플리케이션을 구현했습니다.
송준호 국민대학교 경영정보학과 10
허성오 인천대학교 컴퓨터공학과 09
김그리나 이화여자대학교 영상디자인과 13
** 국내 최초 대학생 빅데이터 연합동아리 BOAZ **
Blog : http://BOAZbigdata.com
Facebook : http://fb.com/BOAZbigdata
Türk firmalarının ihracatta yeni pazarlara açılmasına destek amaçlı Globrand Strateji ve Danışmanlık tarafından hazırlanmış tanıtım sunumu. Kolombiya pazarındaki gelişim ve Türk firmaları için fırsatlar
위 자료는 BOAZ 2016 프로젝트 주제의 하나로, 시각화 세션에서 배웠던 다양한 이론들과 기본 지식들, 그리고 툴 활용능력들을 직접 실행하며 진행한 결과물입니다.
*** 소고기와 돼지고기에 대한 정보 시각화 ***
우리가 흔히 접하는 돼지고기와 소고기에 대해 축산유통종합정보센터와 농식품종합정보시스템에서 제공하는 유용한 자료를 데이터시각화.
김승효 중앙대학교 응용통계학과
김윤지 이화여자대학교 시각디자인학과
조영민 국민대학교 언론정보학구 광고학
** 국내 최초 대학생 빅데이터 연합동아리 BOAZ **
Blog : http://BOAZbigdata.com
Facebook : http://fb.com/BOAZbigdata
가격비교 사이트에서의 사용자 경험(USER EXPERIENCE DESIGN)에 대한 이야기Taeyong Kim
에누리닷컴에 재직중일 때 2006년 사용자경험 컨퍼런스에 다녀와서 사내교육용으로 PT한 내용입니다. 가격비교사이트와 사용자경험에 대한 내용으로 PT하였습니다. 2006년의 내용인데 3년이 지난 지금도 변하지 않는 진리처럼 다가옵니다.
비단 가격비교 사이트에만 적용되는 내용은 아닌 듯 합니다.
가격비교 사이트에서의 사용자 경험(USER EXPERIENCE DESIGN)에 대한 이야기Taeyong Kim
에누리닷컴에 재직중일 때 2006년 사용자경험 컨퍼런스에 다녀와서 사내교육용으로 PT한 내용입니다. 가격비교사이트와 사용자경험에 대한 내용으로 PT하였습니다. 2006년의 내용인데 3년이 지난 지금도 변하지 않는 진리처럼 다가옵니다.
비단 가격비교 사이트에만 적용되는 내용은 아닌 듯 합니다.
designDIVE eyeCan 안구마우스 교육 은교팀
영상자료를 보고싶으시면 아래 링크로 접속해주세요
http://youtu.be/4JuJ4HCzN70
기간 : 2012.07.28 ~ 2012.09.01
주최 : 한국장애인개발원, kidp한국디자인진흥원
주관 : LOVO DESIGN, 한벗재단, DOMC디자인나눔센터
후원 : 삼성전자, designBNR, theDNA, ferrum
designDIVE란?
다학제의 전문가들이 서비스디자인을 통해 수요자가 중심이 된 새로운 서비스 프로세스와 고객 접점을 디자인함으로써 사회를 변화시키는 서비스디자인 워크숍
* 자세한 설명보기 : http://cafe.naver.com/usable/1087
* eyecan이란? eyecanproject.wordpress.com
designDIVE eyeCan 안구마우스는 designDIVE의 4번째 프로젝트로서 근육병을 앓거나 장애로 손을 사용할 수 없는 사용자들의 손이 되어줄 ‘안구마우스’ 를 제작, 팀 구성은 제품 3개팀, UXUI 2개팀, 교육 2개팀, 전달서비스 팀, 패키지디자인 팀, 커뮤니케이션키트 팀으로 총 10개팀이 진행하였습니다.
숭실대학교 인공지능랩 석사과정생 조수현
1인개발 프로젝트.
--------------------------------------------------------------
ㅇ 주요 모듈
- 운동 시작 버튼
- 운동 종료 버튼
- 결과 정보 페이지
- 운동시 예상되는 사용자의 BPM에 맞는 음악 재생
ㅇ SW 유형
- Samsung Tizen Application for wearable (Gear 2, Gear S, Gear S2)
- Companion type ( > Integrated type)
□ Test 환경 정보
[배포 환경]
o Client
- Tizen 2.3.1: Gear2, GearS, GearS2
- Android 4.4: Samsung Galaxy S4
o Server
- AWS EC2, Ubuntu 14.04.2, nginx 1.4.6, mariadb 5.5.44
python 2.7, flask 0.9, uwsgi 1.9.17.1, sqlalchemy 0.15
--------------------------------------------------------------
ㅇ Note
* 본 프로젝트는 디바이스 종류에 상관없이 기어2, 기어S 및 현재 최신버전인 기어S2 에서 모두 같은 기능을 수행한다. 다만, 이전 기어 버전(기어2, 기어S)과 다르게 기어S2(2015년 10월 2일 출시)는 디자인이 원형으로 완전히 변경 되었으므로 알아서 원형디자인에 맞게 변경되도록 설계되었다. 또한 3가지 삼성 기어 시리즈에 모두 설치하는 방식으로 기기 호환성에 대한 최적화까지 완료된 상태이다.
* 학습 된 Classifier(분류기)의 unseen-data(아직 알지 못하는 데이터)에 대한 실제 분류 성능은 93.9% 이상의 Accuracy(정확도)를 보이고 있다.
--------------------------------------------------------------
ㅇ ‘S코치’란?
1) 스마트워치 기반의 웨이트트레이닝用 개인트레이너(PT) 어플리케이션
2) Machine Learning(기계학습) 알고리즘 기반의 인공지능 어플리케이션
3) 3-axis accelerometer sensor, 3-axis gyroscope sensor를 기반으로 사용 자의 모션을 감시(tracking, scheduling), 축적(summation)하여, ‘무슨 운동’을 ‘몇 회’했는지 그리고 ‘운동 별 칼로리 소모량’까지 어 플리케이션이 스스로 알아서 판단하고 기록 및 관리
4) 사용자의 운동을 촉진 할 수 있도록 사용자가 운동을 시작한 후 심장 박동수(bpm)를 예상하여, 기대되는 심박수와 가장 비슷한 BPM에 해당 되는 음악을 스스로 찾고 알아서 재생. 운동이 진행 됨에 따라서 가장 적합(fit)한 음악을 추천 받아 이어서 재생
5) 서비스 되는 헬스케어 앱 중에서 유일무이한 인터페이스 기반 서비스 로서 오직 버튼 2가지(시작/종료)로 다양한 운동을 커버 할 수 있기 때 문에 사용자는 손쉽고 직관적으로 사용 할 수 있다.
6) 서비스 되는 기존 운동 관련 앱 중에서 유일하게 유산소운동이 아닌 웨이트트레이닝(근력운동)을 위한 앱 이다.
세션 소개
개인의 능력, 팀의 협업, 그리고 회사 전체의 효율성을 향상 시키는 것은 개선의 과정을 통해 이루어집니다.
작은 개선을 통해 작은 성공을 이루고, 더 큰 기회로 이어질 수 있는 시야를 공유하고 하고자 합니다.
발표자 소개
서버 컴퓨터를 만들다가,
3년차 서버개발자가 되었고,
고양이(걸오)님을 부양하기 위해 열심히 살아가고 있습니다.
Similar to [분석]워드임베딩과 인공신경망을 이용한 개인 맞춤형 레시피 추천 (20)
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [COLLABO-AZ] : 고객 세그멘테이션 기반 개인 맞춤형 추천시스템 for 루빗BOAZ Bigdata
데이터 분석 프로젝트를 진행한 COLLABO-AZ 팀에서는 아래와 같은 프로젝트를 진행했습니다.
고객 세그멘테이션 기반 개인 맞춤형 추천시스템 for 루빗
20기 정지혜 이화여자대학교 통계학과
20기 김지민 중앙대학교 응용통계학과
20기 오태연 단국대학교 정보통계학과
20기 최은선 한양대학교 에리카캠퍼스 정보사회미디어학과
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [백발백준] : 백준봇 : 컨테이너 오케스트레이션 기반 백준 문제 추천 봇BOAZ Bigdata
데이터 엔지니어링 프로젝트를 진행한 백발백준 팀에서는 아래와 같은 프로젝트를 진행했습니다.
백준봇 : 컨테이너 오케스트레이션 기반 백준 문제 추천 봇
20기 유하준 한국외국어대학교 산업공학과
20기 안지완 중앙대학교 소프트웨어학과
20기 정태형 경기대학교 응용통계학과
20기 최윤서 숙명여자대학교 일반대학원 통계학과
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [무드등] : 무신사를 활용한 고객 상황에 따른 의류 추천 스타일링 대시보드BOAZ Bigdata
데이터 시각화 프로젝트를 진행한 무드등 팀에서는 아래와 같은 프로젝트를 진행했습니다.
무신사를 활용한 고객 상황에 따른 의류 추천 스타일링 대시보드
20기 이호림 숙명여자대학교 경영학부
20기 노승혜 숙명여자대학교 소비자경제학과
20기 정다인 성신여자대학교 통계학과
20기 홍나연 숭실대학교 정보통계보험수리학과
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [섬유유연제] : 어글리us! 스마일 Earth! : NLP 기반 프로젝트와 비즈니스 대시보드BOAZ Bigdata
데이터 시각화 프로젝트를 진행한 섬유유연제 팀에서는 아래와 같은 프로젝트를 진행했습니다.
어글리us! 스마일 Earth! : NLP 기반 프로젝트와 비즈니스 대시보드
20기 정강민 세종대학교 경영학과
20기 김기수 광운대학교 데이터사이언스전공
20기 김세연 이화여자대학교 기후에너지시스템공학전공
20기 윤여빈 성신여자대학교 수리통계데이터사이언스학부
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [SPOAZ] : Spotify 기반 개인화 음악 추천 서비스 프로젝트BOAZ Bigdata
데이터 엔지니어링 프로젝트를 진행한 SPOAZ 팀에서는 아래와 같은 프로젝트를 진행했습니다.
Spotify 기반 개인화 음악 추천 서비스 프로젝트
20기 이해현 서울여자대학교 소프트웨어융합학과
20기 안소유 서울여자대학교 소프트웨어융합학과
20기 임혁 중앙대학교 응용통계학과
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [다함께 레벨업!] : 학식 예약 서비스 yammi CRM 대시보드BOAZ Bigdata
데이터 시각화 프로젝트를 진행한 다함께 레벨업! 팀에서는 아래와 같은 프로젝트를 진행했습니다.
학식 예약 서비스 yammi CRM 대시보드
20기 조성배 중앙대학교 공공인재학부
20기 김윤지 숙명여자대학교 경영학부
20기 김지연 연세대학교 심리학과
20기 한은빈 세종대학교 경영학부
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [HAUL의 움직이는 리포트] : 투자성향 기반 주식 추천 및 기업 정보 제공 대시보드BOAZ Bigdata
데이터 시각화 프로젝트를 진행한 HAUL의 움직이는 리포트 팀에서는 아래와 같은 프로젝트를 진행했습니다.
투자성향 기반 주식 추천 및 기업 정보 제공 대시보드
20기 이준희 건국대학교 응용통계학과
20기 김지후 고려대학교 통계학과
19기 김청환 건국대학교 응용통계학과
19기 백지영 한양대학교 경영대학원 비즈니스인포매틱스학과
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [BEARS] : 이미지 캡셔닝을 통한 이모지 추천 및 해시태그 생성BOAZ Bigdata
데이터 분석 프로젝트를 진행한 BEARS 팀에서는 아래와 같은 프로젝트를 진행했습니다.
이미지 캡셔닝을 통한 이모지 추천 및 해시태그 생성
20기 최영우 인하대학교 중국학과
20기 김주은 성신여자대학교 정보시스템공학과
20기 이시내 한국외국어대학교 바이오메디컬공학과
18기 전혜주 숙명여자대학교 독일언어문화학과
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [낭만젊음사람] : UDA를 통한 중환자실 급성 호흡곤란 증후군 조기 예측BOAZ Bigdata
데이터 분석 프로젝트를 진행한 낭만젊음사람 팀에서는 아래와 같은 프로젝트를 진행했습니다.
UDA를 통한 중환자실 급성 호흡곤란 증후군 조기 예측
20기 서동혁 국민대학교 AI빅데이터융합경영학과
20기 권정을 명지대학교 산업경영공학과
20기 정재원 숙명여자대학교 통계학과
20기 황재성 세종대학교 데이터사이언스학과
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [레시피를 보아즈] : 영수증 인식 및 대화를 통한 재료 기반 레시피 추천 챗봇BOAZ Bigdata
데이터 분석 프로젝트를 진행한 레시피를 보아즈 팀에서는 아래와 같은 프로젝트를 진행했습니다.
영수증 인식 및 대화를 통한 재료 기반 레시피 추천 챗봇
20기 박진영 숙명여자대학교 경영학부
20기 서민진 경희대학교 통계학과
20기 안소유 서울여자대학교 소프트웨어융합학과
20기 윤선영 서울과학기술대학교 데이터사이언스학과
20기 이민선 한국공학대학교 산업경영학과
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [전진 4드론] : RAD(Reinforcement learning method for ...BOAZ Bigdata
데이터 분석 프로젝트를 진행한 전진4드론 팀에서는 아래와 같은 프로젝트를 진행했습니다.
RAD(Reinforcement learning method for Autonomous Drone)
20기 정재준 한양대학교 에리카캠퍼스 프랑스학과
20기 이영현 한양대학교 대학원 인공지능학과
20기 이찬 경희대학교 컴퓨터공학과
20기 정원준 건국대학교 컴퓨터공학부
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [REC] : 캠핏 데이터를 활용한 캠핑장 추천 시스템 구현BOAZ Bigdata
데이터 분석 프로젝트를 진행한 REC 팀에서는 아래와 같은 프로젝트를 진행했습니다.
캠핏 데이터를 활용한 캠핑장 추천 시스템 구현
20기 김민혜 한양대학교 경영대학원 비즈니스 인포메틱스
20기 송여진 이화여자대학교 휴먼기계바이오공학부
20기 이은효 이화여자대학교 대학원 통계학과
20기 임세은 숙명여자대학교 사회심리학과
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [4부터7] : 공방 301 데이터를 활용한 마케팅 방안 제시BOAZ Bigdata
데이터 시각화 프로젝트를 진행한 4부터7 팀에서는 아래와 같은 프로젝트를 진행했습니다.
공방 301 데이터를 활용한 마케팅 방안 제시
19기 김동하 고려대학교 미디어학부
19기 고현서 동덕여자대학교 경영학과
19기 노근혜 이화여자대학교 통계학과
19기 박상윤 가천대학교 경영학부(글로벌경영학)
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [유쾌한 반란] : Howmuch : 꽃집 관리 서비스BOAZ Bigdata
데이터 엔지니어링 프로젝트를 진행한 유쾌한 반란 팀에서는 아래와 같은 프로젝트를 진행했습니다.
일 단위 화훼 경매 데이터를 화훼소매업자들에게 제공하여 적정가에 사입할 수 있도록 돕는 서비스 기획
19기 송우석 연세대학교 컴퓨터과학과
19기 박선홍 한국외국어대학교 국제통상학과
19기 이 은 홍익대학교 산업공학과
19기 정성윤 국민대학교 경영정보학부
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [보아酒] : 리뷰 감정분석을 통한 전통주 추천 서비스BOAZ Bigdata
데이터 분석 프로젝트를 진행한 보아酒 팀에서는 아래와 같은 프로젝트를 진행했습니다.
리뷰 감정분석을 통한 전통주 추천 서비스
19기 정은진 한양대학교 ERICA 정보사회미디어학과
19기 강하연 명지대학교 경영정보학과
19기 고건호 고려대학교 통계학과
19기 김진재 중앙대학교 응용통계학과
19기 박상윤 가천대학교 경영학부(글로벌경영학)
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [이탈리안 BMT] : 지하철 지연 시간 데이터 분석 및 시각화를 위한 데이터 파이프라인 구축BOAZ Bigdata
데이터 엔지니어링 프로젝트를 진행한 이탈리안 BMT 팀에서는 아래와 같은 프로젝트를 진행했습니다.
지하철 지연 시간 데이터 분석 및 시각화를 위한 데이터 파이프라인 구축
19기 김보겸 중앙대학교 사회학과
19기 김가경 동덕여자대학교 정보통계학과
19기 김동진 경희대학교 컴퓨터공학과
19기 박재은 숙명여자대학교 컴퓨터과학전공
19기 이재준 명지대학교 융합소프트웨어 데이터테크놀로지전공
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [분모자] : 분류 모자이크BOAZ Bigdata
데이터 분석 프로젝트를 진행한 분모자 팀에서는 아래와 같은 프로젝트를 진행했습니다.
로고 자동 감지 및 모자이크 서비스 제안
19기 오효근 건국대학교 일반대학원 기계설계학과
19기 김보겸 중앙대학교 사회학과
19기 송예진 서울여자대학교 소프트웨어융합학과
19기 우아라 서울여자대학교 소프트웨어융합학과
19기 임서현 성균관대학교 글로벌리더학부
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [link-us(링커즈)] : 링키드를 위한 비즈니스 대시보드 제작BOAZ Bigdata
데이터 시각화 프로젝트를 진행한 link-us(링커즈) 팀에서는 아래와 같은 프로젝트를 진행했습니다.
링키드(linkid)를 위한 비즈니스 대시보드 제작
19기 정소영 숙명여자대학교 통계학과
19기 유나현 중앙대학교 응용통계학과
19기 이세연 성신여자대학교 빅데이터사이언스전공
19기 정다운 숙명여자대학교 통계학과
데이터 분석 프로젝트를 진행한 뉴진스 팀에서는 아래와 같은 프로젝트를 진행했습니다.
Multi-modal Fake News Detection
19기 장우솔 단국대학교 일반대학원 응용통계학과
19기 김동진 경희대학교 컴퓨터공학과
19기 박명규 한양대학교 ERICA 로봇공학과
19기 성재혁 고려대학교 컴퓨터학과
19기 신은빈 건국대학교 응용통계학과
4. 01. Introduction
Hypothesis
하지만 개인의 특정 음식에 대한 선호를 예측하는 하는 것은 매우 어렵다!
+ 입맛은 미묘한데다 그날 그날 땡기는 음식도 다 다르다!
+ 웬만해서는 싫어할 수 없는 음식들.. 치킨, 삼겹살 등
그럼에도 불구하고! 우리의 가정
개인마다 각자의 선호하는 음식의 맛, 향, 색감, 분위기, 목적 등이 있을 것이다.
이러한 요인들을 추출하고 학습하여 개인별 추천을 한다!
8. 02. Cold Start
Offline Model
추천! 하면 떠오르는 대표적 알고리즘 '협업 필터링'
메인 아이디어 :
유저 A와 유저 B의 유사도가 높을 때
유저 A에게 유저 B가 구매한 물건을 추천하면 유저 A도 좋아할 것이다!
유사도 계산을 하기 위해서는 Rating Matrix 가 필요
9. 02. Cold Start
추천! 하면 떠오르는 대표적 알고리즘 '협업 필터링'
메인 아이디어 :
유저 A와 유저 B의 유사도가 높을 때
유저 A에게 유저 B가 구매한 물건을 추천하면 유저 A도 좋아할 것이다!
유사도 계산을 하기 위해서는 Rating Matrix 가 필요
허허허
우리가 가진거라곤… 오직 레시피뿐…
Offline Model
10. 02. Cold Start
Online Model
Cold Start Problem을 해결하는 방법
Rating matrix? 필요없어!! 실시간으로 배운다. Online Model
ICML'11 Tutorial on Machine Learning for Large Scale Recommender Systems
Deepak Agarwal and Bee-Chung Chen
11. 02. Cold Start
Online Model
가장 ‘인간스러운’ 방법!
나를 정말 잘 알고 있는 가족, 친구, 애인 모두 처음부터 나를 잘 알았던 것은
아니다!! 나와 오랜 시간 함께 하다 보니 자연스레 학습!
서서히 알아간다 (봇 인터페이스를 채택한 이유가 여기에..)
[Realtime Data Mining] chap1.2 Realtime Analytics System
유저 선호도의 변화를
자연스럽게 적용
데이터 저장 비용 감소
13. 03. IRECIPE
Architecture
레시피에 대한 쿼리 (요청)
Feature Extractor
(Word2Vec)
Scoring
(Neural Network)
Information
Retrieval
Bot
Interface
𝑖 recipes
쿼리를 만족하는 i개의 레시피
𝒌 번째 레시피의 특징 추출(𝒌 ∈ 𝒊) 유저 j가 레시피 k를 좋아할지 판단
유저의 피드백을 분류기에 반영
User j
𝑝 𝑘𝑗 = 𝑝 𝑥𝑗 𝑐 𝑘
j개의 레시피의 점수로
랭킹을 매겨 추천
14. 유저 j가 레시피 k를 좋아할지 판단
03. IRECIPE
Architecture
레시피에 대한 쿼리 (요청)
Feature Extractor
(Word2Vec)
Scoring
(Neural Network)
Information
Retrieval
Bot
Interface
𝑖 recipes
쿼리를 만족하는 i개의 레시피
𝒌 번째 레시피의 특징 추출(𝒌 ∈ 𝒊)
User j
𝑝 𝑘𝑗 = 𝑝 𝑥𝑗 𝑐 𝑘
유저의 피드백을 분류기에 반영
j개의 레시피의 점수로
랭킹을 매겨 추천
15. 유저 j가 레시피 k를 좋아할지 판단
03. IRECIPE
Architecture
레시피에 대한 쿼리 (요청)
Feature Extractor
(Word2Vec)
Scoring
(Neural Network)
Information
Retrieval
Bot
Interface
𝑖 recipes
쿼리를 만족하는 i개의 레시피
𝒌 번째 레시피의 특징 추출(𝒌 ∈ 𝒊)
User j
𝑝 𝑘𝑗 = 𝑝 𝑥𝑗 𝑐 𝑘
유저의 피드백을 분류기에 반영
j개의 레시피의 점수로
랭킹을 매겨 추천
16. 03. IRECIPE
Data
그 전에! 데이터 소개부터..
`만개의 레시피` 로부터
* 약 2만 개의 레시피 크롤링
* 숫자와 문장부호 등 필터링 24.6M
3919317 개의 토큰
24142 개의 토큰셋
파이썬 + 셀레니움으로 한땀한땀 (약 20일 걸림..)
17. 03. IRECIPE
Data
레시피라는 텍스트 데이터의 특징
제목 : 등갈비찜
주재료 : 등갈비 1kg, 청양고추 2개, 떡 2줌, 물 7컵, 청주 ½컵
부재료 : 양파 ½개, 대파 ½뿌리, 후추
양 : 2인분
칼로리 : 250
난이도 : 중
다진마늘이 듬뿍 들어간 매콤한 등갈비찜입니다. 우선 등갈비는 찬물에 담가 반나절 정
도 핏물을 제거합니다. 그리고 핏물을 뺀 등갈비와 육수재료를 넣고 물 1컵, 청주 1컵을
부어 센불로 끓입니다. 그 동안 넣을 떡 1줌도 준비하고 매콤한 청양고추 2개는 어슷 썰
어 고춧가루, 간장, 다진마늘, 매실액, 참기름, 맛술, 과일즙, 소금, 후춧가루 위 재료대로
섞어 양념장을 만들고……
요리에 대한 메타 데이터가 주어지고 요리 만드
는 과정이 텍스트로 주어짐. 이 과정 속엔
메타 데이터로 주어진 주재료와 부재료 간의 쓰
임새, 맛, 식감에 대한 표현, 목적 등이 녹아있음
이러한 의미들의 차이를 학습할 수 있다면?
18. 03. IRECIPE
Feature Extraction
컴퓨터에게 단어의 의미적 차이를 어떻게 가르치면 좋을까?
이건 사과고 이건 바나나야
이 둘은 과일이라는 공통점이 있지만 색깔
도 다르고 맛도 달라. 블라블라…….
u'uc0acuacfc'
u'ubc14ub098ub098
‘
?!
컴퓨터는 단지 유니코드의 조합으로서 문
자를 인식할 뿐, 두 단어의 의미적 차이를
알지 못한다!!
19. 03. IRECIPE
Feature Extraction
컴퓨터에게 단어의 의미적 차이를 어떻게 가르치면 좋을까?
많은 방법들이 있었지만..!
• …
• A neural probabilistic language model ( Bengio et al, 2003)
• NLP (almost) from scratch(Collobert & Weston, 2008)
• Efficient Estimation of Word Representation in Vector space(Mikolov et al, 2013)
특정 단어 주변에 같이 나타날 주변 단어들을 예측하는 방식으로 고정된 차원의 벡터로 만들자!
Word2Vec( Simpler and faster model )
28. 03. IRECIPE
레시피의 특징들을 살펴보고 특정 유저 j가 좋아할지 말지
병아리 감별사 마냥 가려내는 분류기를 훈련시킨다!
+ 유저와 실시간으로 상호작용하며
Recommendation
쉽게 말해서
1. 레시피의 특징을 보고 선호 유무를 판별할 수 있어야 한다.
2. 유저로부터 피드백을 받을 수 있어야 한다.
3. 피드백을 훈련에 반영할 수 있어야 한다.
4. +a
그러려면..
29. 03. IRECIPE
Recommendation
1. 레시피의 특징을 보고 선호 유무를 판별할 수 있어야 한다.
2. 유저로부터 피드백을 받을 수 있어야 한다.
3. 피드백을 훈련에 반영할 수 있어야 한다.
4. +a
레시피 특징 벡터(100차원)
(Sum of Ingredient vectors)
복잡 미묘한 입맛을 비선형으로 선호유무와
맵핑하기 위해 인공신경망 사용!
마지막 Output Layer에
Sigmoid Unit 사용 -> Score(Prob)
히든 레이어 1개
히든 노드 400개
활성화 함수 ReLu
떡볶이 어때요?!
30. 03. IRECIPE
Recommendation
1. 레시피의 특징을 보고 선호 유무를 판별할 수 있어야 한다.
2. 유저로부터 피드백을 받을 수 있어야 한다.
3. 피드백을 훈련에 반영할 수 있어야 한다.
4. +a
떡볶이 어때요?!
노노.. 별로
다른거 없어?
아.. (유저 j는
떡볶이를 안
좋아하는구나..)
챗봇 인터페이스를 이용해 피드백을 받는다.
ℎ 𝑥 = 0.76(𝑝떡볶이 𝑗
)
𝑨𝒄𝒕𝒖𝒂𝒍 = 𝟎
Cost 발생!
31. 03. IRECIPE
Recommendation
1. 레시피의 특징을 보고 선호 유무를 판별할 수 있어야 한다.
2. 유저로부터 피드백을 받을 수 있어야 한다.
3. 피드백을 훈련에 반영할 수 있어야 한다.
4. +a
Backpropagation에 필요한 정보를 따로 저장해뒀다
피드백이 들어오면 Gradient Descent로 파라미터 업데이트
ℎ 𝑥 = 0.76(𝑝떡볶이 𝑗
)
𝐴𝑐𝑡𝑢𝑎𝑙 = 0
Cost 발생!Recommendation
Log DB
32. 03. IRECIPE
Recommendation
1. 레시피의 특징을 보고 선호 유무를 판별할 수 있어야 한다.
2. 유저로부터 피드백을 받을 수 있어야 한다.
3. 피드백을 훈련에 반영할 수 있어야 한다.
4. +a
Backpropagation에 필요한 정보를 따로 저장해뒀다
피드백이 들어오면 Gradient Descent로 파라미터 업데이트
ℎ 𝑥 = 0.76(𝑝떡볶이 𝑗
)
𝐴𝑐𝑡𝑢𝑎𝑙 = 0
Cost 발생!Recommendation
Log DB
N
Log_pk user_fk recipe_fk prob hidden actual
… … … … … …
… … … … … …
33. 03. IRECIPE
Recommendation
1. 레시피의 특징을 보고 선호 유무를 판별할 수 있어야 한다.
2. 유저로부터 피드백을 받을 수 있어야 한다.
3. 피드백을 훈련에 반영할 수 있어야 한다.
4. +a
Backpropagation에 필요한 정보를 따로 저장해뒀다
피드백이 들어오면 Gradient Descent로 파라미터 업데이트
ℎ 𝑥 = 0.76(𝑝떡볶이 𝑗
)
𝐴𝑐𝑡𝑢𝑎𝑙 = 0
Cost 발생!Recommendation
Log DB
N
Log_pk user_fk recipe_fk prob hidden actual
0 J k (떡볶이) 0.76 Binary None
… … … … … …
Forward Propagation
Forward propagation
34. 03. IRECIPE
Recommendation
1. 레시피의 특징을 보고 선호 유무를 판별할 수 있어야 한다.
2. 유저로부터 피드백을 받을 수 있어야 한다.
3. 피드백을 훈련에 반영할 수 있어야 한다.
4. +a
Backpropagation에 필요한 정보를 따로 저장해뒀다
피드백이 들어오면 Gradient Descent로 파라미터 업데이트
ℎ 𝑥 = 0.76(𝑝떡볶이 𝑗
)
𝐴𝑐𝑡𝑢𝑎𝑙 = 0
Cost 발생!Recommendation
Log DB
N
Log_pk user_fk recipe_fk prob hidden actual
0 J k (떡볶이) 0.76 Binary 0
… … … … … …
Forward Propagation
Feedback(label)
35. 03. IRECIPE
Recommendation
1. 레시피의 특징을 보고 선호 유무를 판별할 수 있어야 한다.
2. 유저로부터 피드백을 받을 수 있어야 한다.
3. 피드백을 훈련에 반영할 수 있어야 한다.
4. +a
Backpropagation에 필요한 정보를 따로 저장해뒀다
피드백이 들어오면 Gradient Descent로 파라미터 업데이트
ℎ 𝑥 = 0.76(𝑝떡볶이 𝑗
)
𝐴𝑐𝑡𝑢𝑎𝑙 = 0
Cost 발생!Recommendation
Log DB
N
Log_pk user_fk recipe_fk prob hidden actual
0 J k (떡볶이) 0.76 Binary 0
… … … … … …
Forward Propagation
Feedback(label)
Backpropagation
Gradient Descent를
이용한 Parameter Update
36. 03. IRECIPE
Recommendation
1. 레시피의 특징을 보고 선호 유무를 판별할 수 있어야 한다.
2. 유저로부터 피드백을 받을 수 있어야 한다.
3. 피드백을 훈련에 반영할 수 있어야 한다.
4. +a
Underfitting
하지만 실제 추천 서비스를 하기 위해 고민해봐야 할 두 가지 문제
Overfitting
햄버거
어때요?
별로
자장면은요?
아 싫어;;
치킨이요!!
ㅡㅡ
김치찜
어때요?
다른거 없어?
김치찌개는
요?
장난하니
김치전이요!!
ㅡㅡ
37. 03. IRECIPE
Recommendation
1. 레시피의 특징을 보고 선호 유무를 판별할 수 있어야 한다.
2. 유저로부터 피드백을 받을 수 있어야 한다.
3. 피드백을 훈련에 반영할 수 있어야 한다.
4. +a
Underfitting
하지만 실제 추천 서비스를 하기 위해 고민해봐야 할 두 가지 문제
Overfitting
햄버거
어때요?
별로
자장면은요?
아 싫어;
치킨이요!!
ㅡㅡ
김치찜
어때요?
별로
김치찌개는
요?
아 싫어;
김치전이요!!
ㅡㅡ
N
서비스 초기에 겪을 수 있는 문제로
충분한 훈련을 받지 못해서 발생
Pre-training을 통한
Parameter Initialization!
=> 초기 추천의 적중률이 올라가며
더 빠르게 수렴한다.
38. 03. IRECIPE
Recommendation
1. 레시피의 특징을 보고 선호 유무를 판별할 수 있어야 한다.
2. 유저로부터 피드백을 받을 수 있어야 한다.
3. 피드백을 훈련에 반영할 수 있어야 한다.
4. +a
Underfitting
하지만 실제 추천 서비스를 하기 위해 고민해봐야 할 두 가지 문제
Overfitting
떡볶이
어때요?
별로
자장면은요?
아 싫어;
치킨이요!!
ㅡㅡ
김치찜
어때요?
별로
김치찌개는
요?
아 싫어;
김치전이요!!
ㅡㅡ
N
인공신경망이 유저의 선호를 과적합 될
정도로 학습했을 경우 발생
일정 확률로 유저의 선호를
탐색(탐색과 활용)
=> 과적합을 피해 유저의 또 다른
선호를 학습할 수 있음
(일종의 Serendipity)
39. 03. IRECIPE
Pre-training
초기 적중률을 높이기 위한 Pre-Training
1. 태그의 조합에 따라 다른 트레이닝 셋을 구성하여
미리 Scoring Network를 훈련
2. 회원가입 시 기초적인 태그 정보 입력
3. 해당 모델로 초기화
But, 트레이닝셋을 어떻게 구성하느냐에 따라 그 결과가 천차만별..
얼마나 훈련을 시켜둬야 하는지도 애매한 문제가 있음.
40. 03. IRECIPE
Randomness
과적합을 줄이고 Serendipity를 제공하기 위한 Randomness
같은 쿼리가 들어와도 어느 정도의 Randomness가 작용하여
유저의 취향을 탐색(Exploration)한다.
41. 04. Conclusion
Evaluation
Offline Metrics : MSE, RMSE, Precision, Recall, F1 Score, ROC, AUC, MAP, Ranking loss 등
Online Metrics : CTR based A/B test
Our model...?! (threshold가 없고.. Negative를 제시하지 않음)
=> Precision : 유저 당 추천해준 아이템 중 양의 피드백을 받은 아이템의 비율
32명의 인원을 상대로 약 5일 간의 베타 테스트 결과
약 42%....
46. 04. Conclusion
Challenges
Wide and Deep learning for
Search Engine(also Recom)
https://research.googleblog.com/2016/06/wide-deep-learning-better-together-with.html
Wide Model(Memorization) Deep Model(Generalization)
47. 04. Conclusion
Challenges
Wide and Deep learning for
Search Engine(also Recom)
Wide and Deep model (Generalization & Memorization)
https://research.googleblog.com/2016/06/wide-deep-learning-better-together-with.html
48. 04. Conclusion
Conclusion
추천 시스템의 Cold Start Problem을
해결하기 위해, 인공신경망을 이용해 아이
템의 특징을 추출한 후, 함수 근사를 통해
유저의 선호를 예측하고 실시간으로 학습
하는 방식의 Online Model을 제시함.
Django를 이용해 실제 모델이 동작하는
프로토타입 구현
추후 지속적인 개선과 서비스 런칭 상의
이슈를 보완하여 실제 서비스에 투입하여
사용할 수 있을 것으로 기대 됨.
1.
2.
3.
49. Some issues
References
[1] Tomas Mikolov, Kai Chen, Greg Corrado, Jeffrey Dean
Efficient Estimation of Word Representations in Vector Space, 2013
[2] Tomas Mikolov, Ilya Sutskever, Kai Chen, Greg Corrado, Jeffrey Dean
Distributed Representations of Words and Phrases and their Compositionality,
2013
[3] Deep Neural Networks for Youtube Recommendations (Paul Covington et
al, 2016)
[4] Heng-Tze Cheng, Levent Koc, Jeremiah Harmsen, Tal Shaked, Tushar
Chandra, et al. Wide & Deep Learning for Recommender Systems, 2016
[5] Gabriel Dulac-Arnold, Richard Evans, Hado van Hasselt, Peter Sunehag,
el al. Deep Reinforcement Learning in Large Discrete Action Spaces, 2015