SlideShare a Scribd company logo
1 of 8
AutoRec:Autoencoders
Meets Collaborative Filtering
추천 시스템 Boot Camp 4기 강
석우
Recommender Systems
Collaborative Filtering
Autoencoders
Abstract
Collaborative Filtering을 위한 autoencoder 프레임워크인 AutoRec 모델
compact(소형)고 효율적인 학습이 가능한 모델이다.
MovieLens와 Netflix 데이터셋 에서 실험을 했다. ( biased MF, RBM-CF, LLORMA )
SOTA를 이뤘다.
Introduction
CF 모델은 개인화 추천 제공을 위해 아이템에 대한 유저의 선호에 대한 데이터를
활용한다.
Netflix 챌린지로 MF, Neighborhood 방법 들과 함께 다양한 CF 기법이 제안 되었다.
본 논문에서 제안하는 AutoRec은 비전과 스피치 분야에서 딥러닝으로 어느 정도
성공한 Autoencoder 구조를 CF에 대입했다.
AutoRec이 다른 CF에 비해 표현력이 있고 계산적으로 우월한 면이 있다고 주장한
다.
이러한 점을 실험을 통해서 현재 SOTA 보다 좋은 성능을 보이는 점을 증명한다.
The AutoRec Model
Rating 을 기반으로 하는 CF에서는 m 으로 해당하는 유저 수, n 에 해당하는 아이
템 수, 그리고 유저와 아이템으로 부분적으로 채워져 있는 Rating 매트리스 R이 있
다.
각 유저 u는 부분적으로 관측된 벡터
각 아이템 i는 부분적으로 관측된 벡터
목표는 아이템-기반(유저-기반)의 오토인코더을 사용해서 부분적으로 관측된 r 들
을 입력으로 낮은 차원의 latent 공간으로 투영하고 다시 r을 재현해서 추천에 사용
하는 것이다.
The AutoRec Model
주어진 rating 들의 집합 S에 벡터들로 를 푼다
h는 입력 r을 재현하고 k차원의 히든 계층을 가진 auto-
associative neural network ( 데이터 패턴을 기억하는 모델)다.
item-based AutoRec 모델이 아이템 수 만큼 만들어
져서 제공된다. 부분적으로 관측된 데이터 r 만 사용하
므로 정규화로 오버피팅을 해결하려고 했다.
item-based AutoRec의 목적 함수는 아래와 같다
Relative Works
AutoRec은 RBM-Based CF, Matrix Factorization 모델과 다르다.
RBM은 generative, probabilistic 모델이다 MF 는 유저, 아이템 임베딩을 같이 임베딩 한다.
AutoEncoder(Discriminative) VS RBM(Generative)
Generative Model :
Discriminative Model :
Experimental Evaluation
테스트 케이스(전체 10%)의 Rating을 3을 기본으로 주어서 측정 했다.
(a) I/U-AutoRec과 RBM 모델의 RMSE 성능 비교
(b) Activation 함수의 linear와 non-linear 선택 에 따른 RMSE 성능 비교
(c) I-AutoRec 과 Baseline 모델의 RMSE 성능 비교
I-RBM은 학습 후 일주일이 지나면 수렴하지 못한다고 한다.

More Related Content

Similar to Auto rec autoencoders meets collaborative filtering

[NDC2015] 언제 어디서나 프로파일링 가능한 코드네임 JYP 작성기 - 라이브 게임 배포 후에도 프로파일링 하기
[NDC2015] 언제 어디서나 프로파일링 가능한 코드네임 JYP 작성기 - 라이브 게임 배포 후에도 프로파일링 하기[NDC2015] 언제 어디서나 프로파일링 가능한 코드네임 JYP 작성기 - 라이브 게임 배포 후에도 프로파일링 하기
[NDC2015] 언제 어디서나 프로파일링 가능한 코드네임 JYP 작성기 - 라이브 게임 배포 후에도 프로파일링 하기Jaeseung Ha
 
Apache Mahout 맛보기 - 30분만에 추천시스템 만들기 for 네이버 TV 서비스
Apache Mahout 맛보기 - 30분만에 추천시스템 만들기 for 네이버 TV 서비스Apache Mahout 맛보기 - 30분만에 추천시스템 만들기 for 네이버 TV 서비스
Apache Mahout 맛보기 - 30분만에 추천시스템 만들기 for 네이버 TV 서비스Minkyu Cho
 
Efficient and effective passage search via contextualized late interaction ov...
Efficient and effective passage search via contextualized late interaction ov...Efficient and effective passage search via contextualized late interaction ov...
Efficient and effective passage search via contextualized late interaction ov...taeseon ryu
 
딥러닝을 이용한 사용자 선호도 기반 의상 추천 알고리즘 Ppt 선수강
딥러닝을 이용한 사용자 선호도 기반 의상 추천 알고리즘 Ppt 선수강딥러닝을 이용한 사용자 선호도 기반 의상 추천 알고리즘 Ppt 선수강
딥러닝을 이용한 사용자 선호도 기반 의상 추천 알고리즘 Ppt 선수강Minji Kang
 
Patterns for effectviely documenting frameworks
Patterns for effectviely documenting frameworksPatterns for effectviely documenting frameworks
Patterns for effectviely documenting frameworksSunuk Park
 
Create a solution including deep learning models
Create a solution including deep learning modelsCreate a solution including deep learning models
Create a solution including deep learning modelsTae Young Lee
 
공모전 자동 팀 매칭 App_김범준 창업 도전기
공모전 자동 팀 매칭 App_김범준 창업 도전기공모전 자동 팀 매칭 App_김범준 창업 도전기
공모전 자동 팀 매칭 App_김범준 창업 도전기범준 김
 
EPG 정보 검색을 위한 예제 기반 자연어 대화 시스템
EPG 정보 검색을 위한 예제 기반 자연어 대화 시스템EPG 정보 검색을 위한 예제 기반 자연어 대화 시스템
EPG 정보 검색을 위한 예제 기반 자연어 대화 시스템Seokhwan Kim
 
네트워크 경량화 이모저모 @ 2020 DLD
네트워크 경량화 이모저모 @ 2020 DLD네트워크 경량화 이모저모 @ 2020 DLD
네트워크 경량화 이모저모 @ 2020 DLDKim Junghoon
 
AWS 클라우드 비용 최적화를 위한 모범 사례-AWS Summit Seoul 2017
AWS 클라우드 비용 최적화를 위한 모범 사례-AWS Summit Seoul 2017AWS 클라우드 비용 최적화를 위한 모범 사례-AWS Summit Seoul 2017
AWS 클라우드 비용 최적화를 위한 모범 사례-AWS Summit Seoul 2017Amazon Web Services Korea
 
Clova Tech Summit 2: 대화모델 엔진 구조와 Chatbot 개발 최적화 방안
Clova Tech Summit 2: 대화모델 엔진 구조와 Chatbot 개발 최적화 방안Clova Tech Summit 2: 대화모델 엔진 구조와 Chatbot 개발 최적화 방안
Clova Tech Summit 2: 대화모델 엔진 구조와 Chatbot 개발 최적화 방안Clova Platform
 
Chapter7~9 ppt
Chapter7~9 pptChapter7~9 ppt
Chapter7~9 pptInjae Lee
 
어플리케이션 성능 최적화 기법
어플리케이션 성능 최적화 기법어플리케이션 성능 최적화 기법
어플리케이션 성능 최적화 기법Daniel Kim
 
Rl from scratch part6
Rl from scratch part6Rl from scratch part6
Rl from scratch part6Shinwoo Park
 
위성관측 데이터 활용 강수량 산출 AI 경진대회 1위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 1위 수상작위성관측 데이터 활용 강수량 산출 AI 경진대회 1위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 1위 수상작DACON AI 데이콘
 
Spark Day 2017 Machine Learning & Deep Learning With Spark
Spark Day 2017 Machine Learning & Deep Learning With SparkSpark Day 2017 Machine Learning & Deep Learning With Spark
Spark Day 2017 Machine Learning & Deep Learning With SparkSangHoon Lee
 
2021-11-16 모두콘 딥러닝 경량화 발표
2021-11-16 모두콘 딥러닝 경량화 발표2021-11-16 모두콘 딥러닝 경량화 발표
2021-11-16 모두콘 딥러닝 경량화 발표JongkukLim
 
알고리즘 마케팅 CH5
알고리즘 마케팅 CH5알고리즘 마케팅 CH5
알고리즘 마케팅 CH5kyuchul kim
 
구글의 새로운 타겟팅 솔루션, FLoC란?
구글의 새로운 타겟팅 솔루션, FLoC란?구글의 새로운 타겟팅 솔루션, FLoC란?
구글의 새로운 타겟팅 솔루션, FLoC란?JunsooJang
 
AWS CLOUD 2018- AWS의 새로운 통합 머신러닝 플랫폼 서비스, Amazon SageMaker (김무현 솔루션즈 아키텍트)
AWS CLOUD 2018- AWS의 새로운 통합 머신러닝 플랫폼 서비스, Amazon SageMaker (김무현 솔루션즈 아키텍트)AWS CLOUD 2018- AWS의 새로운 통합 머신러닝 플랫폼 서비스, Amazon SageMaker (김무현 솔루션즈 아키텍트)
AWS CLOUD 2018- AWS의 새로운 통합 머신러닝 플랫폼 서비스, Amazon SageMaker (김무현 솔루션즈 아키텍트)Amazon Web Services Korea
 

Similar to Auto rec autoencoders meets collaborative filtering (20)

[NDC2015] 언제 어디서나 프로파일링 가능한 코드네임 JYP 작성기 - 라이브 게임 배포 후에도 프로파일링 하기
[NDC2015] 언제 어디서나 프로파일링 가능한 코드네임 JYP 작성기 - 라이브 게임 배포 후에도 프로파일링 하기[NDC2015] 언제 어디서나 프로파일링 가능한 코드네임 JYP 작성기 - 라이브 게임 배포 후에도 프로파일링 하기
[NDC2015] 언제 어디서나 프로파일링 가능한 코드네임 JYP 작성기 - 라이브 게임 배포 후에도 프로파일링 하기
 
Apache Mahout 맛보기 - 30분만에 추천시스템 만들기 for 네이버 TV 서비스
Apache Mahout 맛보기 - 30분만에 추천시스템 만들기 for 네이버 TV 서비스Apache Mahout 맛보기 - 30분만에 추천시스템 만들기 for 네이버 TV 서비스
Apache Mahout 맛보기 - 30분만에 추천시스템 만들기 for 네이버 TV 서비스
 
Efficient and effective passage search via contextualized late interaction ov...
Efficient and effective passage search via contextualized late interaction ov...Efficient and effective passage search via contextualized late interaction ov...
Efficient and effective passage search via contextualized late interaction ov...
 
딥러닝을 이용한 사용자 선호도 기반 의상 추천 알고리즘 Ppt 선수강
딥러닝을 이용한 사용자 선호도 기반 의상 추천 알고리즘 Ppt 선수강딥러닝을 이용한 사용자 선호도 기반 의상 추천 알고리즘 Ppt 선수강
딥러닝을 이용한 사용자 선호도 기반 의상 추천 알고리즘 Ppt 선수강
 
Patterns for effectviely documenting frameworks
Patterns for effectviely documenting frameworksPatterns for effectviely documenting frameworks
Patterns for effectviely documenting frameworks
 
Create a solution including deep learning models
Create a solution including deep learning modelsCreate a solution including deep learning models
Create a solution including deep learning models
 
공모전 자동 팀 매칭 App_김범준 창업 도전기
공모전 자동 팀 매칭 App_김범준 창업 도전기공모전 자동 팀 매칭 App_김범준 창업 도전기
공모전 자동 팀 매칭 App_김범준 창업 도전기
 
EPG 정보 검색을 위한 예제 기반 자연어 대화 시스템
EPG 정보 검색을 위한 예제 기반 자연어 대화 시스템EPG 정보 검색을 위한 예제 기반 자연어 대화 시스템
EPG 정보 검색을 위한 예제 기반 자연어 대화 시스템
 
네트워크 경량화 이모저모 @ 2020 DLD
네트워크 경량화 이모저모 @ 2020 DLD네트워크 경량화 이모저모 @ 2020 DLD
네트워크 경량화 이모저모 @ 2020 DLD
 
AWS 클라우드 비용 최적화를 위한 모범 사례-AWS Summit Seoul 2017
AWS 클라우드 비용 최적화를 위한 모범 사례-AWS Summit Seoul 2017AWS 클라우드 비용 최적화를 위한 모범 사례-AWS Summit Seoul 2017
AWS 클라우드 비용 최적화를 위한 모범 사례-AWS Summit Seoul 2017
 
Clova Tech Summit 2: 대화모델 엔진 구조와 Chatbot 개발 최적화 방안
Clova Tech Summit 2: 대화모델 엔진 구조와 Chatbot 개발 최적화 방안Clova Tech Summit 2: 대화모델 엔진 구조와 Chatbot 개발 최적화 방안
Clova Tech Summit 2: 대화모델 엔진 구조와 Chatbot 개발 최적화 방안
 
Chapter7~9 ppt
Chapter7~9 pptChapter7~9 ppt
Chapter7~9 ppt
 
어플리케이션 성능 최적화 기법
어플리케이션 성능 최적화 기법어플리케이션 성능 최적화 기법
어플리케이션 성능 최적화 기법
 
Rl from scratch part6
Rl from scratch part6Rl from scratch part6
Rl from scratch part6
 
위성관측 데이터 활용 강수량 산출 AI 경진대회 1위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 1위 수상작위성관측 데이터 활용 강수량 산출 AI 경진대회 1위 수상작
위성관측 데이터 활용 강수량 산출 AI 경진대회 1위 수상작
 
Spark Day 2017 Machine Learning & Deep Learning With Spark
Spark Day 2017 Machine Learning & Deep Learning With SparkSpark Day 2017 Machine Learning & Deep Learning With Spark
Spark Day 2017 Machine Learning & Deep Learning With Spark
 
2021-11-16 모두콘 딥러닝 경량화 발표
2021-11-16 모두콘 딥러닝 경량화 발표2021-11-16 모두콘 딥러닝 경량화 발표
2021-11-16 모두콘 딥러닝 경량화 발표
 
알고리즘 마케팅 CH5
알고리즘 마케팅 CH5알고리즘 마케팅 CH5
알고리즘 마케팅 CH5
 
구글의 새로운 타겟팅 솔루션, FLoC란?
구글의 새로운 타겟팅 솔루션, FLoC란?구글의 새로운 타겟팅 솔루션, FLoC란?
구글의 새로운 타겟팅 솔루션, FLoC란?
 
AWS CLOUD 2018- AWS의 새로운 통합 머신러닝 플랫폼 서비스, Amazon SageMaker (김무현 솔루션즈 아키텍트)
AWS CLOUD 2018- AWS의 새로운 통합 머신러닝 플랫폼 서비스, Amazon SageMaker (김무현 솔루션즈 아키텍트)AWS CLOUD 2018- AWS의 새로운 통합 머신러닝 플랫폼 서비스, Amazon SageMaker (김무현 솔루션즈 아키텍트)
AWS CLOUD 2018- AWS의 새로운 통합 머신러닝 플랫폼 서비스, Amazon SageMaker (김무현 솔루션즈 아키텍트)
 

More from pko89403

Airflow tutorials hands_on
Airflow tutorials hands_onAirflow tutorials hands_on
Airflow tutorials hands_onpko89403
 
Wide&Deep Recommendation Model
Wide&Deep Recommendation ModelWide&Deep Recommendation Model
Wide&Deep Recommendation Modelpko89403
 
DeepAR:Probabilistic Forecasting with Autogressive Recurrent Networks
DeepAR:Probabilistic Forecasting with Autogressive Recurrent Networks DeepAR:Probabilistic Forecasting with Autogressive Recurrent Networks
DeepAR:Probabilistic Forecasting with Autogressive Recurrent Networks pko89403
 
Improving Language Understanding by Generative Pre-Training
Improving Language Understanding by Generative Pre-TrainingImproving Language Understanding by Generative Pre-Training
Improving Language Understanding by Generative Pre-Trainingpko89403
 
CNN Introduction
CNN IntroductionCNN Introduction
CNN Introductionpko89403
 
AutoEncoder&GAN Introduction
AutoEncoder&GAN IntroductionAutoEncoder&GAN Introduction
AutoEncoder&GAN Introductionpko89403
 
Accelerating the machine learning lifecycle with m lflow
Accelerating the machine learning lifecycle with m lflowAccelerating the machine learning lifecycle with m lflow
Accelerating the machine learning lifecycle with m lflowpko89403
 
Graph convolutional matrix completion
Graph convolutional  matrix completionGraph convolutional  matrix completion
Graph convolutional matrix completionpko89403
 
Efficient thompson sampling for online matrix factorization recommendation
Efficient thompson sampling for online matrix factorization recommendationEfficient thompson sampling for online matrix factorization recommendation
Efficient thompson sampling for online matrix factorization recommendationpko89403
 
Session based rcommendations with recurrent neural networks
Session based rcommendations with recurrent neural networksSession based rcommendations with recurrent neural networks
Session based rcommendations with recurrent neural networkspko89403
 

More from pko89403 (11)

Airflow tutorials hands_on
Airflow tutorials hands_onAirflow tutorials hands_on
Airflow tutorials hands_on
 
Wide&Deep Recommendation Model
Wide&Deep Recommendation ModelWide&Deep Recommendation Model
Wide&Deep Recommendation Model
 
DeepAR:Probabilistic Forecasting with Autogressive Recurrent Networks
DeepAR:Probabilistic Forecasting with Autogressive Recurrent Networks DeepAR:Probabilistic Forecasting with Autogressive Recurrent Networks
DeepAR:Probabilistic Forecasting with Autogressive Recurrent Networks
 
Item2Vec
Item2VecItem2Vec
Item2Vec
 
Improving Language Understanding by Generative Pre-Training
Improving Language Understanding by Generative Pre-TrainingImproving Language Understanding by Generative Pre-Training
Improving Language Understanding by Generative Pre-Training
 
CNN Introduction
CNN IntroductionCNN Introduction
CNN Introduction
 
AutoEncoder&GAN Introduction
AutoEncoder&GAN IntroductionAutoEncoder&GAN Introduction
AutoEncoder&GAN Introduction
 
Accelerating the machine learning lifecycle with m lflow
Accelerating the machine learning lifecycle with m lflowAccelerating the machine learning lifecycle with m lflow
Accelerating the machine learning lifecycle with m lflow
 
Graph convolutional matrix completion
Graph convolutional  matrix completionGraph convolutional  matrix completion
Graph convolutional matrix completion
 
Efficient thompson sampling for online matrix factorization recommendation
Efficient thompson sampling for online matrix factorization recommendationEfficient thompson sampling for online matrix factorization recommendation
Efficient thompson sampling for online matrix factorization recommendation
 
Session based rcommendations with recurrent neural networks
Session based rcommendations with recurrent neural networksSession based rcommendations with recurrent neural networks
Session based rcommendations with recurrent neural networks
 

Auto rec autoencoders meets collaborative filtering

  • 1. AutoRec:Autoencoders Meets Collaborative Filtering 추천 시스템 Boot Camp 4기 강 석우 Recommender Systems Collaborative Filtering Autoencoders
  • 2. Abstract Collaborative Filtering을 위한 autoencoder 프레임워크인 AutoRec 모델 compact(소형)고 효율적인 학습이 가능한 모델이다. MovieLens와 Netflix 데이터셋 에서 실험을 했다. ( biased MF, RBM-CF, LLORMA ) SOTA를 이뤘다.
  • 3. Introduction CF 모델은 개인화 추천 제공을 위해 아이템에 대한 유저의 선호에 대한 데이터를 활용한다. Netflix 챌린지로 MF, Neighborhood 방법 들과 함께 다양한 CF 기법이 제안 되었다. 본 논문에서 제안하는 AutoRec은 비전과 스피치 분야에서 딥러닝으로 어느 정도 성공한 Autoencoder 구조를 CF에 대입했다. AutoRec이 다른 CF에 비해 표현력이 있고 계산적으로 우월한 면이 있다고 주장한 다. 이러한 점을 실험을 통해서 현재 SOTA 보다 좋은 성능을 보이는 점을 증명한다.
  • 4. The AutoRec Model Rating 을 기반으로 하는 CF에서는 m 으로 해당하는 유저 수, n 에 해당하는 아이 템 수, 그리고 유저와 아이템으로 부분적으로 채워져 있는 Rating 매트리스 R이 있 다. 각 유저 u는 부분적으로 관측된 벡터 각 아이템 i는 부분적으로 관측된 벡터 목표는 아이템-기반(유저-기반)의 오토인코더을 사용해서 부분적으로 관측된 r 들 을 입력으로 낮은 차원의 latent 공간으로 투영하고 다시 r을 재현해서 추천에 사용 하는 것이다.
  • 5. The AutoRec Model 주어진 rating 들의 집합 S에 벡터들로 를 푼다 h는 입력 r을 재현하고 k차원의 히든 계층을 가진 auto- associative neural network ( 데이터 패턴을 기억하는 모델)다. item-based AutoRec 모델이 아이템 수 만큼 만들어 져서 제공된다. 부분적으로 관측된 데이터 r 만 사용하 므로 정규화로 오버피팅을 해결하려고 했다. item-based AutoRec의 목적 함수는 아래와 같다
  • 6. Relative Works AutoRec은 RBM-Based CF, Matrix Factorization 모델과 다르다. RBM은 generative, probabilistic 모델이다 MF 는 유저, 아이템 임베딩을 같이 임베딩 한다.
  • 8. Experimental Evaluation 테스트 케이스(전체 10%)의 Rating을 3을 기본으로 주어서 측정 했다. (a) I/U-AutoRec과 RBM 모델의 RMSE 성능 비교 (b) Activation 함수의 linear와 non-linear 선택 에 따른 RMSE 성능 비교 (c) I-AutoRec 과 Baseline 모델의 RMSE 성능 비교 I-RBM은 학습 후 일주일이 지나면 수렴하지 못한다고 한다.