SlideShare a Scribd company logo
1 of 20
Download to read offline
추천시스템
김새민 위효원 호은재
Long tail
추천시스템, 왜 필요할까?
오프라인 :
공간의 한계로 일부 인기 품목만 진열
온라인 :
모든 품목을 볼 수 있음
온라인 상에서 볼 수 있는 품목 = Long tail
• 사용자는 오히려 많은 상품들 속에서 무엇을 선택해야 할지 혼란을 겪음
• 고객에게 맞는 적절한 상품을 추천한다면, 고객의 편의와 판매율을 높일 수 있다!
Long tail
추천시스템, 왜 필요할까?
오프라인 :
공간의 한계로 일부 인기 품목만 진열
온라인 :
모든 품목을 볼 수 있음
온라인 상에서 볼 수 있는 품목 = Long tail
• 사용자는 오히려 많은 상품들 속에서 무엇을 선택해야 할지 혼란을 겪음
• 고객에게 맞는 적절한 상품을 추천한다면, 고객의 편의와 판매율을 높일 수 있다!
Utility Matrix
추천 시스템은 matrix에 존재하는 데이터를 바탕으로 비어 있는 값들을 예측하는 것이 목표
유저-아이템 정보를 기반으로 한 matrix
실제 Matrix는 더 방대
→ Sparse한 특징
• Content-based
• Collaborative
• Hybrid : Content & Collaborative
대표 방법
추천시스템 도입
Avatar LOTR Matrix Pirates
Alice 1 0.2
Bob 0.5 0.3
Carol 0.2 1
David 0.4
Content-based : 아이템 특성 기반
1. 사용자가 좋아하는 항목 집합 찾기
2. 프로필 구성 : 사용자가 높게 평가한 아이템이나
구매한 아이템 기반
3. 사용자 프로필을 아이템 목록과 대조하여 추천
유저가 관심을 보인 아이템의 속성을 분석하여 새로운 아이템 추천
Content-based
사용자가 평점을 매긴 아이템(영화)에서, 장르라는 특성을 찾아 점수화
Content-based
장르 별로 점수를 벡터화
→ 사용자가 관심을 보일 만한 아이템 속성(장르)을 찾을 수 있음
Content-based
VS
장점
+ 다른 사용자의 데이터는 필요 없음
+ 독특한 특징을 가진 사용자도 만족시킬 수 있
음
+ 특정 항목이 추천된 이유를 제공할 수 있음
- 신규 유저의 프로필을 어떻게 구축할 것인
지 고민이 필요
- 사용자 프로필은 항목 프로필로 작성됨
→ 평가에 반영된 장르에 해당하는 아이템만
추천됨
단점
Collaborative : 협업 필터링
User-user 간 유사도, User history 이용
선호도(아이템에 대한 점수)나 구매 이력을 바탕으로 유저 간의 유사도 측정
→ 유사한 유저의 선호 목록을 참조해서 추천
User-based
Collaborative : 협업 필터링
Item-item 간 유사도, User history 이용
Item-based
유저가 이전에 구매했던 상품을 기반으로, 그 상품과 유사한 다른 상품을 추천하는 방식
유사도 해리포터매트릭스 노트북 겨울왕국라라랜드
해리포터 1 0.97 0.99 0.93 0.89
매트릭스 0.97 1 0.96 0.94 0.93
노트북 0.99 0.96 1 0.77 0.59
겨울왕국 0.93 0.94 0.77 1 0.99
라라랜드 0.89 0.93 0.59 0.99 1
Collaborative 유저 – 평점 기록을 이용해 추천하는 방식
해리포터 매트릭스 노트북 겨울왕국 라라랜드
새민 5 4 4 3
효원 4 4 5 3
은재 2 1 4 3
선우 4 2 3 1
유저 * 유저
유사도 새민 효원 은재 선우
새민 1.00 0.96 0.82 0.98
효원 0.96 1.00 0.97 0.92
은재 0.82 0.97 1.00 0.71
선우 0.98 0.92 0.71 1.00
아이템 * 아이템
1. 유저-유저 : 유저와 비슷한 성향의 유저를 찾아서 영화 추천
2. 영화 - 영화 : 유저가 높은 평점을 매긴 영화와 유사한 영화를 추천
해리포터 매트릭스 노트북 겨울왕국 라라랜드
새민 5 4 4 3
효원 4 4 5 3
은재 2 1 4 3
선우 4 2 3 ? 1
Collaborative
유사
도
새민 효원 은재 선우
새민 1.00 0.96 0.82 0.98
효원 0.96 1.00 0.97 0.92
은재 0.82 0.97 1.00 0.71
선우 0.98 0.92 0.71 1.00
선우의 <겨울왕국> 평점 예측하기
선우와 유사한 새민 & 효원의 평점 활
용
0.98 × 3 + 0.92 × 5
0.98 + 0.92
= 3.9
Collaborative
VS
장점
+ 아이템에 대한 충분한 정보 없이도 사용 가
능
- Cold Start : ‘새로 시작할 때 곤란함’ 을 의미
하며, 새로운 유저나 아이템의 초기 정보 부족
- Sparsity : 수 많은 아이템 중 경험이 없거나,
구매하지 않은 경우가 데이터의 대부분
(Ex. 내가 평점을 매긴 영화보다 평점을 매기지 않은 영
화가 훨씬 많음)
- Scalability : 유저와 아이템의 수가 많아질수록
데이터의 크기가 기하급수로 커짐
단점
SVD
특이값 분해 (m×n)차원의 A행렬을 그림과 같이 분해하는 방법론
행렬 분해를 이용하여 차원을 축소하는 방식
→ 데이터를 대표하는 특징을 찾을 수 있다!
A=UΣV⊺
U : (m×m)차원의 직교행렬
V : (n×n)차원의 직교행렬
Σ : (m×n) 직사각 대각행렬 (대각성분 이외의 모
든 값은 0
Matrix Factorization
행렬분해를 거쳐 물음표 값을 예측하는 것
유저가 평가하지 않은 선호도를 수식을 통해 추정
Matrix Factorization
행렬분해를 거쳐 물음표 값을 예측하는 것
유저가 평가하지 않은 선호도를 수식을 통해 추정
-0.45 0.62
0.44 0.61
0.58 0.33
-0.51 0.36
5.55 0
0 12.38
-0.46 0.01 -0.50 0.57 0.46
0.56 0.51 0.31 0.5- 0.26
= • •
해리포터 매트릭스 노트북 겨울왕국 라라랜드
새민 5 4 4 3
효원 4 4 5 3
은재 2 1 4 3
선우 4 2 3 1
≒
5.46 3.85 3.65 2.41 0.82
3.16 3.92 1.15 5.26 3.10
0.87 2.16 -0.3 3.82 2.54
3.83 2.24 2.83 0.64 -0.15
Σ
U V⊺
Auto Encoder
오토인코더는 행렬 분해와 비슷하게
입력 데이터를 원래의 차원(dimension) 보다 적은 데이터로 줄인 후에,
변환한 데이터를 기반으로 원래의 데이터를 복원하는 구조
플레이리스트 표현
현재 플레이리스트에
해당 곡이 포함 -> 1
해당 곡이 포함되지 않음 -> 0
인코딩 결과
데이터를 한 문장으로 설명으로 줄임
(100여 개의 숫자들 = 임베딩)
디코딩 결과
원래 플레이리스트에 들어있었을 곡들
이 무엇인지를 유추
Auto Encoder : 추천시스템
Hybrid
협업 필터링과 콘텐츠 기반 필터링을 조합하여 상호 보완적으로 개발하는 알고리즘
콜드 스타트 문제를 해결하고자 신규 콘텐츠는 콘텐츠 기반 필터링으로,
데이터가 쌓인 후에는 협업 필터링을 적용하여 추천의 정확성을 높임
Deep learning
Deep learning을 이용한 대표적인 추천 시스템 모델 : Wide - Deep
Wide - Memorization
축적된 구매내역 데이터에서 사용 가능한 상관
관계를 사용 ex) 운동화를 사는 사람은 다른 운
동용품도 구매
Deep - Generalization
과거에 한번도 발생하지 않았던 새로운 Feature
조합을 탐색하여 추천의 다양성을 높임
신경 네트워크 요소(Deep)와 선형 모델 요소(Wide)의 장점을 결합하여
Memorization과 Generalization 모두를 달성

More Related Content

More from DataScienceLab

21-1 세종시 부동산데이터 시각화 모델링 공모전
21-1 세종시 부동산데이터 시각화 모델링 공모전21-1 세종시 부동산데이터 시각화 모델링 공모전
21-1 세종시 부동산데이터 시각화 모델링 공모전DataScienceLab
 
2021빅콘테스트 스포츠테크 부문 TOP16
2021빅콘테스트 스포츠테크 부문 TOP162021빅콘테스트 스포츠테크 부문 TOP16
2021빅콘테스트 스포츠테크 부문 TOP16DataScienceLab
 
21-2 Air Bnb Review Data EDA 5조
21-2 Air Bnb Review Data EDA 5조21-2 Air Bnb Review Data EDA 5조
21-2 Air Bnb Review Data EDA 5조DataScienceLab
 
21-2 Covid19 Data EDA 4조
21-2 Covid19 Data EDA 4조21-2 Covid19 Data EDA 4조
21-2 Covid19 Data EDA 4조DataScienceLab
 
21-1 Covid 19 데이터 EDA 3조
21-1 Covid 19 데이터 EDA 3조21-1 Covid 19 데이터 EDA 3조
21-1 Covid 19 데이터 EDA 3조DataScienceLab
 
21-2 말레이시아 스타벅스 EDA 2조
21-2 말레이시아 스타벅스 EDA 2조21-2 말레이시아 스타벅스 EDA 2조
21-2 말레이시아 스타벅스 EDA 2조DataScienceLab
 
21-2 에어비앤비 리뷰평점 EDA 1팀
21-2 에어비앤비 리뷰평점 EDA 1팀21-2 에어비앤비 리뷰평점 EDA 1팀
21-2 에어비앤비 리뷰평점 EDA 1팀DataScienceLab
 
폐렴이미지 분류 모델링 프로젝트
폐렴이미지 분류 모델링 프로젝트폐렴이미지 분류 모델링 프로젝트
폐렴이미지 분류 모델링 프로젝트DataScienceLab
 
2021호주 오픈 순위예측 프로젝트
2021호주 오픈 순위예측 프로젝트2021호주 오픈 순위예측 프로젝트
2021호주 오픈 순위예측 프로젝트DataScienceLab
 
음원 사재기 판별 시스템 모델링
음원 사재기 판별 시스템 모델링음원 사재기 판별 시스템 모델링
음원 사재기 판별 시스템 모델링DataScienceLab
 
악플분류 모델링 프로젝트
악플분류 모델링 프로젝트악플분류 모델링 프로젝트
악플분류 모델링 프로젝트DataScienceLab
 
영화 어벤져스 내 네트워크 분석
영화 어벤져스 내 네트워크 분석영화 어벤져스 내 네트워크 분석
영화 어벤져스 내 네트워크 분석DataScienceLab
 
통신사 고객 이탈분석
통신사 고객 이탈분석통신사 고객 이탈분석
통신사 고객 이탈분석DataScienceLab
 
건강식품리뷰데이터분석
건강식품리뷰데이터분석건강식품리뷰데이터분석
건강식품리뷰데이터분석DataScienceLab
 
Airbnb 리뷰데이터 분석을 통한 좋은 숙소의 조건 분석
Airbnb 리뷰데이터 분석을 통한 좋은 숙소의 조건 분석Airbnb 리뷰데이터 분석을 통한 좋은 숙소의 조건 분석
Airbnb 리뷰데이터 분석을 통한 좋은 숙소의 조건 분석DataScienceLab
 
Covid19 데이터로 선진국 및 저개발국 피해규모 분석
Covid19 데이터로 선진국 및 저개발국 피해규모 분석 Covid19 데이터로 선진국 및 저개발국 피해규모 분석
Covid19 데이터로 선진국 및 저개발국 피해규모 분석 DataScienceLab
 
에어비앤비 리뷰데이터 분석을 통한 지역별 호스트 전략 제언
에어비앤비 리뷰데이터 분석을 통한 지역별 호스트 전략 제언 에어비앤비 리뷰데이터 분석을 통한 지역별 호스트 전략 제언
에어비앤비 리뷰데이터 분석을 통한 지역별 호스트 전략 제언 DataScienceLab
 
말레이시아 스타벅스 데이터 분석을 통한 현지 마케팅 전략 평가
말레이시아 스타벅스 데이터 분석을 통한 현지 마케팅 전략 평가말레이시아 스타벅스 데이터 분석을 통한 현지 마케팅 전략 평가
말레이시아 스타벅스 데이터 분석을 통한 현지 마케팅 전략 평가DataScienceLab
 
Covid19 데이터분석을 통한 국내 코로나 대응방향 제안
Covid19 데이터분석을 통한 국내 코로나 대응방향 제안Covid19 데이터분석을 통한 국내 코로나 대응방향 제안
Covid19 데이터분석을 통한 국내 코로나 대응방향 제안DataScienceLab
 

More from DataScienceLab (20)

21-1 세종시 부동산데이터 시각화 모델링 공모전
21-1 세종시 부동산데이터 시각화 모델링 공모전21-1 세종시 부동산데이터 시각화 모델링 공모전
21-1 세종시 부동산데이터 시각화 모델링 공모전
 
2021빅콘테스트 스포츠테크 부문 TOP16
2021빅콘테스트 스포츠테크 부문 TOP162021빅콘테스트 스포츠테크 부문 TOP16
2021빅콘테스트 스포츠테크 부문 TOP16
 
21-2 Air Bnb Review Data EDA 5조
21-2 Air Bnb Review Data EDA 5조21-2 Air Bnb Review Data EDA 5조
21-2 Air Bnb Review Data EDA 5조
 
21-2 Covid19 Data EDA 4조
21-2 Covid19 Data EDA 4조21-2 Covid19 Data EDA 4조
21-2 Covid19 Data EDA 4조
 
21-1 Covid 19 데이터 EDA 3조
21-1 Covid 19 데이터 EDA 3조21-1 Covid 19 데이터 EDA 3조
21-1 Covid 19 데이터 EDA 3조
 
21-2 말레이시아 스타벅스 EDA 2조
21-2 말레이시아 스타벅스 EDA 2조21-2 말레이시아 스타벅스 EDA 2조
21-2 말레이시아 스타벅스 EDA 2조
 
21-2 에어비앤비 리뷰평점 EDA 1팀
21-2 에어비앤비 리뷰평점 EDA 1팀21-2 에어비앤비 리뷰평점 EDA 1팀
21-2 에어비앤비 리뷰평점 EDA 1팀
 
폐렴이미지 분류 모델링 프로젝트
폐렴이미지 분류 모델링 프로젝트폐렴이미지 분류 모델링 프로젝트
폐렴이미지 분류 모델링 프로젝트
 
2021호주 오픈 순위예측 프로젝트
2021호주 오픈 순위예측 프로젝트2021호주 오픈 순위예측 프로젝트
2021호주 오픈 순위예측 프로젝트
 
음원 사재기 판별 시스템 모델링
음원 사재기 판별 시스템 모델링음원 사재기 판별 시스템 모델링
음원 사재기 판별 시스템 모델링
 
악플분류 모델링 프로젝트
악플분류 모델링 프로젝트악플분류 모델링 프로젝트
악플분류 모델링 프로젝트
 
영화 어벤져스 내 네트워크 분석
영화 어벤져스 내 네트워크 분석영화 어벤져스 내 네트워크 분석
영화 어벤져스 내 네트워크 분석
 
광고 CTR 예측
광고 CTR 예측광고 CTR 예측
광고 CTR 예측
 
통신사 고객 이탈분석
통신사 고객 이탈분석통신사 고객 이탈분석
통신사 고객 이탈분석
 
건강식품리뷰데이터분석
건강식품리뷰데이터분석건강식품리뷰데이터분석
건강식품리뷰데이터분석
 
Airbnb 리뷰데이터 분석을 통한 좋은 숙소의 조건 분석
Airbnb 리뷰데이터 분석을 통한 좋은 숙소의 조건 분석Airbnb 리뷰데이터 분석을 통한 좋은 숙소의 조건 분석
Airbnb 리뷰데이터 분석을 통한 좋은 숙소의 조건 분석
 
Covid19 데이터로 선진국 및 저개발국 피해규모 분석
Covid19 데이터로 선진국 및 저개발국 피해규모 분석 Covid19 데이터로 선진국 및 저개발국 피해규모 분석
Covid19 데이터로 선진국 및 저개발국 피해규모 분석
 
에어비앤비 리뷰데이터 분석을 통한 지역별 호스트 전략 제언
에어비앤비 리뷰데이터 분석을 통한 지역별 호스트 전략 제언 에어비앤비 리뷰데이터 분석을 통한 지역별 호스트 전략 제언
에어비앤비 리뷰데이터 분석을 통한 지역별 호스트 전략 제언
 
말레이시아 스타벅스 데이터 분석을 통한 현지 마케팅 전략 평가
말레이시아 스타벅스 데이터 분석을 통한 현지 마케팅 전략 평가말레이시아 스타벅스 데이터 분석을 통한 현지 마케팅 전략 평가
말레이시아 스타벅스 데이터 분석을 통한 현지 마케팅 전략 평가
 
Covid19 데이터분석을 통한 국내 코로나 대응방향 제안
Covid19 데이터분석을 통한 국내 코로나 대응방향 제안Covid19 데이터분석을 통한 국내 코로나 대응방향 제안
Covid19 데이터분석을 통한 국내 코로나 대응방향 제안
 

Yonsei Data Science Lab - Recommender System Intro

  • 2. Long tail 추천시스템, 왜 필요할까? 오프라인 : 공간의 한계로 일부 인기 품목만 진열 온라인 : 모든 품목을 볼 수 있음 온라인 상에서 볼 수 있는 품목 = Long tail • 사용자는 오히려 많은 상품들 속에서 무엇을 선택해야 할지 혼란을 겪음 • 고객에게 맞는 적절한 상품을 추천한다면, 고객의 편의와 판매율을 높일 수 있다!
  • 3. Long tail 추천시스템, 왜 필요할까? 오프라인 : 공간의 한계로 일부 인기 품목만 진열 온라인 : 모든 품목을 볼 수 있음 온라인 상에서 볼 수 있는 품목 = Long tail • 사용자는 오히려 많은 상품들 속에서 무엇을 선택해야 할지 혼란을 겪음 • 고객에게 맞는 적절한 상품을 추천한다면, 고객의 편의와 판매율을 높일 수 있다!
  • 4. Utility Matrix 추천 시스템은 matrix에 존재하는 데이터를 바탕으로 비어 있는 값들을 예측하는 것이 목표 유저-아이템 정보를 기반으로 한 matrix 실제 Matrix는 더 방대 → Sparse한 특징 • Content-based • Collaborative • Hybrid : Content & Collaborative 대표 방법 추천시스템 도입 Avatar LOTR Matrix Pirates Alice 1 0.2 Bob 0.5 0.3 Carol 0.2 1 David 0.4
  • 5. Content-based : 아이템 특성 기반 1. 사용자가 좋아하는 항목 집합 찾기 2. 프로필 구성 : 사용자가 높게 평가한 아이템이나 구매한 아이템 기반 3. 사용자 프로필을 아이템 목록과 대조하여 추천 유저가 관심을 보인 아이템의 속성을 분석하여 새로운 아이템 추천
  • 6. Content-based 사용자가 평점을 매긴 아이템(영화)에서, 장르라는 특성을 찾아 점수화
  • 7. Content-based 장르 별로 점수를 벡터화 → 사용자가 관심을 보일 만한 아이템 속성(장르)을 찾을 수 있음
  • 8. Content-based VS 장점 + 다른 사용자의 데이터는 필요 없음 + 독특한 특징을 가진 사용자도 만족시킬 수 있 음 + 특정 항목이 추천된 이유를 제공할 수 있음 - 신규 유저의 프로필을 어떻게 구축할 것인 지 고민이 필요 - 사용자 프로필은 항목 프로필로 작성됨 → 평가에 반영된 장르에 해당하는 아이템만 추천됨 단점
  • 9. Collaborative : 협업 필터링 User-user 간 유사도, User history 이용 선호도(아이템에 대한 점수)나 구매 이력을 바탕으로 유저 간의 유사도 측정 → 유사한 유저의 선호 목록을 참조해서 추천 User-based
  • 10. Collaborative : 협업 필터링 Item-item 간 유사도, User history 이용 Item-based 유저가 이전에 구매했던 상품을 기반으로, 그 상품과 유사한 다른 상품을 추천하는 방식
  • 11. 유사도 해리포터매트릭스 노트북 겨울왕국라라랜드 해리포터 1 0.97 0.99 0.93 0.89 매트릭스 0.97 1 0.96 0.94 0.93 노트북 0.99 0.96 1 0.77 0.59 겨울왕국 0.93 0.94 0.77 1 0.99 라라랜드 0.89 0.93 0.59 0.99 1 Collaborative 유저 – 평점 기록을 이용해 추천하는 방식 해리포터 매트릭스 노트북 겨울왕국 라라랜드 새민 5 4 4 3 효원 4 4 5 3 은재 2 1 4 3 선우 4 2 3 1 유저 * 유저 유사도 새민 효원 은재 선우 새민 1.00 0.96 0.82 0.98 효원 0.96 1.00 0.97 0.92 은재 0.82 0.97 1.00 0.71 선우 0.98 0.92 0.71 1.00 아이템 * 아이템 1. 유저-유저 : 유저와 비슷한 성향의 유저를 찾아서 영화 추천 2. 영화 - 영화 : 유저가 높은 평점을 매긴 영화와 유사한 영화를 추천
  • 12. 해리포터 매트릭스 노트북 겨울왕국 라라랜드 새민 5 4 4 3 효원 4 4 5 3 은재 2 1 4 3 선우 4 2 3 ? 1 Collaborative 유사 도 새민 효원 은재 선우 새민 1.00 0.96 0.82 0.98 효원 0.96 1.00 0.97 0.92 은재 0.82 0.97 1.00 0.71 선우 0.98 0.92 0.71 1.00 선우의 <겨울왕국> 평점 예측하기 선우와 유사한 새민 & 효원의 평점 활 용 0.98 × 3 + 0.92 × 5 0.98 + 0.92 = 3.9
  • 13. Collaborative VS 장점 + 아이템에 대한 충분한 정보 없이도 사용 가 능 - Cold Start : ‘새로 시작할 때 곤란함’ 을 의미 하며, 새로운 유저나 아이템의 초기 정보 부족 - Sparsity : 수 많은 아이템 중 경험이 없거나, 구매하지 않은 경우가 데이터의 대부분 (Ex. 내가 평점을 매긴 영화보다 평점을 매기지 않은 영 화가 훨씬 많음) - Scalability : 유저와 아이템의 수가 많아질수록 데이터의 크기가 기하급수로 커짐 단점
  • 14. SVD 특이값 분해 (m×n)차원의 A행렬을 그림과 같이 분해하는 방법론 행렬 분해를 이용하여 차원을 축소하는 방식 → 데이터를 대표하는 특징을 찾을 수 있다! A=UΣV⊺ U : (m×m)차원의 직교행렬 V : (n×n)차원의 직교행렬 Σ : (m×n) 직사각 대각행렬 (대각성분 이외의 모 든 값은 0
  • 15. Matrix Factorization 행렬분해를 거쳐 물음표 값을 예측하는 것 유저가 평가하지 않은 선호도를 수식을 통해 추정
  • 16. Matrix Factorization 행렬분해를 거쳐 물음표 값을 예측하는 것 유저가 평가하지 않은 선호도를 수식을 통해 추정 -0.45 0.62 0.44 0.61 0.58 0.33 -0.51 0.36 5.55 0 0 12.38 -0.46 0.01 -0.50 0.57 0.46 0.56 0.51 0.31 0.5- 0.26 = • • 해리포터 매트릭스 노트북 겨울왕국 라라랜드 새민 5 4 4 3 효원 4 4 5 3 은재 2 1 4 3 선우 4 2 3 1 ≒ 5.46 3.85 3.65 2.41 0.82 3.16 3.92 1.15 5.26 3.10 0.87 2.16 -0.3 3.82 2.54 3.83 2.24 2.83 0.64 -0.15 Σ U V⊺
  • 17. Auto Encoder 오토인코더는 행렬 분해와 비슷하게 입력 데이터를 원래의 차원(dimension) 보다 적은 데이터로 줄인 후에, 변환한 데이터를 기반으로 원래의 데이터를 복원하는 구조
  • 18. 플레이리스트 표현 현재 플레이리스트에 해당 곡이 포함 -> 1 해당 곡이 포함되지 않음 -> 0 인코딩 결과 데이터를 한 문장으로 설명으로 줄임 (100여 개의 숫자들 = 임베딩) 디코딩 결과 원래 플레이리스트에 들어있었을 곡들 이 무엇인지를 유추 Auto Encoder : 추천시스템
  • 19. Hybrid 협업 필터링과 콘텐츠 기반 필터링을 조합하여 상호 보완적으로 개발하는 알고리즘 콜드 스타트 문제를 해결하고자 신규 콘텐츠는 콘텐츠 기반 필터링으로, 데이터가 쌓인 후에는 협업 필터링을 적용하여 추천의 정확성을 높임
  • 20. Deep learning Deep learning을 이용한 대표적인 추천 시스템 모델 : Wide - Deep Wide - Memorization 축적된 구매내역 데이터에서 사용 가능한 상관 관계를 사용 ex) 운동화를 사는 사람은 다른 운 동용품도 구매 Deep - Generalization 과거에 한번도 발생하지 않았던 새로운 Feature 조합을 탐색하여 추천의 다양성을 높임 신경 네트워크 요소(Deep)와 선형 모델 요소(Wide)의 장점을 결합하여 Memorization과 Generalization 모두를 달성