SlideShare a Scribd company logo
1 of 27
Download to read offline
Music is Social. 레알?
                                                                                                                                (SN을 활용한 싸이BGM추천)




                    2011.10.18
                    CTO / 기술연구소 / Data Science Team. 박태수




                                     This report contains information that is confidential and proprietary to SK Communications and is solely for the use of SK Communications personnel.
                                     No part of it may be used, circulated, quoted, or reproduced for distribution outside SK Communications. If you are not the intended recipient of this
                                     report, you are hereby notified that the use, circulation, quoting, or reproducing of this report is strictly prohibited and may be unlawful.




SK Communications
Music is Social . 레알?




                    Music is Social. 레알?




SK Communications
Music is Social . 레알?




                       Social Network ??




SK Communications
Music is Social . 레알?




                                   소     공
                                   유     유
                                       같이 들을래?




SK Communications
Music is Social . 레알?




                                   음악에 대한 폭넓은 욕구!!




SK Communications
Music is Social . 레알?




                Social Music Service

                                   Music + Social




SK Communications
Music is Social . 레알?




                                   Music is Social. 레알 ?!!




SK Communications
Music is Social . 레알?




                    대용량 데이터 처리??




SK Communications
Music is Social . 레알?




                          싸이 BGM 서비스 사용자의 일촌 통계
                                            54%

                                   45%




                                                     1%




                                   1~100   101~500   501~   일촌 수




SK Communications
Music is Social . 레알?




             음악활동(구매, 듣기) Histogram
                    사용자수

                                   cutoff




                                                  A         B         C         D




                                                                                           활동 수 비율
                           0%               20%       50%       80%       90%       100%




SK Communications
Music is Social . 레알?




                일촌 네트워크 Histogram
                    사용자수

                        cutoff




                                   1   2         3         4         5         6         7         8         9




                                                                                                                        일촌 수 분포
                              5% 10%       20%       30%       40%       50%       60%       70%       80%       100%




SK Communications
Music is Social . 레알?



                Sample Map                                               각 세그먼트당 1000명 씩 샘플링
                                   일촌 분포
                                           cutoff         A         B     C D
                                    100%


                                                          9         9     9   9
                                     80%

                                     70%
                                                          8         8     8   8
                                                          7         7     7   7
                                     60%

                                     50%
                                                          6         6     6   6
                                                          5         5     5   5
                                     40%
                                                          4         4     4   4
                                     30%

                                     20%
                                                          3         3     3   3
                                                          2         2     2   2
                                     10%
                                      5%                  1         1     1   1
                                     0%             20%       50%       80% 90% 100% 사용자 활동성




SK Communications
Music is Social . 레알?



                    Similarity(Song, Artist, Genre)
                                   사용자

                                         ……                 Similarity Measures
                                         ……
                                                               Simple Matching
                                         ……

                                                      일촌
                                                                Jaccard Coefficient
                              …          …

                    ……             ……         ……
                    ……             ……         ……
                    ……             ……         ……




SK Communications
Music is Social . 레알?




              Analysis(Song)




SK Communications
Music is Social . 레알?




               Analysis(Artist)




SK Communications
Music is Social . 레알?




               Analysis(Genre)




SK Communications
Music is Social . 레알?




                    Music is Social. 레알?



                                   일촌 네트워크 사이에서는
                                      뚜렷한 경향성을 보이지 않는다.




SK Communications
Music is Social . 레알?




                                   Social 정보를 어떻게 활용할까?


                                       • Social Music Chart
                                           일촌 Chart(Borda count)

                                       • Social Music Recommendation
                                           Collaborative Filtering




SK Communications
Music is Social . 레알?




                    Social Music Chart
                      Social Chart(Borda Count)

                            •      Borda Rank Normalization


                                                              U : a set of items
                                                              τ : rank



                            •      Borda Score




SK Communications
Music is Social . 레알?




                    Social Music Chart
                     Social Chart(Borda Count)
                    • 일촌들의 BGM 재생 횟수에 따른 Ranking

                              BGM            일촌1       일촌2       일촌3       일촌4            •    Borda Rank Normalization
                     Hello-허각                      1                   1         2
                     안녕이라고 말하지마-다비치                2         2                   4
                                                                                                                                                  U : a set of items
                     Who Am I - 유브이                3         1                   1
                                                                                                                                                  τ : rank
                     In Heaven - JYJ               4                   3         3
                     …                       …         …         …         …


                    • Borda Count를 적용한 Social Music Chart
                     BGM             일촌1              일촌2                            일촌3                      일촌4                …   SUM          Rank
                     Hello-허각        1-((1-1)/10)=1 0.5+((2-1)/(2*10))=0.55          1-((1-1)/10)=1           1-((2-1)/10)=0.9   …         3.45            1
                     안녕이라고 말하지마 -다비치 1-((2-1)/10)=0.9 1-((2-1)/10)=0.9               0.5+((3-1)/(2*10))=0.6   1-((4-1)/10)=0.7   …          3.1            3
                     Who Am I - 유브이  1-((3-1)/10)=0.8 1-((1-1)/10)=1                 0.5+((3-1)/(2*10))=0.6   1-((1-1)/10)=1     …          3.4            2
                     In Heaven - JYJ 1-((4-1)/10)=0.7 0.5+((2-1)/(2*10))=0.55        1-((3-1)/10)=0.8         1-((3-1)/10)=0.8   …         2.85            4




SK Communications
Music is Social . 레알?




                    Collaborative Filtering
                     많은 사용자들로부터 얻은 기호정보에 따라 사용자들의 관심사를 자동으로 예측하게 해주는 방법

                                     User1

                                              A   B   C   D
                          Nearest                              Recommend
                          Neighbor   User2
                                              A   B   C

                                     User3

                                              V   F   D   E




SK Communications
Music is Social . 레알?




                    Collaborative Filtering
                     Collaborative Filtering의 종류
                          사용자 기반 필터링
                                사용자 간의 유사성을 측정하여 선호도가 비슷한 다른 고객들이 평가한
                                 상품을 기반으로 특정 고객이 선호할만한 상품을 추천하는 방식
                                데이터 양이 작고, 데이터 변경이 자주 일어나는 경우


                          항목 기반 필터링
                                고객이 선호도 등급을 입력한 기존 상품들과 추천하고자 하는 상품들 간의
                                 유사성을 측정하여 특정 고객이 어떤 상품을 선호하는지 예측하여 추천
                                데이터 양이 크고, 데이터 변경이 자주 일어나지 않는 경우




SK Communications
Music is Social . 레알?




                    Collaborative Filtering
                     Item Similarity Computation
                          Pearson correlation coefficient




SK Communications
Music is Social . 레알?




                     Collaborative Filtering
                     Prediction Computation
                                                                                             Pu ,: 고객 u의 아이템 i에 대한 선호도 예측값
                                                                                                 i

                            Pu ,i 
                                      allSimilla rItems, N
                                                              ( S i , N * Ru , N )
                                                                                             R     : 고객 u의 아이템 N에 대한 Rating
                                                                                                 u,N

                                          allSimilarItems, N
                                                              (| S i , N |)
                                                                                             S     : 상품 i와 다른 상품 N의 유사도 값
                                                                                                 i, N

                     Item 유사도 Matrix                          선호도 예측
                     - 1과 5 : 0.9
                     - 2와 5 : 0.8
                     - 3과 5 : 0.2
                     - 4와 5 : 0.1


                                                                   BGM1              BGM2   BGM3        BGM4   BGM5

                                            User1                       5             4      1           2      ?

                                            User2                       1             2      5           5      1




SK Communications
Music is Social . 레알?




                    Collaborative Filtering
                                    음악 서비스를 처음 사용하는 사용자라면??
                                    구매, 재생정보가 없다면???




                                     사용자의 지인들의 Social Music Chart를 이용




SK Communications
Music is Social . 레알?




                      맺음말

                          Music is social. 레알?

                           Social Network 활용 방안
                                      Social Music Chart
                                      Social Music Recommendation




SK Communications
Music is Social . 레알?




                          Q&A
                                   Thank you for your attention!




SK Communications

More Related Content

Viewers also liked

소셜미디어를활용한온라인마케팅
소셜미디어를활용한온라인마케팅소셜미디어를활용한온라인마케팅
소셜미디어를활용한온라인마케팅guest425aa52
 
[한국의SNS 컨퍼런스]싸이월드SNS의 이해
[한국의SNS 컨퍼런스]싸이월드SNS의 이해[한국의SNS 컨퍼런스]싸이월드SNS의 이해
[한국의SNS 컨퍼런스]싸이월드SNS의 이해Bosnag-Kim
 
D2 sonic시스템구조및활용
D2 sonic시스템구조및활용D2 sonic시스템구조및활용
D2 sonic시스템구조및활용NAVER D2
 
[마케팅전략] 게임어플리케이션 매체별 마케팅 전략안
[마케팅전략] 게임어플리케이션 매체별 마케팅 전략안[마케팅전략] 게임어플리케이션 매체별 마케팅 전략안
[마케팅전략] 게임어플리케이션 매체별 마케팅 전략안Lee Sung Hoon
 
[BLT] 창업과 지식재산
[BLT] 창업과 지식재산 [BLT] 창업과 지식재산
[BLT] 창업과 지식재산 JEONG HAN Eom
 

Viewers also liked (10)

소셜미디어를활용한온라인마케팅
소셜미디어를활용한온라인마케팅소셜미디어를활용한온라인마케팅
소셜미디어를활용한온라인마케팅
 
Cyworld appstore weeklyreport_0327_1
Cyworld appstore weeklyreport_0327_1Cyworld appstore weeklyreport_0327_1
Cyworld appstore weeklyreport_0327_1
 
[한국의SNS 컨퍼런스]싸이월드SNS의 이해
[한국의SNS 컨퍼런스]싸이월드SNS의 이해[한국의SNS 컨퍼런스]싸이월드SNS의 이해
[한국의SNS 컨퍼런스]싸이월드SNS의 이해
 
D2 sonic시스템구조및활용
D2 sonic시스템구조및활용D2 sonic시스템구조및활용
D2 sonic시스템구조및활용
 
2 3 user virality-성공_전략(최종)
2 3 user virality-성공_전략(최종)2 3 user virality-성공_전략(최종)
2 3 user virality-성공_전략(최종)
 
Company analysis_SKComms
Company analysis_SKCommsCompany analysis_SKComms
Company analysis_SKComms
 
Cyworld appstore weeklyreport0402
Cyworld appstore weeklyreport0402Cyworld appstore weeklyreport0402
Cyworld appstore weeklyreport0402
 
Cyworld AppStore Weekly Report 2012-03-20
Cyworld AppStore Weekly Report 2012-03-20Cyworld AppStore Weekly Report 2012-03-20
Cyworld AppStore Weekly Report 2012-03-20
 
[마케팅전략] 게임어플리케이션 매체별 마케팅 전략안
[마케팅전략] 게임어플리케이션 매체별 마케팅 전략안[마케팅전략] 게임어플리케이션 매체별 마케팅 전략안
[마케팅전략] 게임어플리케이션 매체별 마케팅 전략안
 
[BLT] 창업과 지식재산
[BLT] 창업과 지식재산 [BLT] 창업과 지식재산
[BLT] 창업과 지식재산
 

More from NAVER D2

[211] 인공지능이 인공지능 챗봇을 만든다
[211] 인공지능이 인공지능 챗봇을 만든다[211] 인공지능이 인공지능 챗봇을 만든다
[211] 인공지능이 인공지능 챗봇을 만든다NAVER D2
 
[233] 대형 컨테이너 클러스터에서의 고가용성 Network Load Balancing: Maglev Hashing Scheduler i...
[233] 대형 컨테이너 클러스터에서의 고가용성 Network Load Balancing: Maglev Hashing Scheduler i...[233] 대형 컨테이너 클러스터에서의 고가용성 Network Load Balancing: Maglev Hashing Scheduler i...
[233] 대형 컨테이너 클러스터에서의 고가용성 Network Load Balancing: Maglev Hashing Scheduler i...NAVER D2
 
[215] Druid로 쉽고 빠르게 데이터 분석하기
[215] Druid로 쉽고 빠르게 데이터 분석하기[215] Druid로 쉽고 빠르게 데이터 분석하기
[215] Druid로 쉽고 빠르게 데이터 분석하기NAVER D2
 
[245]Papago Internals: 모델분석과 응용기술 개발
[245]Papago Internals: 모델분석과 응용기술 개발[245]Papago Internals: 모델분석과 응용기술 개발
[245]Papago Internals: 모델분석과 응용기술 개발NAVER D2
 
[236] 스트림 저장소 최적화 이야기: 아파치 드루이드로부터 얻은 교훈
[236] 스트림 저장소 최적화 이야기: 아파치 드루이드로부터 얻은 교훈[236] 스트림 저장소 최적화 이야기: 아파치 드루이드로부터 얻은 교훈
[236] 스트림 저장소 최적화 이야기: 아파치 드루이드로부터 얻은 교훈NAVER D2
 
[235]Wikipedia-scale Q&A
[235]Wikipedia-scale Q&A[235]Wikipedia-scale Q&A
[235]Wikipedia-scale Q&ANAVER D2
 
[244]로봇이 현실 세계에 대해 학습하도록 만들기
[244]로봇이 현실 세계에 대해 학습하도록 만들기[244]로봇이 현실 세계에 대해 학습하도록 만들기
[244]로봇이 현실 세계에 대해 학습하도록 만들기NAVER D2
 
[243] Deep Learning to help student’s Deep Learning
[243] Deep Learning to help student’s Deep Learning[243] Deep Learning to help student’s Deep Learning
[243] Deep Learning to help student’s Deep LearningNAVER D2
 
[234]Fast & Accurate Data Annotation Pipeline for AI applications
[234]Fast & Accurate Data Annotation Pipeline for AI applications[234]Fast & Accurate Data Annotation Pipeline for AI applications
[234]Fast & Accurate Data Annotation Pipeline for AI applicationsNAVER D2
 
Old version: [233]대형 컨테이너 클러스터에서의 고가용성 Network Load Balancing
Old version: [233]대형 컨테이너 클러스터에서의 고가용성 Network Load BalancingOld version: [233]대형 컨테이너 클러스터에서의 고가용성 Network Load Balancing
Old version: [233]대형 컨테이너 클러스터에서의 고가용성 Network Load BalancingNAVER D2
 
[226]NAVER 광고 deep click prediction: 모델링부터 서빙까지
[226]NAVER 광고 deep click prediction: 모델링부터 서빙까지[226]NAVER 광고 deep click prediction: 모델링부터 서빙까지
[226]NAVER 광고 deep click prediction: 모델링부터 서빙까지NAVER D2
 
[225]NSML: 머신러닝 플랫폼 서비스하기 & 모델 튜닝 자동화하기
[225]NSML: 머신러닝 플랫폼 서비스하기 & 모델 튜닝 자동화하기[225]NSML: 머신러닝 플랫폼 서비스하기 & 모델 튜닝 자동화하기
[225]NSML: 머신러닝 플랫폼 서비스하기 & 모델 튜닝 자동화하기NAVER D2
 
[224]네이버 검색과 개인화
[224]네이버 검색과 개인화[224]네이버 검색과 개인화
[224]네이버 검색과 개인화NAVER D2
 
[216]Search Reliability Engineering (부제: 지진에도 흔들리지 않는 네이버 검색시스템)
[216]Search Reliability Engineering (부제: 지진에도 흔들리지 않는 네이버 검색시스템)[216]Search Reliability Engineering (부제: 지진에도 흔들리지 않는 네이버 검색시스템)
[216]Search Reliability Engineering (부제: 지진에도 흔들리지 않는 네이버 검색시스템)NAVER D2
 
[214] Ai Serving Platform: 하루 수 억 건의 인퍼런스를 처리하기 위한 고군분투기
[214] Ai Serving Platform: 하루 수 억 건의 인퍼런스를 처리하기 위한 고군분투기[214] Ai Serving Platform: 하루 수 억 건의 인퍼런스를 처리하기 위한 고군분투기
[214] Ai Serving Platform: 하루 수 억 건의 인퍼런스를 처리하기 위한 고군분투기NAVER D2
 
[213] Fashion Visual Search
[213] Fashion Visual Search[213] Fashion Visual Search
[213] Fashion Visual SearchNAVER D2
 
[232] TensorRT를 활용한 딥러닝 Inference 최적화
[232] TensorRT를 활용한 딥러닝 Inference 최적화[232] TensorRT를 활용한 딥러닝 Inference 최적화
[232] TensorRT를 활용한 딥러닝 Inference 최적화NAVER D2
 
[242]컴퓨터 비전을 이용한 실내 지도 자동 업데이트 방법: 딥러닝을 통한 POI 변화 탐지
[242]컴퓨터 비전을 이용한 실내 지도 자동 업데이트 방법: 딥러닝을 통한 POI 변화 탐지[242]컴퓨터 비전을 이용한 실내 지도 자동 업데이트 방법: 딥러닝을 통한 POI 변화 탐지
[242]컴퓨터 비전을 이용한 실내 지도 자동 업데이트 방법: 딥러닝을 통한 POI 변화 탐지NAVER D2
 
[212]C3, 데이터 처리에서 서빙까지 가능한 하둡 클러스터
[212]C3, 데이터 처리에서 서빙까지 가능한 하둡 클러스터[212]C3, 데이터 처리에서 서빙까지 가능한 하둡 클러스터
[212]C3, 데이터 처리에서 서빙까지 가능한 하둡 클러스터NAVER D2
 
[223]기계독해 QA: 검색인가, NLP인가?
[223]기계독해 QA: 검색인가, NLP인가?[223]기계독해 QA: 검색인가, NLP인가?
[223]기계독해 QA: 검색인가, NLP인가?NAVER D2
 

More from NAVER D2 (20)

[211] 인공지능이 인공지능 챗봇을 만든다
[211] 인공지능이 인공지능 챗봇을 만든다[211] 인공지능이 인공지능 챗봇을 만든다
[211] 인공지능이 인공지능 챗봇을 만든다
 
[233] 대형 컨테이너 클러스터에서의 고가용성 Network Load Balancing: Maglev Hashing Scheduler i...
[233] 대형 컨테이너 클러스터에서의 고가용성 Network Load Balancing: Maglev Hashing Scheduler i...[233] 대형 컨테이너 클러스터에서의 고가용성 Network Load Balancing: Maglev Hashing Scheduler i...
[233] 대형 컨테이너 클러스터에서의 고가용성 Network Load Balancing: Maglev Hashing Scheduler i...
 
[215] Druid로 쉽고 빠르게 데이터 분석하기
[215] Druid로 쉽고 빠르게 데이터 분석하기[215] Druid로 쉽고 빠르게 데이터 분석하기
[215] Druid로 쉽고 빠르게 데이터 분석하기
 
[245]Papago Internals: 모델분석과 응용기술 개발
[245]Papago Internals: 모델분석과 응용기술 개발[245]Papago Internals: 모델분석과 응용기술 개발
[245]Papago Internals: 모델분석과 응용기술 개발
 
[236] 스트림 저장소 최적화 이야기: 아파치 드루이드로부터 얻은 교훈
[236] 스트림 저장소 최적화 이야기: 아파치 드루이드로부터 얻은 교훈[236] 스트림 저장소 최적화 이야기: 아파치 드루이드로부터 얻은 교훈
[236] 스트림 저장소 최적화 이야기: 아파치 드루이드로부터 얻은 교훈
 
[235]Wikipedia-scale Q&A
[235]Wikipedia-scale Q&A[235]Wikipedia-scale Q&A
[235]Wikipedia-scale Q&A
 
[244]로봇이 현실 세계에 대해 학습하도록 만들기
[244]로봇이 현실 세계에 대해 학습하도록 만들기[244]로봇이 현실 세계에 대해 학습하도록 만들기
[244]로봇이 현실 세계에 대해 학습하도록 만들기
 
[243] Deep Learning to help student’s Deep Learning
[243] Deep Learning to help student’s Deep Learning[243] Deep Learning to help student’s Deep Learning
[243] Deep Learning to help student’s Deep Learning
 
[234]Fast & Accurate Data Annotation Pipeline for AI applications
[234]Fast & Accurate Data Annotation Pipeline for AI applications[234]Fast & Accurate Data Annotation Pipeline for AI applications
[234]Fast & Accurate Data Annotation Pipeline for AI applications
 
Old version: [233]대형 컨테이너 클러스터에서의 고가용성 Network Load Balancing
Old version: [233]대형 컨테이너 클러스터에서의 고가용성 Network Load BalancingOld version: [233]대형 컨테이너 클러스터에서의 고가용성 Network Load Balancing
Old version: [233]대형 컨테이너 클러스터에서의 고가용성 Network Load Balancing
 
[226]NAVER 광고 deep click prediction: 모델링부터 서빙까지
[226]NAVER 광고 deep click prediction: 모델링부터 서빙까지[226]NAVER 광고 deep click prediction: 모델링부터 서빙까지
[226]NAVER 광고 deep click prediction: 모델링부터 서빙까지
 
[225]NSML: 머신러닝 플랫폼 서비스하기 & 모델 튜닝 자동화하기
[225]NSML: 머신러닝 플랫폼 서비스하기 & 모델 튜닝 자동화하기[225]NSML: 머신러닝 플랫폼 서비스하기 & 모델 튜닝 자동화하기
[225]NSML: 머신러닝 플랫폼 서비스하기 & 모델 튜닝 자동화하기
 
[224]네이버 검색과 개인화
[224]네이버 검색과 개인화[224]네이버 검색과 개인화
[224]네이버 검색과 개인화
 
[216]Search Reliability Engineering (부제: 지진에도 흔들리지 않는 네이버 검색시스템)
[216]Search Reliability Engineering (부제: 지진에도 흔들리지 않는 네이버 검색시스템)[216]Search Reliability Engineering (부제: 지진에도 흔들리지 않는 네이버 검색시스템)
[216]Search Reliability Engineering (부제: 지진에도 흔들리지 않는 네이버 검색시스템)
 
[214] Ai Serving Platform: 하루 수 억 건의 인퍼런스를 처리하기 위한 고군분투기
[214] Ai Serving Platform: 하루 수 억 건의 인퍼런스를 처리하기 위한 고군분투기[214] Ai Serving Platform: 하루 수 억 건의 인퍼런스를 처리하기 위한 고군분투기
[214] Ai Serving Platform: 하루 수 억 건의 인퍼런스를 처리하기 위한 고군분투기
 
[213] Fashion Visual Search
[213] Fashion Visual Search[213] Fashion Visual Search
[213] Fashion Visual Search
 
[232] TensorRT를 활용한 딥러닝 Inference 최적화
[232] TensorRT를 활용한 딥러닝 Inference 최적화[232] TensorRT를 활용한 딥러닝 Inference 최적화
[232] TensorRT를 활용한 딥러닝 Inference 최적화
 
[242]컴퓨터 비전을 이용한 실내 지도 자동 업데이트 방법: 딥러닝을 통한 POI 변화 탐지
[242]컴퓨터 비전을 이용한 실내 지도 자동 업데이트 방법: 딥러닝을 통한 POI 변화 탐지[242]컴퓨터 비전을 이용한 실내 지도 자동 업데이트 방법: 딥러닝을 통한 POI 변화 탐지
[242]컴퓨터 비전을 이용한 실내 지도 자동 업데이트 방법: 딥러닝을 통한 POI 변화 탐지
 
[212]C3, 데이터 처리에서 서빙까지 가능한 하둡 클러스터
[212]C3, 데이터 처리에서 서빙까지 가능한 하둡 클러스터[212]C3, 데이터 처리에서 서빙까지 가능한 하둡 클러스터
[212]C3, 데이터 처리에서 서빙까지 가능한 하둡 클러스터
 
[223]기계독해 QA: 검색인가, NLP인가?
[223]기계독해 QA: 검색인가, NLP인가?[223]기계독해 QA: 검색인가, NLP인가?
[223]기계독해 QA: 검색인가, NLP인가?
 

D1 sn을활용한싸이bgm추천

  • 1. Music is Social. 레알? (SN을 활용한 싸이BGM추천) 2011.10.18 CTO / 기술연구소 / Data Science Team. 박태수 This report contains information that is confidential and proprietary to SK Communications and is solely for the use of SK Communications personnel. No part of it may be used, circulated, quoted, or reproduced for distribution outside SK Communications. If you are not the intended recipient of this report, you are hereby notified that the use, circulation, quoting, or reproducing of this report is strictly prohibited and may be unlawful. SK Communications
  • 2. Music is Social . 레알? Music is Social. 레알? SK Communications
  • 3. Music is Social . 레알? Social Network ?? SK Communications
  • 4. Music is Social . 레알? 소 공 유 유 같이 들을래? SK Communications
  • 5. Music is Social . 레알? 음악에 대한 폭넓은 욕구!! SK Communications
  • 6. Music is Social . 레알? Social Music Service Music + Social SK Communications
  • 7. Music is Social . 레알? Music is Social. 레알 ?!! SK Communications
  • 8. Music is Social . 레알? 대용량 데이터 처리?? SK Communications
  • 9. Music is Social . 레알? 싸이 BGM 서비스 사용자의 일촌 통계 54% 45% 1% 1~100 101~500 501~ 일촌 수 SK Communications
  • 10. Music is Social . 레알? 음악활동(구매, 듣기) Histogram 사용자수 cutoff A B C D 활동 수 비율 0% 20% 50% 80% 90% 100% SK Communications
  • 11. Music is Social . 레알? 일촌 네트워크 Histogram 사용자수 cutoff 1 2 3 4 5 6 7 8 9 일촌 수 분포 5% 10% 20% 30% 40% 50% 60% 70% 80% 100% SK Communications
  • 12. Music is Social . 레알? Sample Map 각 세그먼트당 1000명 씩 샘플링 일촌 분포 cutoff A B C D 100% 9 9 9 9 80% 70% 8 8 8 8 7 7 7 7 60% 50% 6 6 6 6 5 5 5 5 40% 4 4 4 4 30% 20% 3 3 3 3 2 2 2 2 10% 5% 1 1 1 1 0% 20% 50% 80% 90% 100% 사용자 활동성 SK Communications
  • 13. Music is Social . 레알? Similarity(Song, Artist, Genre) 사용자 ……  Similarity Measures ……  Simple Matching …… 일촌  Jaccard Coefficient … … …… …… …… …… …… …… …… …… …… SK Communications
  • 14. Music is Social . 레알? Analysis(Song) SK Communications
  • 15. Music is Social . 레알? Analysis(Artist) SK Communications
  • 16. Music is Social . 레알? Analysis(Genre) SK Communications
  • 17. Music is Social . 레알? Music is Social. 레알? 일촌 네트워크 사이에서는 뚜렷한 경향성을 보이지 않는다. SK Communications
  • 18. Music is Social . 레알? Social 정보를 어떻게 활용할까? • Social Music Chart  일촌 Chart(Borda count) • Social Music Recommendation  Collaborative Filtering SK Communications
  • 19. Music is Social . 레알? Social Music Chart  Social Chart(Borda Count) • Borda Rank Normalization U : a set of items τ : rank • Borda Score SK Communications
  • 20. Music is Social . 레알? Social Music Chart  Social Chart(Borda Count) • 일촌들의 BGM 재생 횟수에 따른 Ranking BGM 일촌1 일촌2 일촌3 일촌4 • Borda Rank Normalization Hello-허각 1 1 2 안녕이라고 말하지마-다비치 2 2 4 U : a set of items Who Am I - 유브이 3 1 1 τ : rank In Heaven - JYJ 4 3 3 … … … … … • Borda Count를 적용한 Social Music Chart BGM 일촌1 일촌2 일촌3 일촌4 … SUM Rank Hello-허각 1-((1-1)/10)=1 0.5+((2-1)/(2*10))=0.55 1-((1-1)/10)=1 1-((2-1)/10)=0.9 … 3.45 1 안녕이라고 말하지마 -다비치 1-((2-1)/10)=0.9 1-((2-1)/10)=0.9 0.5+((3-1)/(2*10))=0.6 1-((4-1)/10)=0.7 … 3.1 3 Who Am I - 유브이 1-((3-1)/10)=0.8 1-((1-1)/10)=1 0.5+((3-1)/(2*10))=0.6 1-((1-1)/10)=1 … 3.4 2 In Heaven - JYJ 1-((4-1)/10)=0.7 0.5+((2-1)/(2*10))=0.55 1-((3-1)/10)=0.8 1-((3-1)/10)=0.8 … 2.85 4 SK Communications
  • 21. Music is Social . 레알? Collaborative Filtering  많은 사용자들로부터 얻은 기호정보에 따라 사용자들의 관심사를 자동으로 예측하게 해주는 방법 User1 A B C D Nearest Recommend Neighbor User2 A B C User3 V F D E SK Communications
  • 22. Music is Social . 레알? Collaborative Filtering  Collaborative Filtering의 종류  사용자 기반 필터링  사용자 간의 유사성을 측정하여 선호도가 비슷한 다른 고객들이 평가한 상품을 기반으로 특정 고객이 선호할만한 상품을 추천하는 방식  데이터 양이 작고, 데이터 변경이 자주 일어나는 경우  항목 기반 필터링  고객이 선호도 등급을 입력한 기존 상품들과 추천하고자 하는 상품들 간의 유사성을 측정하여 특정 고객이 어떤 상품을 선호하는지 예측하여 추천  데이터 양이 크고, 데이터 변경이 자주 일어나지 않는 경우 SK Communications
  • 23. Music is Social . 레알? Collaborative Filtering  Item Similarity Computation  Pearson correlation coefficient SK Communications
  • 24. Music is Social . 레알? Collaborative Filtering  Prediction Computation Pu ,: 고객 u의 아이템 i에 대한 선호도 예측값 i Pu ,i  allSimilla rItems, N ( S i , N * Ru , N ) R : 고객 u의 아이템 N에 대한 Rating u,N  allSimilarItems, N (| S i , N |) S : 상품 i와 다른 상품 N의 유사도 값 i, N  Item 유사도 Matrix  선호도 예측 - 1과 5 : 0.9 - 2와 5 : 0.8 - 3과 5 : 0.2 - 4와 5 : 0.1 BGM1 BGM2 BGM3 BGM4 BGM5 User1 5 4 1 2 ? User2 1 2 5 5 1 SK Communications
  • 25. Music is Social . 레알? Collaborative Filtering 음악 서비스를 처음 사용하는 사용자라면?? 구매, 재생정보가 없다면??? 사용자의 지인들의 Social Music Chart를 이용 SK Communications
  • 26. Music is Social . 레알? 맺음말  Music is social. 레알?  Social Network 활용 방안  Social Music Chart  Social Music Recommendation SK Communications
  • 27. Music is Social . 레알? Q&A Thank you for your attention! SK Communications