한대희 ( http://slowcampus.com , manager@slowcampus.com )
사용자가 뉴스 기사는 읽는 행동을 분석하여 어떤 키워드를 좋아하는지 분석하고,
이에 따라 적절한 뉴스 기사를 추천해주는 추천 서버 및 앱 구현 개발.
소마(swmaestro 5기, 2014년) 뉴스 추천 앱(서비스) 프로젝트 팀 발표
1. 콘텐트(아티클) 추천
사용자 선호도를 분석하여 사용자에게 적합한 점수 순으로 콘텐트를 추천함
매치
&
추천
사용자
분석
콘텐트
분석
사용자
로그 수집
콘텐트
메타정보
신문사
사이트
콘텐트
추천
2. 콘텐트 분석
• 18개 사이트, 매일 1.5만개 뉴스 수집 및 분석
아티클
본문
추출
키워
드
추출
아티클
HTML
DB
중복
아티
클
제거
3. 사용자 선호도 계산
• entities_preference_accumlated_old * 0.9 +
entities_preference_today * 0.5
• 0.9 == decay factor
읽기 로그
Like 로그
매체 선호도
키워드 선호도
4. 사용자 – 콘텐트 match
• score_entities_in_article X entity_preference_of_user
사용자 키워드
선호도
각 아티클의
키워드 벡터
5. Technology
• 기사 수집
• 기사에서 본문 추출, 엔티티 추출
• 중복 기사 제거
• 사용자의 엔티티 선호도 계산, 업데이트
• 사용자 행동 로그 분석 – 기사의 여러 페
이지 중 몇 개 읽음
6. 서비스 시스템 아키텍처 개념도
API
서버
기사요청
추천기사목록
사용자 로그
추천목록
Memory
DB
주천결과조회 분석 & 추천
시스템
추천결과 저
장
로그
Aggregator
Image
서버
로그
서버
이미지 파일
로그
서버
API
서버
Image
서버
로그로그저장
분석
7. 추천 시스템 아키텍처 개념도
뉴스
크롤러
신문사1
분석기DB
Memory
DB
API
서버
신문사
N
추천엔진
Memory
DB
추천시스템