4. 01 Why This Paper
컨텐츠 추천이 아닌, Adaptive UI를 위한 유저 모델링
본 논문 저자의 <이전 논문>에 제시된 뉴스 리더 타입과 뉴스앱의 Adaptive UI
Marios Constantinides et al,2015. Exploring mobile news reading interactions for news app personalisation. MobileHCI'15
(온라인 서베이 기반 데이터 수집)
5. 02 Introduction
① 서비스의 개인화는 컨텐츠 추천과 인터페이스 커스텀이 있음
- 개인의 흥미에 따른 컨텐츠 추천
- 사용자가 입맛에 맞게 인터페이스를 커스텀함.
② News app의 개인화 레벨을 높이기 위해서는 적응형 UI를 제공할 필요가 있음
- 사용자의 흥미를 끌 뉴스 컨텐츠 추천에 대한 연구는 이미 활발하게 진행됨
•예를 들어서, 뉴스를 읽기 전에 헤드라인을 먼저 쭉 보는 사람이 있으면, 헤드라인과 약간의
요약을 먼저 쭉 보여주고, 리딩 리스트를 만들 수 있게하면 유용하게 작용할 것.
- 사용자마다 다른 형태의 인터페이스가 필요함
1. 유저 프로필 제작을 위한 유저 모델링 프레임워크 제안
2. 유저 프로필을 만들기 위한 3가지 방법 비교
6. 03 Framework
Layer 1
총 4단계의 레이어로 구성된 프레임워크
Layer 2
Layer 3
Layer 4
뉴스앱 프로토타입으로
Raw 인터랙션 데이터 수집
Raw data를 가공하여
low-level feature 생성
하루동안 뉴스의
open/close가 3쌍 기록됨
하루에 3개의 뉴스를 읽음
low-level feature를
가공하여 high-level
feature 생성
빈도 : 하루에 여러번
Trackers3개의 뉴스 리더 타입에서
high-level feature 도출
.........
7. 03 Framework
1) 빈도 : 얼마나 자주 뉴스를 읽는지 (하루에 여러번, 하루에 1번, 가끔)
2) 읽는 시간 : 하루에 뉴스 읽는 시간 (0-5분, 5-10분, 10분 이상)
3) 시간대 : 뉴스를 읽는 시간대 (아침, 오후, 밤)
4) 읽는 스타일 : 선택된 뉴스를 읽는 방법 (꼼꼼하게, 스키밍, 스캐닝)
5) 탐색 스타일 : 헤드라인 탐색 방법 및 뉴스 선택 방법 (특정 섹션의 헤드라인 스캔, 모든 섹션 스캔)
6) 위치/컨텍스트 : 어디에서 뉴스를 읽는지 (집, 회사, 밖)
Layer 3의 읽는 스타일/탐색 스타일/위치 도출 어려움
1), 2), 3)은 사용자의 사용 데이터를 통해 쉽게 계산할 수 있으나,
4), 5), 6)은 단순하게 계산하기 어려운 높은 수준의 행동임
8. 03 Framework
리딩 타임 글자 수/리딩 타임(wpm)
-> 리딩 스타일
Open/close 기록
Layer 1 Layer 2 Layer 3
스와이프 방향
카테고리 클릭 기록 카테고리 수
헤드라인 수 카테고리 수와 헤드라인 수
-> 탐색 스타일
9. 04 Building a user profile
읽는 스타일, 탐색 스타일, 위치에 대한 계산 방법 비교
① 뉴스리더 타입으로 추론하기
② Low-level feature를 변형하기
③ 랜덤 포레스트 기법 (머신러닝)
①
② ③
①
10. 04 Building a user profile
읽는 스타일, 탐색 스타일, 위치에 대한 계산 방법 비교
① 뉴스리더 타입으로 추론하기①
쉽게 계산이 가능한 빈도, 읽는 시간, 시간
대를 이용하여 나머지 factor 추론
*Marios Constantinides et al,2015. Exploring mobile news reading interactions for news app personalisation. MobileHCI'15
*
①
11. 04 Building a user profile
읽는 스타일, 탐색 스타일, 위치에 대한 계산 방법 비교
② Low-level feature를 변형하기
②
예를 들어, low-level feature로 분당 읽은
단어 수를 계산하여 230이하면 꼼꼼하게,
230~700은 스키밍, 700이상이면 스캐닝.
분당 읽은 단어 수 = 읽은 단어 수/ 읽은 시간
12. 04 Building a user profile
읽는 스타일, 탐색 스타일, 위치에 대한 계산 방법 비교
③ 랜덤 포레스트 기법 (머신러닝)
③
low-level feature를 트레이닝 데이터셋으
로 머신러닝 방법 사용. k-fold 검증 기법을
활용하여 오버피팅 방지.
<Ground truth 수집을 위한 질문>
13. 04 Building a user profile
랜덤 포레스트 기법이 월등히 좋은 성능을 나타냄
① 뉴스리더 타입으로 추론하기
② Low-level feature를 변형하기
③ 랜덤 포레스트 기법 (머신러닝)
<3가지 방법의 각 factor에 대한 정확도 비교>
14. 05 Discussion
1) 규칙 기반 접근보다는 머신 러닝이 high-level feature를 예측
하는 것에 더 좋은 성능을 나타냄
2) 6개의 요소를 고려하여 적절한 인터페이스를 제공하면, 뉴스 읽
는 경험을 강화시킬 수 있음
한계점
- 적은 수의 샘플 사이즈
- Ground truth가 자가기록으로 얻어진 점
15. 06 Takeaway
1. 목적에 따라 높은 수준의 행동을 도출하는 것이 의미가 있음
- 모델링이라고 해서 꼭 분류를 다 해낼 필요가 없음
(뉴스 리더 타입인 Tracker, Reviewer, Dipper와 같이)
2. 질적 데이터를 이용한 유저 모델링 보다는
양적 데이터를 활용한 유저 모델링이 더 효과적임
3. 데이터에 의미 부여는 신중하게 할 필요가 있음
- wpm만 가지고 리딩 스타일이 결정되지 않음
- 질적 데이터를 이용한 유저 모델링을 출발점으로 삼는 것도 방법