2016년 7월 25일 Naver labs에서 발표한 자료입니다. CSCW '16에서 발표된 아래 논문을 한글로 소개하였습니다.
Title: Persistent Sharing of Fitness App Status on Twitter
Author: Kunwoo Park, Ingmar Weber, Meeyoung Cha, Chul Lee
소셜 데이터를 이용한 연구소개 - 피트니스 앱의 지속 사용에 관한 연구Kunwoo Park
2015년 12월 18일 한빛미디어에서 개최된 생활 데이터 모임에서 발표한 내용입니다. 소셜 데이터를 이용한 연구 사례로 피트니스 앱의 지속 사용에 관한 연구를 공유하였습니다. 소개된 논문은 다음 링크에서 확인 가능합니다: http://kunwpark.kr/wp-content/uploads/2015/12/cscw16_park.pdf
Jennifer M. Wang has extensive experience leading large-scale research projects involving data collection, analysis, and modeling. She has overseen teams of up to 27 members and led numerous international studies involving thousands of participants. Her work includes designing surveys, implementing rigorous sampling techniques, addressing missing data and bias, and producing predictive models and peer-reviewed publications. She has specialized expertise in childhood development, education, personality, and social relationships.
Big Data [sorry] & Data Science: What Does a Data Scientist Do?Data Science London
What 'kind of things' does a data scientist do? What are the foundations and principles of data science? What is a Data Product? What does the data science process looks like? Learning from data: Data Modeling or Algorithmic Modeling? - talk by Carlos Somohano @ds_ldn at The Cloud and Big Data: HDInsight on Azure London 25/01/13
소셜 데이터를 이용한 연구소개 - 피트니스 앱의 지속 사용에 관한 연구Kunwoo Park
2015년 12월 18일 한빛미디어에서 개최된 생활 데이터 모임에서 발표한 내용입니다. 소셜 데이터를 이용한 연구 사례로 피트니스 앱의 지속 사용에 관한 연구를 공유하였습니다. 소개된 논문은 다음 링크에서 확인 가능합니다: http://kunwpark.kr/wp-content/uploads/2015/12/cscw16_park.pdf
Jennifer M. Wang has extensive experience leading large-scale research projects involving data collection, analysis, and modeling. She has overseen teams of up to 27 members and led numerous international studies involving thousands of participants. Her work includes designing surveys, implementing rigorous sampling techniques, addressing missing data and bias, and producing predictive models and peer-reviewed publications. She has specialized expertise in childhood development, education, personality, and social relationships.
Big Data [sorry] & Data Science: What Does a Data Scientist Do?Data Science London
What 'kind of things' does a data scientist do? What are the foundations and principles of data science? What is a Data Product? What does the data science process looks like? Learning from data: Data Modeling or Algorithmic Modeling? - talk by Carlos Somohano @ds_ldn at The Cloud and Big Data: HDInsight on Azure London 25/01/13
Product Design System 2009, Team Shabu Final DocumentationJongBum Woo
Department of Industrial Design
KAIST
Coursework 2009
Product Design System (Prof. Tek-jin Nam)
Team Shabu
JaeSik Yun, JongBum Woo
JiHyun Park, KyungHee Kim, YunHwa Jung
Health Mashups: Presenting Statistical Patterns between Wellbeing Data and Co...Yoojung Kim
Health Mashups: Presenting Statistical Patterns between Wellbeing Data and Context in Natural Language to Promote Behavior Change
Bentley, F., Tollmar, K., Stephenson, P., Levy, L., Jones, B., Robertson, S., ... & Wilson, J. (2013). ACM Transactions on Computer-Human Interaction (TOCHI), 20(5), 30.
이제 우리는 스마트폰과 웨어러블을 통해
매일매일의 생활을 데이터로 추적할 수 있습니다.
이 데이터를 진료실에서 활용할 수 있다면 어떨까요?
매일 먹는 약처럼, 의사가 “일주일간 매일 만 보 이상 걸으세요”라는
데이터 목표를 처방한다면 생활습관을 효과적으로 개선할 수 있지 않을까요?
환자와 의사 모두에게 새로운 경험이 될 데이터 처방을 현실화하려면,
데이터를 수집하고, 공유하고, 검토할 수 있도록 돕는 시스템이 필요합니다.
이 프로젝트는 3년 동안 데이터 처방을 위한 시스템을
사용자 중심적으로 설계/개발/평가함으로써,
궁극적으로 진료실 경험을 혁신하는 것을 목표로 진행되었습니다.
20151022 디지털 헬스케어 임상시험 임상시험글로벌선도센터 심포지엄 v4Chiweon Kim
2015년 10월 22일 분당서울대병원에서 열렸던
임상시험글로벌선도센터 공동 심포지엄 'Information Technology in Clinical Trials'에서 발표한 자료입니다.
제 블로그에 올렸던 글들을 정리한 내용입니다.
아래 글들을 참고하세요
http://www.chiweon.com/?p=2547
http://www.chiweon.com/?p=2578
http://www.chiweon.com/?p=2593
http://www.chiweon.com/?p=2639
Detecting Misleading Headlines in Online News: Hands-on Experiences on Attent...Kunwoo Park
This slide is used for the tutorial in Deep Learning Summer School, held in IBS, Daejeon. Based on the recent effort on detecting misleading headlines through deep neural networks (Yoon et al., AAAI 2019), it explains how RNN and Attention mechanism works for text. Moreover, implementations based on TensorFlow 1.x are introduced.
Positivity Bias in Customer Satisfaction RatingsKunwoo Park
This slide is for my presentation at The Web Conference 2018 (also known as WWW). You can check the paper at the following link: https://dl.acm.org/authorize.cfm?key=N655133
More Related Content
Similar to Persistent Sharing of Fitness App Status on Twitter
Product Design System 2009, Team Shabu Final DocumentationJongBum Woo
Department of Industrial Design
KAIST
Coursework 2009
Product Design System (Prof. Tek-jin Nam)
Team Shabu
JaeSik Yun, JongBum Woo
JiHyun Park, KyungHee Kim, YunHwa Jung
Health Mashups: Presenting Statistical Patterns between Wellbeing Data and Co...Yoojung Kim
Health Mashups: Presenting Statistical Patterns between Wellbeing Data and Context in Natural Language to Promote Behavior Change
Bentley, F., Tollmar, K., Stephenson, P., Levy, L., Jones, B., Robertson, S., ... & Wilson, J. (2013). ACM Transactions on Computer-Human Interaction (TOCHI), 20(5), 30.
이제 우리는 스마트폰과 웨어러블을 통해
매일매일의 생활을 데이터로 추적할 수 있습니다.
이 데이터를 진료실에서 활용할 수 있다면 어떨까요?
매일 먹는 약처럼, 의사가 “일주일간 매일 만 보 이상 걸으세요”라는
데이터 목표를 처방한다면 생활습관을 효과적으로 개선할 수 있지 않을까요?
환자와 의사 모두에게 새로운 경험이 될 데이터 처방을 현실화하려면,
데이터를 수집하고, 공유하고, 검토할 수 있도록 돕는 시스템이 필요합니다.
이 프로젝트는 3년 동안 데이터 처방을 위한 시스템을
사용자 중심적으로 설계/개발/평가함으로써,
궁극적으로 진료실 경험을 혁신하는 것을 목표로 진행되었습니다.
20151022 디지털 헬스케어 임상시험 임상시험글로벌선도센터 심포지엄 v4Chiweon Kim
2015년 10월 22일 분당서울대병원에서 열렸던
임상시험글로벌선도센터 공동 심포지엄 'Information Technology in Clinical Trials'에서 발표한 자료입니다.
제 블로그에 올렸던 글들을 정리한 내용입니다.
아래 글들을 참고하세요
http://www.chiweon.com/?p=2547
http://www.chiweon.com/?p=2578
http://www.chiweon.com/?p=2593
http://www.chiweon.com/?p=2639
Detecting Misleading Headlines in Online News: Hands-on Experiences on Attent...Kunwoo Park
This slide is used for the tutorial in Deep Learning Summer School, held in IBS, Daejeon. Based on the recent effort on detecting misleading headlines through deep neural networks (Yoon et al., AAAI 2019), it explains how RNN and Attention mechanism works for text. Moreover, implementations based on TensorFlow 1.x are introduced.
Positivity Bias in Customer Satisfaction RatingsKunwoo Park
This slide is for my presentation at The Web Conference 2018 (also known as WWW). You can check the paper at the following link: https://dl.acm.org/authorize.cfm?key=N655133
MS thesis defense - Gender swapping and its effects in MMORPGsKunwoo Park
- The document discusses a study on the phenomenon of gender swapping in MMORPG games and its effects. It analyzes player demographic data from the Fairyland Online game.
- Females are found to participate in gender swapping more than males. Older and more experienced players also swap genders more. Gender swapping is found to affect in-game behaviors and social networks.
- Players' levels increase faster when their avatar gender matches their real gender, following real-world gender roles. Females profit more from trades, also following online gender roles. Social networks are affected by both real and virtual gender.
[DISC2013] Mood and Weather: Feeling the Heat?Kunwoo Park
The document discusses a study that analyzed the relationship between mood expressed on Twitter and weather conditions using a dataset of 38.1 million tweets from the United States in April 2009 along with corresponding weather data. The researchers found a weak positive correlation between temperature and positive sentiment across states on average, but also found some states showed negative correlations. The study concluded that how weather affects mood varies significantly by region due to cultural and economic factors.
[CS570] Machine Learning Team Project (I know what items really are)Kunwoo Park
This document summarizes a team's approach to predicting which items users might be interested in using a recommendation system. It describes extracting features from user and item metadata to train an SVM model, but this was too computationally expensive. Instead, the team used logistic regression with stochastic gradient descent. They tested features like age, gender and network similarities. Their combined model outperformed random prediction baselines on the KDD Cup 2012 Track 1 dataset.
Social Network Analysis:Methods and Applications Chapter 9Kunwoo Park
This document discusses structural equivalence and positional analysis in networks. It defines structural equivalence as two actors having identical ties to and from all other actors. It describes methods for measuring approximate structural equivalence using metrics like Euclidean distance and correlation. It also outlines techniques for partitioning actors into positions based on their structural equivalence, including CONCOR and hierarchical clustering algorithms. The document emphasizes that positional analysis aims to simplify network data by grouping similarly positioned actors.
Social Network Analysis : Methods and Applications Chapter 6 and 7Kunwoo Park
1) The chapter discusses methods for identifying cohesive subgroups within networks, including cliques, n-clans, and lambda sets.
2) Cohesive subgroups are defined as subsets of nodes that are relatively more strongly connected to each other than to nodes outside the subgroup.
3) Different methods take into account factors like reachability between nodes, nodal degree, and comparing the frequency of ties within versus outside the subgroup.
Social Network Analysis : Methods and Applications Ch 1,2
Persistent Sharing of Fitness App Status on Twitter
1. Persistent Sharing of Fitness App Status on Twitter
2016. 07. 25
Naver PhD Fellow
KAIST 박 건우
2. 목차
1. 발표자 소개
2. 연구 배경
3. 연구 문제
4. 타겟 어플리케이션 소개 및 데이터 수집
5. Twitter 사용 패턴 비교: Persistent vs. Dormant
6. Persistent sharing 예측
7. 논의 및 결론
8. 기타 진행중인 연구
2016-07-25 /272
3. 발표자 소개
• 이름: 박 건우
• 소속: KAIST 전산학부 웹사이언스대학원 박사과정
• 문화기술대학원 소셜 컴퓨팅 랩 (지도교수: 차미영)
• 연구관심분야: 온라인 소셜 데이터를 이용한 오프라인 행동의 이해 및 예측
(Social Computing, Computational Social Science)
2016-07-25 /273
4. 진행했던 연구들
트위터 감성과 날씨의 관계 감성 정보를 이용한 상담 만족도 예측
온라인 게임 내 젠더스와핑 현상 분석
2016-07-25 /274
7. • 개인의 건강 관련 정보들이 어플리케이션을 통해 관리되기 시작
연구 배경
건강 관련 정보
건강 관리 어플리케이션
2016-07-25 /277
8. 연구 배경
• 건강 관리 앱의 문제: 낮은 잔존율! (Low retention problem)
2016-07-25 /278
9. Social sharing
• 외부 소셜 미디어에 상태를 공유하여 긍정적 효과를 받도록 유도
• 부정적 효과 또한 보고되고 있음
Social sharing Twitter friends
Social support: 동기부여, 정보제공
Privacy 노출에 대한 걱정
2016-07-25 /279
효과적인 Social sharing을 위해, 계속하여 앱 내 상태를 공유하여
어플리케이션을 사용하는 데 영향을 미치는 요인들에 대한 이해 필요
10. 연구 문제
• 건강 관리 앱에서 상태를 계속해 공유하는 유저들은 어떻게 Twitter를 사용하는가?
• 어떤 유저들이 계속해서 상태를 공유하며 건강 어플리케이션을 사용하는 지 예측
할 수 있는가?
2016-07-25 /2710
11. 타겟 어플리케이션: MyFitnessPal (MFP)
• 체중 관리를 위한 건강 어플리케이션
• Google Play Store 건강/피트니스 앱 부문 다운로드 횟수 1위
• 앱 내 상태 기록시 Twitter로 자동 공유 기능을 제공
앱 유저
어플리케이션에
내 상태 기록시
Twitter에 포워딩
운동
체중변화
식단기록
블로그
2016-07-25 /2711
12. Twitter 데이터 수집
1. MFP를 사용하는 Twitter 유저 파악
• 데이터 소스: Twitter Decahose, streaming API
• #myfitnesspal을 포함하는 트윗 수집
• Source 확인하여 MFP 앱에서 생성된 트윗인지 확인
Decahose
MFP 유저
#myfitnesspal을 포함하는 트윗
Streaming API
2016-07-25 /2712
13. Twitter 데이터 수집
2. MFP 유저의 트윗과 유저 관련 정보 수집
• 유저 관련 정보: bio, 팔로잉 수, 팔로워 수, 소셜 네트워크
• 3,169명의 4,794,071개 트윗
MFP 트윗 일반 트윗
첫번째 MFP 트윗 크롤링 시점
30 일 180 일
2016-07-25 /2713
14. • 그룹 정의: 지속 공유하는 그룹 (persistent) vs. 공유 중단 그룹 (dormant)
유저 그룹 정의
• 타겟 윈도우 기간 내 MFP 트윗을
적어도 한 개 이상 공유
• 장기간 어플리케이션을 사용하는
유저들
Persistent users (N = 2,598) Dormant users (N=581)
• 타겟 윈도우 내 MFP 트윗 없음
• Dormant user로 판단되는 경우
1) 앱 사용을 중단
2) 잠깐 사용 중단
3) 자동 공유를 중단
MFP 트윗 일반 트윗
첫번째
MFP 트윗
크롤링
시간
90 일
관측 윈도우
90 일
타겟 윈도우
2016-07-25 /2714
15. 연구 문제
• 건강 관리 앱에서 상태를 계속해 공유하는 유저들은 어떻게 Twitter를 사용하는가?
• 어떤 유저들이 계속해서 상태를 공유하며 건강 어플리케이션을 사용하는 지 예측
할 수 있는가?
2016-07-25 /2715
16. Twitter 사용 패턴 비교: Persistent vs. Dormant
• Persistent users 들은 Dormant users와 비교하여 어떻게 Twitter를 다르게
사용하는가?
• 분석 방법
#health
#fitness
#nowlistening
해시태그 이용 패턴 분석 크라우드소싱을 이용한
관심사 분석
2016-07-25 /2716
17. 해시태그 이용 패턴 분석
• 해시 태그는 어떤 유저가 얼마나 다양한 토픽을 사용하는 지를 나타냄
• 해시 태그를 얼마나 많이, 다양하게 사용하는 지 분석
관측 윈도우
#health
#fitness
#nowlistening
#GameOfThrones
• 해시 태그의 개수
• 해시 태그의 diversity
2016-07-25 /2717
18. 해시태그 이용 패턴 분석
• 누가 persistent user일까?
#health
#fitness
#dieting
#health
#fitness
#nowlistening
#GameOfThrones
2016-07-25 /2718
19. 해시태그 이용 패턴 분석
• 누가 persistent user일까?
#health
#fitness
#dieting
#health
#fitness
#nowlistening
#GameOfThrones
Persistent users는 더 적은 수의 해시태그를 (p<0.05),
몇몇 토픽에 집중하여 (p<0.05) 사용
2016-07-25 /2719
20. 크라우드소싱을 이용한 관심사 분석
• Crowdworker 에게 프로필 정보를 주고 관심사를 태깅하도록 함
Is this user interested in health?
crowdworkers
Persistent users는 건강 관련 관심사를 가지고
트위터를 사용하는 경향을 보임 (p<0.05)
2016-07-25 /2720
21. Twitter 사용 패턴 비교
트위터를 건강 관련 토픽에 대해 집중하여 사용하는
사람일수록 운동 어플리케이션을 지속해 사용하는 경향을 보임
#health
#fitness
#nowlistening
해시태그 이용 패턴 분석 크라우드소싱을 이용한
관심사 분석
2016-07-25 /2721
22. 연구 문제
• 건강 관리 앱에서 상태를 계속해 공유하는 유저들은 어떻게 Twitter를 사용하는가?
• 어떤 유저들이 계속해서 상태를 공유하며 건강 어플리케이션을 사용하는 지 예측
할 수 있는가?
2016-07-25 /2722
23. Persistent sharing 예측
• 지속해 상태를 공유하며 어플리케이션을 사용하는 유저들 (persistent users)과,
공유를 그만두는 사용자들 (dormant users)의 특성 차이를 이해
• 방법론: logistic regression
• Balanced sampling 적용
• 변수 종류들
• Twitter profile: 트윗 수, 친구 수 등
• Fitness activity: 타입별 피트니스 액티비티 수, 트윗으로부터 추출된 정보들 등
• Fitness network: support 받은 트윗의 수, MFP를 사용하는 트위터 친구들 수, 건강에 관심있
는 트위터 친구들의 수 등
2016-07-25 /2723
26. 논의 및 결론
• 건강 관리 어플리케이션인 MyFitnessPal를 사용하는 유저들 중 Twitter에 자신
의 건강 상태를 공유하는 사람들을 대상으로, 어떤 요인들이 사람들로 하여금 지
속해서 공유하고 운동을 계속하도록 하는데 영향을 주는 지 살펴봄
• Twitter를 건강 관련 토픽을 중심으로 사용하는 사람들의 경우 지속해서 어플리케이션을 사용
• MyFitnessPal을 사용하거나 건강에 관심있는 사람들과 Twitter 내에서 소셜 네트워크를 이룰수
록 지속해서 상태를 공유하여 어플리케이션을 사용
• 이는 social sharing의 긍정적 효과를 누리기 위해 적절한 social network를 가
지는 것의 중요성을 보여줌
2016-07-25 /2726
27. 기타 진행중인 연구
• 연구 관심사: 사용자 유지 (user retention)을 위한 데이터 기반 접근 –
사용자 특성 이해 및 이탈 예측
온라인 게임 내 이탈 예측 상담 만족도 예측
2016-07-25 /2727