1. Mapping User Preference to
Privacy Default Settings
+ Transactions on CHI 2015
-Jason Watson et al.
/나누리
x 2016 Spring
2. 스트리밍 데이터에 민감한 사람들
• 음악앱 지니의 강제 ‘덕밍아웃(덕후+커밍아웃)’, ‘일코해제(일반인 코스프레 해제)’ 사태
• ‘플레이 리스트’ vs. ‘계좌번호’ ?
3. Author
• Jason Watson(University of North Alabama, Florence, AL)
• Heather Richter Lipford(University of North Carolina at Charlotte, Charlotte, NC)
• Andrew Besmer(Winthrop University, Rock Hill, SC)
• Privacy Policy에 관심이 많은
“Privacy Policy”
4. Background
• 문제: 느슨한 Facebook Privacy Policy (대체로 Everyone)
_ SNS 사업의 목적이 공유 하도록하는 것이므로
_ 기본 설정으로 원치 않는 공유, 잦은 설정 변경 중에 유출되는 것들.
• 그동안: 어떻게 ‘개인 맞춤화’된 프라이버시 설정을 추천/결정해 줄 것인가에 관한 연구는 많았음.
_ 사람들의 프라이버시 성향을 묶기도 하고, (사람 분류)
_ 머신러닝 알고리즘으로 유저의 이전 설정 습관들을 학습하기도 함.
5. Methodology Overview
• 연구의 목표: 현재의 디폴트 프라이버시 설정을 평가하고, 더 나은 프라이버시 디폴트의 가능
성 탐색.
_ 사람들의 프라이버시 설정 선호를 조사하고, 기존의 모델& 도출한 모델이 사용자의 실제가
fit하는 정도를 확인하고자 함.
프라이버시
설정 선호 파악
더 나은 프라이버시
디폴트 탐색
6. Methodology Overview
• 연구의 목표: 현재의 디폴트 프라이버시 설정을 평가하고, 더 나은 프라이버시 디폴트의 가능
성 탐색.
_ 사람들의 프라이버시 설정 선호를 조사하고, 기존의 모델& 도출한 모델이 사용자의 실제가
fit하는 정도를 확인하고자 함.
Servey
• 페이스북의 29가지 프로필 항목의 프라이버시 설정 선호를 조사함.
• 참가자들의 실제 페이스북 프라이버시 설정 데이터를 받지 않고, 자기 보고 서베이로 진행함.
_ 사람들은 각각의 29가지 프로필 아이템들에 자기가 원하는 설정을 하는 시간/노력 들이지 않으므
로
자기 보고 서베이가 가장 적합하다고 판단하였음.
Calculating Policy Fit
• 서베이 데이터로부터 applied policy를 도출하여,
사람들이 원하는 바와 applied policy가 얼마나 잘 fit하는지 계산함.
Servey
Calculating
Policy Fit
7. Survey Design
• Amazon’s Mechanical Turk system 을 이용하여, 미국인을 대상으로 온라인 설문 진행함.
• 30분 설문, 2불의 인센티브.
1) demographics
2) Facebook usage and general attitude questions
_ 3 Westin/Harris segmentation index
_ 16 Buchanan et al. index
_ Facebook Intensity Index
3) privacy preference for 29 profile items
stage A. disclosure preference (Y/N)
stage B. preferred sharing audience (Only Me/ Friends/ Friends of Friends/ Everyone)
stage C. (선택하지 않은) 대안 선택지 상황에 대한 태도(슬라이드 바 0-100)
8. Survey Design
• Amazon’s Mechanical Turk system 을 이용하여, 미국인을 대상으로 온라인 설문 진행함.
• 30분 설문, 2불의 인센티브.
1) demographics
2) Facebook usage and general attitude questions
_ 3 Westin/Harris segmentation index
_ 16 Buchanan et al. index
_ Facebook Intensity Index
3) privacy preference for 29 profile items
stage A. disclosure preference (Y/N)
stage B. preferred sharing audience (Only Me/ Friends/ Friends of Friends/ Everyone)
stage C. (선택하지 않은) 대안 선택지 상황에 대한 태도(슬라이드 바 0-100)
3) privacy preference for 29 profile
items
ex. Gender
9. Results
privacy preference for 29 profile items
• stage A. disclosure preference (Y/N)
- 과반수의 프로필 항목에 관해, 약 2/3정도가 공유하겠다는 의사를 밝힘.
- 민감한 프로필 항목(phone numbers, email and street address) : 약 1/4 (??)
- photos posted > photos tagged in, 둘다 2/3 이상
10. Results
privacy preference for 29 profile items
• stage A. disclosure preference (Y/N)
- 과반수의 프로필 항목에 관해, 약 2/3정도가 공유하겠다는 의사를 밝힘.
- 민감한 프로필 항목(phone numbers, email and street address) : 약 1/4 (??)
- ‘photos posted’ > ‘photos tagged in’, 둘다 2/3 이상
내 사진, 좋아하는 것 에 관대함.
email 주소에 보수적.
11. Results
privacy preference for 29 profile items
• stage B. preferred sharing audience (Only Me/ Friends/ Friends of Friends/ Everyone)
- 많은 참가자들이 프로필 아이템들을 friends 와 만 공유하고 싶어함.
- 민감한 항목으로 갈 수록, friends 의 비율이 높아짐.
- 민감한 항목들에 있어서, friends보다 관대한 설정의 비율이 더 높은 것은 religion, political preference 뿐임.
- gender, personal preference, posted photos 와 같이 덜 민감한 항목에서는 다양한 공유 범위가 나타남.
yes 다양함.
friends 과반.
12. Results
privacy preference for 29 profile items
• stage C. (선택하지 않은) 대안 선택지 상황에 대한 태도 (슬라이드 바 0-100)
- 선택지 보다 more restrictive, more permissive 옵션으로 나누어, 관대함 태도 점수 평균 (0: very undesirable, 100: would not
ex. friends 선택시, more restrictive: only me / more permissive: f to f, everyone
- 대체로 more restrictive -> desirable / more permissive -> undesirable
13. • 서베이 샘플을 랜덤하게 training set과 test set으로 나누어, training set으로부터 네가지 Policy를 도
• Optimal (Liu and Terzi, 2010)
프로필 항목에의 태도 수치(선택항목:100, 대안 항목:0-100) 총합이 max인 공개 범위(D) 설정.
• Mode 과반수가 선택한 공개 범위 설정.
• Restrictive highly restirctive, only ‘Only me’
• Facebook 실제 페이스북 디폴트 설정
Comparing Policies
14. • 서베이 샘플을 랜덤하게 training set과 test set으로 나누어, training set으로부터 네가지 Policy를 도
• Optimal (Liu and Terzi, 2010)
프로필 항목에의 태도 수치(선택항목:100, 대안 항목:0-100) 총합이 max인 공개 범위(D) 설정.
if, P = gender, n=175(yes)
D = only me, op = Xd1(100) + Xd2(76) + Xd3(44) + … + Xd175(100) = 10000
D = friends, op = 11000
D = friends of friends, op = 16300
D = everyone, op = 9000
Ogender = friends
Comparing Policies
15. • 서베이 샘플을 랜덤하게 training set과 test set으로 나누어, training set으로부터 네가지 Policy를 도
• Optimal
프로필 항목에의 태도 수치(선택항목:100, 대안 항목:0-100) 총합이 max인 공개 범위(D) 설정.
• Mode 과반수가 선택한 공개범위 설정.
• Restrictive highly restirctive, only ‘Only me’
• Facebook 실제 페이스북 디폴트 설정
Comparing Policies
16. Calculating Policy Fit
• ‘fit score’를 통해 testing set과 얼마나 잘 fit 되는지를 계산함. (종속변인)
• 가령, P01
Gender 에서 Friends of Friends 에게 공유한다 응답하고,
대안에 대한 desirable 태도를 Only Me(90), Friends(75), Everyone(10) 부여한 경우
• 각, 프라이버시 모델의 fit score은
90인 Restrictive 가 가장 fit한 것.
> Gender에 대해서 Restrictive 가 best fit
10 10 75 90
18. • 가설: 각 모델의 median fit score 가 유의미하게 다를 것이다.
• Friedman’s test로 검증.
• 그 결과, 각 모델의 fit score의 중앙값은
Optimal(Md=99.39), Mode(Md=89.75), Restrictive(Md=96.08), Facebook(Md=73.43)
• x^2(3, n=51)=56.98, p = 0.001, W=0.558
: H0 기각.
Results
19. • 두 그룹간 차이를 알아보기 위해 Wilcoxon tests with a Bonferroni adjustment(p=0.008)으로
six post-hoc pairwise comparisons 사후 검증.
• Optimal 의 fit scores의 중앙값은 다른 세가지에 비하여 유의미하게 크다.
• Mode 와 Restrictive 의 fit scores 중앙값은 유의미하게 다르지 않다.
• Mode 와 Restrictive 의 fit scores 중앙값은 Facebook에 비하여 유의미하게 크다.
Results
20. • 두 그룹간 차이를 알아보기 위해 Wilcoxon tests with a Bonferroni adjustment(p=0.008)으로
six post-hoc pairwise comparisons 사후 검증.
• Policy들 간의 fit scores은 유의미하게 다르다.
• Optimal Policy 가 가장 fit하며, Facebook Policy 가 the lowest fit.
• 재미있는 점은 Mode 와 Restrictive 는 매우 다른 policy임에도,
fit scores은 유의미하게 다르지 않았음. (각각 다르지 않은 정도로 fit하다는 것.)
Results
21. Limitations
• 사용자가 공유의도를 선택하는 설문이 social interaction의 이점이 결여된 상황이었음.
• 사람들이 원하는 설정으로 조정하는 데에 드는 비용, 노력을 고려하지 않았음.
• ordering effects 의 오염변인 있을 수 있음. (profile items의 순서에 따라.)
Discussion
• 사용자가 선호하는 프라이버시 policy를 알아 보았을 뿐만 아니라,
• 대안 선택지에 대한 태도도 수집하여, 사용자의 만족도가 가장 높은 policy를 산출해 내고자 하였음.
• Facebook이 낮은 fit으로 나옴. > 사용자의 설정과 Facebook 디폴트 설정이 다름.
• Restrictive가 꽤 높은 fit으로 나옴. > 사람들은 서베이에서 생각보다 일관적인 보수적 응답을 보임.
• 실제 사용자의 설정과 비교한다면, optimal이 지금보다 적은 fit, facebook이 높은 fit 으로 나올 것.
가져갈 점
• 아이디어 & 방법
• 설문 데이터 아껴쓰기
_사용자 인식 도출 > Optimal 모델 > fit 검증
Limitations & Discussion
22. 앞으로
공유…?
• 건강 데이터의 공유…? 어떤 데이터에 민감할까?
• ‘사회적 건강관리 -> 소셜 네트워킹’ 에 대한 실제 사람들의 생각은?
• 문화적 차이? -> 우리나라 사람들의 생각?