short text large effect measuring the impact of user reviews on android app security & privacy

Short Text, Large Effect:
Measuring the Impact of
User Reviews on Android
App Security & Privacy
Duc Cuong Nguyen∗, Erik Derr∗, Michael Backes†, Sven Bugiel†
∗CISPA, Saarland University †CISPA Helmholtz Center i.G.
전자공학부 김민하

Short Text? Leivews
Large Effect? Update

연구 배경
사용자와 개발자의 직접적인 소통 환경이 형성되어 있음
But
보안 및 개인 정보 보호에 대해 직접적으로 업데이트에 영향을
주는지에 대해서는 아직 조사되지 않음

문제 정의
보안&개인 정보&사생활에 관련된 Reivew와 어플리케이션의
Update 간의 상관관계를 연구
• 다시말해 이 논문의 목적은
• SPR이 안드로이드 어플리케이션에서 Update의 중요한 예측 변
수임을 밝히고자 함

RELATED WORK
• 자연어 처리 사용
• 앱 리뷰 분류 및 분석
• 앱 보안 진화

App and Review Crawler
• 텍스트뿐만 아니라 점수, 그리고 나중에 분류를 위해 텍스트를
전처리.
• 다운로드가 최소 50,000,000개 이상인 앱으로 데이터 수집을 제
한
• 영어로 작성된 리뷰만 탐색
• 텍스트 외에도 개발자 응답(가능한 경우)을 수집
사용자 리뷰 마이닝

Google의 Crawler
• 크롤링(Crawling) 작업 :
• 무수히 많은 컴퓨터에 나뉘어 저장 돼 있는 문서를 수집해 검색
대상의 색인으로 포함시키는 기술
• 상위 2,583개 앱에서 4.5M 사용자 리뷰 수집 후
• 5,527개의 보안, 개인정보 보호 관련 리뷰를 식별

구글 플레이에 등록된 예전 버전의 앱을 분석
• 앱의 변화 기록을 저장
• 보안/사생활과 관련된 업데이트와 사용자의 리뷰의 연관성을
연구
크롤링 앱 기록

• 앱 버전을 쿼리 :
• 각 앱마다 코드가 다름.
• 이러한 코드를 나열하는 방법은 따로 없음
• 예를 들면 일부 어플은 0부터 시작하여 단순하게 정수를 증가시
키는 패턴이지만 어떤 어플은 YYYYMMMDDV와 같이 날짜 패
턴을 이용하기 때문에 코드들이 일관되지 않음
• 이러한 버전들을 수집하기 위하여 play API를 사용

• 출시 날짜 추출 :
• 하지만 Play API의 두 번째 주요 단점은 이전 앱 버전의 릴리스/
업로드 날짜를 쿼리할 수 없다는 것입니다.

리뷰 분류 순서
1. SPR과 SPR이 아닌 수의 균형을 맞춥니다
2. 특징 추출
스톱 워드 제거를 이용하여 a, an the 등을
리뷰에서 제거 하고,
단어 대신 N-gram 기능 사용하여 문자 추출
3. 기계 학습
Bow(bag of words) 적용
4. 검증
K-fold 크로스 검증과 AUC 적용

검증
• k-Fold 크로스 검증
• AUC (Area Under the Curve)

Static App Analysis
• 앱 개발 코드나 타사 라이브러리 코드의 변경 여부를 분석
• 1. 경험적 분석
• 2. LibScout
• 라이브러리 코드가 변경될 수도 있으므로

Mapping SPR to SPU
SPU가 발견되면 SPR과 새로 발견된 SPU 사이의 이 연결
은 일치로 간주된다

Mapping SPR to SPU
SPR에서 SPU까지의 버전 거리

SPR
• SP 관련 가장 많이 언급된 Top10개
추출된 5,527의 SPR중에 2,898개는 카테고리로 분류가 불가
능

SPR
• Runtime permissions vs. install-time permissions
Result
런타임 권한이 있는 앱이 많은 수의 SPR을 유도한다는 것을
T-Test를 실시하여 밝힘
* T-test란 두 집단 간의 평균의 차이가 유의미한 지 검증하는 보편적인 통계 방법

SPR
• 나머지 사례에선 우편으로 구체적 설명을 요구(350자제한)
• 나머지 96개 리뷰에선 이미 해당 사항을 수정 중이라 답하였고
• 직후에 업데이트된 버전에서78/96 의 SPU를 확인할 수 있었음
• Developer responses

SPU
• 앱의 권한이 변경된 것이 확인되면 SPU로 간주
• 요청된 권한이 앱에서 제거: 1,608
• 권한 보호 API 호출이 제거 1,085
• 보호된 API를 트리거하는 Lib 호출이 제거: 940

SPU
*WAKE LOCK ? 자원을 이용하기 위해 프로세서가 활성화
되고 있는 상태

SPR To SPU Mapping
X축에서 오른쪽으로 갈수록 SPR과 SPU의 거리가 멀다고 판단
다시말해 SPU가 리뷰에 의해서 수정되었을 가능성이 감소
답변
정적 분석의 한계
앱이 더 이상 유지 관리X
라이브러리 자체에 변경
개발자의 내부 코드 수정
SPUSPR

Summary of Findings
• 개발자 응답률(Response Rate)

• SPR Ratio: 총 리뷰 수에 대한 SPR 비율
• Ageage score: 마지막 앱 업데이트 이후 해당 앱 버전이 받은 평균 점수
• Permission mechanism: 앱 버전에서 사용하는 권한 메커니즘(실행 시간 또는 설치 시간)
• App category : Google Play에서 정의한 앱 카테고리
• Reply Ratio: 이전 앱 versio 이후 총 리뷰 수에 대한 개발자 응답 비율
MODELING
SECURITY AND PRIVACY UPDATES
1. Data set
2. 상관관계 분석(Correlation Analysis)
3. Building the Models

Discussion
저자는 다음 사항을 검토 필요성을 제시
1. 글자수를 제안하는 리뷰
2. 리뷰 작성 프로세스 단순화
3. 개발자의 리뷰 확인 접근 방식을 고려

Conclusion
SPR,
Review
None SPR
Security&Priavcy 과 관련된 업데이트
를 분석하기 위해 정적 코드 분석
업데이트의 영향이 된 요인을 평가하는 회귀 모델
Result
앱의 투명성을 증진시키기 위해서 SPR을 더 많이 표현하는 행위를 요구
개발자를 위한 더 좋은 툴을 만들 행위를 요구
리뷰를 적극 수용하여 사생활 뿐만 아니라 앱 디자인에도 영감을 주기를 바람

short text large effect measuring the impact of user reviews on android app security & privacy

Recommended

Recommended

More Related Content

Similar to short text large effect measuring the impact of user reviews on android app security & privacy

Similar to short text large effect measuring the impact of user reviews on android app security & privacy (20)

More from KIMMINHA3

More from KIMMINHA3 (15)

short text large effect measuring the impact of user reviews on android app security & privacy

Editor's Notes