[devil's camp] - 자료분석 Using R (정진경)

•Download as PPTX, PDF•

0 likes•432 views

중앙대학교 Zeropage 주최의 기술 세미나 devil's camp 발표자료 입니다.

자료분석 using R
‘21 정진경

자료분석?

Lady Tasting Tea (The Design of Experiments)

변수 종류에 따른 분석
분할표
회귀 모형

분할표

회귀 모형

Data = Model + Error

OLS (Ordinary Least Squares) Method

RStudio 및 코드 다운로드
R 설치: https://cran.rstudio.com/
RStudio 설치: https://www.rstudio.com/products/rstudio/download/
실습 코드: … http://bit.ly/28ZfNuo

단순 회귀 모형
Example - Car Repair Data

Anscombe’s Quartet

회귀 진단 - 선형성 가정
Example - Hamilton Data

회귀 진단 - 이상점, 영향점
Example - Cook’s Distance, DFITS

다중 회귀 모형
Example - Supervisor Data

Supervisor Performance Data

어떤 모델이 적절한가?

범주형 설명변수, 교호작용
Example - Salary Survey Data

Salary Survey Data 모형

회귀방정식 해석

회귀진단 - 오차의 자기상관
Example - Ski Sales Data

AR Model

로지스틱 회귀 모형

GLM - 이항반응변수

로지스틱 회귀

다중공선성

변수 선택

Recommended

JavaScript 비동기 프로그래밍 집중 탐구 - 조유성님

JavaScript 비동기 프로그래밍 집중 탐구 - 조유성님

JavaScript 비동기 프로그래밍 집중 탐구 - 조유성님NAVER D2

Papago/N2MT 개발이야기

Papago/N2MT 개발이야기

Papago/N2MT 개발이야기NAVER D2

데이터분석과통계2 - 최재걸님

데이터분석과통계2 - 최재걸님

데이터분석과통계2 - 최재걸님NAVER D2

텀 프로젝트에서 제품 프로젝트로 - 성준영님

텀 프로젝트에서 제품 프로젝트로 - 성준영님

텀 프로젝트에서 제품 프로젝트로 - 성준영님NAVER D2

[211] 인공지능이 인공지능 챗봇을 만든다

[211] 인공지능이 인공지능 챗봇을 만든다

[211] 인공지능이 인공지능 챗봇을 만든다NAVER D2

[233] 대형 컨테이너 클러스터에서의 고가용성 Network Load Balancing: Maglev Hashing Scheduler i...

[233] 대형 컨테이너 클러스터에서의 고가용성 Network Load Balancing: Maglev Hashing Scheduler i...

[233] 대형 컨테이너 클러스터에서의 고가용성 Network Load Balancing: Maglev Hashing Scheduler i...NAVER D2

[215] Druid로 쉽고 빠르게 데이터 분석하기

[215] Druid로 쉽고 빠르게 데이터 분석하기

[215] Druid로 쉽고 빠르게 데이터 분석하기NAVER D2

[245]Papago Internals: 모델분석과 응용기술 개발

[245]Papago Internals: 모델분석과 응용기술 개발

[245]Papago Internals: 모델분석과 응용기술 개발NAVER D2

Recommended

JavaScript 비동기 프로그래밍 집중 탐구 - 조유성님

JavaScript 비동기 프로그래밍 집중 탐구 - 조유성님

JavaScript 비동기 프로그래밍 집중 탐구 - 조유성님NAVER D2

Papago/N2MT 개발이야기

Papago/N2MT 개발이야기

Papago/N2MT 개발이야기NAVER D2

데이터분석과통계2 - 최재걸님

데이터분석과통계2 - 최재걸님

데이터분석과통계2 - 최재걸님NAVER D2

텀 프로젝트에서 제품 프로젝트로 - 성준영님

텀 프로젝트에서 제품 프로젝트로 - 성준영님

텀 프로젝트에서 제품 프로젝트로 - 성준영님NAVER D2

[211] 인공지능이 인공지능 챗봇을 만든다

[211] 인공지능이 인공지능 챗봇을 만든다

[211] 인공지능이 인공지능 챗봇을 만든다NAVER D2

[233] 대형 컨테이너 클러스터에서의 고가용성 Network Load Balancing: Maglev Hashing Scheduler i...

[233] 대형 컨테이너 클러스터에서의 고가용성 Network Load Balancing: Maglev Hashing Scheduler i...

[233] 대형 컨테이너 클러스터에서의 고가용성 Network Load Balancing: Maglev Hashing Scheduler i...NAVER D2

[215] Druid로 쉽고 빠르게 데이터 분석하기

[215] Druid로 쉽고 빠르게 데이터 분석하기

[215] Druid로 쉽고 빠르게 데이터 분석하기NAVER D2

[245]Papago Internals: 모델분석과 응용기술 개발

[245]Papago Internals: 모델분석과 응용기술 개발

[245]Papago Internals: 모델분석과 응용기술 개발NAVER D2

[236] 스트림 저장소 최적화 이야기: 아파치 드루이드로부터 얻은 교훈

[236] 스트림 저장소 최적화 이야기: 아파치 드루이드로부터 얻은 교훈

[236] 스트림 저장소 최적화 이야기: 아파치 드루이드로부터 얻은 교훈NAVER D2

[235]Wikipedia-scale Q&A

[235]Wikipedia-scale Q&A

[235]Wikipedia-scale Q&ANAVER D2

[244]로봇이 현실 세계에 대해 학습하도록 만들기

[244]로봇이 현실 세계에 대해 학습하도록 만들기

[244]로봇이 현실 세계에 대해 학습하도록 만들기NAVER D2

[243] Deep Learning to help student’s Deep Learning

[243] Deep Learning to help student’s Deep Learning

[243] Deep Learning to help student’s Deep LearningNAVER D2

[234]Fast & Accurate Data Annotation Pipeline for AI applications

[234]Fast & Accurate Data Annotation Pipeline for AI applications

[234]Fast & Accurate Data Annotation Pipeline for AI applicationsNAVER D2

Old version: [233]대형 컨테이너 클러스터에서의 고가용성 Network Load Balancing

Old version: [233]대형 컨테이너 클러스터에서의 고가용성 Network Load Balancing

Old version: [233]대형 컨테이너 클러스터에서의 고가용성 Network Load BalancingNAVER D2

[226]NAVER 광고 deep click prediction: 모델링부터 서빙까지

[226]NAVER 광고 deep click prediction: 모델링부터 서빙까지

[226]NAVER 광고 deep click prediction: 모델링부터 서빙까지NAVER D2

[225]NSML: 머신러닝 플랫폼 서비스하기 & 모델 튜닝 자동화하기

[225]NSML: 머신러닝 플랫폼 서비스하기 & 모델 튜닝 자동화하기

[225]NSML: 머신러닝 플랫폼 서비스하기 & 모델 튜닝 자동화하기NAVER D2

[224]네이버 검색과 개인화

[224]네이버 검색과 개인화

[224]네이버 검색과 개인화NAVER D2

[216]Search Reliability Engineering (부제: 지진에도 흔들리지 않는 네이버 검색시스템)

[216]Search Reliability Engineering (부제: 지진에도 흔들리지 않는 네이버 검색시스템)

[216]Search Reliability Engineering (부제: 지진에도 흔들리지 않는 네이버 검색시스템)NAVER D2

[214] Ai Serving Platform: 하루 수 억 건의 인퍼런스를 처리하기 위한 고군분투기

[214] Ai Serving Platform: 하루 수 억 건의 인퍼런스를 처리하기 위한 고군분투기

[214] Ai Serving Platform: 하루 수 억 건의 인퍼런스를 처리하기 위한 고군분투기NAVER D2

[213] Fashion Visual Search

[213] Fashion Visual Search

[213] Fashion Visual SearchNAVER D2

[232] TensorRT를 활용한 딥러닝 Inference 최적화

[232] TensorRT를 활용한 딥러닝 Inference 최적화

[232] TensorRT를 활용한 딥러닝 Inference 최적화NAVER D2

[242]컴퓨터 비전을 이용한 실내 지도 자동 업데이트 방법: 딥러닝을 통한 POI 변화 탐지

[242]컴퓨터 비전을 이용한 실내 지도 자동 업데이트 방법: 딥러닝을 통한 POI 변화 탐지

[242]컴퓨터 비전을 이용한 실내 지도 자동 업데이트 방법: 딥러닝을 통한 POI 변화 탐지NAVER D2

[212]C3, 데이터 처리에서 서빙까지 가능한 하둡 클러스터

[212]C3, 데이터 처리에서 서빙까지 가능한 하둡 클러스터

[212]C3, 데이터 처리에서 서빙까지 가능한 하둡 클러스터NAVER D2

[223]기계독해 QA: 검색인가, NLP인가?

[223]기계독해 QA: 검색인가, NLP인가?

[223]기계독해 QA: 검색인가, NLP인가?NAVER D2

[231] Clova 화자인식

[231] Clova 화자인식

[231] Clova 화자인식NAVER D2

[232]TensorRT를 활용한 딥러닝 Inference 최적화

[232]TensorRT를 활용한 딥러닝 Inference 최적화

[232]TensorRT를 활용한 딥러닝 Inference 최적화NAVER D2

[222]누구나 만드는 내 목소리 합성기 (부제: 그게 정말 되나요?)

[222]누구나 만드는 내 목소리 합성기 (부제: 그게 정말 되나요?)

[222]누구나 만드는 내 목소리 합성기 (부제: 그게 정말 되나요?)NAVER D2

Old Version: [211] 인공지능이 인공지능 챗봇을 만든다

Old Version: [211] 인공지능이 인공지능 챗봇을 만든다

Old Version: [211] 인공지능이 인공지능 챗봇을 만든다NAVER D2

More Related Content

More from NAVER D2

[236] 스트림 저장소 최적화 이야기: 아파치 드루이드로부터 얻은 교훈

[236] 스트림 저장소 최적화 이야기: 아파치 드루이드로부터 얻은 교훈

[236] 스트림 저장소 최적화 이야기: 아파치 드루이드로부터 얻은 교훈NAVER D2

[235]Wikipedia-scale Q&A

[235]Wikipedia-scale Q&A

[235]Wikipedia-scale Q&ANAVER D2

[244]로봇이 현실 세계에 대해 학습하도록 만들기

[244]로봇이 현실 세계에 대해 학습하도록 만들기

[244]로봇이 현실 세계에 대해 학습하도록 만들기NAVER D2

[243] Deep Learning to help student’s Deep Learning

[243] Deep Learning to help student’s Deep Learning

[243] Deep Learning to help student’s Deep LearningNAVER D2

[234]Fast & Accurate Data Annotation Pipeline for AI applications

[234]Fast & Accurate Data Annotation Pipeline for AI applications

[234]Fast & Accurate Data Annotation Pipeline for AI applicationsNAVER D2

Old version: [233]대형 컨테이너 클러스터에서의 고가용성 Network Load Balancing

Old version: [233]대형 컨테이너 클러스터에서의 고가용성 Network Load Balancing

Old version: [233]대형 컨테이너 클러스터에서의 고가용성 Network Load BalancingNAVER D2

[226]NAVER 광고 deep click prediction: 모델링부터 서빙까지

[226]NAVER 광고 deep click prediction: 모델링부터 서빙까지

[226]NAVER 광고 deep click prediction: 모델링부터 서빙까지NAVER D2

[225]NSML: 머신러닝 플랫폼 서비스하기 & 모델 튜닝 자동화하기

[225]NSML: 머신러닝 플랫폼 서비스하기 & 모델 튜닝 자동화하기

[225]NSML: 머신러닝 플랫폼 서비스하기 & 모델 튜닝 자동화하기NAVER D2

[224]네이버 검색과 개인화

[224]네이버 검색과 개인화

[224]네이버 검색과 개인화NAVER D2

[216]Search Reliability Engineering (부제: 지진에도 흔들리지 않는 네이버 검색시스템)

[216]Search Reliability Engineering (부제: 지진에도 흔들리지 않는 네이버 검색시스템)

[216]Search Reliability Engineering (부제: 지진에도 흔들리지 않는 네이버 검색시스템)NAVER D2

[214] Ai Serving Platform: 하루 수 억 건의 인퍼런스를 처리하기 위한 고군분투기

[214] Ai Serving Platform: 하루 수 억 건의 인퍼런스를 처리하기 위한 고군분투기

[214] Ai Serving Platform: 하루 수 억 건의 인퍼런스를 처리하기 위한 고군분투기NAVER D2

[213] Fashion Visual Search

[213] Fashion Visual Search

[213] Fashion Visual SearchNAVER D2

[232] TensorRT를 활용한 딥러닝 Inference 최적화

[232] TensorRT를 활용한 딥러닝 Inference 최적화

[232] TensorRT를 활용한 딥러닝 Inference 최적화NAVER D2

[242]컴퓨터 비전을 이용한 실내 지도 자동 업데이트 방법: 딥러닝을 통한 POI 변화 탐지

[242]컴퓨터 비전을 이용한 실내 지도 자동 업데이트 방법: 딥러닝을 통한 POI 변화 탐지

[242]컴퓨터 비전을 이용한 실내 지도 자동 업데이트 방법: 딥러닝을 통한 POI 변화 탐지NAVER D2

[212]C3, 데이터 처리에서 서빙까지 가능한 하둡 클러스터

[212]C3, 데이터 처리에서 서빙까지 가능한 하둡 클러스터

[212]C3, 데이터 처리에서 서빙까지 가능한 하둡 클러스터NAVER D2

[223]기계독해 QA: 검색인가, NLP인가?

[223]기계독해 QA: 검색인가, NLP인가?

[223]기계독해 QA: 검색인가, NLP인가?NAVER D2

[231] Clova 화자인식

[231] Clova 화자인식

[231] Clova 화자인식NAVER D2

[232]TensorRT를 활용한 딥러닝 Inference 최적화

[232]TensorRT를 활용한 딥러닝 Inference 최적화

[232]TensorRT를 활용한 딥러닝 Inference 최적화NAVER D2

[222]누구나 만드는 내 목소리 합성기 (부제: 그게 정말 되나요?)

[222]누구나 만드는 내 목소리 합성기 (부제: 그게 정말 되나요?)

[222]누구나 만드는 내 목소리 합성기 (부제: 그게 정말 되나요?)NAVER D2

Old Version: [211] 인공지능이 인공지능 챗봇을 만든다

Old Version: [211] 인공지능이 인공지능 챗봇을 만든다

Old Version: [211] 인공지능이 인공지능 챗봇을 만든다NAVER D2

More from NAVER D2 (20)

[236] 스트림 저장소 최적화 이야기: 아파치 드루이드로부터 얻은 교훈

[236] 스트림 저장소 최적화 이야기: 아파치 드루이드로부터 얻은 교훈

[236] 스트림 저장소 최적화 이야기: 아파치 드루이드로부터 얻은 교훈

[235]Wikipedia-scale Q&A

[235]Wikipedia-scale Q&A

[235]Wikipedia-scale Q&A

[244]로봇이 현실 세계에 대해 학습하도록 만들기

[244]로봇이 현실 세계에 대해 학습하도록 만들기

[244]로봇이 현실 세계에 대해 학습하도록 만들기

[243] Deep Learning to help student’s Deep Learning

[243] Deep Learning to help student’s Deep Learning

[243] Deep Learning to help student’s Deep Learning

[234]Fast & Accurate Data Annotation Pipeline for AI applications

[234]Fast & Accurate Data Annotation Pipeline for AI applications

[234]Fast & Accurate Data Annotation Pipeline for AI applications

Old version: [233]대형 컨테이너 클러스터에서의 고가용성 Network Load Balancing

Old version: [233]대형 컨테이너 클러스터에서의 고가용성 Network Load Balancing

Old version: [233]대형 컨테이너 클러스터에서의 고가용성 Network Load Balancing

[226]NAVER 광고 deep click prediction: 모델링부터 서빙까지

[226]NAVER 광고 deep click prediction: 모델링부터 서빙까지

[226]NAVER 광고 deep click prediction: 모델링부터 서빙까지

[225]NSML: 머신러닝 플랫폼 서비스하기 & 모델 튜닝 자동화하기

[225]NSML: 머신러닝 플랫폼 서비스하기 & 모델 튜닝 자동화하기

[225]NSML: 머신러닝 플랫폼 서비스하기 & 모델 튜닝 자동화하기

[224]네이버 검색과 개인화

[224]네이버 검색과 개인화

[224]네이버 검색과 개인화

[216]Search Reliability Engineering (부제: 지진에도 흔들리지 않는 네이버 검색시스템)

[216]Search Reliability Engineering (부제: 지진에도 흔들리지 않는 네이버 검색시스템)

[216]Search Reliability Engineering (부제: 지진에도 흔들리지 않는 네이버 검색시스템)

[214] Ai Serving Platform: 하루 수 억 건의 인퍼런스를 처리하기 위한 고군분투기

[214] Ai Serving Platform: 하루 수 억 건의 인퍼런스를 처리하기 위한 고군분투기

[214] Ai Serving Platform: 하루 수 억 건의 인퍼런스를 처리하기 위한 고군분투기

[213] Fashion Visual Search

[213] Fashion Visual Search

[213] Fashion Visual Search

[232] TensorRT를 활용한 딥러닝 Inference 최적화

[232] TensorRT를 활용한 딥러닝 Inference 최적화

[232] TensorRT를 활용한 딥러닝 Inference 최적화

[242]컴퓨터 비전을 이용한 실내 지도 자동 업데이트 방법: 딥러닝을 통한 POI 변화 탐지

[242]컴퓨터 비전을 이용한 실내 지도 자동 업데이트 방법: 딥러닝을 통한 POI 변화 탐지

[242]컴퓨터 비전을 이용한 실내 지도 자동 업데이트 방법: 딥러닝을 통한 POI 변화 탐지

[212]C3, 데이터 처리에서 서빙까지 가능한 하둡 클러스터

[212]C3, 데이터 처리에서 서빙까지 가능한 하둡 클러스터

[212]C3, 데이터 처리에서 서빙까지 가능한 하둡 클러스터

[223]기계독해 QA: 검색인가, NLP인가?

[223]기계독해 QA: 검색인가, NLP인가?

[223]기계독해 QA: 검색인가, NLP인가?

[231] Clova 화자인식

[231] Clova 화자인식

[231] Clova 화자인식

[232]TensorRT를 활용한 딥러닝 Inference 최적화

[232]TensorRT를 활용한 딥러닝 Inference 최적화

[232]TensorRT를 활용한 딥러닝 Inference 최적화

[222]누구나 만드는 내 목소리 합성기 (부제: 그게 정말 되나요?)

[222]누구나 만드는 내 목소리 합성기 (부제: 그게 정말 되나요?)

[222]누구나 만드는 내 목소리 합성기 (부제: 그게 정말 되나요?)

Old Version: [211] 인공지능이 인공지능 챗봇을 만든다

Old Version: [211] 인공지능이 인공지능 챗봇을 만든다

Old Version: [211] 인공지능이 인공지능 챗봇을 만든다

[devil's camp] - 자료분석 Using R (정진경)

1. 자료분석 using R ‘21 정진경

2. 자료분석?

3. Lady Tasting Tea (The Design of Experiments)

4. 변수 종류에 따른 분석 분할표 회귀 모형

6. 회귀 모형

7. Data = Model + Error

8. OLS (Ordinary Least Squares) Method

9. RStudio 및 코드 다운로드 R 설치: https://cran.rstudio.com/ RStudio 설치: https://www.rstudio.com/products/rstudio/download/ 실습 코드: … http://bit.ly/28ZfNuo

10. 단순 회귀 모형 Example - Car Repair Data

11. Anscombe’s Quartet

12. 회귀 진단 - 선형성 가정 Example - Hamilton Data

13. 회귀 진단 - 이상점, 영향점 Example - Cook’s Distance, DFITS

14. 다중 회귀 모형 Example - Supervisor Data

15. Supervisor Performance Data

16. 어떤 모델이 적절한가?

17. 범주형 설명변수, 교호작용 Example - Salary Survey Data

18. Salary Survey Data 모형

19. 회귀방정식 해석

20. 회귀진단 - 오차의 자기상관 Example - Ski Sales Data

22. 로지스틱 회귀 모형

23. GLM - 이항반응변수

24. 로지스틱 회귀

25. 다중공선성

26. 변수 선택

Editor's Notes

Q: X, Y축 상의 자료를 분석하시오. Q: 모호한 데이터에 대해서도 분석 가능한가? 체중관리 앱을 만든다고 가정하고, 사용자의 체중이 시간에 따라 증가하면 경고하고, 감소하면 칭찬하는 기능을 넣으려고 한다. 증가/감소 했음을 어떻게 판단할 것인가? 1종 오류와 2종 오류를 어떻게 제어할 수 있는가?
Lady가 홍차를 먼저 넣은 밀크티와, 우유를 먼저 넣은 밀크티를 구분할 수 있는 능력이 있다고 주장한다. 실험 설계: 4개의 홍차를 먼저 넣은 밀크티, 4개의 우유를 먼저 넣은 밀크티 총 8개의 밀크티를 무작위로 배치한 뒤 4개를 선택해 맞추도록 한다. 주장에 대해 가설을 설정하고 검정한다. 귀무가설: 맞출 확률이 ½ 이다. (구분할 수 있는 능력이 없다) 대립가설: 맞출 확률이 ½ 보다 높다. (구분할 수 있는 능력이 있다) Exact Test. 모형 없이 검정 가능.
변수 종류에 대한 이해 양적 변수 질적 변수 - 명목형, 순서형 몸무게 예제는 양적 변수(시간)와 양적 변수(몸무게) 간의 관계 티 예제는 명목형 변수와 명목형 변수 간의 관계
모형 설정 후 회귀방정식 추정 추정된 식에서 설명변수의 중요성을 평가하고 주어진 설명변수들의 값에 대한 반응변수의 값을 예측하기 위하여 사용될 수 있다.
SSE 개념 소개
ch2.R Setwd로 소스코드 다운로드 받은 디렉토리로 이동
복잡한 모델일 수록 Goodness of Fit은 크다. 변수를 왕창 추가하면 될까? > No. 해석 불가능. 설득력 없음. 대신 Prediction은 가능.