SlideShare a Scribd company logo
1 of 28
Advanced Training: Statistics
Agenda
간편 통계
• 히스토그램
• 요약 카드
• 추세선
• 회귀분석
통계 시각화
• 박스 플롯
• 관리도(Control Chart)
Be a Detective, Find Fraud!
• 벤포드의 법칙
수학 공식을 Tableau 수식으로 변환
히스토그램 Histogram
기본 히스토그램 누적 히스토그램
• 히스토그램은 데이터의 분포를 보여줌
• 막대의 길이는 특정 구간에 속하는 관측치의 개수를 표현
• 구간은 빈(bin)이라고 지칭됨
구간 차원(bin) 만들기
©2012 Tableau Software Inc. All rights reserved.
구간 차원(bin)은 데이터(측정값)를 동일 크기의
구간에 분류해서 넣음
히스토그램
©2012 Tableau Software Inc. All rights reserved.
히스토그램은 데이터의 분포를 보여줌
비대칭적인 구간 차원(bin)
©2012 Tableau Software Inc. All rights reserved.
구간을 임의로 정의하려면 계산 필드를 먼저 만들고
나서 다시 구간 차원(bin)을 생성
요약 카드
요약 카드
Skewness(왜곡도, 왜도, 비대칭도)
Positive Excess Kurtosis on top,
Negative Excess Kurtosis on bottom
Excess Kurtosis(첨도)
추세선
ANOVA and Summary Tables
©2012 Tableau Software Inc. All rights reserved.
ANOVA and Summary Tables
©2012 Tableau Software Inc. All rights reserved.
ANOVA and Summary Tables
©2012 Tableau Software Inc. All rights reserved.
잔차
모형의 예측치(prediction)와
관측치(observation) 간의 차이
Understanding Residuals
Standard Scatterplot: X and Y Predictions on X, Residuals on Y
Pattern of Residuals Tells you the fit of the model…
Great Residuals: Poor Residuals:
The better the model fit, the less pattern (more random) the predictions vs.
residuals scatterplot should look
Tableau에서의 잔차 분석 (Windows Only)
Traditional
박스 플롯
Tableau
• Bullet 2
– Bullet 3
• Tableau의 Show Me 박스 플롯은
관측치를 모두 보이며, 1.5*IQR
기준의 수염 표시
• 간단한 옵션 설정으로 traditional
boxplot으로 변경
“Show Me”… a Box-and-whisker plot
참조선 옵션 변경
표준 점수
수학 공식을 Tableau 수식으로 변환
𝑥𝑖 = each point of data = AVG([Calories]) for each Display_Name
𝑥 = the average of all points = WINDOW_AVG(AVG([Calories]))
𝑠 𝑥= standard deviation of all points = WINDOW_STDEV(AVG([Calories]))
관리도(Control Chart)
First line of text
• Bullet 2
– Bullet 3
Np 관리도 수식
Where:
n = sample size
P-bar = percent of defective units.
This is (Number of Defectives)/(Total
Sample Size)
Explanation of Translating NP calc into
Tableau
P-bar:
WINDOW_SUM(SUM([Defectives]))/WINDOW_SUM(SUM([Sample Size]))
N :
SUM([Sample Size])
여러 번 출현하는 것은 별도의 계산 필드로 작성.
여기서는 n*p-bar를 여러 번 사용하게 되므로 계산 필드로 만들어 놓기로 함
Np-bar:
[N]*[P-bar]
하나의 계산 필드에서 +와 –를 동시에 표현할 수 없으므로 별도의 계산식으로
분리. Upper Control Limit (UCL) 및 Lower Control Limit (LCL)
UCL:
[np-bar]+3*SQRT( [np-bar]*(1-[P-bar]) )
LCL:
[np-bar]-3*SQRT( [np-bar]*(1-[P-bar]) )
UCL과 LCL을 벗어나는 마크 색상 표시
IF
SUM ( [Defectives] ) > [UCL] OR
SUM ( [Defectives] ) < [LCL]
THEN ‘Out of Control’
ELSE ‘In Control’
END
벤포드의 법칙(Benford’s Law)
First line of text
• Bullet 2
– Bullet 3
END

More Related Content

Viewers also liked

Presentation on advance tax
Presentation on advance taxPresentation on advance tax
Presentation on advance taxPooja Gupta
 
M.Sc_Maths Thesis Pradeep Mishra
M.Sc_Maths Thesis Pradeep MishraM.Sc_Maths Thesis Pradeep Mishra
M.Sc_Maths Thesis Pradeep MishraPradeep Mishra
 
MATRIMONIO Y DIVORCIO EN LA ACTUAL CONSTITUCIÓN
MATRIMONIO Y DIVORCIO EN LA ACTUAL CONSTITUCIÓN MATRIMONIO Y DIVORCIO EN LA ACTUAL CONSTITUCIÓN
MATRIMONIO Y DIVORCIO EN LA ACTUAL CONSTITUCIÓN AndresGallegos1212
 
Martin,Dustin.thesis
Martin,Dustin.thesisMartin,Dustin.thesis
Martin,Dustin.thesisDustin Martin
 
Paul Wrighton resume Nov 2016
Paul Wrighton resume Nov 2016Paul Wrighton resume Nov 2016
Paul Wrighton resume Nov 2016Paul Wrighton
 
Türkiye ve Dünyada Sosyal Medya Kullanımı / Nuray Aktay
Türkiye ve Dünyada Sosyal Medya Kullanımı / Nuray AktayTürkiye ve Dünyada Sosyal Medya Kullanımı / Nuray Aktay
Türkiye ve Dünyada Sosyal Medya Kullanımı / Nuray AktayNuray Aktay
 
Протестные настроения (апрель 2016). Протест дальнобойщиков
Протестные настроения (апрель 2016). Протест дальнобойщиковПротестные настроения (апрель 2016). Протест дальнобойщиков
Протестные настроения (апрель 2016). Протест дальнобойщиковStepan Goncharov
 
Selenium Camp 2016 - Effective UI tests scaling on Java
Selenium Camp 2016 - Effective UI tests scaling on JavaSelenium Camp 2016 - Effective UI tests scaling on Java
Selenium Camp 2016 - Effective UI tests scaling on JavaSergey Korol
 
Presentation on advance tax
Presentation on advance taxPresentation on advance tax
Presentation on advance taxPooja Gupta
 
Tableau Drive, 엔터프라이즈 배포를 위한 새로운 방법론
Tableau Drive, 엔터프라이즈 배포를 위한 새로운 방법론Tableau Drive, 엔터프라이즈 배포를 위한 새로운 방법론
Tableau Drive, 엔터프라이즈 배포를 위한 새로운 방법론Tableau Software
 
Online publishers versus Ad-blockers
Online publishers versus Ad-blockersOnline publishers versus Ad-blockers
Online publishers versus Ad-blockersYanwen Zhang
 

Viewers also liked (14)

Enfoque 017 (2)
Enfoque 017 (2)Enfoque 017 (2)
Enfoque 017 (2)
 
msorianoresume2
msorianoresume2msorianoresume2
msorianoresume2
 
Presentation on advance tax
Presentation on advance taxPresentation on advance tax
Presentation on advance tax
 
Presentation
PresentationPresentation
Presentation
 
M.Sc_Maths Thesis Pradeep Mishra
M.Sc_Maths Thesis Pradeep MishraM.Sc_Maths Thesis Pradeep Mishra
M.Sc_Maths Thesis Pradeep Mishra
 
MATRIMONIO Y DIVORCIO EN LA ACTUAL CONSTITUCIÓN
MATRIMONIO Y DIVORCIO EN LA ACTUAL CONSTITUCIÓN MATRIMONIO Y DIVORCIO EN LA ACTUAL CONSTITUCIÓN
MATRIMONIO Y DIVORCIO EN LA ACTUAL CONSTITUCIÓN
 
Martin,Dustin.thesis
Martin,Dustin.thesisMartin,Dustin.thesis
Martin,Dustin.thesis
 
Paul Wrighton resume Nov 2016
Paul Wrighton resume Nov 2016Paul Wrighton resume Nov 2016
Paul Wrighton resume Nov 2016
 
Türkiye ve Dünyada Sosyal Medya Kullanımı / Nuray Aktay
Türkiye ve Dünyada Sosyal Medya Kullanımı / Nuray AktayTürkiye ve Dünyada Sosyal Medya Kullanımı / Nuray Aktay
Türkiye ve Dünyada Sosyal Medya Kullanımı / Nuray Aktay
 
Протестные настроения (апрель 2016). Протест дальнобойщиков
Протестные настроения (апрель 2016). Протест дальнобойщиковПротестные настроения (апрель 2016). Протест дальнобойщиков
Протестные настроения (апрель 2016). Протест дальнобойщиков
 
Selenium Camp 2016 - Effective UI tests scaling on Java
Selenium Camp 2016 - Effective UI tests scaling on JavaSelenium Camp 2016 - Effective UI tests scaling on Java
Selenium Camp 2016 - Effective UI tests scaling on Java
 
Presentation on advance tax
Presentation on advance taxPresentation on advance tax
Presentation on advance tax
 
Tableau Drive, 엔터프라이즈 배포를 위한 새로운 방법론
Tableau Drive, 엔터프라이즈 배포를 위한 새로운 방법론Tableau Drive, 엔터프라이즈 배포를 위한 새로운 방법론
Tableau Drive, 엔터프라이즈 배포를 위한 새로운 방법론
 
Online publishers versus Ad-blockers
Online publishers versus Ad-blockersOnline publishers versus Ad-blockers
Online publishers versus Ad-blockers
 

Similar to Tableau 라이브 온라인 교육 - 통계 분석 (Statistics)

파이썬 데이터과학 레벨2 - 데이터 시각화와 실전 데이터분석, 그리고 머신러닝 입문 (2020년 이태영)
파이썬 데이터과학 레벨2 - 데이터 시각화와 실전 데이터분석, 그리고 머신러닝 입문 (2020년 이태영)파이썬 데이터과학 레벨2 - 데이터 시각화와 실전 데이터분석, 그리고 머신러닝 입문 (2020년 이태영)
파이썬 데이터과학 레벨2 - 데이터 시각화와 실전 데이터분석, 그리고 머신러닝 입문 (2020년 이태영)Tae Young Lee
 
R과 기초통계 : 02.기술통계-자료나타내기
R과 기초통계 : 02.기술통계-자료나타내기R과 기초통계 : 02.기술통계-자료나타내기
R과 기초통계 : 02.기술통계-자료나타내기Yoonwhan Lee
 
Cnn 발표자료
Cnn 발표자료Cnn 발표자료
Cnn 발표자료종현 최
 
★강의교재_데이터 분석을 위한 통계와 확률_v2.pptx
★강의교재_데이터 분석을 위한 통계와 확률_v2.pptx★강의교재_데이터 분석을 위한 통계와 확률_v2.pptx
★강의교재_데이터 분석을 위한 통계와 확률_v2.pptxDonghwan Lee
 
2.linear regression and logistic regression
2.linear regression and logistic regression2.linear regression and logistic regression
2.linear regression and logistic regressionHaesun Park
 
Titanic kaggle competition
Titanic kaggle competitionTitanic kaggle competition
Titanic kaggle competitionjdo
 
3.neural networks
3.neural networks3.neural networks
3.neural networksHaesun Park
 
Deep Learning from scratch 4장 : neural network learning
Deep Learning from scratch 4장 : neural network learningDeep Learning from scratch 4장 : neural network learning
Deep Learning from scratch 4장 : neural network learningJinSooKim80
 
내가 이해하는 SVM(왜, 어떻게를 중심으로)
내가 이해하는 SVM(왜, 어떻게를 중심으로)내가 이해하는 SVM(왜, 어떻게를 중심으로)
내가 이해하는 SVM(왜, 어떻게를 중심으로)SANG WON PARK
 
[SOPT] 데이터 구조 및 알고리즘 스터디 - #02 : 스택, 큐, 수식 연산
[SOPT] 데이터 구조 및 알고리즘 스터디 - #02 : 스택, 큐, 수식 연산[SOPT] 데이터 구조 및 알고리즘 스터디 - #02 : 스택, 큐, 수식 연산
[SOPT] 데이터 구조 및 알고리즘 스터디 - #02 : 스택, 큐, 수식 연산S.O.P.T - Shout Our Passion Together
 
R 스터디 네번째
R 스터디 네번째R 스터디 네번째
R 스터디 네번째Jaeseok Park
 
Python datatype
Python datatypePython datatype
Python datatype건희 김
 

Similar to Tableau 라이브 온라인 교육 - 통계 분석 (Statistics) (14)

파이썬 데이터과학 레벨2 - 데이터 시각화와 실전 데이터분석, 그리고 머신러닝 입문 (2020년 이태영)
파이썬 데이터과학 레벨2 - 데이터 시각화와 실전 데이터분석, 그리고 머신러닝 입문 (2020년 이태영)파이썬 데이터과학 레벨2 - 데이터 시각화와 실전 데이터분석, 그리고 머신러닝 입문 (2020년 이태영)
파이썬 데이터과학 레벨2 - 데이터 시각화와 실전 데이터분석, 그리고 머신러닝 입문 (2020년 이태영)
 
R과 기초통계 : 02.기술통계-자료나타내기
R과 기초통계 : 02.기술통계-자료나타내기R과 기초통계 : 02.기술통계-자료나타내기
R과 기초통계 : 02.기술통계-자료나타내기
 
Cnn 발표자료
Cnn 발표자료Cnn 발표자료
Cnn 발표자료
 
Variational AutoEncoder(VAE)
Variational AutoEncoder(VAE)Variational AutoEncoder(VAE)
Variational AutoEncoder(VAE)
 
★강의교재_데이터 분석을 위한 통계와 확률_v2.pptx
★강의교재_데이터 분석을 위한 통계와 확률_v2.pptx★강의교재_데이터 분석을 위한 통계와 확률_v2.pptx
★강의교재_데이터 분석을 위한 통계와 확률_v2.pptx
 
2.linear regression and logistic regression
2.linear regression and logistic regression2.linear regression and logistic regression
2.linear regression and logistic regression
 
Titanic kaggle competition
Titanic kaggle competitionTitanic kaggle competition
Titanic kaggle competition
 
3.neural networks
3.neural networks3.neural networks
3.neural networks
 
Deep Learning from scratch 4장 : neural network learning
Deep Learning from scratch 4장 : neural network learningDeep Learning from scratch 4장 : neural network learning
Deep Learning from scratch 4장 : neural network learning
 
내가 이해하는 SVM(왜, 어떻게를 중심으로)
내가 이해하는 SVM(왜, 어떻게를 중심으로)내가 이해하는 SVM(왜, 어떻게를 중심으로)
내가 이해하는 SVM(왜, 어떻게를 중심으로)
 
[SOPT] 데이터 구조 및 알고리즘 스터디 - #02 : 스택, 큐, 수식 연산
[SOPT] 데이터 구조 및 알고리즘 스터디 - #02 : 스택, 큐, 수식 연산[SOPT] 데이터 구조 및 알고리즘 스터디 - #02 : 스택, 큐, 수식 연산
[SOPT] 데이터 구조 및 알고리즘 스터디 - #02 : 스택, 큐, 수식 연산
 
House price
House priceHouse price
House price
 
R 스터디 네번째
R 스터디 네번째R 스터디 네번째
R 스터디 네번째
 
Python datatype
Python datatypePython datatype
Python datatype
 

Tableau 라이브 온라인 교육 - 통계 분석 (Statistics)