SlideShare a Scribd company logo
 
 
 
ㄹㄹㅈㄷㄹ ,[object Object]
 
교재   : 허명회 ,  양경숙 SPSS  다변량자료분석 SPSS 아카데미
[object Object],[object Object],[object Object],[object Object],[object Object]
제  1  장 서론 컴퓨터 등 기술의 발달  ⇒  방대한 양의 자료 수집이 가능 ⇒  다변량 자료분석의 쓰임새 1)  자료 속에 유용한 정보가 있는지 판별 2)  정보가 있다면 그것을 요약
⊙  다변량 자료분석의 목적 다변량 자료로부터  변수 간의 관련성  또는  개체 간의   관련성 을 분석 예 ) 3 학년 학생들의 수학 ,  국어 ,  사회 ,  과학 성적 예 )  기업의 분류 ⇒  부도나는 기업 ,  건실한 기업 등등
⊙  다변량 자료분석의 방법 모형에 기초한 분석방법 – 모수의 추정과 검정 탐색적인 자료분석방법  – 정보도출 ,  변수의 축약   ⇒  단순화 (simplification)
⊙  개체 (individual, experimental unit)   측정 혹은 평가를 받는 대상 ,  객체 예 )  사람 ,  회사 ,  가족 ,  제품 ,  국가 ⊙  변수 (variable) 각 개체의 속성 ,  특성 예 )  사람 – 키 ,  몸무게 ,  앉은키 ,  머리색 등등 회사 – 자본금 ,  부채 ,  자산 ,  당기순이익 등등 개체와 변수의 수   ↑  ->  다변량 자료분석의 유용성   ↑
 
⊙  다변량 자료의 행렬표현 < n 개의 개체와  p 개의 변수의 경우  > 자료행렬  ( 행벡터 ,  열벡터 )
예 ) 5 명의 대상자로부터 변수 를 관측한 결과 A = (5,0,3) B = (4,2,0) C = (2,1,6)  ⇒ D = (0,5,0) E = (5,2,0)
⊙  중심화 – 평균을  0 으로   ⇒  중심위치를 통일 ⊙  표준화 – 평균을  0,  분산  1 로   ⇒  중심위치와 산포를 통일
⊙  Euclidean Distance  ⊙  Mahalanobis Distance

More Related Content

Similar to 122

[통계페스티발] 무덤에서 요람까지 통계와 함께
[통계페스티발] 무덤에서 요람까지 통계와 함께[통계페스티발] 무덤에서 요람까지 통계와 함께
[통계페스티발] 무덤에서 요람까지 통계와 함께백승민 Baek Seung Min
 
연구학교 데이터분석
연구학교 데이터분석 연구학교 데이터분석
연구학교 데이터분석 성훈 김
 
추천 시스템 개요 (1)-draft
추천 시스템 개요 (1)-draft추천 시스템 개요 (1)-draft
추천 시스템 개요 (1)-drafthyunsung lee
 
개념화 조작화 측정
개념화 조작화 측정개념화 조작화 측정
개념화 조작화 측정sundol75
 
11_통계 자료분석 입문
11_통계 자료분석 입문11_통계 자료분석 입문
11_통계 자료분석 입문noerror
 
230601이종기-시장조사론특강교안-신뢰성과 타당성-요인분석-최종.pdf
230601이종기-시장조사론특강교안-신뢰성과 타당성-요인분석-최종.pdf230601이종기-시장조사론특강교안-신뢰성과 타당성-요인분석-최종.pdf
230601이종기-시장조사론특강교안-신뢰성과 타당성-요인분석-최종.pdfJong-Ki Lee
 
[PyCon KR 2018] 땀내를 줄이는 Data와 Feature 다루기
[PyCon KR 2018] 땀내를 줄이는 Data와 Feature 다루기[PyCon KR 2018] 땀내를 줄이는 Data와 Feature 다루기
[PyCon KR 2018] 땀내를 줄이는 Data와 Feature 다루기Joeun Park
 
Mapping Authors in Intellectual Space
Mapping Authors in Intellectual SpaceMapping Authors in Intellectual Space
Mapping Authors in Intellectual SpaceYeseul Song
 
Doing data science_ch2
Doing data science_ch2Doing data science_ch2
Doing data science_ch2박 민규
 
R을 이용한 데이터 분석
R을 이용한 데이터 분석R을 이용한 데이터 분석
R을 이용한 데이터 분석simon park
 
메타분석 소개
메타분석 소개메타분석 소개
메타분석 소개Youngjun Na
 
LLG Data Journalism Module3 Review
LLG Data Journalism Module3 ReviewLLG Data Journalism Module3 Review
LLG Data Journalism Module3 Reviewneuroassociates
 
03.기술통계 자료의 중심과 퍼진정도
03.기술통계 자료의 중심과 퍼진정도03.기술통계 자료의 중심과 퍼진정도
03.기술통계 자료의 중심과 퍼진정도Yoonwhan Lee
 
[파인트리오픈클래스] 엑셀을 활용한 데이터 분석과 이해
[파인트리오픈클래스] 엑셀을 활용한 데이터 분석과 이해[파인트리오픈클래스] 엑셀을 활용한 데이터 분석과 이해
[파인트리오픈클래스] 엑셀을 활용한 데이터 분석과 이해pinetreeopenclass
 
[도서 리뷰] 헤드 퍼스트 데이터 분석 ( Head First Data Analysis )
[도서 리뷰]  헤드 퍼스트 데이터 분석 ( Head First Data Analysis )[도서 리뷰]  헤드 퍼스트 데이터 분석 ( Head First Data Analysis )
[도서 리뷰] 헤드 퍼스트 데이터 분석 ( Head First Data Analysis )Seung-Woo Kang
 
[네이버AI해커톤]어떻게 걱정을 멈추고 베이스라인을 사랑하는 법을 배우게 되었는가
[네이버AI해커톤]어떻게 걱정을 멈추고 베이스라인을 사랑하는 법을 배우게 되었는가[네이버AI해커톤]어떻게 걱정을 멈추고 베이스라인을 사랑하는 법을 배우게 되었는가
[네이버AI해커톤]어떻게 걱정을 멈추고 베이스라인을 사랑하는 법을 배우게 되었는가NAVER Engineering
 
220112 지승현 mauve
220112 지승현 mauve220112 지승현 mauve
220112 지승현 mauvessuser23ed0c
 
Effective active learning strategy for multi label learning
Effective active learning strategy for multi label learningEffective active learning strategy for multi label learning
Effective active learning strategy for multi label learningJinho Lee
 
[데이터저널리즘 세미나] LLG in Seoul Module 3 Review
[데이터저널리즘 세미나] LLG in Seoul Module 3 Review[데이터저널리즘 세미나] LLG in Seoul Module 3 Review
[데이터저널리즘 세미나] LLG in Seoul Module 3 ReviewNewsjelly
 

Similar to 122 (20)

[통계페스티발] 무덤에서 요람까지 통계와 함께
[통계페스티발] 무덤에서 요람까지 통계와 함께[통계페스티발] 무덤에서 요람까지 통계와 함께
[통계페스티발] 무덤에서 요람까지 통계와 함께
 
연구학교 데이터분석
연구학교 데이터분석 연구학교 데이터분석
연구학교 데이터분석
 
추천 시스템 개요 (1)-draft
추천 시스템 개요 (1)-draft추천 시스템 개요 (1)-draft
추천 시스템 개요 (1)-draft
 
개념화 조작화 측정
개념화 조작화 측정개념화 조작화 측정
개념화 조작화 측정
 
11_통계 자료분석 입문
11_통계 자료분석 입문11_통계 자료분석 입문
11_통계 자료분석 입문
 
230601이종기-시장조사론특강교안-신뢰성과 타당성-요인분석-최종.pdf
230601이종기-시장조사론특강교안-신뢰성과 타당성-요인분석-최종.pdf230601이종기-시장조사론특강교안-신뢰성과 타당성-요인분석-최종.pdf
230601이종기-시장조사론특강교안-신뢰성과 타당성-요인분석-최종.pdf
 
[PyCon KR 2018] 땀내를 줄이는 Data와 Feature 다루기
[PyCon KR 2018] 땀내를 줄이는 Data와 Feature 다루기[PyCon KR 2018] 땀내를 줄이는 Data와 Feature 다루기
[PyCon KR 2018] 땀내를 줄이는 Data와 Feature 다루기
 
Mapping Authors in Intellectual Space
Mapping Authors in Intellectual SpaceMapping Authors in Intellectual Space
Mapping Authors in Intellectual Space
 
Doing data science_ch2
Doing data science_ch2Doing data science_ch2
Doing data science_ch2
 
R을 이용한 데이터 분석
R을 이용한 데이터 분석R을 이용한 데이터 분석
R을 이용한 데이터 분석
 
메타분석 소개
메타분석 소개메타분석 소개
메타분석 소개
 
LLG Data Journalism Module3 Review
LLG Data Journalism Module3 ReviewLLG Data Journalism Module3 Review
LLG Data Journalism Module3 Review
 
03.기술통계 자료의 중심과 퍼진정도
03.기술통계 자료의 중심과 퍼진정도03.기술통계 자료의 중심과 퍼진정도
03.기술통계 자료의 중심과 퍼진정도
 
[파인트리오픈클래스] 엑셀을 활용한 데이터 분석과 이해
[파인트리오픈클래스] 엑셀을 활용한 데이터 분석과 이해[파인트리오픈클래스] 엑셀을 활용한 데이터 분석과 이해
[파인트리오픈클래스] 엑셀을 활용한 데이터 분석과 이해
 
[도서 리뷰] 헤드 퍼스트 데이터 분석 ( Head First Data Analysis )
[도서 리뷰]  헤드 퍼스트 데이터 분석 ( Head First Data Analysis )[도서 리뷰]  헤드 퍼스트 데이터 분석 ( Head First Data Analysis )
[도서 리뷰] 헤드 퍼스트 데이터 분석 ( Head First Data Analysis )
 
[네이버AI해커톤]어떻게 걱정을 멈추고 베이스라인을 사랑하는 법을 배우게 되었는가
[네이버AI해커톤]어떻게 걱정을 멈추고 베이스라인을 사랑하는 법을 배우게 되었는가[네이버AI해커톤]어떻게 걱정을 멈추고 베이스라인을 사랑하는 법을 배우게 되었는가
[네이버AI해커톤]어떻게 걱정을 멈추고 베이스라인을 사랑하는 법을 배우게 되었는가
 
220112 지승현 mauve
220112 지승현 mauve220112 지승현 mauve
220112 지승현 mauve
 
Effective active learning strategy for multi label learning
Effective active learning strategy for multi label learningEffective active learning strategy for multi label learning
Effective active learning strategy for multi label learning
 
[데이터저널리즘 세미나] LLG in Seoul Module 3 Review
[데이터저널리즘 세미나] LLG in Seoul Module 3 Review[데이터저널리즘 세미나] LLG in Seoul Module 3 Review
[데이터저널리즘 세미나] LLG in Seoul Module 3 Review
 
DSAC M2 #1
DSAC M2 #1DSAC M2 #1
DSAC M2 #1
 

122

  • 1.  
  • 2.  
  • 3.  
  • 4.
  • 5.  
  • 6. 교재 : 허명회 , 양경숙 SPSS 다변량자료분석 SPSS 아카데미
  • 7.
  • 8. 제 1 장 서론 컴퓨터 등 기술의 발달 ⇒ 방대한 양의 자료 수집이 가능 ⇒ 다변량 자료분석의 쓰임새 1) 자료 속에 유용한 정보가 있는지 판별 2) 정보가 있다면 그것을 요약
  • 9. ⊙ 다변량 자료분석의 목적 다변량 자료로부터 변수 간의 관련성 또는 개체 간의 관련성 을 분석 예 ) 3 학년 학생들의 수학 , 국어 , 사회 , 과학 성적 예 ) 기업의 분류 ⇒ 부도나는 기업 , 건실한 기업 등등
  • 10. ⊙ 다변량 자료분석의 방법 모형에 기초한 분석방법 – 모수의 추정과 검정 탐색적인 자료분석방법 – 정보도출 , 변수의 축약 ⇒ 단순화 (simplification)
  • 11. ⊙ 개체 (individual, experimental unit) 측정 혹은 평가를 받는 대상 , 객체 예 ) 사람 , 회사 , 가족 , 제품 , 국가 ⊙ 변수 (variable) 각 개체의 속성 , 특성 예 ) 사람 – 키 , 몸무게 , 앉은키 , 머리색 등등 회사 – 자본금 , 부채 , 자산 , 당기순이익 등등 개체와 변수의 수 ↑ -> 다변량 자료분석의 유용성 ↑
  • 12.  
  • 13. ⊙ 다변량 자료의 행렬표현 < n 개의 개체와 p 개의 변수의 경우 > 자료행렬 ( 행벡터 , 열벡터 )
  • 14. 예 ) 5 명의 대상자로부터 변수 를 관측한 결과 A = (5,0,3) B = (4,2,0) C = (2,1,6) ⇒ D = (0,5,0) E = (5,2,0)
  • 15. ⊙ 중심화 – 평균을 0 으로 ⇒ 중심위치를 통일 ⊙ 표준화 – 평균을 0, 분산 1 로 ⇒ 중심위치와 산포를 통일
  • 16. ⊙ Euclidean Distance ⊙ Mahalanobis Distance