미세먼지와 호흡기 질환의 연관관계 규명(제13회 SAS 분석챔피언십, 입상작)Hanbin Seo
미세먼지와 호흡기 질환의 연관관계 규명, 제13회 SAS 분석 챔피언십
주최/주관: SAS Korea (후원: 건강보험심사평가원, 코웨이, KT); 성적: 동상(Bronze prize), 2015.10.
공모주제 하위 목표
- 공기 질(air quality)과 호흡기 질환의 연관 관계를 규명하는 예측 모형 개발
- 공기청정기의 공기 질 개선효과 규명 및 마케팅 기획
미세먼지와 호흡기 질환의 연관관계 규명(제13회 SAS 분석챔피언십, 입상작)Hanbin Seo
미세먼지와 호흡기 질환의 연관관계 규명, 제13회 SAS 분석 챔피언십
주최/주관: SAS Korea (후원: 건강보험심사평가원, 코웨이, KT); 성적: 동상(Bronze prize), 2015.10.
공모주제 하위 목표
- 공기 질(air quality)과 호흡기 질환의 연관 관계를 규명하는 예측 모형 개발
- 공기청정기의 공기 질 개선효과 규명 및 마케팅 기획
위 자료는 BOAZ 2015 프로젝트 주제의 하나로, Advanced 정규세션 동안 Base 정규세션에서 배웠던 다양한 이론들과 기본 지식들, 그리고 툴 활용능력들을 직접 실행하며 진행한 결과물입니다.
*** 텔레마틱스 데이터를 이용한 자동차 운전자 프로필 생성 ***
Kaggle에서 제공하는 2차원 좌표의 텔레마틱스 데이터를 활용하여 지도매칭과 모델링접근 방법을 통한 운전자의 특징 파악 및 프로필 생성
- Telematics 소개
- 운전자 지문 활용방안
- 지도 매칭 방법 & 모델링 접근 방법
건국대학교 응용통계학과 김한솔
숙명여자대학교 경제학과 남윤이
성균관대학교 컴퓨터공학과 성미진
숙명여자대학교 통계학과 신현화
** 국내 최초 대학생 빅데이터 연합동아리 BOAZ **
Blog : http://BOAZbigdata.com
Facebook : http://fb.com/BOAZbigdata
"R을 이용한 데이터 처리 & 분석 실무 - 서민구 지음" 정리 자료 #3
- https://thebook.io/006723/
- 첫번째 : goo.gl/FJjOlq
- 두번째 : goo.gl/Wdb90g
- 세번째 : goo.gl/80VGcn
- 네번째 : goo.gl/lblUsR
우주항공, 전기자동차, 정밀기계 등 고부가가치 미래 신(新)사업은 빠른 속도로 발전하고 있습니다. 신(新)사업에 뛰어든 회사들은 경계를 허물고 융합을 거듭합니다. 경쟁에서 뒤쳐지지 않기 위해서 새로운 기술을 도입하게 됩니다. 제조 기업은 빠르게 변화하는 산업 트렌드에 맞춰 고객의 요구 사항을 반영하고 개발 프로세스를 변경할 수 있는 설계 기술이 회사의 중요한 자산이 됩니다.
최근 제품의 복잡성은 계속해서 커지고 있는 반면, 제품 출시 기간은 지속적으로 짧아지면서 기업에서는 제품 개발 프로세스를 고도화하기 위해 노력하게 되었습니다. 이러한 상황에서 제너레이티브 디자인(Generative Design)은 새로운 돌파구가 됩니다. 이런 시장의 요구에 맞춰 ‘제너레이티브 디자인' 온라인 클래스를 개설합니다.
인공지능을 활용한 스마트 설계 워크샵에 대해 궁금하신 사항은 아래 링크를 통해 추가로 확인해 보세요.
바로가기 ▶ https://autode.sk/304xfeA
삼성MNS는 국내 삼성전자 디지털복합기 전문점이며, 서울 서초구 서초동에 위치하고 있고, 주요 취급 제품으로는 복합기, 프린터, 팩스, 전산용품의 판매 및 유지보수와 디지털복합기의 임대 및 MPS(Managed Printing Services) 사업을 근간으로 운영되고 있는 회사입니다.
위 자료는 BOAZ 2015 프로젝트 주제의 하나로, Advanced 정규세션 동안 Base 정규세션에서 배웠던 다양한 이론들과 기본 지식들, 그리고 툴 활용능력들을 직접 실행하며 진행한 결과물입니다.
*** 텔레마틱스 데이터를 이용한 자동차 운전자 프로필 생성 ***
Kaggle에서 제공하는 2차원 좌표의 텔레마틱스 데이터를 활용하여 지도매칭과 모델링접근 방법을 통한 운전자의 특징 파악 및 프로필 생성
- Telematics 소개
- 운전자 지문 활용방안
- 지도 매칭 방법 & 모델링 접근 방법
건국대학교 응용통계학과 김한솔
숙명여자대학교 경제학과 남윤이
성균관대학교 컴퓨터공학과 성미진
숙명여자대학교 통계학과 신현화
** 국내 최초 대학생 빅데이터 연합동아리 BOAZ **
Blog : http://BOAZbigdata.com
Facebook : http://fb.com/BOAZbigdata
"R을 이용한 데이터 처리 & 분석 실무 - 서민구 지음" 정리 자료 #3
- https://thebook.io/006723/
- 첫번째 : goo.gl/FJjOlq
- 두번째 : goo.gl/Wdb90g
- 세번째 : goo.gl/80VGcn
- 네번째 : goo.gl/lblUsR
우주항공, 전기자동차, 정밀기계 등 고부가가치 미래 신(新)사업은 빠른 속도로 발전하고 있습니다. 신(新)사업에 뛰어든 회사들은 경계를 허물고 융합을 거듭합니다. 경쟁에서 뒤쳐지지 않기 위해서 새로운 기술을 도입하게 됩니다. 제조 기업은 빠르게 변화하는 산업 트렌드에 맞춰 고객의 요구 사항을 반영하고 개발 프로세스를 변경할 수 있는 설계 기술이 회사의 중요한 자산이 됩니다.
최근 제품의 복잡성은 계속해서 커지고 있는 반면, 제품 출시 기간은 지속적으로 짧아지면서 기업에서는 제품 개발 프로세스를 고도화하기 위해 노력하게 되었습니다. 이러한 상황에서 제너레이티브 디자인(Generative Design)은 새로운 돌파구가 됩니다. 이런 시장의 요구에 맞춰 ‘제너레이티브 디자인' 온라인 클래스를 개설합니다.
인공지능을 활용한 스마트 설계 워크샵에 대해 궁금하신 사항은 아래 링크를 통해 추가로 확인해 보세요.
바로가기 ▶ https://autode.sk/304xfeA
삼성MNS는 국내 삼성전자 디지털복합기 전문점이며, 서울 서초구 서초동에 위치하고 있고, 주요 취급 제품으로는 복합기, 프린터, 팩스, 전산용품의 판매 및 유지보수와 디지털복합기의 임대 및 MPS(Managed Printing Services) 사업을 근간으로 운영되고 있는 회사입니다.
4. 1. 분석의 개요 및 목적
2. 분석 범위 및 방법
3. 변수 탐색 / 분석
4. Feature Selection
Part 1
5. Model 검증을 위해 다중회귀분석 실시
5. 이상치와 영향력 탐색
6. 회귀모형 가정의 진단 및 개선
7. 다중공선성 진단 (Multicollinearity)
Case 별 다중회귀분석 실시해서 결과값 비교
8. 최종 회귀함수 결정
Cross Validation 실시
Predition
CSV file 생성
Part 2
6. 1. 분석의 개요 및 목적
중고차 가격
회귀분석
회기모형 도출
Test Set
가격 예측
7. 2. 분석 범위 및 방법
분석 범위 : Train Set
1,019
Data
39
Variables
8. 분석 방법
독립변수(independent) X, 종속변수(dependent) Y 결정.
(본 프로젝트의 경우, Y는 Price로 결정)
독립변수를 연속형(continous), 이산형(descrete), 질적(categorica
l) 변수로 구분
Linear Regression 독립변수, 종속변수 모두 측정형 변수
(연속형은 모두 측정형 변수, 이산형 중의 일부는 측정형 변수)
독립변수와 종속변수 간, 독립변수 상호간의 상관 정도 분석
회귀식에 반영할 최종 독립변수 X 선정
9. Id Model Price Age_08_04 Mfg_Month Mfg_Year KM
Fuel_Type HP Met_Color Color Automatic CC Doors
Cylinders Gears
Quarterly_Ta
x
Weight
Mfr_Guarant
ee
BOVAG_Guar
antee
Guarantee_P
eriod
ABS Airbag_1 Airbag_2 Airco
Automatic_ai
rco
Boardcompu
ter
CD_Player
Central_Lock
Powered_Wi
ndows
Power_Steeri
ng
Radio Mistlamps Sport_Model
Backseat_Div
ider
Metallic_Rim
Radio_casset
te
Parking_Assi
stant
Tow_Bar
3. 변수 탐색
10. Id
Model
Price
Age_08_04 Mfg_Month Mfg_Year KM
Fuel_Type HP Met_Color Color Automatic CC Doors
Cylinders Gears
Quarterly_Ta
x
Weight
Mfr_Guarant
ee
BOVAG_Guar
antee
Guarantee_P
eriod
ABS Airbag_1 Airbag_2 Airco
Automatic_ai
rco
Boardcompu
ter
CD_Player
Central_Lock
Powered_Wi
ndows
Power_Steeri
ng
Radio Mistlamps Sport_Model
Backseat_Div
ider
Metallic_Rim
Radio_casset
te
Parking_Assi
stant
Tow_Bar
dfy dfx
종속변수(dfy)와 독립변수(dfx) 구분
39. Model 1
Age_08_04
0.781
Model 2
Age_08_04
KM
0.800
Model 3
KM
0.331
Model 4
0.848
Age_08_04
KM
Weight
Model 5
0.857
Age_08_04
KM
Weight
Mfg_Year
Model 6
0.858
Age_08_04
KM
Weight
Mfg_Year
Boardcompu
ter
Model 7
0.881
Age_08_04
KM
Weight
Mfg_Year
Boardcompu
ter
Automatic_ai
rco