2. Datayanolja 2017
2
3
0 발표자 소개
1 인터넷 폐쇄망에서 분석 시스템 구축 (feat. 엔지니어가 없을 때)
2 분석 보고서 자동화
Machine Learning 삽질기 (분석 & 개발)
3. Datayanolja 2017
3
,
0 발표자 소개
1 인터넷 폐쇄망에서 분석 시스템 구축 (feat. 엔지니어가 없을 때)
2 분석 보고서 자동화 하기
Machine Learning 삽질기 (분석 & 개발)
4. Datayanolja 2017
4삽질의 진화
(2012.9~2015.2) 인지과학
We use empirical methods and formal tools
to uncover the mechanisms of human learning
and inference.
3 M 3(( N RN I ( % M 3(( V FV M I F P( V F ( N ( )-1 0 -( V E S I
5. Datayanolja 2017
5삽질의 진화
(2015) MINDSCALE
: 데이터분석 온라인 교육 사이트 컨텐츠 제작
http://mindscale.kr/
(2015) R User Conference in Korea 2015
: R을 이용한 텍스트 감정분석
- 여론과 감성 발견하기
6. Datayanolja 2017
6삽질의 진화
3M 3((L NPN(NSI M 5 N 4 :7 1 21 :7
16 2-E :9 2/ 12 :7 7, 7. :9 2. 62
:7 17 11 :7 17 6-
M 3(( S NPN INF VL( NPN(8 LSN N E N S
3
M 3((R L SF V R(A DN SMS5 L I4SN E F
V S L? 4 ). ))11, 0 F L V ? 4-/ V B
V V4 V B V V4M ,6 L L
PV
3 g
3 f
7. Datayanolja 2017
7
,
0 발표자 소개
1 인터넷 폐쇄망에서 분석 시스템 구축 (feat. 엔지니어가 없을 때)
2 분석 보고서 자동화
Machine Learning 삽질기 (분석 & 개발)
11. Datayanolja 2017
11R과 Python을 하고 싶어요..
conda 이용
pip 이용
Python
• N M
• N I S FI x
• http://www.lfd.uci.edu/~gohlke/pythonlibs/
& NSI NSFV x
• SIF d B v
25. Datayanolja 2017
25
,
0 발표자 소개
1 인터넷 폐쇄망에서 분석 시스템 구축 (feat. 엔지니어가 없을 때)
2 분석 보고서 자동화
Machine Learning 삽질기 (연구 & 개발)
26. Datayanolja 2017
26Machine Learning 연구
VS
많은 기능이 지원되는 caret에
새로운 알고리즘 추가
별도 라이브러리 생성
장점:
- 타 알고리즘 비교 가능
- 병렬처리 등 다양한 기능 구현 쉬움
단점:
- 기능 구현 시간이 느려
- 라이센스 이슈 (GPL)
장점:
- Tech 덜 신경
- 특정 알고리즘에 맞는 아키텍쳐
단점:
- 알고리즘 일반화가 어려움
27. Datayanolja 2017
27Machine Learning 연구
데이터 이슈 및 고려점들
- 머신러닝에 적합한 데이터 형태(Input)
: 6개월내, 3개월내, 1개월내 à 거래별, 월별
& 그럼에도 불구하고 기존 방법론 대비 변별력 향상
& 머신러닝 시 경계할 점들
: 상관 높은 변수들이 많이 선택될 위험성
시간이 지남에 따라 변별력이 낮아짐 (과거와 미래의 패턴이 달라짐)
계산 시간을 어떻게 줄일 것인가(하드웨어 VS 소프트웨어)