계속해서 증가하는 기업 데이터, 어떻게 관리해야 할까요?
데이터 관리의 가장 기본은 정확한 DB설계와 구축이며, 이를 위해 스마트한 데이터모델링 작업과 툴이 필요합니다.
본 자료는 데브기어에서 진행한 온라인 세미나 '효과적인 데이터모델링을 위한 14가지 방법'의 발표 자료로, 해당 세미나는 다음 링크를 통해 다시 볼 수 있습니다: http://goo.gl/DlfO8I
계속해서 증가하는 기업 데이터, 어떻게 관리해야 할까요?
데이터 관리의 가장 기본은 정확한 DB설계와 구축이며, 이를 위해 스마트한 데이터모델링 작업과 툴이 필요합니다.
본 자료는 데브기어에서 진행한 온라인 세미나 '효과적인 데이터모델링을 위한 14가지 방법'의 발표 자료로, 해당 세미나는 다음 링크를 통해 다시 볼 수 있습니다: http://goo.gl/DlfO8I
10. 05
ML
VS
AML
•데이터 사전 처리
•적합한 변수 선택
•적절한 모델 선택
•모델 하이퍼 매개 변수 최적화
•기계 학습 모델 평가
•평가 결과 분석
Data Scientist, Machine Learning expert
•다양한 모델 자동 실행
•하이퍼 매개변수 자동 설정
11. 06
Get Data
Clean, Prepare &
Manipulate Data
Feature
Selection &Extraction
Train Model
Model
Validation
1
2
3
4
5
12. 07
2. 제어
▪ 데이터 전처리
▪ 변수 최적화
▪ 데이터 과학자 개입을 최소화
1. 정확성
▪ 오픈 소스를 이용(검증된)
▪ 여러 모델을 경쟁하여 최적의 모델 선택
▪ 모델을 반복적으로 학습
3. 설명
▪ 모델의 결과가 유효함
▪ 모델의 결과가 투명함
▪ 비즈니스에 대한 실용적인 통찰력을 가짐
4. 통합
▪ 만들어진 모델은 배포 가능해야 함
▪ 여러가지 환경에 모델이 실행되어야 함