H2O Driverless AI에 대한 소개와 IBM Power Systems 에서의 기능을 간략히 소개한 장표입니다.
In this presentation, IBM introduces H2O Driverless AI on IBM Power system to accelerate the speed of deep learning workflow .
2. "AI는 전세계에서 가장 빨리
성장하는 업무 부하”
CIOs planning to use
machine learning
300%
Increase in jobs requiring
AI skills
9/10
Increase in AI spend year
over year
“AI 전문인력에 대한
급증하는 구인난”
“대다수 기업들이 AI를
채택하기 위해 준비 중”
200%
AI가 IT Industry를 바꾸고 있습니다
3. CONFIDENTIAL
CONFIDENTIAL
Company Founded in Silicon Valley in 2012
Funded: $75M. Investors: Wells Fargo, NVIDIA, Nexus Ventures, Paxion
Ventures
Products • H2O Open Source Machine Learning (14,000 organizations)
• H2O Driverless AI – Automatic Machine Learning
Leadership Leader in Gartner MQ Machine Learning and Data Science Platform
Team 100+ AI expertise (7 of the world’s top 100 Kaggle Grandmasters/expert data
scientists)
Global Mountain View, London, Prague, India
H2O.ai 회사 개요
4. CONFIDENTIAL
CONFIDENTIAL
세계적으로 인정받는 H2O Community
Financial InsuranceMarketingHW
Vendors
Retail Advisory &
Accounting
Healthcare
“H2O.ai's reference customers gave it the highest overall score for sales relationship and
overall service and support” - Gartner MQ 2018CONFIDENTIAL
Trial Requests
3300+
3M+
Models Built
Open source community Commercial Customers Driverless AI Demand
4
5. • 비전의 완정성에서 최고 수준의
기술 리더
• 아이디어 공유와 파트너 네트웍,
기계학습 및 AI를 위한 사실상의
산업 표준 측면에서 인정받음
• 영업 관계 및 고객 관리, 고객
지원(운영 및 장애 지원 등)에서
고객들은 벤더 중 H2O.ai에 최고
평점을 부여
Get the
Gartner
Magic
Quadrant
here
2018 Gartner 데이터 사이언스 및 기계 학습 플랫폼 분야에서
리더로 분류된 H2O.ai
5
6. AI 전문 인력 부족
~100
Data science experts in the
world
Time for a data scientist to
build a model
Months
느린 개발 속도
Black box models
AI에 대한 신뢰 부족
”US alone faces a shortage of 190,000 people with analytical expertise.”
Data is a Team Sport
Enterprise AI 채택을 위한 도전
Confidential 6
7. 빠른 개발 속도
Months
to Hours
5 Kaggle Grandmasters
Top 10
Data Science Experts
Automated
GPU accelerated ML
설명가능하고 투명한 AI
In AI
기업들을 위한 AI를 제공하는 H2O Driverless AI
Trust
7
8. 21 day free trial for Driverless AI
H2O Driverless AI는 “Expert Data Scientist in a Box”를 제공
• 수상 경력에 빛나는 소프트웨어
• H2O.ai의 세계적 AI 전문가들에 의해
개발되고 지원되는 AI 소프트웨어
• 기업들이 단일 플랫폼에서 AI와
기계학습을 달성할 수 있도록 해주는
소프트웨어
• 전문 데이터 과학자의 역할을
수행하여 초보 및 전문가 팀 모두에게
가치를 부여
• 세밀함과 하일라이트로 강조된
insight와 함께, 이해하기 쉬운 결과 및
시각화를 통한 interpretability
9. H2O Driverless AI: 작업 절차
SQL
Local
Amazon S3
HDFS
X Y
Automatic
Scoring Pipeline
Machine learning
Interpretability
Deploy
Low-latency
Scoring to
Production
Modelling
Dataset
Model Recipes:
• i.i.d. data
• Time-series
• More on the way
Advanced
Feature
Engineering
Algorithm Model
Tuning
+ +
Survival of the Fittest
Automatic Machine Learning
Data shape, outliers,
missing values 등을 이해
Powered by GPU Acceleration
1
Data를
drag & drop 2
자동화된 시각화
Best practice model recipes와
CPU/GPU 연산능력을 이용하여,
진보된 feature engineering과
parameter tuning을 포함한
수천개의 가능성 있는 모델들에
걸쳐 반복 훈련
3
자동화된 기계 학습
Feature transformation과
models를 포함한, low-latency
Python 또는 Java로 구현된
Automatic Scoring
Pipelines를 deploy
4
자동화된 Scoring Pipelines
Data를 클라우드,
빅데이터, 데스크탑
등에서 ingest
Google BigQuery
Azure Blog Storage
Snowflake
Model
Documentation
Confidential 9
10. 21 day free trial for Driverless AI
자동화:
- Visualization
- Feature Engineering
- Model Tuning
- Time Series
배치 활용:
- Automatic Pipelines
- Low latency inferencing
신뢰:
- 설명 가능한 결과와 사유 부호(reason code)
- 자동 문서화
Enterprise Ready:
- 보안성 – LDAP, Kerberos
- 확장성 – Scale with GPUs
- 기업들의 source data를 지원
H2O Driverless AI는 “Expert Data Scientist in a Box”를 제공
11. 고도의 정확성, 사용의 편리함, 정말 빠른 훈련
• 단순한 인터페이스
• Feature engineering을
자동화하여 정확성 증대
• 넓은 범위의 use case를
풀기 위해 자동화된
recicpe들
• 적절한 model들의
집합을 찾고 조율하기
위한 자동화된 tuning
12. CONFIDENTIAL
CONFIDENTIAL
신뢰와 규제 준수를 위한 업계 선두의 Interpretability
• 규제 뿐만 아니라 디버깅을
위해 필요한 Interpretability
• 사유 부호(reason code)와
모델 interpretability를 영어
평문으로 취득
• 각 prediction에 대한 사유
부호 생성에 K-Lime, LOCO,
partial dependence 등의
기술을 지원
13. Low-latency Model들의 편리한 배치 활용
• 모든 feature 변환을 포함하여 IT가 배치하고
관리하기 편리한 stand-alone scoring pipeline
• 새로운 버전의 model이 생성되는 경우 편리한
update
• 복잡한 big data model에 대해 최적화된
scoring code
• 최말단 및 모바일 등 어떤 디바이스에서나 배치
가능한 간결한 scoring code
• 현대의 실시간 app을 만족시키기 위해
millisecond 단위의 반응 속도
14. High Speed Data Transfer
9.5x
H2O Driverless AI on IBM Power AI in a Box
Big Data Scale
2.6x
More RAM Max I/O bandwidth
30x
GPU Accelerated ML
Integrated Systems Approach
Faster on GPUs
15. High Speed Data Transfer
1.5x
Big Data Scale
2x
Data Ingest Feature Engineering
5x
GPU Accelerated ML
Integrated Systems Approach
Time Series
H2O Driverless AI on IBM Power AI in a Box
16. H2O Driverless AI는 IBM Power AI의 보완재
IBM Power AI는 이미지에
대한 Deep Learning을 제공
Sensor
Log
Transactional
H2O Driverless AI는 자동화된
Machine Learning을 제공
Image
17. CONFIDENTIAL
CONFIDENTIAL
H2O.ai at Capital One: 25 Use Cases
17
도매/상업 뱅킹
• Know Your Customers (KYC)
고객 전방위 평가를 위한 확률적 Matching Engine
• 자금 세탁 방지 (AML)
허위 거래 및 의심 활동 보고서(SAR’s) 신고 처리
• 문서 분류
향상된 기계 학습 기반 문서 분류로 수작업 감축
카드/지불 관련 업무
• 신청 사기 예측
사기적 신청 방지
• 거래 사기 예측
손실 감소 및 고객 만족 향상
• 실시간 타케팅
실제 구매율 향상
• 신용 리스크 평가
신용 포트폴리오 최적화
• 문맥 내 (in-context) 프로모션
고객 만족율 및 실제 구매율 향상
소비자 뱅킹
• 예금 사기 예측
고객의 펀드 가입 신속화, 고객 만족 향상
• 고객 이탈 예측
고객 유지율 향상
• 자동 대출 신용 리스크
신용 포트폴리오 최적화
• 소득 증명 예측
수작업 및 확인 작업 감소
• Direct-Mail 마케팅
마케팅 최적화
인프라스트럭춰
• 보안 Cyberlake
Windows Syslog / 도메인 생성 알고리즘
• Autonomic Computing
기간계 시스템의 운영 효율 향상
• Master Data 관리
확률적 Matching Engine 으로 단일 마스터 고객 기록
• Model 관리 & governance
모델 관리 및 문서화
• Tech College
교육 및 홍보
19. 금융 사기 탐지
“Driverless AI는 feature 및
모델 성능 측면에서 놀라운
결과를 만들어내고
있습니다.”
Venkatesh Ramanathan
Senior Data Scientist, PayPal
• Driverless AI는 10년
경력의 feature
engineering 전문가에
필적
• 사기 행위 탐지
정확도를 0.89에서
0.947로 6% 향상
• H2O4GPU with
Driverless AI 사용으로
6배 속도 향상
20. 부동산 시장에서의 마케팅 최적화
“Driverless AI는 우리의
Intelligent Marketing Cloud
로 고객에게 접근하는데 큰
도움을 주었습니다. AI를 하기
위한 AI는 우리 시스템을
날마다 향상시켜 주고
있습니다.”
Martin Stein
Chief Product Officer
• 다른 부동산 디지털
마케팅 솔루션보다 2.5배
뛰어난 효과
• 한 G5 고객사는 연간
디지털 마케팅 비용
$500K를 절감하면서도
웹 트래픽을 3배로 늘림
• 10배 빠른 모델 생성
21. 제조업 매출 및 forecast 향상
“H2O Driverless AI feature
engineering은 제가 본 것 중
최고입니다. 그리고 scoring
pipeline 생성은 제게는 아마
최고의 플러스입니다. 시간을
크게 줄여주었거든요.”
Robert Coop
Sr. Data Scientist
Stanley Black & Decker
• 1명의 data scientist로
25% 시간 절약
• 제조 생산 라인을 위한
모델 튜닝과 훈련에
1달의 시간 단축
• Forecast 정확성 향상을
통해 미래 고객 주문을
위한 필요 부품 및
원자재를 정확히 예측
22. 더 나은 healthcare를 위해
환자들과 전문가들을 연결
• 기계학습 추천에 의해
특정 환자에 알맞은
의사를 연결
• 회사들은 급증하는 순
프로모터 점수 및 거의
완벽에 가까운 고객
만족율을 경험
• 고객 충성도와 프리미엄
고객 유지율이 모두 증가
• 비용 감소와 동시에
환자의 치료 대기 시간이
감소
“Driverless AI는 우리 data
science team에게 효율적
운영과 대규모 실험을
가능하게 해주었습니다.
이런 새로운 혁신을 통해
전반적 환자 진료에 큰
개선을 이루었습니다.”
Bharath Sudarshan
Director of Data Science and Innovation
Armada Health
22
23. H2O Driverless AI는 모든 산업에 가치를 제공
10년 경력의 machine
learning 전문가에 필적
Near perfect
scores
2.5X
Performance
다른 디지털 마케팅을 압도고객 만족 향상
“Driverless AI is giving amazing results
in terms of feature and model
performance “
Venkatesh Ramanathan
Senior Data Scientist, PayPal
Financial Services
“Driverless AI powers our data science
team to operate at scale. We have the
opportunity to impact care at large.”
Healthcare Marketing
+6%
Accuracy
Martin Stein
Chief Product Officer, G5
“Driverless AI helped us gain an edge
for our clients. AI to do AI, truly is
improving our system on a daily basis.”
Bharath Sudarshan
Director of Data Science, Armada Health
24. CONFIDENTIAL
시작 하십시요
Watch “Democratizing Intelligence” by Sri Ambati, CEO &Founder
Learn how Driverless AI delivers Trust & Explainable AI
Watch this Driverless AI webinar to get started
Attend this training for more technical training
Learn how PayPal is solving fraud with Driverless
Get the 21 day free trial for Driverless AI