More Related Content Similar to Big Data Service Overview 2020年7月版 (20) More from オラクルエンジニア通信 (20) Big Data Service Overview 2020年7月版2. The following is intended to outline our general product direction. It is intended for information purposes
only, and may not be incorporated into any contract. It is not a commitment to deliver any material, code,
or functionality, and should not be relied upon in making purchasing decisions. The development,
release, timing, and pricing of any features or functionality described for Oracle’s products may change
and remains at the sole discretion of Oracle Corporation.
Statements in this presentation relating to Oracle’s future plans, expectations, beliefs, intentions and
prospects are “forward-looking statements” and are subject to material risks and uncertainties. A detailed
discussion of these factors and other risks that affect our business is contained in Oracle’s Securities
and Exchange Commission (SEC) filings, including our most recent reports on Form 10-K and Form 10-
Q under the heading “Risk Factors.” These filings are available on the SEC’s website or on Oracle’s
website at http://www.oracle.com/investor. All information in this presentation is current as of September
2019 and Oracle undertakes no duty to update any statement in light of new information or future events.
Safe harbor statement
The following is intended to outline our general product direction. It is intended for information purposes
only, and may not be incorporated into any contract. It is not a commitment to deliver any material, code,
or functionality, and should not be relied upon in making purchasing decisions. The development,
release, timing, and pricing of any features or functionality described for Oracle’s products may change
and remains at the sole discretion of Oracle Corporation.
Statements in this presentation relating to Oracle’s future plans, expectations, beliefs, intentions and
prospects are “forward-looking statements” and are subject to material risks and uncertainties. A detailed
discussion of these factors and other risks that affect our business is contained in Oracle’s Securities
and Exchange Commission (SEC) filings, including our most recent reports on Form 10-K and Form 10-
Q under the heading “Risk Factors.” These filings are available on the SEC’s website or on Oracle’s
website at http://www.oracle.com/investor. All information in this presentation is current as of September
2019 and Oracle undertakes no duty to update any statement in light of new information or future events.
Safe harbor statement
Copyright © 2020, Oracle and/or its affiliates2
3. Copyright © 2020, Oracle and/or its affiliates3
Oracle Gen 2 Cloud 3つの差別化要素
テクノロジと価格
データ・
プラットフォーム
クラウド・
セキュリティ
Oracle Cloud Infrastructure
Gen 2 Cloud
4. 2020年2月12日(米国時間)/ 2月19日(日本)のプレスリリース
Oracle Cloud Data Science Platform
‒ Oracle Cloud Infrastructure Data Science
‒ Oracle Autonomous Databaseの新しい強力な
機械学習機能(coming soon)
‒ Oracle Cloud Infrastructure Data Catalog
‒ Oracle Big Data Service (coming soon)
‒ Oracle Cloud SQL (coming soon)
‒ Oracle Cloud Infrastructure Data Flow
‒ Oracle Cloud InfrastructureVirtual Machines for
Data Science
企業のデジタル・トランスフォーメーションを
支えるための、各種新サービスについてアナウンス
https://www.oracle.com/jp/corporate/pressrelease/jp20200219.html
4 Copyright © 2020, Oracle and/or its affiliates
5. Oracle Cloud Data Science Platform
Analytics Cloud
Data
Science
Machine Learning Graph Cloud SQL
Data Catalog
Streaming
Database
Migration
Data
Integration
Big Data
Service
Data Flow
Autonomous Database
Exadata
Database
MySQL
Block Storage. File Storage. Object Storage
プロセスと管理
データストア
メタデータ管理
アナリティクス
Autonomous & Converged をさらに拡大し、多様化するデータへのアクセスと
適切なツールの効率的な活用を実現することで、生産性向上とデータからの知見創出をサポート
(*)
(*)
(*) リリース予定2月12発表5 Copyright © 2020, Oracle and/or its affiliates
6. Oracle Cloud Data Science Platform
Analytics Cloud
Data
Science
Machine Learning Graph
Streaming
Database
Migration
Data
Integration
Data Flow
Autonomous Database
Exadata
Database
MySQL
Block Storage. File Storage. Object Storage
プロセスと管理
データストア
メタデータ管理
アナリティクス
(*)
(*)
(*)
(*)
(*) リリース予定2月12発表
Data Catalog
Autonomous & Converged をさらに拡大し、多様化するデータへのアクセスと
適切なツールの効率的な活用を実現することで、生産性向上とデータからの知見創出をサポート
Cloud SQL
Big Data
Service
Copyright © 2020, Oracle and/or its affiliates6
7. 7 Copyright © 2020, Oracle and/or its affiliates
Oracle Big Data Service and Cloud SQL
包括的なData Lake Platform を、
Oracle Gen 2 Cloud 環境で実現
セキュアかつ信頼性のある、エラスティッ
クなHadoopクラスタ環境を数分で提供
オンプレミスの Big Data 環境を Oracle Cloud
へ拡張し、ハイブリッドな構成を実現可能
Oracle Cloud Platformとネイティブに統合さ
れたサービスにより、幅広い組み合わせで
ソリューション構成が可能
v
Infrastructure
Data Management
Database – Data Lake -Access – Integration - Preparation
CPU – GPU – Storage - Network
8. Oracle Big Data Service
実績あるClouderaディストリビューションとOracle Big Data テクノロジーが融合
Copyright © 2020, Oracle and/or its affiliates8
最適化されたCloudera Enterpriseの実行環境
をクラウドサービスとして提供
Big Data Service 実行環境に Oracle Big Data
SQL をベースとした、Cloud SQL を追加する
ことが可能
Oracle Machine Learning (ORAAH)やOracle Big
Data Spatial and GraphといったOracle Big
Data テクノロジーを使用することが可能
9. 9 Copyright © 2020, Oracle and/or its affiliates
Oracle SQL で 様々なBig Data Sourceにアクセス
Oracle Cloud SQL
Oracleベースのアプリケーションを変更す
ることなく複数のデータストアにアクセス
Smart Scan や Storage Index、Predicate
Pushdownなどにより処理の最適化と高速化
を実現
HDFS、Hive、オブジェクトストア、Kafka、
NoSQLをサポート
既存のHiveメタデータとセキュリティを使
用してシンプルに管理
※Big Data Service とは別に追加費用が必要です。
11. 11 Copyright © 2020, Oracle and/or its affiliates
わずか数分でセキュアなHAクラスタ環境を簡単に構築可能
Big Data Service 環境を迅速に提供
クラスタ環境構築に必要な、最小限の設定
を入力
ワンクリックで、高度なセキュリティと高
可用性Hadoopサービスを備えたクラスタ環
境を生成
Clouderaバージョンの選択が可能
‒ 既存オンプレミス環境との互換性を保つた
めに一致したバージョンを選択可能
‒ 最新バージョンを選択して、最新機能を活
用することも可能
コンソールから必要項目を入力するだけでクラスタを生成
12. 12 Copyright © 2020, Oracle and/or its affiliates
Big Data 環境のワークロード・ポータビリティが実現可能
オンプレミスとクラウドでのハイブリッド環境を実現
データベースとClouderaディストリビュー
ションのバージョンが同一の環境をクラウ
ドに実現
処理内容やアプリケーション要件、セキュ
リティ要件などに合わせて、適切な環境で
のワークロードを実行し、全体最適を実現
両環境の併用により、ハイブリッドでの Big
Data / Data Lake 環境を実現
On-premises
ソフトウェア・ライセンス
Customer Managed
Oracle Cloud
ユニバーサルクレジット
Oracle Managed
13. 13 Copyright © 2020, Oracle and/or its affiliates
Oracle Cloud の各サービスやClouderaアプリケーションとの連携が可能
各種クラウド・サービスとの連携によるソリューション構成を実現
Oracle Cloud Data Science Platformの実現
‒ 様々なレベルのデータユーザーからの要
件に対応可能な基盤を実現
各Oracle Cloud サービスと連携が可能
‒ OCI Data Science
‒ Analytics Cloud
‒ Autonomous Database
Cloudera Certified applicationの活用が可能
14. 14 Copyright © 2020, Oracle and/or its affiliates
ユースケースに合わせて適切なシェイプを選択可能
Oracle Gen2 Cloud の特徴を最大限活用した基盤を実現
Flexibility
Performance
VM Standard
1-24 OCPUs,
15-320 GB RAM
Up to 1 PB Block
Bare Metal
Standard
52 OCPUs,
768 GB RAM
Up to 1 PB
Block
VM
Dense IO
8-24 OCPUs,
120-320 GB RAM,
6.4-25.6TB NVMe
Bare Metal HPC
Dense IO
36 OCPUs (3.7 GHz),
384 GB RAM
6.7TB NVMe
Bare Metal
Dense IO
52 OCPUs,
768 GB RAM,
51.2 TB NVMe
Development Test Data Science Data Lakes
15. 15
DWHからData Lake まで、包括的にカバーするデータ・プラットフォーム
(参考) ソリューション・パターン例
Data Sources
Enterprise Applications
Devices End Users
Events Sensors
Social
Voice
Any Digital Asset
Data Consumers
People
Applications
OCI Object
Storage
Big Data Service
with Cloud SQL
Analytics Cloud
Autonomous Data
Warehouse
Data Integration
(specific product
determined by data
source)
1 2
3
4
6
5
8
7
9
10
Data Catalog
13
15
14
Copyright © 2020, Oracle and/or its affiliates. All rights reserved.
16. 16 Copyright © 2020, Oracle and/or its affiliates
※2020年7月22日現在
Big Data Service & Cloud SQL 価格表(日本円)
Pay as
You Go
Anual
Flex
Metric Metric Minimum
Oracle Big Data Service - Compute - Standard 16.128 16.128 OCPU Per Hour 4 OCPUs per node
Oracle Big Data Service - Compute - Dense I/O 25.68 25.68 OCPU Per Hour 4 OCPUs per node
Oracle Big Data Service - Compute - HPC 18.432 18.432 OCPU Per Hour -
Oracle Cloud SQL - Compute Capacity 12.90 12.90 OCPU Per Hour -
【補足】
• 金額は1$=120円換算の日本円表記です。
• Compute - Standard の場合、別途Block Storage が必要です。
• Compute - Dense I/O および Compute - HPC の場合、上記価格にストレージの金額も含まれます。
• 推奨される最小クラスタ構成は、Master/Utilityノードが4、Workerノードが4 です。
• ノード数の構成については、Cloudera Best Practice を御参考下さい。
https://docs.cloudera.com/documentation/enterprise/6/6.3/topics/cm_ig_host_allocations.html
17. 17 Copyright © 2020, Oracle and/or its affiliates
(参考) 推奨される最小構成例と価格イメージ
• Master/Utilityノード(Block Volume 1TB) × 4ノード
• Workerノード(Block Volume 8TB) × 4ノード
• Cloud SQLノード(Block Volume 2TB)×1
ノード
種別
ノード
数
サービス名 メトリック
Annual Flex
単価[]
必要
数量
Annual Flex
月額[](744時間)
Annual Flex
年額[](12ヶ月)
Master/
Utility
Node
4
Oracle Big Data Service - Compute - Standard OCPU Per Hour 16.128 4 191,988 2,303,853
Oracle Cloud Infrastructure - Block Volume GB Per Month(*) 5.1 1000 20,400 244,800
Worker
Node
4
Oracle Big Data Service - Compute - Standard OCPU Per Hour 16.128 4 191,988 2,303,853
Oracle Cloud Infrastructure - Block Volume GB Per Month(*) 5.1 8000 163,200 1,958,400
Cloud
SQL
1
Oracle Cloud SQL - Compute Capacity OCPU Per Hour 12.90 4 38,390 460,685
Oracle Cloud Infrastructure - Block Volume GB Per Month(*) 5.1 2000 10,200 122,400
合計 616,166 7,393,990
• 主に開発/簡易テスト用途を想定
• シェイプはすべて VM.Standard2.4 を使用
• CPU数のサイジング根拠は配慮しない
■ 前提条件 ■ 推奨構成
※2020年7月22日現在の価格情報をもとにしています。
18. 18 Copyright © 2020, Oracle and/or its affiliates
こんな課題に役立ちます
• 既存のCloudera 環境を、クラウド環境に拡張して
ハイブリッド構成を実現したい。
• Oracle Cloud 環境の様々なデータソースに、透過的
なSQLで簡単にアクセスしたい。
• 各種サービスと組み合わせることで、Data Science
Platform を実現したい。
サービス価格(PAYG)
• Oracle Big Data Service - Compute - Standard:
¥16.128 [OCPU Per Hour]
• Oracle Big Data Service - Compute - Dense I/O:
¥25.68[OCPU Per Hour]
• Oracle Big Data Service - Compute - HPC:
¥18.432 [OCPU Per Hour]
• Oracle Cloud SQL - Compute Capacity:
¥12.90 [OCPU Per Hour]
サービス概要/特徴
• Oracle Big Data Service は、Clouderaベースの
Hadoopサービスです。
• Oracle Cloud SQL を追加することで様々なデータ
ソースへの透過的なSQLアクセスを提供します。
• 様々なOracle Cloud サービスと組み合わせることで、
包括的なData Lake Platform を、Oracle Gen 2
Cloud 環境で実現することが可能となります。
Oracle Big Data Service and Cloud SQL
ClouderaベースのHadoopサービスと透過的なSQLアクセスを提供
※2020年7月22日現在
Editor's Notes データ活用の多様化した
例えば非構造がでてきて
例えばリアルタイム性がもとめられてきて
例えば大量データにより、HDFSやObject Storageにデータを置き始めて
オープンソースを活用していく
それぞれを使いやすくしていく
今日、企業におけるデータ・サイエンス・チームは、適切なデータと有効な機械学習モデルを構築・導入するためのツールに容易にアクセスできないため、データが持つ膨大な可能性の一部しか活用できていません。結果として、モデルの開発に時間がかかりすぎ、企業要件に求められる精度と頑健性が常に満たされるとは限らず、運用段階に進めないことも頻繁にあります。
オラクルのData & AIサービス製品開発担当バイスプレジデントであるグレッグ・パブリック(Greg Pavlik)は、次のように述べています。「成功するデータ・サイエンス・プロジェクトの基本は効果的な機械学習モデルですが、企業で扱われるデータのボリュームと多様性が原因で、イニシアティブが開始前に失速する可能性があります。『Oracle Cloud Infrastructure Data Science』を利用することで、ワークフロー全体を自動化し、コラボレーションのための強力なチーム・サポートを追加して、個々のデータ・サイエンティストの生産性を向上させることができます。これは、データ・サイエンス・プロジェクトから実際の価値を確実にビジネスにもたらす上で役立ちます」
Wes Prichard from product marketing is working with the product groups and field and will soon be publishing design patterns to sales central. Here's an example ... and it's all about having each of the pieces working together seamlessly ... and minimize the time and effort for Data Consumers to gain insights from their sources
The objective is to manage data in both ADW and BDS. Analytics Cloud provides visualization of data.
Data Integration capabilities ingest data from intended sources. The type of data integration used depends on if the data is batch, streaming, or synchronized database records and whether the data is on-premises or in the cloud.
Data can be delivered to object storage for shared access by cloud services and for processing prior to storage in ADW or BDS.
Data can also be delivered to ADW directly and then transformed using ELT capabilities and/or records from other databases can be ingested directly.
Data can also be delivered to BDS directly as-is. BDS contains Oracle Data Integrator that can act as the data integration component to ingest data to BDS.
ADW includes the ability to both query data from object storage or ingest data from object storage.
BDS can ingest data from object storage or query data in object storage. Oracle Data Integrator that can act as the data integration component to ingest data to BDS.
Data can be transferred from BDS to ADW using the Big Data Connectors. (In the future, Cloud SQL in ADW will enable ADW to query data in BDS that is listed in the Hive metadata repository.)
OAC can access data in ADW for any of the visualization and business analytics capabilities that OAC provides. (Is there any push down processing to ADW for data transformation?)
The integration between OAC and BDS will not be fully defined until after BDS is released. The minimum scope will be connectivity to Hive. PM is also considering direct access to Cloud SQL on BDS.
Business Analysts use OAC to consume data from both ADW and BDS
removed
removed
Data Catalog is used to harvest metadata from ADW data sources. Users interact with Data Catalog to use and manage the catalog. (Connecting line to users not shown.)
(Data Catalog does not yet support BDS as a data source)
Data Catalog is used to harvest metadata from object storage data sources. Users interact with Data Catalog to use and manage the catalog. (Connecting line to users not shown.)