クラウド事業戦略統括 ビジネス推進本部
Senior Business Development Manager
谷川 信朗
日本オラクル株式会社
2021年2月版
Oracle Cloud Infrastructure Data Catalog
The following is intended to outline our general product direction. It is intended for information purposes
only, and may not be incorporated into any contract. It is not a commitment to deliver any material, code,
or functionality, and should not be relied upon in making purchasing decisions. The development,
release, timing, and pricing of any features or functionality described for Oracle’s products may change
and remains at the sole discretion of Oracle Corporation.
Statements in this presentation relating to Oracle’s future plans, expectations, beliefs, intentions and
prospects are “forward-looking statements” and are subject to material risks and uncertainties. A detailed
discussion of these factors and other risks that affect our business is contained in Oracle’s Securities
and Exchange Commission (SEC) filings, including our most recent reports on Form 10-K and Form 10-
Q under the heading “Risk Factors.” These filings are available on the SEC’s website or on Oracle’s
website at http://www.oracle.com/investor. All information in this presentation is current as of September
2019 and Oracle undertakes no duty to update any statement in light of new information or future events.
Safe harbor statement
The following is intended to outline our general product direction. It is intended for information purposes
only, and may not be incorporated into any contract. It is not a commitment to deliver any material, code,
or functionality, and should not be relied upon in making purchasing decisions. The development,
release, timing, and pricing of any features or functionality described for Oracle’s products may change
and remains at the sole discretion of Oracle Corporation.
Statements in this presentation relating to Oracle’s future plans, expectations, beliefs, intentions and
prospects are “forward-looking statements” and are subject to material risks and uncertainties. A detailed
discussion of these factors and other risks that affect our business is contained in Oracle’s Securities
and Exchange Commission (SEC) filings, including our most recent reports on Form 10-K and Form 10-
Q under the heading “Risk Factors.” These filings are available on the SEC’s website or on Oracle’s
website at http://www.oracle.com/investor. All information in this presentation is current as of September
2019 and Oracle undertakes no duty to update any statement in light of new information or future events.
Safe harbor statement
Copyright © 2021, Oracle and/or its affiliates
2
3 Copyright © 2021, Oracle and/or its affiliates
各種サービスを組み合わせることで、クラウド上に Data Lake を含むデータ基盤を実現
Oracleが提供する 包括的な Cloud Data Platform ソリューション
データベース
ファイル等
センサー
ソーシャル
モバイル
業務部門
IT
開発者
データ
サイエンティ
スト
Object
Storage
OCI Data Flow
GoldenGate
on Marketplace
Streaming
Stream Analytics
for OCI
Analytics Cloud
Fast
Connect
Data Providers
(対象データ)
Data Consumers
(データ利用者)
*1) 2021年2月現在、Big Data Serviceに含まれたサービスとして提供中で、単体サービスとしての提供は今後の予定
Big Data Service
ADW/ATP/ExaCS
OCI
Data Integration
OCI Data Science
Cloud SQL(*1)
OCI Data Catalog
Ingest, Integration,
Data Refinery
(収集)
Data Persistence, Data Lake
(蓄積/管理)
Serving
(提供)
Visualize, Analytics, Data Science
(可視化/分析/データサイエンス)
4 Copyright © 2021, Oracle and/or its affiliates
各種サービスを組み合わせることで、クラウド上に Data Lake を含むデータ基盤を実現
Oracleが提供する 包括的な Cloud Data Platform ソリューション
データベース
ファイル等
センサー
ソーシャル
モバイル
業務部門
IT
開発者
データ
サイエンティ
スト
Object
Storage
OCI Data Flow
GoldenGate
on Marketplace
Streaming
Stream Analytics
for OCI
Analytics Cloud
Data Providers
(対象データ)
Data Consumers
(データ利用者)
*1) 2021年2月現在、Big Data Serviceに含まれたサービスとして提供中で、単体サービスとしての提供は今後の予定
Big Data Service
ADW/ATP/ExaCS
OCI
Data Integration
OCI Data Science
Cloud SQL(*1)
Ingest, Integration,
Data Refinery
(収集)
Data Persistence, Data Lake
(蓄積/管理)
Serving
(提供)
Visualize, Analytics, Data Science
(可視化/分析/データサイエンス)
Fast
Connect
OCI Data Catalog
5 Copyright © 2021, Oracle and/or its affiliates
なぜOracle Cloud において Data Catalog が必要とされるか
Data Analysts Data Scientists Data Engineers
Developers
Data Stewards
分析に適したデータが
見つからない
• データ資産の全体像の欠如
• 部門固有知識への依存
• データの情報が簡単に入手
できない
データレイクのデータを
理解するのは難しい
• データ辞書が存在しない
• 手動でのスキーマ定義
• データモデルをそもそも
共有できていない
データガバナンスを
改善する必要がある
• データの所有権が不明瞭
• 一般的なビジネス概念の欠如
• 機密データの拡散
Oracle Cloud Infrastructure Data Catalog
v
Infrastructure
Data Management
Database – Data Lake -Access – Integration - Preparation
CPU – GPU – Storage - Network
信頼できるデータ資産に対するセルフ
サービス・データディスカバリーおよび
ガバナンスをサポート
 Oracle Cloud上のデータ資産を発見、検索、
整理、強化、およびトレースするためのイ
ンベントリサービスを提供
 Business Glossary 機能が組み込まれており、
正しく信頼できるデータ資産を有効に活用
することが可能
Harvest
Browse
Enrich
Search
Collaborate
Data
Engineer
Data
Steward
Chief Data
Officer
Data
Scientist
Business
Analyst
Copyright © 2021, Oracle and/or its affiliates
6
Self-service Data Discovery and Governance Solution for Oracle Ecosystem
Oracle Cloud Infrastructure Data CatalogVision
検索と探索
メタデータの
キュレーション
データ
インテリジェンス エンタープライズ
• ビジネス用語集(企業内
辞書)と承認ワークフ
ロー
• タグ付け、ユーザーの注
釈、ソーシャルコラボ
レーション、評価/コメ
ント、関連付け、リンク
• オンプレミスおよびクラ
ウドシステムからのメタ
データ収集
• セマンティック検索、
データプロファイリング、
リネージ、影響分析、
データ関連性検索
• AI / MLベースのレコメン
デーション
• 自動タグ付け、自動検出、
自動分類、自動関連付け、
データ類似性評価
• OCI Native、REST API
• OCI Object Store、ADW
などのHive Metastore
• 他のOCIサービスとの付
加価値統合
※これらの機能を段階的に実装し、随時サービス拡張していきます。
Copyright © 2021, Oracle and/or its affiliates
7
8 Copyright © 2021, Oracle and/or its affiliates
OCI Data Catalog が現在カバーしている主なユースケース
Data Discovery and Business
Glossary
Oracle Cloud and on-prem sources
1. 分析のために、Object Storage Data Lake,
Autonomous Data Warehouse, Oracle and
non-Oracle databases全体のデータを迅速
に探索
2. ビジネス用語集と関連する技術的なメタ
データを管理し、データガバナンスを改善
現在提供されている
主な機能
Copyright © 2021, Oracle and/or its affiliates
9
データプロフェッショナルに提供される共通のUI
主な機能:Single Collaborative Environment
• 便利なショートカットと運用統計が記載
されたホームページ
• メタデータの検索と閲覧
• データ資産、用語集、ジョブ、スケ
ジュールを管理するためのクイックアク
ション
• 人気のタグ、最近更新されたオブジェク
トの可視化
Copyright © 2021, Oracle and/or its affiliates
10
対象となるデータソースのメタデータ収集
主な機能:Metadata Harvesting
Copyright © 2021, Oracle and/or its affiliates
11
2021年2月時点
サポートされるデータソース
データソースタイプ バージョン
Oracle Database 12.1 / 12.2 / 18 / 19 / 20 / 21
Oracle Database on Oracle Cloud Infrastructure 12.1 / 12.2 / 18 / 19
Exadata DB Systems 12.1 / 12.2 / 18 / 19
Oracle Object Storage[*] Latest
Autonomous DataWarehouse 18c/19c
AutonomousTransaction Processing 18c/19c
MySQL 5.7.x and 8.0.x
PostgreSQL 10.1 / 9.6, 9.5, 9.4, 9.3, 9.2, 9.1, and 9.0 / 8.4, 8.3, and 8.2
Hive CDH 5.4 and higher / Apache 1.0, 2.0, 3.0 and higher
Microsoft SQL Server 2019 / 2017 / 2016 SP2 / 2014 SP3 / 2012 SP4
IBM DB2 10.5.0.11 / 11.5.5.0
Apache Kafka 2.12-2.3.0
Microsoft Azure SQL Database 12.00.2000
Copyright © 2021, Oracle and/or its affiliates
12
[*] CSV(,/¥t/|/;), XML, Avro, Excel, Apache Parquet, Apache ORC, JSON(Simple)
ビジネス用語集とメタデータの強化
主な機能:Business Glossary and Metadata Enrichment
• Harvest(収集)したメタデータをビジ
ネス用語集として管理
• ビジネス用語とカテゴリを定義
• ユーザー注釈用の自由形式のタグ
追加
• ビジネス用語とタグへのアセット
リンク
Copyright © 2021, Oracle and/or its affiliates
13
収集・管理されているメタデータの情報を検索
主な機能: Search and Exploration
• 技術名、用語、タグに基づいて
データを検索
• さまざまなオブジェクトの詳細
を表示する
• データ資産に基づいてカタログ
を参照する
Copyright © 2021, Oracle and/or its affiliates
14
15 Copyright © 2021, Oracle and/or its affiliates
こんな課題に役立ちます
• Oracle Cloud 上のObject Storage
(CSV,Excel,ORC,Avro,Parquet,JSON)、
Database、ATP/ADW、MySQL、Hive、
Kafkaに存在するメタデータを統合管理したい
• アナリスト、データサイエンティスト、デー
タスチュワードなどのデータプロフェッショ
ナルの分析プロジェクトやデータサイエンス
プロジェクトに、単一ビューでのデータディ
スカバリーを提供したい
サービス価格(PAYG)
• 無償(OCIリソースに対する課金も不要)
サービス概要/特徴
• OCI Data Catalog は、Oracle Cloud上のデータ資産
を発見、検索、整理、強化、およびトレースするた
めのインベントリサービスを提供します。
• OCI Data Catalog には、Business Glossary 機能が
組み込まれており、正しく信頼できるデータ資産を
有効に活用することが可能です。
Oracle Cloud Infrastructure - Data Catalog
Oracle Cloud Ecosystem におけるデータ資産の統合管理
[旧版]OCI Data Catalog Overview 2021年2月版

[旧版]OCI Data Catalog Overview 2021年2月版

  • 1.
    クラウド事業戦略統括 ビジネス推進本部 Senior BusinessDevelopment Manager 谷川 信朗 日本オラクル株式会社 2021年2月版 Oracle Cloud Infrastructure Data Catalog
  • 2.
    The following isintended to outline our general product direction. It is intended for information purposes only, and may not be incorporated into any contract. It is not a commitment to deliver any material, code, or functionality, and should not be relied upon in making purchasing decisions. The development, release, timing, and pricing of any features or functionality described for Oracle’s products may change and remains at the sole discretion of Oracle Corporation. Statements in this presentation relating to Oracle’s future plans, expectations, beliefs, intentions and prospects are “forward-looking statements” and are subject to material risks and uncertainties. A detailed discussion of these factors and other risks that affect our business is contained in Oracle’s Securities and Exchange Commission (SEC) filings, including our most recent reports on Form 10-K and Form 10- Q under the heading “Risk Factors.” These filings are available on the SEC’s website or on Oracle’s website at http://www.oracle.com/investor. All information in this presentation is current as of September 2019 and Oracle undertakes no duty to update any statement in light of new information or future events. Safe harbor statement The following is intended to outline our general product direction. It is intended for information purposes only, and may not be incorporated into any contract. It is not a commitment to deliver any material, code, or functionality, and should not be relied upon in making purchasing decisions. The development, release, timing, and pricing of any features or functionality described for Oracle’s products may change and remains at the sole discretion of Oracle Corporation. Statements in this presentation relating to Oracle’s future plans, expectations, beliefs, intentions and prospects are “forward-looking statements” and are subject to material risks and uncertainties. A detailed discussion of these factors and other risks that affect our business is contained in Oracle’s Securities and Exchange Commission (SEC) filings, including our most recent reports on Form 10-K and Form 10- Q under the heading “Risk Factors.” These filings are available on the SEC’s website or on Oracle’s website at http://www.oracle.com/investor. All information in this presentation is current as of September 2019 and Oracle undertakes no duty to update any statement in light of new information or future events. Safe harbor statement Copyright © 2021, Oracle and/or its affiliates 2
  • 3.
    3 Copyright ©2021, Oracle and/or its affiliates 各種サービスを組み合わせることで、クラウド上に Data Lake を含むデータ基盤を実現 Oracleが提供する 包括的な Cloud Data Platform ソリューション データベース ファイル等 センサー ソーシャル モバイル 業務部門 IT 開発者 データ サイエンティ スト Object Storage OCI Data Flow GoldenGate on Marketplace Streaming Stream Analytics for OCI Analytics Cloud Fast Connect Data Providers (対象データ) Data Consumers (データ利用者) *1) 2021年2月現在、Big Data Serviceに含まれたサービスとして提供中で、単体サービスとしての提供は今後の予定 Big Data Service ADW/ATP/ExaCS OCI Data Integration OCI Data Science Cloud SQL(*1) OCI Data Catalog Ingest, Integration, Data Refinery (収集) Data Persistence, Data Lake (蓄積/管理) Serving (提供) Visualize, Analytics, Data Science (可視化/分析/データサイエンス)
  • 4.
    4 Copyright ©2021, Oracle and/or its affiliates 各種サービスを組み合わせることで、クラウド上に Data Lake を含むデータ基盤を実現 Oracleが提供する 包括的な Cloud Data Platform ソリューション データベース ファイル等 センサー ソーシャル モバイル 業務部門 IT 開発者 データ サイエンティ スト Object Storage OCI Data Flow GoldenGate on Marketplace Streaming Stream Analytics for OCI Analytics Cloud Data Providers (対象データ) Data Consumers (データ利用者) *1) 2021年2月現在、Big Data Serviceに含まれたサービスとして提供中で、単体サービスとしての提供は今後の予定 Big Data Service ADW/ATP/ExaCS OCI Data Integration OCI Data Science Cloud SQL(*1) Ingest, Integration, Data Refinery (収集) Data Persistence, Data Lake (蓄積/管理) Serving (提供) Visualize, Analytics, Data Science (可視化/分析/データサイエンス) Fast Connect OCI Data Catalog
  • 5.
    5 Copyright ©2021, Oracle and/or its affiliates なぜOracle Cloud において Data Catalog が必要とされるか Data Analysts Data Scientists Data Engineers Developers Data Stewards 分析に適したデータが 見つからない • データ資産の全体像の欠如 • 部門固有知識への依存 • データの情報が簡単に入手 できない データレイクのデータを 理解するのは難しい • データ辞書が存在しない • 手動でのスキーマ定義 • データモデルをそもそも 共有できていない データガバナンスを 改善する必要がある • データの所有権が不明瞭 • 一般的なビジネス概念の欠如 • 機密データの拡散
  • 6.
    Oracle Cloud InfrastructureData Catalog v Infrastructure Data Management Database – Data Lake -Access – Integration - Preparation CPU – GPU – Storage - Network 信頼できるデータ資産に対するセルフ サービス・データディスカバリーおよび ガバナンスをサポート  Oracle Cloud上のデータ資産を発見、検索、 整理、強化、およびトレースするためのイ ンベントリサービスを提供  Business Glossary 機能が組み込まれており、 正しく信頼できるデータ資産を有効に活用 することが可能 Harvest Browse Enrich Search Collaborate Data Engineer Data Steward Chief Data Officer Data Scientist Business Analyst Copyright © 2021, Oracle and/or its affiliates 6
  • 7.
    Self-service Data Discoveryand Governance Solution for Oracle Ecosystem Oracle Cloud Infrastructure Data CatalogVision 検索と探索 メタデータの キュレーション データ インテリジェンス エンタープライズ • ビジネス用語集(企業内 辞書)と承認ワークフ ロー • タグ付け、ユーザーの注 釈、ソーシャルコラボ レーション、評価/コメ ント、関連付け、リンク • オンプレミスおよびクラ ウドシステムからのメタ データ収集 • セマンティック検索、 データプロファイリング、 リネージ、影響分析、 データ関連性検索 • AI / MLベースのレコメン デーション • 自動タグ付け、自動検出、 自動分類、自動関連付け、 データ類似性評価 • OCI Native、REST API • OCI Object Store、ADW などのHive Metastore • 他のOCIサービスとの付 加価値統合 ※これらの機能を段階的に実装し、随時サービス拡張していきます。 Copyright © 2021, Oracle and/or its affiliates 7
  • 8.
    8 Copyright ©2021, Oracle and/or its affiliates OCI Data Catalog が現在カバーしている主なユースケース Data Discovery and Business Glossary Oracle Cloud and on-prem sources 1. 分析のために、Object Storage Data Lake, Autonomous Data Warehouse, Oracle and non-Oracle databases全体のデータを迅速 に探索 2. ビジネス用語集と関連する技術的なメタ データを管理し、データガバナンスを改善
  • 9.
  • 10.
    データプロフェッショナルに提供される共通のUI 主な機能:Single Collaborative Environment •便利なショートカットと運用統計が記載 されたホームページ • メタデータの検索と閲覧 • データ資産、用語集、ジョブ、スケ ジュールを管理するためのクイックアク ション • 人気のタグ、最近更新されたオブジェク トの可視化 Copyright © 2021, Oracle and/or its affiliates 10
  • 11.
  • 12.
    2021年2月時点 サポートされるデータソース データソースタイプ バージョン Oracle Database12.1 / 12.2 / 18 / 19 / 20 / 21 Oracle Database on Oracle Cloud Infrastructure 12.1 / 12.2 / 18 / 19 Exadata DB Systems 12.1 / 12.2 / 18 / 19 Oracle Object Storage[*] Latest Autonomous DataWarehouse 18c/19c AutonomousTransaction Processing 18c/19c MySQL 5.7.x and 8.0.x PostgreSQL 10.1 / 9.6, 9.5, 9.4, 9.3, 9.2, 9.1, and 9.0 / 8.4, 8.3, and 8.2 Hive CDH 5.4 and higher / Apache 1.0, 2.0, 3.0 and higher Microsoft SQL Server 2019 / 2017 / 2016 SP2 / 2014 SP3 / 2012 SP4 IBM DB2 10.5.0.11 / 11.5.5.0 Apache Kafka 2.12-2.3.0 Microsoft Azure SQL Database 12.00.2000 Copyright © 2021, Oracle and/or its affiliates 12 [*] CSV(,/¥t/|/;), XML, Avro, Excel, Apache Parquet, Apache ORC, JSON(Simple)
  • 13.
    ビジネス用語集とメタデータの強化 主な機能:Business Glossary andMetadata Enrichment • Harvest(収集)したメタデータをビジ ネス用語集として管理 • ビジネス用語とカテゴリを定義 • ユーザー注釈用の自由形式のタグ 追加 • ビジネス用語とタグへのアセット リンク Copyright © 2021, Oracle and/or its affiliates 13
  • 14.
    収集・管理されているメタデータの情報を検索 主な機能: Search andExploration • 技術名、用語、タグに基づいて データを検索 • さまざまなオブジェクトの詳細 を表示する • データ資産に基づいてカタログ を参照する Copyright © 2021, Oracle and/or its affiliates 14
  • 15.
    15 Copyright ©2021, Oracle and/or its affiliates こんな課題に役立ちます • Oracle Cloud 上のObject Storage (CSV,Excel,ORC,Avro,Parquet,JSON)、 Database、ATP/ADW、MySQL、Hive、 Kafkaに存在するメタデータを統合管理したい • アナリスト、データサイエンティスト、デー タスチュワードなどのデータプロフェッショ ナルの分析プロジェクトやデータサイエンス プロジェクトに、単一ビューでのデータディ スカバリーを提供したい サービス価格(PAYG) • 無償(OCIリソースに対する課金も不要) サービス概要/特徴 • OCI Data Catalog は、Oracle Cloud上のデータ資産 を発見、検索、整理、強化、およびトレースするた めのインベントリサービスを提供します。 • OCI Data Catalog には、Business Glossary 機能が 組み込まれており、正しく信頼できるデータ資産を 有効に活用することが可能です。 Oracle Cloud Infrastructure - Data Catalog Oracle Cloud Ecosystem におけるデータ資産の統合管理