SlideShare a Scribd company logo
初心者必見!
Hadoopを学び始めることで開ける未来
日本サード・パーティ株式会社
人財育成コンサルティング事業部
シニアデータエンジニア 西口 晃司
2018/10/16
Copyright © Japan Third Party Co., Ltd. All Rights Reserved. 2
Copyright © Japan Third Party Co., Ltd. All Rights Reserved.
自己紹介
3
 氏名 西口 晃司
 所属 人財育成コンサルティング事業部
シニアデータエンジニア
 担当業務
データ活用コンサルタント/インストラクター
1000名以上の技術者を育成
 主な専門分野
Hadoop(Hortonworks/Cloudera/MapR)
MongoDB, Talend, Splunk, NVIDIA
Copyright © Japan Third Party Co., Ltd. All Rights Reserved.
直近の主な活動
4
 データサイエンティスト協会 スキル委員会活動
 データ活用リテラシ研修の企画開発
 データ活用関連技術エンジニアの育成
 クラウドデータ基盤の設計、構築
Copyright © Japan Third Party Co., Ltd. All Rights Reserved.
セッションの対象
5
Hadoop を聞いたことがある。
Hadoop の今を知りたい。
Hortonworks Hadoop を知ってみたい。
Copyright © Japan Third Party Co., Ltd. All Rights Reserved.
アジェンダ
6
1. BigData の世界からみるデータ
2. Hadoop の進化
3. 事例紹介
Copyright © Japan Third Party Co., Ltd. All Rights Reserved.
1.BigData の世界からみるデータ
Copyright © Japan Third Party Co., Ltd. All Rights Reserved.
1-1.データは増え続ける
8
0
50
100
150
200
世界のデジタルデータ生成量
[ZB]
163ZB
44ZB
IoT、5 G がデータ量加速を後押し
本当のデータビックバンはこれから
(出典)総務省 ICTコトづくり検討会議(2013年)
http://www.soumu.go.jp/main_content/000234279.pdf
Copyright © Japan Third Party Co., Ltd. All Rights Reserved.
1-2.データ活用モデル
9
(出典)The wisdom hierarchy:representations of the DIKW hierarchy(2006年)
https://unigis.at/schnuppermodul/modul_gisintro/html/lektion5/media/rowley-2007.pdf
知恵
知識
情報
生データ Data
Information
Knowledge
Wisdom
価値
未整理
整理・集計
分析・体系化
活用・判断
Copyright © Japan Third Party Co., Ltd. All Rights Reserved.
1-2.データ活用モデル
10
(出典)The wisdom hierarchy:representations of the DIKW hierarchy(2006年)
https://unigis.at/schnuppermodul/modul_gisintro/html/lektion5/media/rowley-2007.pdf
知恵
知識
情報
生データ
価値
未整理
整理・集計
分析・体系化
活用・判断
Amazon
S3
Copyright © Japan Third Party Co., Ltd. All Rights Reserved.
1-3.データ活用時代に求められる3つのスキル
11
ビジネス課題を整理して
解決するスキル
統計学や機械学習などの
情報科学を実践してデータを
価値あるものにするスキル
データを蓄積し、意味のあ
る形にするために実装した
り運用するスキル
(出典)
データサイエンティスト協会「データサイエンティスト協会、データサイエンティストの
ミッション、スキルセット、定義、スキルレベルを発表」(2014年)
http://www.datascientist.or.jp/news/2014/pdf/1210.pdf
エンジニアリングスキル データサイエンススキル
ビジネススキル
Copyright © Japan Third Party Co., Ltd. All Rights Reserved.
1-4.エンジニアリングスキル
12
ビジネス課題を整理して
解決するスキル
統計学や機械学習などの
情報科学を実践してデータを
価値あるものにするスキル
データを蓄積し、意味のあ
る形にするために実装した
り運用するスキル
エンジニアリングスキル データサイエンススキル
ビジネススキル
(出典)
データサイエンティスト協会「データサイエンティスト協会、データサイエンティストの
ミッション、スキルセット、定義、スキルレベルを発表」(2014年)
http://www.datascientist.or.jp/news/2014/pdf/1210.pdf
Copyright © Japan Third Party Co., Ltd. All Rights Reserved.
1-4.エンジニアリングスキル ~データを蓄積する技術~
13
知恵
知識
情報
生データ
価値
未整理
整理・集計
分析・体系化
活用・判断
Amazon
S3(出典)The wisdom hierarchy:representations of the DIKW hierarchy(2006年)
https://unigis.at/schnuppermodul/modul_gisintro/html/lektion5/media/rowley-2007.pdf
Copyright © Japan Third Party Co., Ltd. All Rights Reserved.
1-5.データサイエンススキル
14
ビジネス課題を整理して
解決するスキル
統計学や機械学習などの
情報科学を実践してデータを
価値あるものにするスキル
データを蓄積し、意味のあ
る形にするために実装した
り運用するスキル
エンジニアリングスキル データサイエンススキル
ビジネススキル
(出典)
データサイエンティスト協会「データサイエンティスト協会、データサイエンティストの
ミッション、スキルセット、定義、スキルレベルを発表」(2014年)
http://www.datascientist.or.jp/news/2014/pdf/1210.pdf
Copyright © Japan Third Party Co., Ltd. All Rights Reserved.
1-5.データサイエンススキル
15
(出典)The wisdom hierarchy:representations of the DIKW hierarchy(2006年)
https://unigis.at/schnuppermodul/modul_gisintro/html/lektion5/media/rowley-2007.pdf
知恵
知識
情報
生データ
価値
未整理
整理・集計
分析・体系化
活用・判断
Copyright © Japan Third Party Co., Ltd. All Rights Reserved.
AI
1-5.データサイエンススキル
16
データ活用度
(データ整理)
データアナリシス
・回帰/時系列分析
・クラスタ分析
・アソシエーション分析
ディープラーニング機械学習
・回帰/時系列分析
・クラスタ分析
・相関分析
・自然言語理解
・ランダムフォレスト
・ナイーブベイズ
データ可視化
データ整理
データ集計
従来の
データ分析
数値データのみ
多様なデータ
(数値、Text、
画像、動画、etc)
・販売/売上予測
・マッチング販売
・陳列の適正化
(ビジネス例)
・医療画像診断
・自動運転
・AIスピーカー
BA
R
自動データアナリ
シス(擬人化)
・販売予測
・故障予測
・陳列の適正化
・画像分類
・物体検出
・音声認識
・チャットボット
・コールセンタ支援
・与信支援
(ビジネス例) (ビジネス例) (ビジネス例)
IoT
Copyright © Japan Third Party Co., Ltd. All Rights Reserved.
2. Hadoop の進化
Copyright © Japan Third Party Co., Ltd. All Rights Reserved.
2-1.Hadoop おさらい
18
(出典)http://hortonworks.com/wp-content/uploads/2013/10/hadoopstack.png
使いやすさのニーズ
バッチ処理
高速処理のニーズ
インタラクティブクエリ処理
リアルタイムのニーズ
ストリームデータ処理
Copyright © Japan Third Party Co., Ltd. All Rights Reserved.
2-2.Hadoop比較
19
Hadoop
Apache
Hadoop準拠
Apache
Hadoop準拠
自社開発
データ格納 HDFS HDFS MapR-FS
拡張性 OSSと密に連携 OSSと密に連携
OSSと
連携可能
Apache Hadoop のコミッタの
約30%がHortonworks社メンバ
Apache Hadoop のコミッタの
約15%がCloudera社メンバ
Copyright © Japan Third Party Co., Ltd. All Rights Reserved.
2-3.Hortonworks が提供するプラットフォーム
20
~リアルタイム処理に注力~
• Hortonworks Data Platform (HDP)
「Apache Hdoop」や「Apache Spark」等の Hadoop エコシス
テムをベースにしたデータプラットフォーム
• Hortonworks DataFlow (HDF)
ストリーミングを実現する「Apache NiFi」や「Apache Kafka」、
「Apache Storm」をベースにしたリアルタイムデータ処理ソフ
トウェア
Copyright © Japan Third Party Co., Ltd. All Rights Reserved.
2-3.Hortonworks が提供するプラットフォーム
21
~リアルタイム処理に注力~
• Hortonworks Data Platform (HDP)
「Apache Hdoop」や「Apache Spark」等の Hadoop エコシス
テムをベースにしたデータプラットフォーム
• Hortonworks DataFlow (HDF)
ストリーミングを実現する「Apache NiFi」や「Apache Kafka」、
「Apache Storm」をベースにしたリアルタイムデータ処理ソフ
トウェア
Copyright © Japan Third Party Co., Ltd. All Rights Reserved. 22
2-4.Hortonworks Data Platform (HDP)
Copyright © Japan Third Party Co., Ltd. All Rights Reserved. 23
2-5.HDPで選択できるHadoopエコシステム
Copyright © Japan Third Party Co., Ltd. All Rights Reserved. 24
2-6.HDPでのHadoop
Copyright © Japan Third Party Co., Ltd. All Rights Reserved. 25
 Apache Hadoop に準拠しており最新機能を早く使える
 エコシステムを自由に組み合わせることができる
 Microsoft Azure HDInsight を利用することでクラウ
ド環境で HDP を簡単に使うことができる
2-7.Hortonworks Data Platform の特長
Copyright © Japan Third Party Co., Ltd. All Rights Reserved.
2-8.Hortonworks が提供するプラットフォーム
26
~リアルタイム処理に注力~
• Hortonworks Data Platform (HDP)
「Apache Hdoop」や「Apache Spark」等の Hadoop エコシス
テムをベースにしたデータプラットフォーム
• Hortonworks DataFlow (HDF)
ストリーミングを実現する「Apache NiFi」や「Apache Kafka」、
「Apache Storm」をベースにしたリアルタイムデータ処理ソフ
トウェア
Copyright © Japan Third Party Co., Ltd. All Rights Reserved. 27
2-9.Hortonworks DataFlow
簡単にデータフロー
を定義
簡単にデータの収集を実現
簡単にリアルタイム処理を実現
データから
新たな価値
Copyright © Japan Third Party Co., Ltd. All Rights Reserved.
2-10.Hortonworks DataFlow の特長
28
リアルタイム処理を実現
・常時連続実行
・データフロー管理
・処理時間 ミリ秒~秒
Copyright © Japan Third Party Co., Ltd. All Rights Reserved.
3. 事例紹介
Copyright © Japan Third Party Co., Ltd. All Rights Reserved.
3-1.日産自動車株式会社様
30
 課題
✓ 走行データや品質データなどの長期保管
✓ サイロ化しているデータの統合
✓ 統一プラットフォームの必要性
 活用
✓ HDFS でデータレイクを実現
✓ Kafka で IoT データの収集を実現
✓ Spark で高速処理を実現
Copyright © Japan Third Party Co., Ltd. All Rights Reserved.
3-2.三菱ふそうトラック・バス株式会社様
31
 課題
✓ データ主導のビジネス変革
✓ 情報提供サービスの提供
 活用
✓ HDFS でデータレイクを実現
✓ Storm で リアルタイム分析を実現
✓ HBASE でデータ格納/参照の高速処理を実現
✓ Spark で高速処理を実現
Copyright © Japan Third Party Co., Ltd. All Rights Reserved.
3-3. Hilton Hotels & Resorts 様
32
 課題
✓ 予約情報やプロファイルデータ
のサイロ化
✓ 一貫性のないデータ管理
✓ 顧客視点での分析が不十分
 活用
✓ HDFS でデータレイクを実現
✓ NiFi でフローデータ処理を実現
✓ Kafka で データの収集を実現
✓ Storm で リアルタイム処理を実現
Copyright © Japan Third Party Co., Ltd. All Rights Reserved.
3-4.Hadoopを取り巻く環境
33
 成熟してきたデータ活用
 IoT・5Gなどの関連技術の発展
 パブリッククラウドやオンプレミスなど選択肢
 Sparkをはじめとした新しい処理エンジンの登場
Hadoopが「難しい」から「誰でも簡単に使える」になりつつある。
再燃するHadoopブームに向け学びが必要
Copyright © Japan Third Party Co., Ltd. All Rights Reserved.
◆主要トレーニングメニュー◆
34
① HDP Operations: Administration Foundations
② HDP Administration II
③ HDF NiFi Flow Management
詳細は、
https://jp.hortonworks.com/services/training/
をご参照ください。
Copyright © Japan Third Party Co., Ltd. All Rights Reserved.
① HDP Operations: Administration Foundations
35
【概要】
Apache Hadoopクラスタを管理する必要のある管理者向けのコース
講義と実機による演習を通じ、Hadoopのインストール / 構成 /クラスター運用タスクについて理
解することができます。
Hadoopとビッグデータの連携や、実習を通じてHadoop開発のマルチノードクラスタにおけるラ
イフサイクルを理解することができます。
【言語】
講義 :日本語
テキスト:英語
【詳細情報】
・https://jp.hortonworks.com/services/training/class/hdp-operations-administration-foundation/ (英語情報)
・https://edu.jtp.co.jp/archives/course_cpt/1568 (日本語情報)
Copyright © Japan Third Party Co., Ltd. All Rights Reserved.
② HDP Administration II
36
【概要】
このトレーニングコースは、Apache Hadoop2.xクラスタを管理する必要のある管理者向けの
コースです。
講義と実機による演習を通じ、Hadoop2.xのアップグレード / 構成 / アプリケーション管理 / そ
の他の基本タスクについて理解することができます。
Hadoopとビッグデータの連携や、実習を通じてHadoop開発のマルチノードクラスタにおけるラ
イフサイクルを理解することができます。
【言語】
講義 :日本語
テキスト:英語
【詳細情報】
・https://jp.hortonworks.com/services/training/class/hdp-operations-hadoop-administration-2/ (英語情報)
・https://edu.jtp.co.jp/archives/course_cpt/1566 (日本語情報)
Copyright © Japan Third Party Co., Ltd. All Rights Reserved.
③ HDF NiFi Flow Management
37
【概要】
このトレーニングコースは、システム間のデータの流れを自動化できることが目的です。
講義と実機による演習を通じ、NiFiの紹介 / NiFiのインストールと設定 / NiFiユーザーインター
フェイスの詳細説明 / それぞれのコンポーネントと要素を理解することができます。また、HDP
と HDF の違いにも理解できます。
【言語】
講義 :英語 (Virtual)
テキスト:英語
【詳細情報】
・ https://jp.hortonworks.com/services/training/class/hdp-operations-hortonworks-data-flow/ (英語情報)
Copyright © Japan Third Party Co., Ltd. All Rights Reserved.
(再掲) Hadoopを取り巻く環境
38
 成熟してきたデータ活用
 IoT・5Gなどの関連技術の発展
 パブリッククラウドやオンプレミスなど選択肢
 Sparkをはじめとした新しい処理エンジンの登場
Hadoopが「難しい」から「誰でも簡単に使える」になりつつある。
再燃するHadoopブームに向け学びが必要
〒140-0001 東京都品川区北品川4-7-35 御殿山トラストタワー14階
TEL.03-6408-2488(代表)
FAX.03-6859-4797
https://www.jtp.co.jp
Copyright © Japan Third Party Co., Ltd. All Rights Reserved.
アンケートのご協力のお願い
Copyright © Japan Third Party Co., Ltd. All Rights Reserved.
アンケートのご協力のお願い

More Related Content

What's hot

Case Study: OLAP usability on Spark and Hadoop
Case Study: OLAP usability on Spark and HadoopCase Study: OLAP usability on Spark and Hadoop
Case Study: OLAP usability on Spark and Hadoop
DataWorks Summit/Hadoop Summit
 
Introduction to Hadoop and Spark (before joining the other talk) and An Overv...
Introduction to Hadoop and Spark (before joining the other talk) and An Overv...Introduction to Hadoop and Spark (before joining the other talk) and An Overv...
Introduction to Hadoop and Spark (before joining the other talk) and An Overv...
DataWorks Summit/Hadoop Summit
 
Use case and Live demo : Agile data integration from Legacy system to Hadoop ...
Use case and Live demo : Agile data integration from Legacy system to Hadoop ...Use case and Live demo : Agile data integration from Legacy system to Hadoop ...
Use case and Live demo : Agile data integration from Legacy system to Hadoop ...
DataWorks Summit/Hadoop Summit
 
HDP Security Overview
HDP Security OverviewHDP Security Overview
HDP Security Overview
Yifeng Jiang
 
Struggle against crossdomain data complexity in Recruit Group
Struggle against crossdomain data complexity in Recruit GroupStruggle against crossdomain data complexity in Recruit Group
Struggle against crossdomain data complexity in Recruit Group
DataWorks Summit/Hadoop Summit
 
OLAP options on Hadoop
OLAP options on HadoopOLAP options on Hadoop
OLAP options on Hadoop
Yuta Imai
 
Data Science on Hadoop
Data Science on HadoopData Science on Hadoop
Data Science on Hadoop
Yifeng Jiang
 
sparksql-hive-bench-by-nec-hwx-at-hcj16
sparksql-hive-bench-by-nec-hwx-at-hcj16sparksql-hive-bench-by-nec-hwx-at-hcj16
sparksql-hive-bench-by-nec-hwx-at-hcj16
Yifeng Jiang
 
Yifeng spark-final-public
Yifeng spark-final-publicYifeng spark-final-public
Yifeng spark-final-public
Yifeng Jiang
 
Hadoop最新事情とHortonworks Data Platform
Hadoop最新事情とHortonworks Data PlatformHadoop最新事情とHortonworks Data Platform
Hadoop最新事情とHortonworks Data Platform
Yuta Imai
 
The real world use of Big Data to change business
The real world use of Big Data to change businessThe real world use of Big Data to change business
The real world use of Big Data to change business
DataWorks Summit/Hadoop Summit
 
[db tech showcase Tokyo 2018] #dbts2018 #E37 『Attunity Replicateが変えた Oracle D...
[db tech showcase Tokyo 2018] #dbts2018 #E37 『Attunity Replicateが変えた Oracle D...[db tech showcase Tokyo 2018] #dbts2018 #E37 『Attunity Replicateが変えた Oracle D...
[db tech showcase Tokyo 2018] #dbts2018 #E37 『Attunity Replicateが変えた Oracle D...
Insight Technology, Inc.
 
Yifeng hadoop-present-public
Yifeng hadoop-present-publicYifeng hadoop-present-public
Yifeng hadoop-present-public
Yifeng Jiang
 
20150630_データ分析に最適な基盤とは? -コスト/スピードでビジネスバリューを得るために- by 株式会社インサイトテクノロジー CTO 石川雅也
20150630_データ分析に最適な基盤とは? -コスト/スピードでビジネスバリューを得るために- by 株式会社インサイトテクノロジー CTO 石川雅也20150630_データ分析に最適な基盤とは? -コスト/スピードでビジネスバリューを得るために- by 株式会社インサイトテクノロジー CTO 石川雅也
20150630_データ分析に最適な基盤とは? -コスト/スピードでビジネスバリューを得るために- by 株式会社インサイトテクノロジー CTO 石川雅也
Insight Technology, Inc.
 
Apache Ambari Overview -- Hadoop for Everyone
Apache Ambari Overview -- Hadoop for EveryoneApache Ambari Overview -- Hadoop for Everyone
Apache Ambari Overview -- Hadoop for Everyone
Yifeng Jiang
 
Red Hat Forum 2014 IBM session
Red Hat Forum 2014 IBM sessionRed Hat Forum 2014 IBM session
Red Hat Forum 2014 IBM session
Shinichiro Arai
 
Deep Learning On Apache Spark
Deep Learning On Apache SparkDeep Learning On Apache Spark
Deep Learning On Apache Spark
Yuta Imai
 
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...
Insight Technology, Inc.
 
Datalake最新情報セミナー
Datalake最新情報セミナーDatalake最新情報セミナー
Datalake最新情報セミナー
mtanaka0111
 
Hadoop/Spark セルフサービス系の事例まとめ
Hadoop/Spark セルフサービス系の事例まとめHadoop/Spark セルフサービス系の事例まとめ
Hadoop/Spark セルフサービス系の事例まとめ
Yuta Imai
 

What's hot (20)

Case Study: OLAP usability on Spark and Hadoop
Case Study: OLAP usability on Spark and HadoopCase Study: OLAP usability on Spark and Hadoop
Case Study: OLAP usability on Spark and Hadoop
 
Introduction to Hadoop and Spark (before joining the other talk) and An Overv...
Introduction to Hadoop and Spark (before joining the other talk) and An Overv...Introduction to Hadoop and Spark (before joining the other talk) and An Overv...
Introduction to Hadoop and Spark (before joining the other talk) and An Overv...
 
Use case and Live demo : Agile data integration from Legacy system to Hadoop ...
Use case and Live demo : Agile data integration from Legacy system to Hadoop ...Use case and Live demo : Agile data integration from Legacy system to Hadoop ...
Use case and Live demo : Agile data integration from Legacy system to Hadoop ...
 
HDP Security Overview
HDP Security OverviewHDP Security Overview
HDP Security Overview
 
Struggle against crossdomain data complexity in Recruit Group
Struggle against crossdomain data complexity in Recruit GroupStruggle against crossdomain data complexity in Recruit Group
Struggle against crossdomain data complexity in Recruit Group
 
OLAP options on Hadoop
OLAP options on HadoopOLAP options on Hadoop
OLAP options on Hadoop
 
Data Science on Hadoop
Data Science on HadoopData Science on Hadoop
Data Science on Hadoop
 
sparksql-hive-bench-by-nec-hwx-at-hcj16
sparksql-hive-bench-by-nec-hwx-at-hcj16sparksql-hive-bench-by-nec-hwx-at-hcj16
sparksql-hive-bench-by-nec-hwx-at-hcj16
 
Yifeng spark-final-public
Yifeng spark-final-publicYifeng spark-final-public
Yifeng spark-final-public
 
Hadoop最新事情とHortonworks Data Platform
Hadoop最新事情とHortonworks Data PlatformHadoop最新事情とHortonworks Data Platform
Hadoop最新事情とHortonworks Data Platform
 
The real world use of Big Data to change business
The real world use of Big Data to change businessThe real world use of Big Data to change business
The real world use of Big Data to change business
 
[db tech showcase Tokyo 2018] #dbts2018 #E37 『Attunity Replicateが変えた Oracle D...
[db tech showcase Tokyo 2018] #dbts2018 #E37 『Attunity Replicateが変えた Oracle D...[db tech showcase Tokyo 2018] #dbts2018 #E37 『Attunity Replicateが変えた Oracle D...
[db tech showcase Tokyo 2018] #dbts2018 #E37 『Attunity Replicateが変えた Oracle D...
 
Yifeng hadoop-present-public
Yifeng hadoop-present-publicYifeng hadoop-present-public
Yifeng hadoop-present-public
 
20150630_データ分析に最適な基盤とは? -コスト/スピードでビジネスバリューを得るために- by 株式会社インサイトテクノロジー CTO 石川雅也
20150630_データ分析に最適な基盤とは? -コスト/スピードでビジネスバリューを得るために- by 株式会社インサイトテクノロジー CTO 石川雅也20150630_データ分析に最適な基盤とは? -コスト/スピードでビジネスバリューを得るために- by 株式会社インサイトテクノロジー CTO 石川雅也
20150630_データ分析に最適な基盤とは? -コスト/スピードでビジネスバリューを得るために- by 株式会社インサイトテクノロジー CTO 石川雅也
 
Apache Ambari Overview -- Hadoop for Everyone
Apache Ambari Overview -- Hadoop for EveryoneApache Ambari Overview -- Hadoop for Everyone
Apache Ambari Overview -- Hadoop for Everyone
 
Red Hat Forum 2014 IBM session
Red Hat Forum 2014 IBM sessionRed Hat Forum 2014 IBM session
Red Hat Forum 2014 IBM session
 
Deep Learning On Apache Spark
Deep Learning On Apache SparkDeep Learning On Apache Spark
Deep Learning On Apache Spark
 
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...
 
Datalake最新情報セミナー
Datalake最新情報セミナーDatalake最新情報セミナー
Datalake最新情報セミナー
 
Hadoop/Spark セルフサービス系の事例まとめ
Hadoop/Spark セルフサービス系の事例まとめHadoop/Spark セルフサービス系の事例まとめ
Hadoop/Spark セルフサービス系の事例まとめ
 

Similar to Beginner must-see! A future that can be opened by learning Hadoop

リクルート式Hadoopの使い方
リクルート式Hadoopの使い方リクルート式Hadoopの使い方
リクルート式Hadoopの使い方
Recruit Technologies
 
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)
NTT DATA OSS Professional Services
 
Apache Big Data Miami 2017 - Hadoop Source Code Reading #23 #hadoopreading
Apache Big Data Miami 2017 - Hadoop Source Code Reading #23 #hadoopreadingApache Big Data Miami 2017 - Hadoop Source Code Reading #23 #hadoopreading
Apache Big Data Miami 2017 - Hadoop Source Code Reading #23 #hadoopreading
Yahoo!デベロッパーネットワーク
 
分散処理基盤Apache Hadoop入門とHadoopエコシステムの最新技術動向 (オープンソースカンファレンス 2015 Tokyo/Spring 講...
分散処理基盤Apache Hadoop入門とHadoopエコシステムの最新技術動向 (オープンソースカンファレンス 2015 Tokyo/Spring 講...分散処理基盤Apache Hadoop入門とHadoopエコシステムの最新技術動向 (オープンソースカンファレンス 2015 Tokyo/Spring 講...
分散処理基盤Apache Hadoop入門とHadoopエコシステムの最新技術動向 (オープンソースカンファレンス 2015 Tokyo/Spring 講...
NTT DATA OSS Professional Services
 
Hadoop ecosystem NTTDATA osc15tk
Hadoop ecosystem NTTDATA osc15tkHadoop ecosystem NTTDATA osc15tk
Hadoop ecosystem NTTDATA osc15tk
NTT DATA OSS Professional Services
 
Hadoop~Yahoo!Japanの活用について
Hadoop~Yahoo!Japanの活用についてHadoop~Yahoo!Japanの活用について
Hadoop~Yahoo!Japanの活用について
kaminashi
 
db tech showcase2019 オープニングセッション @ 石川 雅也
db tech showcase2019 オープニングセッション @ 石川 雅也db tech showcase2019 オープニングセッション @ 石川 雅也
db tech showcase2019 オープニングセッション @ 石川 雅也
Insight Technology, Inc.
 
並列分散処理基盤Hadoopの紹介と、開発者が語るHadoopの使いどころ (Silicon Valley x 日本 / Tech x Business ...
並列分散処理基盤Hadoopの紹介と、開発者が語るHadoopの使いどころ (Silicon Valley x 日本 / Tech x Business ...並列分散処理基盤Hadoopの紹介と、開発者が語るHadoopの使いどころ (Silicon Valley x 日本 / Tech x Business ...
並列分散処理基盤Hadoopの紹介と、開発者が語るHadoopの使いどころ (Silicon Valley x 日本 / Tech x Business ...
NTT DATA OSS Professional Services
 
[db analytics showcase Sapporo 2018] B25 Hadoop上で動く世界最速のAnalytic DBをSparkと一緒に...
[db analytics showcase Sapporo 2018] B25 Hadoop上で動く世界最速のAnalytic DBをSparkと一緒に...[db analytics showcase Sapporo 2018] B25 Hadoop上で動く世界最速のAnalytic DBをSparkと一緒に...
[db analytics showcase Sapporo 2018] B25 Hadoop上で動く世界最速のAnalytic DBをSparkと一緒に...
Insight Technology, Inc.
 
Hadoopビッグデータ基盤の歴史を振り返る #cwt2015
Hadoopビッグデータ基盤の歴史を振り返る #cwt2015Hadoopビッグデータ基盤の歴史を振り返る #cwt2015
Hadoopビッグデータ基盤の歴史を振り返る #cwt2015
Cloudera Japan
 
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
NTT DATA Technology & Innovation
 
[de:code 2019 振り返り Night!] Data Platform
[de:code 2019 振り返り Night!] Data Platform[de:code 2019 振り返り Night!] Data Platform
[de:code 2019 振り返り Night!] Data Platform
Naoki (Neo) SATO
 
Prestoで実現するインタラクティブクエリ - dbtech showcase 2014 Tokyo
Prestoで実現するインタラクティブクエリ - dbtech showcase 2014 TokyoPrestoで実現するインタラクティブクエリ - dbtech showcase 2014 Tokyo
Prestoで実現するインタラクティブクエリ - dbtech showcase 2014 Tokyo
Treasure Data, Inc.
 
ビッグデータ活用支援フォーラム
ビッグデータ活用支援フォーラムビッグデータ活用支援フォーラム
ビッグデータ活用支援フォーラムRecruit Technologies
 
[db tech showcase Tokyo 2014] D33: Prestoで実現するインタラクティブクエリ by トレジャーデータ株式会社 斉藤太郎
[db tech showcase Tokyo 2014] D33: Prestoで実現するインタラクティブクエリ  by トレジャーデータ株式会社 斉藤太郎[db tech showcase Tokyo 2014] D33: Prestoで実現するインタラクティブクエリ  by トレジャーデータ株式会社 斉藤太郎
[db tech showcase Tokyo 2014] D33: Prestoで実現するインタラクティブクエリ by トレジャーデータ株式会社 斉藤太郎
Insight Technology, Inc.
 
20130313 OSCA Hadoopセミナー
20130313 OSCA Hadoopセミナー20130313 OSCA Hadoopセミナー
20130313 OSCA Hadoopセミナー
Ichiro Fukuda
 
今注目のSpark SQL、知っておきたいその性能とは 20151209 OSC Enterprise
今注目のSpark SQL、知っておきたいその性能とは 20151209 OSC Enterprise今注目のSpark SQL、知っておきたいその性能とは 20151209 OSC Enterprise
今注目のSpark SQL、知っておきたいその性能とは 20151209 OSC EnterpriseYusukeKuramata
 
Yahoo! JAPANのデータ基盤とHadoop #dbts2016
Yahoo! JAPANのデータ基盤とHadoop #dbts2016Yahoo! JAPANのデータ基盤とHadoop #dbts2016
Yahoo! JAPANのデータ基盤とHadoop #dbts2016
Yahoo!デベロッパーネットワーク
 
DLLAB Engineer Days:AIチームが履歴やリソース管理で疲弊してたので開発基盤作ってOSS化した話
DLLAB Engineer Days:AIチームが履歴やリソース管理で疲弊してたので開発基盤作ってOSS化した話DLLAB Engineer Days:AIチームが履歴やリソース管理で疲弊してたので開発基盤作ってOSS化した話
DLLAB Engineer Days:AIチームが履歴やリソース管理で疲弊してたので開発基盤作ってOSS化した話
Kamonohashi
 
Apache Hadoopを利用したビッグデータ分析基盤
Apache Hadoopを利用したビッグデータ分析基盤Apache Hadoopを利用したビッグデータ分析基盤
Apache Hadoopを利用したビッグデータ分析基盤
Hortonworks Japan
 

Similar to Beginner must-see! A future that can be opened by learning Hadoop (20)

リクルート式Hadoopの使い方
リクルート式Hadoopの使い方リクルート式Hadoopの使い方
リクルート式Hadoopの使い方
 
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)
 
Apache Big Data Miami 2017 - Hadoop Source Code Reading #23 #hadoopreading
Apache Big Data Miami 2017 - Hadoop Source Code Reading #23 #hadoopreadingApache Big Data Miami 2017 - Hadoop Source Code Reading #23 #hadoopreading
Apache Big Data Miami 2017 - Hadoop Source Code Reading #23 #hadoopreading
 
分散処理基盤Apache Hadoop入門とHadoopエコシステムの最新技術動向 (オープンソースカンファレンス 2015 Tokyo/Spring 講...
分散処理基盤Apache Hadoop入門とHadoopエコシステムの最新技術動向 (オープンソースカンファレンス 2015 Tokyo/Spring 講...分散処理基盤Apache Hadoop入門とHadoopエコシステムの最新技術動向 (オープンソースカンファレンス 2015 Tokyo/Spring 講...
分散処理基盤Apache Hadoop入門とHadoopエコシステムの最新技術動向 (オープンソースカンファレンス 2015 Tokyo/Spring 講...
 
Hadoop ecosystem NTTDATA osc15tk
Hadoop ecosystem NTTDATA osc15tkHadoop ecosystem NTTDATA osc15tk
Hadoop ecosystem NTTDATA osc15tk
 
Hadoop~Yahoo!Japanの活用について
Hadoop~Yahoo!Japanの活用についてHadoop~Yahoo!Japanの活用について
Hadoop~Yahoo!Japanの活用について
 
db tech showcase2019 オープニングセッション @ 石川 雅也
db tech showcase2019 オープニングセッション @ 石川 雅也db tech showcase2019 オープニングセッション @ 石川 雅也
db tech showcase2019 オープニングセッション @ 石川 雅也
 
並列分散処理基盤Hadoopの紹介と、開発者が語るHadoopの使いどころ (Silicon Valley x 日本 / Tech x Business ...
並列分散処理基盤Hadoopの紹介と、開発者が語るHadoopの使いどころ (Silicon Valley x 日本 / Tech x Business ...並列分散処理基盤Hadoopの紹介と、開発者が語るHadoopの使いどころ (Silicon Valley x 日本 / Tech x Business ...
並列分散処理基盤Hadoopの紹介と、開発者が語るHadoopの使いどころ (Silicon Valley x 日本 / Tech x Business ...
 
[db analytics showcase Sapporo 2018] B25 Hadoop上で動く世界最速のAnalytic DBをSparkと一緒に...
[db analytics showcase Sapporo 2018] B25 Hadoop上で動く世界最速のAnalytic DBをSparkと一緒に...[db analytics showcase Sapporo 2018] B25 Hadoop上で動く世界最速のAnalytic DBをSparkと一緒に...
[db analytics showcase Sapporo 2018] B25 Hadoop上で動く世界最速のAnalytic DBをSparkと一緒に...
 
Hadoopビッグデータ基盤の歴史を振り返る #cwt2015
Hadoopビッグデータ基盤の歴史を振り返る #cwt2015Hadoopビッグデータ基盤の歴史を振り返る #cwt2015
Hadoopビッグデータ基盤の歴史を振り返る #cwt2015
 
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
 
[de:code 2019 振り返り Night!] Data Platform
[de:code 2019 振り返り Night!] Data Platform[de:code 2019 振り返り Night!] Data Platform
[de:code 2019 振り返り Night!] Data Platform
 
Prestoで実現するインタラクティブクエリ - dbtech showcase 2014 Tokyo
Prestoで実現するインタラクティブクエリ - dbtech showcase 2014 TokyoPrestoで実現するインタラクティブクエリ - dbtech showcase 2014 Tokyo
Prestoで実現するインタラクティブクエリ - dbtech showcase 2014 Tokyo
 
ビッグデータ活用支援フォーラム
ビッグデータ活用支援フォーラムビッグデータ活用支援フォーラム
ビッグデータ活用支援フォーラム
 
[db tech showcase Tokyo 2014] D33: Prestoで実現するインタラクティブクエリ by トレジャーデータ株式会社 斉藤太郎
[db tech showcase Tokyo 2014] D33: Prestoで実現するインタラクティブクエリ  by トレジャーデータ株式会社 斉藤太郎[db tech showcase Tokyo 2014] D33: Prestoで実現するインタラクティブクエリ  by トレジャーデータ株式会社 斉藤太郎
[db tech showcase Tokyo 2014] D33: Prestoで実現するインタラクティブクエリ by トレジャーデータ株式会社 斉藤太郎
 
20130313 OSCA Hadoopセミナー
20130313 OSCA Hadoopセミナー20130313 OSCA Hadoopセミナー
20130313 OSCA Hadoopセミナー
 
今注目のSpark SQL、知っておきたいその性能とは 20151209 OSC Enterprise
今注目のSpark SQL、知っておきたいその性能とは 20151209 OSC Enterprise今注目のSpark SQL、知っておきたいその性能とは 20151209 OSC Enterprise
今注目のSpark SQL、知っておきたいその性能とは 20151209 OSC Enterprise
 
Yahoo! JAPANのデータ基盤とHadoop #dbts2016
Yahoo! JAPANのデータ基盤とHadoop #dbts2016Yahoo! JAPANのデータ基盤とHadoop #dbts2016
Yahoo! JAPANのデータ基盤とHadoop #dbts2016
 
DLLAB Engineer Days:AIチームが履歴やリソース管理で疲弊してたので開発基盤作ってOSS化した話
DLLAB Engineer Days:AIチームが履歴やリソース管理で疲弊してたので開発基盤作ってOSS化した話DLLAB Engineer Days:AIチームが履歴やリソース管理で疲弊してたので開発基盤作ってOSS化した話
DLLAB Engineer Days:AIチームが履歴やリソース管理で疲弊してたので開発基盤作ってOSS化した話
 
Apache Hadoopを利用したビッグデータ分析基盤
Apache Hadoopを利用したビッグデータ分析基盤Apache Hadoopを利用したビッグデータ分析基盤
Apache Hadoopを利用したビッグデータ分析基盤
 

More from DataWorks Summit

Data Science Crash Course
Data Science Crash CourseData Science Crash Course
Data Science Crash Course
DataWorks Summit
 
Floating on a RAFT: HBase Durability with Apache Ratis
Floating on a RAFT: HBase Durability with Apache RatisFloating on a RAFT: HBase Durability with Apache Ratis
Floating on a RAFT: HBase Durability with Apache Ratis
DataWorks Summit
 
Tracking Crime as It Occurs with Apache Phoenix, Apache HBase and Apache NiFi
Tracking Crime as It Occurs with Apache Phoenix, Apache HBase and Apache NiFiTracking Crime as It Occurs with Apache Phoenix, Apache HBase and Apache NiFi
Tracking Crime as It Occurs with Apache Phoenix, Apache HBase and Apache NiFi
DataWorks Summit
 
HBase Tales From the Trenches - Short stories about most common HBase operati...
HBase Tales From the Trenches - Short stories about most common HBase operati...HBase Tales From the Trenches - Short stories about most common HBase operati...
HBase Tales From the Trenches - Short stories about most common HBase operati...
DataWorks Summit
 
Optimizing Geospatial Operations with Server-side Programming in HBase and Ac...
Optimizing Geospatial Operations with Server-side Programming in HBase and Ac...Optimizing Geospatial Operations with Server-side Programming in HBase and Ac...
Optimizing Geospatial Operations with Server-side Programming in HBase and Ac...
DataWorks Summit
 
Managing the Dewey Decimal System
Managing the Dewey Decimal SystemManaging the Dewey Decimal System
Managing the Dewey Decimal System
DataWorks Summit
 
Practical NoSQL: Accumulo's dirlist Example
Practical NoSQL: Accumulo's dirlist ExamplePractical NoSQL: Accumulo's dirlist Example
Practical NoSQL: Accumulo's dirlist Example
DataWorks Summit
 
HBase Global Indexing to support large-scale data ingestion at Uber
HBase Global Indexing to support large-scale data ingestion at UberHBase Global Indexing to support large-scale data ingestion at Uber
HBase Global Indexing to support large-scale data ingestion at Uber
DataWorks Summit
 
Scaling Cloud-Scale Translytics Workloads with Omid and Phoenix
Scaling Cloud-Scale Translytics Workloads with Omid and PhoenixScaling Cloud-Scale Translytics Workloads with Omid and Phoenix
Scaling Cloud-Scale Translytics Workloads with Omid and Phoenix
DataWorks Summit
 
Building the High Speed Cybersecurity Data Pipeline Using Apache NiFi
Building the High Speed Cybersecurity Data Pipeline Using Apache NiFiBuilding the High Speed Cybersecurity Data Pipeline Using Apache NiFi
Building the High Speed Cybersecurity Data Pipeline Using Apache NiFi
DataWorks Summit
 
Supporting Apache HBase : Troubleshooting and Supportability Improvements
Supporting Apache HBase : Troubleshooting and Supportability ImprovementsSupporting Apache HBase : Troubleshooting and Supportability Improvements
Supporting Apache HBase : Troubleshooting and Supportability Improvements
DataWorks Summit
 
Security Framework for Multitenant Architecture
Security Framework for Multitenant ArchitectureSecurity Framework for Multitenant Architecture
Security Framework for Multitenant Architecture
DataWorks Summit
 
Presto: Optimizing Performance of SQL-on-Anything Engine
Presto: Optimizing Performance of SQL-on-Anything EnginePresto: Optimizing Performance of SQL-on-Anything Engine
Presto: Optimizing Performance of SQL-on-Anything Engine
DataWorks Summit
 
Introducing MlFlow: An Open Source Platform for the Machine Learning Lifecycl...
Introducing MlFlow: An Open Source Platform for the Machine Learning Lifecycl...Introducing MlFlow: An Open Source Platform for the Machine Learning Lifecycl...
Introducing MlFlow: An Open Source Platform for the Machine Learning Lifecycl...
DataWorks Summit
 
Extending Twitter's Data Platform to Google Cloud
Extending Twitter's Data Platform to Google CloudExtending Twitter's Data Platform to Google Cloud
Extending Twitter's Data Platform to Google Cloud
DataWorks Summit
 
Event-Driven Messaging and Actions using Apache Flink and Apache NiFi
Event-Driven Messaging and Actions using Apache Flink and Apache NiFiEvent-Driven Messaging and Actions using Apache Flink and Apache NiFi
Event-Driven Messaging and Actions using Apache Flink and Apache NiFi
DataWorks Summit
 
Securing Data in Hybrid on-premise and Cloud Environments using Apache Ranger
Securing Data in Hybrid on-premise and Cloud Environments using Apache RangerSecuring Data in Hybrid on-premise and Cloud Environments using Apache Ranger
Securing Data in Hybrid on-premise and Cloud Environments using Apache Ranger
DataWorks Summit
 
Big Data Meets NVM: Accelerating Big Data Processing with Non-Volatile Memory...
Big Data Meets NVM: Accelerating Big Data Processing with Non-Volatile Memory...Big Data Meets NVM: Accelerating Big Data Processing with Non-Volatile Memory...
Big Data Meets NVM: Accelerating Big Data Processing with Non-Volatile Memory...
DataWorks Summit
 
Computer Vision: Coming to a Store Near You
Computer Vision: Coming to a Store Near YouComputer Vision: Coming to a Store Near You
Computer Vision: Coming to a Store Near You
DataWorks Summit
 
Big Data Genomics: Clustering Billions of DNA Sequences with Apache Spark
Big Data Genomics: Clustering Billions of DNA Sequences with Apache SparkBig Data Genomics: Clustering Billions of DNA Sequences with Apache Spark
Big Data Genomics: Clustering Billions of DNA Sequences with Apache Spark
DataWorks Summit
 

More from DataWorks Summit (20)

Data Science Crash Course
Data Science Crash CourseData Science Crash Course
Data Science Crash Course
 
Floating on a RAFT: HBase Durability with Apache Ratis
Floating on a RAFT: HBase Durability with Apache RatisFloating on a RAFT: HBase Durability with Apache Ratis
Floating on a RAFT: HBase Durability with Apache Ratis
 
Tracking Crime as It Occurs with Apache Phoenix, Apache HBase and Apache NiFi
Tracking Crime as It Occurs with Apache Phoenix, Apache HBase and Apache NiFiTracking Crime as It Occurs with Apache Phoenix, Apache HBase and Apache NiFi
Tracking Crime as It Occurs with Apache Phoenix, Apache HBase and Apache NiFi
 
HBase Tales From the Trenches - Short stories about most common HBase operati...
HBase Tales From the Trenches - Short stories about most common HBase operati...HBase Tales From the Trenches - Short stories about most common HBase operati...
HBase Tales From the Trenches - Short stories about most common HBase operati...
 
Optimizing Geospatial Operations with Server-side Programming in HBase and Ac...
Optimizing Geospatial Operations with Server-side Programming in HBase and Ac...Optimizing Geospatial Operations with Server-side Programming in HBase and Ac...
Optimizing Geospatial Operations with Server-side Programming in HBase and Ac...
 
Managing the Dewey Decimal System
Managing the Dewey Decimal SystemManaging the Dewey Decimal System
Managing the Dewey Decimal System
 
Practical NoSQL: Accumulo's dirlist Example
Practical NoSQL: Accumulo's dirlist ExamplePractical NoSQL: Accumulo's dirlist Example
Practical NoSQL: Accumulo's dirlist Example
 
HBase Global Indexing to support large-scale data ingestion at Uber
HBase Global Indexing to support large-scale data ingestion at UberHBase Global Indexing to support large-scale data ingestion at Uber
HBase Global Indexing to support large-scale data ingestion at Uber
 
Scaling Cloud-Scale Translytics Workloads with Omid and Phoenix
Scaling Cloud-Scale Translytics Workloads with Omid and PhoenixScaling Cloud-Scale Translytics Workloads with Omid and Phoenix
Scaling Cloud-Scale Translytics Workloads with Omid and Phoenix
 
Building the High Speed Cybersecurity Data Pipeline Using Apache NiFi
Building the High Speed Cybersecurity Data Pipeline Using Apache NiFiBuilding the High Speed Cybersecurity Data Pipeline Using Apache NiFi
Building the High Speed Cybersecurity Data Pipeline Using Apache NiFi
 
Supporting Apache HBase : Troubleshooting and Supportability Improvements
Supporting Apache HBase : Troubleshooting and Supportability ImprovementsSupporting Apache HBase : Troubleshooting and Supportability Improvements
Supporting Apache HBase : Troubleshooting and Supportability Improvements
 
Security Framework for Multitenant Architecture
Security Framework for Multitenant ArchitectureSecurity Framework for Multitenant Architecture
Security Framework for Multitenant Architecture
 
Presto: Optimizing Performance of SQL-on-Anything Engine
Presto: Optimizing Performance of SQL-on-Anything EnginePresto: Optimizing Performance of SQL-on-Anything Engine
Presto: Optimizing Performance of SQL-on-Anything Engine
 
Introducing MlFlow: An Open Source Platform for the Machine Learning Lifecycl...
Introducing MlFlow: An Open Source Platform for the Machine Learning Lifecycl...Introducing MlFlow: An Open Source Platform for the Machine Learning Lifecycl...
Introducing MlFlow: An Open Source Platform for the Machine Learning Lifecycl...
 
Extending Twitter's Data Platform to Google Cloud
Extending Twitter's Data Platform to Google CloudExtending Twitter's Data Platform to Google Cloud
Extending Twitter's Data Platform to Google Cloud
 
Event-Driven Messaging and Actions using Apache Flink and Apache NiFi
Event-Driven Messaging and Actions using Apache Flink and Apache NiFiEvent-Driven Messaging and Actions using Apache Flink and Apache NiFi
Event-Driven Messaging and Actions using Apache Flink and Apache NiFi
 
Securing Data in Hybrid on-premise and Cloud Environments using Apache Ranger
Securing Data in Hybrid on-premise and Cloud Environments using Apache RangerSecuring Data in Hybrid on-premise and Cloud Environments using Apache Ranger
Securing Data in Hybrid on-premise and Cloud Environments using Apache Ranger
 
Big Data Meets NVM: Accelerating Big Data Processing with Non-Volatile Memory...
Big Data Meets NVM: Accelerating Big Data Processing with Non-Volatile Memory...Big Data Meets NVM: Accelerating Big Data Processing with Non-Volatile Memory...
Big Data Meets NVM: Accelerating Big Data Processing with Non-Volatile Memory...
 
Computer Vision: Coming to a Store Near You
Computer Vision: Coming to a Store Near YouComputer Vision: Coming to a Store Near You
Computer Vision: Coming to a Store Near You
 
Big Data Genomics: Clustering Billions of DNA Sequences with Apache Spark
Big Data Genomics: Clustering Billions of DNA Sequences with Apache SparkBig Data Genomics: Clustering Billions of DNA Sequences with Apache Spark
Big Data Genomics: Clustering Billions of DNA Sequences with Apache Spark
 

Recently uploaded

FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdfFIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
FIDO Alliance
 
【AI論文解説】Consistency ModelとRectified Flow
【AI論文解説】Consistency ModelとRectified Flow【AI論文解説】Consistency ModelとRectified Flow
【AI論文解説】Consistency ModelとRectified Flow
Sony - Neural Network Libraries
 
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdfFIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
FIDO Alliance
 
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
NTT DATA Technology & Innovation
 
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
harmonylab
 
FIDO Alliance Osaka Seminar: Welcome Slides.pdf
FIDO Alliance Osaka Seminar: Welcome Slides.pdfFIDO Alliance Osaka Seminar: Welcome Slides.pdf
FIDO Alliance Osaka Seminar: Welcome Slides.pdf
FIDO Alliance
 
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
atsushi061452
 
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
yassun7010
 
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
Fukuoka Institute of Technology
 
CS集会#13_なるほどわからん通信技術 発表資料
CS集会#13_なるほどわからん通信技術 発表資料CS集会#13_なるほどわからん通信技術 発表資料
CS集会#13_なるほどわからん通信技術 発表資料
Yuuitirou528 default
 
FIDO Alliance Osaka Seminar: CloudGate.pdf
FIDO Alliance Osaka Seminar: CloudGate.pdfFIDO Alliance Osaka Seminar: CloudGate.pdf
FIDO Alliance Osaka Seminar: CloudGate.pdf
FIDO Alliance
 
MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
iPride Co., Ltd.
 
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
Toru Tamaki
 
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
Matsushita Laboratory
 
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdfFIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
FIDO Alliance
 
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアルLoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
CRI Japan, Inc.
 

Recently uploaded (16)

FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdfFIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
 
【AI論文解説】Consistency ModelとRectified Flow
【AI論文解説】Consistency ModelとRectified Flow【AI論文解説】Consistency ModelとRectified Flow
【AI論文解説】Consistency ModelとRectified Flow
 
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdfFIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
 
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
 
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
 
FIDO Alliance Osaka Seminar: Welcome Slides.pdf
FIDO Alliance Osaka Seminar: Welcome Slides.pdfFIDO Alliance Osaka Seminar: Welcome Slides.pdf
FIDO Alliance Osaka Seminar: Welcome Slides.pdf
 
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
 
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
 
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
 
CS集会#13_なるほどわからん通信技術 発表資料
CS集会#13_なるほどわからん通信技術 発表資料CS集会#13_なるほどわからん通信技術 発表資料
CS集会#13_なるほどわからん通信技術 発表資料
 
FIDO Alliance Osaka Seminar: CloudGate.pdf
FIDO Alliance Osaka Seminar: CloudGate.pdfFIDO Alliance Osaka Seminar: CloudGate.pdf
FIDO Alliance Osaka Seminar: CloudGate.pdf
 
MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
 
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
 
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
 
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdfFIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
 
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアルLoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
 

Beginner must-see! A future that can be opened by learning Hadoop

  • 2. Copyright © Japan Third Party Co., Ltd. All Rights Reserved. 2
  • 3. Copyright © Japan Third Party Co., Ltd. All Rights Reserved. 自己紹介 3  氏名 西口 晃司  所属 人財育成コンサルティング事業部 シニアデータエンジニア  担当業務 データ活用コンサルタント/インストラクター 1000名以上の技術者を育成  主な専門分野 Hadoop(Hortonworks/Cloudera/MapR) MongoDB, Talend, Splunk, NVIDIA
  • 4. Copyright © Japan Third Party Co., Ltd. All Rights Reserved. 直近の主な活動 4  データサイエンティスト協会 スキル委員会活動  データ活用リテラシ研修の企画開発  データ活用関連技術エンジニアの育成  クラウドデータ基盤の設計、構築
  • 5. Copyright © Japan Third Party Co., Ltd. All Rights Reserved. セッションの対象 5 Hadoop を聞いたことがある。 Hadoop の今を知りたい。 Hortonworks Hadoop を知ってみたい。
  • 6. Copyright © Japan Third Party Co., Ltd. All Rights Reserved. アジェンダ 6 1. BigData の世界からみるデータ 2. Hadoop の進化 3. 事例紹介
  • 7. Copyright © Japan Third Party Co., Ltd. All Rights Reserved. 1.BigData の世界からみるデータ
  • 8. Copyright © Japan Third Party Co., Ltd. All Rights Reserved. 1-1.データは増え続ける 8 0 50 100 150 200 世界のデジタルデータ生成量 [ZB] 163ZB 44ZB IoT、5 G がデータ量加速を後押し 本当のデータビックバンはこれから (出典)総務省 ICTコトづくり検討会議(2013年) http://www.soumu.go.jp/main_content/000234279.pdf
  • 9. Copyright © Japan Third Party Co., Ltd. All Rights Reserved. 1-2.データ活用モデル 9 (出典)The wisdom hierarchy:representations of the DIKW hierarchy(2006年) https://unigis.at/schnuppermodul/modul_gisintro/html/lektion5/media/rowley-2007.pdf 知恵 知識 情報 生データ Data Information Knowledge Wisdom 価値 未整理 整理・集計 分析・体系化 活用・判断
  • 10. Copyright © Japan Third Party Co., Ltd. All Rights Reserved. 1-2.データ活用モデル 10 (出典)The wisdom hierarchy:representations of the DIKW hierarchy(2006年) https://unigis.at/schnuppermodul/modul_gisintro/html/lektion5/media/rowley-2007.pdf 知恵 知識 情報 生データ 価値 未整理 整理・集計 分析・体系化 活用・判断 Amazon S3
  • 11. Copyright © Japan Third Party Co., Ltd. All Rights Reserved. 1-3.データ活用時代に求められる3つのスキル 11 ビジネス課題を整理して 解決するスキル 統計学や機械学習などの 情報科学を実践してデータを 価値あるものにするスキル データを蓄積し、意味のあ る形にするために実装した り運用するスキル (出典) データサイエンティスト協会「データサイエンティスト協会、データサイエンティストの ミッション、スキルセット、定義、スキルレベルを発表」(2014年) http://www.datascientist.or.jp/news/2014/pdf/1210.pdf エンジニアリングスキル データサイエンススキル ビジネススキル
  • 12. Copyright © Japan Third Party Co., Ltd. All Rights Reserved. 1-4.エンジニアリングスキル 12 ビジネス課題を整理して 解決するスキル 統計学や機械学習などの 情報科学を実践してデータを 価値あるものにするスキル データを蓄積し、意味のあ る形にするために実装した り運用するスキル エンジニアリングスキル データサイエンススキル ビジネススキル (出典) データサイエンティスト協会「データサイエンティスト協会、データサイエンティストの ミッション、スキルセット、定義、スキルレベルを発表」(2014年) http://www.datascientist.or.jp/news/2014/pdf/1210.pdf
  • 13. Copyright © Japan Third Party Co., Ltd. All Rights Reserved. 1-4.エンジニアリングスキル ~データを蓄積する技術~ 13 知恵 知識 情報 生データ 価値 未整理 整理・集計 分析・体系化 活用・判断 Amazon S3(出典)The wisdom hierarchy:representations of the DIKW hierarchy(2006年) https://unigis.at/schnuppermodul/modul_gisintro/html/lektion5/media/rowley-2007.pdf
  • 14. Copyright © Japan Third Party Co., Ltd. All Rights Reserved. 1-5.データサイエンススキル 14 ビジネス課題を整理して 解決するスキル 統計学や機械学習などの 情報科学を実践してデータを 価値あるものにするスキル データを蓄積し、意味のあ る形にするために実装した り運用するスキル エンジニアリングスキル データサイエンススキル ビジネススキル (出典) データサイエンティスト協会「データサイエンティスト協会、データサイエンティストの ミッション、スキルセット、定義、スキルレベルを発表」(2014年) http://www.datascientist.or.jp/news/2014/pdf/1210.pdf
  • 15. Copyright © Japan Third Party Co., Ltd. All Rights Reserved. 1-5.データサイエンススキル 15 (出典)The wisdom hierarchy:representations of the DIKW hierarchy(2006年) https://unigis.at/schnuppermodul/modul_gisintro/html/lektion5/media/rowley-2007.pdf 知恵 知識 情報 生データ 価値 未整理 整理・集計 分析・体系化 活用・判断
  • 16. Copyright © Japan Third Party Co., Ltd. All Rights Reserved. AI 1-5.データサイエンススキル 16 データ活用度 (データ整理) データアナリシス ・回帰/時系列分析 ・クラスタ分析 ・アソシエーション分析 ディープラーニング機械学習 ・回帰/時系列分析 ・クラスタ分析 ・相関分析 ・自然言語理解 ・ランダムフォレスト ・ナイーブベイズ データ可視化 データ整理 データ集計 従来の データ分析 数値データのみ 多様なデータ (数値、Text、 画像、動画、etc) ・販売/売上予測 ・マッチング販売 ・陳列の適正化 (ビジネス例) ・医療画像診断 ・自動運転 ・AIスピーカー BA R 自動データアナリ シス(擬人化) ・販売予測 ・故障予測 ・陳列の適正化 ・画像分類 ・物体検出 ・音声認識 ・チャットボット ・コールセンタ支援 ・与信支援 (ビジネス例) (ビジネス例) (ビジネス例) IoT
  • 17. Copyright © Japan Third Party Co., Ltd. All Rights Reserved. 2. Hadoop の進化
  • 18. Copyright © Japan Third Party Co., Ltd. All Rights Reserved. 2-1.Hadoop おさらい 18 (出典)http://hortonworks.com/wp-content/uploads/2013/10/hadoopstack.png 使いやすさのニーズ バッチ処理 高速処理のニーズ インタラクティブクエリ処理 リアルタイムのニーズ ストリームデータ処理
  • 19. Copyright © Japan Third Party Co., Ltd. All Rights Reserved. 2-2.Hadoop比較 19 Hadoop Apache Hadoop準拠 Apache Hadoop準拠 自社開発 データ格納 HDFS HDFS MapR-FS 拡張性 OSSと密に連携 OSSと密に連携 OSSと 連携可能 Apache Hadoop のコミッタの 約30%がHortonworks社メンバ Apache Hadoop のコミッタの 約15%がCloudera社メンバ
  • 20. Copyright © Japan Third Party Co., Ltd. All Rights Reserved. 2-3.Hortonworks が提供するプラットフォーム 20 ~リアルタイム処理に注力~ • Hortonworks Data Platform (HDP) 「Apache Hdoop」や「Apache Spark」等の Hadoop エコシス テムをベースにしたデータプラットフォーム • Hortonworks DataFlow (HDF) ストリーミングを実現する「Apache NiFi」や「Apache Kafka」、 「Apache Storm」をベースにしたリアルタイムデータ処理ソフ トウェア
  • 21. Copyright © Japan Third Party Co., Ltd. All Rights Reserved. 2-3.Hortonworks が提供するプラットフォーム 21 ~リアルタイム処理に注力~ • Hortonworks Data Platform (HDP) 「Apache Hdoop」や「Apache Spark」等の Hadoop エコシス テムをベースにしたデータプラットフォーム • Hortonworks DataFlow (HDF) ストリーミングを実現する「Apache NiFi」や「Apache Kafka」、 「Apache Storm」をベースにしたリアルタイムデータ処理ソフ トウェア
  • 22. Copyright © Japan Third Party Co., Ltd. All Rights Reserved. 22 2-4.Hortonworks Data Platform (HDP)
  • 23. Copyright © Japan Third Party Co., Ltd. All Rights Reserved. 23 2-5.HDPで選択できるHadoopエコシステム
  • 24. Copyright © Japan Third Party Co., Ltd. All Rights Reserved. 24 2-6.HDPでのHadoop
  • 25. Copyright © Japan Third Party Co., Ltd. All Rights Reserved. 25  Apache Hadoop に準拠しており最新機能を早く使える  エコシステムを自由に組み合わせることができる  Microsoft Azure HDInsight を利用することでクラウ ド環境で HDP を簡単に使うことができる 2-7.Hortonworks Data Platform の特長
  • 26. Copyright © Japan Third Party Co., Ltd. All Rights Reserved. 2-8.Hortonworks が提供するプラットフォーム 26 ~リアルタイム処理に注力~ • Hortonworks Data Platform (HDP) 「Apache Hdoop」や「Apache Spark」等の Hadoop エコシス テムをベースにしたデータプラットフォーム • Hortonworks DataFlow (HDF) ストリーミングを実現する「Apache NiFi」や「Apache Kafka」、 「Apache Storm」をベースにしたリアルタイムデータ処理ソフ トウェア
  • 27. Copyright © Japan Third Party Co., Ltd. All Rights Reserved. 27 2-9.Hortonworks DataFlow 簡単にデータフロー を定義 簡単にデータの収集を実現 簡単にリアルタイム処理を実現 データから 新たな価値
  • 28. Copyright © Japan Third Party Co., Ltd. All Rights Reserved. 2-10.Hortonworks DataFlow の特長 28 リアルタイム処理を実現 ・常時連続実行 ・データフロー管理 ・処理時間 ミリ秒~秒
  • 29. Copyright © Japan Third Party Co., Ltd. All Rights Reserved. 3. 事例紹介
  • 30. Copyright © Japan Third Party Co., Ltd. All Rights Reserved. 3-1.日産自動車株式会社様 30  課題 ✓ 走行データや品質データなどの長期保管 ✓ サイロ化しているデータの統合 ✓ 統一プラットフォームの必要性  活用 ✓ HDFS でデータレイクを実現 ✓ Kafka で IoT データの収集を実現 ✓ Spark で高速処理を実現
  • 31. Copyright © Japan Third Party Co., Ltd. All Rights Reserved. 3-2.三菱ふそうトラック・バス株式会社様 31  課題 ✓ データ主導のビジネス変革 ✓ 情報提供サービスの提供  活用 ✓ HDFS でデータレイクを実現 ✓ Storm で リアルタイム分析を実現 ✓ HBASE でデータ格納/参照の高速処理を実現 ✓ Spark で高速処理を実現
  • 32. Copyright © Japan Third Party Co., Ltd. All Rights Reserved. 3-3. Hilton Hotels & Resorts 様 32  課題 ✓ 予約情報やプロファイルデータ のサイロ化 ✓ 一貫性のないデータ管理 ✓ 顧客視点での分析が不十分  活用 ✓ HDFS でデータレイクを実現 ✓ NiFi でフローデータ処理を実現 ✓ Kafka で データの収集を実現 ✓ Storm で リアルタイム処理を実現
  • 33. Copyright © Japan Third Party Co., Ltd. All Rights Reserved. 3-4.Hadoopを取り巻く環境 33  成熟してきたデータ活用  IoT・5Gなどの関連技術の発展  パブリッククラウドやオンプレミスなど選択肢  Sparkをはじめとした新しい処理エンジンの登場 Hadoopが「難しい」から「誰でも簡単に使える」になりつつある。 再燃するHadoopブームに向け学びが必要
  • 34. Copyright © Japan Third Party Co., Ltd. All Rights Reserved. ◆主要トレーニングメニュー◆ 34 ① HDP Operations: Administration Foundations ② HDP Administration II ③ HDF NiFi Flow Management 詳細は、 https://jp.hortonworks.com/services/training/ をご参照ください。
  • 35. Copyright © Japan Third Party Co., Ltd. All Rights Reserved. ① HDP Operations: Administration Foundations 35 【概要】 Apache Hadoopクラスタを管理する必要のある管理者向けのコース 講義と実機による演習を通じ、Hadoopのインストール / 構成 /クラスター運用タスクについて理 解することができます。 Hadoopとビッグデータの連携や、実習を通じてHadoop開発のマルチノードクラスタにおけるラ イフサイクルを理解することができます。 【言語】 講義 :日本語 テキスト:英語 【詳細情報】 ・https://jp.hortonworks.com/services/training/class/hdp-operations-administration-foundation/ (英語情報) ・https://edu.jtp.co.jp/archives/course_cpt/1568 (日本語情報)
  • 36. Copyright © Japan Third Party Co., Ltd. All Rights Reserved. ② HDP Administration II 36 【概要】 このトレーニングコースは、Apache Hadoop2.xクラスタを管理する必要のある管理者向けの コースです。 講義と実機による演習を通じ、Hadoop2.xのアップグレード / 構成 / アプリケーション管理 / そ の他の基本タスクについて理解することができます。 Hadoopとビッグデータの連携や、実習を通じてHadoop開発のマルチノードクラスタにおけるラ イフサイクルを理解することができます。 【言語】 講義 :日本語 テキスト:英語 【詳細情報】 ・https://jp.hortonworks.com/services/training/class/hdp-operations-hadoop-administration-2/ (英語情報) ・https://edu.jtp.co.jp/archives/course_cpt/1566 (日本語情報)
  • 37. Copyright © Japan Third Party Co., Ltd. All Rights Reserved. ③ HDF NiFi Flow Management 37 【概要】 このトレーニングコースは、システム間のデータの流れを自動化できることが目的です。 講義と実機による演習を通じ、NiFiの紹介 / NiFiのインストールと設定 / NiFiユーザーインター フェイスの詳細説明 / それぞれのコンポーネントと要素を理解することができます。また、HDP と HDF の違いにも理解できます。 【言語】 講義 :英語 (Virtual) テキスト:英語 【詳細情報】 ・ https://jp.hortonworks.com/services/training/class/hdp-operations-hortonworks-data-flow/ (英語情報)
  • 38. Copyright © Japan Third Party Co., Ltd. All Rights Reserved. (再掲) Hadoopを取り巻く環境 38  成熟してきたデータ活用  IoT・5Gなどの関連技術の発展  パブリッククラウドやオンプレミスなど選択肢  Sparkをはじめとした新しい処理エンジンの登場 Hadoopが「難しい」から「誰でも簡単に使える」になりつつある。 再燃するHadoopブームに向け学びが必要
  • 40. Copyright © Japan Third Party Co., Ltd. All Rights Reserved. アンケートのご協力のお願い
  • 41. Copyright © Japan Third Party Co., Ltd. All Rights Reserved. アンケートのご協力のお願い