SlideShare a Scribd company logo
Submit Search
Upload
Login
Signup
Apache Hadoopの現在と未来
Report
Yahoo!デベロッパーネットワーク
Follow
Public Relations
Mar. 15, 2019
•
0 likes
•
3,825 views
1
of
20
Apache Hadoopの現在と未来
Mar. 15, 2019
•
0 likes
•
3,825 views
Download Now
Download to read offline
Report
Technology
2019年3月14日に開催された Hadoop / Spark Conference Japan 2019 で発表した資料です。
Yahoo!デベロッパーネットワーク
Follow
Public Relations
Recommended
データサイズ2ペタ ソネット・メディア・ネットワークスでのImpala活用とHadoop運用
Yoshikazu Suganuma
1.6K views
•
22 slides
HDFSのスケーラビリティの限界を突破するためのさまざまな取り組み | Hadoop / Spark Conference Japan 2019 #hc...
Yahoo!デベロッパーネットワーク
3.3K views
•
49 slides
Apache Hadoop HDFSの最新機能の紹介(2018)#dbts2018
Yahoo!デベロッパーネットワーク
3.1K views
•
36 slides
スキーマレスカラムナフォーマット「Yosegi」で実現する スキーマの柔軟性と処理性能を両立したログ収集システム / Hadoop / Spark Con...
Yahoo!デベロッパーネットワーク
8K views
•
66 slides
Hadoopエコシステムのデータストア振り返り
NTT DATA OSS Professional Services
4.4K views
•
43 slides
Distributed data stores in Hadoop ecosystem
NTT DATA OSS Professional Services
5.2K views
•
52 slides
More Related Content
What's hot
Hadoop loves H2
Tadashi Satoh
4.6K views
•
19 slides
大規模分散システムの現在 -- GFS, MapReduce, BigTableはどう変化したか?
maruyama097
7K views
•
339 slides
Amazon Redshift ベンチマーク Hadoop + Hiveと比較
FlyData Inc.
13.3K views
•
13 slides
Hadoop Compatible File Systems 2019 (db tech showcase 2019 Tokyo講演資料、2019/09/25)
NTT DATA Technology & Innovation
1.5K views
•
61 slides
Hadoopエコシステムの最新動向とNTTデータの取り組み (OSC 2016 Tokyo/Spring 講演資料)
NTT DATA OSS Professional Services
6K views
•
47 slides
Hadoop 2.6の最新機能(Cloudera World Tokyo 2014 LT講演資料)
NTT DATA OSS Professional Services
9.2K views
•
13 slides
What's hot
(20)
Hadoop loves H2
Tadashi Satoh
•
4.6K views
大規模分散システムの現在 -- GFS, MapReduce, BigTableはどう変化したか?
maruyama097
•
7K views
Amazon Redshift ベンチマーク Hadoop + Hiveと比較
FlyData Inc.
•
13.3K views
Hadoop Compatible File Systems 2019 (db tech showcase 2019 Tokyo講演資料、2019/09/25)
NTT DATA Technology & Innovation
•
1.5K views
Hadoopエコシステムの最新動向とNTTデータの取り組み (OSC 2016 Tokyo/Spring 講演資料)
NTT DATA OSS Professional Services
•
6K views
Hadoop 2.6の最新機能(Cloudera World Tokyo 2014 LT講演資料)
NTT DATA OSS Professional Services
•
9.2K views
HDFS Router-based federation
NTT DATA OSS Professional Services
•
1.7K views
Hadoop概要説明
Satoshi Noto
•
31.8K views
Hadoopデータプラットフォーム #cwt2013
Cloudera Japan
•
4.1K views
Hadoopことはじめ
均 津田
•
1.6K views
MapR と Vertica エンジニアが語る、なぜその組み合わせが最高なのか? - db tech showcase 大阪 2014 2014/06/19
MapR Technologies Japan
•
5.1K views
Apache Sparkのご紹介 (後半:技術トピック)
NTT DATA OSS Professional Services
•
26.1K views
Apache Hadoop の現在と将来(Hadoop / Spark Conference Japan 2016 キーノート講演資料)
Hadoop / Spark Conference Japan
•
7.2K views
HadoopとRDBMSをシームレスに連携させるSmart SQL Processing (Hadoop Conference Japan 2014)
Hadoop / Spark Conference Japan
•
2.7K views
Hadoopによる大規模分散データ処理
Yoji Kiyota
•
3.3K views
PostgreSQL10を導入!大規模データ分析事例からみるDWHとしてのPostgreSQL活用のポイント
NTT DATA OSS Professional Services
•
7.4K views
並列分散処理基盤Hadoopの紹介と、開発者が語るHadoopの使いどころ (Silicon Valley x 日本 / Tech x Business ...
NTT DATA OSS Professional Services
•
3.4K views
HDFS basics from API perspective
NTT DATA OSS Professional Services
•
2.9K views
分散処理基盤Apache Hadoopの現状と、NTTデータのHadoopに対する取り組み
NTT DATA OSS Professional Services
•
3.2K views
Hadoop2.6の最新機能+
NTT DATA OSS Professional Services
•
7.9K views
Similar to Apache Hadoopの現在と未来
Beginner must-see! A future that can be opened by learning Hadoop
DataWorks Summit
488 views
•
41 slides
Apache Big Data Miami 2017 - Hadoop Source Code Reading #23 #hadoopreading
Yahoo!デベロッパーネットワーク
602 views
•
39 slides
Hadoop-3.2.0の新機能の紹介とJava9+対応のコミュニティ動向
Yahoo!デベロッパーネットワーク
1.5K views
•
26 slides
Hadoop ~Yahoo! JAPANの活用について~
Yahoo!デベロッパーネットワーク
4.8K views
•
61 slides
Hadoop~Yahoo!Japanの活用について
kaminashi
1.1K views
•
46 slides
大規模HDFS & ErasureCoding#yjdsw3
Yahoo!デベロッパーネットワーク
834 views
•
28 slides
Similar to Apache Hadoopの現在と未来
(20)
Beginner must-see! A future that can be opened by learning Hadoop
DataWorks Summit
•
488 views
Apache Big Data Miami 2017 - Hadoop Source Code Reading #23 #hadoopreading
Yahoo!デベロッパーネットワーク
•
602 views
Hadoop-3.2.0の新機能の紹介とJava9+対応のコミュニティ動向
Yahoo!デベロッパーネットワーク
•
1.5K views
Hadoop ~Yahoo! JAPANの活用について~
Yahoo!デベロッパーネットワーク
•
4.8K views
Hadoop~Yahoo!Japanの活用について
kaminashi
•
1.1K views
大規模HDFS & ErasureCoding#yjdsw3
Yahoo!デベロッパーネットワーク
•
834 views
ヤフーにおけるHadoop Operations #tdtech
Yahoo!デベロッパーネットワーク
•
3.8K views
Yahoo! JAPANのデータ基盤とHadoop #dbts2016
Yahoo!デベロッパーネットワーク
•
2.8K views
Hadoop scr第7回 hw2011フィードバック
AdvancedTechNight
•
1.1K views
Participation report of data stax accelerate 2019
MKT-INTHEFOREST
•
157 views
Yifeng hadoop-present-public
Yifeng Jiang
•
871 views
マルチビッグデータの活用を支える DWHの作り方
Yahoo!デベロッパーネットワーク
•
1.9K views
MBAAで覚えるDBREの大事なおしごと
Insight Technology, Inc.
•
612 views
Apache Hadoop and YARN, current development status
NTT DATA OSS Professional Services
•
2.6K views
Apache Kafkaによるログ転送とパフォーマンスチューニング - Bonfire Backend #2 -
Yahoo!デベロッパーネットワーク
•
6.5K views
Yahoo! JAPAN MeetUp #8 (インフラ技術カンファレンス)セッション②
Yahoo!デベロッパーネットワーク
•
5.1K views
if-up 2019 | A2. クラウドにつながり始めたハードウェア
SORACOM,INC
•
1.1K views
Java11へのマイグレーションガイド ~Apache Hadoopの事例~
Yahoo!デベロッパーネットワーク
•
10.1K views
DLLAB Engineer Days:AIチームが履歴やリソース管理で疲弊してたので開発基盤作ってOSS化した話
Kamonohashi
•
3.2K views
YJTC18 A-1 大規模サーバの戦略
Yahoo!デベロッパーネットワーク
•
3.3K views
More from Yahoo!デベロッパーネットワーク
ゼロから始める転移学習
Yahoo!デベロッパーネットワーク
12.8K views
•
132 slides
継続的なモデルモニタリングを実現するKubernetes Operator
Yahoo!デベロッパーネットワーク
4.7K views
•
35 slides
ヤフーでは開発迅速性と品質のバランスをどう取ってるか
Yahoo!デベロッパーネットワーク
1.2K views
•
24 slides
オンプレML基盤on Kubernetes パネルディスカッション
Yahoo!デベロッパーネットワーク
1.9K views
•
18 slides
LakeTahoe
Yahoo!デベロッパーネットワーク
1.7K views
•
28 slides
オンプレML基盤on Kubernetes 〜Yahoo! JAPAN AIPF〜
Yahoo!デベロッパーネットワーク
1.6K views
•
35 slides
More from Yahoo!デベロッパーネットワーク
(20)
ゼロから始める転移学習
Yahoo!デベロッパーネットワーク
•
12.8K views
継続的なモデルモニタリングを実現するKubernetes Operator
Yahoo!デベロッパーネットワーク
•
4.7K views
ヤフーでは開発迅速性と品質のバランスをどう取ってるか
Yahoo!デベロッパーネットワーク
•
1.2K views
オンプレML基盤on Kubernetes パネルディスカッション
Yahoo!デベロッパーネットワーク
•
1.9K views
LakeTahoe
Yahoo!デベロッパーネットワーク
•
1.7K views
オンプレML基盤on Kubernetes 〜Yahoo! JAPAN AIPF〜
Yahoo!デベロッパーネットワーク
•
1.6K views
Persistent-memory-native Database High-availability Feature
Yahoo!デベロッパーネットワーク
•
5.8K views
データの価値を最大化させるためのデザイン~データビジュアライゼーションの方法~ #devsumi 17-E-2
Yahoo!デベロッパーネットワーク
•
7.6K views
eコマースと実店舗の相互利益を目指したデザイン #yjtc
Yahoo!デベロッパーネットワーク
•
2.2K views
ヤフーを支えるセキュリティ ~サイバー攻撃を防ぐエンジニアの仕事とは~ #yjtc
Yahoo!デベロッパーネットワーク
•
1.9K views
Yahoo! JAPANのIaaSを支えるKubernetesクラスタ、アップデート自動化への挑戦 #yjtc
Yahoo!デベロッパーネットワーク
•
2.2K views
ビッグデータから人々のムードを捉える #yjtc
Yahoo!デベロッパーネットワーク
•
1.8K views
サイエンス領域におけるMLOpsの取り組み #yjtc
Yahoo!デベロッパーネットワーク
•
2.1K views
ヤフーのAIプラットフォーム紹介 ~AIテックカンパニーを支えるデータ基盤~ #yjtc
Yahoo!デベロッパーネットワーク
•
2.1K views
Yahoo! JAPAN Tech Conference 2022 Day2 Keynote #yjtc
Yahoo!デベロッパーネットワーク
•
2.3K views
新技術を使った次世代の商品の見せ方 ~ヤフオク!のマルチビュー機能~ #yjtc
Yahoo!デベロッパーネットワーク
•
1.9K views
PC版Yahoo!メールリニューアル ~サービスのUI/UX統合と改善プロセス~ #yjtc
Yahoo!デベロッパーネットワーク
•
1.9K views
モブデザインによる多職種チームのコミュニケーション改善 #yjtc
Yahoo!デベロッパーネットワーク
•
2.2K views
「新しいおうち探し」のためのAIアシスト検索 #yjtc
Yahoo!デベロッパーネットワーク
•
2.1K views
ユーザーの地域を考慮した検索入力補助機能の改善の試み #yjtc
Yahoo!デベロッパーネットワーク
•
2K views
Recently uploaded
MLOps Course Slides_JP(配布用).pdf
Yuya Yamamoto
40 views
•
31 slides
CCoE実践者コミュニティ#1_CCoEが進めるセキュリティカイゼンの旅.pptx
Tomoaki Tada
55 views
•
20 slides
テスト自動化.pdf
ssuserf8ea02
25 views
•
26 slides
2023情報処理学会関西支部大会-G12.pdf
KoseiShimoda1
7 views
•
11 slides
拡散する画像生成.pdf
NTTDOCOMO-ServiceInnovation
44 views
•
38 slides
GraphQLはどんな時に使うか
Yutaka Tachibana
11 views
•
37 slides
Recently uploaded
(12)
MLOps Course Slides_JP(配布用).pdf
Yuya Yamamoto
•
40 views
CCoE実践者コミュニティ#1_CCoEが進めるセキュリティカイゼンの旅.pptx
Tomoaki Tada
•
55 views
テスト自動化.pdf
ssuserf8ea02
•
25 views
2023情報処理学会関西支部大会-G12.pdf
KoseiShimoda1
•
7 views
拡散する画像生成.pdf
NTTDOCOMO-ServiceInnovation
•
44 views
GraphQLはどんな時に使うか
Yutaka Tachibana
•
11 views
画像生成AIの問題点
iPride Co., Ltd.
•
10 views
CatBoost on GPU のひみつ
Takuji Tahara
•
528 views
松下研究室紹介_関西大学高槻キャンパスオープンキャンパス
Matsushita Laboratory
•
27 views
遠隔お酌IoTLT2309.pptx
Yoshiaki Ito
•
140 views
IGDA Japan SIG Audio #20-1 室内・野外でのマイク収録と整音.pdf
IGDA Japan SIG-Audio
•
113 views
20230921_IoTLT_vol103_kitazaki_v1.pdf
Ayachika Kitazaki
•
159 views
Apache Hadoopの現在と未来
1.
Copyright (C) 2019
Yahoo Japan Corporation. All Rights Reserved. 2019年3月14日 鯵坂 明 (日本Hadoopユーザ会、ヤフー株式会社) Apache Hadoopの 現在と未来
2.
Copyright (C) 2019
Yahoo Japan Corporation. All Rights Reserved.Copyright (C) 2019 Yahoo Japan Corporation. All Rights Reserved. 事前アンケート結果
3.
Copyright (C) 2019
Yahoo Japan Corporation. All Rights Reserved. 2系への移行は終わり3系の利用/検証が進む 4 3年前 YARNを利用している: 547人 YARNを利用していない: 298人 Hadoopを利用していない: 448人 現在 Hadoop 3系(CDH6, HDP3): 161人 Hadoop 2系(CDH5, HDP2など): 328人 Hadoopを利用していな い: 279人
4.
Copyright (C) 2019
Yahoo Japan Corporation. All Rights Reserved. 参加者ではオンプレミス優勢 5 Hadoopの利用環境 (複数回答あり) オンプレミス: 310人 AWS: 195人 Azure: 48人 GCP: 29人
5.
Copyright (C) 2019
Yahoo Japan Corporation. All Rights Reserved. クラスタ台数は10台までが多くを占める 6 44% 25% 10% 14% 7% 1台~10台 11台~50台 51台~100台 101台~1000台 1001台~
6.
Copyright (C) 2019
Yahoo Japan Corporation. All Rights Reserved. 扱うデータ量はさまざま 7 8% 9% 16% 17%18% 11% 13% 8% ~10GB 10GB ~ 100GB 100GB ~ 1TB 1TB ~ 10TB 10TB ~ 100TB 100TB ~ 1PB 1PB ~ 10PB 10PB ~
7.
Copyright (C) 2019
Yahoo Japan Corporation. All Rights Reserved. 利用しているミドルウェア (20人以上) 8 0 50 100 150 200 250 300 350 400 450 500 参考: 前回のアンケート結果
8.
Copyright (C) 2019
Yahoo Japan Corporation. All Rights Reserved.Copyright (C) 2019 Yahoo Japan Corporation. All Rights Reserved. Hadoopの現在と未来
9.
Copyright (C) 2019
Yahoo Japan Corporation. All Rights Reserved. 並列分散処理をとりまく状況の変化 10 • クラウドサービスでの利用が増加 • データ量/計算量の増加 • 機械学習/ディープラーニングの流行 • コンテナ技術の流行
10.
Copyright (C) 2019
Yahoo Japan Corporation. All Rights Reserved. クラウドストレージとの連携が進む 11 • Amazon S3 • OpenStack Swift • Azure Blob Storage • Azure Data Lake Storage • Alibaba Cloud Object Storage Service • Tencent Cloud Object Storage (対応中)
11.
Copyright (C) 2019
Yahoo Japan Corporation. All Rights Reserved. スケーラビリティの限界突破 12 • HDFS/YARN Router-based Federationでクラスタを束ねることで、 マスタの負荷を軽減 • オブジェクトストレージ機能の開発 (Ozone) • HDFS Erasure Codingによるディスク の節約
12.
Copyright (C) 2019
Yahoo Japan Corporation. All Rights Reserved. プロジェクト構成の変化 13 • Common • HDFS • MapReduce • YARN • Submarine • Ozone
13.
Copyright (C) 2019
Yahoo Japan Corporation. All Rights Reserved. プロジェクト構成の変化 14 • Common • HDFS • MapReduce • YARN • Submarine • Ozone
14.
Copyright (C) 2019
Yahoo Japan Corporation. All Rights Reserved. Hadoop Submarine 15 人を深い(deep)所に連れていく唯一の乗り物 写真:アフロ
15.
Copyright (C) 2019
Yahoo Japan Corporation. All Rights Reserved. Hadoop Submarine 16 YARNの最新機能をフル活用して、 TensorFlow, PyTorchなどをHadoop上で 分散実行させる • GPU isolation • Docker on YARN • Container-DNS support
16.
Copyright (C) 2019
Yahoo Japan Corporation. All Rights Reserved. サブプロジェクトの追加 17 • Common • HDFS • MapReduce • YARN • Submarine • Ozone
17.
Copyright (C) 2019
Yahoo Japan Corporation. All Rights Reserved. サブプロジェクトの追加 18 • Common • HDFS • MapReduce • YARN • Submarine • Ozone → Arpit氏が詳しく紹介
18.
Copyright (C) 2019
Yahoo Japan Corporation. All Rights Reserved. Hadoopの未来はどうなる? 19 • 機械学習/ディープラーニングにも対応 し、利用領域がさらに広がった今、これ 以上何を求める? • 個人的には、利用しやすさを高めたい • Kubernetesとできることは変わらない はずなのに、K8sが今流行っている理由 を考えよう
19.
Copyright (C) 2019
Yahoo Japan Corporation. All Rights Reserved. 数年後までの野望 20 • Java 11対応を完了させる • リリースサイクルの加速 • プロダクトのさらなる分割?
20.
Copyright (C) 2019
Yahoo Japan Corporation. All Rights Reserved. 最後に 21 並列分散処理を取り巻く状況の変化に追従しながら Hadoopは進化し続けてきた 今後も進化を続けるHadoopに是非ご期待ください これまでのContributionに感謝 & これからの Contributionも大歓迎 もっと便利なHadoopを目指して頑張りましょう