Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
SY
Uploaded by
Shinichi YAMASHITA
2,187 views
Hadoop - OSC2013 .Enterprise
12/13に開催されたOSC 2013 .Enterpriseで発表したHadoopに関するスライドです。
Read more
3
Save
Share
Embed
Embed presentation
Download
Downloaded 23 times
1
/ 27
2
/ 27
3
/ 27
4
/ 27
5
/ 27
6
/ 27
7
/ 27
8
/ 27
9
/ 27
10
/ 27
11
/ 27
12
/ 27
13
/ 27
14
/ 27
15
/ 27
16
/ 27
17
/ 27
18
/ 27
19
/ 27
20
/ 27
21
/ 27
22
/ 27
23
/ 27
24
/ 27
25
/ 27
26
/ 27
27
/ 27
More Related Content
PPTX
Gis tools for hadoopを用いたビッグデータ処理の検証
by
Kazutaka ishizaki
PPTX
Hadoopによる空間ビッグデータ処理の試み
by
Kazutaka ishizaki
PDF
OSC2014 Tokyo/Spring Hadoop
by
Shinichi YAMASHITA
PPTX
Hadoopことはじめ
by
Katsunori Kanda
PPTX
Drupalを活用した Linked Open Dataの実践的試行環境の構築
by
Takanori Hayashi
PDF
2014-07-26 Exploration into HDInsight Tuning Maniax 2014 Hadoopコース参戦記
by
Yoshiyuki Nakamura
PDF
Reading drill
by
Kai Sasaki
PDF
Hadoop Source Code Reading #17
by
Shingo Furuyama
Gis tools for hadoopを用いたビッグデータ処理の検証
by
Kazutaka ishizaki
Hadoopによる空間ビッグデータ処理の試み
by
Kazutaka ishizaki
OSC2014 Tokyo/Spring Hadoop
by
Shinichi YAMASHITA
Hadoopことはじめ
by
Katsunori Kanda
Drupalを活用した Linked Open Dataの実践的試行環境の構築
by
Takanori Hayashi
2014-07-26 Exploration into HDInsight Tuning Maniax 2014 Hadoopコース参戦記
by
Yoshiyuki Nakamura
Reading drill
by
Kai Sasaki
Hadoop Source Code Reading #17
by
Shingo Furuyama
Viewers also liked
PDF
OSC2012 Tokyo/Spring - Hadoop入門
by
Shinichi YAMASHITA
PDF
Medias sociaux & pme
by
Hugo Vicard
PPTX
Entendiendo el Business Model Canvas
by
Guillermo Poveda
PPT
Phishing
by
guest4b5c234
PDF
OSC2012 OSC.DB Hadoop
by
Shinichi YAMASHITA
PDF
Hadoop - OSC2010 Tokyo/Spring
by
Shinichi YAMASHITA
PDF
SourceReading 20101020
by
Shinichi YAMASHITA
PDF
OSC2011 Tokyo/Spring Hadoop入門
by
Shinichi YAMASHITA
PPT
Competitic - visibilité sur le web - numerique en entreprise
by
COMPETITIC
PPTX
Atelier Numérique "Gestion Relation clients par le mail - 2016"
by
Kate De Gourdon
PPT
Halloween super affiliate scam
by
Aira Sensei
PPT
Obligations site internet
by
COMPETITIC
PDF
I Modelli Mentali
by
Emanuele Tattolo
PDF
Padronanza personale
by
Emanuele Tattolo
PPT
2011 06 23 aspects juridiques ecommerce by competitic
by
COMPETITIC
PPT
Day I Was Born
by
Anthony Nunez
PPT
Halloween super affiliate bonus
by
Aira Sensei
OSC2012 Tokyo/Spring - Hadoop入門
by
Shinichi YAMASHITA
Medias sociaux & pme
by
Hugo Vicard
Entendiendo el Business Model Canvas
by
Guillermo Poveda
Phishing
by
guest4b5c234
OSC2012 OSC.DB Hadoop
by
Shinichi YAMASHITA
Hadoop - OSC2010 Tokyo/Spring
by
Shinichi YAMASHITA
SourceReading 20101020
by
Shinichi YAMASHITA
OSC2011 Tokyo/Spring Hadoop入門
by
Shinichi YAMASHITA
Competitic - visibilité sur le web - numerique en entreprise
by
COMPETITIC
Atelier Numérique "Gestion Relation clients par le mail - 2016"
by
Kate De Gourdon
Halloween super affiliate scam
by
Aira Sensei
Obligations site internet
by
COMPETITIC
I Modelli Mentali
by
Emanuele Tattolo
Padronanza personale
by
Emanuele Tattolo
2011 06 23 aspects juridiques ecommerce by competitic
by
COMPETITIC
Day I Was Born
by
Anthony Nunez
Halloween super affiliate bonus
by
Aira Sensei
Similar to Hadoop - OSC2013 .Enterprise
PDF
Hadoopの概念と基本的知識
by
Ken SASAKI
PDF
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)
by
NTT DATA OSS Professional Services
PDF
Hadoopとは
by
Hirokazu Yatsunami
PDF
Apache Hadoop & Hive 入門 (マーケティングデータ分析基盤技術勉強会)
by
Takeshi Mikami
PDF
Hadoop ecosystem NTTDATA osc15tk
by
NTT DATA OSS Professional Services
PDF
分散処理基盤Apache Hadoop入門とHadoopエコシステムの最新技術動向 (オープンソースカンファレンス 2015 Tokyo/Spring 講...
by
NTT DATA OSS Professional Services
PDF
40分でわかるHadoop徹底入門 (Cloudera World Tokyo 2014 講演資料)
by
hamaken
PDF
Apache Hadoop の現在と将来(Hadoop / Spark Conference Japan 2016 キーノート講演資料)
by
Hadoop / Spark Conference Japan
PDF
【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~
by
Developers Summit
PPT
Hadoop ~Yahoo! JAPANの活用について~
by
Yahoo!デベロッパーネットワーク
PPT
Hadoop~Yahoo! JAPANの活用について~
by
Yahoo!デベロッパーネットワーク
PDF
第1回Hadoop関西勉強会参加レポート
by
You&I
PPTX
A 2-3ゾウ使いへの第一歩 hadoop on azure 編
by
GoAzure
PPTX
ゾウ使いへの第一歩
by
Fumito Ito
PPT
Hadoop~Yahoo!Japanの活用について
by
kaminashi
PDF
分散処理基盤Apache Hadoopの現状と、NTTデータのHadoopに対する取り組み
by
NTT DATA OSS Professional Services
PDF
Hadoop Conference Japan 2013 Winter オープニングスライド
by
hamaken
PDF
Hadoop Conference Japan_2016 セッション「顧客事例から学んだ、 エンタープライズでの "マジな"Hadoop導入の勘所」
by
オラクルエンジニア通信
PPT
Hadoopの紹介
by
bigt23
ODP
Hadoop for programmer
by
Sho Shimauchi
Hadoopの概念と基本的知識
by
Ken SASAKI
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)
by
NTT DATA OSS Professional Services
Hadoopとは
by
Hirokazu Yatsunami
Apache Hadoop & Hive 入門 (マーケティングデータ分析基盤技術勉強会)
by
Takeshi Mikami
Hadoop ecosystem NTTDATA osc15tk
by
NTT DATA OSS Professional Services
分散処理基盤Apache Hadoop入門とHadoopエコシステムの最新技術動向 (オープンソースカンファレンス 2015 Tokyo/Spring 講...
by
NTT DATA OSS Professional Services
40分でわかるHadoop徹底入門 (Cloudera World Tokyo 2014 講演資料)
by
hamaken
Apache Hadoop の現在と将来(Hadoop / Spark Conference Japan 2016 キーノート講演資料)
by
Hadoop / Spark Conference Japan
【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~
by
Developers Summit
Hadoop ~Yahoo! JAPANの活用について~
by
Yahoo!デベロッパーネットワーク
Hadoop~Yahoo! JAPANの活用について~
by
Yahoo!デベロッパーネットワーク
第1回Hadoop関西勉強会参加レポート
by
You&I
A 2-3ゾウ使いへの第一歩 hadoop on azure 編
by
GoAzure
ゾウ使いへの第一歩
by
Fumito Ito
Hadoop~Yahoo!Japanの活用について
by
kaminashi
分散処理基盤Apache Hadoopの現状と、NTTデータのHadoopに対する取り組み
by
NTT DATA OSS Professional Services
Hadoop Conference Japan 2013 Winter オープニングスライド
by
hamaken
Hadoop Conference Japan_2016 セッション「顧客事例から学んだ、 エンタープライズでの "マジな"Hadoop導入の勘所」
by
オラクルエンジニア通信
Hadoopの紹介
by
bigt23
Hadoop for programmer
by
Sho Shimauchi
Hadoop - OSC2013 .Enterprise
1.
Apache Hadoopの 現状、これから Hadoopユーザー会 山下 真一
2.
自己紹介 • 山下 真一 (@_sinchii_) • 日々進化するHadoopと格闘中 • Hadoop Advent
Calendar やります : 12/21 予定 • http://qiita.com/advent-calendar/2013/hadoop • 12/1 から開催中! OSC .Enterprise 2013 2
3.
Hadoopユーザー会 • Hadoopユーザーの集い場です! • • http://hugjp.org/index.php 不定期ですが、イベントも開催しています! • • • ソースコードリーディング : 次回は12/20
(金) Advent Calendar などなど 年一回ユーザーカンファレンスも開催しています! • 前回は、今年1月@東京ビッグサイト 次回は来年? OSC .Enterprise 2013 3
4.
本日の発表内容 • Hadoopのおさらい • Hadoopの歩み • Hadoop最新動向 • Hadoopのこれから OSC .Enterprise 2013 4
5.
おさらい : Hadoopとは 数十分~数日のバッチ処理を 数分~短時間で処理 処理異常時は再試行 Google
MapReduce 論文 (2004) MapReduceフレームワーク Google File System 論文 (2003) HDFS分散ファイルシステム データは複数の複製を保持 OS / Java 色々なデータを分散して保存 容易に入手できるコモディティな サーバを利用 主な利用用途 集計 抽出 OSC .Enterprise 2013 加工 分析 5
6.
MapReduceの仕組み スコア 一覧 Shuffle (同じKeyでデータを集約) Map <A, 10> <B, 20> <C,
15> <A, {10,25} > <C, {10,5,15} > Reduce Map スコアの抽出 <A, 25> <C, 10> <D, 10> <B, 10> <C, 5> <A, 35 > <C, 30 > Reduce <D, 5> Map 何らかの処理 <B, 30 > <D, 15 > <B, {20,10} > <D, {5,10} > ・<Key, Value>の形でデータを管理 ・MapやReduceが分散処理の対象 OSC .Enterprise 2013 6
7.
Hadoopの仕組み タスク ジョブ情報 TaskTracker(s) M M M タスク分割 R
R R JobTracker JobClient クライ アント データローカリティを 意識した割り当て ファイルをブロックに分割 配置を指示 DFSClient 入出力データは HDFSと連携 マスター サーバ M ・・・ R ・・・ ・・・ M ・・・ NameNode ・・・ ・・・ ファイル ラックを意識した ブロック配置を実施 OSC .Enterprise 2013 DataNode(s) 7
8.
本日の発表内容 • Hadoopのおさらい • Hadoopの歩み • Hadoop最新動向 • Hadoopのこれから OSC .Enterprise 2013 8
9.
Hadoopのヒストリー The Google File
System 論文の公開 MapReduce 論文の公開 EMR プロトタイプ 作成 2003 2004 2005 HDP CDH 2006 0.20 リリース 1.0 リリース 2009 2011 API Sqoop Hive Flume OSC .Enterprise 2013 2013 YARN Pig HBase 2系安定版 リリース HA NFS Impala Oozie Ambari Spark 9
10.
Hadoopエコシステム Hive (SQL style) Pig (DSL) Mahout (機械学習) HBase (カラム指向型ストア) Flume (データ投入) MapReduceフレームワーク Sqoop (DB連携) HDFS分散ファイルシステム Oozie (低レイテインシ) Spark (インメモリ) Ambari (ジョブフロー) Impala (クラスタ管理) ZooKeeper (分散ロック) OSC .Enterprise
2013 10
11.
本日の発表内容 • Hadoopのおさらい • Hadoopの歩み • Hadoop最新動向 • Hadoopのこれから OSC .Enterprise 2013 11
12.
YARN : Yet
Another Resource Negotiator • Hadoop 1.0 系 MapReduce基盤の問題 • JobTrackerへの負荷集中 • 多数のリクエストを処理するためネックとなりやすい MapReduceジョブ制御 (タスクアサイン) • TaskTracker管理 (ハートビート) TaskTrackerでリソースを予約して動作 • スロット数は固定して利用するためリソースを十分活用でき ない Mapスロット Reduceスロット OSC .Enterprise 2013 12
13.
YARN : Yet
Another Resource Negotiator • JobTrackerのリソース管理とジョブ管理を分離 • ResourceManager : リソース管理 • • ApplicationMaster : アプリケーション • • • スレーブノード(NodeManager)管理 MapReduceジョブは、ApplicationMasterが制御 処理はコンテナ(Container)が実行 NodeManager : スレーブノード • リソース使用状況(CPU・メモリ)を確認 OSC .Enterprise 2013 13
14.
YARNを構成するノード MapReduceジョブ管理 タスク割り当て Map(Reduce)タスク Application Master Container Node Manager AM割り当て&管理 Node Manager Container Resource Manager Node Manager ハートビート CPU・メモリ利用状況 Node Manager JobHistory Server (ジョブ履歴) OSC .Enterprise 2013 14
15.
YARNの特徴 • スレーブノードのリソースを十分に利用する仕組み • MapReduce APIの互換性 • • Hadoop 1.0系のMapReduceジョブも実行可能 様々なApplicationMasterが動作可能 • MapReduceジョブ以外のアプリケーションも実行可能 OSC
.Enterprise 2013 15
16.
YARN上で動作するアプリケーション • MapReduce • Apache Spark :
インメモリ処理エンジン • Apache Storm : ストリーミング処理 • Apache Giraph : グラフ処理 • Apache Tez : Hive/Pig実行エンジン • HOYA (Apache HBase) : カラム指向型ストア • Impala : 低レイテンシ処理 などなど OSC .Enterprise 2013 16
17.
YARNもstableとなったものの... • 2013年12月12日時点では...あと一歩な印象 • YARN HA の実装 • • • ResourceManager ApplicationMaster スケジューラ • • • CapacityScheduler FairScheduler 長時間動作するApplicationMaster対応 OSC
.Enterprise 2013 17
18.
HDFS 2.0 • NameNode HA • HDFS
Snapshot • HDFS Cache • NFS • (HDFS Federation) OSC .Enterprise 2013 18
19.
NameNode HA • • • ホットスタンバイ構成 ZooKeeperを利用して死活監視 QJMによりトランザクションログ(edits)管理 ZooKeeper ロック情報 ZKFC NameNode (active) ロック監視 fsimage トランザクション情報 JournalNode ロック消滅時に フェールオーバー実施 JournalNode OSC .Enterprise
2013 ZKFC NameNode (standby) edits JournalNode 19
20.
HDFS Snapshot • ユーザ単位でのスナップショット 管理者によって スナップショット可能な ディレクトリを設定 /user hoge file1 65535世代 保存可能 fuga dir1 file2 file3 file5 file4 Read-Only OSC .Enterprise
2013 20
21.
HDFS Snapshot • スナップショットのコマンド • • 削除 :
hdfs dfs -deleteSnapshot • リネーム : hdfs dfs -renameSnapshot • • 作成 : hdfs dfs -createSnapshot 比較 : hdfs snapshotDiff スナップショットの確認 • hdfs dfs -ls <対象ディレクトリ>/.snapshot/ OSC .Enterprise 2013 21
22.
その他 • Apache Pig :
0.12.0 • • AvroStorageをサポート • • ASSERT 文、IN CASE文、 (HCatalogによるHiveメタ情報の連携) Apache Hive : 0.12.0 • • • Date型対応 Parallel ORDER BY クエリ最適化 OSC .Enterprise 2013 22
23.
その他 • Java 7 対応 • Windows
上での Hadoop環境 • ログ周りの改善 • • • auditログ メッセージレベルの見直し 無駄なstacktrace出力の抑制 OSC .Enterprise 2013 23
24.
本日の発表内容 • Hadoopのおさらい • Hadoopの歩み • Hadoop最新動向 • Hadoopのこれから OSC .Enterprise 2013 24
25.
Hadoop Trunk状況 • Hadoop 2系(2.2がcurrent) • 2.3 • • • 2.4 • • • • • バグフィックス? 2.2.1
を2.3として扱うかも? YARN HA (RM Fail Over via ZKFC) ? Application History Server Long-running applications HDFS Trace ? HDFS Symlink ? ヘテロなストレージ ? Hadoop 1系 … 果たして今後リリースはあるのか? OSC .Enterprise 2013 25
26.
Hadoopエコシステムの拡大 • Apache Sentry • • Apache Tez • • YARN上でPig
/ Hive をより適切な実行計画での動作 Stinger • • ロールベースのHadoopクラスタ認証 Hiveのクエリを100倍高速にするとか... Openstackとの連携 • Savannaプロジェクト OSC .Enterprise 2013 26
27.
まとめ • Hadoop 2系 • • • HDFS :
必要な仕組みは一通りそろった YARN : まだまだ発展途上 エコシステムの膨張 • • 次々と新しいものは出てくる印象 これまで利用してきたもの(Hive/Pig ...)もより充実 • 従来の仕組み(HDFS+MR)はほぼ完成 • HDFSを土台とした新たな仕組みに期待! OSC .Enterprise 2013 27
Download