Submit Search
Upload
分散処理のすゝめ?
•
0 likes
•
719 views
Y
yoshito oe
Follow
A.J.A.社内勉強会第2回 (2016.07.07) の資料です。
Read less
Read more
Internet
Report
Share
Report
Share
1 of 18
Download now
Download to read offline
Recommended
Hdfsソースコードリーディング第2回
Hdfsソースコードリーディング第2回
shunsuke Mikami
Hadoop
Hadoop
Atsushi Shimura
Hdfsソースコードリーディング第一回
Hdfsソースコードリーディング第一回
shunsuke Mikami
Cassandra3.0
Cassandra3.0
Kazutaka Tomita
Hadoopとその周辺の紹介
Hadoopとその周辺の紹介
Shinya Okano
SASとHadoopとの連携
SASとHadoopとの連携
SAS Institute Japan
DBP-011_Apache Spark for Azure HDInsight ~新世代の Big Data 処理基盤~
DBP-011_Apache Spark for Azure HDInsight ~新世代の Big Data 処理基盤~
decode2016
米国の事例で学ぶCassandra
米国の事例で学ぶCassandra
Kazutaka Tomita
Recommended
Hdfsソースコードリーディング第2回
Hdfsソースコードリーディング第2回
shunsuke Mikami
Hadoop
Hadoop
Atsushi Shimura
Hdfsソースコードリーディング第一回
Hdfsソースコードリーディング第一回
shunsuke Mikami
Cassandra3.0
Cassandra3.0
Kazutaka Tomita
Hadoopとその周辺の紹介
Hadoopとその周辺の紹介
Shinya Okano
SASとHadoopとの連携
SASとHadoopとの連携
SAS Institute Japan
DBP-011_Apache Spark for Azure HDInsight ~新世代の Big Data 処理基盤~
DBP-011_Apache Spark for Azure HDInsight ~新世代の Big Data 処理基盤~
decode2016
米国の事例で学ぶCassandra
米国の事例で学ぶCassandra
Kazutaka Tomita
Hadoop 基礎
Hadoop 基礎
hideaki honda
cassandra調査レポート
cassandra調査レポート
Akihiro Kuwano
Db tech showcase 2016
Db tech showcase 2016
datastaxjp
はやわかりHadoop
はやわかりHadoop
Shinpei Ohtani
Cassandraのしくみ データの読み書き編
Cassandraのしくみ データの読み書き編
Yuki Morishita
JavaOne2013報告会 LT資料 Hadoopの話を聞いてきた
JavaOne2013報告会 LT資料 Hadoopの話を聞いてきた
Takashi Aoe
10年効く分散ファイルシステム技術 GlusterFS & Red Hat Storage
10年効く分散ファイルシステム技術 GlusterFS & Red Hat Storage
Etsuji Nakai
インフラエンジニアのためのcassandra入門
インフラエンジニアのためのcassandra入門
Akihiro Kuwano
マルチAZ対応!AWS上で稼働するスケールアウトNAS Red Hat Storage
マルチAZ対応!AWS上で稼働するスケールアウトNAS Red Hat Storage
Taira Hajime
Comparing GlusterFS Swift API to Native Swift
Comparing GlusterFS Swift API to Native Swift
Etsuji Nakai
20120913 nosql@hikarie(okuyama fuse)
20120913 nosql@hikarie(okuyama fuse)
Takahiro Iwase
20110805 hddssd research
20110805 hddssd research
Yusei Yamanaka
Consistency level
Consistency level
Kazutaka Tomita
Windows Azure HDInsight サービスの紹介
Windows Azure HDInsight サービスの紹介
Kuninobu SaSaki
Cache勉強会
Cache勉強会
Shinji Miyazato
The rethinkingofrepair
The rethinkingofrepair
Kazutaka Tomita
分散仮想ストレージシステム紹介
分散仮想ストレージシステム紹介
OSSラボ株式会社
cassandra 100 node cluster admin operation
cassandra 100 node cluster admin operation
oranie Narut
Hadoopことはじめ
Hadoopことはじめ
均 津田
これがCassandra
これがCassandra
Takehiro Torigaki
LT Thursday Intro. (Rust使ってみた←釣り)
LT Thursday Intro. (Rust使ってみた←釣り)
Yuki Katada
Sized Linear Algebra Package のチュートリアル
Sized Linear Algebra Package のチュートリアル
Akinori Abe
More Related Content
What's hot
Hadoop 基礎
Hadoop 基礎
hideaki honda
cassandra調査レポート
cassandra調査レポート
Akihiro Kuwano
Db tech showcase 2016
Db tech showcase 2016
datastaxjp
はやわかりHadoop
はやわかりHadoop
Shinpei Ohtani
Cassandraのしくみ データの読み書き編
Cassandraのしくみ データの読み書き編
Yuki Morishita
JavaOne2013報告会 LT資料 Hadoopの話を聞いてきた
JavaOne2013報告会 LT資料 Hadoopの話を聞いてきた
Takashi Aoe
10年効く分散ファイルシステム技術 GlusterFS & Red Hat Storage
10年効く分散ファイルシステム技術 GlusterFS & Red Hat Storage
Etsuji Nakai
インフラエンジニアのためのcassandra入門
インフラエンジニアのためのcassandra入門
Akihiro Kuwano
マルチAZ対応!AWS上で稼働するスケールアウトNAS Red Hat Storage
マルチAZ対応!AWS上で稼働するスケールアウトNAS Red Hat Storage
Taira Hajime
Comparing GlusterFS Swift API to Native Swift
Comparing GlusterFS Swift API to Native Swift
Etsuji Nakai
20120913 nosql@hikarie(okuyama fuse)
20120913 nosql@hikarie(okuyama fuse)
Takahiro Iwase
20110805 hddssd research
20110805 hddssd research
Yusei Yamanaka
Consistency level
Consistency level
Kazutaka Tomita
Windows Azure HDInsight サービスの紹介
Windows Azure HDInsight サービスの紹介
Kuninobu SaSaki
Cache勉強会
Cache勉強会
Shinji Miyazato
The rethinkingofrepair
The rethinkingofrepair
Kazutaka Tomita
分散仮想ストレージシステム紹介
分散仮想ストレージシステム紹介
OSSラボ株式会社
cassandra 100 node cluster admin operation
cassandra 100 node cluster admin operation
oranie Narut
Hadoopことはじめ
Hadoopことはじめ
均 津田
これがCassandra
これがCassandra
Takehiro Torigaki
What's hot
(20)
Hadoop 基礎
Hadoop 基礎
cassandra調査レポート
cassandra調査レポート
Db tech showcase 2016
Db tech showcase 2016
はやわかりHadoop
はやわかりHadoop
Cassandraのしくみ データの読み書き編
Cassandraのしくみ データの読み書き編
JavaOne2013報告会 LT資料 Hadoopの話を聞いてきた
JavaOne2013報告会 LT資料 Hadoopの話を聞いてきた
10年効く分散ファイルシステム技術 GlusterFS & Red Hat Storage
10年効く分散ファイルシステム技術 GlusterFS & Red Hat Storage
インフラエンジニアのためのcassandra入門
インフラエンジニアのためのcassandra入門
マルチAZ対応!AWS上で稼働するスケールアウトNAS Red Hat Storage
マルチAZ対応!AWS上で稼働するスケールアウトNAS Red Hat Storage
Comparing GlusterFS Swift API to Native Swift
Comparing GlusterFS Swift API to Native Swift
20120913 nosql@hikarie(okuyama fuse)
20120913 nosql@hikarie(okuyama fuse)
20110805 hddssd research
20110805 hddssd research
Consistency level
Consistency level
Windows Azure HDInsight サービスの紹介
Windows Azure HDInsight サービスの紹介
Cache勉強会
Cache勉強会
The rethinkingofrepair
The rethinkingofrepair
分散仮想ストレージシステム紹介
分散仮想ストレージシステム紹介
cassandra 100 node cluster admin operation
cassandra 100 node cluster admin operation
Hadoopことはじめ
Hadoopことはじめ
これがCassandra
これがCassandra
Viewers also liked
LT Thursday Intro. (Rust使ってみた←釣り)
LT Thursday Intro. (Rust使ってみた←釣り)
Yuki Katada
Sized Linear Algebra Package のチュートリアル
Sized Linear Algebra Package のチュートリアル
Akinori Abe
全員がフルスタックするためのチーム開発
全員がフルスタックするためのチーム開発
saito_hirokazu
Amazon machine leaning の紹介
Amazon machine leaning の紹介
Akinori Abe
Microsoft Azure Machine Learning "ちょっと"だけ触ってみた
Microsoft Azure Machine Learning "ちょっと"だけ触ってみた
Yuki Katada
BloomFilterを直感的に理解する
BloomFilterを直感的に理解する
co-sche
Akka/Actor introduction
Akka/Actor introduction
Yuki Katada
Neo4jで始めるグラフDB入門 - LT Thursday
Neo4jで始めるグラフDB入門 - LT Thursday
Yusuke Komahara
あなたのプレゼンをぐっとレベルアップさせる小手先の技術
あなたのプレゼンをぐっとレベルアップさせる小手先の技術
Takahiro Ogoshi
Elastic Beanstalkでアプリ/インフラかんたん一括管理
Elastic Beanstalkでアプリ/インフラかんたん一括管理
Yusuke Komahara
感情分析で株価を予測して おこづかい稼ぎ 日経版
感情分析で株価を予測して おこづかい稼ぎ 日経版
saito_hirokazu
20170112 tristan 勉強会_社外
20170112 tristan 勉強会_社外
Tristan Irvine
Maglev: A Fast and Reliable Software Network Load Balancer
Maglev: A Fast and Reliable Software Network Load Balancer
kuro kuro
Heterogeneous System Architecture Overview
Heterogeneous System Architecture Overview
inside-BigData.com
Enabling Graph Analytics at Scale: The Opportunity for GPU-Acceleration of D...
Enabling Graph Analytics at Scale: The Opportunity for GPU-Acceleration of D...
odsc
GPUs in Big Data - StampedeCon 2014
GPUs in Big Data - StampedeCon 2014
StampedeCon
GPU Ecosystem
GPU Ecosystem
Ofer Rosenberg
SIGGRAPH 2012: GPU-Accelerated 2D and Web Rendering
SIGGRAPH 2012: GPU-Accelerated 2D and Web Rendering
Mark Kilgard
Hadoop + GPU
Hadoop + GPU
Vladimir Starostenkov
Newbie’s guide to_the_gpgpu_universe
Newbie’s guide to_the_gpgpu_universe
Ofer Rosenberg
Viewers also liked
(20)
LT Thursday Intro. (Rust使ってみた←釣り)
LT Thursday Intro. (Rust使ってみた←釣り)
Sized Linear Algebra Package のチュートリアル
Sized Linear Algebra Package のチュートリアル
全員がフルスタックするためのチーム開発
全員がフルスタックするためのチーム開発
Amazon machine leaning の紹介
Amazon machine leaning の紹介
Microsoft Azure Machine Learning "ちょっと"だけ触ってみた
Microsoft Azure Machine Learning "ちょっと"だけ触ってみた
BloomFilterを直感的に理解する
BloomFilterを直感的に理解する
Akka/Actor introduction
Akka/Actor introduction
Neo4jで始めるグラフDB入門 - LT Thursday
Neo4jで始めるグラフDB入門 - LT Thursday
あなたのプレゼンをぐっとレベルアップさせる小手先の技術
あなたのプレゼンをぐっとレベルアップさせる小手先の技術
Elastic Beanstalkでアプリ/インフラかんたん一括管理
Elastic Beanstalkでアプリ/インフラかんたん一括管理
感情分析で株価を予測して おこづかい稼ぎ 日経版
感情分析で株価を予測して おこづかい稼ぎ 日経版
20170112 tristan 勉強会_社外
20170112 tristan 勉強会_社外
Maglev: A Fast and Reliable Software Network Load Balancer
Maglev: A Fast and Reliable Software Network Load Balancer
Heterogeneous System Architecture Overview
Heterogeneous System Architecture Overview
Enabling Graph Analytics at Scale: The Opportunity for GPU-Acceleration of D...
Enabling Graph Analytics at Scale: The Opportunity for GPU-Acceleration of D...
GPUs in Big Data - StampedeCon 2014
GPUs in Big Data - StampedeCon 2014
GPU Ecosystem
GPU Ecosystem
SIGGRAPH 2012: GPU-Accelerated 2D and Web Rendering
SIGGRAPH 2012: GPU-Accelerated 2D and Web Rendering
Hadoop + GPU
Hadoop + GPU
Newbie’s guide to_the_gpgpu_universe
Newbie’s guide to_the_gpgpu_universe
Similar to 分散処理のすゝめ?
[db tech showcase Tokyo 2015] B34:データの仮想化を具体化するIBMのロジカルデータウェアハウス by 日本アイ・ビー・エ...
[db tech showcase Tokyo 2015] B34:データの仮想化を具体化するIBMのロジカルデータウェアハウス by 日本アイ・ビー・エ...
Insight Technology, Inc.
【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~
【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~
Developers Summit
40分でわかるHadoop徹底入門 (Cloudera World Tokyo 2014 講演資料)
40分でわかるHadoop徹底入門 (Cloudera World Tokyo 2014 講演資料)
hamaken
AI・HPC・ビッグデータで利用される分散ファイルシステムを知る
AI・HPC・ビッグデータで利用される分散ファイルシステムを知る
日本ヒューレット・パッカード株式会社
Hadoop loves H2
Hadoop loves H2
Tadashi Satoh
Hadoopの紹介
Hadoopの紹介
bigt23
NTTデータ流 Hadoop活用のすすめ ~インフラ構築・運用の勘所~
NTTデータ流 Hadoop活用のすすめ ~インフラ構築・運用の勘所~
NTT DATA OSS Professional Services
Hadoop事始め
Hadoop事始め
You&I
Cloudera大阪セミナー 20130219
Cloudera大阪セミナー 20130219
Cloudera Japan
ATN No.1 MapReduceだけでない!? Hadoopとその仲間たち
ATN No.1 MapReduceだけでない!? Hadoopとその仲間たち
AdvancedTechNight
Tuning maniax 2014 Hadoop編
Tuning maniax 2014 Hadoop編
ThinkIT_impress
Distributed data stores in Hadoop ecosystem
Distributed data stores in Hadoop ecosystem
NTT DATA OSS Professional Services
Introduction to Hadoop and Spark (before joining the other talk) and An Overv...
Introduction to Hadoop and Spark (before joining the other talk) and An Overv...
DataWorks Summit/Hadoop Summit
Osc2012 spring HBase Report
Osc2012 spring HBase Report
Seiichiro Ishida
Hadoop, NoSQL, GlusterFSの概要
Hadoop, NoSQL, GlusterFSの概要
日本ヒューレット・パッカード株式会社
Okuyama説明資料 20120119 ss
Okuyama説明資料 20120119 ss
Takahiro Iwase
マイニング探検会#10
マイニング探検会#10
Yoji Kiyota
ゾウ使いへの第一歩
ゾウ使いへの第一歩
Fumito Ito
A 2-3ゾウ使いへの第一歩 hadoop on azure 編
A 2-3ゾウ使いへの第一歩 hadoop on azure 編
GoAzure
Infinispan - Open Source Data Grid
Infinispan - Open Source Data Grid
nekop
Similar to 分散処理のすゝめ?
(20)
[db tech showcase Tokyo 2015] B34:データの仮想化を具体化するIBMのロジカルデータウェアハウス by 日本アイ・ビー・エ...
[db tech showcase Tokyo 2015] B34:データの仮想化を具体化するIBMのロジカルデータウェアハウス by 日本アイ・ビー・エ...
【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~
【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~
40分でわかるHadoop徹底入門 (Cloudera World Tokyo 2014 講演資料)
40分でわかるHadoop徹底入門 (Cloudera World Tokyo 2014 講演資料)
AI・HPC・ビッグデータで利用される分散ファイルシステムを知る
AI・HPC・ビッグデータで利用される分散ファイルシステムを知る
Hadoop loves H2
Hadoop loves H2
Hadoopの紹介
Hadoopの紹介
NTTデータ流 Hadoop活用のすすめ ~インフラ構築・運用の勘所~
NTTデータ流 Hadoop活用のすすめ ~インフラ構築・運用の勘所~
Hadoop事始め
Hadoop事始め
Cloudera大阪セミナー 20130219
Cloudera大阪セミナー 20130219
ATN No.1 MapReduceだけでない!? Hadoopとその仲間たち
ATN No.1 MapReduceだけでない!? Hadoopとその仲間たち
Tuning maniax 2014 Hadoop編
Tuning maniax 2014 Hadoop編
Distributed data stores in Hadoop ecosystem
Distributed data stores in Hadoop ecosystem
Introduction to Hadoop and Spark (before joining the other talk) and An Overv...
Introduction to Hadoop and Spark (before joining the other talk) and An Overv...
Osc2012 spring HBase Report
Osc2012 spring HBase Report
Hadoop, NoSQL, GlusterFSの概要
Hadoop, NoSQL, GlusterFSの概要
Okuyama説明資料 20120119 ss
Okuyama説明資料 20120119 ss
マイニング探検会#10
マイニング探検会#10
ゾウ使いへの第一歩
ゾウ使いへの第一歩
A 2-3ゾウ使いへの第一歩 hadoop on azure 編
A 2-3ゾウ使いへの第一歩 hadoop on azure 編
Infinispan - Open Source Data Grid
Infinispan - Open Source Data Grid
分散処理のすゝめ?
1.
分散処理のすゝめ? 大江喜渡
2.
自己紹介 ・大江 喜渡 ・専門: 分散システム系 -
MapReduce on GPU ・言語/OSS - Java - Scala - Hadoop
3.
大規模データを処理するには… データを分割して複数サーバに保持 並列にデータを読み込む分散処理
4.
大規模データを処理するには… データを分割して複数サーバに保持 並列にデータを読み込む分散処理 障害時の対応 プロセスの監視 プロセス間通信の管理
5.
Hadoop Google基盤技術を基に開発されたオープンソースクローン 面倒な分散処理を全て内部で実装 レプリカを生成 → 耐障害性・データの安全性 分散処理を意識せず処理の記述が可能に
6.
HDFS(Hadoop Distributed File
System) - ファイルをブロック分割して分散配置 - 1ブロックは3つに複製される多重保存 - 故障してもどこかのサーバで複製
7.
HDFS(Hadoop Distributed File
System) MapReduce - MapとReduceのフェーズに分け データから加工と抽出、集約を行う - 分散処理の面倒な部分を内部で処理
8.
HDFS(Hadoop Distributed File
System) MapReduce(v1) DWH NoSQL Database 分散協調 サービス
9.
Fluent-plugin-twitter Fluent-plugin-hbase Hive外部テーブル
10.
HDFS(Hadoop Distributed File
System) MapReduce YARN(Yet Another Resource Negotiator) - リソースの制御を切り離し - MR以外の分散アプリケーション の実行が可能に
11.
HDFS(Hadoop Distributed File
System) MapReduce YARN(Yet Another Resource Negotiator) Spark SparkSQL Spark Streaming MLlib GraphX Spark - MRの置き換わりを目指し - バッチだけでなくストリーム から機械学習、グラフ処理まで
12.
MapReduce Spark SparkSQL Spark Streaming MLlib GraphX
13.
メッセージキュー 集約 抽出/加工
14.
HDFS 大規模データの効率的なスキャン バッチ処理 HBase 各行への効率的な検索・書き込み リアルタイム/ストリーム処理 http://www.cloudera.co.jp/blog/kudu- new-apache-hadoop-storage-for-fast- analytics-on-fast-data.html
15.
http://www.cloudera.co.jp/blog/kudu- new-apache-hadoop-storage-for-fast- analytics-on-fast-data.html Kudu 大規模データのフルスキャン ランダムアクセス ※どっちかに特化しているのであれば HDFSかHBase
16.
Data バッチ処理
17.
Data ストリーム処理
18.
まとめ 多様なユースケースをカバーできる基盤が整っている CDH等で簡単に基盤は作れて試せる ニーズもあってか分散処理基盤OSSは次々誕生する 情報量多い… 更新速すぎ… 楽しいです!
Download now