Submit Search
Upload
MapReduceからの
•
Download as KEY, PDF
•
4 likes
•
838 views
Shotaro Tsubouchi
Follow
Hadoopソースコードリーディング第1回にて使用
Read less
Read more
Technology
Self Improvement
Report
Share
Report
Share
1 of 28
Download now
Recommended
JavaOne2013報告会 LT資料 Hadoopの話を聞いてきた
JavaOne2013報告会 LT資料 Hadoopの話を聞いてきた
Takashi Aoe
Hadoop 基礎
Hadoop 基礎
hideaki honda
超入門データベース基礎の基礎
超入門データベース基礎の基礎
Matsuzawa Fumiaki
SASによるインメモリ分散並列処理 レコメンドプロシジャ入門
SASによるインメモリ分散並列処理 レコメンドプロシジャ入門
SAS Institute Japan
100億超メッセージ/日のサービスを 支えるHBase運用におけるチャレンジ
100億超メッセージ/日のサービスを 支えるHBase運用におけるチャレンジ
LINE Corporation
世界一簡単なHadoopの話
世界一簡単なHadoopの話
Koichi Shimazaki
SASとHadoopとの連携 2015
SASとHadoopとの連携 2015
SAS Institute Japan
Hadoopことはじめ
Hadoopことはじめ
均 津田
Recommended
JavaOne2013報告会 LT資料 Hadoopの話を聞いてきた
JavaOne2013報告会 LT資料 Hadoopの話を聞いてきた
Takashi Aoe
Hadoop 基礎
Hadoop 基礎
hideaki honda
超入門データベース基礎の基礎
超入門データベース基礎の基礎
Matsuzawa Fumiaki
SASによるインメモリ分散並列処理 レコメンドプロシジャ入門
SASによるインメモリ分散並列処理 レコメンドプロシジャ入門
SAS Institute Japan
100億超メッセージ/日のサービスを 支えるHBase運用におけるチャレンジ
100億超メッセージ/日のサービスを 支えるHBase運用におけるチャレンジ
LINE Corporation
世界一簡単なHadoopの話
世界一簡単なHadoopの話
Koichi Shimazaki
SASとHadoopとの連携 2015
SASとHadoopとの連携 2015
SAS Institute Japan
Hadoopことはじめ
Hadoopことはじめ
均 津田
データベース01 - データベースとは
データベース01 - データベースとは
Kenta Oku
データベース入門
データベース入門
拓 小林
Pigのインストール
Pigのインストール
Noritada Shimizu
Hadoop~Yahoo!Japanの活用について
Hadoop~Yahoo!Japanの活用について
kaminashi
Hadoop for programmer
Hadoop for programmer
Sho Shimauchi
今さら聞けないHadoop セントラルソフト株式会社(20120119)
今さら聞けないHadoop セントラルソフト株式会社(20120119)
Toru Takizawa
Comsys2013 10
Comsys2013 10
Yusuke Simizu
Windows Azure HDInsight サービスの紹介
Windows Azure HDInsight サービスの紹介
Kuninobu SaSaki
はやわかりHadoop
はやわかりHadoop
Shinpei Ohtani
Apache Hadoop の現在と将来(Hadoop / Spark Conference Japan 2016 キーノート講演資料)
Apache Hadoop の現在と将来(Hadoop / Spark Conference Japan 2016 キーノート講演資料)
Hadoop / Spark Conference Japan
Tuning maniax 2014 Hadoop編
Tuning maniax 2014 Hadoop編
ThinkIT_impress
テーブルの変更・作成
テーブルの変更・作成
Jun Chiba
Amazon Redshift ベンチマーク Hadoop + Hiveと比較
Amazon Redshift ベンチマーク Hadoop + Hiveと比較
FlyData Inc.
Apache Drill Overview - Tokyo Apache Drill Meetup 2015/09/15
Apache Drill Overview - Tokyo Apache Drill Meetup 2015/09/15
MapR Technologies Japan
Apache Hive 紹介
Apache Hive 紹介
あしたのオープンソース研究所
Apache Hadoop HDFSの最新機能の紹介(2018)#dbts2018
Apache Hadoop HDFSの最新機能の紹介(2018)#dbts2018
Yahoo!デベロッパーネットワーク
分散グラフデータベース DataStax Enterprise Graph
分散グラフデータベース DataStax Enterprise Graph
Yuki Morishita
データサイズ2ペタ ソネット・メディア・ネットワークスでのImpala活用とHadoop運用
データサイズ2ペタ ソネット・メディア・ネットワークスでのImpala活用とHadoop運用
Yoshikazu Suganuma
スケールアウト・インメモリ分析の標準フォーマットを目指す Apache Arrow と Value Vectors - Tokyo Apache Dril...
スケールアウト・インメモリ分析の標準フォーマットを目指す Apache Arrow と Value Vectors - Tokyo Apache Dril...
MapR Technologies Japan
Hadoop入門
Hadoop入門
Preferred Networks
AI・HPC・ビッグデータで利用される分散ファイルシステムを知る
AI・HPC・ビッグデータで利用される分散ファイルシステムを知る
日本ヒューレット・パッカード株式会社
Osc2012 spring HBase Report
Osc2012 spring HBase Report
Seiichiro Ishida
More Related Content
What's hot
データベース01 - データベースとは
データベース01 - データベースとは
Kenta Oku
データベース入門
データベース入門
拓 小林
Pigのインストール
Pigのインストール
Noritada Shimizu
Hadoop~Yahoo!Japanの活用について
Hadoop~Yahoo!Japanの活用について
kaminashi
Hadoop for programmer
Hadoop for programmer
Sho Shimauchi
今さら聞けないHadoop セントラルソフト株式会社(20120119)
今さら聞けないHadoop セントラルソフト株式会社(20120119)
Toru Takizawa
Comsys2013 10
Comsys2013 10
Yusuke Simizu
Windows Azure HDInsight サービスの紹介
Windows Azure HDInsight サービスの紹介
Kuninobu SaSaki
はやわかりHadoop
はやわかりHadoop
Shinpei Ohtani
Apache Hadoop の現在と将来(Hadoop / Spark Conference Japan 2016 キーノート講演資料)
Apache Hadoop の現在と将来(Hadoop / Spark Conference Japan 2016 キーノート講演資料)
Hadoop / Spark Conference Japan
Tuning maniax 2014 Hadoop編
Tuning maniax 2014 Hadoop編
ThinkIT_impress
テーブルの変更・作成
テーブルの変更・作成
Jun Chiba
Amazon Redshift ベンチマーク Hadoop + Hiveと比較
Amazon Redshift ベンチマーク Hadoop + Hiveと比較
FlyData Inc.
Apache Drill Overview - Tokyo Apache Drill Meetup 2015/09/15
Apache Drill Overview - Tokyo Apache Drill Meetup 2015/09/15
MapR Technologies Japan
Apache Hive 紹介
Apache Hive 紹介
あしたのオープンソース研究所
Apache Hadoop HDFSの最新機能の紹介(2018)#dbts2018
Apache Hadoop HDFSの最新機能の紹介(2018)#dbts2018
Yahoo!デベロッパーネットワーク
分散グラフデータベース DataStax Enterprise Graph
分散グラフデータベース DataStax Enterprise Graph
Yuki Morishita
データサイズ2ペタ ソネット・メディア・ネットワークスでのImpala活用とHadoop運用
データサイズ2ペタ ソネット・メディア・ネットワークスでのImpala活用とHadoop運用
Yoshikazu Suganuma
スケールアウト・インメモリ分析の標準フォーマットを目指す Apache Arrow と Value Vectors - Tokyo Apache Dril...
スケールアウト・インメモリ分析の標準フォーマットを目指す Apache Arrow と Value Vectors - Tokyo Apache Dril...
MapR Technologies Japan
Hadoop入門
Hadoop入門
Preferred Networks
What's hot
(20)
データベース01 - データベースとは
データベース01 - データベースとは
データベース入門
データベース入門
Pigのインストール
Pigのインストール
Hadoop~Yahoo!Japanの活用について
Hadoop~Yahoo!Japanの活用について
Hadoop for programmer
Hadoop for programmer
今さら聞けないHadoop セントラルソフト株式会社(20120119)
今さら聞けないHadoop セントラルソフト株式会社(20120119)
Comsys2013 10
Comsys2013 10
Windows Azure HDInsight サービスの紹介
Windows Azure HDInsight サービスの紹介
はやわかりHadoop
はやわかりHadoop
Apache Hadoop の現在と将来(Hadoop / Spark Conference Japan 2016 キーノート講演資料)
Apache Hadoop の現在と将来(Hadoop / Spark Conference Japan 2016 キーノート講演資料)
Tuning maniax 2014 Hadoop編
Tuning maniax 2014 Hadoop編
テーブルの変更・作成
テーブルの変更・作成
Amazon Redshift ベンチマーク Hadoop + Hiveと比較
Amazon Redshift ベンチマーク Hadoop + Hiveと比較
Apache Drill Overview - Tokyo Apache Drill Meetup 2015/09/15
Apache Drill Overview - Tokyo Apache Drill Meetup 2015/09/15
Apache Hive 紹介
Apache Hive 紹介
Apache Hadoop HDFSの最新機能の紹介(2018)#dbts2018
Apache Hadoop HDFSの最新機能の紹介(2018)#dbts2018
分散グラフデータベース DataStax Enterprise Graph
分散グラフデータベース DataStax Enterprise Graph
データサイズ2ペタ ソネット・メディア・ネットワークスでのImpala活用とHadoop運用
データサイズ2ペタ ソネット・メディア・ネットワークスでのImpala活用とHadoop運用
スケールアウト・インメモリ分析の標準フォーマットを目指す Apache Arrow と Value Vectors - Tokyo Apache Dril...
スケールアウト・インメモリ分析の標準フォーマットを目指す Apache Arrow と Value Vectors - Tokyo Apache Dril...
Hadoop入門
Hadoop入門
Similar to MapReduceからの
AI・HPC・ビッグデータで利用される分散ファイルシステムを知る
AI・HPC・ビッグデータで利用される分散ファイルシステムを知る
日本ヒューレット・パッカード株式会社
Osc2012 spring HBase Report
Osc2012 spring HBase Report
Seiichiro Ishida
Hadoopの紹介
Hadoopの紹介
bigt23
[Japanese Content] Lance Riedel_The App Server, The Hive in Tokyo_Aug29
[Japanese Content] Lance Riedel_The App Server, The Hive in Tokyo_Aug29
The Hive
2014-07-26 Exploration into HDInsight Tuning Maniax 2014 Hadoopコース参戦記
2014-07-26 Exploration into HDInsight Tuning Maniax 2014 Hadoopコース参戦記
Yoshiyuki Nakamura
Apache Kuduは何がそんなに「速い」DBなのか? #dbts2017
Apache Kuduは何がそんなに「速い」DBなのか? #dbts2017
Cloudera Japan
Kuduを調べてみた #dogenzakalt
Kuduを調べてみた #dogenzakalt
Toshihiro Suzuki
【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~
【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~
Developers Summit
HBaseを用いたグラフDB「Hornet」の設計と運用
HBaseを用いたグラフDB「Hornet」の設計と運用
Toshihiro Suzuki
Hadoop, NoSQL, GlusterFSの概要
Hadoop, NoSQL, GlusterFSの概要
日本ヒューレット・パッカード株式会社
TokyoWebminig カジュアルなHadoop
TokyoWebminig カジュアルなHadoop
Teruo Kawasaki
CDH5最新情報 #cwt2013
CDH5最新情報 #cwt2013
Cloudera Japan
Hadoopビッグデータ基盤の歴史を振り返る #cwt2015
Hadoopビッグデータ基盤の歴史を振り返る #cwt2015
Cloudera Japan
MapReduceを使った並列化 20111212
MapReduceを使った並列化 20111212
marony
SASとHadoopとの連携
SASとHadoopとの連携
SAS Institute Japan
GMOプライベートDMPの仕組み
GMOプライベートDMPの仕組み
Michio Katano
CDH4.1オーバービュー
CDH4.1オーバービュー
Cloudera Japan
リクルート式Hadoopの使い方
リクルート式Hadoopの使い方
Recruit Technologies
HAWQをCDHで動かしてみた
HAWQをCDHで動かしてみた
adachij2002
オライリーセミナー Hive入門 #oreilly0724
オライリーセミナー Hive入門 #oreilly0724
Cloudera Japan
Similar to MapReduceからの
(20)
AI・HPC・ビッグデータで利用される分散ファイルシステムを知る
AI・HPC・ビッグデータで利用される分散ファイルシステムを知る
Osc2012 spring HBase Report
Osc2012 spring HBase Report
Hadoopの紹介
Hadoopの紹介
[Japanese Content] Lance Riedel_The App Server, The Hive in Tokyo_Aug29
[Japanese Content] Lance Riedel_The App Server, The Hive in Tokyo_Aug29
2014-07-26 Exploration into HDInsight Tuning Maniax 2014 Hadoopコース参戦記
2014-07-26 Exploration into HDInsight Tuning Maniax 2014 Hadoopコース参戦記
Apache Kuduは何がそんなに「速い」DBなのか? #dbts2017
Apache Kuduは何がそんなに「速い」DBなのか? #dbts2017
Kuduを調べてみた #dogenzakalt
Kuduを調べてみた #dogenzakalt
【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~
【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~
HBaseを用いたグラフDB「Hornet」の設計と運用
HBaseを用いたグラフDB「Hornet」の設計と運用
Hadoop, NoSQL, GlusterFSの概要
Hadoop, NoSQL, GlusterFSの概要
TokyoWebminig カジュアルなHadoop
TokyoWebminig カジュアルなHadoop
CDH5最新情報 #cwt2013
CDH5最新情報 #cwt2013
Hadoopビッグデータ基盤の歴史を振り返る #cwt2015
Hadoopビッグデータ基盤の歴史を振り返る #cwt2015
MapReduceを使った並列化 20111212
MapReduceを使った並列化 20111212
SASとHadoopとの連携
SASとHadoopとの連携
GMOプライベートDMPの仕組み
GMOプライベートDMPの仕組み
CDH4.1オーバービュー
CDH4.1オーバービュー
リクルート式Hadoopの使い方
リクルート式Hadoopの使い方
HAWQをCDHで動かしてみた
HAWQをCDHで動かしてみた
オライリーセミナー Hive入門 #oreilly0724
オライリーセミナー Hive入門 #oreilly0724
Recently uploaded
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Yuma Ohgami
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
Toru Tamaki
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
FumieNakayama
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
FumieNakayama
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
Hiroki Ichikura
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
UEHARA, Tetsutaro
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
Toru Tamaki
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
Toru Tamaki
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
iPride Co., Ltd.
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
taisei2219
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
博三 太田
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
sugiuralab
Recently uploaded
(12)
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
MapReduceからの
1.
MapReduce
2.
で得たデータを
3.
システムに使う
には
4.
やっぱり データベース でしょ
5.
ということで
6.
MapReduce
7.
からの
8.
HBase
9.
MapReduce からの
HBase
10.
自己紹介 • お名前 ショータロー(@shootaroo) •
またの名 坪内 章太郎(33) • お仕事 フリーエンジニア • お趣味 プログラミング、ランニング、ロードバイク、 レーシングカート、バイオリン、ワイン
11.
HBaseとは
12.
HBase •Hadoopプロジェクトの分散KVS •Google BigTableを参考に実装さ れている •ファイルシステムにHDFSを利用 •MapReduceやHDFSと設定やコ
マンドが似ている
13.
HBase の使い方
14.
主要Class ‣ org.apache.hadoop.hbase
‣ client ‣ HTable - テーブルへのアクセス ‣ Put, Delete - データ登録、削除 ‣ Get, Scan - データ取得条件 ‣ Result, ResultScanner - 取得結果 ‣ HBaseAdmin - テーブル管理用 ‣ util ‣ Bytes - バイト配列とのデータ変換
15.
クライアントに必要なJar •hbase-0.20.x.jar •hadoop-0.20.x-core.jar •zookeeper-3.2.2.jar •commons-logging-1.0.4.jar •log4j-1.2.15.jar
16.
MapReduce からの使い方
17.
主要Class ‣ org.apache.hadoop.hbase.mapreduce ‣
TableInputFormat - ScanによるResultを返すInputFormat ‣ TableOutputFormat - Put,Deleteでテーブルを更新するOutputFormat ‣ TableMapReduceUtil - ‣ TableMapper - INがResultのMapper ‣ TableReducer - OUTがPut,DeleteのReducer
18.
やっとくこと • クラスパスの設定 •
hadoop-env.shのHADOOP_CLASSPATH • hbase-0.20.3.jar • zookeeper-3.2.2.jar
19.
デモ
20.
課題 •データ少ないと分散してくれない •Bytesがいちいち面倒 •データ壊れることが。。
21.
おしまい
22.
からの
23.
Cassandra
24.
Ver.0.6で Hadoop対応
25.
と思ったけど
26.
InputFormatしか 用意されてない。。
なぜ??
27.
やっぱり おしまい
Editor's Notes
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
Download now