Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
Uploaded by
Yukinori Suda
4,677 views
HiveとImpalaのおいしいとこ取り
『Hadoop 第3版』『プログラミング Hive』刊行記念 Hadoopセミナー
Technology
◦
Read more
15
Save
Share
Embed
Embed presentation
Download
Downloaded 23 times
1
/ 21
2
/ 21
3
/ 21
4
/ 21
5
/ 21
6
/ 21
7
/ 21
8
/ 21
9
/ 21
10
/ 21
11
/ 21
12
/ 21
13
/ 21
14
/ 21
15
/ 21
16
/ 21
17
/ 21
18
/ 21
19
/ 21
20
/ 21
21
/ 21
More Related Content
PDF
Cloudera Impalaをサービスに組み込むときに苦労した話
by
Yukinori Suda
PPTX
Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)
by
Cloudera Japan
PDF
SQL on Hadoop 比較検証 【2014月11日における検証レポート】
by
NTT DATA OSS Professional Services
PDF
Impalaチューニングポイントベストプラクティス
by
Yahoo!デベロッパーネットワーク
PDF
20190314 PGStrom Arrow_Fdw
by
Kohei KaiGai
PPTX
HAWQをCDHで動かしてみた
by
adachij2002
PDF
Impala データサイエンティストのための 高速大規模分散基盤 #tokyowebmining
by
Sho Shimauchi
PDF
Userdiveによるimpala導入へのミチ
by
Kuni Nakaji
Cloudera Impalaをサービスに組み込むときに苦労した話
by
Yukinori Suda
Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)
by
Cloudera Japan
SQL on Hadoop 比較検証 【2014月11日における検証レポート】
by
NTT DATA OSS Professional Services
Impalaチューニングポイントベストプラクティス
by
Yahoo!デベロッパーネットワーク
20190314 PGStrom Arrow_Fdw
by
Kohei KaiGai
HAWQをCDHで動かしてみた
by
adachij2002
Impala データサイエンティストのための 高速大規模分散基盤 #tokyowebmining
by
Sho Shimauchi
Userdiveによるimpala導入へのミチ
by
Kuni Nakaji
What's hot
PDF
Apache Kuduは何がそんなに「速い」DBなのか? #dbts2017
by
Cloudera Japan
PDF
Apache Kafkaって本当に大丈夫?~故障検証のオーバービューと興味深い挙動の紹介~
by
NTT DATA OSS Professional Services
PDF
Apache Impalaパフォーマンスチューニング #dbts2018
by
Cloudera Japan
PDF
基礎から学ぶ超並列SQLエンジンImpala #cwt2015
by
Cloudera Japan
PDF
今注目のSpark SQL、知っておきたいその性能とは 20151209 OSC Enterprise
by
YusukeKuramata
PDF
マルチテナント Hadoop クラスタのためのモニタリング Best Practice
by
Hadoop / Spark Conference Japan
PPTX
Introduction to Impala ~Hadoop用のSQLエンジン~ #hcj13w
by
Cloudera Japan
PDF
CDHの歴史とCDH5新機能概要 #at_tokuben
by
Cloudera Japan
PPTX
Impala 2.0 Update 日本語版 #impalajp
by
Cloudera Japan
PDF
Apache Hadoop の現在と将来(Hadoop / Spark Conference Japan 2016 キーノート講演資料)
by
Hadoop / Spark Conference Japan
PDF
Apache Hadoop and YARN, current development status
by
NTT DATA OSS Professional Services
PDF
HBase Across the World #LINE_DM
by
Cloudera Japan
PDF
Impala概要 道玄坂LT祭り 20150312 #dogenzakalt
by
Cloudera Japan
PDF
[db tech showcase Tokyo 2017] D33: Deep Learningや、Analyticsのワークロードを加速するには-Ten...
by
Insight Technology, Inc.
PDF
Hadoop Conference Japan_2016 セッション「顧客事例から学んだ、 エンタープライズでの "マジな"Hadoop導入の勘所」
by
オラクルエンジニア通信
PDF
Kuduを調べてみた #dogenzakalt
by
Toshihiro Suzuki
PDF
「新製品 Kudu 及び RecordServiceの概要」 #cwt2015
by
Cloudera Japan
PPTX
機械学習の定番プラットフォームSparkの紹介
by
Cloudera Japan
PDF
hscj2019_ishizaki_public
by
Kazuaki Ishizaki
PDF
Hadoop概要説明
by
Satoshi Noto
Apache Kuduは何がそんなに「速い」DBなのか? #dbts2017
by
Cloudera Japan
Apache Kafkaって本当に大丈夫?~故障検証のオーバービューと興味深い挙動の紹介~
by
NTT DATA OSS Professional Services
Apache Impalaパフォーマンスチューニング #dbts2018
by
Cloudera Japan
基礎から学ぶ超並列SQLエンジンImpala #cwt2015
by
Cloudera Japan
今注目のSpark SQL、知っておきたいその性能とは 20151209 OSC Enterprise
by
YusukeKuramata
マルチテナント Hadoop クラスタのためのモニタリング Best Practice
by
Hadoop / Spark Conference Japan
Introduction to Impala ~Hadoop用のSQLエンジン~ #hcj13w
by
Cloudera Japan
CDHの歴史とCDH5新機能概要 #at_tokuben
by
Cloudera Japan
Impala 2.0 Update 日本語版 #impalajp
by
Cloudera Japan
Apache Hadoop の現在と将来(Hadoop / Spark Conference Japan 2016 キーノート講演資料)
by
Hadoop / Spark Conference Japan
Apache Hadoop and YARN, current development status
by
NTT DATA OSS Professional Services
HBase Across the World #LINE_DM
by
Cloudera Japan
Impala概要 道玄坂LT祭り 20150312 #dogenzakalt
by
Cloudera Japan
[db tech showcase Tokyo 2017] D33: Deep Learningや、Analyticsのワークロードを加速するには-Ten...
by
Insight Technology, Inc.
Hadoop Conference Japan_2016 セッション「顧客事例から学んだ、 エンタープライズでの "マジな"Hadoop導入の勘所」
by
オラクルエンジニア通信
Kuduを調べてみた #dogenzakalt
by
Toshihiro Suzuki
「新製品 Kudu 及び RecordServiceの概要」 #cwt2015
by
Cloudera Japan
機械学習の定番プラットフォームSparkの紹介
by
Cloudera Japan
hscj2019_ishizaki_public
by
Kazuaki Ishizaki
Hadoop概要説明
by
Satoshi Noto
Viewers also liked
PDF
分散処理基盤Apache Hadoop入門とHadoopエコシステムの最新技術動向 (オープンソースカンファレンス 2015 Tokyo/Spring 講...
by
NTT DATA OSS Professional Services
PPTX
Hive on spark is blazing fast or is it final
by
Hortonworks
PDF
Hiveを高速化するLLAP
by
Yahoo!デベロッパーネットワーク
PDF
InfluxDB の概要 - sonots #tokyoinfluxdb
by
Naotoshi Seo
PDF
Apache Drill で JSON 形式の オープンデータを分析してみる - db tech showcase Tokyo 2015 2015/06/11
by
MapR Technologies Japan
PPTX
Hive, Impala, and Spark, Oh My: SQL-on-Hadoop in Cloudera 5.5
by
Cloudera, Inc.
PDF
Nosqlの基礎知識(2013年7月講義資料)
by
CLOUDIAN KK
PDF
Nested Types in Impala
by
Cloudera, Inc.
PDF
Postgres.foreign.data.wrappers.2015
by
EDB
PPTX
Choosing an HDFS data storage format- Avro vs. Parquet and more - StampedeCon...
by
StampedeCon
PDF
Cloudera impalaの性能評価(Hiveとの比較)
by
Yukinori Suda
PDF
Hadoopエコシステムの最新動向とNTTデータの取り組み (OSC 2016 Tokyo/Spring 講演資料)
by
NTT DATA OSS Professional Services
PDF
Spark shark
by
Tsuyoshi OZAWA
PDF
ビッグデータ活用を加速する!分散SQLエンジン Spark SQL のご紹介 20161105 OSC Tokyo Fall
by
YusukeKuramata
分散処理基盤Apache Hadoop入門とHadoopエコシステムの最新技術動向 (オープンソースカンファレンス 2015 Tokyo/Spring 講...
by
NTT DATA OSS Professional Services
Hive on spark is blazing fast or is it final
by
Hortonworks
Hiveを高速化するLLAP
by
Yahoo!デベロッパーネットワーク
InfluxDB の概要 - sonots #tokyoinfluxdb
by
Naotoshi Seo
Apache Drill で JSON 形式の オープンデータを分析してみる - db tech showcase Tokyo 2015 2015/06/11
by
MapR Technologies Japan
Hive, Impala, and Spark, Oh My: SQL-on-Hadoop in Cloudera 5.5
by
Cloudera, Inc.
Nosqlの基礎知識(2013年7月講義資料)
by
CLOUDIAN KK
Nested Types in Impala
by
Cloudera, Inc.
Postgres.foreign.data.wrappers.2015
by
EDB
Choosing an HDFS data storage format- Avro vs. Parquet and more - StampedeCon...
by
StampedeCon
Cloudera impalaの性能評価(Hiveとの比較)
by
Yukinori Suda
Hadoopエコシステムの最新動向とNTTデータの取り組み (OSC 2016 Tokyo/Spring 講演資料)
by
NTT DATA OSS Professional Services
Spark shark
by
Tsuyoshi OZAWA
ビッグデータ活用を加速する!分散SQLエンジン Spark SQL のご紹介 20161105 OSC Tokyo Fall
by
YusukeKuramata
Similar to HiveとImpalaのおいしいとこ取り
PDF
株式会社インタースペース 守安様 登壇資料
by
leverages_event
PDF
Hadoopビッグデータ基盤の歴史を振り返る #cwt2015
by
Cloudera Japan
PDF
Hadoopデータプラットフォーム #cwt2013
by
Cloudera Japan
PDF
オライリーセミナー Hive入門 #oreilly0724
by
Cloudera Japan
PDF
Apache CloudStack 4.0 インストール(ver0.5)
by
Yasuhiro Arai
PDF
OLAP options on Hadoop
by
Yuta Imai
PPTX
sparksql-hive-bench-by-nec-hwx-at-hcj16
by
Yifeng Jiang
PDF
TokyoWebminig カジュアルなHadoop
by
Teruo Kawasaki
PPTX
Cloudera Impala Seminar Jan. 8 2013
by
Cloudera Japan
PDF
Cloudera impala
by
外道 父
PPTX
ATN No.1 MapReduceだけでない!? Hadoopとその仲間たち
by
AdvancedTechNight
PDF
Hadoop operation chaper 4
by
Yukinori Suda
PDF
CDH4.1オーバービュー
by
Cloudera Japan
PDF
Evolution of Impala #hcj2014
by
Cloudera Japan
PPTX
HDPをWindowsで動かしてみた
by
adachij2002
PPTX
G-Tech2015 Hadoop/Sparkを中核としたビッグデータ基盤_20151006
by
Cloudera Japan
PDF
CDH4セミナー資料
by
Cloudera Japan
PPTX
The truth about SQL and Data Warehousing on Hadoop
by
DataWorks Summit/Hadoop Summit
PDF
20100930 sig startups
by
Ichiro Fukuda
PDF
C5.2 (Cloudera Manager + CDH) アップデート #cwt2014
by
Cloudera Japan
株式会社インタースペース 守安様 登壇資料
by
leverages_event
Hadoopビッグデータ基盤の歴史を振り返る #cwt2015
by
Cloudera Japan
Hadoopデータプラットフォーム #cwt2013
by
Cloudera Japan
オライリーセミナー Hive入門 #oreilly0724
by
Cloudera Japan
Apache CloudStack 4.0 インストール(ver0.5)
by
Yasuhiro Arai
OLAP options on Hadoop
by
Yuta Imai
sparksql-hive-bench-by-nec-hwx-at-hcj16
by
Yifeng Jiang
TokyoWebminig カジュアルなHadoop
by
Teruo Kawasaki
Cloudera Impala Seminar Jan. 8 2013
by
Cloudera Japan
Cloudera impala
by
外道 父
ATN No.1 MapReduceだけでない!? Hadoopとその仲間たち
by
AdvancedTechNight
Hadoop operation chaper 4
by
Yukinori Suda
CDH4.1オーバービュー
by
Cloudera Japan
Evolution of Impala #hcj2014
by
Cloudera Japan
HDPをWindowsで動かしてみた
by
adachij2002
G-Tech2015 Hadoop/Sparkを中核としたビッグデータ基盤_20151006
by
Cloudera Japan
CDH4セミナー資料
by
Cloudera Japan
The truth about SQL and Data Warehousing on Hadoop
by
DataWorks Summit/Hadoop Summit
20100930 sig startups
by
Ichiro Fukuda
C5.2 (Cloudera Manager + CDH) アップデート #cwt2014
by
Cloudera Japan
More from Yukinori Suda
PDF
Performance evaluation of cloudera impala (with Comparison to Hive)
by
Yukinori Suda
PDF
Performance Evaluation of Cloudera Impala GA
by
Yukinori Suda
PDF
Evaluation of cloudera impala 1.1
by
Yukinori Suda
PDF
自宅でHive愛を育む方法 〜Raspberry Pi編〜
by
Yukinori Suda
PDF
Performance evaluation of cloudera impala 0.6 beta with comparison to Hive
by
Yukinori Suda
PDF
Hadoopエコシステムを駆使したこれからのWebアクセス解析サービス
by
Yukinori Suda
PDF
⾃宅で Hive 愛を育むための⼿順(Raspberry Pi 編)
by
Yukinori Suda
Performance evaluation of cloudera impala (with Comparison to Hive)
by
Yukinori Suda
Performance Evaluation of Cloudera Impala GA
by
Yukinori Suda
Evaluation of cloudera impala 1.1
by
Yukinori Suda
自宅でHive愛を育む方法 〜Raspberry Pi編〜
by
Yukinori Suda
Performance evaluation of cloudera impala 0.6 beta with comparison to Hive
by
Yukinori Suda
Hadoopエコシステムを駆使したこれからのWebアクセス解析サービス
by
Yukinori Suda
⾃宅で Hive 愛を育むための⼿順(Raspberry Pi 編)
by
Yukinori Suda
HiveとImpalaのおいしいとこ取り
1.
Copyright © CELLANT
Corp. All Rights Reserved. h t t p : / / w w w . c e l l a n t . j p / 1 1 HiveとImpalaのおいしいとこ取り 『プログラミング Hive』『Hadoop 第3版』 刊行記念 Hadoopセミナー 2013年年7⽉月24⽇日 株式会社セラン R&D戦略略室 須⽥田幸憲
2.
Copyright © CELLANT
Corp. All Rights Reserved. h t t p : / / w w w . c e l l a n t . j p / 祝!刊⾏行行 2
3.
Copyright © CELLANT
Corp. All Rights Reserved. h t t p : / / w w w . c e l l a n t . j p / v 須⽥田幸憲(@sudabon) v 株式会社セラン R&D戦略略室 室⻑⾧長 v 経歴 l 1997〜~2004 NEC 中央研究所 / ネットワークの研究 l 2005〜~2006 BIGLOBE / BtoBサービスの開発 l 2012/8〜~ 現職 v Hadoop歴:約1年年 v 好きなHadoopエコシステム:Hive ⾃自⼰己紹介 3
4.
Copyright © CELLANT
Corp. All Rights Reserved. h t t p : / / w w w . c e l l a n t . j p / v MOBYLOG(モビログ) l Webアクセス解析・広告効果測定サービス l 2005年年12⽉月にサービス開始 l PC、スマホ、ケータイ、スマホアプリの計測が可能 l ケータイでの解析が強み(MOBYLOG ENGINE) • 旧Omniture社(現Adobe社)のSiteCatalyst、及びWebTrends社の WebTrends AnalyticsにモジュールとしてOEM提供 v Xdata collect(クロスデータ・コレクト) l クラウド型のログストレージサービス l 2013年年5⽉月にサービス開始 l Webサーバで取得できる情報に加えて、セッション情報やユーザイベ ントも保存でき、CSVとしてダウンロード可能 l ⽉月間50万件までは無料料で利利⽤用可能 セランの事業紹介 4
5.
Copyright © CELLANT
Corp. All Rights Reserved. h t t p : / / w w w . c e l l a n t . j p / v MOBYLOGでは分析が難しいバッチ処理理 l ⻑⾧長期間を対象に個別のユーザイベントを抽出する場合 v 顧客単位で個別に分析コンサルティング l 物販サイト(EC) l ディジタルコンテンツ販売 l コンテンツのポータルサイト Hadoopの活⽤用⽅方法 5
6.
Copyright © CELLANT
Corp. All Rights Reserved. h t t p : / / w w w . c e l l a n t . j p / v 前職の動画配信ベンチャー企業にて、動画の閲覧ロ グの集計でHadoopを利利⽤用 v システム環境 l Amazon EMR • Aliveクラスタではなく、Transientクラスタ l Hadoop Streaming • S3に保存したログを、EC2上で動作するPHPからコントロール Hadoopエコシステムとの関わり(1) 6
7.
Copyright © CELLANT
Corp. All Rights Reserved. h t t p : / / w w w . c e l l a n t . j p / v AWSのユーザ会の懇親会で、某社エンジニアのRさん に、オンプレでHadoopの構築について詳細にアドバ イスいただきました! Hadoopエコシステムとの関わり(2) 7 ・オンプレだったら、ClouderaのHadoopディスト リビューションのCDHがあるよ ・Cloudera Managerのフリー版があって、GUI操 作で複数台のインストールも簡単にできるよ ・Hiveを使えば、Java以外の言語でもSQLライク なクエリ実行で、MapReduce処理できるよ
8.
Copyright © CELLANT
Corp. All Rights Reserved. h t t p : / / w w w . c e l l a n t . j p / v バッチ開発時にアドホックにクエリを実⾏行行 l ログ内容のチェックをするためにHiveクエリを実⾏行行 l バッチのクエリのデバッグ時にHiveクエリを実⾏行行 v Hive/MapReduceの処理理完了了を待つケースが頻繁 にあり、時間短縮する⽅方法を模索索していた Cloudera Impalaがリリース! Hiveより7〜~45倍の⾼高速化 即、導⼊入しました Hadoopエコシステムとの関わり(3) 8
9.
Copyright © CELLANT
Corp. All Rights Reserved. h t t p : / / w w w . c e l l a n t . j p / Impalaのリリースと性能評価 9 2012/10/24 バージョン0.1 beta 2012/11/14 バージョン0.2 beta 2012/12/05 バージョン0.3 beta 2013/01/19 バージョン0.4 beta 2013/02/05 バージョン0.5 beta 2013/02/27 バージョン0.6 beta 2013/04/15 バージョン0.7 beta 2013/05/01 バージョン1.0 2013/06/18 バージョン1.0.1 2012/11/02 5台のクラスタで評価 > slideshareで資料公開 2012/12/07 14台のクラスタで評価 > @ITに寄稿 > slideshareで資料公開 2013/03/06 14台のクラスタで評価 > slideshareで資料公開 2013/05/01 14台のクラスタで評価 > slideshareで資料公開 HiBenchを用いた評価 RCFileの評価 mem_limitオプション、Parquetの評価
10.
Copyright © CELLANT
Corp. All Rights Reserved. h t t p : / / w w w . c e l l a n t . j p / Our System Environment 10 v Install using Cloudera Manager Free Edition 4.5.2 Master Slave 11 Servers All servers are connected with 1Gbps Ethernet through an L2 switch Active NameNode DataNode TaskTracker Impalad Stand-‐‑‒by NameNode JobTracker statestored 3 Servers DataNode TaskTracker Impalad DataNode TaskTracker Impalad DataNode TaskTracker Impalad DataNode TaskTracker Impalad DataNode TaskTracker Impalad DataNode TaskTracker Impalad DataNode TaskTracker Impalad DataNode TaskTracker Impalad DataNode TaskTracker Impalad DataNode TaskTracker Impalad
11.
Copyright © CELLANT
Corp. All Rights Reserved. h t t p : / / w w w . c e l l a n t . j p / v CPU l Intel Core 2 Duo 2.13 GHz with Hyper Threading v Memory l 4GB v Disk l 7,200 rpm SATA mechanical Hard Disk Drive * 1 v OS l Cent OS 6.2 Our Server Specification 11
12.
Copyright © CELLANT
Corp. All Rights Reserved. h t t p : / / w w w . c e l l a n t . j p / v Use CDH4.2.1 + Impala 1.0 v Use hivebench in open-‐‑‒sourced benchmark tool “HiBench” l https://github.com/hibench v Modified datasets to 1/10 scale l Default configuration generates table with 1 billion rows v Modified query sentence l Deleted “INSERT INTO TABLE …” to evaluate read-‐‑‒only performance v Combines a few storage format with a few compression method l TextFile, SequenceFile, RCFile, ParquestFile l No compression, Gzip, Snappy v Comparison with job query latency v Average job latency over 5 measurements Benchmark 12
13.
Copyright © CELLANT
Corp. All Rights Reserved. h t t p : / / w w w . c e l l a n t . j p / v Uservisits table l 100 million rows l 16,895 MB as TextFile l Table Definitions • sourceIP string • destURL string • visitDate string • adRevenue double • userAgent string • countryCode string • languageCode string • searchWord string • duration int Modified Datasets 13 v Rankings table l 12 million rows l 744 MB as TextFile l Table Definitions • pageURL string • pageRank int • avgDuration int
14.
Copyright © CELLANT
Corp. All Rights Reserved. h t t p : / / w w w . c e l l a n t . j p / SELECT sourceIP, sum(adRevenue) as totalRevenue, avg(pageRank) FROM rankings_̲t R JOIN ( SELECT sourceIP, destURL, adRevenue FROM uservisits_̲t UV WHERE (datediff(UV.visitDate, '1999-‐‑‒01-‐‑‒01')>=0 AND datediff(UV.visitDate, '2000-‐‑‒01-‐‑‒01')<=0) ) NUV ON (R.pageURL = NUV.destURL) group by sourceIP order by totalRevenue DESC limit 1; Modified Query 14
15.
Copyright © CELLANT
Corp. All Rights Reserved. h t t p : / / w w w . c e l l a n t . j p / Benchmark Result (Hive) 15 0 50 100 150 200 250 No Comp. Gzip Snappy Gzip Snappy TextFileSequenceFileRCFile 235.843 227.883 213.616 234.289 197.894 Avg. Job Latency [sec]
16.
Copyright © CELLANT
Corp. All Rights Reserved. h t t p : / / w w w . c e l l a n t . j p / Benchmark Result (Impala) 16 0 50 100 150 200 250 No Comp. Gzip Snappy Gzip Snappy Snappy Text File Sequence FileRCFile Parquet File 36.61 29.736 24.024 26.083 19.586 16.2 Avg. Job Latency [sec]
17.
Copyright © CELLANT
Corp. All Rights Reserved. h t t p : / / w w w . c e l l a n t . j p / v HiveとImpalaは使い分けが重要 l 耐障害性を備えたHiveはバッチ処理理 l Impalaはアドホックなクエリ v Impalaは可能な限りメモリを使う設計 v mem_̲limitオプションを使う l PartitionテーブルをParquetに変換する場合、mem_̲limit は効かないバグがある(IMPALA-‐‑‒257 ⇒ 1.1でFix) v 2つのJOINの使い分け l 基本的には”partitioned join”を使うべき l ”A JOIN B”の場合に、BのサイズがAのサイズより極めて ⼩小さい時は”broadcast join”の⽅方が⾼高速な可能性あり Impalaを上⼿手く活⽤用するためのTIPS 17
18.
Copyright © CELLANT
Corp. All Rights Reserved. h t t p : / / w w w . c e l l a n t . j p / v Cloudera Manager 4.6.0 + CDH4.3.0 現在のHadoopクラスタの構成(全20台) 18 Cloudera Manager Hue プライマリ セカンダリ マスターサーバ群 スレーブサーバ群(10台+4台)管理サーバ ・・・・・・・ Zookeeper JournalNode NameNode Impalad TaskTracker DataNode HDFS HA Zookeeper HiveServer JobTracker JournalNode Zookeeper HMaster Zookeeper StateStored Hive Metastore ・・・・・ HRegionServer DataNode HRegionServer DataNode Impalad TaskTracker DataNode Zookeeper JournalNode NameNode
19.
Copyright © CELLANT
Corp. All Rights Reserved. h t t p : / / w w w . c e l l a n t . j p / v HiveとImpalaに対してGUIから実⾏行行可能 Hueを利利⽤用したクエリ実⾏行行 19 Hive Impala
20.
Copyright © CELLANT
Corp. All Rights Reserved. h t t p : / / w w w . c e l l a n t . j p / v HiveServer2への移⾏行行 l 要望が多かったセキュリティと同時実⾏行行をサポート l HiveServer1との後⽅方互換性がないため、バッチソフト ウェアの改修が必要 ずっと移⾏行行を検討しているものの、時間の都合で… v Hive Storage Formatの変更更 l RCFile + Snappyを利利⽤用していたが変換にあまりにも時間 がかかっていたため、TextFile + Gzipに変更更 l ImpalaはTextFile + Gzipをサポートしてない サポート時期も未定…LZOへの移⾏行行も視野に… 現状の課題 20
21.
Copyright © CELLANT
Corp. All Rights Reserved. h t t p : / / w w w . c e l l a n t . j p / 21 ご静聴ありがとうございました。
Download