SlideShare a Scribd company logo
1 of 35
Download to read offline
Impalaチューニングポイント 
ベストプラクティス 
ヤフー株式会社 
マーケティングソリューションカンパニー 
開発本部 業務開発部 
杉⼭山 朋広
⾃自⼰己紹介 
杉⼭山 朋広 
(すぎやま ともひろ) 
 
2002年年ヤフー株式会社⼊入社 
Yahoo!ウォレットやYahoo! JAPAN IDなどのIDサービスを経て 
現在は広告関連システムを担当 
 
Hadoopの経験は2012年年ごろから 
Copyright (C) 2014 Yahoo Japan Corporation. All Rights Reserved. 無断引⽤用・転載禁⽌止
アジェンダ 
単⼀一クエリがどれくらいの速度度か 
ストレージフォーマット 
パーティションとブロックサイズ 
 
並列列クエリをどれくらい処理理できるか 
並列列アクセスの注意点 
 
その他 
Hive,MapReduceのチューニング 
Copyright (C) 2014 Yahoo Japan Corporation. All Rights Reserved. 無断引⽤用・転載禁⽌止
Impalaについて 
HDFSを直接readする低レイテンシなSQLエンジン 
 
Evolution of Impala #hcj2014 
http://www.slideshare.net/Cloudera_̲jp/evolution-‐‑‒of-‐‑‒impala-‐‑‒hcj2014 
Copyright (C) 2014 Yahoo Japan Corporation. All Rights Reserved. 無断引⽤用・転載禁⽌止
検証データ 
以下のようなファイルをピックアップ 
⾏行行数11億⾏行行/⽇日 
サイズ12GB(gz)/⽇日 
形式tsvファイル 
蓄積期間396⽇日(13カ⽉月) 
総⾏行行数11億⾏行行/⽇日 × 396⽇日 = 約4,300億⾏行行 
総サイズ12GB/⽇日 × 396⽇日 = 約4,500GB 
Copyright (C) 2014 Yahoo Japan Corporation. All Rights Reserved. 無断引⽤用・転載禁⽌止
データ構造 
⽇日付>ID>属性でユニーク 
YYYYMMDDIDdevice...countrank… 
2014010114135382791...863123… 
2014010114135383201...128414… 
2014010114135408703...413638… 
::::::: 
2014123114135382792...343862… 
Copyright (C) 2014 Yahoo Japan Corporation. All Rights Reserved. 無断引⽤用・転載禁⽌止
検証環境 
以下の30ノードで検証環境を構築 
Cloudera Expressをインストール 
CPU6 core x 2 
RAM64 G 
DISK3T x 4 
Nodes30 nodes (4 x Master + 26 x Slave) 
CDH5.1 
Copyright (C) 2014 Yahoo Japan Corporation. All Rights Reserved. 無断引⽤用・転載禁⽌止
ストレージフォーマット 
Copyright (C) 2014 Yahoo Japan Corporation. All Rights Reserved. 無断引⽤用・転載禁⽌止
ストレージフォーマットとは 
Hadoopの処理理に最適化されたフォーマット 
RCFILE 
SEQUENCEFILE 
AVRO 
PARQUET 
デフォルトでTEXTのGzipやLZOがサポートされない 
= 最初にストレージフォーマットを決める必要がある 
Copyright (C) 2014 Yahoo Japan Corporation. All Rights Reserved. 無断引⽤用・転載禁⽌止
主要ストレージフォーマット⽐比較 
PARQUETを採⽤用 
FormatCODECsizeCreatecount(*) 
TEXTGzip11.4 GB-‐‑‒not support 
AVROSnappy14.7 GB280 s1340 ms 
SEQUENCEFILESnappy25.2 GB260 s1150 ms 
RCFILESnappy16.4 GB270 s830 ms 
PARQUETSnappy12.9 GB300 s730 ms 
Hiveで作成・Impalaでカウント 
1⽇日分(Gzip12GB・11億⾏行行)をサンプル 
Copyright (C) 2014 Yahoo Japan Corporation. All Rights Reserved. 無断引⽤用・転載禁⽌止
パーティションとブロックサイズ 
Copyright (C) 2014 Yahoo Japan Corporation. All Rights Reserved. 無断引⽤用・転載禁⽌止
ブロックサイズの最適化 
HDFSのブロックサイズの他に 
PARQUETのブロックサイズ設定もある 
 
適切切な値を設定する事で 
レスポンスの向上が期待できる 
Copyright (C) 2014 Yahoo Japan Corporation. All Rights Reserved. 無断引⽤用・転載禁⽌止
パーティションによる分割 
特定のルールでデータをグループ化して別々に保存 
透過的に1テーブルとして扱われる 
HDFS 
DIR 
MyTable 
HDFS 
DIR2 
HDFS 
DIR1 
MyTable 
dt=20140101 
dt=20140102 
: 
dt=20141231 
select * from 
MyTable 
select * from 
MyTable 
Copyright (C) 2014 Yahoo Japan Corporation. All Rights Reserved. 無断引⽤用・転載禁⽌止
チューニング 
パーティションによりファイルの分割度度を調整 
64分割 
128分割 
256分割 
 
必ずHDFSのブロックサイズの⽅方を⼤大きくする 
dfs.block.size > parquet.block.size 
Copyright (C) 2014 Yahoo Japan Corporation. All Rights Reserved. 無断引⽤用・転載禁⽌止
検証クエリ(1⽇日分) 
11億⾏行行→3,000⾏行行の絞り込み 
サイズは300K程度度 
 select ID, device, sum(count), sum(...) 
from mytable 
where ID = 1413538320 
group by ID, device; 
Copyright (C) 2014 Yahoo Japan Corporation. All Rights Reserved. 無断引⽤用・転載禁⽌止
ブロックサイズ⽐比較 
検証データ1⽇日分(Gzip11.4GB)を分割数を変えて⽐比較 
⼤大中⼩小 
ファイル数64128256 
HDFSブロックサイズ512 MB256 MB128 MB 
PARQUETブロックサイズ256 MB128 MB64 MB 
平均ファイルサイズ174 MB83 MB40 MB 
最⼩小ファイルサイズ84 MB36 MB11 MB 
最⼤大ファイルサイズ284 MB180 MB110 MB 
最⼤大ファイルの応答時間6.11 s4.32 s3.05 s 
Copyright (C) 2014 Yahoo Japan Corporation. All Rights Reserved. 無断引⽤用・転載禁⽌止
検証クエリ(13ヶ⽉月分) 
256分割で13ヶ⽉月分4,300億⾏行行のデータを⽣生成 
4,300億⾏行行→3,000⾏行行の絞り込み 
サイズは300K程度度 
 select ID, device, sum(count), sum(...) 
from mytable 
where ID = 1413538320 
group by ID, device; 
Copyright (C) 2014 Yahoo Japan Corporation. All Rights Reserved. 無断引⽤用・転載禁⽌止
検証データ全量量テスト 
検証データ全量量4,300億⾏行行に対する検証クエリの結果 
試⾏行行数応答時間 
1回⽬目351.8 s 
2回⽬目 12.5 s 
3回⽬目 11.7 s 
4回⽬目 11.3 s 
5回⽬目 11.5 s 
メタ情報のリフレッシュ直後だけ5〜~6分かかる 
Copyright (C) 2014 Yahoo Japan Corporation. All Rights Reserved. 無断引⽤用・転載禁⽌止
並列列アクセスの注意点 
Copyright (C) 2014 Yahoo Japan Corporation. All Rights Reserved. 無断引⽤用・転載禁⽌止
並列列クエリ 
Impaladの各ノードに並列列にクエリを発⾏行行 
Impalad 
Query Planner 
Query Coordinator 
Query Exec Engine 
Impalad 
Query Planner 
Query Coordinator 
Query Exec Engine 
Impalad 
Query Planner 
Query Coordinator 
Query Exec Engine 
select … 
where 
ID = 1413538320 and 
YYYYMMDD = 20140101 
select … 
where 
ID = 1413538320 and 
YYYYMMDD = 20140101 
select … 
where 
ID = 1413538320 and 
YYYYMMDD = 20140101 
Copyright (C) 2014 Yahoo Japan Corporation. All Rights Reserved. 無断引⽤用・転載禁⽌止
並列列クエリ:結果 
20 
18 
16 
14 
12 
10 
8 
6 
4 
2 
0 
最⼤大25並列列で、5秒程度度の遅延 
12345678910111213141516171819202122232425 
avg 
sec 
parallel reqs 
Copyright (C) 2014 Yahoo Japan Corporation. All Rights Reserved. 無断引⽤用・転載禁⽌止
遅延の原因 
同じブロックへのアクセス集中 
Impalad 
Query Planner 
Query Coordinator 
Query Exec Engine 
Impalad 
Query Planner 
Query Coordinator 
Query Exec Engine 
Impalad 
Query Planner 
Query Coordinator 
Query Exec Engine 
blk-‐‑‒X 
select … 
where 
ID = 1413538320 and 
YYYYMMDD = 20140101 
select … 
where 
ID = 1413538320 and 
YYYYMMDD = 20140101 
select … 
where 
ID = 1413538320 and 
YYYYMMDD = 20140101 
同じブロックへの並列列クエリは 
ホットスポットを⽣生む 
Copyright (C) 2014 Yahoo Japan Corporation. All Rights Reserved. 無断引⽤用・転載禁⽌止
並列列クエリの注意点 
できるだけ別々のブロックにアクセスする 
Impalad 
Query Planner 
Query Coordinator 
Query Exec Engine 
Impalad 
Query Planner 
Query Coordinator 
Query Exec Engine 
Impalad 
Query Planner 
Query Coordinator 
Query Exec Engine 
blk-‐‑‒b 
select … 
where 
ID = 1413530001 and 
YYYYMMDD = 20140101 
select … 
where 
ID = 1413530002 and 
YYYYMMDD = 20140101 
select … 
where 
ID = 1413530003 and 
YYYYMMDD = 20140101 
blk-‐‑‒ablk-‐‑‒c 
Copyright (C) 2014 Yahoo Japan Corporation. All Rights Reserved. 無断引⽤用・転載禁⽌止
結果⽐比較 
20 
15 
10 
5 
0 
25並列列での遅延を3秒くらい軽減できた 
12345678910111213141516171819202122232425 
avg 
sec 
parallel reqs 
同ブロックアクセス別ブロックアクセス 
Copyright (C) 2014 Yahoo Japan Corporation. All Rights Reserved. 無断引⽤用・転載禁⽌止
Hive,MapReduceのチューニング 
Copyright (C) 2014 Yahoo Japan Corporation. All Rights Reserved. 無断引⽤用・転載禁⽌止
Hiveの利利⽤用 
Metastoreの作成は⽐比較的⻑⾧長い 
(数10分くらい) 
 
MapReduceやOozieで制御 
 
但しHiveMetastoreとImpalaStateStoreの 
同期オペレーションが必要 
RawData(tsv) 
Hive 
(MapReduce) 
Refresh 
ImpalaStateStore 
※⼿手オペ 
Copyright (C) 2014 Yahoo Japan Corporation. All Rights Reserved. 無断引⽤用・転載禁⽌止
Hiveジョブのエラー 
ParquetテーブルをHiveで作成 
Hiveジョブのreducerがエラー 
Examining task ID: task_1407388082801_0126_r_000014 (and more) from job job_1407388082801_0126 
Examining task ID: task_1407388082801_0126_r_000027 (and more) from job job_1407388082801_0126 
Task with the most failures(4): 
----- 
Task ID: 
task_1407388082801_0126_r_000009 
URL: 
http://test1.yahoo.co.jp:8088/taskdetails.jsp? 
jobid=job_1407388082801_0126tipid=task_1407388082801_0126_r_000009 
----- 
Diagnostic Messages for this Task: 
Error: Java heap space 
Copyright (C) 2014 Yahoo Japan Corporation. All Rights Reserved. 無断引⽤用・転載禁⽌止
原因:メモリ不不⾜足 
parquet.block.size 
Parquet x 1ファイルあたりの割当メモリ 
default : 134,217,728(128MB) 
 
パーティション数分のメモリが必要 
クラスタ全体:128MB x 256partitions = 32GB 
ノード当たり:32GB ÷ 26nodes = 約1.23GB 
 
初期のメモリ設定値が1GB/ノードだった 
Copyright (C) 2014 Yahoo Japan Corporation. All Rights Reserved. 無断引⽤用・転載禁⽌止
対処 
以下のパラメータを⾒見見直して解消 
mapreduce.map.memory.mb 
mapreduce.map.java.opts.max.heap 
mapreduce.reduce.memory.mb 
mapreduce.reduce.java.opts.max.heap 
 
ブロックサイズの引き下げでもOK 
パーティションあたりの平均ファイルサイズが⼩小さい場合 
例例)parquet.block.size = 67,108,864 
 
Parquetの作成にはメモリが必要 
Copyright (C) 2014 Yahoo Japan Corporation. All Rights Reserved. 無断引⽤用・転載禁⽌止
まとめ 
Copyright (C) 2014 Yahoo Japan Corporation. All Rights Reserved. 無断引⽤用・転載禁⽌止
処理理時間のイメージ 
Impala:数秒〜~数10秒 ※ 
MapReduce:数分〜~数時間 
HBase:ミリ秒〜~数秒 
 
※)但しリフレッシュ後の初回は数分 
Copyright (C) 2014 Yahoo Japan Corporation. All Rights Reserved. 無断引⽤用・転載禁⽌止
並列列クエリの注意点 
同⼀一ブロックへの並列列アクセスは避ける 
 
同⼀一クエリを避けてノード数を増やせば 
並列列性能が期待できる 
Copyright (C) 2014 Yahoo Japan Corporation. All Rights Reserved. 無断引⽤用・転載禁⽌止
向いているサービス 
 
時系列列データの参照系 
明細 
履履歴情報
今後の課題・関⼼心 
どこまでスケールするか? 
100 nodes? 1000 nodes? 
 
Impala 2.0 
 
Impala + HBase 
Copyright (C) 2014 Yahoo Japan Corporation. All Rights Reserved. 無断引⽤用・転載禁⽌止
ご清聴ありがとうございました

More Related Content

What's hot

What's hot (20)

Introduction to Impala ~Hadoop用のSQLエンジン~ #hcj13w
Introduction to Impala ~Hadoop用のSQLエンジン~ #hcj13wIntroduction to Impala ~Hadoop用のSQLエンジン~ #hcj13w
Introduction to Impala ~Hadoop用のSQLエンジン~ #hcj13w
 
「新製品 Kudu 及び RecordServiceの概要」 #cwt2015
「新製品 Kudu 及び RecordServiceの概要」 #cwt2015「新製品 Kudu 及び RecordServiceの概要」 #cwt2015
「新製品 Kudu 及び RecordServiceの概要」 #cwt2015
 
Apache Kuduは何がそんなに「速い」DBなのか? #dbts2017
Apache Kuduは何がそんなに「速い」DBなのか? #dbts2017Apache Kuduは何がそんなに「速い」DBなのか? #dbts2017
Apache Kuduは何がそんなに「速い」DBなのか? #dbts2017
 
#cwt2016 Apache Kudu 構成とテーブル設計
#cwt2016 Apache Kudu 構成とテーブル設計#cwt2016 Apache Kudu 構成とテーブル設計
#cwt2016 Apache Kudu 構成とテーブル設計
 
CDHの歴史とCDH5新機能概要 #at_tokuben
CDHの歴史とCDH5新機能概要 #at_tokubenCDHの歴史とCDH5新機能概要 #at_tokuben
CDHの歴史とCDH5新機能概要 #at_tokuben
 
Apache Hadoop YARNとマルチテナントにおけるリソース管理
Apache Hadoop YARNとマルチテナントにおけるリソース管理Apache Hadoop YARNとマルチテナントにおけるリソース管理
Apache Hadoop YARNとマルチテナントにおけるリソース管理
 
Impala データサイエンティストのための 高速大規模分散基盤 #tokyowebmining
Impala データサイエンティストのための 高速大規模分散基盤 #tokyowebminingImpala データサイエンティストのための 高速大規模分散基盤 #tokyowebmining
Impala データサイエンティストのための 高速大規模分散基盤 #tokyowebmining
 
Userdiveによるimpala導入へのミチ
Userdiveによるimpala導入へのミチUserdiveによるimpala導入へのミチ
Userdiveによるimpala導入へのミチ
 
Kuduを調べてみた #dogenzakalt
Kuduを調べてみた #dogenzakaltKuduを調べてみた #dogenzakalt
Kuduを調べてみた #dogenzakalt
 
大規模データに対するデータサイエンスの進め方 #CWT2016
大規模データに対するデータサイエンスの進め方 #CWT2016大規模データに対するデータサイエンスの進め方 #CWT2016
大規模データに対するデータサイエンスの進め方 #CWT2016
 
HBaseサポート最前線 #hbase_ca
HBaseサポート最前線 #hbase_caHBaseサポート最前線 #hbase_ca
HBaseサポート最前線 #hbase_ca
 
Evolution of Impala #hcj2014
Evolution of Impala #hcj2014Evolution of Impala #hcj2014
Evolution of Impala #hcj2014
 
Troubleshooting Using Cloudera Manager #cwt2015
Troubleshooting Using Cloudera Manager #cwt2015Troubleshooting Using Cloudera Manager #cwt2015
Troubleshooting Using Cloudera Manager #cwt2015
 
G-Tech2015 Hadoop/Sparkを中核としたビッグデータ基盤_20151006
G-Tech2015 Hadoop/Sparkを中核としたビッグデータ基盤_20151006G-Tech2015 Hadoop/Sparkを中核としたビッグデータ基盤_20151006
G-Tech2015 Hadoop/Sparkを中核としたビッグデータ基盤_20151006
 
HBase×Impalaで作るアドテク 「GMOプライベートDMP」@HBaseMeetupTokyo2015Summer
HBase×Impalaで作るアドテク「GMOプライベートDMP」@HBaseMeetupTokyo2015SummerHBase×Impalaで作るアドテク「GMOプライベートDMP」@HBaseMeetupTokyo2015Summer
HBase×Impalaで作るアドテク 「GMOプライベートDMP」@HBaseMeetupTokyo2015Summer
 
CDH5最新情報 #cwt2013
CDH5最新情報 #cwt2013CDH5最新情報 #cwt2013
CDH5最新情報 #cwt2013
 
Hadoop Conference Japan_2016 セッション「顧客事例から学んだ、 エンタープライズでの "マジな"Hadoop導入の勘所」
Hadoop Conference Japan_2016 セッション「顧客事例から学んだ、 エンタープライズでの "マジな"Hadoop導入の勘所」Hadoop Conference Japan_2016 セッション「顧客事例から学んだ、 エンタープライズでの "マジな"Hadoop導入の勘所」
Hadoop Conference Japan_2016 セッション「顧客事例から学んだ、 エンタープライズでの "マジな"Hadoop導入の勘所」
 
Hadoop最新情報 - YARN, Omni, Drill, Impala, Shark, Vertica - MapR CTO Meetup 2014...
Hadoop最新情報 - YARN, Omni, Drill, Impala, Shark, Vertica - MapR CTO Meetup 2014...Hadoop最新情報 - YARN, Omni, Drill, Impala, Shark, Vertica - MapR CTO Meetup 2014...
Hadoop最新情報 - YARN, Omni, Drill, Impala, Shark, Vertica - MapR CTO Meetup 2014...
 
Hadoopトレーニング番外編 〜間違えられやすいHadoopの7つの仕様〜
Hadoopトレーニング番外編 〜間違えられやすいHadoopの7つの仕様〜Hadoopトレーニング番外編 〜間違えられやすいHadoopの7つの仕様〜
Hadoopトレーニング番外編 〜間違えられやすいHadoopの7つの仕様〜
 
HAWQをCDHで動かしてみた
HAWQをCDHで動かしてみたHAWQをCDHで動かしてみた
HAWQをCDHで動かしてみた
 

Viewers also liked

Cloudera impala
Cloudera impalaCloudera impala
Cloudera impala
外道 父
 

Viewers also liked (9)

Cloudera impalaの性能評価(Hiveとの比較)
Cloudera impalaの性能評価(Hiveとの比較)Cloudera impalaの性能評価(Hiveとの比較)
Cloudera impalaの性能評価(Hiveとの比較)
 
Cloudera impala
Cloudera impalaCloudera impala
Cloudera impala
 
HBaseCon 2012 参加レポート
HBaseCon 2012 参加レポートHBaseCon 2012 参加レポート
HBaseCon 2012 参加レポート
 
Data Science Summit 2012 レポート
Data Science Summit 2012 レポートData Science Summit 2012 レポート
Data Science Summit 2012 レポート
 
ML Pipelineで実践機械学習
ML Pipelineで実践機械学習ML Pipelineで実践機械学習
ML Pipelineで実践機械学習
 
Hadoop ~Yahoo! JAPANの活用について~
Hadoop ~Yahoo! JAPANの活用について~Hadoop ~Yahoo! JAPANの活用について~
Hadoop ~Yahoo! JAPANの活用について~
 
Impala Performance Update
Impala Performance UpdateImpala Performance Update
Impala Performance Update
 
Apache Flume and its use case in Manufacturing
Apache Flume and its use case in ManufacturingApache Flume and its use case in Manufacturing
Apache Flume and its use case in Manufacturing
 
Hadoop Summit 2015: Performance Optimization at Scale, Lessons Learned at Twi...
Hadoop Summit 2015: Performance Optimization at Scale, Lessons Learned at Twi...Hadoop Summit 2015: Performance Optimization at Scale, Lessons Learned at Twi...
Hadoop Summit 2015: Performance Optimization at Scale, Lessons Learned at Twi...
 

Similar to Impalaチューニングポイントベストプラクティス

WebDB Forum 2012 基調講演資料
WebDB Forum 2012 基調講演資料WebDB Forum 2012 基調講演資料
WebDB Forum 2012 基調講演資料
Recruit Technologies
 
今注目のSpark SQL、知っておきたいその性能とは 20151209 OSC Enterprise
今注目のSpark SQL、知っておきたいその性能とは 20151209 OSC Enterprise今注目のSpark SQL、知っておきたいその性能とは 20151209 OSC Enterprise
今注目のSpark SQL、知っておきたいその性能とは 20151209 OSC Enterprise
YusukeKuramata
 
[D22] Pivotal HD 2.0 -業界最高レベルSQL on Hadoop技術「HAWQ」解説- by Masayuki Matsushita
[D22] Pivotal HD 2.0 -業界最高レベルSQL on Hadoop技術「HAWQ」解説- by Masayuki Matsushita[D22] Pivotal HD 2.0 -業界最高レベルSQL on Hadoop技術「HAWQ」解説- by Masayuki Matsushita
[D22] Pivotal HD 2.0 -業界最高レベルSQL on Hadoop技術「HAWQ」解説- by Masayuki Matsushita
Insight Technology, Inc.
 
InfluxDB の概要 - sonots #tokyoinfluxdb
InfluxDB の概要 - sonots #tokyoinfluxdbInfluxDB の概要 - sonots #tokyoinfluxdb
InfluxDB の概要 - sonots #tokyoinfluxdb
Naotoshi Seo
 

Similar to Impalaチューニングポイントベストプラクティス (20)

Automation with SoftLayer and Zabbix
Automation with SoftLayer and ZabbixAutomation with SoftLayer and Zabbix
Automation with SoftLayer and Zabbix
 
PHPにおけるI/O多重化とyield
PHPにおけるI/O多重化とyieldPHPにおけるI/O多重化とyield
PHPにおけるI/O多重化とyield
 
PHPコアから読み解くPHP5.5
PHPコアから読み解くPHP5.5PHPコアから読み解くPHP5.5
PHPコアから読み解くPHP5.5
 
Beginner must-see! A future that can be opened by learning Hadoop
Beginner must-see! A future that can be opened by learning HadoopBeginner must-see! A future that can be opened by learning Hadoop
Beginner must-see! A future that can be opened by learning Hadoop
 
WebDB Forum 2012 基調講演資料
WebDB Forum 2012 基調講演資料WebDB Forum 2012 基調講演資料
WebDB Forum 2012 基調講演資料
 
ビッグデータ&データマネジメント展
ビッグデータ&データマネジメント展ビッグデータ&データマネジメント展
ビッグデータ&データマネジメント展
 
今注目のSpark SQL、知っておきたいその性能とは 20151209 OSC Enterprise
今注目のSpark SQL、知っておきたいその性能とは 20151209 OSC Enterprise今注目のSpark SQL、知っておきたいその性能とは 20151209 OSC Enterprise
今注目のSpark SQL、知っておきたいその性能とは 20151209 OSC Enterprise
 
[db tech showcase Tokyo 2017] C25: 世界最速のAnalytic DBがHadoopとタッグを組んだ! ~スケールアウト検...
[db tech showcase Tokyo 2017] C25: 世界最速のAnalytic DBがHadoopとタッグを組んだ! ~スケールアウト検...[db tech showcase Tokyo 2017] C25: 世界最速のAnalytic DBがHadoopとタッグを組んだ! ~スケールアウト検...
[db tech showcase Tokyo 2017] C25: 世界最速のAnalytic DBがHadoopとタッグを組んだ! ~スケールアウト検...
 
Ansibleで構成管理始める人のモチベーションをあげたい! (Cloudera World Tokyo 2014LT講演資料)
Ansibleで構成管理始める人のモチベーションをあげたい! (Cloudera World Tokyo 2014LT講演資料)Ansibleで構成管理始める人のモチベーションをあげたい! (Cloudera World Tokyo 2014LT講演資料)
Ansibleで構成管理始める人のモチベーションをあげたい! (Cloudera World Tokyo 2014LT講演資料)
 
MBAAで覚えるDBREの大事なおしごと
MBAAで覚えるDBREの大事なおしごとMBAAで覚えるDBREの大事なおしごと
MBAAで覚えるDBREの大事なおしごと
 
リクルート式Hadoopの使い方
リクルート式Hadoopの使い方リクルート式Hadoopの使い方
リクルート式Hadoopの使い方
 
[D22] Pivotal HD 2.0 -業界最高レベルSQL on Hadoop技術「HAWQ」解説- by Masayuki Matsushita
[D22] Pivotal HD 2.0 -業界最高レベルSQL on Hadoop技術「HAWQ」解説- by Masayuki Matsushita[D22] Pivotal HD 2.0 -業界最高レベルSQL on Hadoop技術「HAWQ」解説- by Masayuki Matsushita
[D22] Pivotal HD 2.0 -業界最高レベルSQL on Hadoop技術「HAWQ」解説- by Masayuki Matsushita
 
Hadoop~Yahoo!Japanの活用について
Hadoop~Yahoo!Japanの活用についてHadoop~Yahoo!Japanの活用について
Hadoop~Yahoo!Japanの活用について
 
【基礎編】社内向けMySQL勉強会
【基礎編】社内向けMySQL勉強会【基礎編】社内向けMySQL勉強会
【基礎編】社内向けMySQL勉強会
 
Hadoop~Yahoo! JAPANの活用について~
Hadoop~Yahoo! JAPANの活用について~Hadoop~Yahoo! JAPANの活用について~
Hadoop~Yahoo! JAPANの活用について~
 
Elasticsearch勉強会
Elasticsearch勉強会Elasticsearch勉強会
Elasticsearch勉強会
 
FastViewによるwebの自動最適化とビジネスメリット
FastViewによるwebの自動最適化とビジネスメリットFastViewによるwebの自動最適化とビジネスメリット
FastViewによるwebの自動最適化とビジネスメリット
 
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)
 
InfluxDB の概要 - sonots #tokyoinfluxdb
InfluxDB の概要 - sonots #tokyoinfluxdbInfluxDB の概要 - sonots #tokyoinfluxdb
InfluxDB の概要 - sonots #tokyoinfluxdb
 
Yahoo! JAPANのデータ基盤とHadoop #dbts2016
Yahoo! JAPANのデータ基盤とHadoop #dbts2016Yahoo! JAPANのデータ基盤とHadoop #dbts2016
Yahoo! JAPANのデータ基盤とHadoop #dbts2016
 

More from Yahoo!デベロッパーネットワーク

More from Yahoo!デベロッパーネットワーク (20)

ゼロから始める転移学習
ゼロから始める転移学習ゼロから始める転移学習
ゼロから始める転移学習
 
継続的なモデルモニタリングを実現するKubernetes Operator
継続的なモデルモニタリングを実現するKubernetes Operator継続的なモデルモニタリングを実現するKubernetes Operator
継続的なモデルモニタリングを実現するKubernetes Operator
 
ヤフーでは開発迅速性と品質のバランスをどう取ってるか
ヤフーでは開発迅速性と品質のバランスをどう取ってるかヤフーでは開発迅速性と品質のバランスをどう取ってるか
ヤフーでは開発迅速性と品質のバランスをどう取ってるか
 
オンプレML基盤on Kubernetes パネルディスカッション
オンプレML基盤on Kubernetes パネルディスカッションオンプレML基盤on Kubernetes パネルディスカッション
オンプレML基盤on Kubernetes パネルディスカッション
 
LakeTahoe
LakeTahoeLakeTahoe
LakeTahoe
 
オンプレML基盤on Kubernetes 〜Yahoo! JAPAN AIPF〜
オンプレML基盤on Kubernetes 〜Yahoo! JAPAN AIPF〜オンプレML基盤on Kubernetes 〜Yahoo! JAPAN AIPF〜
オンプレML基盤on Kubernetes 〜Yahoo! JAPAN AIPF〜
 
Persistent-memory-native Database High-availability Feature
Persistent-memory-native Database High-availability FeaturePersistent-memory-native Database High-availability Feature
Persistent-memory-native Database High-availability Feature
 
データの価値を最大化させるためのデザイン~データビジュアライゼーションの方法~ #devsumi 17-E-2
データの価値を最大化させるためのデザイン~データビジュアライゼーションの方法~ #devsumi 17-E-2データの価値を最大化させるためのデザイン~データビジュアライゼーションの方法~ #devsumi 17-E-2
データの価値を最大化させるためのデザイン~データビジュアライゼーションの方法~ #devsumi 17-E-2
 
eコマースと実店舗の相互利益を目指したデザイン #yjtc
eコマースと実店舗の相互利益を目指したデザイン #yjtceコマースと実店舗の相互利益を目指したデザイン #yjtc
eコマースと実店舗の相互利益を目指したデザイン #yjtc
 
ヤフーを支えるセキュリティ ~サイバー攻撃を防ぐエンジニアの仕事とは~ #yjtc
ヤフーを支えるセキュリティ ~サイバー攻撃を防ぐエンジニアの仕事とは~ #yjtcヤフーを支えるセキュリティ ~サイバー攻撃を防ぐエンジニアの仕事とは~ #yjtc
ヤフーを支えるセキュリティ ~サイバー攻撃を防ぐエンジニアの仕事とは~ #yjtc
 
Yahoo! JAPANのIaaSを支えるKubernetesクラスタ、アップデート自動化への挑戦 #yjtc
Yahoo! JAPANのIaaSを支えるKubernetesクラスタ、アップデート自動化への挑戦 #yjtcYahoo! JAPANのIaaSを支えるKubernetesクラスタ、アップデート自動化への挑戦 #yjtc
Yahoo! JAPANのIaaSを支えるKubernetesクラスタ、アップデート自動化への挑戦 #yjtc
 
ビッグデータから人々のムードを捉える #yjtc
ビッグデータから人々のムードを捉える #yjtcビッグデータから人々のムードを捉える #yjtc
ビッグデータから人々のムードを捉える #yjtc
 
サイエンス領域におけるMLOpsの取り組み #yjtc
サイエンス領域におけるMLOpsの取り組み #yjtcサイエンス領域におけるMLOpsの取り組み #yjtc
サイエンス領域におけるMLOpsの取り組み #yjtc
 
ヤフーのAIプラットフォーム紹介 ~AIテックカンパニーを支えるデータ基盤~ #yjtc
ヤフーのAIプラットフォーム紹介 ~AIテックカンパニーを支えるデータ基盤~ #yjtcヤフーのAIプラットフォーム紹介 ~AIテックカンパニーを支えるデータ基盤~ #yjtc
ヤフーのAIプラットフォーム紹介 ~AIテックカンパニーを支えるデータ基盤~ #yjtc
 
Yahoo! JAPAN Tech Conference 2022 Day2 Keynote #yjtc
Yahoo! JAPAN Tech Conference 2022 Day2 Keynote #yjtcYahoo! JAPAN Tech Conference 2022 Day2 Keynote #yjtc
Yahoo! JAPAN Tech Conference 2022 Day2 Keynote #yjtc
 
新技術を使った次世代の商品の見せ方 ~ヤフオク!のマルチビュー機能~ #yjtc
新技術を使った次世代の商品の見せ方 ~ヤフオク!のマルチビュー機能~ #yjtc新技術を使った次世代の商品の見せ方 ~ヤフオク!のマルチビュー機能~ #yjtc
新技術を使った次世代の商品の見せ方 ~ヤフオク!のマルチビュー機能~ #yjtc
 
PC版Yahoo!メールリニューアル ~サービスのUI/UX統合と改善プロセス~ #yjtc
PC版Yahoo!メールリニューアル ~サービスのUI/UX統合と改善プロセス~ #yjtcPC版Yahoo!メールリニューアル ~サービスのUI/UX統合と改善プロセス~ #yjtc
PC版Yahoo!メールリニューアル ~サービスのUI/UX統合と改善プロセス~ #yjtc
 
モブデザインによる多職種チームのコミュニケーション改善 #yjtc
モブデザインによる多職種チームのコミュニケーション改善 #yjtcモブデザインによる多職種チームのコミュニケーション改善 #yjtc
モブデザインによる多職種チームのコミュニケーション改善 #yjtc
 
「新しいおうち探し」のためのAIアシスト検索 #yjtc
「新しいおうち探し」のためのAIアシスト検索 #yjtc「新しいおうち探し」のためのAIアシスト検索 #yjtc
「新しいおうち探し」のためのAIアシスト検索 #yjtc
 
ユーザーの地域を考慮した検索入力補助機能の改善の試み #yjtc
ユーザーの地域を考慮した検索入力補助機能の改善の試み #yjtcユーザーの地域を考慮した検索入力補助機能の改善の試み #yjtc
ユーザーの地域を考慮した検索入力補助機能の改善の試み #yjtc
 

Impalaチューニングポイントベストプラクティス