Apache Kylinについて
Copyright (C)2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 5
アーキテクチャ
強み
弱み
• OLAPの実行エンジンで、キューブをプレビルドしオンライ
ンのクエリのレイテンシを下げる戦略をとっている
• プレビルドしたキューブはHBaseに配置し、クエリの実行
時にはプレビルドしたキューブから結果セットを生成する
• キューブをプレビルドするので、“BigAccount”的なファクトの
多重度の歪みに強い
• ディメンションの多重度の歪みに弱い
6.
アーキテクチャ
Copyright (C) 2016Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 6
出所:http://www.ebaytechblog.com/2014/10/20/announcing-kylin-extreme-olap-engine-for-big-data/
7.
強み
Copyright (C) 2016Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 7
• ほとんどのデータはパレート則的にファクトの多重度に歪みをみせる
• たとえば、取引をたくさんしてくれている上客(BigAccount)であればある
ほどその顧客に関するデータ量が大きくなる
• そのユーザーのためのクエリを返すためのワークロードが他の顧客より多
いので、そのユーザーにとってのUXが損なわれる
• Kylinのアーキテクチャだと、上記のようなファクトの歪みがクエリのレイテ
ンシに影響しない
• たとえば、顧客IDに対する集計をプレビルドしておけば、顧客別の集計結
果を返すために必要なワークロードはどの顧客でも1件のlookupになる
(こともある)
• さらに、アプリケーションからは、SQLを介してプレビルドしたキューブ
が透過的にみえるので、パフォーマンスチューニングのためにデータを再
設計する必要がない