9. 9
Amebaのログ解析基盤:Patriot
昨年のCloudera World Tokyo で運用体制等について紹介
Amebaにおけるログ解析基盤Patriotの活用事例
http://www.slideshare.net/cyberagent/cloudera-world-tokyo-2013
株式会社サイバーエージェント
44. 44
•スキーマ設計
株式会社サイバーエージェント
RowKey
ColumnFamily
Column
Value
<サービスID>_<日時フォーマット>_
<カテゴリID>_<サブカテゴリID>_
<オブジェクト>
d
<count>
…
h
<count>
…
m
<count>
トレンド分析システム
45. 45
トレンド分析システム
•スキーマ設計
株式会社サイバーエージェント
RowKey
ColumnFamily
Column
Value
<サービスID>_<日時フォーマット>_
<カテゴリID>_<サブカテゴリID>_
<オブジェクト>
d
<count>
…
h
<count>
…
m
<count>
サービスを一意に 識別するID
46. 46
トレンド分析システム
•スキーマ設計
株式会社サイバーエージェント
RowKey
ColumnFamily
Column
Value
<サービスID>_<日時フォーマット>_
<カテゴリID>_<サブカテゴリID>_
<オブジェクト>
d
<count>
…
h
<count>
…
m
<count>
時系列の種類ごとに フォーマットされた日時 Daily -> yyyyMMdd Hourly -> yyyyMMddHH 10分ごと -> yyyyMMddHHm0
47. 47
トレンド分析システム
•スキーマ設計
株式会社サイバーエージェント
RowKey
ColumnFamily
Column
Value
<サービスID>_<日時フォーマット>_
<カテゴリID>_<サブカテゴリID>_
<オブジェクト>
d
<count>
…
h
<count>
…
m
<count>
『検索ワード』、『投稿画像』 など、カテゴリを識別するID
48. 48
トレンド分析システム
•スキーマ設計
株式会社サイバーエージェント
RowKey
ColumnFamily
Column
Value
<サービスID>_<日時フォーマット>_
<カテゴリID>_<サブカテゴリID>_
<オブジェクト>
d
<count>
…
h
<count>
…
m
<count>
『投稿画像』 の 『いいね』、 『コメント』など、カテゴリを 更に細分化するID (任意)
49. 49
トレンド分析システム
•スキーマ設計
株式会社サイバーエージェント
RowKey
ColumnFamily
Column
Value
<サービスID>_<日時フォーマット>_
<カテゴリID>_<サブカテゴリID>_
<オブジェクト>
d
<count>
…
h
<count>
…
m
<count>
『検索ワード』の『AKB』など、 分析対象となるオブジェクト
50. 50
トレンド分析システム
•スキーマ設計
株式会社サイバーエージェント
RowKey
ColumnFamily
Column
Value
<サービスID>_<日時フォーマット>_
<カテゴリID>_<サブカテゴリID>_
<オブジェクト>
d
<count>
…
h
<count>
…
m
<count>
時系列の種類によって ColumnFamilyを分ける Daily -> d Hourly -> h 10分ごと -> m
51. 51
トレンド分析システム
•スキーマ設計
株式会社サイバーエージェント
オブジェクトに対する アクティビティのカウント HBaseのカウンタ機能を利用
RowKey
ColumnFamily
Column
Value
<サービスID>_<日時フォーマット>_
<カテゴリID>_<サブカテゴリID>_
<オブジェクト>
d
<count>
…
h
<count>
…
m
<count>