23. Copyright(C) tritrue Inc. All rights Reserved.
システム構成図(Hbase利利⽤用時)
情報収集
インデックサー
検索API
NoSQL
検索索エンジン
…
・・・
Hbase
Master
RegionServer
HadoopDB
24. Copyright(C) tritrue Inc. All rights Reserved.
システム構成図(Cassandra利利⽤用時)
情報収集
インデックサー
検索API
NoSQL
検索索エンジン
…
テーブル毎に細かくクラスタを構築
25. Copyright(C) tritrue Inc. All rights Reserved.
Cassandraを利利⽤用してから思ったこと
■スケールアウトが容易易
・Azureを利利⽤用することでスケールアップも容易易
・ノードを増やすと安定
→⼿手間が掛からない
■レプリケーション
・データの反映まで時間が掛かる
・整合性の調整
→サービス的に問題なし
■P2P型
・マスタスレイブが無いため、ダウンタイム無し
→⼿手間が掛からない
■スキャンが出来ない
→現在苦戦中
26. Copyright(C) tritrue Inc. All rights Reserved.
実験・ユーザテスト環境構築
データ格納⽤用
分析結果格納⽤用
ユーザアクセス⽤用
ユーザテストアクセス⽤用
実験⽤用
Snapshot
Snapshot
Data
Data
Data
本番環境を容易易に複製可能
27. Copyright(C) tritrue Inc. All rights Reserved.
まとめ
■サービス開発から初期稼働時に⼤大量量データを扱いたい
→クラウド上でCassandra運⽤用
■課題
→コミュニティが少ない
→国内にCassandra運⽤用経験者が少ない
■今後の期待
→海外サービス事業社では利利⽤用拡⼤大中
■今後の展望
・ファイル・システムをHDFSからHadoopに変更更
・Spark導⼊入検討
・パフォーマンス向上(チューニングやテーブル再設計)
28. Copyright(C) tritrue Inc. All rights Reserved.
Confidential
検索索エンジンPatheeがMSAzureと
Cassandraをどう利利⽤用しているのか
To Be The Next Big Thing