Awsでつくるapache kafkaといろんな悩み

AWSでつくるApache Kafkaといろんな悩み
もう１つのHadoop Summit
2016/12/14
Future Architect Inc,
Keigo Suda

AWS上でKafkaを利⽤するために考えたこと
ü どのようなポイントがあったか
ü どのようにそのポイントに対応したか
ü (Kafka on クラウドの情報って以外と少ない)
Kafka on AWS(⼩中規模)の話
※資料は終了後公開します

＊ Technology Innovation Group スペシャリスト
＊今の専⾨ -> ⼤きいデータを扱う領域(インフラ〜アプリ)
＊最近はもっぱらKafkaとストリーム処理エンジンの諸々
須⽥桂伍 (すだけいご)
@keigodasu

宣伝
l Kafkaの細かい話をします

もくじ
l IoTのためのデータプラットフォームを作っている話
l Kafka on AWSの話

IoTのための
データプラットフォームを作っている話

IoTプラットフォームの説明
l ⼯場内の各センサーデータを収集・加⼯・蓄積・分析するための基盤
l IoTといってもいわゆるIIoT(Industrial Internet of Things)
l 世界中にある製造拠点を対象に展開していく
収集加⼯蓄積分析

IoTプラットフォームの説明
収集加⼯蓄積分析連携
既存システム
API
API
API
API

IoTプラットフォームの全体像
収集加⼯蓄積分析連携
既存システム
API
API
API
API
ここの話をします

Kafkaの構成
3
Availability Zone(Active) Availability Zone(Standby)
Mirror Maker
✖ 3✖
メッセージ登録 Audit サービス監視
・・・
3✖ 3✖
Audit サービス監視
アーカイブ
メタデータ管理
エッジサーバエッジサーバエッジサーバ

Apache Kafkaとは
l 分散メッセージングシステムのひとつ
l もう定番のひとつになりつつある？

そもそもなんでKafka on AWS
l プラットフォーム⾮依存
l 海外への展開も考慮し、その都度適切なクラウドプラットフォームを選べるようにしたかった
l 肝であるプラットフォームの⼊り⼝はつくりこみたかった
l 今回の仕組み上、⼊り⼝兼プラットフォーム全体のバッファであるメッセージングは⾊々とつく
り込みたかったため、挙動やクセも含め中⾝のわかるプロダクトが適していた
l 機密なデータも扱うのでVPC(閉域に閉じたかった)
l 製造に必要な機密情報もやりとりされるため閉域網内でやりとりしたい・蓄積したい

Kafka on AWSといえばNetflix
l ブログやスライドなど情報はちらほら公開されている
l そもそもスケール感が違いすぎるのでほんとに参考程度

設計にあたっての主なポイント
l クラスタ構成配置
l Producer/Consumer
l トピック設計
l その他の細々
本当はもっといろいろテッキーな話したい・・・別の機会に

Kafkaの構成
3
Availability Zone(Active) Availability Zone(Standby)
Mirror Maker
クラスタ構成配置
Producer
Consumer
その他の細々トピック設計
✖ 3✖
メッセージ登録 Audit サービス監視
・・・
3✖ 3✖
Audit サービス監視
アーカイブ
メタデータ管理
エッジサーバエッジサーバエッジサーバ

KafkaでマルチAZどうする問題
l マネージドのつらみ、この点Kinesisはさすが
l AZまたぎのクラスタ構成 or AZ毎にクラスタ配置
Availability Zone Availability Zone Availability Zone Availability Zone
AZまたぎのクラスタ構成 AZ毎にクラスタ配置
Replication
Producer
Consumer
トピック設計その他の細々

AZ毎にクラスタを配置
l ⾊々と最後まで決めかねた部分(今もちょっと迷う)
l 設定変更や稼働後のテスト等でのクロスチェックなどでは⾊々と都合がいい
l AZ障害時は切り替わるまでの時間の発⽣データを拠点のエッジサーバ上に蓄
積できるため、復旧後に再送
Producer
Consumer

Producer処理はAPIとして公開
l 拠点にあるエッジサーバはライトに保ちたかった
l ⼯場ではそもそもサーバをメンテナンスできる⼈も少ない
l 極⼒は単純な右から左の処理にとどめる
l プラットフォームの⼊り⼝としてKafkaを直接さらすのはいろいろつらい
l セキュリティまわり(認証認可など)
l 拠点側ではとりあえずデータを投げて、プラットフォーム側のロジックで救う
l OSSのツールはどれも結構機能が多すぎたためAPIは⾃作
l HTTPのエンドポイントを設けられるものは増えてきたがそんなに機能いらない
Producer
Consumer

Producer
l API/Producer処理はGoで開発
l クライアントライブラリはSaramaを利⽤
Producer
Consumer

(参考)いろいろあるよGoのクライアント
l 主だったものは以下にまとまっている
l https://cwiki.apache.org/confluence/display/KAFKA/Clients
l どれも機能として惜しいものが多いので、シンプルな利⽤にとどめておく⽅がいいかも
l 無難にJavaのAPIの⽅が何かと捗る・・・
Producer
Consumer

Broker接続先はInternal ELB
l BrokerはInternal ELBにアタッチ
l 接続先クラスタの切り替えはエイリアスの付け替えで
Producer
Consumer
Availability Zone(Active) Availability Zone(Stanby)
エイリアスつけかえ

Consumerは無難
l Spark Streaming on EMRがConsumerのメイン
l 待機系として利⽤するAZでは、当該AZに切り替わった時に⽴ち上げる
l ⼀部Consumerアプリケーションはあるが部分的
l 正直SaramaはConsumer処理の実装が弱いため
Producer
Consumer

トピック設計
l トピックの作成単位は製造拠点(⼯場単位)
l ⼯場 * 製品 * ⼯程 * 利⽤⽤途(順序性を考慮するか等) * 連携システムなどを考慮し
た単位でトピック作成していくと爆発的に増えていくことを懸念
l 後続のSpark Streamingでロジックに応じた加⼯やルーティングを実施
l いったんKafkaにさえ⼊ってしまえばこっちのもの
Producer
Consumer

レプリカ & Acks
l トピックの利⽤⽤途に応じて設定は変更
l 業務利⽤(使えないと業務が⽌まるレベル)はロストさせない/早く失敗させる
l 運⽤管理⽤途(ログの収集など)はほどほどに
l 業務的に重要なものは以下でトピック作成(それ以外は適宜)
l acks = all
l replication.factor=3
l min.insync.replica=3
Producer
Consumer

件数の突合
l 簡易的なものを⼿組みで実装し、以下の件数を突合
l 拠点のエッジサーバから送信した件数 – KafkaにProduceされた件数・・・①
l エッジサーバ側で集約した件数 – ストリーム処理後の件数・・・②
l 取得した件数情報はCloudWatchのカスタムメトリクスで連携
Producer
Consumer
エッジサーバ
集約
①
②
集約データ集約データ
個別データ
個別データ
個別データ
個別データ
結果

Kafkaのメトリクス取得
l Consumerのオフセット値取得や遅延監視にlinkedin/Burrowを利⽤
l https://github.com/linkedin/Burrow
Producer
Consumer
{
"error": false,
"message": "consumer group topic offsets returned",
"offsets": [
26,
29,
28
],
"request": {
"cluster": “cluster01",
"group": ”consumer-group01",
"host": “hostname",
"topic": ”some_topic",
"url": "/v2/kafka/local/consumer/consumer-group01/topic/some_topic"
}
}
http://<Burow稼働ホスト>:8000/v2/kafka/cluster01/consumer/consumer-group01/topic/some_topic

オブジェクトストレージへのアーカイブ
l 候補は⾊々あるがちょっとまだ決めかねている。
l Kafka Connect
l Secor
l Streamx
l Embulk ・・・
l Kafkaを中⼼とするならKafka Connectだけど、より汎⽤性をもたせるなら
Embulkあたり？
Producer
Consumer

その他
l EC2でIPいろいろ変わっちゃう
l AnsibleとTerraformでつくり込み
Producer
Consumer

まとめ
l マルチAZをどう⾃前で担保するかが⼀番のポイント(だと思った)
l クラウド上でKafka運⽤しているかた、どんどん発信してほしい

ありがとうございました!!

Awsでつくるapache kafkaといろんな悩み

More Related Content

What's hot

Similar to Awsでつくるapache kafkaといろんな悩み

More from Keigo Suda

Awsでつくるapache kafkaといろんな悩み