SlideShare a Scribd company logo
© 2016 CAC Corporation. All rights reserved.
激増するデータを
効果的に処理するバッチソリューション
AZAREA-Cluster
2016年2月5日
株式会社シーエーシー ICT営業本部 技術企画
田中 等
thitoshi@cac.co.jp
© 2016 CAC Corporation. All rights reserved.
自己紹介
株式会社シーエーシー
今年50周年を迎える老舗のSIer
社員数約1,000名
田中 等
アーキテクトとして多くのシステム開発プロジェクト
に参画
最近は、個別プロジェクトのアーキテクチャだけでは
なくプロジェクトをまたいだソリューション開発を手
掛ける
1
© 2016 CAC Corporation. All rights reserved.
アジェンダ
バッチの問題
SIerの課題
AZAREA-Clusterによる解決
AZAREA-Clusterの効果
2
© 2016 CAC Corporation. All rights reserved. 3
バッチの問題
© 2016 CAC Corporation. All rights reserved.
バッチで問題になりがちなのは?
4
© 2016 CAC Corporation. All rights reserved.
なぜパフォーマンスが問題になるのか?
処理時間を見積るのが難しい
例えば、同じデータ量でも処理内容により時間はまっ
たく異なる
実際に作って測ってみないと分からない
分からないのでとりあえず大き目に見積る
必要以上のマシンスペック
それでも小さ過ぎる場合もある
5
© 2016 CAC Corporation. All rights reserved.
SQLの問題
SQLは非常にポピュラーな言語
バッチをSQL(ストアドプロシージャ)で開発す
ることも多い
SQLにも問題がある
6
!
© 2016 CAC Corporation. All rights reserved.
SQLの問題
実行計画によりパフォーマンスが劇的に変わる
インデックスが使われるか、メモリ内でソートできるか、…
SQLの書き方でパフォーマンスが劇的に変わる
技術者への依存性が高い
データ量によりパフォーマンスが劇的に変わる
ある日突然遅くなることがある
7
処理時間
データ量
© 2016 CAC Corporation. All rights reserved.
SQLの問題
SQLをチューニングすることによりパフォーマンスを改善できる
しかしチューニングにも限界がある
オンラインは処理件数が少ないので、何とかなりやすい
バッチは処理件数が多いので、チューニングでは不十分なことも多い
結局ハードウェアのスケールアップに頼ることも
高価なDWHアプライアンス製品が必要になることも
8
© 2016 CAC Corporation. All rights reserved.
並列分散処理の問題
並列分散処理では、スケールアウトによりパフォーマン
スを向上する
スケールアップに比べて向上の余地が大きい
処理時間を想定しやすい
マシン数を2倍にすれば、処理時間は1/2になるだろう
パブリッククラウドを利用すれば、コストを抑えられる
並列分散処理にも問題がある
9
!
© 2016 CAC Corporation. All rights reserved.
並列分散処理の問題
Hadoop
オープンソースの並列分散処理基盤
並列分散処理を今までよりも容易にした
今やビッグデータ処理のデファクトスタンダードとも言える
10
© 2016 CAC Corporation. All rights reserved.
並列分散処理の問題
Hadoopの課題
アプリケーションの開発は特殊で難しい
Hadoopエンジニアの数 << SQLエンジニアの数
少量データには向かない
処理実行のオーバーヘッドが大きい
※最近では、Hadoopを様々な点で改善した新たな並列分
散処理基盤、Sparkも注目されている
11
© 2016 CAC Corporation. All rights reserved.
もう1つの問題
データ量により最適なアーキテクチャが異なる
例えば、少量ならSQL、大量ならHadoop
大は小を兼ねない
 一般的に、大量データ用のアーキテクチャはコストパフォーマンスが悪い
設計時の見極めが難しい
必要十分なアーキテクチャは?
将来データ量が増えたらどうする?
アーキテクチャは簡単には変えられない
12
© 2016 CAC Corporation. All rights reserved.
バッチの問題のまとめ
SQL
大量データには向かない
Hadoop
少量データには向かない
開発が難しい
データ量により最適なアーキテクチャが異なる
しかし、データ量は変化する
13
方式
データ量
小~中規模 大規模
SQL ●
×
パフォーマンスの
低下
Hadoop
×
処理の
オーバーヘッド
▲
開発が難しい
© 2016 CAC Corporation. All rights reserved. 14
SIerの課題
© 2016 CAC Corporation. All rights reserved.
SIerの課題
「スクラッチ開発」中心では生き残れない
一から全てを開発するのではコストが掛かり過ぎる
競合他社と差別化しにくい
価格競争に陥りがち
製品・ソリューション中心に
複数の顧客に展開することによりコストダウン
競合他社には無い独自の製品・ソリューションを差別化要素に
15
© 2016 CAC Corporation. All rights reserved. 16
AZAREA-Clusterによる解決
© 2016 CAC Corporation. All rights reserved.
AZAREA-Clusterによる解決
17
SIerの課題バッチの問題
バッチの問題を
解決する製品を!
© 2016 CAC Corporation. All rights reserved.
大規模データの問題を解決
まずは大規模データの問題を解決することに
18
方式
データ量
小~中規模 大規模
SQL ●
×
パフォーマンスの
低下
Hadoop
×
処理の
オーバーヘッド
▲
開発が難しい
© 2016 CAC Corporation. All rights reserved.
大規模データの問題を解決
Hadoopを簡単に!
容易なAPI
 HadoopのAPIをラップし、業務アプリ的なAPIに
GUI開発ツール
 データフロー図を描くとバッチのソースコードが生成される
 必要に応じてソースコードをカスタマイズ
その他、デバッグ・テスト支援機能
19
Hadoop
AZAREA-Cluster
バッチアプリケーションGUI開発ツールフロー図
Java
© 2016 CAC Corporation. All rights reserved.
大規模データの問題を解決
AZAREA-Clusterにより大規模データ処理の問題を解決
20
方式
データ量
小~中規模 大規模
SQL ●
×
パフォーマンスの
低下
Hadoop
×
処理の
オーバーヘッド
▲
開発が難しい
AZAREA-Cluster
×
処理の
オーバーヘッド
●
開発は容易
© 2016 CAC Corporation. All rights reserved.
小~中規模データの問題を解決
業務バッチの現実
実際には「大規模データ」を扱う業務バッチは少なかった
Hadoopはオーバースペック
 数並列程度で十分
 つまり、マシン1台で十分
 オープンソースであってもコストは掛かる
 最低限のマシン数、環境構築、運用、サポート、…
Hadoop無しで実行できないか?
21
© 2016 CAC Corporation. All rights reserved.
小~中規模データの問題を解決
スタンドアローン実行モード
Hadoopは使わず単一マシンでマルチスレッド実行する
 1~16並列程度
Hadoopを参考に、独自の実行エンジンを開発
同じバッチがHadoopでもスタンドアローンでも動く
22
Hadoop
バッチアプリケーション
Java
AZAREA-Cluster
Hadoopラッパ スタンドアローン
実行エンジン
Hadoopモード スタンドアローンモード
© 2016 CAC Corporation. All rights reserved.
小~中規模データの問題を解決
AZAREA-Clusterによりアーキテクチャ不統一の問題を解決
23
方式
データ量
小~中規模 大規模
SQL ●
×
パフォーマンスの
低下
Hadoop
×
処理の
オーバーヘッド
▲
開発が難しい
AZAREA-Cluster ●
オーバーヘッド無し
●
開発は容易
© 2016 CAC Corporation. All rights reserved.
AZAREA-Clusterによる解決
データ量によらず同じアーキテクチャ
設計時にアーキテクチャを誤るリスクが無くなる
完成後もデータ量の変化に容易に対応できる
24
© 2016 CAC Corporation. All rights reserved. 25
AZAREA-Clusterの効果
© 2016 CAC Corporation. All rights reserved.
AZAREA-Clusterの効果
中規模データの業務バッチを高速化
製薬業向けの営業支援システム
薬の販売実績データを、分析のために加工・集計するバッチ
26
AZAREA-Cluster
バッチアプリケーション販売実績
データ
集計結果
© 2016 CAC Corporation. All rights reserved.
AZAREA-Clusterの効果
中規模データの業務バッチを高速化
中規模とは言え、SQLでは相当時間が掛かる
AZAREA-Clusterを使い、SQLより倍以上高速
スタンドアローンモード
8CPU
将来のデータ増加にも容易に対応できる
27
© 2016 CAC Corporation. All rights reserved.
AZAREA-Clusterの効果
画面とバッチとで業務処理を共通化
受託機関・基金・事業所様向けのCAC製年金管理パッケージ
 Micmari (みくまり)
多数の企業、多数の年金加入者の年金計算をバッチで処理
画面からも同様の処理を可能
28
画面
バッチ
業務処理
AZAREA-Cluster
業務処理
AZAREA-Cluster
少量データ
大量データ
Webサーバ
Hadoop
共通共通
© 2016 CAC Corporation. All rights reserved.
AZAREA-Clusterの効果
画面とバッチとで業務処理を共通化
業務処理をAZAREA-Clusterで実装
バッチでは、大量データ処理
Hadoopを利用
画面では、1件ずつ処理
生産性・保守性が向上
年金の制度変更や機能追加への迅速な対応が可能に
29
© 2016 CAC Corporation. All rights reserved.
AZAREA-Clusterの効果
IoTシステムの基盤として
30
機器
センサー
集計
可視化機械学習
制御
アラート
【スピードレイヤー】
【バッチレイヤー】
ルール
参照
バッチ
AZAREA-Cluster
データ
ベース
キュー
Streaming
© 2016 CAC Corporation. All rights reserved. 31
まとめ
© 2016 CAC Corporation. All rights reserved.
まとめ
AZAREA-Cluster
大規模データは、Hadoopを利用して高速処理
小~中規模データも、マルチスレッドで高速処理
データ量によらず、同じアーキテクチャで効率的に処理可能
32

More Related Content

What's hot

ストレージサービスからの情報漏えいにサヨナラ
ストレージサービスからの情報漏えいにサヨナラストレージサービスからの情報漏えいにサヨナラ
ストレージサービスからの情報漏えいにサヨナラ
Masato Nakamura
 
OpenStack環境の継続的インテグレーション
OpenStack環境の継続的インテグレーションOpenStack環境の継続的インテグレーション
OpenStack環境の継続的インテグレーション
エクイニクス・ジャパン
 
OpenStackを使用するメリット
OpenStackを使用するメリットOpenStackを使用するメリット
OpenStackを使用するメリット
ミランティスジャパン株式会社
 
Mackerel x Twilio ~レコチョクの場合~
Mackerel x Twilio ~レコチョクの場合~Mackerel x Twilio ~レコチョクの場合~
Mackerel x Twilio ~レコチョクの場合~
recotech
 
「やってみました SoftLayer クラウドゲートウェイ / NetApp AltaVault」
「やってみました SoftLayer クラウドゲートウェイ / NetApp AltaVault」「やってみました SoftLayer クラウドゲートウェイ / NetApp AltaVault」
「やってみました SoftLayer クラウドゲートウェイ / NetApp AltaVault」
softlayerjp
 
AWS Summit Tokyo 2015_NTTデータセッション(前半:クラウドを活用したオムニチャネル基盤構築)
AWS Summit Tokyo 2015_NTTデータセッション(前半:クラウドを活用したオムニチャネル基盤構築)AWS Summit Tokyo 2015_NTTデータセッション(前半:クラウドを活用したオムニチャネル基盤構築)
AWS Summit Tokyo 2015_NTTデータセッション(前半:クラウドを活用したオムニチャネル基盤構築)
Hinemos
 
AWS Summit Tokyo 2015_NTTデータセッション(後半:AWSを使ったシステム運用ノウハウ)
AWS Summit Tokyo 2015_NTTデータセッション(後半:AWSを使ったシステム運用ノウハウ)AWS Summit Tokyo 2015_NTTデータセッション(後半:AWSを使ったシステム運用ノウハウ)
AWS Summit Tokyo 2015_NTTデータセッション(後半:AWSを使ったシステム運用ノウハウ)
Hinemos
 
開発組織を急成長させる AWS 〜 Opt Technologies の歩みと AWS 活用
開発組織を急成長させる AWS 〜 Opt Technologies の歩みと AWS 活用開発組織を急成長させる AWS 〜 Opt Technologies の歩みと AWS 活用
開発組織を急成長させる AWS 〜 Opt Technologies の歩みと AWS 活用
Jiro Hiraiwa
 
新しいジョブに挑戦してみませんか?
新しいジョブに挑戦してみませんか?新しいジョブに挑戦してみませんか?
新しいジョブに挑戦してみませんか?
Masato Nakamura
 
サーバーの脆弱性管理に関して(OpenStack + Vuls) - OpenStack最新情報セミナー(2016年12月)
サーバーの脆弱性管理に関して(OpenStack + Vuls) - OpenStack最新情報セミナー(2016年12月)サーバーの脆弱性管理に関して(OpenStack + Vuls) - OpenStack最新情報セミナー(2016年12月)
サーバーの脆弱性管理に関して(OpenStack + Vuls) - OpenStack最新情報セミナー(2016年12月)
VirtualTech Japan Inc.
 
160724 jtf2016sre
160724 jtf2016sre160724 jtf2016sre
160724 jtf2016sre
OSSラボ株式会社
 
JobScheduler ユーザカンファレンス 2016 東京日産コンピュータシステム様 事例紹介
JobScheduler ユーザカンファレンス 2016 東京日産コンピュータシステム様 事例紹介JobScheduler ユーザカンファレンス 2016 東京日産コンピュータシステム様 事例紹介
JobScheduler ユーザカンファレンス 2016 東京日産コンピュータシステム様 事例紹介
Daisuke Ikeda
 
Sas University Editionを使おう(インストール編)
Sas University Editionを使おう(インストール編)Sas University Editionを使おう(インストール編)
Sas University Editionを使おう(インストール編)
Shibaura Institute of Technology
 
知って得する!パブリッククラウドをオンプレミスのように使う裏ワザ
知って得する!パブリッククラウドをオンプレミスのように使う裏ワザ知って得する!パブリッククラウドをオンプレミスのように使う裏ワザ
知って得する!パブリッククラウドをオンプレミスのように使う裏ワザ
エクイニクス・ジャパン
 

What's hot (14)

ストレージサービスからの情報漏えいにサヨナラ
ストレージサービスからの情報漏えいにサヨナラストレージサービスからの情報漏えいにサヨナラ
ストレージサービスからの情報漏えいにサヨナラ
 
OpenStack環境の継続的インテグレーション
OpenStack環境の継続的インテグレーションOpenStack環境の継続的インテグレーション
OpenStack環境の継続的インテグレーション
 
OpenStackを使用するメリット
OpenStackを使用するメリットOpenStackを使用するメリット
OpenStackを使用するメリット
 
Mackerel x Twilio ~レコチョクの場合~
Mackerel x Twilio ~レコチョクの場合~Mackerel x Twilio ~レコチョクの場合~
Mackerel x Twilio ~レコチョクの場合~
 
「やってみました SoftLayer クラウドゲートウェイ / NetApp AltaVault」
「やってみました SoftLayer クラウドゲートウェイ / NetApp AltaVault」「やってみました SoftLayer クラウドゲートウェイ / NetApp AltaVault」
「やってみました SoftLayer クラウドゲートウェイ / NetApp AltaVault」
 
AWS Summit Tokyo 2015_NTTデータセッション(前半:クラウドを活用したオムニチャネル基盤構築)
AWS Summit Tokyo 2015_NTTデータセッション(前半:クラウドを活用したオムニチャネル基盤構築)AWS Summit Tokyo 2015_NTTデータセッション(前半:クラウドを活用したオムニチャネル基盤構築)
AWS Summit Tokyo 2015_NTTデータセッション(前半:クラウドを活用したオムニチャネル基盤構築)
 
AWS Summit Tokyo 2015_NTTデータセッション(後半:AWSを使ったシステム運用ノウハウ)
AWS Summit Tokyo 2015_NTTデータセッション(後半:AWSを使ったシステム運用ノウハウ)AWS Summit Tokyo 2015_NTTデータセッション(後半:AWSを使ったシステム運用ノウハウ)
AWS Summit Tokyo 2015_NTTデータセッション(後半:AWSを使ったシステム運用ノウハウ)
 
開発組織を急成長させる AWS 〜 Opt Technologies の歩みと AWS 活用
開発組織を急成長させる AWS 〜 Opt Technologies の歩みと AWS 活用開発組織を急成長させる AWS 〜 Opt Technologies の歩みと AWS 活用
開発組織を急成長させる AWS 〜 Opt Technologies の歩みと AWS 活用
 
新しいジョブに挑戦してみませんか?
新しいジョブに挑戦してみませんか?新しいジョブに挑戦してみませんか?
新しいジョブに挑戦してみませんか?
 
サーバーの脆弱性管理に関して(OpenStack + Vuls) - OpenStack最新情報セミナー(2016年12月)
サーバーの脆弱性管理に関して(OpenStack + Vuls) - OpenStack最新情報セミナー(2016年12月)サーバーの脆弱性管理に関して(OpenStack + Vuls) - OpenStack最新情報セミナー(2016年12月)
サーバーの脆弱性管理に関して(OpenStack + Vuls) - OpenStack最新情報セミナー(2016年12月)
 
160724 jtf2016sre
160724 jtf2016sre160724 jtf2016sre
160724 jtf2016sre
 
JobScheduler ユーザカンファレンス 2016 東京日産コンピュータシステム様 事例紹介
JobScheduler ユーザカンファレンス 2016 東京日産コンピュータシステム様 事例紹介JobScheduler ユーザカンファレンス 2016 東京日産コンピュータシステム様 事例紹介
JobScheduler ユーザカンファレンス 2016 東京日産コンピュータシステム様 事例紹介
 
Sas University Editionを使おう(インストール編)
Sas University Editionを使おう(インストール編)Sas University Editionを使おう(インストール編)
Sas University Editionを使おう(インストール編)
 
知って得する!パブリッククラウドをオンプレミスのように使う裏ワザ
知って得する!パブリッククラウドをオンプレミスのように使う裏ワザ知って得する!パブリッククラウドをオンプレミスのように使う裏ワザ
知って得する!パブリッククラウドをオンプレミスのように使う裏ワザ
 

Similar to バッチソリューションAzarea cluster 2016

クラウドファースト時代の最適なシステム配置について
クラウドファースト時代の最適なシステム配置についてクラウドファースト時代の最適なシステム配置について
クラウドファースト時代の最適なシステム配置について
Kentaro Kamata
 
クラウドファースト時代の最適なシステム配置について
クラウドファースト時代の最適なシステム配置についてクラウドファースト時代の最適なシステム配置について
クラウドファースト時代の最適なシステム配置について
エクイニクス・ジャパン
 
kintone Cafe Japan 2016: kintone x 機械学習で実現する簡単名刺管理
kintone Cafe Japan 2016: kintone x 機械学習で実現する簡単名刺管理kintone Cafe Japan 2016: kintone x 機械学習で実現する簡単名刺管理
kintone Cafe Japan 2016: kintone x 機械学習で実現する簡単名刺管理
Takahiro Kubo
 
安心安全を食卓に届ける、Oisixのマイクロサービス
安心安全を食卓に届ける、Oisixのマイクロサービス安心安全を食卓に届ける、Oisixのマイクロサービス
安心安全を食卓に届ける、Oisixのマイクロサービス
小林 弘明
 
DLLAB Engineer Days:AIチームが履歴やリソース管理で疲弊してたので開発基盤作ってOSS化した話
DLLAB Engineer Days:AIチームが履歴やリソース管理で疲弊してたので開発基盤作ってOSS化した話DLLAB Engineer Days:AIチームが履歴やリソース管理で疲弊してたので開発基盤作ってOSS化した話
DLLAB Engineer Days:AIチームが履歴やリソース管理で疲弊してたので開発基盤作ってOSS化した話
Kamonohashi
 
日本におけるIT自動化導入の特殊な事情 - 菅原 亮、株式会社NTTデータ
日本におけるIT自動化導入の特殊な事情 - 菅原 亮、株式会社NTTデータ日本におけるIT自動化導入の特殊な事情 - 菅原 亮、株式会社NTTデータ
日本におけるIT自動化導入の特殊な事情 - 菅原 亮、株式会社NTTデータ
Puppet
 
はてなのインフラの歴史、そしてMackerelへ至る道とこれから
はてなのインフラの歴史、そしてMackerelへ至る道とこれから はてなのインフラの歴史、そしてMackerelへ至る道とこれから
はてなのインフラの歴史、そしてMackerelへ至る道とこれから
Rakuten Group, Inc.
 
OpenStack入門 2016/06/27
OpenStack入門 2016/06/27OpenStack入門 2016/06/27
OpenStack入門 2016/06/27
株式会社 NTTテクノクロス
 
DeNAが取り組む Software Engineer in Test
DeNAが取り組む Software Engineer in TestDeNAが取り組む Software Engineer in Test
DeNAが取り組む Software Engineer in Test
Masaki Nakagawa
 
2016年12月期 決算説明資料
2016年12月期 決算説明資料2016年12月期 決算説明資料
2016年12月期 決算説明資料
SIOS Corporation
 
20140619 dbtechshowcase osaka_2014_couchbase_x_metawater
20140619 dbtechshowcase osaka_2014_couchbase_x_metawater20140619 dbtechshowcase osaka_2014_couchbase_x_metawater
20140619 dbtechshowcase osaka_2014_couchbase_x_metawaterMasahiro Tomisugi
 
Yahoo! JAPANが実践するOpenStackと大規模環境でのコンテナ利用 #devsumi
Yahoo! JAPANが実践するOpenStackと大規模環境でのコンテナ利用 #devsumiYahoo! JAPANが実践するOpenStackと大規模環境でのコンテナ利用 #devsumi
Yahoo! JAPANが実践するOpenStackと大規模環境でのコンテナ利用 #devsumi
Yahoo!デベロッパーネットワーク
 
Aws発表資料(dac) 20160721
Aws発表資料(dac) 20160721Aws発表資料(dac) 20160721
Aws発表資料(dac) 20160721
Norikazu Yura
 
機械学習で泣かないためのコード設計
機械学習で泣かないためのコード設計機械学習で泣かないためのコード設計
機械学習で泣かないためのコード設計
Takahiro Kubo
 
【kintone hive 上海】ウィングアーク上海講演資料_160918
【kintone hive 上海】ウィングアーク上海講演資料_160918【kintone hive 上海】ウィングアーク上海講演資料_160918
【kintone hive 上海】ウィングアーク上海講演資料_160918
Cybozucommunity
 
アプリエンジニアでもできる閉域網構築のススメ!
アプリエンジニアでもできる閉域網構築のススメ!アプリエンジニアでもできる閉域網構築のススメ!
アプリエンジニアでもできる閉域網構築のススメ!
Tosihiyuki Hirai
 
Ansible・Serverspecベースの自動化フレームワークSHIFT wareの紹介
Ansible・Serverspecベースの自動化フレームワークSHIFT wareの紹介Ansible・Serverspecベースの自動化フレームワークSHIFT wareの紹介
Ansible・Serverspecベースの自動化フレームワークSHIFT wareの紹介
光平 八代
 
OpenStack summit report 2016 in barcelona
OpenStack summit report 2016 in barcelonaOpenStack summit report 2016 in barcelona
OpenStack summit report 2016 in barcelona
Yuki Yamashita
 
VadeSecure: フランスソフトウェアベンダーあるある
VadeSecure: フランスソフトウェアベンダーあるあるVadeSecure: フランスソフトウェアベンダーあるある
VadeSecure: フランスソフトウェアベンダーあるある
Katsumi INOUE
 
バッチを Akka Streams で再実装したら100倍速くなった話 #ScalaMatsuri
バッチを Akka Streams で再実装したら100倍速くなった話 #ScalaMatsuriバッチを Akka Streams で再実装したら100倍速くなった話 #ScalaMatsuri
バッチを Akka Streams で再実装したら100倍速くなった話 #ScalaMatsuri
Kazuki Negoro
 

Similar to バッチソリューションAzarea cluster 2016 (20)

クラウドファースト時代の最適なシステム配置について
クラウドファースト時代の最適なシステム配置についてクラウドファースト時代の最適なシステム配置について
クラウドファースト時代の最適なシステム配置について
 
クラウドファースト時代の最適なシステム配置について
クラウドファースト時代の最適なシステム配置についてクラウドファースト時代の最適なシステム配置について
クラウドファースト時代の最適なシステム配置について
 
kintone Cafe Japan 2016: kintone x 機械学習で実現する簡単名刺管理
kintone Cafe Japan 2016: kintone x 機械学習で実現する簡単名刺管理kintone Cafe Japan 2016: kintone x 機械学習で実現する簡単名刺管理
kintone Cafe Japan 2016: kintone x 機械学習で実現する簡単名刺管理
 
安心安全を食卓に届ける、Oisixのマイクロサービス
安心安全を食卓に届ける、Oisixのマイクロサービス安心安全を食卓に届ける、Oisixのマイクロサービス
安心安全を食卓に届ける、Oisixのマイクロサービス
 
DLLAB Engineer Days:AIチームが履歴やリソース管理で疲弊してたので開発基盤作ってOSS化した話
DLLAB Engineer Days:AIチームが履歴やリソース管理で疲弊してたので開発基盤作ってOSS化した話DLLAB Engineer Days:AIチームが履歴やリソース管理で疲弊してたので開発基盤作ってOSS化した話
DLLAB Engineer Days:AIチームが履歴やリソース管理で疲弊してたので開発基盤作ってOSS化した話
 
日本におけるIT自動化導入の特殊な事情 - 菅原 亮、株式会社NTTデータ
日本におけるIT自動化導入の特殊な事情 - 菅原 亮、株式会社NTTデータ日本におけるIT自動化導入の特殊な事情 - 菅原 亮、株式会社NTTデータ
日本におけるIT自動化導入の特殊な事情 - 菅原 亮、株式会社NTTデータ
 
はてなのインフラの歴史、そしてMackerelへ至る道とこれから
はてなのインフラの歴史、そしてMackerelへ至る道とこれから はてなのインフラの歴史、そしてMackerelへ至る道とこれから
はてなのインフラの歴史、そしてMackerelへ至る道とこれから
 
OpenStack入門 2016/06/27
OpenStack入門 2016/06/27OpenStack入門 2016/06/27
OpenStack入門 2016/06/27
 
DeNAが取り組む Software Engineer in Test
DeNAが取り組む Software Engineer in TestDeNAが取り組む Software Engineer in Test
DeNAが取り組む Software Engineer in Test
 
2016年12月期 決算説明資料
2016年12月期 決算説明資料2016年12月期 決算説明資料
2016年12月期 決算説明資料
 
20140619 dbtechshowcase osaka_2014_couchbase_x_metawater
20140619 dbtechshowcase osaka_2014_couchbase_x_metawater20140619 dbtechshowcase osaka_2014_couchbase_x_metawater
20140619 dbtechshowcase osaka_2014_couchbase_x_metawater
 
Yahoo! JAPANが実践するOpenStackと大規模環境でのコンテナ利用 #devsumi
Yahoo! JAPANが実践するOpenStackと大規模環境でのコンテナ利用 #devsumiYahoo! JAPANが実践するOpenStackと大規模環境でのコンテナ利用 #devsumi
Yahoo! JAPANが実践するOpenStackと大規模環境でのコンテナ利用 #devsumi
 
Aws発表資料(dac) 20160721
Aws発表資料(dac) 20160721Aws発表資料(dac) 20160721
Aws発表資料(dac) 20160721
 
機械学習で泣かないためのコード設計
機械学習で泣かないためのコード設計機械学習で泣かないためのコード設計
機械学習で泣かないためのコード設計
 
【kintone hive 上海】ウィングアーク上海講演資料_160918
【kintone hive 上海】ウィングアーク上海講演資料_160918【kintone hive 上海】ウィングアーク上海講演資料_160918
【kintone hive 上海】ウィングアーク上海講演資料_160918
 
アプリエンジニアでもできる閉域網構築のススメ!
アプリエンジニアでもできる閉域網構築のススメ!アプリエンジニアでもできる閉域網構築のススメ!
アプリエンジニアでもできる閉域網構築のススメ!
 
Ansible・Serverspecベースの自動化フレームワークSHIFT wareの紹介
Ansible・Serverspecベースの自動化フレームワークSHIFT wareの紹介Ansible・Serverspecベースの自動化フレームワークSHIFT wareの紹介
Ansible・Serverspecベースの自動化フレームワークSHIFT wareの紹介
 
OpenStack summit report 2016 in barcelona
OpenStack summit report 2016 in barcelonaOpenStack summit report 2016 in barcelona
OpenStack summit report 2016 in barcelona
 
VadeSecure: フランスソフトウェアベンダーあるある
VadeSecure: フランスソフトウェアベンダーあるあるVadeSecure: フランスソフトウェアベンダーあるある
VadeSecure: フランスソフトウェアベンダーあるある
 
バッチを Akka Streams で再実装したら100倍速くなった話 #ScalaMatsuri
バッチを Akka Streams で再実装したら100倍速くなった話 #ScalaMatsuriバッチを Akka Streams で再実装したら100倍速くなった話 #ScalaMatsuri
バッチを Akka Streams で再実装したら100倍速くなった話 #ScalaMatsuri
 

Recently uploaded

Grokking Simplicity探訪
Grokking Simplicity探訪Grokking Simplicity探訪
Grokking Simplicity探訪
Yoshitaka Kawashima
 
CO2排出量見える化・削減・報告クラウド「アスエネ」サービス紹介_Saleshub.pdf
CO2排出量見える化・削減・報告クラウド「アスエネ」サービス紹介_Saleshub.pdfCO2排出量見える化・削減・報告クラウド「アスエネ」サービス紹介_Saleshub.pdf
CO2排出量見える化・削減・報告クラウド「アスエネ」サービス紹介_Saleshub.pdf
yamamotominami
 
アジャイルの30年(Tree Decades of Agileというブログ記事に関する要約)
アジャイルの30年(Tree Decades of Agileというブログ記事に関する要約)アジャイルの30年(Tree Decades of Agileというブログ記事に関する要約)
アジャイルの30年(Tree Decades of Agileというブログ記事に関する要約)
You&I
 
FIWARE Orion Context Broker コンテキスト情報管理 (Orion 4.0.0対応)
FIWARE Orion Context Broker コンテキスト情報管理 (Orion 4.0.0対応)FIWARE Orion Context Broker コンテキスト情報管理 (Orion 4.0.0対応)
FIWARE Orion Context Broker コンテキスト情報管理 (Orion 4.0.0対応)
fisuda
 
受発注バスターズ説明資料  株式会社batton Saleshub掲載用.pdf
受発注バスターズ説明資料  株式会社batton Saleshub掲載用.pdf受発注バスターズ説明資料  株式会社batton Saleshub掲載用.pdf
受発注バスターズ説明資料  株式会社batton Saleshub掲載用.pdf
ooishi1
 
NIST Cybersecurity Framework 2.0の変更点整理をしよう
NIST Cybersecurity Framework 2.0の変更点整理をしようNIST Cybersecurity Framework 2.0の変更点整理をしよう
NIST Cybersecurity Framework 2.0の変更点整理をしよう
You&I
 

Recently uploaded (6)

Grokking Simplicity探訪
Grokking Simplicity探訪Grokking Simplicity探訪
Grokking Simplicity探訪
 
CO2排出量見える化・削減・報告クラウド「アスエネ」サービス紹介_Saleshub.pdf
CO2排出量見える化・削減・報告クラウド「アスエネ」サービス紹介_Saleshub.pdfCO2排出量見える化・削減・報告クラウド「アスエネ」サービス紹介_Saleshub.pdf
CO2排出量見える化・削減・報告クラウド「アスエネ」サービス紹介_Saleshub.pdf
 
アジャイルの30年(Tree Decades of Agileというブログ記事に関する要約)
アジャイルの30年(Tree Decades of Agileというブログ記事に関する要約)アジャイルの30年(Tree Decades of Agileというブログ記事に関する要約)
アジャイルの30年(Tree Decades of Agileというブログ記事に関する要約)
 
FIWARE Orion Context Broker コンテキスト情報管理 (Orion 4.0.0対応)
FIWARE Orion Context Broker コンテキスト情報管理 (Orion 4.0.0対応)FIWARE Orion Context Broker コンテキスト情報管理 (Orion 4.0.0対応)
FIWARE Orion Context Broker コンテキスト情報管理 (Orion 4.0.0対応)
 
受発注バスターズ説明資料  株式会社batton Saleshub掲載用.pdf
受発注バスターズ説明資料  株式会社batton Saleshub掲載用.pdf受発注バスターズ説明資料  株式会社batton Saleshub掲載用.pdf
受発注バスターズ説明資料  株式会社batton Saleshub掲載用.pdf
 
NIST Cybersecurity Framework 2.0の変更点整理をしよう
NIST Cybersecurity Framework 2.0の変更点整理をしようNIST Cybersecurity Framework 2.0の変更点整理をしよう
NIST Cybersecurity Framework 2.0の変更点整理をしよう
 

バッチソリューションAzarea cluster 2016

  • 1. © 2016 CAC Corporation. All rights reserved. 激増するデータを 効果的に処理するバッチソリューション AZAREA-Cluster 2016年2月5日 株式会社シーエーシー ICT営業本部 技術企画 田中 等 thitoshi@cac.co.jp
  • 2. © 2016 CAC Corporation. All rights reserved. 自己紹介 株式会社シーエーシー 今年50周年を迎える老舗のSIer 社員数約1,000名 田中 等 アーキテクトとして多くのシステム開発プロジェクト に参画 最近は、個別プロジェクトのアーキテクチャだけでは なくプロジェクトをまたいだソリューション開発を手 掛ける 1
  • 3. © 2016 CAC Corporation. All rights reserved. アジェンダ バッチの問題 SIerの課題 AZAREA-Clusterによる解決 AZAREA-Clusterの効果 2
  • 4. © 2016 CAC Corporation. All rights reserved. 3 バッチの問題
  • 5. © 2016 CAC Corporation. All rights reserved. バッチで問題になりがちなのは? 4
  • 6. © 2016 CAC Corporation. All rights reserved. なぜパフォーマンスが問題になるのか? 処理時間を見積るのが難しい 例えば、同じデータ量でも処理内容により時間はまっ たく異なる 実際に作って測ってみないと分からない 分からないのでとりあえず大き目に見積る 必要以上のマシンスペック それでも小さ過ぎる場合もある 5
  • 7. © 2016 CAC Corporation. All rights reserved. SQLの問題 SQLは非常にポピュラーな言語 バッチをSQL(ストアドプロシージャ)で開発す ることも多い SQLにも問題がある 6 !
  • 8. © 2016 CAC Corporation. All rights reserved. SQLの問題 実行計画によりパフォーマンスが劇的に変わる インデックスが使われるか、メモリ内でソートできるか、… SQLの書き方でパフォーマンスが劇的に変わる 技術者への依存性が高い データ量によりパフォーマンスが劇的に変わる ある日突然遅くなることがある 7 処理時間 データ量
  • 9. © 2016 CAC Corporation. All rights reserved. SQLの問題 SQLをチューニングすることによりパフォーマンスを改善できる しかしチューニングにも限界がある オンラインは処理件数が少ないので、何とかなりやすい バッチは処理件数が多いので、チューニングでは不十分なことも多い 結局ハードウェアのスケールアップに頼ることも 高価なDWHアプライアンス製品が必要になることも 8
  • 10. © 2016 CAC Corporation. All rights reserved. 並列分散処理の問題 並列分散処理では、スケールアウトによりパフォーマン スを向上する スケールアップに比べて向上の余地が大きい 処理時間を想定しやすい マシン数を2倍にすれば、処理時間は1/2になるだろう パブリッククラウドを利用すれば、コストを抑えられる 並列分散処理にも問題がある 9 !
  • 11. © 2016 CAC Corporation. All rights reserved. 並列分散処理の問題 Hadoop オープンソースの並列分散処理基盤 並列分散処理を今までよりも容易にした 今やビッグデータ処理のデファクトスタンダードとも言える 10
  • 12. © 2016 CAC Corporation. All rights reserved. 並列分散処理の問題 Hadoopの課題 アプリケーションの開発は特殊で難しい Hadoopエンジニアの数 << SQLエンジニアの数 少量データには向かない 処理実行のオーバーヘッドが大きい ※最近では、Hadoopを様々な点で改善した新たな並列分 散処理基盤、Sparkも注目されている 11
  • 13. © 2016 CAC Corporation. All rights reserved. もう1つの問題 データ量により最適なアーキテクチャが異なる 例えば、少量ならSQL、大量ならHadoop 大は小を兼ねない  一般的に、大量データ用のアーキテクチャはコストパフォーマンスが悪い 設計時の見極めが難しい 必要十分なアーキテクチャは? 将来データ量が増えたらどうする? アーキテクチャは簡単には変えられない 12
  • 14. © 2016 CAC Corporation. All rights reserved. バッチの問題のまとめ SQL 大量データには向かない Hadoop 少量データには向かない 開発が難しい データ量により最適なアーキテクチャが異なる しかし、データ量は変化する 13 方式 データ量 小~中規模 大規模 SQL ● × パフォーマンスの 低下 Hadoop × 処理の オーバーヘッド ▲ 開発が難しい
  • 15. © 2016 CAC Corporation. All rights reserved. 14 SIerの課題
  • 16. © 2016 CAC Corporation. All rights reserved. SIerの課題 「スクラッチ開発」中心では生き残れない 一から全てを開発するのではコストが掛かり過ぎる 競合他社と差別化しにくい 価格競争に陥りがち 製品・ソリューション中心に 複数の顧客に展開することによりコストダウン 競合他社には無い独自の製品・ソリューションを差別化要素に 15
  • 17. © 2016 CAC Corporation. All rights reserved. 16 AZAREA-Clusterによる解決
  • 18. © 2016 CAC Corporation. All rights reserved. AZAREA-Clusterによる解決 17 SIerの課題バッチの問題 バッチの問題を 解決する製品を!
  • 19. © 2016 CAC Corporation. All rights reserved. 大規模データの問題を解決 まずは大規模データの問題を解決することに 18 方式 データ量 小~中規模 大規模 SQL ● × パフォーマンスの 低下 Hadoop × 処理の オーバーヘッド ▲ 開発が難しい
  • 20. © 2016 CAC Corporation. All rights reserved. 大規模データの問題を解決 Hadoopを簡単に! 容易なAPI  HadoopのAPIをラップし、業務アプリ的なAPIに GUI開発ツール  データフロー図を描くとバッチのソースコードが生成される  必要に応じてソースコードをカスタマイズ その他、デバッグ・テスト支援機能 19 Hadoop AZAREA-Cluster バッチアプリケーションGUI開発ツールフロー図 Java
  • 21. © 2016 CAC Corporation. All rights reserved. 大規模データの問題を解決 AZAREA-Clusterにより大規模データ処理の問題を解決 20 方式 データ量 小~中規模 大規模 SQL ● × パフォーマンスの 低下 Hadoop × 処理の オーバーヘッド ▲ 開発が難しい AZAREA-Cluster × 処理の オーバーヘッド ● 開発は容易
  • 22. © 2016 CAC Corporation. All rights reserved. 小~中規模データの問題を解決 業務バッチの現実 実際には「大規模データ」を扱う業務バッチは少なかった Hadoopはオーバースペック  数並列程度で十分  つまり、マシン1台で十分  オープンソースであってもコストは掛かる  最低限のマシン数、環境構築、運用、サポート、… Hadoop無しで実行できないか? 21
  • 23. © 2016 CAC Corporation. All rights reserved. 小~中規模データの問題を解決 スタンドアローン実行モード Hadoopは使わず単一マシンでマルチスレッド実行する  1~16並列程度 Hadoopを参考に、独自の実行エンジンを開発 同じバッチがHadoopでもスタンドアローンでも動く 22 Hadoop バッチアプリケーション Java AZAREA-Cluster Hadoopラッパ スタンドアローン 実行エンジン Hadoopモード スタンドアローンモード
  • 24. © 2016 CAC Corporation. All rights reserved. 小~中規模データの問題を解決 AZAREA-Clusterによりアーキテクチャ不統一の問題を解決 23 方式 データ量 小~中規模 大規模 SQL ● × パフォーマンスの 低下 Hadoop × 処理の オーバーヘッド ▲ 開発が難しい AZAREA-Cluster ● オーバーヘッド無し ● 開発は容易
  • 25. © 2016 CAC Corporation. All rights reserved. AZAREA-Clusterによる解決 データ量によらず同じアーキテクチャ 設計時にアーキテクチャを誤るリスクが無くなる 完成後もデータ量の変化に容易に対応できる 24
  • 26. © 2016 CAC Corporation. All rights reserved. 25 AZAREA-Clusterの効果
  • 27. © 2016 CAC Corporation. All rights reserved. AZAREA-Clusterの効果 中規模データの業務バッチを高速化 製薬業向けの営業支援システム 薬の販売実績データを、分析のために加工・集計するバッチ 26 AZAREA-Cluster バッチアプリケーション販売実績 データ 集計結果
  • 28. © 2016 CAC Corporation. All rights reserved. AZAREA-Clusterの効果 中規模データの業務バッチを高速化 中規模とは言え、SQLでは相当時間が掛かる AZAREA-Clusterを使い、SQLより倍以上高速 スタンドアローンモード 8CPU 将来のデータ増加にも容易に対応できる 27
  • 29. © 2016 CAC Corporation. All rights reserved. AZAREA-Clusterの効果 画面とバッチとで業務処理を共通化 受託機関・基金・事業所様向けのCAC製年金管理パッケージ  Micmari (みくまり) 多数の企業、多数の年金加入者の年金計算をバッチで処理 画面からも同様の処理を可能 28 画面 バッチ 業務処理 AZAREA-Cluster 業務処理 AZAREA-Cluster 少量データ 大量データ Webサーバ Hadoop 共通共通
  • 30. © 2016 CAC Corporation. All rights reserved. AZAREA-Clusterの効果 画面とバッチとで業務処理を共通化 業務処理をAZAREA-Clusterで実装 バッチでは、大量データ処理 Hadoopを利用 画面では、1件ずつ処理 生産性・保守性が向上 年金の制度変更や機能追加への迅速な対応が可能に 29
  • 31. © 2016 CAC Corporation. All rights reserved. AZAREA-Clusterの効果 IoTシステムの基盤として 30 機器 センサー 集計 可視化機械学習 制御 アラート 【スピードレイヤー】 【バッチレイヤー】 ルール 参照 バッチ AZAREA-Cluster データ ベース キュー Streaming
  • 32. © 2016 CAC Corporation. All rights reserved. 31 まとめ
  • 33. © 2016 CAC Corporation. All rights reserved. まとめ AZAREA-Cluster 大規模データは、Hadoopを利用して高速処理 小~中規模データも、マルチスレッドで高速処理 データ量によらず、同じアーキテクチャで効率的に処理可能 32