SlideShare a Scribd company logo
Submit Search
Upload
ソーシャルゲームのEMR活用事例
Report
Share
知教 本間
システムオペレーションエンジニア at 株式会社gumi
Follow
•
10 likes
•
4,555 views
1
of
18
ソーシャルゲームのEMR活用事例
•
10 likes
•
4,555 views
Report
Share
Download Now
Download to read offline
Technology
Business
2011-12-15 第一回 EMR勉強会発表資料
Read more
知教 本間
システムオペレーションエンジニア at 株式会社gumi
Follow
Recommended
20111215_第1回EMR勉強会発表資料 by
20111215_第1回EMR勉強会発表資料
Kotaro Tsukui
2.5K views
•
20 slides
AWS Black Belt Techシリーズ Amazon EMR by
AWS Black Belt Techシリーズ Amazon EMR
Amazon Web Services Japan
27.6K views
•
74 slides
Amazon Elastic MapReduceやSparkを中心とした社内の分析環境事例とTips by
Amazon Elastic MapReduceやSparkを中心とした社内の分析環境事例とTips
yuichi_komatsu
6.3K views
•
82 slides
Amazon Elastic MapReduce with Hive/Presto ハンズオン(講義) by
Amazon Elastic MapReduce with Hive/Presto ハンズオン(講義)
Amazon Web Services Japan
18K views
•
60 slides
AWS Black Belt Tech シリーズ 2015 - Amazon Elastic MapReduce by
AWS Black Belt Tech シリーズ 2015 - Amazon Elastic MapReduce
Amazon Web Services Japan
102.4K views
•
84 slides
AWS Elastic MapReduce詳細 -ほぼ週刊AWSマイスターシリーズ第10回- by
AWS Elastic MapReduce詳細 -ほぼ週刊AWSマイスターシリーズ第10回-
SORACOM, INC
4K views
•
56 slides
More Related Content
What's hot
エンタープライズワークロードにおけるAmazon Auroraの活用 by
エンタープライズワークロードにおけるAmazon Auroraの活用
Amazon Web Services Japan
2.8K views
•
47 slides
Aurora by
Aurora
maruyama097
3.3K views
•
253 slides
Amazon Aurora by
Amazon Aurora
Shinpei Ohtani
5.2K views
•
88 slides
AWS Black Belt Techシリーズ Amazon Redshift by
AWS Black Belt Techシリーズ Amazon Redshift
Amazon Web Services Japan
36.1K views
•
44 slides
データレイクを基盤としたAWS上での機械学習サービス構築 by
データレイクを基盤としたAWS上での機械学習サービス構築
Amazon Web Services Japan
11.4K views
•
63 slides
はじめてのAmazon RDS for PostgreSQL by
はじめてのAmazon RDS for PostgreSQL
Junpei Nakada
5.4K views
•
29 slides
What's hot
(20)
エンタープライズワークロードにおけるAmazon Auroraの活用 by Amazon Web Services Japan
エンタープライズワークロードにおけるAmazon Auroraの活用
Amazon Web Services Japan
•
2.8K views
Aurora by maruyama097
Aurora
maruyama097
•
3.3K views
Amazon Aurora by Shinpei Ohtani
Amazon Aurora
Shinpei Ohtani
•
5.2K views
AWS Black Belt Techシリーズ Amazon Redshift by Amazon Web Services Japan
AWS Black Belt Techシリーズ Amazon Redshift
Amazon Web Services Japan
•
36.1K views
データレイクを基盤としたAWS上での機械学習サービス構築 by Amazon Web Services Japan
データレイクを基盤としたAWS上での機械学習サービス構築
Amazon Web Services Japan
•
11.4K views
はじめてのAmazon RDS for PostgreSQL by Junpei Nakada
はじめてのAmazon RDS for PostgreSQL
Junpei Nakada
•
5.4K views
Amazon Aurora Deep Dive (re:Invent 2015 DAT405 日本語翻訳版) by Amazon Web Services Japan
Amazon Aurora Deep Dive (re:Invent 2015 DAT405 日本語翻訳版)
Amazon Web Services Japan
•
3K views
2017年1月のAWSサービスアップデートまとめ by Amazon Web Services Japan
2017年1月のAWSサービスアップデートまとめ
Amazon Web Services Japan
•
2.9K views
NoSQL on AWSで作る最新ソーシャルゲームアーキテクチャ by Yasuhiro Matsuo
NoSQL on AWSで作る最新ソーシャルゲームアーキテクチャ
Yasuhiro Matsuo
•
5K views
AWS Black Belt Online Seminar 2017 Amazon DynamoDB by Amazon Web Services Japan
AWS Black Belt Online Seminar 2017 Amazon DynamoDB
Amazon Web Services Japan
•
146.5K views
スケーラブルな Deep Leaning フレームワーク "Apache MXNet” を AWS で学ぶ by Amazon Web Services Japan
スケーラブルな Deep Leaning フレームワーク "Apache MXNet” を AWS で学ぶ
Amazon Web Services Japan
•
13K views
オンプレミスRDBMSをAWSへ移行する手法 by Amazon Web Services Japan
オンプレミスRDBMSをAWSへ移行する手法
Amazon Web Services Japan
•
30.6K views
[Aurora事例祭り]AWS Database Migration Service と Schema Conversion Tool の使いドコロ by Amazon Web Services Japan
[Aurora事例祭り]AWS Database Migration Service と Schema Conversion Tool の使いドコロ
Amazon Web Services Japan
•
11.5K views
[Aurora事例祭り]Amazon Aurora を使いこなすためのベストプラクティス by Amazon Web Services Japan
[Aurora事例祭り]Amazon Aurora を使いこなすためのベストプラクティス
Amazon Web Services Japan
•
56.6K views
Sparkストリーミング検証 by BrainPad Inc.
Sparkストリーミング検証
BrainPad Inc.
•
2.7K views
AWS Black Belt Tech シリーズ 2015 - Amazon Redshift by Amazon Web Services Japan
AWS Black Belt Tech シリーズ 2015 - Amazon Redshift
Amazon Web Services Japan
•
42.5K views
Using Amazon Aurora for Enterprise Workloads by Amazon Web Services Japan
Using Amazon Aurora for Enterprise Workloads
Amazon Web Services Japan
•
2.3K views
クラウド上のデータ活用デザインパターン by Amazon Web Services Japan
クラウド上のデータ活用デザインパターン
Amazon Web Services Japan
•
7.3K views
次世代ディザスタリカバリを成功させるアマゾンクラウド活用法 by SORACOM, INC
次世代ディザスタリカバリを成功させるアマゾンクラウド活用法
SORACOM, INC
•
8.7K views
AWS Black Belt Online Seminar Amazon Aurora by Amazon Web Services Japan
AWS Black Belt Online Seminar Amazon Aurora
Amazon Web Services Japan
•
55.1K views
Viewers also liked
クックパッドでのemr利用事例 by
クックパッドでのemr利用事例
Tatsuya Sasaki
4.6K views
•
38 slides
Groongaでのタグ検索と表記揺れとの戦い by
Groongaでのタグ検索と表記揺れとの戦い
Naoya Murakami
3.2K views
•
46 slides
Tabemirusalessheet20160610 by
Tabemirusalessheet20160610
tabemiru-support
96.3K views
•
14 slides
MySQLユーザ視点での小さく始めるElasticsearch by
MySQLユーザ視点での小さく始めるElasticsearch
Kentaro Yoshida
16.8K views
•
59 slides
ソーシャルアプリにおけるRedisの活用事例とトラブル事例 by
ソーシャルアプリにおけるRedisの活用事例とトラブル事例
leverages_event
12.8K views
•
31 slides
[AWSマイスターシリーズ] Amazon Elastic MapReduce (EMR) by
[AWSマイスターシリーズ] Amazon Elastic MapReduce (EMR)
Amazon Web Services Japan
13.2K views
•
67 slides
Viewers also liked
(20)
クックパッドでのemr利用事例 by Tatsuya Sasaki
クックパッドでのemr利用事例
Tatsuya Sasaki
•
4.6K views
Groongaでのタグ検索と表記揺れとの戦い by Naoya Murakami
Groongaでのタグ検索と表記揺れとの戦い
Naoya Murakami
•
3.2K views
Tabemirusalessheet20160610 by tabemiru-support
Tabemirusalessheet20160610
tabemiru-support
•
96.3K views
MySQLユーザ視点での小さく始めるElasticsearch by Kentaro Yoshida
MySQLユーザ視点での小さく始めるElasticsearch
Kentaro Yoshida
•
16.8K views
ソーシャルアプリにおけるRedisの活用事例とトラブル事例 by leverages_event
ソーシャルアプリにおけるRedisの活用事例とトラブル事例
leverages_event
•
12.8K views
[AWSマイスターシリーズ] Amazon Elastic MapReduce (EMR) by Amazon Web Services Japan
[AWSマイスターシリーズ] Amazon Elastic MapReduce (EMR)
Amazon Web Services Japan
•
13.2K views
DeepSecurityでシステムを守る運用を幾つか by Hirokazu Yoshida
DeepSecurityでシステムを守る運用を幾つか
Hirokazu Yoshida
•
10.6K views
Redis勉強会資料(2015/06 update) by Yuji Otani
Redis勉強会資料(2015/06 update)
Yuji Otani
•
52.5K views
Mongo sharding by Takahiro Inoue
Mongo sharding
Takahiro Inoue
•
42.1K views
MongoDBで作るソーシャルデータ新解析基盤 by Takahiro Inoue
MongoDBで作るソーシャルデータ新解析基盤
Takahiro Inoue
•
29K views
MongoDB on AWSクラウドという選択 by Yasuhiro Matsuo
MongoDB on AWSクラウドという選択
Yasuhiro Matsuo
•
22.8K views
MapReduce入門 by Satoshi Noto
MapReduce入門
Satoshi Noto
•
23.4K views
SparkやBigQueryなどを用いたモバイルゲーム分析環境 by yuichi_komatsu
SparkやBigQueryなどを用いたモバイルゲーム分析環境
yuichi_komatsu
•
5.3K views
MongoDB全機能解説1 by Takahiro Inoue
MongoDB全機能解説1
Takahiro Inoue
•
54.6K views
Business Innovation cases driven by AI and BigData technologies by DataWorks Summit/Hadoop Summit
Business Innovation cases driven by AI and BigData technologies
DataWorks Summit/Hadoop Summit
•
3.4K views
がっつりMongoDB事例紹介 by Tetsutaro Watanabe
がっつりMongoDB事例紹介
Tetsutaro Watanabe
•
23.2K views
1000台規模のHadoopクラスタをHive/Tezアプリケーションにあわせてパフォーマンスチューニングした話 by Yahoo!デベロッパーネットワーク
1000台規模のHadoopクラスタをHive/Tezアプリケーションにあわせてパフォーマンスチューニングした話
Yahoo!デベロッパーネットワーク
•
6.9K views
sparksql-hive-bench-by-nec-hwx-at-hcj16 by Yifeng Jiang
sparksql-hive-bench-by-nec-hwx-at-hcj16
Yifeng Jiang
•
10.5K views
Case Study: OLAP usability on Spark and Hadoop by DataWorks Summit/Hadoop Summit
Case Study: OLAP usability on Spark and Hadoop
DataWorks Summit/Hadoop Summit
•
3.9K views
SEGA : Growth hacking by Spark ML for Mobile games by DataWorks Summit/Hadoop Summit
SEGA : Growth hacking by Spark ML for Mobile games
DataWorks Summit/Hadoop Summit
•
3.9K views
Similar to ソーシャルゲームのEMR活用事例
ソーシャルゲームログ解析基盤のMongoDB活用事例 by
ソーシャルゲームログ解析基盤のMongoDB活用事例
知教 本間
4.8K views
•
19 slides
Flume cassandra real time log processing (日本語) by
Flume cassandra real time log processing (日本語)
CLOUDIAN KK
2K views
•
20 slides
MongoDBざっくり解説 by
MongoDBざっくり解説
知教 本間
3.6K views
•
29 slides
MongoDBを用いたソーシャルアプリのログ解析 〜解析基盤構築からフロントUIまで、MongoDBを最大限に活用する〜 by
MongoDBを用いたソーシャルアプリのログ解析 〜解析基盤構築からフロントUIまで、MongoDBを最大限に活用する〜
Takahiro Inoue
43.2K views
•
89 slides
【JAWS UG 山形】ランサーズでのAWS活用事例 by
【JAWS UG 山形】ランサーズでのAWS活用事例
Yuki Kanazawa
1.7K views
•
58 slides
ソーシャルゲームにおけるMongoDB適用事例 - Animal Land by
ソーシャルゲームにおけるMongoDB適用事例 - Animal Land
Masakazu Matsushita
11.2K views
•
43 slides
Similar to ソーシャルゲームのEMR活用事例
(20)
ソーシャルゲームログ解析基盤のMongoDB活用事例 by 知教 本間
ソーシャルゲームログ解析基盤のMongoDB活用事例
知教 本間
•
4.8K views
Flume cassandra real time log processing (日本語) by CLOUDIAN KK
Flume cassandra real time log processing (日本語)
CLOUDIAN KK
•
2K views
MongoDBざっくり解説 by 知教 本間
MongoDBざっくり解説
知教 本間
•
3.6K views
MongoDBを用いたソーシャルアプリのログ解析 〜解析基盤構築からフロントUIまで、MongoDBを最大限に活用する〜 by Takahiro Inoue
MongoDBを用いたソーシャルアプリのログ解析 〜解析基盤構築からフロントUIまで、MongoDBを最大限に活用する〜
Takahiro Inoue
•
43.2K views
【JAWS UG 山形】ランサーズでのAWS活用事例 by Yuki Kanazawa
【JAWS UG 山形】ランサーズでのAWS活用事例
Yuki Kanazawa
•
1.7K views
ソーシャルゲームにおけるMongoDB適用事例 - Animal Land by Masakazu Matsushita
ソーシャルゲームにおけるMongoDB適用事例 - Animal Land
Masakazu Matsushita
•
11.2K views
ログブラウズ、解析サービスSumologicの紹介 by Yasuhiro Araki, Ph.D
ログブラウズ、解析サービスSumologicの紹介
Yasuhiro Araki, Ph.D
•
7.1K views
ゆるふわLinux-HA 〜PostgreSQL編〜 by Taro Matsuzawa
ゆるふわLinux-HA 〜PostgreSQL編〜
Taro Matsuzawa
•
6.8K views
Rubyによるお手軽分散処理 by maebashi
Rubyによるお手軽分散処理
maebashi
•
3.9K views
Fluentdでログを集めてGlusterFSに保存してMapReduceで集計 by maebashi
Fluentdでログを集めてGlusterFSに保存してMapReduceで集計
maebashi
•
2.3K views
第6回インターネットと運用技術シンポジウム WIPセッション by Hiroki Kashiwazaki
第6回インターネットと運用技術シンポジウム WIPセッション
Hiroki Kashiwazaki
•
2.4K views
Sinatraでwebアプリケーション開発を学ぶ by Hiroshi Oyamada
Sinatraでwebアプリケーション開発を学ぶ
Hiroshi Oyamada
•
6.1K views
そう、UE4ならね。あなたのモバイルゲームをより快適にする沢山の冴えたやり方について Part 2 <Texture Streaming, メモリプロ... by エピック・ゲームズ・ジャパン Epic Games Japan
そう、UE4ならね。あなたのモバイルゲームをより快適にする沢山の冴えたやり方について Part 2 <Texture Streaming, メモリプロ...
エピック・ゲームズ・ジャパン Epic Games Japan
•
17.4K views
Tokyo.R#16 wdkz by Kazuya Wada
Tokyo.R#16 wdkz
Kazuya Wada
•
7.3K views
Terraformで始めるInfrastructure as Code by Takahisa Iwamoto
Terraformで始めるInfrastructure as Code
Takahisa Iwamoto
•
4.8K views
ゲームのインフラをAwsで実戦tips全て見せます by infinite_loop
ゲームのインフラをAwsで実戦tips全て見せます
infinite_loop
•
6.1K views
ソリューションセッション#3 ビッグデータの3つのVと4つのプロセスを支えるAWS活用法 by Amazon Web Services Japan
ソリューションセッション#3 ビッグデータの3つのVと4つのプロセスを支えるAWS活用法
Amazon Web Services Japan
•
3.4K views
CLUB DB2 第122回 DB2管理本の著者が教える 簡単運用管理入門 by Akira Shimosako
CLUB DB2 第122回 DB2管理本の著者が教える 簡単運用管理入門
Akira Shimosako
•
13K views
ソーシャルゲームのデータ分析基盤としてのAWS Jaws ug三都物語LT by OCHI Shuji
ソーシャルゲームのデータ分析基盤としてのAWS Jaws ug三都物語LT
OCHI Shuji
•
3K views
クラウドサービスAmazon EC2を活用した「SKIPaaS」構築事例 by Yuuki Namikawa
クラウドサービスAmazon EC2を活用した「SKIPaaS」構築事例
Yuuki Namikawa
•
1.6K views
More from 知教 本間
gumiにおける、海外支社とのAtlassian製品利用事例 by
gumiにおける、海外支社とのAtlassian製品利用事例
知教 本間
1.8K views
•
31 slides
GitHubEnterpriseからBitbucket(Stash) への移行事例 by
GitHubEnterpriseからBitbucket(Stash) への移行事例
知教 本間
3.4K views
•
24 slides
AWSアカウント開設からインスタンスを立ち上げるまでの作業自動化について by
AWSアカウント開設からインスタンスを立ち上げるまでの作業自動化について
知教 本間
2.4K views
•
28 slides
Use case for using the ElastiCache for Redis in production by
Use case for using the ElastiCache for Redis in production
知教 本間
3.9K views
•
21 slides
チームでChef serverを運用するには by
チームでChef serverを運用するには
知教 本間
5.6K views
•
34 slides
Redisへと至る、gumiデータストアの歴史 by
Redisへと至る、gumiデータストアの歴史
知教 本間
8.9K views
•
40 slides
More from 知教 本間
(7)
gumiにおける、海外支社とのAtlassian製品利用事例 by 知教 本間
gumiにおける、海外支社とのAtlassian製品利用事例
知教 本間
•
1.8K views
GitHubEnterpriseからBitbucket(Stash) への移行事例 by 知教 本間
GitHubEnterpriseからBitbucket(Stash) への移行事例
知教 本間
•
3.4K views
AWSアカウント開設からインスタンスを立ち上げるまでの作業自動化について by 知教 本間
AWSアカウント開設からインスタンスを立ち上げるまでの作業自動化について
知教 本間
•
2.4K views
Use case for using the ElastiCache for Redis in production by 知教 本間
Use case for using the ElastiCache for Redis in production
知教 本間
•
3.9K views
チームでChef serverを運用するには by 知教 本間
チームでChef serverを運用するには
知教 本間
•
5.6K views
Redisへと至る、gumiデータストアの歴史 by 知教 本間
Redisへと至る、gumiデータストアの歴史
知教 本間
•
8.9K views
ソーシャルゲームログ解析基盤のHadoop活用事例 by 知教 本間
ソーシャルゲームログ解析基盤のHadoop活用事例
知教 本間
•
5.3K views
Recently uploaded
SNMPセキュリティ超入門 by
SNMPセキュリティ超入門
mkoda
376 views
•
15 slides
SSH応用編_20231129.pdf by
SSH応用編_20231129.pdf
icebreaker4
353 views
•
13 slides
Keycloakの全体像: 基本概念、ユースケース、そして最新の開発動向 by
Keycloakの全体像: 基本概念、ユースケース、そして最新の開発動向
Hitachi, Ltd. OSS Solution Center.
73 views
•
26 slides
Windows 11 information that can be used at the development site by
Windows 11 information that can be used at the development site
Atomu Hidaka
88 views
•
41 slides
今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20... by
今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20...
NTT DATA Technology & Innovation
129 views
•
42 slides
光コラボは契約してはいけない by
光コラボは契約してはいけない
Takuya Matsunaga
18 views
•
17 slides
Recently uploaded
(11)
SNMPセキュリティ超入門 by mkoda
SNMPセキュリティ超入門
mkoda
•
376 views
SSH応用編_20231129.pdf by icebreaker4
SSH応用編_20231129.pdf
icebreaker4
•
353 views
Keycloakの全体像: 基本概念、ユースケース、そして最新の開発動向 by Hitachi, Ltd. OSS Solution Center.
Keycloakの全体像: 基本概念、ユースケース、そして最新の開発動向
Hitachi, Ltd. OSS Solution Center.
•
73 views
Windows 11 information that can be used at the development site by Atomu Hidaka
Windows 11 information that can be used at the development site
Atomu Hidaka
•
88 views
今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20... by NTT DATA Technology & Innovation
今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20...
NTT DATA Technology & Innovation
•
129 views
光コラボは契約してはいけない by Takuya Matsunaga
光コラボは契約してはいけない
Takuya Matsunaga
•
18 views
JJUG CCC.pptx by Kanta Sasaki
JJUG CCC.pptx
Kanta Sasaki
•
6 views
定例会スライド_キャチs 公開用.pdf by Keio Robotics Association
定例会スライド_キャチs 公開用.pdf
Keio Robotics Association
•
121 views
IPsec VPNとSSL-VPNの違い by 富士通クラウドテクノロジーズ株式会社
IPsec VPNとSSL-VPNの違い
富士通クラウドテクノロジーズ株式会社
•
471 views
The Things Stack説明資料 by The Things Industries by CRI Japan, Inc.
The Things Stack説明資料 by The Things Industries
CRI Japan, Inc.
•
71 views
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料) by NTT DATA Technology & Innovation
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)
NTT DATA Technology & Innovation
•
23 views
ソーシャルゲームのEMR活用事例
1.
ソーシャルゲームのEMR活用事例
∼ユーザに愛されるカスタマーサポートを目指して∼ 11年12月16日金曜日
2.
自己紹介
Name:本間 知教(ほんま とものり) Twitter:@CkReal 経歴 2008年4月∼2011年9月 国内某ITコンサルティング会社:インフラ担当 2011年9月∼ 株式会社gumi:インフラand解析チーム 好きなAWS:EMR(とS3) 2 11年12月16日金曜日
3.
アジェンダ
1.EMR利用に至る経緯 2.gumiのEMR活用事例 3.EMRを使ってみて 3 11年12月16日金曜日
4.
EMR利用に至る経緯
4 11年12月16日金曜日
5.
gumiの課題
CS(カスタマーサポート)の応対負荷 エンジニアが調査に時間を取れない NFSサーバが単一障害点 gumiのカスタマーサポート概略図 対応が遅くなりがち APPサーバ ゲームユーザ syslog-ng 転送 質問 回答 回答 NFSサーバ 調査依頼 CS エンジニア 5 11年12月16日金曜日
6.
現在のログ状況
例)任侠道のアクションログ 最大18GB(圧縮2.4GB)/日 ログ形式(赤字は整形) 【日付】【ホスト名】【アプリ名】 【アクション名】 【ユーザID】【アクション詳細】 Nov 1 23:59:59 hogehoge-ap1 hogehoge ADD_MONEY 12345 [BeforeMoney] 67979 [AfterMoney] 68024 [Money] 45 Nov 1 23:59:59 hogehoge-ap2 hogehoge CONSUME_POWER 12345 [BeforePower] 25 [AfterPower] 20 [ConsumePower] 5 6 11年12月16日金曜日
7.
DB投入時のドキュメント形式
ユーザ/時のアクション内容をJSON形式で格納 例)MongoDB格納後のログ(一部整形&省略) "_id" : "df41b04eb72d29b4a30955f2de1a20134e187cd6f59f0d3df0468d22", "app" : "hogehoge", "userid" : "12345", "dateint" : 20111101, "hourint" : 23, ユーザIDごとに、 "actions" : [ アクションレコードを格納 "CONSUME_POWER", "ADD_MONEY" ], 時刻フィールドを利用して、 "records" : [ MongoDBのShardingキーとする { "action" : "ADD_MONEY", "timeint" : 235959, ユーザごとの各アクションを } 配列として格納 ] 7 11年12月16日金曜日
8.
EMR or EC2?
Amazon S3とEMRのコラボが素敵 NFSサーバの障害リスク解消 インスタンスを常時稼動させる必要がない 過去ログからも調査・解析できるようにできる 8 11年12月16日金曜日
9.
解析方法の模索
EMR利用時に、何のプロダクトを使うか? Pythonが利用可能なため、Hadoop Streamingを採用 プロダクト メリット デメリット Pig 複雑な処理も記述可能 スクリプト習得コスト ある程度、ログが整形 Hive SQLに近い記述方法 されている必要がある Hadoop Streaming 多くの言語で対応可能 MapReduce習得コスト 9 11年12月16日金曜日
10.
gumiのEMR活用事例
10 11年12月16日金曜日
11.
gumiの解析システム構成Ver0.3
日次で各アプリのアクションログを集計 Amazon S3 Amazon EMR 圧縮アクションログ 集計ログ 圧縮アクションログ 集計ログ 圧縮アクションログ 集計ログ NFSサーバ1 アクションログ DBサーバ Shard1 NFSサーバ2 アクションログ Shard2 圧縮(gzip) Shard3 mongos NFSサーバ3 アクションログ Shard4 アクションログ アクションログ アクションログ config Shard5 バッチサーバ Shard6 11 ReplicaSets & Sharding 11年12月16日金曜日
12.
MapReduce処理
2000万件超/日のアクションを約30万件に集計 --bootstrap-action Python2.7インストールスクリプト --mapper アクションログを以下のKey/Valueに整形 [Key]【アプリ名】/【ユーザID】/【日付】/【時刻】 [Value]action:【アクション種別】,timeint:【時刻】,params:{“AAA:123,…”} --reducer Mapperで処理されたValue内のactionを集約 [Value]actions:[【アクション種別1】,【アクション種別2】…] ,records:[action:…] 12 11年12月16日金曜日
13.
とある一日のバッチ処理
前日分の各アプリのアクションログを集計 EMRは各アプリごとのクラスタで起動 各アプリのEMR実行は、2h程度で終了 0:00 1:00 3:00 7:00 転送&圧縮 EMR実行 MongoDB挿入 (並列実行) (並列実行) (順次実行) 13 11年12月16日金曜日
14.
EMRを使ってみて
14 11年12月16日金曜日
15.
EMRを使ってみて
S3上のファイルをいつでも利用できる EC2⇔S3間の転送は、20MB/sec程度 必要なときだけ、EMRクラスタを使える Hadoopクラスタを管理する必要がない 変化する要件にも対応しやすい とりあえず、S3に元ファイルはあるしねw 15 11年12月16日金曜日
16.
EMRを使ってみて
たまにジョブが失敗する Reduce処理が終わらない? 集計ログを回収しきれない? チューニング方法模索中… 毎時集計まで対応予定 ファイルサイズ Master Slave 実行時間 8.4GB m1.xlarge m2.4xlarge × 4台 2h12m 3.2GB c1.xlarge m1.xlarge × 3台 44分 835MB c1.xlarge m1.xlarge × 3台 28分 22GB m2.4xlarge m2.4xlarge × 2台 FAILED… 16 11年12月16日金曜日
17.
EMR実行途中のCPU使用率
リニアにスケールさせるのは、なかなか難しい 11年12月16日金曜日
18.
ご清聴ありがとうございました。
18 11年12月16日金曜日