Submit Search
Upload
イケてる分析基盤をつくる
•
0 likes
•
1,361 views
Atsushi Hayakawa
Follow
イケてる分析基盤をつくる
Read less
Read more
Internet
Report
Share
Report
Share
1 of 11
Download now
Download to read offline
Recommended
implyを用いたアクセスログの可視化
implyを用いたアクセスログの可視化
Atsushi Hayakawa
nginxのログを非スケーラブルに省メモリな方法で蓄積する
nginxのログを非スケーラブルに省メモリな方法で蓄積する
Atsushi Hayakawa
Kafkaを使った マイクロサービス基盤 part2 +運用して起きたトラブル集
Kafkaを使った マイクロサービス基盤 part2 +運用して起きたトラブル集
matsu_chara
Norikra + Fluentd+ Elasticsearch + Kibana リアルタイムストリーミング処理ログ集計による異常検知
Norikra + Fluentd+ Elasticsearch + Kibana リアルタイムストリーミング処理ログ集計による異常検知
daisuke-a-matsui
Awsでつくるapache kafkaといろんな悩み
Awsでつくるapache kafkaといろんな悩み
Keigo Suda
データポータルソフトウェア CKAN
データポータルソフトウェア CKAN
Fumihiro Kato
GCP HTTPロードバランサ運用例
GCP HTTPロードバランサ運用例
Fumihiko Shiroyama
EmbulkのGCS/BigQuery周りのプラグインについて
EmbulkのGCS/BigQuery周りのプラグインについて
Satoshi Akama
Recommended
implyを用いたアクセスログの可視化
implyを用いたアクセスログの可視化
Atsushi Hayakawa
nginxのログを非スケーラブルに省メモリな方法で蓄積する
nginxのログを非スケーラブルに省メモリな方法で蓄積する
Atsushi Hayakawa
Kafkaを使った マイクロサービス基盤 part2 +運用して起きたトラブル集
Kafkaを使った マイクロサービス基盤 part2 +運用して起きたトラブル集
matsu_chara
Norikra + Fluentd+ Elasticsearch + Kibana リアルタイムストリーミング処理ログ集計による異常検知
Norikra + Fluentd+ Elasticsearch + Kibana リアルタイムストリーミング処理ログ集計による異常検知
daisuke-a-matsui
Awsでつくるapache kafkaといろんな悩み
Awsでつくるapache kafkaといろんな悩み
Keigo Suda
データポータルソフトウェア CKAN
データポータルソフトウェア CKAN
Fumihiro Kato
GCP HTTPロードバランサ運用例
GCP HTTPロードバランサ運用例
Fumihiko Shiroyama
EmbulkのGCS/BigQuery周りのプラグインについて
EmbulkのGCS/BigQuery周りのプラグインについて
Satoshi Akama
データカタログソフトウェア CKAN
データカタログソフトウェア CKAN
Fumihiro Kato
Kafka logをオブジェクトストレージに連携する方法まとめ
Kafka logをオブジェクトストレージに連携する方法まとめ
Keigo Suda
AWSをコードで定義する
AWSをコードで定義する
Sugawara Genki
それFluentdで! #fluentd
それFluentdで! #fluentd
Atsuko Shibuya
Azure Batch Renderingではじめるクラウドレンダリング
Azure Batch Renderingではじめるクラウドレンダリング
Microsoft
1day cloud on_your_lab
1day cloud on_your_lab
Go Chiba
Gazelle & CPAN modules for performance. Shibuya.pm Tech Talk #17 LT
Gazelle & CPAN modules for performance. Shibuya.pm Tech Talk #17 LT
Masahiro Nagano
松本克彦 ピグにおけるリアルタイムランキングの導入
松本克彦 ピグにおけるリアルタイムランキングの導入
matsumoto_katsuhiko
20171122 altair converge2017publish
20171122 altair converge2017publish
Hiroshi Tanaka
Apache CloudStack -コントリビューションの手引き-
Apache CloudStack -コントリビューションの手引き-
Go Chiba
メルカリでのNorikraの活用、 Mackerelを添えて
メルカリでのNorikraの活用、 Mackerelを添えて
Masahiro Nagano
20210129 azure webapplogging
20210129 azure webapplogging
Takayoshi Tanaka
Azuredevopsakskeda
Azuredevopsakskeda
Tsukasa Kato
CKAN日本語コミュニティの現状と課題
CKAN日本語コミュニティの現状と課題
Fumihiro Kato
データ分析基盤として Rancher・k8s で始まるのか調査してみた
データ分析基盤として Rancher・k8s で始まるのか調査してみた
YASUKAZU NAGATOMI
はじめての Gatling
はじめての Gatling
Naoya Nakazawa
LocalStack
LocalStack
chibochibo
azure functionsとcsx
azure functionsとcsx
裕之 木下
AKS と ACI を組み合わせて使ってみた
AKS と ACI を組み合わせて使ってみた
Hideaki Aoyagi
sbtマルチプロジェクトビルドの使いどころ
sbtマルチプロジェクトビルドの使いどころ
Kazuhiro Hara
Git勉強会
Git勉強会
Masato Kawamura
Pycharm 4への誘い
Pycharm 4への誘い
Ai Makabi
More Related Content
What's hot
データカタログソフトウェア CKAN
データカタログソフトウェア CKAN
Fumihiro Kato
Kafka logをオブジェクトストレージに連携する方法まとめ
Kafka logをオブジェクトストレージに連携する方法まとめ
Keigo Suda
AWSをコードで定義する
AWSをコードで定義する
Sugawara Genki
それFluentdで! #fluentd
それFluentdで! #fluentd
Atsuko Shibuya
Azure Batch Renderingではじめるクラウドレンダリング
Azure Batch Renderingではじめるクラウドレンダリング
Microsoft
1day cloud on_your_lab
1day cloud on_your_lab
Go Chiba
Gazelle & CPAN modules for performance. Shibuya.pm Tech Talk #17 LT
Gazelle & CPAN modules for performance. Shibuya.pm Tech Talk #17 LT
Masahiro Nagano
松本克彦 ピグにおけるリアルタイムランキングの導入
松本克彦 ピグにおけるリアルタイムランキングの導入
matsumoto_katsuhiko
20171122 altair converge2017publish
20171122 altair converge2017publish
Hiroshi Tanaka
Apache CloudStack -コントリビューションの手引き-
Apache CloudStack -コントリビューションの手引き-
Go Chiba
メルカリでのNorikraの活用、 Mackerelを添えて
メルカリでのNorikraの活用、 Mackerelを添えて
Masahiro Nagano
20210129 azure webapplogging
20210129 azure webapplogging
Takayoshi Tanaka
Azuredevopsakskeda
Azuredevopsakskeda
Tsukasa Kato
CKAN日本語コミュニティの現状と課題
CKAN日本語コミュニティの現状と課題
Fumihiro Kato
データ分析基盤として Rancher・k8s で始まるのか調査してみた
データ分析基盤として Rancher・k8s で始まるのか調査してみた
YASUKAZU NAGATOMI
はじめての Gatling
はじめての Gatling
Naoya Nakazawa
LocalStack
LocalStack
chibochibo
azure functionsとcsx
azure functionsとcsx
裕之 木下
AKS と ACI を組み合わせて使ってみた
AKS と ACI を組み合わせて使ってみた
Hideaki Aoyagi
sbtマルチプロジェクトビルドの使いどころ
sbtマルチプロジェクトビルドの使いどころ
Kazuhiro Hara
What's hot
(20)
データカタログソフトウェア CKAN
データカタログソフトウェア CKAN
Kafka logをオブジェクトストレージに連携する方法まとめ
Kafka logをオブジェクトストレージに連携する方法まとめ
AWSをコードで定義する
AWSをコードで定義する
それFluentdで! #fluentd
それFluentdで! #fluentd
Azure Batch Renderingではじめるクラウドレンダリング
Azure Batch Renderingではじめるクラウドレンダリング
1day cloud on_your_lab
1day cloud on_your_lab
Gazelle & CPAN modules for performance. Shibuya.pm Tech Talk #17 LT
Gazelle & CPAN modules for performance. Shibuya.pm Tech Talk #17 LT
松本克彦 ピグにおけるリアルタイムランキングの導入
松本克彦 ピグにおけるリアルタイムランキングの導入
20171122 altair converge2017publish
20171122 altair converge2017publish
Apache CloudStack -コントリビューションの手引き-
Apache CloudStack -コントリビューションの手引き-
メルカリでのNorikraの活用、 Mackerelを添えて
メルカリでのNorikraの活用、 Mackerelを添えて
20210129 azure webapplogging
20210129 azure webapplogging
Azuredevopsakskeda
Azuredevopsakskeda
CKAN日本語コミュニティの現状と課題
CKAN日本語コミュニティの現状と課題
データ分析基盤として Rancher・k8s で始まるのか調査してみた
データ分析基盤として Rancher・k8s で始まるのか調査してみた
はじめての Gatling
はじめての Gatling
LocalStack
LocalStack
azure functionsとcsx
azure functionsとcsx
AKS と ACI を組み合わせて使ってみた
AKS と ACI を組み合わせて使ってみた
sbtマルチプロジェクトビルドの使いどころ
sbtマルチプロジェクトビルドの使いどころ
Viewers also liked
Git勉強会
Git勉強会
Masato Kawamura
Pycharm 4への誘い
Pycharm 4への誘い
Ai Makabi
IntelliJ IDEAで快適なPython生活
IntelliJ IDEAで快適なPython生活
敦志 金谷
第7回ros勉強会 NTTデータのロボティクス分野取り組み
第7回ros勉強会 NTTデータのロボティクス分野取り組み
Masato Kawamura
Flask勉強会その1
Flask勉強会その1
Masato Kawamura
らずぱいでウィーン!!!!!
らずぱいでウィーン!!!!!
Atsushi Hayakawa
らずぱいラジコン
らずぱいラジコン
Atsushi Hayakawa
最近のクラウドストレージの事情と私情
最近のクラウドストレージの事情と私情
Atsushi Hayakawa
らずぱいカー
らずぱいカー
Atsushi Hayakawa
Splatoon界での壮絶な戦い&Japan.Rの宣伝
Splatoon界での壮絶な戦い&Japan.Rの宣伝
Atsushi Hayakawa
gepuro task views
gepuro task views
Atsushi Hayakawa
Hadoopビッグデータ基盤の歴史を振り返る #cwt2015
Hadoopビッグデータ基盤の歴史を振り返る #cwt2015
Cloudera Japan
Word2vecで大谷翔平の二刀流論争に終止符を打つ!
Word2vecで大谷翔平の二刀流論争に終止符を打つ!
Takami Sato
Kaggle – Airbnb New User Bookingsのアプローチについて(Kaggle Tokyo Meetup #1 20160305)
Kaggle – Airbnb New User Bookingsのアプローチについて(Kaggle Tokyo Meetup #1 20160305)
Keiku322
統計的学習の基礎 4.4~
統計的学習の基礎 4.4~
Atsushi Hayakawa
NIPS2016論文紹介 Riemannian SVRG fast stochastic optimization on riemannian manif...
NIPS2016論文紹介 Riemannian SVRG fast stochastic optimization on riemannian manif...
Takami Sato
Rstudio上でのパッケージインストールを便利にするaddin4githubinstall
Rstudio上でのパッケージインストールを便利にするaddin4githubinstall
Atsushi Hayakawa
Overview of tree algorithms from decision tree to xgboost
Overview of tree algorithms from decision tree to xgboost
Takami Sato
セクシー女優で学ぶ画像分類入門
セクシー女優で学ぶ画像分類入門
Takami Sato
Kafkaを活用するためのストリーム処理の基本
Kafkaを活用するためのストリーム処理の基本
Sotaro Kimura
Viewers also liked
(20)
Git勉強会
Git勉強会
Pycharm 4への誘い
Pycharm 4への誘い
IntelliJ IDEAで快適なPython生活
IntelliJ IDEAで快適なPython生活
第7回ros勉強会 NTTデータのロボティクス分野取り組み
第7回ros勉強会 NTTデータのロボティクス分野取り組み
Flask勉強会その1
Flask勉強会その1
らずぱいでウィーン!!!!!
らずぱいでウィーン!!!!!
らずぱいラジコン
らずぱいラジコン
最近のクラウドストレージの事情と私情
最近のクラウドストレージの事情と私情
らずぱいカー
らずぱいカー
Splatoon界での壮絶な戦い&Japan.Rの宣伝
Splatoon界での壮絶な戦い&Japan.Rの宣伝
gepuro task views
gepuro task views
Hadoopビッグデータ基盤の歴史を振り返る #cwt2015
Hadoopビッグデータ基盤の歴史を振り返る #cwt2015
Word2vecで大谷翔平の二刀流論争に終止符を打つ!
Word2vecで大谷翔平の二刀流論争に終止符を打つ!
Kaggle – Airbnb New User Bookingsのアプローチについて(Kaggle Tokyo Meetup #1 20160305)
Kaggle – Airbnb New User Bookingsのアプローチについて(Kaggle Tokyo Meetup #1 20160305)
統計的学習の基礎 4.4~
統計的学習の基礎 4.4~
NIPS2016論文紹介 Riemannian SVRG fast stochastic optimization on riemannian manif...
NIPS2016論文紹介 Riemannian SVRG fast stochastic optimization on riemannian manif...
Rstudio上でのパッケージインストールを便利にするaddin4githubinstall
Rstudio上でのパッケージインストールを便利にするaddin4githubinstall
Overview of tree algorithms from decision tree to xgboost
Overview of tree algorithms from decision tree to xgboost
セクシー女優で学ぶ画像分類入門
セクシー女優で学ぶ画像分類入門
Kafkaを活用するためのストリーム処理の基本
Kafkaを活用するためのストリーム処理の基本
Similar to イケてる分析基盤をつくる
LINEのMySQL運用について
LINEのMySQL運用について
LINE Corporation
Spark Structured StreamingでKafkaクラスタのデータをお手軽活用
Spark Structured StreamingでKafkaクラスタのデータをお手軽活用
Sotaro Kimura
Jjug springセッション
Jjug springセッション
Yuichi Hasegawa
NetApp XCP データ移行ツールインストールと設定
NetApp XCP データ移行ツールインストールと設定
Kan Itani
GCPでStreamなデータパイプライン作った
GCPでStreamなデータパイプライン作った
Shu (shoe116)
OSC2012 Nagoya - OpenStack - Storage System; Overview
OSC2012 Nagoya - OpenStack - Storage System; Overview
irix_jp
SQL Server 使いのための Azure Synapse Analytics - Spark 入門
SQL Server 使いのための Azure Synapse Analytics - Spark 入門
Daiyu Hatakeyama
FluentdとRedshiftの素敵な関係
FluentdとRedshiftの素敵な関係
moai kids
自宅ラック勉強会 2.2 夏のZabbix特別教室 ~構築編~
自宅ラック勉強会 2.2 夏のZabbix特別教室 ~構築編~
真乙 九龍
Developers.IO 2019 Effective Datalake
Developers.IO 2019 Effective Datalake
Satoru Ishikawa
Spark on sql server?
Spark on sql server?
Oda Shinsuke
Apache Spark on Azure
Apache Spark on Azure
Tusyoshi Matsuzaki
Oci file storage service deep dive 20181001 ss
Oci file storage service deep dive 20181001 ss
Kenichi Sonoda
[第2版]Python機械学習プログラミング 第9章
[第2版]Python機械学習プログラミング 第9章
Haruki Eguchi
LINEのMySQL運用について 修正版
LINEのMySQL運用について 修正版
LINE Corporation
シスコ装置を使い倒す!組込み機能による可視化からセキュリティ強化
シスコ装置を使い倒す!組込み機能による可視化からセキュリティ強化
シスコシステムズ合同会社
Web Operations and Perl kansai.pm#14
Web Operations and Perl kansai.pm#14
Masahiro Nagano
NetAppのデータ管理をPuppetで。〜APIとコミュニティのオープン性〜 - 渡邊 誠 、ネットアップ株式会社
NetAppのデータ管理をPuppetで。〜APIとコミュニティのオープン性〜 - 渡邊 誠 、ネットアップ株式会社
Puppet
普通のRailsアプリをdockerで本番運用する知見
普通のRailsアプリをdockerで本番運用する知見
zaru sakuraba
Spark Streaming + Amazon Kinesis
Spark Streaming + Amazon Kinesis
Yuta Imai
Similar to イケてる分析基盤をつくる
(20)
LINEのMySQL運用について
LINEのMySQL運用について
Spark Structured StreamingでKafkaクラスタのデータをお手軽活用
Spark Structured StreamingでKafkaクラスタのデータをお手軽活用
Jjug springセッション
Jjug springセッション
NetApp XCP データ移行ツールインストールと設定
NetApp XCP データ移行ツールインストールと設定
GCPでStreamなデータパイプライン作った
GCPでStreamなデータパイプライン作った
OSC2012 Nagoya - OpenStack - Storage System; Overview
OSC2012 Nagoya - OpenStack - Storage System; Overview
SQL Server 使いのための Azure Synapse Analytics - Spark 入門
SQL Server 使いのための Azure Synapse Analytics - Spark 入門
FluentdとRedshiftの素敵な関係
FluentdとRedshiftの素敵な関係
自宅ラック勉強会 2.2 夏のZabbix特別教室 ~構築編~
自宅ラック勉強会 2.2 夏のZabbix特別教室 ~構築編~
Developers.IO 2019 Effective Datalake
Developers.IO 2019 Effective Datalake
Spark on sql server?
Spark on sql server?
Apache Spark on Azure
Apache Spark on Azure
Oci file storage service deep dive 20181001 ss
Oci file storage service deep dive 20181001 ss
[第2版]Python機械学習プログラミング 第9章
[第2版]Python機械学習プログラミング 第9章
LINEのMySQL運用について 修正版
LINEのMySQL運用について 修正版
シスコ装置を使い倒す!組込み機能による可視化からセキュリティ強化
シスコ装置を使い倒す!組込み機能による可視化からセキュリティ強化
Web Operations and Perl kansai.pm#14
Web Operations and Perl kansai.pm#14
NetAppのデータ管理をPuppetで。〜APIとコミュニティのオープン性〜 - 渡邊 誠 、ネットアップ株式会社
NetAppのデータ管理をPuppetで。〜APIとコミュニティのオープン性〜 - 渡邊 誠 、ネットアップ株式会社
普通のRailsアプリをdockerで本番運用する知見
普通のRailsアプリをdockerで本番運用する知見
Spark Streaming + Amazon Kinesis
Spark Streaming + Amazon Kinesis
More from Atsushi Hayakawa
tidyverse.orgの翻訳
tidyverse.orgの翻訳
Atsushi Hayakawa
Zepp play soccerで測ってみた
Zepp play soccerで測ってみた
Atsushi Hayakawa
dataclassとtypehintを使ってますか?
dataclassとtypehintを使ってますか?
Atsushi Hayakawa
トライアスロンとgepuro task views V2.0 Japan.R 2018
トライアスロンとgepuro task views V2.0 Japan.R 2018
Atsushi Hayakawa
バンクーバー旅行記
バンクーバー旅行記
Atsushi Hayakawa
Analyze The Community Of Tokyo.R
Analyze The Community Of Tokyo.R
Atsushi Hayakawa
Visual Studio CodeでRを使う
Visual Studio CodeでRを使う
Atsushi Hayakawa
トライアスロンと僕 - Japan.R 2017
トライアスロンと僕 - Japan.R 2017
Atsushi Hayakawa
simputatoinで欠損値補完 - Tokyo.R #65
simputatoinで欠損値補完 - Tokyo.R #65
Atsushi Hayakawa
useR!2017 in Brussels
useR!2017 in Brussels
Atsushi Hayakawa
Japan.R 2016の運営
Japan.R 2016の運営
Atsushi Hayakawa
赤外線カメラでストリーミング配信
赤外線カメラでストリーミング配信
Atsushi Hayakawa
「Japan.R開催のお知らせ」と「Rでワンライナー」
「Japan.R開催のお知らせ」と「Rでワンライナー」
Atsushi Hayakawa
最強のハードディスクはどれだ?
最強のハードディスクはどれだ?
Atsushi Hayakawa
みどりぼん第11回 前半
みどりぼん第11回 前半
Atsushi Hayakawa
R入門(dplyrでデータ加工)-TokyoR42
R入門(dplyrでデータ加工)-TokyoR42
Atsushi Hayakawa
第六回「データ解析のための統計モデリング入門」前半
第六回「データ解析のための統計モデリング入門」前半
Atsushi Hayakawa
Julia0.3でランダムフォレスト
Julia0.3でランダムフォレスト
Atsushi Hayakawa
家に早く帰りたい
家に早く帰りたい
Atsushi Hayakawa
はじパタ11章 後半
はじパタ11章 後半
Atsushi Hayakawa
More from Atsushi Hayakawa
(20)
tidyverse.orgの翻訳
tidyverse.orgの翻訳
Zepp play soccerで測ってみた
Zepp play soccerで測ってみた
dataclassとtypehintを使ってますか?
dataclassとtypehintを使ってますか?
トライアスロンとgepuro task views V2.0 Japan.R 2018
トライアスロンとgepuro task views V2.0 Japan.R 2018
バンクーバー旅行記
バンクーバー旅行記
Analyze The Community Of Tokyo.R
Analyze The Community Of Tokyo.R
Visual Studio CodeでRを使う
Visual Studio CodeでRを使う
トライアスロンと僕 - Japan.R 2017
トライアスロンと僕 - Japan.R 2017
simputatoinで欠損値補完 - Tokyo.R #65
simputatoinで欠損値補完 - Tokyo.R #65
useR!2017 in Brussels
useR!2017 in Brussels
Japan.R 2016の運営
Japan.R 2016の運営
赤外線カメラでストリーミング配信
赤外線カメラでストリーミング配信
「Japan.R開催のお知らせ」と「Rでワンライナー」
「Japan.R開催のお知らせ」と「Rでワンライナー」
最強のハードディスクはどれだ?
最強のハードディスクはどれだ?
みどりぼん第11回 前半
みどりぼん第11回 前半
R入門(dplyrでデータ加工)-TokyoR42
R入門(dplyrでデータ加工)-TokyoR42
第六回「データ解析のための統計モデリング入門」前半
第六回「データ解析のための統計モデリング入門」前半
Julia0.3でランダムフォレスト
Julia0.3でランダムフォレスト
家に早く帰りたい
家に早く帰りたい
はじパタ11章 後半
はじパタ11章 後半
イケてる分析基盤をつくる
1.
イケてる分析基盤をつくる @gepuro
2.
動機 アクセス状況をリアルタイムに収集加工して、サイトに反映させたい。 2/11
3.
現在の分析基盤 3/11 blog google_analytics web_beacon article local_file text_mining sqlite
4.
完成予定 netflixとほぼ同じ・・・ 4/11 blog web_beacon article kafka spark_streaming S3 druid twitter kafka_manager panoramix flask API
5.
kafka, kafka manager kafka kafka
manager · 2011年にLinkedINが公開した分散メッセージングシステム 2M write / sec - - · kafkaの管理ツール ブラウザぽちぽち - - 5/11
6.
druid ストリーミングデータに対応したデータベース Fast Scalable * ペタバイトまでスケールする Built
for Analytics · · 列指向- · 1M events / second でデータの挿入が可能- · SQLが書ける- Sql4D (yahoo incが開発してる)- 6/11
7.
panoramix ダッシュボードのフレームワーク 構成 python2.7でしか動かない(python3では一部動く) まだベータ版かな · flask druid - - · · 7/11
8.
webビーコン サーバ側 サイト側 · https://gist.github.com/anonymous/d02c6438813add79a387- · https://gist.github.com/anonymous/7c038e7b4e690c51409d- 8/11
9.
ミドルウェアの構築 コードを残すためにdockerを利用 それぞれでは動作確認したけど、接続が出来ていない。 お手製のflask環境 お手製のpanoramix環境 https://hub.docker.com/_/memcached/ https://hub.docker.com/r/sheepkiller/kafka-manager/ https://github.com/laclefyoshi/druid_test/tree/master/druid https://github.com/mistercrunch/panoramix https://hub.docker.com/r/sequenceiq/spark/ · · · · · · · 9/11
10.
dockerネットワーク 自分のブログで実験をするため、さくらVPS 1Gプランで動かしたい sparkがメモリを食うので、スワップ多発 kafkaもメモリを食う。。。 Sparkを別のホスト(自宅サーバ)で利用する。 http://weave.works/ · · · · 個人ユースで、AWSは高いです・・・orz- · 異なるホストで動かすdockerを接続させる デモ:https://www.youtube.com/watch?v=kihQCCT1ykE これで、Sparkを別ホストで動かせそう - - - 10/11
11.
次回? 各ミドルウェアを接続せさる。 順番 druidとpanoramix1. druidとkafka2. kafkaとSpark Streaming3. flaskとdruid4. その他5. 11/11
Download now