Home
Explore
Submit Search
Upload
Login
Signup
Advertisement
Check these out next
Spark Streamingを使ってみた ~Twitterリアルタイムトレンドランキング~
sugiyama koki
Spark GraphX で始めるグラフ解析
Yosuke Mizutani
Devsumi 2016 b_4 KafkaとSparkを組み合わせたリアルタイム分析基盤の構築
Tanaka Yuichi
Watson summit 2016_j2_5
Tanaka Yuichi
初めてのSpark streaming 〜kafka+sparkstreamingの紹介〜
Tanaka Yuichi
Spark Summit 2015 参加報告
Katsunori Kanda
Kafkaを活用するためのストリーム処理の基本
Sotaro Kimura
Apache NiFiと他プロダクトのつなぎ方
Sotaro Kimura
1
of
28
Top clipped slide
Spark Streamingで作る、つぶやきビッグデータのクローン(Hadoop Spark Conference Japan 2016版)
Feb. 8, 2016
•
0 likes
2 likes
×
Be the first to like this
Show More
•
1,960 views
views
×
Total views
0
On Slideshare
0
From embeds
0
Number of embeds
0
Download Now
Download to read offline
Report
Data & Analytics
Hadoop Spark Conference Japan 2016での発表資料です
Junichi Noda
Follow
Software Developer at 秋葉原IT戦略研究所
Advertisement
Advertisement
Advertisement
Recommended
Apache Sparkを利用した「つぶやきビッグデータ」クローンとリコメンドシステムの構築
Junichi Noda
3.6K views
•
48 slides
Spark Streamingで作る、つぶやきビッグデータのクローン (2015-11.10版)
Junichi Noda
1.9K views
•
37 slides
Spark Streaming と Spark GraphX を使用したTwitter解析による レコメンドサービス例
Junichi Noda
3.1K views
•
55 slides
GEEK ACADEMY REAL Vol.2. 「最先端のデータ解析/Apache Sparkを利用したレコメンドエンジン開発」
Junichi Noda
1.3K views
•
24 slides
Spark streamingを使用したtwitter解析によるレコメンドサービス例
Junichi Noda
2.6K views
•
46 slides
Apache sparkでつぶやきビッグデータ クローンをつくってみた
Junichi Noda
3.2K views
•
32 slides
More Related Content
Slideshows for you
(20)
Spark Streamingを使ってみた ~Twitterリアルタイムトレンドランキング~
sugiyama koki
•
5K views
Spark GraphX で始めるグラフ解析
Yosuke Mizutani
•
3K views
Devsumi 2016 b_4 KafkaとSparkを組み合わせたリアルタイム分析基盤の構築
Tanaka Yuichi
•
3.1K views
Watson summit 2016_j2_5
Tanaka Yuichi
•
759 views
初めてのSpark streaming 〜kafka+sparkstreamingの紹介〜
Tanaka Yuichi
•
7.8K views
Spark Summit 2015 参加報告
Katsunori Kanda
•
3.3K views
Kafkaを活用するためのストリーム処理の基本
Sotaro Kimura
•
8.3K views
Apache NiFiと他プロダクトのつなぎ方
Sotaro Kimura
•
5.5K views
BigDataUnivercity 2017年改めてApache Sparkとデータサイエンスの関係についてのまとめ
Tanaka Yuichi
•
1.4K views
本当にあったApache Spark障害の話
x1 ichi
•
7.9K views
16.02.08_Hadoop Conferece Japan 2016_データサイエンスにおける一次可視化からのSpark on Elasticsear...
LINE Corp.
•
1.2K views
Sparkを用いたビッグデータ解析 〜 前編 〜
x1 ichi
•
10.8K views
Bluemixを使ったTwitter分析
Tanaka Yuichi
•
8.6K views
Big datauniversity
Tanaka Yuichi
•
3.1K views
Jjug ccc
Tanaka Yuichi
•
4.2K views
QConTokyo2015「Sparkを用いたビッグデータ解析 〜後編〜」
Kazuki Taniguchi
•
3.5K views
Apache Sparkを使った感情極性分析
Tanaka Yuichi
•
2.7K views
ApacheSparkを中心としたOSSビッグデータ活用と導入時の検討ポイント
Tanaka Yuichi
•
13.9K views
SparkとJupyterNotebookを使った分析処理 [Html5 conference]
Tanaka Yuichi
•
3.3K views
15.05.21_ビッグデータ分析基盤Sparkの最新動向とその活用-Spark SUMMIT EAST 2015-
LINE Corp.
•
1.3K views
Viewers also liked
(20)
法規制後でも個人で楽しむドローン入門 2016・秋
Junichi Noda
•
526 views
アイデアスケッチ テンプレート
Junichi Noda
•
690 views
秋葉原IT戦略研究所のご紹介
Junichi Noda
•
1.4K views
とらのあなエンジニア採用イベント 2017年2月9日
Junichi Noda
•
1.8K views
いろいろなストリーム処理プロダクトをベンチマークしてみた #hcj2016
Yahoo!デベロッパーネットワーク
•
1.9K views
JS と Canvas で作るシューティングゲーム
sairoutine
•
2.5K views
Touhou Project on JavaScript
sairoutine
•
795 views
Maintainable cloud architecture_of_hadoop
Kai Sasaki
•
4.3K views
Mithril - 軽量/高速なMVCフレームワーク
sairoutine
•
3.2K views
[Anitech] ITでアニメを考える、「ShangriLa Meetup5」
Junichi Noda
•
918 views
アニメ聖地デザインパターン
Junichi Noda
•
3.1K views
ラブライブ!サンシャイン!!入門書 (A4 縦向き)
Junichi Noda
•
3.6K views
本当にあったHadoopの恐い話Blockはどこへきえた? (Hadoop / Spark Conference Japan 2016 ライトニングトー...
NTT DATA OSS Professional Services
•
3.8K views
僕の考える最強のビックデータエンジニア
Yu Yamada
•
4.2K views
サポートメンバは見た! Hadoopバグワースト10 (adoop / Spark Conference Japan 2016 ライトニングトーク発表資料)
NTT DATA OSS Professional Services
•
3.4K views
金融機関でのHive/Presto事例紹介
Amazon Web Services Japan
•
5.7K views
せいまち〜聖地探訪に出会いを求めるのは間違っているだろうか〜
Junichi Noda
•
9.2K views
Hadoop Conference Japan_2016 セッション「顧客事例から学んだ、 エンタープライズでの "マジな"Hadoop導入の勘所」
オラクルエンジニア通信
•
4.7K views
レガシーな Perl システムに DDD (ドメイン駆動設計)を取り入れる
sairoutine
•
3.8K views
Slack + Hubot でお前の一番好きな二次元嫁キャラと一緒に仕事をする
sairoutine
•
5.5K views
Advertisement
Similar to Spark Streamingで作る、つぶやきビッグデータのクローン(Hadoop Spark Conference Japan 2016版)
(20)
Spark Structured StreamingでKafkaクラスタのデータをお手軽活用
Sotaro Kimura
•
1.2K views
Spark Streaming on AWS -S3からKinesisへ-
chibochibo
•
1.1K views
Strem処理(Spark Streaming + Kinesis)とOffline処理(Hive)の統合
SmartNews, Inc.
•
2.3K views
さくらのナレッジの運営から見えるもの
法林浩之
•
746 views
Elastic StackでWebサーバのログ解析を始めた件について
Takaaki Hoyo
•
2.6K views
Pythonで入門するApache Spark at PyCon2016
Tatsuya Atsumi
•
5.8K views
Spark Summit 2014 の報告と最近の取り組みについて
Recruit Technologies
•
2.7K views
Spark Streamingを活用したシステムの検証結果と設計時のノウハウ
Future Of Data Japan
•
3.3K views
Sparkでレコメンドエンジンを作ってみた
fujita_s
•
4.5K views
Apache Spark+Zeppelinでアドホックなネットワーク解析
npsg
•
2.5K views
ビッグじゃなくても使えるSpark Streaming
chibochibo
•
3.4K views
大量のデータ処理や分析に使えるOSS Apache Spark入門(Open Source Conference 2021 Online/Kyoto 発表資料)
NTT DATA Technology & Innovation
•
1.2K views
平成最後の1月ですし、Databricksでもやってみましょうか
Ryuichi Tokugami
•
1.4K views
コンテナ事例 CircleCI, Cucumber-Chef
Yukihiko SAWANOBORI
•
6.2K views
PythonによるWebスクレイピング入門
Hironori Sekine
•
105.5K views
ゼロから始めるSparkSQL徹底活用!
Nagato Kasaki
•
6.5K views
Spanner移行について本気出して考えてみた
techgamecollege
•
1.5K views
Presto As A Service - Treasure DataでのPresto運用事例
Taro L. Saito
•
9.8K views
さくらのクラウドアップデート情報2016年7月版
さくらインターネット株式会社
•
942 views
Apache Spark + Arrow
Takeshi Yamamuro
•
1.2K views
More from Junichi Noda
(14)
アニメ聖地巡礼についてのアイデアソンテンプレート
Junichi Noda
•
3.4K views
ITを使った今時の聖地巡礼ユーザー分析 in 沼津
Junichi Noda
•
769 views
ラブライブ✕沼津 アニメタイアップについて
Junichi Noda
•
8.6K views
Word2Vec Neologdで作るアニメ人工知能
Junichi Noda
•
3.8K views
秋葉原IT戦略研究所のご紹介(2016/05/04)
Junichi Noda
•
3.4K views
日本のアニメ産業を爆速させるアニメAPIの開発と活用事例 (ニコニコ超会議2016 大和証券ステージ)
Junichi Noda
•
4.1K views
ShangriLa Anime APIを利用してアニメ関連のビッグデータ解析を最速で行う
Junichi Noda
•
4.4K views
機械学習ライブラリ「Spark MLlib」で作る アニメレコメンドシステムver 1.1
Junichi Noda
•
1.3K views
機械学習ライブラリ「Spark MLlib」で作る アニメレコメンドシステム
Junichi Noda
•
11.2K views
秋葉原IT戦略研究所のREAL~コミュニティ立ち上げから半年間の成果~
Junichi Noda
•
368 views
アカリクVol7 「アドテク」gmoアドパートナーズ株式会社
Junichi Noda
•
5.6K views
最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML
Junichi Noda
•
9.4K views
ConoHaオブジェクトストレージ 利用ケース
Junichi Noda
•
3.8K views
オープンソースカンファレンス2014 kansai@kyoto
Junichi Noda
•
552 views
Advertisement
Recently uploaded
(20)
51西雅图大学.pdf
dsadasd17
•
2 views
#国外文凭办理奥克兰大学学位证成绩单
08e9d7528d5drman
•
2 views
#国外文凭办理Duquesne学位证成绩单
losapab511ockdiaom
•
2 views
173-天普大学.pdf
dsadasd17
•
2 views
39.思克莱德大学.pdf
dsadasd17
•
2 views
#学位证靠谱办乌尔姆大学文凭证书全套
qghfsvkwiqiubridge
•
3 views
#国外文凭办理Mizzou学位证成绩单
losapab511ockdiaom
•
2 views
★可查可存档〖制作曼尼托巴大学文凭证书毕业证〗
tujjj
•
2 views
43圣玛丽大学.pdf
dsadasd17
•
2 views
#专业办证《Dal毕业证学位证原版精仿》
mibiri4418mevor
•
2 views
#专业办证《梅西大学毕业证学位证原版精仿》
ee61223771acdrman
•
2 views
#学位证靠谱办Camosun文凭证书全套
qghfsvkwiqiubridge
•
2 views
66俄勒冈大学.pdf
dsadasd17
•
2 views
2022年度エネルギー白書資料集
ssuser1323ea1
•
3 views
#国外文凭办理Baylor学位证成绩单
losapab511ockdiaom
•
2 views
#国外文凭办理Seneca学位证成绩单
08e9d7528d5drman
•
3 views
交通ゲーム理論入門
Takuma Oda
•
4 views
#国外文凭办理KU学位证成绩单
losapab511ockdiaom
•
2 views
1悉尼大学.pdf
dsadasd17
•
11 views
Qlik医療データ活用勉強会_第26回_202305.pptx
QlikPresalesJapan
•
18 views
Spark Streamingで作る、つぶやきビッグデータのクローン(Hadoop Spark Conference Japan 2016版)
Spark Streamingで作る、 つぶやきビッグデータのクローン GMOインターネット 次世代システム研究室 (所属コミュニティ:
秋葉原IT戦略研究所) 野田純一 2016.02.08
Overview 1.自己紹介 私とSparkの関わり 2.目的 3.Spark Streamingについて 4.検証サービス説明 5.Spark Streamingを使用したオンラインTwitter解析によるレコメンドシステム 「Mikasa」-三笠 6.まとめ
• 実業務でSpark使っています
• Sparkについて少し執筆しました • 「Software
Design 2015年11月号」 • ConoHaを使ったHadoopクラスタの構成例と SparkSQLをつかったデータ処理の実例が記載。
5 ↓これが作りたい 2014 7月22日 NHK
3. Spark Streaming
について • Sparkサブシステムの一つでファイルからでなくリアルタイ ムに流れてくるストリームソースに対しての集計を対象とし ている。 • 直近1時間のツイート数を毎分集計する、直近3時間でアクセ スが多いIPを集計する・・などのウィンドウ集計が可能。
3. Spark Streaming
∼データソースについて その他、ssc.socketTextStream(" localhost", 7777) とするとローカルポートをソースにできるのでサーバーのログを流 し込んでリアルタイムにエラー、クラックIPの集計などが可能。
4. Spark Streamingを使用したオンライン Twitter解析によるレコメンドシステム 「Mikasa」-三笠 https://github.com/AKB428/mikasa_ol https://github.com/AKB428/mikasa_rs
• Twitterストリームからデータを取得する。 • Twitter
Streaming APIを使う。 • 400の検索キーワードが指定可能。 • Spark Stremingでリアルタイム集計を行う。
14 2015年7月22日
画面デモ(直近5分を毎分集計) (F1)2015年冬期 TVアニメ http://tv-anime.xyz/5/ (F2)ラブライブ
http://lovelive-net.com/5/ (F2)2016年春期TVアニメ http://akiba-net.com/ 5/ (F2)関東TV番組 http://telev.net/5/ F1=ユーザー辞書に登録してある単語のみ集計 F2=ユーザー辞書外の単語も集計
画面デモ(直近60分を毎分集計) (F1)2015年冬期TVアニメ http://tv-anime.xyz/ 60/ (F2)ラブライブ http://lovelive-net.com/60/ (F2)2016年春期TVアニメ
http://akiba-net.com/ 60/ (F2)関東TV番組 http://telev.net/60/ F1=ユーザー辞書に登録してある単語のみ集計 F2=ユーザー辞書外の単語も集計
システム・デモ
画面デモ 過去の履歴キャプチャ
• コミケ 2015
12/31 朝8時頃
• 最近のバルス
デモ:リコメンドTwitterボット https://twitter.com/Akihabaara_itso https://twitter.com/AnimeBigdata/
実際の売上 23
サーバーデモ 動作中のサーバーのコンソールを公開
Mikasaインストールについて インストールマニュアル https://gist.github.com/AKB428/c30bc6a979e05fa3a022 • TwitterAPIとAmazonAPIのアカウントがあれば1時間でセット アップ完了。 • AmazonAPIはリコメンドしない場合は不要。 •
TwitterAPIのアカウント取得も10分程度で可能。 Mikasa OL https://github.com/AKB428/mikasa_ol Mikasa RS https://github.com/AKB428/mikasa_rs
• 10. まとめ •
作ったシステムはスタンドアロンでも安定して動く (4ヶ月放置しても安定動作 Spark1.4、Spark1.5) • 視覚的にわかりやすい、作りやすいのでSpark入門用 の教材に最適、会社ではインターン生にCDH、HDPク ラスタを構築してもらい、クラスタ上で動作するよう 作ってもらったりしている。(分散処理を体験したい 学生向け) • イベントのハッシュタグを監視し、イベントの展示モ ニタなどに使うといい感じ。(OSCでは実際使っても らっている。 • 辞書はmecab-ipadic-neologdを導入したい。
秋葉原IT戦略研究所(同人ITサークルです) 出展します。2月18∼19日 ←薄い本も出します
ご清聴ありがとうございました
Advertisement