Submit Search
Upload
Apache Sparkを利用した「つぶやきビッグデータ」クローンとリコメンドシステムの構築
•
Download as PPTX, PDF
•
7 likes
•
3,637 views
Junichi Noda
Follow
デブサミ2016 1日目のセッション内容です。 http://event.shoeisha.jp/devsumi/20160218/session/993/
Read less
Read more
Technology
Report
Share
Report
Share
1 of 48
Download now
Recommended
Apache sparkでつぶやきビッグデータ クローンをつくってみた
Apache sparkでつぶやきビッグデータ クローンをつくってみた
Junichi Noda
Spark Streamingで作る、つぶやきビッグデータのクローン (2015-11.10版)
Spark Streamingで作る、つぶやきビッグデータのクローン (2015-11.10版)
Junichi Noda
GEEK ACADEMY REAL Vol.2. 「最先端のデータ解析/Apache Sparkを利用したレコメンドエンジン開発」
GEEK ACADEMY REAL Vol.2. 「最先端のデータ解析/Apache Sparkを利用したレコメンドエンジン開発」
Junichi Noda
Spark Streamingで作る、つぶやきビッグデータのクローン(Hadoop Spark Conference Japan 2016版)
Spark Streamingで作る、つぶやきビッグデータのクローン(Hadoop Spark Conference Japan 2016版)
Junichi Noda
Spark streamingを使用したtwitter解析によるレコメンドサービス例
Spark streamingを使用したtwitter解析によるレコメンドサービス例
Junichi Noda
Spark Streaming と Spark GraphX を使用したTwitter解析による レコメンドサービス例
Spark Streaming と Spark GraphX を使用したTwitter解析による レコメンドサービス例
Junichi Noda
2015 10 24_spark_osc15tk
2015 10 24_spark_osc15tk
Junichi Noda
GraphXはScalaエンジニアにとってのブルーオーシャン @ Scala Matsuri 2014
GraphXはScalaエンジニアにとってのブルーオーシャン @ Scala Matsuri 2014
鉄平 土佐
Recommended
Apache sparkでつぶやきビッグデータ クローンをつくってみた
Apache sparkでつぶやきビッグデータ クローンをつくってみた
Junichi Noda
Spark Streamingで作る、つぶやきビッグデータのクローン (2015-11.10版)
Spark Streamingで作る、つぶやきビッグデータのクローン (2015-11.10版)
Junichi Noda
GEEK ACADEMY REAL Vol.2. 「最先端のデータ解析/Apache Sparkを利用したレコメンドエンジン開発」
GEEK ACADEMY REAL Vol.2. 「最先端のデータ解析/Apache Sparkを利用したレコメンドエンジン開発」
Junichi Noda
Spark Streamingで作る、つぶやきビッグデータのクローン(Hadoop Spark Conference Japan 2016版)
Spark Streamingで作る、つぶやきビッグデータのクローン(Hadoop Spark Conference Japan 2016版)
Junichi Noda
Spark streamingを使用したtwitter解析によるレコメンドサービス例
Spark streamingを使用したtwitter解析によるレコメンドサービス例
Junichi Noda
Spark Streaming と Spark GraphX を使用したTwitter解析による レコメンドサービス例
Spark Streaming と Spark GraphX を使用したTwitter解析による レコメンドサービス例
Junichi Noda
2015 10 24_spark_osc15tk
2015 10 24_spark_osc15tk
Junichi Noda
GraphXはScalaエンジニアにとってのブルーオーシャン @ Scala Matsuri 2014
GraphXはScalaエンジニアにとってのブルーオーシャン @ Scala Matsuri 2014
鉄平 土佐
Apache NiFiと他プロダクトのつなぎ方
Apache NiFiと他プロダクトのつなぎ方
Sotaro Kimura
楽天のSplunk as a service
楽天のSplunk as a service
Rakuten Group, Inc.
Awsでつくるapache kafkaといろんな悩み
Awsでつくるapache kafkaといろんな悩み
Keigo Suda
ビッグじゃなくても使えるSpark Streaming
ビッグじゃなくても使えるSpark Streaming
chibochibo
Jazug6周年lt(片倉義昌)
Jazug6周年lt(片倉義昌)
Yoshimasa Katakura
2015/04/25 妖怪は見た!実録Azure事件簿アプリケーション編 / Global Azure Boot Camp
2015/04/25 妖怪は見た!実録Azure事件簿アプリケーション編 / Global Azure Boot Camp
Yuki KAN
2015/04/25 Azure JavaScript API App つくったよ (LT) / Global Azure Boot Camp
2015/04/25 Azure JavaScript API App つくったよ (LT) / Global Azure Boot Camp
Yuki KAN
Elasticsearch 変わり種プラグインの作り方
Elasticsearch 変わり種プラグインの作り方
Ryoji Kurosawa
Zabbixによるオートスケーリングクラスタ監視とオペレーション自動化
Zabbixによるオートスケーリングクラスタ監視とオペレーション自動化
真乙 九龍
20150312 html5とか勉強会-lt-開発者に知ってほしいi pv6のこと
20150312 html5とか勉強会-lt-開発者に知ってほしいi pv6のこと
v6app
elasticsearchプラグイン入門
elasticsearchプラグイン入門
Shinsuke Sugaya
Spark Streaming on AWS -S3からKinesisへ-
Spark Streaming on AWS -S3からKinesisへ-
chibochibo
Spark in small or middle scale data processing with Elasticsearch
Spark in small or middle scale data processing with Elasticsearch
chibochibo
Osc2013 kansai@kyoto ZABBIX-JP クラウド環境監視効率化
Osc2013 kansai@kyoto ZABBIX-JP クラウド環境監視効率化
Daisuke Ikeda
ニコニコニュースと全文検索
ニコニコニュースと全文検索
techtalkdwango
さくらのナレッジの運営から見えるもの
さくらのナレッジの運営から見えるもの
法林浩之
第2回インフラエンジニアのためのプレゼン技術研究会(オススメの技術書)
第2回インフラエンジニアのためのプレゼン技術研究会(オススメの技術書)
Ken Sawada
Kafka logをオブジェクトストレージに連携する方法まとめ
Kafka logをオブジェクトストレージに連携する方法まとめ
Keigo Suda
MariaDBとMroongaで作る全言語対応超高速全文検索システム
MariaDBとMroongaで作る全言語対応超高速全文検索システム
Kouhei Sutou
私がCloudStackを使う4つの理由
私がCloudStackを使う4つの理由
Takuma Nakajima
広告配信現場で使うSpark機械学習
広告配信現場で使うSpark機械学習
x1 ichi
How to develop a huge Single Page Application
How to develop a huge Single Page Application
Naoki Yamada
More Related Content
What's hot
Apache NiFiと他プロダクトのつなぎ方
Apache NiFiと他プロダクトのつなぎ方
Sotaro Kimura
楽天のSplunk as a service
楽天のSplunk as a service
Rakuten Group, Inc.
Awsでつくるapache kafkaといろんな悩み
Awsでつくるapache kafkaといろんな悩み
Keigo Suda
ビッグじゃなくても使えるSpark Streaming
ビッグじゃなくても使えるSpark Streaming
chibochibo
Jazug6周年lt(片倉義昌)
Jazug6周年lt(片倉義昌)
Yoshimasa Katakura
2015/04/25 妖怪は見た!実録Azure事件簿アプリケーション編 / Global Azure Boot Camp
2015/04/25 妖怪は見た!実録Azure事件簿アプリケーション編 / Global Azure Boot Camp
Yuki KAN
2015/04/25 Azure JavaScript API App つくったよ (LT) / Global Azure Boot Camp
2015/04/25 Azure JavaScript API App つくったよ (LT) / Global Azure Boot Camp
Yuki KAN
Elasticsearch 変わり種プラグインの作り方
Elasticsearch 変わり種プラグインの作り方
Ryoji Kurosawa
Zabbixによるオートスケーリングクラスタ監視とオペレーション自動化
Zabbixによるオートスケーリングクラスタ監視とオペレーション自動化
真乙 九龍
20150312 html5とか勉強会-lt-開発者に知ってほしいi pv6のこと
20150312 html5とか勉強会-lt-開発者に知ってほしいi pv6のこと
v6app
elasticsearchプラグイン入門
elasticsearchプラグイン入門
Shinsuke Sugaya
Spark Streaming on AWS -S3からKinesisへ-
Spark Streaming on AWS -S3からKinesisへ-
chibochibo
Spark in small or middle scale data processing with Elasticsearch
Spark in small or middle scale data processing with Elasticsearch
chibochibo
Osc2013 kansai@kyoto ZABBIX-JP クラウド環境監視効率化
Osc2013 kansai@kyoto ZABBIX-JP クラウド環境監視効率化
Daisuke Ikeda
ニコニコニュースと全文検索
ニコニコニュースと全文検索
techtalkdwango
さくらのナレッジの運営から見えるもの
さくらのナレッジの運営から見えるもの
法林浩之
第2回インフラエンジニアのためのプレゼン技術研究会(オススメの技術書)
第2回インフラエンジニアのためのプレゼン技術研究会(オススメの技術書)
Ken Sawada
Kafka logをオブジェクトストレージに連携する方法まとめ
Kafka logをオブジェクトストレージに連携する方法まとめ
Keigo Suda
MariaDBとMroongaで作る全言語対応超高速全文検索システム
MariaDBとMroongaで作る全言語対応超高速全文検索システム
Kouhei Sutou
私がCloudStackを使う4つの理由
私がCloudStackを使う4つの理由
Takuma Nakajima
What's hot
(20)
Apache NiFiと他プロダクトのつなぎ方
Apache NiFiと他プロダクトのつなぎ方
楽天のSplunk as a service
楽天のSplunk as a service
Awsでつくるapache kafkaといろんな悩み
Awsでつくるapache kafkaといろんな悩み
ビッグじゃなくても使えるSpark Streaming
ビッグじゃなくても使えるSpark Streaming
Jazug6周年lt(片倉義昌)
Jazug6周年lt(片倉義昌)
2015/04/25 妖怪は見た!実録Azure事件簿アプリケーション編 / Global Azure Boot Camp
2015/04/25 妖怪は見た!実録Azure事件簿アプリケーション編 / Global Azure Boot Camp
2015/04/25 Azure JavaScript API App つくったよ (LT) / Global Azure Boot Camp
2015/04/25 Azure JavaScript API App つくったよ (LT) / Global Azure Boot Camp
Elasticsearch 変わり種プラグインの作り方
Elasticsearch 変わり種プラグインの作り方
Zabbixによるオートスケーリングクラスタ監視とオペレーション自動化
Zabbixによるオートスケーリングクラスタ監視とオペレーション自動化
20150312 html5とか勉強会-lt-開発者に知ってほしいi pv6のこと
20150312 html5とか勉強会-lt-開発者に知ってほしいi pv6のこと
elasticsearchプラグイン入門
elasticsearchプラグイン入門
Spark Streaming on AWS -S3からKinesisへ-
Spark Streaming on AWS -S3からKinesisへ-
Spark in small or middle scale data processing with Elasticsearch
Spark in small or middle scale data processing with Elasticsearch
Osc2013 kansai@kyoto ZABBIX-JP クラウド環境監視効率化
Osc2013 kansai@kyoto ZABBIX-JP クラウド環境監視効率化
ニコニコニュースと全文検索
ニコニコニュースと全文検索
さくらのナレッジの運営から見えるもの
さくらのナレッジの運営から見えるもの
第2回インフラエンジニアのためのプレゼン技術研究会(オススメの技術書)
第2回インフラエンジニアのためのプレゼン技術研究会(オススメの技術書)
Kafka logをオブジェクトストレージに連携する方法まとめ
Kafka logをオブジェクトストレージに連携する方法まとめ
MariaDBとMroongaで作る全言語対応超高速全文検索システム
MariaDBとMroongaで作る全言語対応超高速全文検索システム
私がCloudStackを使う4つの理由
私がCloudStackを使う4つの理由
Viewers also liked
広告配信現場で使うSpark機械学習
広告配信現場で使うSpark機械学習
x1 ichi
How to develop a huge Single Page Application
How to develop a huge Single Page Application
Naoki Yamada
Akira shibata at developer summit 2016
Akira shibata at developer summit 2016
Akira Shibata
Sparkで始めるお手軽グラフデータ分析
Sparkで始めるお手軽グラフデータ分析
Nagato Kasaki
Selenium boot campの紹介
Selenium boot campの紹介
Nozomi Ito
IT系女子集まれ!女子部カンファレンスvo.1 用スライド資料
IT系女子集まれ!女子部カンファレンスvo.1 用スライド資料
Kazumi IWANAGA
本当にあったApache Spark障害の話
本当にあったApache Spark障害の話
x1 ichi
Disrupting Big Data with Apache Spark in the Cloud
Disrupting Big Data with Apache Spark in the Cloud
Jen Aman
【18-C-5】C# で iOS/Androidアプリ開発 - Visual Studio 2015 + Xamarin + MVVMCross -
【18-C-5】C# で iOS/Androidアプリ開発 - Visual Studio 2015 + Xamarin + MVVMCross -
ShinichiAoyagi
モノづくりを楽しもう! ~ このデバイスとクラウドでできること
モノづくりを楽しもう! ~ このデバイスとクラウドでできること
Kazumi IWANAGA
Kafka 0.10.0 アップデート、プロダクション100ノードでやってみた #yjdsnight
Kafka 0.10.0 アップデート、プロダクション100ノードでやってみた #yjdsnight
Yahoo!デベロッパーネットワーク
Devsumi 2016 b_4 KafkaとSparkを組み合わせたリアルタイム分析基盤の構築
Devsumi 2016 b_4 KafkaとSparkを組み合わせたリアルタイム分析基盤の構築
Tanaka Yuichi
Apache Atlasの現状とデータガバナンス事例 #hadoopreading
Apache Atlasの現状とデータガバナンス事例 #hadoopreading
Yahoo!デベロッパーネットワーク
Spark as a Platform to Support Multi-Tenancy and Many Kinds of Data Applicati...
Spark as a Platform to Support Multi-Tenancy and Many Kinds of Data Applicati...
Spark Summit
Top 5 mistakes when writing Spark applications
Top 5 mistakes when writing Spark applications
hadooparchbook
クラウドを使ったデザイン データ活用 - Autodesk Forge ご紹介 @ デブサミ 2016
クラウドを使ったデザイン データ活用 - Autodesk Forge ご紹介 @ デブサミ 2016
Isezaki Toshiaki
Apache Spark 1000 nodes NTT DATA
Apache Spark 1000 nodes NTT DATA
NTT DATA OSS Professional Services
我が家のフロントエンド開発事情
我が家のフロントエンド開発事情
Naoki Yamada
Sparkでレコメンドエンジンを作ってみた
Sparkでレコメンドエンジンを作ってみた
fujita_s
Java script.trend(spec)
Java script.trend(spec)
dynamis
Viewers also liked
(20)
広告配信現場で使うSpark機械学習
広告配信現場で使うSpark機械学習
How to develop a huge Single Page Application
How to develop a huge Single Page Application
Akira shibata at developer summit 2016
Akira shibata at developer summit 2016
Sparkで始めるお手軽グラフデータ分析
Sparkで始めるお手軽グラフデータ分析
Selenium boot campの紹介
Selenium boot campの紹介
IT系女子集まれ!女子部カンファレンスvo.1 用スライド資料
IT系女子集まれ!女子部カンファレンスvo.1 用スライド資料
本当にあったApache Spark障害の話
本当にあったApache Spark障害の話
Disrupting Big Data with Apache Spark in the Cloud
Disrupting Big Data with Apache Spark in the Cloud
【18-C-5】C# で iOS/Androidアプリ開発 - Visual Studio 2015 + Xamarin + MVVMCross -
【18-C-5】C# で iOS/Androidアプリ開発 - Visual Studio 2015 + Xamarin + MVVMCross -
モノづくりを楽しもう! ~ このデバイスとクラウドでできること
モノづくりを楽しもう! ~ このデバイスとクラウドでできること
Kafka 0.10.0 アップデート、プロダクション100ノードでやってみた #yjdsnight
Kafka 0.10.0 アップデート、プロダクション100ノードでやってみた #yjdsnight
Devsumi 2016 b_4 KafkaとSparkを組み合わせたリアルタイム分析基盤の構築
Devsumi 2016 b_4 KafkaとSparkを組み合わせたリアルタイム分析基盤の構築
Apache Atlasの現状とデータガバナンス事例 #hadoopreading
Apache Atlasの現状とデータガバナンス事例 #hadoopreading
Spark as a Platform to Support Multi-Tenancy and Many Kinds of Data Applicati...
Spark as a Platform to Support Multi-Tenancy and Many Kinds of Data Applicati...
Top 5 mistakes when writing Spark applications
Top 5 mistakes when writing Spark applications
クラウドを使ったデザイン データ活用 - Autodesk Forge ご紹介 @ デブサミ 2016
クラウドを使ったデザイン データ活用 - Autodesk Forge ご紹介 @ デブサミ 2016
Apache Spark 1000 nodes NTT DATA
Apache Spark 1000 nodes NTT DATA
我が家のフロントエンド開発事情
我が家のフロントエンド開発事情
Sparkでレコメンドエンジンを作ってみた
Sparkでレコメンドエンジンを作ってみた
Java script.trend(spec)
Java script.trend(spec)
Similar to Apache Sparkを利用した「つぶやきビッグデータ」クローンとリコメンドシステムの構築
Watson summit 2016_j2_5
Watson summit 2016_j2_5
Tanaka Yuichi
Databricks の始め方
Databricks の始め方
Ryoma Nagata
15.05.21_ビッグデータ分析基盤Sparkの最新動向とその活用-Spark SUMMIT EAST 2015-
15.05.21_ビッグデータ分析基盤Sparkの最新動向とその活用-Spark SUMMIT EAST 2015-
LINE Corp.
Sparkを用いたビッグデータ解析 〜 前編 〜
Sparkを用いたビッグデータ解析 〜 前編 〜
x1 ichi
Apache Spark + Arrow
Apache Spark + Arrow
Takeshi Yamamuro
PythonによるWebスクレイピング入門
PythonによるWebスクレイピング入門
Hironori Sekine
Skinny Framework で始めた Scala
Skinny Framework で始めた Scala
Ryuji Yamashita
Spark Structured StreamingでKafkaクラスタのデータをお手軽活用
Spark Structured StreamingでKafkaクラスタのデータをお手軽活用
Sotaro Kimura
SparkTokyo2019NovIshizaki
SparkTokyo2019NovIshizaki
Kazuaki Ishizaki
20160127三木会 RDB経験者のためのspark
20160127三木会 RDB経験者のためのspark
Ryuji Tamagawa
Spark Summit 2014 の報告と最近の取り組みについて
Spark Summit 2014 の報告と最近の取り組みについて
Recruit Technologies
Spray intro
Spray intro
Suguru Hamazaki
Webサーバの基礎知識【編集済み】
Webサーバの基礎知識【編集済み】
Kikunaga Taishi
Apache EventMesh を使ってみた
Apache EventMesh を使ってみた
Yoshiyasu SAEKI
恐るべきApache, Web勉強会@福岡
恐るべきApache, Web勉強会@福岡
Aya Komuro
PySpark Intro Part.2 with SQL Graph
PySpark Intro Part.2 with SQL Graph
Oshitari_kochi
SwaggerとAPIのデザイン
SwaggerとAPIのデザイン
Kazuhiro Hara
スキーマつきストリーム データ処理基盤、 Confluent Platformとは?
スキーマつきストリーム データ処理基盤、 Confluent Platformとは?
Sotaro Kimura
Spark SQL - The internal -
Spark SQL - The internal -
NTT DATA OSS Professional Services
Raspberry Pi用のコンテナをクラウドでビルドする方法
Raspberry Pi用のコンテナをクラウドでビルドする方法
Shunsuke Kikuchi
Similar to Apache Sparkを利用した「つぶやきビッグデータ」クローンとリコメンドシステムの構築
(20)
Watson summit 2016_j2_5
Watson summit 2016_j2_5
Databricks の始め方
Databricks の始め方
15.05.21_ビッグデータ分析基盤Sparkの最新動向とその活用-Spark SUMMIT EAST 2015-
15.05.21_ビッグデータ分析基盤Sparkの最新動向とその活用-Spark SUMMIT EAST 2015-
Sparkを用いたビッグデータ解析 〜 前編 〜
Sparkを用いたビッグデータ解析 〜 前編 〜
Apache Spark + Arrow
Apache Spark + Arrow
PythonによるWebスクレイピング入門
PythonによるWebスクレイピング入門
Skinny Framework で始めた Scala
Skinny Framework で始めた Scala
Spark Structured StreamingでKafkaクラスタのデータをお手軽活用
Spark Structured StreamingでKafkaクラスタのデータをお手軽活用
SparkTokyo2019NovIshizaki
SparkTokyo2019NovIshizaki
20160127三木会 RDB経験者のためのspark
20160127三木会 RDB経験者のためのspark
Spark Summit 2014 の報告と最近の取り組みについて
Spark Summit 2014 の報告と最近の取り組みについて
Spray intro
Spray intro
Webサーバの基礎知識【編集済み】
Webサーバの基礎知識【編集済み】
Apache EventMesh を使ってみた
Apache EventMesh を使ってみた
恐るべきApache, Web勉強会@福岡
恐るべきApache, Web勉強会@福岡
PySpark Intro Part.2 with SQL Graph
PySpark Intro Part.2 with SQL Graph
SwaggerとAPIのデザイン
SwaggerとAPIのデザイン
スキーマつきストリーム データ処理基盤、 Confluent Platformとは?
スキーマつきストリーム データ処理基盤、 Confluent Platformとは?
Spark SQL - The internal -
Spark SQL - The internal -
Raspberry Pi用のコンテナをクラウドでビルドする方法
Raspberry Pi用のコンテナをクラウドでビルドする方法
More from Junichi Noda
とらのあなエンジニア採用イベント 2017年2月9日
とらのあなエンジニア採用イベント 2017年2月9日
Junichi Noda
[Anitech] ITでアニメを考える、「ShangriLa Meetup5」
[Anitech] ITでアニメを考える、「ShangriLa Meetup5」
Junichi Noda
アニメ聖地デザインパターン
アニメ聖地デザインパターン
Junichi Noda
アニメ聖地巡礼についてのアイデアソンテンプレート
アニメ聖地巡礼についてのアイデアソンテンプレート
Junichi Noda
アイデアスケッチ テンプレート
アイデアスケッチ テンプレート
Junichi Noda
ITを使った今時の聖地巡礼ユーザー分析 in 沼津
ITを使った今時の聖地巡礼ユーザー分析 in 沼津
Junichi Noda
ラブライブ!サンシャイン!!入門書 (A4 縦向き)
ラブライブ!サンシャイン!!入門書 (A4 縦向き)
Junichi Noda
法規制後でも個人で楽しむドローン入門 2016・秋
法規制後でも個人で楽しむドローン入門 2016・秋
Junichi Noda
ラブライブ✕沼津 アニメタイアップについて
ラブライブ✕沼津 アニメタイアップについて
Junichi Noda
Word2Vec Neologdで作るアニメ人工知能
Word2Vec Neologdで作るアニメ人工知能
Junichi Noda
せいまち〜聖地探訪に出会いを求めるのは間違っているだろうか〜
せいまち〜聖地探訪に出会いを求めるのは間違っているだろうか〜
Junichi Noda
秋葉原IT戦略研究所のご紹介(2016/05/04)
秋葉原IT戦略研究所のご紹介(2016/05/04)
Junichi Noda
日本のアニメ産業を爆速させるアニメAPIの開発と活用事例 (ニコニコ超会議2016 大和証券ステージ)
日本のアニメ産業を爆速させるアニメAPIの開発と活用事例 (ニコニコ超会議2016 大和証券ステージ)
Junichi Noda
ShangriLa Anime APIを利用してアニメ関連のビッグデータ解析を最速で行う
ShangriLa Anime APIを利用してアニメ関連のビッグデータ解析を最速で行う
Junichi Noda
機械学習ライブラリ「Spark MLlib」で作る アニメレコメンドシステムver 1.1
機械学習ライブラリ「Spark MLlib」で作る アニメレコメンドシステムver 1.1
Junichi Noda
機械学習ライブラリ「Spark MLlib」で作る アニメレコメンドシステム
機械学習ライブラリ「Spark MLlib」で作る アニメレコメンドシステム
Junichi Noda
秋葉原IT戦略研究所のご紹介
秋葉原IT戦略研究所のご紹介
Junichi Noda
秋葉原IT戦略研究所のREAL~コミュニティ立ち上げから半年間の成果~
秋葉原IT戦略研究所のREAL~コミュニティ立ち上げから半年間の成果~
Junichi Noda
アカリクVol7 「アドテク」gmoアドパートナーズ株式会社
アカリクVol7 「アドテク」gmoアドパートナーズ株式会社
Junichi Noda
最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML
最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML
Junichi Noda
More from Junichi Noda
(20)
とらのあなエンジニア採用イベント 2017年2月9日
とらのあなエンジニア採用イベント 2017年2月9日
[Anitech] ITでアニメを考える、「ShangriLa Meetup5」
[Anitech] ITでアニメを考える、「ShangriLa Meetup5」
アニメ聖地デザインパターン
アニメ聖地デザインパターン
アニメ聖地巡礼についてのアイデアソンテンプレート
アニメ聖地巡礼についてのアイデアソンテンプレート
アイデアスケッチ テンプレート
アイデアスケッチ テンプレート
ITを使った今時の聖地巡礼ユーザー分析 in 沼津
ITを使った今時の聖地巡礼ユーザー分析 in 沼津
ラブライブ!サンシャイン!!入門書 (A4 縦向き)
ラブライブ!サンシャイン!!入門書 (A4 縦向き)
法規制後でも個人で楽しむドローン入門 2016・秋
法規制後でも個人で楽しむドローン入門 2016・秋
ラブライブ✕沼津 アニメタイアップについて
ラブライブ✕沼津 アニメタイアップについて
Word2Vec Neologdで作るアニメ人工知能
Word2Vec Neologdで作るアニメ人工知能
せいまち〜聖地探訪に出会いを求めるのは間違っているだろうか〜
せいまち〜聖地探訪に出会いを求めるのは間違っているだろうか〜
秋葉原IT戦略研究所のご紹介(2016/05/04)
秋葉原IT戦略研究所のご紹介(2016/05/04)
日本のアニメ産業を爆速させるアニメAPIの開発と活用事例 (ニコニコ超会議2016 大和証券ステージ)
日本のアニメ産業を爆速させるアニメAPIの開発と活用事例 (ニコニコ超会議2016 大和証券ステージ)
ShangriLa Anime APIを利用してアニメ関連のビッグデータ解析を最速で行う
ShangriLa Anime APIを利用してアニメ関連のビッグデータ解析を最速で行う
機械学習ライブラリ「Spark MLlib」で作る アニメレコメンドシステムver 1.1
機械学習ライブラリ「Spark MLlib」で作る アニメレコメンドシステムver 1.1
機械学習ライブラリ「Spark MLlib」で作る アニメレコメンドシステム
機械学習ライブラリ「Spark MLlib」で作る アニメレコメンドシステム
秋葉原IT戦略研究所のご紹介
秋葉原IT戦略研究所のご紹介
秋葉原IT戦略研究所のREAL~コミュニティ立ち上げから半年間の成果~
秋葉原IT戦略研究所のREAL~コミュニティ立ち上げから半年間の成果~
アカリクVol7 「アドテク」gmoアドパートナーズ株式会社
アカリクVol7 「アドテク」gmoアドパートナーズ株式会社
最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML
最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML
Recently uploaded
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
FumieNakayama
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
Yuki Kikuchi
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
UEHARA, Tetsutaro
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
akihisamiyanaga1
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
Hiroshi Tomioka
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
博三 太田
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
FumieNakayama
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
sugiuralab
Recently uploaded
(8)
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
Apache Sparkを利用した「つぶやきビッグデータ」クローンとリコメンドシステムの構築
1.
Apache Sparkを利用した 「つぶやきビッグデータ」クローンと リコメンドシステムの構築 GMOインターネット 次世代システム研究室 野田純一
2.
Overview 1.自己紹介 2.目的 3.Sparkについて 4.Spark Streamingについて 5.検証サービス説明 6.Spark Streamingを使用したオンラインTwitter解析によ るレコメンドシステム
「Mikasa」-三笠 7.まとめ
3.
1. 自己紹介 ■結構前 Java2EEによる業務オペレーションシステム ■ちょっと前 Perl/Rubyでソーシャルゲーム フレームワー ク開発 ■最近 Hadoopでアドテク Github:
https://github.com/AKB428 Twitter: @n428dev Qiita: http://qiita.com/AKB428 Hatena: http://akb428.hatenablog.com/ 本部: http://akibalab.info/ Junichi Noda Larry Wall
4.
• Sparkについて少し執筆しました • 「Software
Design 2015年11月号」 • ConoHaを使ったHadoopクラスタの構成例と SparkSQLをつかったデータ処理の実例が記載。
5.
5 ↓これが作りたい 2014 7月22日 NHK
NEWS WEB 2. 目的
6.
• HadoopのMapReduceとは別アプローチ(DAG)での並列 分散集計処理を行う • インメモリー処理 •
Hadoopエコシステムの一部として扱われるがHadoopと直 接的な関係はない • APIを利用できる言語はScala, Java, Python 3. Sparkについて
7.
5. Sparkについて 〜Spark処理でのDAG DAG
8.
• http://itpro.nikkeibp.co.jp/atcl/column/14/1226001 37/122600004/?ST=bigdata&P=3
9.
いて • Sparkサブシステムの一つでファイルからでなくリアルタイ ムに流れてくるストリームソースに対しての集計を対象とし ている。 • 直近1時間のツイート数を毎分集計する、直近3時間でアク セスが多いIPを集計する・・などのウィンドウ集計が可能。 4.
Spark Streamingについて
10.
Spark Streaming 〜データソースについて その他、ssc.socketTextStream("
localhost", 7777) とするとローカルポートをソースにできるのでサーバーのログを流 し込んでリアルタイムにエラー、クラックIPの集計などが可能。
11.
5. 検証サービス紹介
12.
4. Spark Streamingを使用したオンライン Twitter解析によるレコメンドシステム
「 Mikasa」-三笠 https://github.com/AKB428/mikasa_ol https://github.com/AKB428/mikasa_rs
13.
14.
15.
16.
• Twitterストリームからデータを取得する。 • Twitter
Streaming APIを使う。 • 400の検索キーワードが指定可能。 • Spark Streamingでリアルタイム集計を行う。
17.
• 日本語文章を単語にわけて分解して集計 • 日本語を分解するため形態素解析ライブラリ kuromojiを使う。 •
アニメ作品など標準辞書にない単語はユーザー辞 書(CSV)を用意。
18.
形態素解析ライブラリの必要性について
19.
ユーザー辞書の必要性について
20.
Spark Streamingによるウィンドウ集計の活用 Mikasaは直近5分、直近60分のデータ集計を毎 分行っている。(合計60*2=120回) 少ないソースコードで、ウィンドウ集計が可能 。
21.
• ソースコード • https://github.com/AKB428/mikasa_ol/blob/maste r/src/main/scala/mikasa.scala
22.
23.
画面デモ(直近5分を毎分集計) (F1)2015年4期 TVアニメ http://tv-anime.xyz/5/ (F1)2016年1期
TVアニメ http://akiba-net.com/5/ (F2)ラブライブ http://lovelive-net.com/5/ (F2)デブサミ http://2045.tokyo/5/ (F2)関東TV番組 http://telev.net/5/ F1=ユーザー辞書に登録してある単語のみ集計 F2=ユーザー辞書外の単語も集計
24.
画面デモ(直近60分を毎分集計) (F1)2015年2期 TVアニメ http://tv-anime.xyz/60/ (F1)ラブライブ
http://tv-anime.biz/60/ (F2)ラブライブ http://lovelive-net.com/60/ (F2)秋葉原 http://akiba-net.com/60/ (F2)関東TV番組 http://telev.net/60/ F1=ユーザー辞書に登録してある単語のみ集計 F2=ユーザー辞書外の単語も集計
25.
画面デモ 過去の履歴キャプチャ
26.
26
27.
2015年7月22日 7月22日 ラブライブ 矢澤にこ
誕生日 27
28.
28 2015年7月22日
29.
• コミケ 2015
12/31 朝8時頃
30.
• 最近のバルス
31.
31 京都OSC用 つぶやきビックデータ 検索ハッシュタグ 「#osckansai」 http://2045.tokyo/5/ http://2045.tokyo/60/ ※URLの内容は8/8当日のみ 京都OSC用になります
32.
8/8 〜12:00 32
33.
8/8 12:24〜 33
34.
8/8 13:20 34
35.
8/8 15:10 35
36.
8/8 15:20 36
37.
8/8 15:40 37
38.
8/8 16:10 38
39.
デモ:リコメンドTwitterボット https://twitter.com/Akihabaara_itso https://twitter.com/AuctionMadoka
40.
実際の売上 40
41.
サーバーデモ 動作中のサーバーのコンソールを公開
42.
• Mikasa Twitter
のデータ収集解析の2つのアプロ ーチについて • ①Twitter Filter + ユーザー辞書のみの単語で絞る • 1のメリット▶集計しやすい、後続の処理も設計しや すい。 • 1のデメリット▶未知の単語を拾えない、ユーザー辞 書にひもづく別のワードを拾えない • 結論:ある程度、解析対象のドメインが固定されて いるものにはこのアプローチは有効
43.
• ② Twitter
Filter + ユーザー辞書を使いつつ全ての単語を集計 • メリット▶ 未知のワードが拾える、リアルなネットワーク解 析ができる。 • デメリット▶ ジャンクワードが多く出現するのでデータクレ ンジングの作業にコストがかかる。 • 結論:解析対象が不明なドメインの場合、まずこのアプローチ で回す。計測対象のネットワークが変動しやすいドメインの場 合はこのアプローチが有効。ある程度アプローチ2で回してア プローチ1に切り替える、もしくはアプローチ1を追加した二 段のサービスに設計する。
44.
Spark Streaming 〜ソースコード補足 •
TwitterUtilは実体はJavaのTwitterライブラリで あるtwitter4j • Twitter解析にはTwitterAPI特有のAPIレートリ ミット、単一IPによる高負荷時のアクセス制 限があるので注意 • Twitter開発者アカウントには電話番号が必須 になったので気軽に開発はできなくなりつつ ある。
45.
Mikasaインストールについて インストールマニュアル https://gist.github.com/AKB428/c30bc6a979e05fa3a022 • TwitterAPIとAmazonAPIのアカウントがあれば1時間でセッ トアップ完了。 • AmazonAPIはリコメンドしない場合は不要。 •
TwitterAPIのアカウント取得も10分程度で可能。 Mikasa OL https://github.com/AKB428/mikasa_ol Mikasa RS https://github.com/AKB428/mikasa_rs
46.
• 作ったシステムはスタンドアロンでも安定して動く( 4ヶ月放置しても安定動作 Spark1.4、Spark1.5) •
視覚的にわかりやすい、作りやすいのでSpark入門用 の教材に最適、会社ではインターン生にCDH、HDPク ラスタを構築してもらい、クラスタ上で動作するよう 作ってもらったりしている。(分散処理を体験したい 学生向け) • イベントのハッシュタグを監視し、イベントの展示モ ニタなどに使うといい感じ。(OSCでは実際使っても らっている。 6.まとめ
47.
コミュニティブースやっています! IT系の同人誌を売っています。 つぶやきビッグデータクローンのデモもあるので 是非お立ち寄りください
48.
ご清聴ありがとうございました あんず&このは LINEスタンプ発売中
Download now