Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
Uploaded by
BrainPad Inc.
1,600 views
エンジニア勉強会資料_④Rtoaster×Myndエンジンによる興味キーワード分析機能開発事例
2018年3月13日にブレインパッドが開催した「エンジニア向け勉強会」の講演資料です。
Engineering
◦
Read more
0
Save
Share
Embed
Embed presentation
Download
Download to read offline
1
/ 22
2
/ 22
3
/ 22
4
/ 22
5
/ 22
6
/ 22
7
/ 22
8
/ 22
9
/ 22
10
/ 22
11
/ 22
12
/ 22
13
/ 22
14
/ 22
15
/ 22
16
/ 22
17
/ 22
18
/ 22
19
/ 22
20
/ 22
21
/ 22
22
/ 22
More Related Content
PDF
プロトタイプで終わらせない死の谷を超える機械学習プロジェクトの進め方 #MLCT4
by
shakezo
PDF
れこめん道~とあるエンジニアの苦闘の日々
by
BrainPad Inc.
PDF
エンジニア勉強会資料_⑤広告プロダクトとプラットフォームの開発
by
BrainPad Inc.
PDF
エンジニア勉強会資料_①ブレインパッドの中で僕たちは何を開発しているのか?
by
BrainPad Inc.
PDF
DMPの分析機能を実現する技術
by
BrainPad Inc.
PDF
エンジニア勉強会資料_②エンジニア・デザイナ・プロダクトオーナーが推薦するプロトタイプドリブン開発
by
BrainPad Inc.
PDF
Business utilization of real estate image classification system using deep le...
by
BrainPad Inc.
PPTX
エンジニア勉強会資料_⑥エンジニアが主導する組織マネジメントや開発体制の継続的改善
by
BrainPad Inc.
プロトタイプで終わらせない死の谷を超える機械学習プロジェクトの進め方 #MLCT4
by
shakezo
れこめん道~とあるエンジニアの苦闘の日々
by
BrainPad Inc.
エンジニア勉強会資料_⑤広告プロダクトとプラットフォームの開発
by
BrainPad Inc.
エンジニア勉強会資料_①ブレインパッドの中で僕たちは何を開発しているのか?
by
BrainPad Inc.
DMPの分析機能を実現する技術
by
BrainPad Inc.
エンジニア勉強会資料_②エンジニア・デザイナ・プロダクトオーナーが推薦するプロトタイプドリブン開発
by
BrainPad Inc.
Business utilization of real estate image classification system using deep le...
by
BrainPad Inc.
エンジニア勉強会資料_⑥エンジニアが主導する組織マネジメントや開発体制の継続的改善
by
BrainPad Inc.
What's hot
PDF
カスタマーサクセスのためのデータ整備人の活動記録
by
syou6162
PDF
ブレインパッドにおける機械学習プロジェクトの進め方
by
BrainPad Inc.
PDF
グローバル企業の中で「変化」を仕掛ける楽天技術研究所 Rakuten Institute of Technology の挑戦
by
Rakuten Group, Inc.
PDF
機械学習システムを受託開発 する時に気をつけておきたい事
by
BrainPad Inc.
PDF
深層学習の導入で抱える課題とユースケース実例
by
Hirono Jumpei
PDF
データエンジニアとデータアナリストを兼任して良かったこと
by
Masatoshi Ida
PDF
データサイエンス業務と「ツール」
by
The Japan DataScientist Society
PDF
ぼくのかんがえたさいきょうの機械学習プロダクトの作り方
by
Ozawa Kensuke
PDF
2018.08.21-機械学習工学研究会 現場を交えた勉強会発表資料
by
BrainPad Inc.
PDF
分析手法のご紹介
by
Recruit Technologies
PDF
楽天の次世代を支える AI Platform ~ チャットボット、マーケティング、そしてCreative AI
by
Rakuten Group, Inc.
PDF
楽天における企業内スタートアップの取り組み
by
Rakuten Group, Inc.
PPTX
[自己PR]12/23 エンジニア"1on1"面談会
by
Toshi Matsumoto
PDF
今後10年の機械学習ビジネスの可能性
by
tomohiro furukawa
PDF
ユーザに価値を届けるためのデータプラットフォームの考え方
by
Rakuten Group, Inc.
PPTX
[Ridge-i] Deep Learning Lab - ディープラーニング 導入の課題と実例
by
Ridge-i
PDF
20171201 deep learning lab albert
by
Hirono Jumpei
PDF
楽天技術研究所 Society 5.0 のクリエイティブ都市
by
Rakuten Group, Inc.
カスタマーサクセスのためのデータ整備人の活動記録
by
syou6162
ブレインパッドにおける機械学習プロジェクトの進め方
by
BrainPad Inc.
グローバル企業の中で「変化」を仕掛ける楽天技術研究所 Rakuten Institute of Technology の挑戦
by
Rakuten Group, Inc.
機械学習システムを受託開発 する時に気をつけておきたい事
by
BrainPad Inc.
深層学習の導入で抱える課題とユースケース実例
by
Hirono Jumpei
データエンジニアとデータアナリストを兼任して良かったこと
by
Masatoshi Ida
データサイエンス業務と「ツール」
by
The Japan DataScientist Society
ぼくのかんがえたさいきょうの機械学習プロダクトの作り方
by
Ozawa Kensuke
2018.08.21-機械学習工学研究会 現場を交えた勉強会発表資料
by
BrainPad Inc.
分析手法のご紹介
by
Recruit Technologies
楽天の次世代を支える AI Platform ~ チャットボット、マーケティング、そしてCreative AI
by
Rakuten Group, Inc.
楽天における企業内スタートアップの取り組み
by
Rakuten Group, Inc.
[自己PR]12/23 エンジニア"1on1"面談会
by
Toshi Matsumoto
今後10年の機械学習ビジネスの可能性
by
tomohiro furukawa
ユーザに価値を届けるためのデータプラットフォームの考え方
by
Rakuten Group, Inc.
[Ridge-i] Deep Learning Lab - ディープラーニング 導入の課題と実例
by
Ridge-i
20171201 deep learning lab albert
by
Hirono Jumpei
楽天技術研究所 Society 5.0 のクリエイティブ都市
by
Rakuten Group, Inc.
More from BrainPad Inc.
PDF
機械学習システムのアーキテクチャアラカルト
by
BrainPad Inc.
PDF
データサイエンティストとは? そのスキル/ナレッジレベル定義の必要性
by
BrainPad Inc.
PDF
システム開発素人が深層学習を用いた画像認識で麻雀点数計算するLINEbotを作ったハナシ
by
BrainPad Inc.
PDF
機械学習システム開発案件の事例紹介
by
BrainPad Inc.
PDF
Python研修の作り方 - teaching-is_learning-
by
BrainPad Inc.
PDF
2018 builderscon airflowを用いて、 複雑大規模なジョブフロー管理 に立ち向かう
by
BrainPad Inc.
PDF
GKEとgRPCで実装する多言語対応・スケーラブルな内部API
by
BrainPad Inc.
PDF
DeltaCubeにおけるユニークユーザー集計高速化(理論編)
by
BrainPad Inc.
PDF
エンジニア勉強会資料_③Rtoasterの11年
by
BrainPad Inc.
PDF
DeltaCubeにおけるユニークユーザー集計高速化(実践編)
by
BrainPad Inc.
PDF
Apache Sparkについて
by
BrainPad Inc.
PDF
Sparkストリーミング検証
by
BrainPad Inc.
PDF
Big Data Analytics Tokyo講演資料
by
BrainPad Inc.
PDF
Developpers Summit2015 Autumn 講演資料
by
BrainPad Inc.
PDF
Python twitter data_150709
by
BrainPad Inc.
PDF
Oss LT会_20210203
by
BrainPad Inc.
PDF
実証実験報告セミナー資料 20180328(抜粋版)
by
BrainPad Inc.
PDF
Sparkパフォーマンス検証
by
BrainPad Inc.
機械学習システムのアーキテクチャアラカルト
by
BrainPad Inc.
データサイエンティストとは? そのスキル/ナレッジレベル定義の必要性
by
BrainPad Inc.
システム開発素人が深層学習を用いた画像認識で麻雀点数計算するLINEbotを作ったハナシ
by
BrainPad Inc.
機械学習システム開発案件の事例紹介
by
BrainPad Inc.
Python研修の作り方 - teaching-is_learning-
by
BrainPad Inc.
2018 builderscon airflowを用いて、 複雑大規模なジョブフロー管理 に立ち向かう
by
BrainPad Inc.
GKEとgRPCで実装する多言語対応・スケーラブルな内部API
by
BrainPad Inc.
DeltaCubeにおけるユニークユーザー集計高速化(理論編)
by
BrainPad Inc.
エンジニア勉強会資料_③Rtoasterの11年
by
BrainPad Inc.
DeltaCubeにおけるユニークユーザー集計高速化(実践編)
by
BrainPad Inc.
Apache Sparkについて
by
BrainPad Inc.
Sparkストリーミング検証
by
BrainPad Inc.
Big Data Analytics Tokyo講演資料
by
BrainPad Inc.
Developpers Summit2015 Autumn 講演資料
by
BrainPad Inc.
Python twitter data_150709
by
BrainPad Inc.
Oss LT会_20210203
by
BrainPad Inc.
実証実験報告セミナー資料 20180328(抜粋版)
by
BrainPad Inc.
Sparkパフォーマンス検証
by
BrainPad Inc.
エンジニア勉強会資料_④Rtoaster×Myndエンジンによる興味キーワード分析機能開発事例
1.
Rtoaster × Myndエンジンによる 興味キーワード分析機能開発事例 Mynd株式会社 取締役
/ エンジニア 森口 正之 株式会社ブレインパッド DPG グループマネージャー 田崎 雄一郎 # brainpadtech
2.
自己紹介 2012年 4月 SNS系企業
新卒入社 ぴちぴちの社会人6年目です 2014年11月 ブレインパッド入社 データ マネジメント プラットフォーム グループ グループ マネージャー Rtoasterのユーザー分析機能や 外部パートナー連携など頑張ってます的な人です 来週からドイツ/フランス/スイス旅行なのでそわそわしてます
3.
興味キーワード分析機能について
4.
Rtoaster 分析機能について DMPに蓄積された行動情報をもとに、 様々な角度からどんなユーザーがいるかの分析を支援 ● 期間 ●
URL ● キーワード ● 属性 ● 自動分析 などなど
5.
キーワード分析機能 Rtoaster契約サイト 10,000人 寿司 カレー豆腐 ユーザーが何に興味を持っているか 直感的にわかりやすく、 次のアクションに繋げやすい 10人 2,000人 600人 うどん 米 ピザ クーポン発行 カレーに興味あるなら インド行くでしょ 🍣 📛 🍛
6.
キーワード分析機能の構成
7.
キーワード抽出部分について ● 自社製品のロジック部分考案にデータサイエンティストなどに 協力を依頼することはままある ○ 今回はキーワード機能ということで、自然言語処理の得意なMynd社と協力 ●
協業の中でうまくいったこと ○ 物理的に距離が近く、スムーズにコミュニケーションできた ○ キーワードデータをサマリ過ぎずに出力してもらうことで、 今回の機能向けに限定し過ぎたものとならず、 それを利用した新機能の検討などを我々だけで閉じることができた Mynd株式会社 2015年4月にブレインパッドグループにJOIN 自然言語処理系に強み あとで詳しく☆
8.
ユーザー分析システム 分析画面 データ集約基盤 キーワード分析機能 構成図 Rtoaster内部は マイクロサービス構成になってます 連携ハブシステム 自動レコメンドシステム airflowクラスタ Auto Scaling Group コアエンジン などなど SparkクラスタPrestoクラスタ
9.
処理部分のインスタンス構成 ● master node ○
1台 ○ r4.xlarge ● core / task node ○ 計20台 ○ r4.xlarge 夜間バッチ負荷のため多め 今後オートスケール予定 ● job-manager ○ 1台 ○ c4.xlarge ● job-worker ○ 2〜10台 ○ c4.2xlarge 並列実行にコア数が欲しいだけで こんな強い必要はない リリースしたばかりで負荷検証途中のため、やや力技の構成(参考値程度に) キーワード処理だけでなく全ての分析機能処理で共通利用
10.
● Array型の処理時間が遅かったため 文字列型で持ち、クエリを早くしている ● 約3000万UUの中から抽出する処理で ○
単一条件,AND条件で3秒程度 ○ OR条件だと25秒程度 ■ 400万UUくらいだと7秒程度 ● キーワード分析機能においては、 あまり凝った使い方はしていない ○ 単純に数を力でこなす感じ ● 別の分析機能ではSparkMLを利用して 機械学習とかもしている スケールさせやすい なんやかんや高速 リリース間隔早い 最近も月2回くらいリリース ただし追うのも大変 スケールさせやすい SparkMLなどライブラリも充実 ドキュメントや事例がWeb上に多い EMRでの構築事例も多い 事例ケースも多く最適解は難しいたまにバグもまじる 調整すべきパラメータが多い
11.
ここまでの伝えたいこと ● キーワード分析機能をMynd社と協力して実現した ○ 社内に自然言語処理や機械学習などに強みを持つメンバーがおり、 一緒に考えられるのはブレインパッドならではの安心感かと! ●
Spark, Presto, Airflowなどの大規模処理向けの アプリケーションを採用して処理をしています ○ エンジニア主体で技術採用も積極的に行えている ○ スモールなサービスだと使わなくても処理として事足りるので、 しっかり業務で携われるのはNo.1 DMPならではのデータ量 ● 分散処理からインフラから画面開発までまで ひとりひとりがフルスタックに開発してます
12.
Myndについて
13.
● 2010年4月 組み込み系開発企業
新卒入社 ● 2012年4月 Mynd社立ち上げ ● 2015年4月 BrainPadグループにJoin ● 2017年4月 現職 自己紹介 元々は組み込み系→ネイティブアプリも....→クラウドも....→なんか色々やってます
14.
● エンジニアばかりの小さな会社 ○ フルタイムメンバーは現在5人 ○
内4人がエンジニア ● 自然言語処理、機械学習に強みを持っています
18.
キーワード抽出って何するの?
19.
...日本企業が世界で勝てない理由のひとつに、 各国政府への「ロビイング」の不足があります。 日本企業が今後... 日本企業 世界 各国政府 ロビイング 不足 今後 日本企業 世界 各国政府 ロビイング 不足 今後
20.
意外と簡単そう....?
21.
● システム化って難しいですよね.... ○ お客様に合わせた実装 ○
運用・保守 ● 他のモジュールではもっと凝った事もしています! ○ クラスタリング・意味タグ付与・etc とは言え....
22.
簡単だと思っていただけた方! 是非声をかけてください!
Download