Submit Search
Upload
Big Dataで価値を生み出すためのSmall Trial & Method (みんなのPython勉強会#42)
•
1 like
•
861 views
Shinsaku Kono
Follow
みんなのPython勉強会#42 の登壇資料です https://startpython.connpass.com/event/112787/presentation/
Read less
Read more
Engineering
Report
Share
Report
Share
1 of 58
Download now
Download to read offline
Recommended
Major update on mobile market research by ray poynter
Major update on mobile market research by ray poynter
Tomoko Yoshida
Itca yammer提案110615
Itca yammer提案110615
伸夫 森本
Androidアプリ 長い黒髪のマイカノジョ 制作ノート
Androidアプリ 長い黒髪のマイカノジョ 制作ノート
Hiroyuki Shimanishi
chatGPTの驚くべき対話能力.pdf
chatGPTの驚くべき対話能力.pdf
YamashitaKatsushi
説得のためのテクノロジ:「カプトロジ」入門
説得のためのテクノロジ:「カプトロジ」入門
Nanae Sh irozu
IoT×ビジネス活用 ~最先端技術のビジネス活用に向けて~
IoT×ビジネス活用 ~最先端技術のビジネス活用に向けて~
法林浩之
Sapporo Open Seminar 2
Sapporo Open Seminar 2
Hiro Yoshioka
ChatGPTの驚くべき対話能力 20230414APR.pdf
ChatGPTの驚くべき対話能力 20230414APR.pdf
YamashitaKatsushi
Recommended
Major update on mobile market research by ray poynter
Major update on mobile market research by ray poynter
Tomoko Yoshida
Itca yammer提案110615
Itca yammer提案110615
伸夫 森本
Androidアプリ 長い黒髪のマイカノジョ 制作ノート
Androidアプリ 長い黒髪のマイカノジョ 制作ノート
Hiroyuki Shimanishi
chatGPTの驚くべき対話能力.pdf
chatGPTの驚くべき対話能力.pdf
YamashitaKatsushi
説得のためのテクノロジ:「カプトロジ」入門
説得のためのテクノロジ:「カプトロジ」入門
Nanae Sh irozu
IoT×ビジネス活用 ~最先端技術のビジネス活用に向けて~
IoT×ビジネス活用 ~最先端技術のビジネス活用に向けて~
法林浩之
Sapporo Open Seminar 2
Sapporo Open Seminar 2
Hiro Yoshioka
ChatGPTの驚くべき対話能力 20230414APR.pdf
ChatGPTの驚くべき対話能力 20230414APR.pdf
YamashitaKatsushi
Fit12
Fit12
Masa Tadokoro
Hour of-code-2016冬-シンポジウム
Hour of-code-2016冬-シンポジウム
Yuta Tonegawa
RTC2023_ChatGPT_YukiTsukamae.pdf
RTC2023_ChatGPT_YukiTsukamae.pdf
hossenkamal2
RTC2023_ChatGPT_YukiTsukamae.pptx
RTC2023_ChatGPT_YukiTsukamae.pptx
hossenkamal2
Janog31 bof-pattern-sasaki-01
Janog31 bof-pattern-sasaki-01
Ken SASAKI
企業と勉強会 @nifty エンジニアサポート
企業と勉強会 @nifty エンジニアサポート
Daichi Morifuji
楽天の中のわたしと勉強会
楽天の中のわたしと勉強会
Rakuten Group, Inc.
非エンジニアのためのIt業界
非エンジニアのためのIt業界
Hideto Masuoka
Web IDE Gitpodを使ってTOPPES OSを体験してみよう
Web IDE Gitpodを使ってTOPPES OSを体験してみよう
Center for Embedded Computing Systems, Nagoya Univ.
dots.サービスのご説明@dots.2周年記念パーティ
dots.サービスのご説明@dots.2周年記念パーティ
dots.
SORACOM Technology Camp 2018 ベーシックトラック1 | 事例で整理!IoTソリューションの開発/導入検討の進め方
SORACOM Technology Camp 2018 ベーシックトラック1 | 事例で整理!IoTソリューションの開発/導入検討の進め方
SORACOM,INC
Project 15 - Algyan May 2022.pdf
Project 15 - Algyan May 2022.pdf
YasuhiroHanda2
プロトタイピングツール投入のケーススタディ
プロトタイピングツール投入のケーススタディ
力也 伊原
クラッシュフィーバーのシステム構成
クラッシュフィーバーのシステム構成
Tomotsune Murata
プランナーがPR駆動してみた話
プランナーがPR駆動してみた話
Rino Omura
Devsumi2013 community
Devsumi2013 community
Developers Summit
IT革命からコミュニティ、コミュニケーション革命に!
IT革命からコミュニティ、コミュニケーション革命に!
Yuichi Morito
ビッグデータビジネスの捉え方
ビッグデータビジネスの捉え方
Takatsugu Kobayashi
ビジネスマネージャとデータ分析
ビジネスマネージャとデータ分析
TOSHI STATS Co.,Ltd.
『Mobageの大規模データマイニング活用と 意思決定』- #IBIS 2012 -ビジネスと機械学習の接点-
『Mobageの大規模データマイニング活用と 意思決定』- #IBIS 2012 -ビジネスと機械学習の接点-
Koichi Hamada
More Related Content
Similar to Big Dataで価値を生み出すためのSmall Trial & Method (みんなのPython勉強会#42)
Fit12
Fit12
Masa Tadokoro
Hour of-code-2016冬-シンポジウム
Hour of-code-2016冬-シンポジウム
Yuta Tonegawa
RTC2023_ChatGPT_YukiTsukamae.pdf
RTC2023_ChatGPT_YukiTsukamae.pdf
hossenkamal2
RTC2023_ChatGPT_YukiTsukamae.pptx
RTC2023_ChatGPT_YukiTsukamae.pptx
hossenkamal2
Janog31 bof-pattern-sasaki-01
Janog31 bof-pattern-sasaki-01
Ken SASAKI
企業と勉強会 @nifty エンジニアサポート
企業と勉強会 @nifty エンジニアサポート
Daichi Morifuji
楽天の中のわたしと勉強会
楽天の中のわたしと勉強会
Rakuten Group, Inc.
非エンジニアのためのIt業界
非エンジニアのためのIt業界
Hideto Masuoka
Web IDE Gitpodを使ってTOPPES OSを体験してみよう
Web IDE Gitpodを使ってTOPPES OSを体験してみよう
Center for Embedded Computing Systems, Nagoya Univ.
dots.サービスのご説明@dots.2周年記念パーティ
dots.サービスのご説明@dots.2周年記念パーティ
dots.
SORACOM Technology Camp 2018 ベーシックトラック1 | 事例で整理!IoTソリューションの開発/導入検討の進め方
SORACOM Technology Camp 2018 ベーシックトラック1 | 事例で整理!IoTソリューションの開発/導入検討の進め方
SORACOM,INC
Project 15 - Algyan May 2022.pdf
Project 15 - Algyan May 2022.pdf
YasuhiroHanda2
プロトタイピングツール投入のケーススタディ
プロトタイピングツール投入のケーススタディ
力也 伊原
クラッシュフィーバーのシステム構成
クラッシュフィーバーのシステム構成
Tomotsune Murata
プランナーがPR駆動してみた話
プランナーがPR駆動してみた話
Rino Omura
Devsumi2013 community
Devsumi2013 community
Developers Summit
IT革命からコミュニティ、コミュニケーション革命に!
IT革命からコミュニティ、コミュニケーション革命に!
Yuichi Morito
ビッグデータビジネスの捉え方
ビッグデータビジネスの捉え方
Takatsugu Kobayashi
ビジネスマネージャとデータ分析
ビジネスマネージャとデータ分析
TOSHI STATS Co.,Ltd.
『Mobageの大規模データマイニング活用と 意思決定』- #IBIS 2012 -ビジネスと機械学習の接点-
『Mobageの大規模データマイニング活用と 意思決定』- #IBIS 2012 -ビジネスと機械学習の接点-
Koichi Hamada
Similar to Big Dataで価値を生み出すためのSmall Trial & Method (みんなのPython勉強会#42)
(20)
Fit12
Fit12
Hour of-code-2016冬-シンポジウム
Hour of-code-2016冬-シンポジウム
RTC2023_ChatGPT_YukiTsukamae.pdf
RTC2023_ChatGPT_YukiTsukamae.pdf
RTC2023_ChatGPT_YukiTsukamae.pptx
RTC2023_ChatGPT_YukiTsukamae.pptx
Janog31 bof-pattern-sasaki-01
Janog31 bof-pattern-sasaki-01
企業と勉強会 @nifty エンジニアサポート
企業と勉強会 @nifty エンジニアサポート
楽天の中のわたしと勉強会
楽天の中のわたしと勉強会
非エンジニアのためのIt業界
非エンジニアのためのIt業界
Web IDE Gitpodを使ってTOPPES OSを体験してみよう
Web IDE Gitpodを使ってTOPPES OSを体験してみよう
dots.サービスのご説明@dots.2周年記念パーティ
dots.サービスのご説明@dots.2周年記念パーティ
SORACOM Technology Camp 2018 ベーシックトラック1 | 事例で整理!IoTソリューションの開発/導入検討の進め方
SORACOM Technology Camp 2018 ベーシックトラック1 | 事例で整理!IoTソリューションの開発/導入検討の進め方
Project 15 - Algyan May 2022.pdf
Project 15 - Algyan May 2022.pdf
プロトタイピングツール投入のケーススタディ
プロトタイピングツール投入のケーススタディ
クラッシュフィーバーのシステム構成
クラッシュフィーバーのシステム構成
プランナーがPR駆動してみた話
プランナーがPR駆動してみた話
Devsumi2013 community
Devsumi2013 community
IT革命からコミュニティ、コミュニケーション革命に!
IT革命からコミュニティ、コミュニケーション革命に!
ビッグデータビジネスの捉え方
ビッグデータビジネスの捉え方
ビジネスマネージャとデータ分析
ビジネスマネージャとデータ分析
『Mobageの大規模データマイニング活用と 意思決定』- #IBIS 2012 -ビジネスと機械学習の接点-
『Mobageの大規模データマイニング活用と 意思決定』- #IBIS 2012 -ビジネスと機械学習の接点-
Big Dataで価値を生み出すためのSmall Trial & Method (みんなのPython勉強会#42)
1.
1 Big Data で 価値を生み出すため Small
Trial & Method 2019-02-13 みんな Python勉強会#42 https://www.pexels.com/photo/adult-apple-device-business-code-340152/
2.
お話しする内容 データを活用したプロダクト開発案件 について ・ど ようなシステムやプロセスを採用したか ・どういう工夫をしてきたか これらを踏まえて、ご紹介いたします。 2
3.
各案件担当者と 共同発表という形でお伝えします 関心 あるトピックが見つかりましたら、ぜひとも交流タイムで各発表者とマッチングして リアルな目線で
ディスカッションを楽しんでいただけたらと思います 内田 臣了 共同発表 3 河野 晋策 twitter / @lapis_zero09
4.
1. じめに 2. レコメンド機能開発 3.
不正行為・規約違反行為対策 4. Jupyter Notebook Tips 4
5.
1. じめに 5
6.
今回ご紹介するプロダクト事例 6 婚活 恋活 http://www.recruit-mp.co.jp/service/zexy.html
7.
市場 グロース期 ・米国で 結婚したカップル
1/3がオンラインで 出会い ・他ドメイン 大規模サービスに比べて、チームやプロダクトとして まだ発展途上 フェーズ 7
8.
ほか:スタッフ用 業務管理ツールなど サブシステム システム概略(カスタマー向けアプリ) 8
9.
データ基盤 9
10.
データ基盤 BigQueryというクラウドDWHソリューションを利用 ・他ツールで そ まま再現できない手法も出てきます ・各自
環境に照らしながら聞いていただけれ と思います 10 Google Cloud 発表資料より引用
11.
データ活用(一部抜粋) 色々やっています 11
12.
本日 これら2つ 案件開発についてご紹介します データ活用事例 12 レコメンド機能
不正行為・規約違反行為対策 http://image.itmedia.co.jp/l/im/ait/articles/1804/23/l_news011_04.jpg https://zexy-koimusubi.net/ https://www.irasutoya.com/2018/07/blog-post_403.html
13.
2. レコメンド機能開発 Trial 13
14.
自己紹介 内田 臣了 (Shinryo
Uchida) リクルートテクノロジーズ ITエンジニアリング本部 プロダクトエンジニアリング部 APプロダクト開発グループ 2017年4月 新卒入社 リクルート 運営するサービス 検索改善業務に従事 柴犬が好き 14
15.
Small Trial for
Big Data ケーススタディを通してお伝えしたいこと ビッグデータを扱う案件であっても 1つ1つ 小さな分析・検証 積み重 である 15
16.
サービス 16
17.
ご利用 流れ 1. 異性を探す 2.
いい !を送る 3. マッチングしたらメッセージを交換 4. お見合い・デートを申し込み 5. 交際開始(退会) 17
18.
ご利用 流れ 1. 異性を探す 2.
いい !を送る 3. マッチングしたらメッセージを交換 4. お見合い・デートを申し込み 5. 交際開始(退会) 18
19.
おすすめ順 「異性を探す」ステップに関連 検索結果 並び順 ひとつ ユーザー
プロフィール内容や行動に基づき スコアを算出しランキング お客様 出会いに大きく影響を与えるため 非常に重要な役割 19
20.
おすすめ順 開発プロセス 今回 おすすめ順
開発プロセス 話をします (ロジック 中身 話 しません) 各工程 開発コストを下げて 高速にサイクルを回す工夫 誰でも 手軽に 開発 ● 特定 開発者に縛られない ● 素早いリリース ● リスク 小さく 20 分析 実装検証
21.
おすすめ順 開発プロセス 21 分析 実装検証
22.
1. 分析 22 分析 実装検証
23.
Google BigQueryとJupyter Notebookによる分析 23 おすすめ順ロジック
改良 直感で なく必ずデータに基づいて行う 主要なデータ(個人情報除く) Google BigQuery上に格納されており、 分析者 それにアクセスし作業する マッチング率 改善につながる 特徴量 作り込みや 施策 効果 見立てを行う
24.
データ分析ハッカソン 24 4月に入社した新入社員たちを対象に データ分析ハッカソンを開催 入社数か月 新人でも すぐに分析に取りかかれる環境 詳しく こちら:リクルートテクノロジーズ 新人研修特別版(データ分析編) https://recruit-tech.co.jp/blog/2018/05/29/data_bootcamp2018/
25.
2. 実装 25 分析 実装検証
26.
マイクロサービス化による高速リリース 26 検索エンジンレコメンドAPI 定義 ファイル サービス バックエンド クライアント サービス バックエンドから検索エンジンに 直接クエリを投げる で
なく、 おすすめ順ロジックを適用する機能をAPIとして切り出しそれを仲介
27.
メリット:更新時 コスト・リスク 軽減 27 検索エンジンレコメンドAPI 定義 ファイル サービス バックエンド クライアント 更新不要 更新不要 更新不要更新 デプロイ
規模を小さくしてコスト・リスクを軽減 ● ロジック 適用・切り戻しが容易 ● 万が一 障害時、切り離しが容易 直接検索エンジンにリクエストする経路も用意
28.
メリット:誰でもおすすめ順をカスタマイズ可能 28 検索エンジンレコメンドAPI 定義 ファイル サービス バックエンド クライアント レコメンド定義をJSONファイルに切り出し ➔ 誰でも容易にロジックを変更可能 ● エンジニアに依頼せずとも企画者が直接定義を編集できる (実際にプロダクトマネージャや企画者がロジックを調整している)
29.
3. 検証 29 分析 実装検証
30.
A/Bテストによる効果検証 30 定義A 定義B A群 B群 それぞれ 群で測定指標を比較 レコメンド API A群 B群 ● マッチング率 ●
いい !送信率 など ● マッチング率 ● いい !送信率 など 無作為に分け、異なるロジックを適用 比較 新ロジック適用前にA/Bテストでオンライン評価 ➔ 良い効果が観測された場合、新たなロジックを全適用する もし大きな毀損があった場合 、 即座に測定を中止し元 ロジックに切り戻しを実施
31.
Redashを介したBigQueryクエリ共有 31 比較 測定用 クエリ 即実行可能な状態でRedashで共有 パラメータを指定して ボタンを押すだけで誰でも実行可能 データ基盤チームによる 主要KPI日次レポート 仕組みも存在
32.
まとめ 32 小さく作って小さく試しながら 堅実にレコメンド機能を磨き込んでいる 速く作るために各工程で コストを小さくし 改善サイクルを高速に回す仕組みを整えている 分析 実装検証 ビッグデータを扱う案件であっても 1つ1つ 小さな分析・検証
積み重 である
33.
3. 不正行為・規約違反行為対策 Trial 33
34.
https://zexy-enmusubi.net/promise/
35.
• • FS • • FS • • 2
36.
• Recruit Technologies
Co., Ltd. • • @lapis_zero09 lapis-zero09 https://www.lapis-zero09.xyz/profile/ 3
37.
4 FS 1 • KPI • 2 • 3 • • 4 • • •
ROI 5 • Minimum Viable Product
38.
https://zexy-koimusubi.net/static/promise.html5
39.
6 ! • • !
40.
7 ! • • !
41.
1. 8 KPI →
42.
2. 9
43.
2. 10
44.
3. 4. 3. • • 11 4. • • F 9
!! http://scikit-learn.org/stable/tutorial/machine_learning_map/index.html https://www.slideshare.net/ShinsakuKono/introduction-to-ensemble-methods-for-beginners
45.
5. Feasibility Study 12 README • • • • argparse MVP • • • • •
46.
13 FB KPI
47.
14 FS ( ) 1 •
KPI • 2 • 3 • • 4 • • • ROI 5 • Minimum Viable Product
48.
15 FS 1 2 3
49.
1. 2. 16
50.
17 p p
51.
p p 18
52.
1. 2. 3. ü ü ü 19
53.
• ü ü ü • 20
54.
21 ! • • ! !!
55.
Amazon EC2 • • •DB 22 Web
56.
1. • Deep Learing 2. • 3. • • 23
57.
4. Method編 34
58.
35 ご清聴ありがとうございました https://www.pexels.com/photo/adult-apple-device-business-code-340152/
Download now