Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

リクルートのビッグデータ活用基盤とデータ活用に向けた取組み

5,556 views

Published on

2015/07/10 システム管理者の夏期講習2015での、池田の講演資料になります

Published in: Technology

リクルートのビッグデータ活用基盤とデータ活用に向けた取組み

  1. 1. リクルートのビッグデータ活用基盤 とデータ活用に向けた取組み リクルートテクノロジーズ 池田
  2. 2. 本日の内容 • リクルートにおけるビッグデータの取り組みの紹介 とビッグデータの活用を支えるビッグデータ基盤を ご紹介いたします • アプリのPUSH配信を支える基盤(Pusna-RS)と ビッグデータ基盤の連携を例に、リクルートにおけ るビッグデータ活用基盤・周辺技術進化の取り組み をお伝えします • 最後に、データ活用を促進する「メタデータ管理 Webシステム」ご紹介とシステム管理者目線から システムを提供する価値について、お話しさせてい ただきます 2(C) Recruit Technologies Co.,Ltd. All rights reserved.
  3. 3. 本日のアジェンダ 1. 自己紹介 2. リクルートの紹介 3. リクルートのビッグデータへの取り組み 4. メタデータ管理Web 5. まとめ 3(C) Recruit Technologies Co.,Ltd. All rights reserved.
  4. 4. 本日のアジェンダ 1. 自己紹介 2. リクルートの紹介 3. リクルートのビッグデータへの取り組み 4. メタデータ管理Web 5. まとめ 4(C) Recruit Technologies Co.,Ltd. All rights reserved.
  5. 5. 自己紹介 5(C) Recruit Technologies Co.,Ltd. All rights reserved. 池田 英哲(いけだ ひであき) 株式会社 リクルートテクノロジーズ ビッグデータ部 IDポイント ビッグデータインフラグループ 2003年~2006年 某SIer Flashを用いたWebアプリケーション開発等を担当 2006年~2013年 某コンサル会社 インフォメーションマネジメント(BI・DWH)関連部署に配属 Analytics部隊の設立に携わる 2014年1月~ リクルートテクノロジーズ 入社後一貫して、リクルートIDプロジェクトのDWH構築・運用を担当 職歴
  6. 6. 本日のアジェンダ 1. 自己紹介 2. リクルートの紹介 3. リクルートのビッグデータへの取り組み 4. メタデータ管理Web 5. まとめ 6(C) Recruit Technologies Co.,Ltd. All rights reserved.
  7. 7. 7 企業概要(リクルート全体) 創立 1960年3月31日 「大学新聞広告社」としてスタート グループ 従業員数 31,841名 連結売上高 約 1兆2999億円 ※2015年3月末 連結経常利益 約 1,256億円 ※2015年3月末 関連企業数 162社(国内+海外) 目指す世界観 「あなた」を支える存在でありたい
  8. 8. リクルートテクノロジーズの位置づけ 8 リクルートキャリア リクルートジョブズ リクルートスタッフィング リクルート住まいカンパニー リクルートライフスタイル リクルートマーケティングパートナーズ スタッフサービス・ホールディングス リクルートアドミニストレーション リクルートコミュニケーションズ 事業会社 機能会社 ネットインフラ 大規模プロジェクト推進 UXD/SEO ビッグデータ機能 テクノロジーR&D 事業・社内IT推進 リクルート ホールディングス リクルートとは、 主要7事業会社+3機能会社 で構成されるグループ企業群 私が所属する会社は リクルートテクノロジーズ セキュリティAP基盤・オフショア開発
  9. 9. リクルートのビジネスモデル ~ リボンモデル 9(C) Recruit Technologies Co.,Ltd. All rights reserved. マッチング カスタマー (一般ユーザー) クライアント (サービス提供企業) 世界中の生活者と産業界に 「まだ、ここにない、出会い。」を提供します
  10. 10. リクルートの展開しているサービス ライフイベント領域 進学 就職 結婚 転職 住宅購入 車購入 出産/育児 旅行 IT/トレンド 生活/地域情報 グルメ・美容 ライフスタイル領域 選択・意思決定 を支援する情報サービスの提供 「まだ、ここにない、出会い。」を実現する
  11. 11. リクルートID 一人ひとりにあった最適な情報を提供し、皆様の選択や行動を支える存在 となることを目指す 11(C) Recruit Technologies Co.,Ltd. All rights reserved. リクルートID
  12. 12. リクルートIDの使えるサービス①
  13. 13. リクルートIDの使えるサービス②
  14. 14. リクルートIDの使えるサービス③
  15. 15. リクルートIDの使えるサービス④
  16. 16. 本日のアジェンダ 1. 自己紹介 2. リクルートの紹介 3. リクルートのビッグデータへの取り組み 4. メタデータ管理Web 5. まとめ 16(C) Recruit Technologies Co.,Ltd. All rights reserved.
  17. 17. ビッグデータとは? 17(C) Recruit Technologies Co.,Ltd. All rights reserved. ビッグデータ=大量データ Volume 量 Variety 多様性 Velocity 速度 Volume 行動履歴・ソーシャル・センサ(GPS)等 Variety 構造化データだけでなく、 文書・画像・動画・音声などの非構造データ Velocity リアルタイムに発生するCSの嗜好データ スマホ/アプリデータ 利用者・利用パターンの増加
  18. 18. ビッグデータ活用事例① 経験知をモデル化 18(C) Recruit Technologies Co.,Ltd. All rights reserved. 豊富な経験値を持つCAが創りだした過去データ・ロジックをレコメンド作成に利用 求人検索システム 求職者 CA(キャリアアドバイザー) 応募 求人紹介 検索 レコメンドリスト 求人紹介(メール送付・管理画面表示) レコメンドロジック 求職者 求人 確信度 001 O社 0.5 001 X社 0.3 001 Y社 0.2 求職者 A社 O社 P社 Q社 ・・・ B社 X社 Y社 Z社 ・・・
  19. 19. ビッグデータ活用事例② パーソナライズPUSH 19(C) Recruit Technologies Co.,Ltd. All rights reserved. Pusna(プッシュアプローチ)によるアクション増を実現する 今週のあなたにオススメ 会場一覧ができました 通知を受け取る オススメ一覧閲覧 個社閲覧フェア予約 ブライダルフェア予約
  20. 20. ビッグデータ利用者の広がり 技術の進化や「ビッグデータ」の広がりでデータ利用者が拡大している 20(C) Recruit Technologies Co.,Ltd. All rights reserved. IT部門 BIレポート開発者 DB管理者 データサイエンティスト 研究者 エンジニア レポート/モニタリング 営業/エグゼ データに興味のない層 ビジネスインサイト マーケター 事業企画 Big DataのTrend 技術進歩 (Hadoop/セルフBI etc.) データ活用の 一般化 数字は見るけど操作は覚えたくない 自分でデータをいじりたい ITスキルはあまりない 自分でデータを解析する
  21. 21. ビッグデータ基盤 ビッグデータ(データの量/種類/頻度の増加)への対応と、利用者の増加 に合わせ、基盤は常に進化 21(C) Recruit Technologies Co.,Ltd. All rights reserved. データソース データ格納 プレゼンテーション 利用者 外部データ Hadoop エコシステム 高度分析やモデル作成 レポート/モニタリング ビジネスインサイト (マーケター) 機械学習やモデル実装 エンドユーザー (エグゼ/営業 /マネージャ) (プロデューサ/事業 企画) データ サイエンティスト (高度分析者) データ サイエンティスト (エンジニア) 行動ログ 事業DB 事業Hadoop 全社DWH 中央Hadoop • モニタリング • レポート • モデル作成 • データ収集 • 整形・加工 • データストレージ • 高速分析処理 Webアクセスログ アプリログ PUSH通知ログ ビーコンログ
  22. 22. 22(C) Recruit Technologies Co.,Ltd. All rights reserved. PUSH
  23. 23. PUSH通知とは スマートデバイスを起動していなくても通知を送ることが出来る仕組み 23(C) Recruit Technologies Co.,Ltd. All rights reserved. Push! Push!
  24. 24. PUSH通知とは メールと同様に重要な集客ツール。 24(C) Recruit Technologies Co.,Ltd. All rights reserved. Push! Push! メリット  リアルタイムな情報配信  ユーザのアクティブ率向上  休眠ユーザの再起 デメリット  過剰なプッシュによるユーザ離れのリスク  実装の工数がかかる
  25. 25. PUSH通知基盤(Pusna RS)の全体構成 PUSH通知のメリットを最大限活かすための基盤を構築。 25(C) Recruit Technologies Co.,Ltd. All rights reserved. デバイス管理 プッシュ配信 APNs GCM カスタマー リクルート DynamoDB elasticsearch 登録API 登録WorkerSQS 配信worker 操作用Web UI 管理API SQS 配信担当者 データ基盤 事業サーバ ※ atmarkit http://www.atmarkit.co.jp/ait/articles/1412/18/news022.html
  26. 26. デバイス管理 プッシュ配信 APNs GCM カスタマー リクルート DynamoDB elasticsearch 登録API 登録WorkerSQS 配信worker 操作用Web UI 管理API SQS 配信担当者 データ基盤 事業サーバ ビッグデータ基盤との連携 PUSH配信基盤からビッグデータ基盤にリアルタイムに連携。既存のアプリ ケーション改修・影響なく連携を実現。 26(C) Recruit Technologies Co.,Ltd. All rights reserved. ビッグデータ基盤 ビッグデータ基盤用キュー
  27. 27. 本日のアジェンダ 1. 自己紹介 2. リクルートの紹介 3. リクルートのビッグデータへの取り組み 4. メタデータ管理Web 5. まとめ 27(C) Recruit Technologies Co.,Ltd. All rights reserved.
  28. 28. データソース データ格納 プレゼンテーション 利用者 外部データ Hadoop エコシステム 高度分析やモデル作成 レポート/モニタリング ビジネスインサイト (マーケター) 機械学習やモデル実装 エンドユーザー (エグゼ/営業 /マネージャ) (プロデューサ/事業 企画) データ サイエンティスト (高度分析者) データ サイエンティスト (エンジニア) 行動ログ 事業DB 事業Hadoop 全社DWH 中央Hadoop • モニタリング • レポート • モデル作成 • データ収集 • 整形・加工 • データストレージ • 高速分析処理 Webアクセスログ アプリログ PUSH通知ログ ビーコンログ ビッグデータ活用に伴い… (C) Recruit Technologies Co.,Ltd. All rights reserved. データの質・量の増加 利用者の増加
  29. 29. メタデータ管理Web構築の背景 データ意味情報(メタデータ)の問い合わせに忙殺される。 29(C) Recruit Technologies Co.,Ltd. All rights reserved. 会員情報はどこにある!? XXの意味を教えてください! 利用者 テーブル定義書(ファイル) DWH 実データの表示結果 Select * from XX limit 100 Select * from YY limit 100 Select * from ZZ limit 100 ・・・ 開発者 データ管理担当 分からないです… 引用元)気がつくと机がぐちゃぐちゃになっているあなたへ ISBN 978-4-7942-1146-0 “平均的なビジネスマンは、探し物をするためだけ に、1年間で約150時間を費やしている” 利用者がわかる形で回答 × × データの質・量の増加 利用者の増加
  30. 30. メタデータ管理Webの紹介 30(C) Recruit Technologies Co.,Ltd. All rights reserved.
  31. 31. 機能紹介 31(C) Recruit Technologies Co.,Ltd. All rights reserved.
  32. 32. 32(C) Recruit Technologies Co.,Ltd. All rights reserved. ココに来れば必要な情報があるという状態を作り出し、分析担当者のデータ 特定に至る時間やシステム担当者の負担を軽減させる。 メタデータ管理Webで実現した世界  探す手間が省ける  ナレッジが共有される 依頼者 テーブル定義書(ファイル) データ管理担当 探す メタデータ管理Web DWH データ管理担当  問合せが減る!  潜在的なニーズを拾える!  問合せが減る!  自分のDBの最新情報が把握できる! 開発者 自動 自動 自動
  33. 33. メタデータWebの開発の進め方 33(C) Recruit Technologies Co.,Ltd. All rights reserved. ①課題認識 ③要件定義・ 設計・開発 ②F/S検証・ 効果算出 ④運用・継続 改善 F/S…
  34. 34. ①課題認識 背景にあった課題[再掲] データ定義の問い合わせに忙殺される時間を減らしたい! 34(C) Recruit Technologies Co.,Ltd. All rights reserved. どこかにまとまっていれば いいのに!! データ利用者 テーブル定義書(ファイル) DWH 実データの表示結果 Select * from XX limit 100 Select * from YY limit 100 Select * from ZZ limit 100 ・・・ 開発者 データ管理担当 分からないです… 得られた情報を利用者が わかる形に変換して回答 × × これって自分だけ??
  35. 35. ②F/S検証・効果算出 → 起案 簡単な仕組み( MVP minimum viable product:実用最小限の製品)を開 発、公開。 35(C) Recruit Technologies Co.,Ltd. All rights reserved. 簡易システム構築・公開 convert 効果ありそう!検索機能の充実等、 利用者が求めている機能もわかった! DB管理者 データ利用者 DB開発者 検索が便利! 意味説明が 分かりやすい! 統一の定義書が すぐ手に入る! メモを残したい 最新情報がない履歴が見たい
  36. 36. ③要件定義・設計・開発 利用者コメントや要望ヒアリングで肥大化かつ相反する要件に対し、 キーワードを決め、絞り込み。 36(C) Recruit Technologies Co.,Ltd. All rights reserved. 利用者目線で機能をあきらめ取捨選択 多機能 ≠使いやすい 「シンプルに使えること」をキーワードに機能選択 Standish Group Study Reported at XP2002 by Jim Johnson, まったく使わな い, 45% めったに使わな い, 19% ときどき, 16% よく使う, 13% いつも使う, 7% 65%の機能が 使われない
  37. 37. ④運用・機能改善 速く機能を提供することで、継続的に利用される仕組みを実現。 37(C) Recruit Technologies Co.,Ltd. All rights reserved. 小気味よいリリースでファンを増やす! ※90日で200のリリースを実施 絞り込んだ機能の リリース 動かし/使い、 フィードバックを 得る フィードバックか ら必要な機能を見 極める
  38. 38. 利用の推移 平日は400回/日以上の利用があり、月間で計10,000回(300UU)を超え ている。 38(C) Recruit Technologies Co.,Ltd. All rights reserved. 年間50人月超の工数削減効果! (5分/回の工数削減効果) + 問合せを受けるシステム管理者の工数削減!
  39. 39. 本日のアジェンダ 1. 自己紹介 2. リクルートの紹介 3. リクルートのビッグデータへの取り組み 4. メタデータ管理Web 5. まとめ 39(C) Recruit Technologies Co.,Ltd. All rights reserved.
  40. 40. まとめ 40(C) Recruit Technologies Co.,Ltd. All rights reserved. システム管理者だからできることはもっとあるはず。
  41. 41. 41(C) Recruit Technologies Co.,Ltd. All rights reserved. ご清聴ありがとうございました。

×