Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
データ定義情報の管理と
Webによる公開
リクルートテクノロジーズ
池田
本日のアジェンダ
1. 自己紹介
2. 会社紹介
3. メタデータ管理Webの紹介
2(C) Recruit Co.,Ltd. All rights reserved.
自己紹介
3(C) Recruit Co.,Ltd. All rights reserved.
池田 英哲(いけだ ひであき)
株式会社 リクルートテクノロジーズ
ビッグデータ部
IDポイント ビッグデータインフラグループ
長男
次男
2003...
創立 1960年3月31日 「大学新聞広告社」としてスタート
グループ
従業員数
連結売上高
連結経常利益
関連企業数
目指す世界観 「あなた」を支える存在でありたい
4
28,209名
約 1兆1915億円 ※2014年3月
末
約 1,22...
リクルートテクノロジーズの位置づけ
リクルートキャリア
リクルートジョブズ
リクルートスタッフィング
リクルート住まいカンパニー
リクルートライフスタイル
リクルートマーケティングパートナーズ
スタッフサービス・ホールディングス
リクルートアド...
旅行
IT/トレンド
生活/地域情報
グルメ・美容
ライフスタイル領域ライフイベント領域
進学
就職
結婚
転職
住宅購入
車購入
出産/育児
「選択・意思決定」を支援する情報サービスの提供
→「まだ、ここにない、出会い。」の実現へ
リクルート...
リクルートIDの使えるサイト①
リクルートIDの使えるサイト②
リクルートIDの使えるサイト③
リクルートIDの使えるサイト④
メタデータ管理Webの紹介
11(C) Recruit Co.,Ltd. All rights reserved.
いつもの風景
元の定義情報がバラバラでデータを集めてもその意味が分からないために
利用者からの問い合わせで忙殺される
12(C) Recruit Co.,Ltd. All rights reserved.
分析用のデータください!
XXの値教え...
データ種類の増加
さらに。。。
データ元やデータ種類は増え、利用シーンの増加に伴いデータ管理者への
問合せの質・量も増加。
13(C) Recruit Co.,Ltd. All rights reserved.
Webサイトの
アクセスログ
E...
14(C) Recruit Co.,Ltd. All rights reserved.
ココに来れば必要な情報があるという状態を作り出し、分析担当者のデー
タ特定に至る時間やシステム担当者の負担を軽減させる。
メタデータ管理Webで実現したい世...
メタデータ管理Web
全社DWH
メタデータ管理Webのシステム概要
テーブル定義情報が自動で最新化され、コメント登録による相互活性化等
、「利用したくなる」仕組みを構築。
15(C) Recruit Co.,Ltd. All rights r...
(参考)格納されている定義情報
2015年1月末現在
16(C) Recruit Co.,Ltd. All rights reserved.
3
環境
18
データベース
22,175
テーブル
965
テーブル
638
サイト分のアクセス解析...
Upcoming SlideShare
Loading in …5
×

データ定義情報の管理とWebによる公開

1,408 views

Published on

2015/02/16 データ総研主催 データマネジメント情報交換会での、池田の講演資料になります

Published in: Technology
  • Be the first to comment

データ定義情報の管理とWebによる公開

  1. 1. データ定義情報の管理と Webによる公開 リクルートテクノロジーズ 池田
  2. 2. 本日のアジェンダ 1. 自己紹介 2. 会社紹介 3. メタデータ管理Webの紹介 2(C) Recruit Co.,Ltd. All rights reserved.
  3. 3. 自己紹介 3(C) Recruit Co.,Ltd. All rights reserved. 池田 英哲(いけだ ひであき) 株式会社 リクルートテクノロジーズ ビッグデータ部 IDポイント ビッグデータインフラグループ 長男 次男 2003年~2006年 某SIer Flashを用いたWebアプリケーション開発等を担当 2006年~2013年 某コンサル会社 インフォメーションマネジメント(BI・DWH)関連部署に配属 Analytics部隊の設立に伴い部署移動 2014年1月~ リクルートテクノロジーズ 入社後一貫して、リクルートIDプロジェクトのDWH構築・運用を担当 職歴
  4. 4. 創立 1960年3月31日 「大学新聞広告社」としてスタート グループ 従業員数 連結売上高 連結経常利益 関連企業数 目指す世界観 「あなた」を支える存在でありたい 4 28,209名 約 1兆1915億円 ※2014年3月 末 約 1,220億円 ※2014年3月末 国内:59社、海外:50社 企業概要(リクルート全体)
  5. 5. リクルートテクノロジーズの位置づけ リクルートキャリア リクルートジョブズ リクルートスタッフィング リクルート住まいカンパニー リクルートライフスタイル リクルートマーケティングパートナーズ スタッフサービス・ホールディングス リクルートアドミニストレーション リクルートコミュニケーションズ 事業会社 機能会社 インフラ部門 大規模プロジェクト推進部門 UI設計/SEO部門 ビッグデータ機能部門 テクノロジーR&D部門 事業・社内IT推進部門 リクルート ホールディングス リクルートとは、 主要7事業会社+3機能会社 で構成されるグループ企業群 私が所属する会社は リクルートテクノロジーズ 5
  6. 6. 旅行 IT/トレンド 生活/地域情報 グルメ・美容 ライフスタイル領域ライフイベント領域 進学 就職 結婚 転職 住宅購入 車購入 出産/育児 「選択・意思決定」を支援する情報サービスの提供 →「まだ、ここにない、出会い。」の実現へ リクルートの展開しているサービス
  7. 7. リクルートIDの使えるサイト①
  8. 8. リクルートIDの使えるサイト②
  9. 9. リクルートIDの使えるサイト③
  10. 10. リクルートIDの使えるサイト④
  11. 11. メタデータ管理Webの紹介 11(C) Recruit Co.,Ltd. All rights reserved.
  12. 12. いつもの風景 元の定義情報がバラバラでデータを集めてもその意味が分からないために 利用者からの問い合わせで忙殺される 12(C) Recruit Co.,Ltd. All rights reserved. 分析用のデータください! XXの値教えてください! 利用者 テーブル定義書(ファイル) DWH 実データの表示結果 Select * from XX limit 100 Select * from YY limit 100 Select * from ZZ limit 100 ・・・ 開発者 データ管理担当 分からないです… データが変わってます… 引用元)気がつくと机がぐちゃぐちゃになっているあなたへ ISBN 978-4-7942-1146-0 “平均的なビジネスマンは、探し物をするためだけに、 1年間で約150時間を費やしている” 得られた情報を利用者がわかる形に変換して回答
  13. 13. データ種類の増加 さらに。。。 データ元やデータ種類は増え、利用シーンの増加に伴いデータ管理者への 問合せの質・量も増加。 13(C) Recruit Co.,Ltd. All rights reserved. Webサイトの アクセスログ Excel Access MDB NOSQL データ元の増加 RDBMS DWH スマホアプリ ログ データ利用シーンの増加 高度分析や モデル作成 レポート/ モニタリング ビジネスインサイト (マーケター) 機械学習や モデル実装 データ管理担当
  14. 14. 14(C) Recruit Co.,Ltd. All rights reserved. ココに来れば必要な情報があるという状態を作り出し、分析担当者のデー タ特定に至る時間やシステム担当者の負担を軽減させる。 メタデータ管理Webで実現したい世界  定義情報がどこにあるのか探す必要がない  新しいコード値の意味等最新情報が分かる  他の利用者のナレッジが共有され、試行錯 誤の手間が減る 依頼者 テーブル定義書(ファイル) データ管理担当 探す メタデータ管理Web DWH データ管理担当  問い合わせに忙殺されなくなる  検索ワード等からデータ利用状況や潜在的 なニーズを拾える  最新のテーブル定義情報提供等の依頼・ 問合せが減る 開発者
  15. 15. メタデータ管理Web 全社DWH メタデータ管理Webのシステム概要 テーブル定義情報が自動で最新化され、コメント登録による相互活性化等 、「利用したくなる」仕組みを構築。 15(C) Recruit Co.,Ltd. All rights reserved. データ元DB RDBMS Oracle mySQL DWH メタデータリポジトリ 設計書 共有フォルダ等 開発者 設計情報更新 日次 日次 日次 権限管理システム 利用者 コード値範囲チェック等 にメタデータを活用 参照・ コメント登録 <物理情報> <論理情報> <権限情報>
  16. 16. (参考)格納されている定義情報 2015年1月末現在 16(C) Recruit Co.,Ltd. All rights reserved. 3 環境 18 データベース 22,175 テーブル 965 テーブル 638 サイト分のアクセス解析ログ RDBMS (旧サイトカタリスト)

×