Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
Uploaded by
Recruit Lifestyle Co., Ltd.
PDF, PPTX
2,781 views
ビックデータ分析基盤の成⻑の軌跡
2013年の分社からリクルートライフスタイルにおける分析基盤の成長の軌跡をご紹介します。 リクルートライフスタイル 白子 佳孝
Technology
◦
Read more
3
Save
Share
Embed
Embed presentation
Download
Download as PDF, PPTX
1
/ 23
2
/ 23
3
/ 23
4
/ 23
5
/ 23
6
/ 23
7
/ 23
8
/ 23
9
/ 23
10
/ 23
11
/ 23
12
/ 23
13
/ 23
14
/ 23
15
/ 23
16
/ 23
17
/ 23
18
/ 23
19
/ 23
20
/ 23
21
/ 23
22
/ 23
23
/ 23
More Related Content
PDF
リクルートのビッグデータ活用基盤とビッグデータ活用のためのメタデータ管理Webのご紹介
by
Recruit Technologies
PDF
リクルートライフスタイル流!分析基盤との賢い付き合い方
by
Recruit Lifestyle Co., Ltd.
PDF
リクルートのビッグデータ活用基盤とデータ活用に向けた取組み
by
Recruit Technologies
PDF
リクルートのビッグデータ活用基盤とデータ活用に向けた取組み
by
Recruit Technologies
PDF
リクルートにおけるデータのインフラ化への取組
by
Recruit Technologies
PDF
「リクルートデータセット」 ~公開までの道のりとこれから~
by
Recruit Technologies
PDF
MLOpsの概要と初学者が気をつけたほうが良いこと
by
Sho Tanaka
PDF
経営のアジリティを支えるDevOpsと組織
by
Recruit Technologies
リクルートのビッグデータ活用基盤とビッグデータ活用のためのメタデータ管理Webのご紹介
by
Recruit Technologies
リクルートライフスタイル流!分析基盤との賢い付き合い方
by
Recruit Lifestyle Co., Ltd.
リクルートのビッグデータ活用基盤とデータ活用に向けた取組み
by
Recruit Technologies
リクルートのビッグデータ活用基盤とデータ活用に向けた取組み
by
Recruit Technologies
リクルートにおけるデータのインフラ化への取組
by
Recruit Technologies
「リクルートデータセット」 ~公開までの道のりとこれから~
by
Recruit Technologies
MLOpsの概要と初学者が気をつけたほうが良いこと
by
Sho Tanaka
経営のアジリティを支えるDevOpsと組織
by
Recruit Technologies
What's hot
PDF
Slideshare Japanese
by
Hidenori Goto
PPTX
Teams の”チーム”と Office 365 グループを理解して Power Platform を活用せよ
by
Yugo Shimizu
PDF
[Cloud OnAir] BigQuery の仕組みからベストプラクティスまでのご紹介 2018年9月6日 放送
by
Google Cloud Platform - Japan
PDF
ChatGPTのビジネス活用とセキュリティ
by
Daisuke Masubuchi
PDF
リクルート式ビッグデータ活用術
by
Recruit Technologies
PPTX
データモデリング・テクニック
by
Hidekatsu Izuno
PDF
マッチングサービスにおけるKPIの話
by
cyberagent
PDF
Data-centricなML開発
by
Takeshi Suzuki
PDF
解説!30分で分かるLEAN ANALYTICS
by
しくみ製作所
PDF
Git Flowを運用するために
by
Shun Tsunoda
PDF
TDD のこころ
by
Takuto Wada
PDF
Getting started with MLOps
by
yusuke shibui
PDF
AWS IoTアーキテクチャパターン
by
Amazon Web Services Japan
PDF
もしプロダクトマネージャー・プロダクトチームにUXリサーチのメンターがついたら <レクイエム>
by
Yoshiki Hayama
PDF
MLflowによる機械学習モデルのライフサイクルの管理
by
Takeshi Yamamuro
PPTX
え!? Power BI の画面からデータ更新なんてできるの!? ~PowerApps カスタムビジュアルの可能性~
by
Yugo Shimizu
PDF
Data × UX - 定量分析と定性分析のシナジーをガチUXデザイナーが語る
by
Yoshiki Hayama
PPTX
テストコード入門
by
小川 昌吾
PDF
Singularityで分散深層学習
by
Hitoshi Sato
PDF
情報科学における18のメタテクニック
by
nakano_lab
Slideshare Japanese
by
Hidenori Goto
Teams の”チーム”と Office 365 グループを理解して Power Platform を活用せよ
by
Yugo Shimizu
[Cloud OnAir] BigQuery の仕組みからベストプラクティスまでのご紹介 2018年9月6日 放送
by
Google Cloud Platform - Japan
ChatGPTのビジネス活用とセキュリティ
by
Daisuke Masubuchi
リクルート式ビッグデータ活用術
by
Recruit Technologies
データモデリング・テクニック
by
Hidekatsu Izuno
マッチングサービスにおけるKPIの話
by
cyberagent
Data-centricなML開発
by
Takeshi Suzuki
解説!30分で分かるLEAN ANALYTICS
by
しくみ製作所
Git Flowを運用するために
by
Shun Tsunoda
TDD のこころ
by
Takuto Wada
Getting started with MLOps
by
yusuke shibui
AWS IoTアーキテクチャパターン
by
Amazon Web Services Japan
もしプロダクトマネージャー・プロダクトチームにUXリサーチのメンターがついたら <レクイエム>
by
Yoshiki Hayama
MLflowによる機械学習モデルのライフサイクルの管理
by
Takeshi Yamamuro
え!? Power BI の画面からデータ更新なんてできるの!? ~PowerApps カスタムビジュアルの可能性~
by
Yugo Shimizu
Data × UX - 定量分析と定性分析のシナジーをガチUXデザイナーが語る
by
Yoshiki Hayama
テストコード入門
by
小川 昌吾
Singularityで分散深層学習
by
Hitoshi Sato
情報科学における18のメタテクニック
by
nakano_lab
Similar to ビックデータ分析基盤の成⻑の軌跡
PDF
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
by
Techon Organization
PPTX
事業の進展とデータマネジメント体制の進歩(+プレトタイプの話)
by
Tokoroten Nakayama
PDF
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...
by
Google Cloud Platform - Japan
PPTX
リクルートライフスタイルの考えるストリームデータの活かし方(Hadoop Spark Conference2016)
by
Atsushi Kurumada
PPTX
リクルートライフスタイルが考える、万人に使ってもらえる分析基盤の作り方
by
Yu Yamada
PDF
[よくわかるクラウドデータベース] リクルートにおけるRedshift導入・活用事例
by
Amazon Web Services Japan
PDF
Developers Summit 2018: ストリームとバッチを融合したBigData Analytics ~事例とデモから見えてくる、これからのデー...
by
オラクルエンジニア通信
PDF
変わる!? リクルートグループのデータ解析基盤
by
Recruit Technologies
PDF
[Oracle Innovation Summit Tokyo 2018] 水環境の持続を支えるクラウド型ICTプラットフォーム「Water Busine...
by
オラクルエンジニア通信
PDF
The Design for Serverless ETL Pipeline データ分析基盤のレガシーなデータロードをサーバレスでフルリプレースするまで道のり
by
Recruit Lifestyle Co., Ltd.
PDF
データ定義情報の管理とWebによる公開
by
Recruit Technologies
PDF
デジタル化への第一歩 「エンタープライズデータレイク構築事例のご紹介」
by
BeeX.inc
PDF
ビッグデータによる価値創造を実現するデータ収集・蓄積・分析クラウドサービス “簡単!賢く!データを活かす!”東芝データレイクサービスの取り組みのご紹介
by
griddb
PDF
ビッグデータとデータマート
by
株式会社オプト 仙台ラボラトリ
PDF
マルチクラウドで実演するカスタマーセントリックな分析基盤
by
Recruit Lifestyle Co., Ltd.
PPTX
オンプレ、クラウドを組み合わせて作るビックデータ基盤 データ基盤の選び方
by
Yu Yamada
PPTX
巨大なサービスと膨大なデータを支えるプラットフォーム
by
Tetsutaro Watanabe
PDF
データマイニングCROSS 第2部-機械学習・大規模分散処理
by
Koichi Hamada
PDF
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション
by
Dell TechCenter Japan
PDF
オープンソースで開くビッグデータの扉
by
Open Source Software Association of Japan
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
by
Techon Organization
事業の進展とデータマネジメント体制の進歩(+プレトタイプの話)
by
Tokoroten Nakayama
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...
by
Google Cloud Platform - Japan
リクルートライフスタイルの考えるストリームデータの活かし方(Hadoop Spark Conference2016)
by
Atsushi Kurumada
リクルートライフスタイルが考える、万人に使ってもらえる分析基盤の作り方
by
Yu Yamada
[よくわかるクラウドデータベース] リクルートにおけるRedshift導入・活用事例
by
Amazon Web Services Japan
Developers Summit 2018: ストリームとバッチを融合したBigData Analytics ~事例とデモから見えてくる、これからのデー...
by
オラクルエンジニア通信
変わる!? リクルートグループのデータ解析基盤
by
Recruit Technologies
[Oracle Innovation Summit Tokyo 2018] 水環境の持続を支えるクラウド型ICTプラットフォーム「Water Busine...
by
オラクルエンジニア通信
The Design for Serverless ETL Pipeline データ分析基盤のレガシーなデータロードをサーバレスでフルリプレースするまで道のり
by
Recruit Lifestyle Co., Ltd.
データ定義情報の管理とWebによる公開
by
Recruit Technologies
デジタル化への第一歩 「エンタープライズデータレイク構築事例のご紹介」
by
BeeX.inc
ビッグデータによる価値創造を実現するデータ収集・蓄積・分析クラウドサービス “簡単!賢く!データを活かす!”東芝データレイクサービスの取り組みのご紹介
by
griddb
ビッグデータとデータマート
by
株式会社オプト 仙台ラボラトリ
マルチクラウドで実演するカスタマーセントリックな分析基盤
by
Recruit Lifestyle Co., Ltd.
オンプレ、クラウドを組み合わせて作るビックデータ基盤 データ基盤の選び方
by
Yu Yamada
巨大なサービスと膨大なデータを支えるプラットフォーム
by
Tetsutaro Watanabe
データマイニングCROSS 第2部-機械学習・大規模分散処理
by
Koichi Hamada
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション
by
Dell TechCenter Japan
オープンソースで開くビッグデータの扉
by
Open Source Software Association of Japan
More from Recruit Lifestyle Co., Ltd.
PPTX
分散トレーシングAWS:X-Rayとの上手い付き合い方
by
Recruit Lifestyle Co., Ltd.
PDF
ホットペッパービューティーにおけるモバイルアプリ向けAPIのBFF/Backend分割
by
Recruit Lifestyle Co., Ltd.
PDF
Real-time personalized recommendation using embedding
by
Recruit Lifestyle Co., Ltd.
PDF
業務と消費者の体験を同時にデザインするリクルートの価値検証のリアル ー 「Airレジ ハンディ」セルフオーダーのブレない「価値」の確かめ方 ー
by
Recruit Lifestyle Co., Ltd.
PDF
データ分析基盤運⽤チームの 運⽤業務を改善してみた話
by
Recruit Lifestyle Co., Ltd.
PDF
データプロダクト開発を成功に導くには
by
Recruit Lifestyle Co., Ltd.
PDF
リクルートライフスタイルにおける深層学習の活用とGCPでの実現方法
by
Recruit Lifestyle Co., Ltd.
PDF
Jupyter だけで機械学習を実サービス展開できる基盤
by
Recruit Lifestyle Co., Ltd.
PDF
「進化し続けるインフラ」のためのマルチアカウント管理
by
Recruit Lifestyle Co., Ltd.
PDF
Flutter移行の苦労と、乗り越えた先に得られたもの
by
Recruit Lifestyle Co., Ltd.
PDF
Air事業のデザイン組織とデザイナー
by
Recruit Lifestyle Co., Ltd.
PDF
CTIサービスを支える裏側 〜物理デバイスとの戦い〜 | iOSDC Japan 2020
by
Recruit Lifestyle Co., Ltd.
PDF
OOUIを実践してわかった、9つの大切なこと
by
Recruit Lifestyle Co., Ltd.
PDF
リクルートライフスタイル AirシリーズでのUXリサーチ
by
Recruit Lifestyle Co., Ltd.
PPTX
データサイエンティストが力を発揮できるアジャイルデータ活用基盤
by
Recruit Lifestyle Co., Ltd.
PDF
データから価値を生み続けるには
by
Recruit Lifestyle Co., Ltd.
PDF
SQLを書くだけでAPIが作れる基盤
by
Recruit Lifestyle Co., Ltd.
PDF
データサイエンティストとエンジニア 両者が幸せになれる機械学習基盤を求めて
by
Recruit Lifestyle Co., Ltd.
PDF
BtoBサービスならではの顧客目線の取り入れ方
by
Recruit Lifestyle Co., Ltd.
PDF
Refactoring point of Kotlin application
by
Recruit Lifestyle Co., Ltd.
分散トレーシングAWS:X-Rayとの上手い付き合い方
by
Recruit Lifestyle Co., Ltd.
ホットペッパービューティーにおけるモバイルアプリ向けAPIのBFF/Backend分割
by
Recruit Lifestyle Co., Ltd.
Real-time personalized recommendation using embedding
by
Recruit Lifestyle Co., Ltd.
業務と消費者の体験を同時にデザインするリクルートの価値検証のリアル ー 「Airレジ ハンディ」セルフオーダーのブレない「価値」の確かめ方 ー
by
Recruit Lifestyle Co., Ltd.
データ分析基盤運⽤チームの 運⽤業務を改善してみた話
by
Recruit Lifestyle Co., Ltd.
データプロダクト開発を成功に導くには
by
Recruit Lifestyle Co., Ltd.
リクルートライフスタイルにおける深層学習の活用とGCPでの実現方法
by
Recruit Lifestyle Co., Ltd.
Jupyter だけで機械学習を実サービス展開できる基盤
by
Recruit Lifestyle Co., Ltd.
「進化し続けるインフラ」のためのマルチアカウント管理
by
Recruit Lifestyle Co., Ltd.
Flutter移行の苦労と、乗り越えた先に得られたもの
by
Recruit Lifestyle Co., Ltd.
Air事業のデザイン組織とデザイナー
by
Recruit Lifestyle Co., Ltd.
CTIサービスを支える裏側 〜物理デバイスとの戦い〜 | iOSDC Japan 2020
by
Recruit Lifestyle Co., Ltd.
OOUIを実践してわかった、9つの大切なこと
by
Recruit Lifestyle Co., Ltd.
リクルートライフスタイル AirシリーズでのUXリサーチ
by
Recruit Lifestyle Co., Ltd.
データサイエンティストが力を発揮できるアジャイルデータ活用基盤
by
Recruit Lifestyle Co., Ltd.
データから価値を生み続けるには
by
Recruit Lifestyle Co., Ltd.
SQLを書くだけでAPIが作れる基盤
by
Recruit Lifestyle Co., Ltd.
データサイエンティストとエンジニア 両者が幸せになれる機械学習基盤を求めて
by
Recruit Lifestyle Co., Ltd.
BtoBサービスならではの顧客目線の取り入れ方
by
Recruit Lifestyle Co., Ltd.
Refactoring point of Kotlin application
by
Recruit Lifestyle Co., Ltd.
Recently uploaded
PPTX
2025年11月24日情報ネットワーク法学会大井哲也発表「API利用のシステム情報」
by
Tetsuya Oi
PDF
PCCC25(設立25年記念PCクラスタシンポジウム):コアマイクロシステムズ株式会社 テーマ 「AI HPC時代のトータルソリューションプロバイダ」
by
PC Cluster Consortium
PDF
論文紹介:DiffusionRet: Generative Text-Video Retrieval with Diffusion Model
by
Toru Tamaki
PDF
論文紹介:HiLoRA: Adaptive Hierarchical LoRA Routing for Training-Free Domain Gene...
by
Toru Tamaki
PPTX
ChatGPTのコネクタ開発から学ぶ、外部サービスをつなぐMCPサーバーの仕組み
by
Ryuji Egashira
PDF
論文紹介:MotionMatcher: Cinematic Motion Customizationof Text-to-Video Diffusion ...
by
Toru Tamaki
PDF
PCCC25(設立25年記念PCクラスタシンポジウム):Pacific Teck Japan テーマ2「『Slinky』 SlurmとクラウドのKuber...
by
PC Cluster Consortium
PDF
PCCC25(設立25年記念PCクラスタシンポジウム):Pacific Teck Japan テーマ3「『TrinityX』 AI時代のクラスターマネジメ...
by
PC Cluster Consortium
PDF
膨大なデータ時代を制する鍵、セグメンテーションAIが切り拓く解析精度と効率の革新
by
Data Source
PDF
PCCC25(設立25年記念PCクラスタシンポジウム):エヌビディア合同会社 テーマ1「NVIDIA 最新発表製品等のご案内」
by
PC Cluster Consortium
PDF
PCCC25(設立25年記念PCクラスタシンポジウム):日本ヒューレット・パッカード合同会社 テーマ1「大規模AIの能力を最大限に活用するHPE Comp...
by
PC Cluster Consortium
PDF
PCCC25(設立25年記念PCクラスタシンポジウム):富士通株式会社 テーマ1「HPC&AI: Accelerating material develo...
by
PC Cluster Consortium
PDF
PCCC25(設立25年記念PCクラスタシンポジウム):日本ヒューレット・パッカード合同会社 テーマ3「IT運用とデータサイエンティストを強力に支援するH...
by
PC Cluster Consortium
PDF
AI開発の最前線を変えるニューラルネットワークプロセッサと、未来社会における応用可能性
by
Data Source
PDF
ニューラルプロセッサによるAI処理の高速化と、未知の可能性を切り拓く未来の人工知能
by
Data Source
2025年11月24日情報ネットワーク法学会大井哲也発表「API利用のシステム情報」
by
Tetsuya Oi
PCCC25(設立25年記念PCクラスタシンポジウム):コアマイクロシステムズ株式会社 テーマ 「AI HPC時代のトータルソリューションプロバイダ」
by
PC Cluster Consortium
論文紹介:DiffusionRet: Generative Text-Video Retrieval with Diffusion Model
by
Toru Tamaki
論文紹介:HiLoRA: Adaptive Hierarchical LoRA Routing for Training-Free Domain Gene...
by
Toru Tamaki
ChatGPTのコネクタ開発から学ぶ、外部サービスをつなぐMCPサーバーの仕組み
by
Ryuji Egashira
論文紹介:MotionMatcher: Cinematic Motion Customizationof Text-to-Video Diffusion ...
by
Toru Tamaki
PCCC25(設立25年記念PCクラスタシンポジウム):Pacific Teck Japan テーマ2「『Slinky』 SlurmとクラウドのKuber...
by
PC Cluster Consortium
PCCC25(設立25年記念PCクラスタシンポジウム):Pacific Teck Japan テーマ3「『TrinityX』 AI時代のクラスターマネジメ...
by
PC Cluster Consortium
膨大なデータ時代を制する鍵、セグメンテーションAIが切り拓く解析精度と効率の革新
by
Data Source
PCCC25(設立25年記念PCクラスタシンポジウム):エヌビディア合同会社 テーマ1「NVIDIA 最新発表製品等のご案内」
by
PC Cluster Consortium
PCCC25(設立25年記念PCクラスタシンポジウム):日本ヒューレット・パッカード合同会社 テーマ1「大規模AIの能力を最大限に活用するHPE Comp...
by
PC Cluster Consortium
PCCC25(設立25年記念PCクラスタシンポジウム):富士通株式会社 テーマ1「HPC&AI: Accelerating material develo...
by
PC Cluster Consortium
PCCC25(設立25年記念PCクラスタシンポジウム):日本ヒューレット・パッカード合同会社 テーマ3「IT運用とデータサイエンティストを強力に支援するH...
by
PC Cluster Consortium
AI開発の最前線を変えるニューラルネットワークプロセッサと、未来社会における応用可能性
by
Data Source
ニューラルプロセッサによるAI処理の高速化と、未知の可能性を切り拓く未来の人工知能
by
Data Source
ビックデータ分析基盤の成⻑の軌跡
1.
ビックデータ分析基盤の成⻑の軌跡 ⽩⼦ 佳孝 リクルートライフスタイル データマネジメントG #mastercloud
2.
リクルートライフスタイルの分析基盤の歴史から、 皆さんの基盤成⻑戦略の参考になれば(いいな) 本発表で伝えたいこと
3.
Index 1. リクルートライフスタイルについて 2. 成⻑の軌跡
4.
Index 1. リクルートライフスタイルについて 2. 成⻑の軌跡
5.
会社紹介
6.
Data もちろん、データを利活⽤して。 ユーザーとクライアントがマッチングする場を提供
7.
Data • サービスアクセスログ • トランザクションログ •
会員属性情報 • etc... • マスタデータ • ⼊稿データ • 営業接点データ • 勘定データ • etc... ユーザー側だけではなく、クライアント企業側にも広⼤な世界が 広がっている点は、リクルートグループの⼤きな特徴 リボンモデルの交差点から取得されるデータとは
8.
Index 1. リクルートライフスタイルについて 2. 成⻑の軌跡
9.
2013 2014 2015 2016 2017 2018 ✔TresureData導⼊ ✔Hadoop除却 ✔Redshiftのノード拡張 ✔分社化に伴い、RLS独⾃の分 析基盤提供スタート ✔Netezza, Redshift導⼊ ✔オンプレ-AWS間にDC導⼊ ✔Redshiftのノード拡張 ✔Netezzaを別途導⼊ ✔新Netezzaへの移⾏完了 ✔Mirror-Redshift誕⽣ ✔Redshiftのノード拡張 ✔BigQuery導⼊ ✔Exadata導⼊ ✔Netezza除却 ✔TreasureData脱却 ✔Spectrum導⼊ ✔Mirror-Redshift除却 Timeline
10.
4クラスタのHadoop(MapR)から時代が始まる リクルートテクノロジーズが提供するプライベートクラウド「RAFTEL」にある⾼性能なサーバ4台 のクラスタからなるHadoopを利⽤開始 クォーターサイズのNetezza(Twin Fin3)導⼊ IBMが提供している据え置き型のDWHアプライアンスであるNetezzaを導⼊ 分析や統計解析などの処理環境としてユーザに徐々に開放していった Redshift導⼊ AWSが提供するDWHサービスのRedshiftを導⼊ 最初は、ds1.xlargeの4ノード構成だった Netezzaの利⽤者が増えたことにより、リソースが枯渇し始めたので、レポーティング・モニタリン グ⽤途として導⼊を決定 2013 2014
2015 2016 2017 2018
11.
2013 2014 2015
2016 2017 2018 HPB HPG JLN 事業データ CSV 外部データ S3 Redshift アクセスログ Neteeza Hadoop
12.
Redshiftノードのスケールアウト Redshiftのノードを4→7に増強 この頃から、アドホックな分析はRedshift、売上直結のバッチ処理はNetezzaでと役割分担が明確に なってきた。 Hadoop除却に伴い、TreasureDataに移⾏ プライベートクラウド「RAFTEL」のインフラを丸ごと⼊れ替えるという壮⼤なプロジェクトが発⾜ その際に⾊々あった様で、 カスタマーの⾏動ログデータの⼀次加⼯で利⽤していたHadoopを⼀気に TresureDataに置き換え TDにしたことで、 HDFSのディスクの⼼配が必要なくなった ここで、当時のインフラ担当から⼀⾔: このときメインでここを担当していた⼈が驚くほど資料を残しておらず、後任が地獄を⾒た… みなさんも仕様書はちゃんと書きましょう! 2013
2014 2015 2016 2017 2018
13.
2013 2014 2015
2016 2017 2018 S3 Redshift Neteeza Treasure Data HPB HPG JLN 事業データ CSV 外部データ アクセスログ
14.
Redshiftノードの再スケールアウト Redshiftの利⽤がだいぶ進み、ノードを7から⼀気に32に増強 ノード数の上限に到達してしまったため、スケールアウトができなくなる オンプレ-AWS間にDC導⼊ Redshiftへの通信が増加の⼀途をたどり、AWSのVPN接続ルーターをハングさせるという事態に陥っ たため、専⽤線を導⼊ ⼤量通信が⽬⽴ったtableau-Redshift間の通信を専⽤線経由に切り替えた ハーフサイズのNetezza(Twin Fin 6)の導⼊ リクルートテクノロジーズが利⽤していた中古Netezzaを購⼊ (なぜいらなくなったのかは不明) 今まで使っていたNetezzaからデータや処理を移⾏するプロジェクトが発⾜ 2013
2014 2015 2016 2017 2018
15.
2013 2014 2015
2016 2017 2018 S3 Redshift Neteeza Treasure Data HPB HPG JLN 事業データ CSV 外部データ アクセスログ アプリログ
16.
Redshiftノードのスケールアップ Redshiftの利⽤がさらに進み、32ノードではこれ以上のパフォーマンス改善が⾒込まれなかったため、 検証を重ねた結果、最終的にds2.8xlargeの11ノードにスケールアップ Mirror-Redshift誕⽣ 現⾏Redshiftの速度が利⽤者に追い付かなくなってきたため、データ鮮度を求めないクエリなどを逃 がすクラスタを新設 毎週末、本番Redshiftから取得したSNAPSHOTよりクラスタを再作成 新Netezzaへの移⾏完了 2015年に購⼊したNetezzaへのデータおよびバッチ処理の移⾏が完了 クオーターサイズのNetezzaはスタンバイマシンになった 2013 2014 2015
2016 2017 2018
17.
2013 2014 2015
2016 2017 2018 HPB HPG JLN 事業データ CSV 外部データ S3 Redshift Mirror-Redshift Neteeza アクセスログ アプリログ Treasure Data
18.
BigQueryの導⼊ Googleが提供するDWHサービスのBigQueryを導⼊ 年々、利⽤者もデータも増えてきており、移⾏や代替環境作成などを⾏なっていた。 そのため、どんなにデータやユーザが増えても、性能劣化が起きない・キャパプラ不要なDWHに乗 り換えていこうという⽬的でBigQueryが導⼊された また、今までを教訓に共通ルール整備、命名規則なども初めからしっかり設計した さらに、リクルートテクノロジーズもBigQueryを利⽤し始めたので、プロジェクト共有機能により データ共有が容易になった Netezza除却からのExadata導⼊ NetezzaのEOSLを迎えるにあたり、代替としてExadataを導⼊ PureData(Netezza後継機)とどちらにするか検討されたが、リクルートテクノロジーズが持つ ExadataとでDataGuardによる冗⻑構成が取れるという点でExadataに決定 2013 2014 2015
2016 2017 2018
19.
2013 2014 2015
2016 2017 2018 HPB HPG JLN 事業データ CSV 外部データ S3 Redshift Mirror-Redshift BigQuery アクセスログ アプリログ Treasure Data Exadata Cloud Storage
20.
TreasureData脱却 カスタマーの⾏動ログデータの⼀次加⼯処理をBigQueryに移⾏し、TreasureDataから脱却 ⼀部アプリログの連携はTDを未だ利⽤中 Spectrum導⼊ S3のファイルを直接参照できるRedshift Spectrumを導⼊ 数百のテーブルロード処理がSpectrumに置き換えられたことで、Redshiftの負荷がかなり軽減され た Mirror-Redshift除却 アドホックな分析はBigQueryやSpectrumに寄せる様にし、クエリを逃していたクラスタを除却 データ鮮度が新しいデータを参照できるため、分析者からも喜びの声が 2013 2014
2015 2016 2017 2018
21.
2013 2014 2015
2016 2017 2018 HPB HPG JLN 事業データ CSV 外部データ S3 Redshift Spectrum BigQuery アクセスログ アプリログ Treasure Data Exadata Cloud Storage
22.
Google AnalyticsのBigQuery連携 Snowflakeの検証・導⼊ データのワークロード統⼀ データカタログの整備 2013 2014
2015 2016 2017 2018
Download