Submit Search
Upload
Investment in Yahoo! JAPAN's dataplatform and business growth by big data
•
2 likes
•
1,183 views
DataWorks Summit/Hadoop Summit
Follow
Investment in Yahoo! JAPAN's dataplatform and business growth by big data
Read less
Read more
Technology
Report
Share
Report
Share
1 of 43
Download now
Download to read offline
Recommended
Yahoo! JAPANのデータ基盤とHadoop #dbts2016
Yahoo! JAPANのデータ基盤とHadoop #dbts2016
Yahoo!デベロッパーネットワーク
Use case and Live demo : Agile data integration from Legacy system to Hadoop ...
Use case and Live demo : Agile data integration from Legacy system to Hadoop ...
DataWorks Summit/Hadoop Summit
Apache Atlasの現状とデータガバナンス事例 #hadoopreading
Apache Atlasの現状とデータガバナンス事例 #hadoopreading
Yahoo!デベロッパーネットワーク
データ利活用を促進するメタデータ
データ利活用を促進するメタデータ
Yahoo!デベロッパーネットワーク
大規模サイトを支えるビッグデータプラットフォーム技術
大規模サイトを支えるビッグデータプラットフォーム技術
Yahoo!デベロッパーネットワーク
Hadoop ~Yahoo! JAPANの活用について~
Hadoop ~Yahoo! JAPANの活用について~
Yahoo!デベロッパーネットワーク
「Data Infrastructure at Scale 」#yjdsw4
「Data Infrastructure at Scale 」#yjdsw4
Yahoo!デベロッパーネットワーク
Yahoo! JAPANを支えるビッグデータプラットフォーム技術
Yahoo! JAPANを支えるビッグデータプラットフォーム技術
Yahoo!デベロッパーネットワーク
Recommended
Yahoo! JAPANのデータ基盤とHadoop #dbts2016
Yahoo! JAPANのデータ基盤とHadoop #dbts2016
Yahoo!デベロッパーネットワーク
Use case and Live demo : Agile data integration from Legacy system to Hadoop ...
Use case and Live demo : Agile data integration from Legacy system to Hadoop ...
DataWorks Summit/Hadoop Summit
Apache Atlasの現状とデータガバナンス事例 #hadoopreading
Apache Atlasの現状とデータガバナンス事例 #hadoopreading
Yahoo!デベロッパーネットワーク
データ利活用を促進するメタデータ
データ利活用を促進するメタデータ
Yahoo!デベロッパーネットワーク
大規模サイトを支えるビッグデータプラットフォーム技術
大規模サイトを支えるビッグデータプラットフォーム技術
Yahoo!デベロッパーネットワーク
Hadoop ~Yahoo! JAPANの活用について~
Hadoop ~Yahoo! JAPANの活用について~
Yahoo!デベロッパーネットワーク
「Data Infrastructure at Scale 」#yjdsw4
「Data Infrastructure at Scale 」#yjdsw4
Yahoo!デベロッパーネットワーク
Yahoo! JAPANを支えるビッグデータプラットフォーム技術
Yahoo! JAPANを支えるビッグデータプラットフォーム技術
Yahoo!デベロッパーネットワーク
最新事例から学ぶビッグデータの活用法 #ocif16 #hortonworks
最新事例から学ぶビッグデータの活用法 #ocif16 #hortonworks
Kimihiko Kitase
db tech showcase2019オープニングセッション @ 森田 俊哉
db tech showcase2019オープニングセッション @ 森田 俊哉
Insight Technology, Inc.
大規模HDFS & ErasureCoding#yjdsw3
大規模HDFS & ErasureCoding#yjdsw3
Yahoo!デベロッパーネットワーク
[よくわかるクラウドデータベース] Amazon RDS for SQL Server導入事例
[よくわかるクラウドデータベース] Amazon RDS for SQL Server導入事例
Amazon Web Services Japan
分散システム処理モデルの課題および展望#yjdsw3
分散システム処理モデルの課題および展望#yjdsw3
Yahoo!デベロッパーネットワーク
ビッグデータ関連Oss動向調査とニーズ分析
ビッグデータ関連Oss動向調査とニーズ分析
Yukio Yoshida
db tech showcase2019 オープニングセッション @ 石川 雅也
db tech showcase2019 オープニングセッション @ 石川 雅也
Insight Technology, Inc.
DBREから始めるデータベースプラットフォーム
DBREから始めるデータベースプラットフォーム
Insight Technology, Inc.
niconicoにおける継続的なデータ活用のためのHadoop運用事例
niconicoにおける継続的なデータ活用のためのHadoop運用事例
Makoto SHIMURA
大規模クラスタでのHadoop課題
大規模クラスタでのHadoop課題
Yahoo!デベロッパーネットワーク
MBAAで覚えるDBREの大事なおしごと
MBAAで覚えるDBREの大事なおしごと
Insight Technology, Inc.
クラウドにおけるビッグデータ分析環境
クラウドにおけるビッグデータ分析環境
Kimihiko Kitase
Business Innovation cases driven by AI and BigData technologies
Business Innovation cases driven by AI and BigData technologies
DataWorks Summit/Hadoop Summit
データドリブン企業におけるHadoop基盤とETL -niconicoでの実践例-
データドリブン企業におけるHadoop基盤とETL -niconicoでの実践例-
Makoto SHIMURA
Yahoo!プロモーション広告のビックデータ基盤を支える技術と今後の展望
Yahoo!プロモーション広告のビックデータ基盤を支える技術と今後の展望
Yahoo!デベロッパーネットワーク
データテクノロジースペシャル:Yahoo! JAPANにおけるメタデータ管理の試み
データテクノロジースペシャル:Yahoo! JAPANにおけるメタデータ管理の試み
Yahoo!デベロッパーネットワーク
ビッグデータとデータマート
ビッグデータとデータマート
株式会社オプト 仙台ラボラトリ
Lunch & Learn, AWS NoSQL Services
Lunch & Learn, AWS NoSQL Services
Insight Technology, Inc.
データの見える化で進めるデータドリブンカンパニー #devsumiC
データの見える化で進めるデータドリブンカンパニー #devsumiC
Yahoo!デベロッパーネットワーク
Apache Hadoopを利用したビッグデータ分析基盤
Apache Hadoopを利用したビッグデータ分析基盤
Hortonworks Japan
A3RT - the details and actual use cases of "Analytics & Artificial intelligen...
A3RT - the details and actual use cases of "Analytics & Artificial intelligen...
DataWorks Summit/Hadoop Summit
The truth about SQL and Data Warehousing on Hadoop
The truth about SQL and Data Warehousing on Hadoop
DataWorks Summit/Hadoop Summit
More Related Content
What's hot
最新事例から学ぶビッグデータの活用法 #ocif16 #hortonworks
最新事例から学ぶビッグデータの活用法 #ocif16 #hortonworks
Kimihiko Kitase
db tech showcase2019オープニングセッション @ 森田 俊哉
db tech showcase2019オープニングセッション @ 森田 俊哉
Insight Technology, Inc.
大規模HDFS & ErasureCoding#yjdsw3
大規模HDFS & ErasureCoding#yjdsw3
Yahoo!デベロッパーネットワーク
[よくわかるクラウドデータベース] Amazon RDS for SQL Server導入事例
[よくわかるクラウドデータベース] Amazon RDS for SQL Server導入事例
Amazon Web Services Japan
分散システム処理モデルの課題および展望#yjdsw3
分散システム処理モデルの課題および展望#yjdsw3
Yahoo!デベロッパーネットワーク
ビッグデータ関連Oss動向調査とニーズ分析
ビッグデータ関連Oss動向調査とニーズ分析
Yukio Yoshida
db tech showcase2019 オープニングセッション @ 石川 雅也
db tech showcase2019 オープニングセッション @ 石川 雅也
Insight Technology, Inc.
DBREから始めるデータベースプラットフォーム
DBREから始めるデータベースプラットフォーム
Insight Technology, Inc.
niconicoにおける継続的なデータ活用のためのHadoop運用事例
niconicoにおける継続的なデータ活用のためのHadoop運用事例
Makoto SHIMURA
大規模クラスタでのHadoop課題
大規模クラスタでのHadoop課題
Yahoo!デベロッパーネットワーク
MBAAで覚えるDBREの大事なおしごと
MBAAで覚えるDBREの大事なおしごと
Insight Technology, Inc.
クラウドにおけるビッグデータ分析環境
クラウドにおけるビッグデータ分析環境
Kimihiko Kitase
Business Innovation cases driven by AI and BigData technologies
Business Innovation cases driven by AI and BigData technologies
DataWorks Summit/Hadoop Summit
データドリブン企業におけるHadoop基盤とETL -niconicoでの実践例-
データドリブン企業におけるHadoop基盤とETL -niconicoでの実践例-
Makoto SHIMURA
Yahoo!プロモーション広告のビックデータ基盤を支える技術と今後の展望
Yahoo!プロモーション広告のビックデータ基盤を支える技術と今後の展望
Yahoo!デベロッパーネットワーク
データテクノロジースペシャル:Yahoo! JAPANにおけるメタデータ管理の試み
データテクノロジースペシャル:Yahoo! JAPANにおけるメタデータ管理の試み
Yahoo!デベロッパーネットワーク
ビッグデータとデータマート
ビッグデータとデータマート
株式会社オプト 仙台ラボラトリ
Lunch & Learn, AWS NoSQL Services
Lunch & Learn, AWS NoSQL Services
Insight Technology, Inc.
データの見える化で進めるデータドリブンカンパニー #devsumiC
データの見える化で進めるデータドリブンカンパニー #devsumiC
Yahoo!デベロッパーネットワーク
Apache Hadoopを利用したビッグデータ分析基盤
Apache Hadoopを利用したビッグデータ分析基盤
Hortonworks Japan
What's hot
(20)
最新事例から学ぶビッグデータの活用法 #ocif16 #hortonworks
最新事例から学ぶビッグデータの活用法 #ocif16 #hortonworks
db tech showcase2019オープニングセッション @ 森田 俊哉
db tech showcase2019オープニングセッション @ 森田 俊哉
大規模HDFS & ErasureCoding#yjdsw3
大規模HDFS & ErasureCoding#yjdsw3
[よくわかるクラウドデータベース] Amazon RDS for SQL Server導入事例
[よくわかるクラウドデータベース] Amazon RDS for SQL Server導入事例
分散システム処理モデルの課題および展望#yjdsw3
分散システム処理モデルの課題および展望#yjdsw3
ビッグデータ関連Oss動向調査とニーズ分析
ビッグデータ関連Oss動向調査とニーズ分析
db tech showcase2019 オープニングセッション @ 石川 雅也
db tech showcase2019 オープニングセッション @ 石川 雅也
DBREから始めるデータベースプラットフォーム
DBREから始めるデータベースプラットフォーム
niconicoにおける継続的なデータ活用のためのHadoop運用事例
niconicoにおける継続的なデータ活用のためのHadoop運用事例
大規模クラスタでのHadoop課題
大規模クラスタでのHadoop課題
MBAAで覚えるDBREの大事なおしごと
MBAAで覚えるDBREの大事なおしごと
クラウドにおけるビッグデータ分析環境
クラウドにおけるビッグデータ分析環境
Business Innovation cases driven by AI and BigData technologies
Business Innovation cases driven by AI and BigData technologies
データドリブン企業におけるHadoop基盤とETL -niconicoでの実践例-
データドリブン企業におけるHadoop基盤とETL -niconicoでの実践例-
Yahoo!プロモーション広告のビックデータ基盤を支える技術と今後の展望
Yahoo!プロモーション広告のビックデータ基盤を支える技術と今後の展望
データテクノロジースペシャル:Yahoo! JAPANにおけるメタデータ管理の試み
データテクノロジースペシャル:Yahoo! JAPANにおけるメタデータ管理の試み
ビッグデータとデータマート
ビッグデータとデータマート
Lunch & Learn, AWS NoSQL Services
Lunch & Learn, AWS NoSQL Services
データの見える化で進めるデータドリブンカンパニー #devsumiC
データの見える化で進めるデータドリブンカンパニー #devsumiC
Apache Hadoopを利用したビッグデータ分析基盤
Apache Hadoopを利用したビッグデータ分析基盤
Viewers also liked
A3RT - the details and actual use cases of "Analytics & Artificial intelligen...
A3RT - the details and actual use cases of "Analytics & Artificial intelligen...
DataWorks Summit/Hadoop Summit
The truth about SQL and Data Warehousing on Hadoop
The truth about SQL and Data Warehousing on Hadoop
DataWorks Summit/Hadoop Summit
Hadoop in the Cloud – The What, Why and How from the Experts
Hadoop in the Cloud – The What, Why and How from the Experts
DataWorks Summit/Hadoop Summit
Evolving HDFS to a Generalized Distributed Storage Subsystem
Evolving HDFS to a Generalized Distributed Storage Subsystem
DataWorks Summit/Hadoop Summit
Apache NiFi 1.0 in Nutshell
Apache NiFi 1.0 in Nutshell
DataWorks Summit/Hadoop Summit
Using Hadoop to build a Data Quality Service for both real-time and batch data
Using Hadoop to build a Data Quality Service for both real-time and batch data
DataWorks Summit/Hadoop Summit
Rebuilding Web Tracking Infrastructure for Scale
Rebuilding Web Tracking Infrastructure for Scale
DataWorks Summit/Hadoop Summit
Enabling Apache Zeppelin and Spark for Data Science in the Enterprise
Enabling Apache Zeppelin and Spark for Data Science in the Enterprise
DataWorks Summit/Hadoop Summit
SEGA : Growth hacking by Spark ML for Mobile games
SEGA : Growth hacking by Spark ML for Mobile games
DataWorks Summit/Hadoop Summit
Data infrastructure architecture for medium size organization: tips for colle...
Data infrastructure architecture for medium size organization: tips for colle...
DataWorks Summit/Hadoop Summit
Security and Data Governance using Apache Ranger and Apache Atlas
Security and Data Governance using Apache Ranger and Apache Atlas
DataWorks Summit/Hadoop Summit
Comparison of Transactional Libraries for HBase
Comparison of Transactional Libraries for HBase
DataWorks Summit/Hadoop Summit
Apache Eagle - Monitor Hadoop in Real Time
Apache Eagle - Monitor Hadoop in Real Time
DataWorks Summit/Hadoop Summit
Combined analysis of Watson and Spark
Combined analysis of Watson and Spark
DataWorks Summit/Hadoop Summit
Case study of online machine learning for display advertising in Yahoo! JAPAN
Case study of online machine learning for display advertising in Yahoo! JAPAN
DataWorks Summit/Hadoop Summit
LLAP: Sub-Second Analytical Queries in Hive
LLAP: Sub-Second Analytical Queries in Hive
DataWorks Summit/Hadoop Summit
Protecting Enterprise Data In Apache Hadoop
Protecting Enterprise Data In Apache Hadoop
DataWorks Summit/Hadoop Summit
Real-World Machine Learning - Leverage the Features of MapR Converged Data Pl...
Real-World Machine Learning - Leverage the Features of MapR Converged Data Pl...
DataWorks Summit/Hadoop Summit
Path to 400M Members: LinkedIn’s Data Powered Journey
Path to 400M Members: LinkedIn’s Data Powered Journey
DataWorks Summit/Hadoop Summit
Streamline Hadoop DevOps with Apache Ambari
Streamline Hadoop DevOps with Apache Ambari
DataWorks Summit/Hadoop Summit
Viewers also liked
(20)
A3RT - the details and actual use cases of "Analytics & Artificial intelligen...
A3RT - the details and actual use cases of "Analytics & Artificial intelligen...
The truth about SQL and Data Warehousing on Hadoop
The truth about SQL and Data Warehousing on Hadoop
Hadoop in the Cloud – The What, Why and How from the Experts
Hadoop in the Cloud – The What, Why and How from the Experts
Evolving HDFS to a Generalized Distributed Storage Subsystem
Evolving HDFS to a Generalized Distributed Storage Subsystem
Apache NiFi 1.0 in Nutshell
Apache NiFi 1.0 in Nutshell
Using Hadoop to build a Data Quality Service for both real-time and batch data
Using Hadoop to build a Data Quality Service for both real-time and batch data
Rebuilding Web Tracking Infrastructure for Scale
Rebuilding Web Tracking Infrastructure for Scale
Enabling Apache Zeppelin and Spark for Data Science in the Enterprise
Enabling Apache Zeppelin and Spark for Data Science in the Enterprise
SEGA : Growth hacking by Spark ML for Mobile games
SEGA : Growth hacking by Spark ML for Mobile games
Data infrastructure architecture for medium size organization: tips for colle...
Data infrastructure architecture for medium size organization: tips for colle...
Security and Data Governance using Apache Ranger and Apache Atlas
Security and Data Governance using Apache Ranger and Apache Atlas
Comparison of Transactional Libraries for HBase
Comparison of Transactional Libraries for HBase
Apache Eagle - Monitor Hadoop in Real Time
Apache Eagle - Monitor Hadoop in Real Time
Combined analysis of Watson and Spark
Combined analysis of Watson and Spark
Case study of online machine learning for display advertising in Yahoo! JAPAN
Case study of online machine learning for display advertising in Yahoo! JAPAN
LLAP: Sub-Second Analytical Queries in Hive
LLAP: Sub-Second Analytical Queries in Hive
Protecting Enterprise Data In Apache Hadoop
Protecting Enterprise Data In Apache Hadoop
Real-World Machine Learning - Leverage the Features of MapR Converged Data Pl...
Real-World Machine Learning - Leverage the Features of MapR Converged Data Pl...
Path to 400M Members: LinkedIn’s Data Powered Journey
Path to 400M Members: LinkedIn’s Data Powered Journey
Streamline Hadoop DevOps with Apache Ambari
Streamline Hadoop DevOps with Apache Ambari
Similar to Investment in Yahoo! JAPAN's dataplatform and business growth by big data
失敗しないためのデータ活用の勘所
失敗しないためのデータ活用の勘所
Kazuya Mori
AI学習データ作成支援サービス”Annotation One”のご紹介.pdf
AI学習データ作成支援サービス”Annotation One”のご紹介.pdf
Nakashima @Global Walkers
2016年度コーポレートフェローシップ活動報告(山本さん)
2016年度コーポレートフェローシップ活動報告(山本さん)
Code for Japan
Mobageのhadoop活用環境と適用方法
Mobageのhadoop活用環境と適用方法
show you
Markezine day 2012 gdo nakazawa
Markezine day 2012 gdo nakazawa
Shinya Nakazawa
自治体Web service 021114
自治体Web service 021114
伸夫 森本
Developers Summit 2012 16-E-1
Developers Summit 2012 16-E-1
Kohei Kumazawa
JPC2016: PUP-01 知って得する MPN 最新情報
JPC2016: PUP-01 知って得する MPN 最新情報
MPN Japan
YJTC18 D-7 Yahoo!ショッピングのサービスデータ活用事例
YJTC18 D-7 Yahoo!ショッピングのサービスデータ活用事例
Yahoo!デベロッパーネットワーク
Red Hat on Azure が選ばれる理由
Red Hat on Azure が選ばれる理由
MPN Japan
NucliOS 概要
NucliOS 概要
インフラジスティックス・ジャパン株式会社
OSS Market Momentum In Japan
OSS Market Momentum In Japan
MKT International Inc.
全社のデータ活用を一段階上げる取り組み
全社のデータ活用を一段階上げる取り組み
株式会社MonotaRO Tech Team
基調講演「データのグループウェア化」
基調講演「データのグループウェア化」
Cybozucommunity
株式会社デジタルフォルンご紹介資料_202403pdf___共に前へ時代を前へ。
株式会社デジタルフォルンご紹介資料_202403pdf___共に前へ時代を前へ。
naokomukoyama
サイエンス視点からのデータアーキテクト
サイエンス視点からのデータアーキテクト
Masaharu Horino
UXデザインを活用した仮説立案から考えるデータ分析とは?
UXデザインを活用した仮説立案から考えるデータ分析とは?
Shigeyuki Kameda
プロダクトマネージャーはフレームワークを作れ
プロダクトマネージャーはフレームワークを作れ
Toshifumi Sakamoto
Dxhr dxl ver20201104
Dxhr dxl ver20201104
kaitooyachi1
Jaws2017 災害支援クラウド活用 20170311
Jaws2017 災害支援クラウド活用 20170311
Kazuhiro Watanabe
Similar to Investment in Yahoo! JAPAN's dataplatform and business growth by big data
(20)
失敗しないためのデータ活用の勘所
失敗しないためのデータ活用の勘所
AI学習データ作成支援サービス”Annotation One”のご紹介.pdf
AI学習データ作成支援サービス”Annotation One”のご紹介.pdf
2016年度コーポレートフェローシップ活動報告(山本さん)
2016年度コーポレートフェローシップ活動報告(山本さん)
Mobageのhadoop活用環境と適用方法
Mobageのhadoop活用環境と適用方法
Markezine day 2012 gdo nakazawa
Markezine day 2012 gdo nakazawa
自治体Web service 021114
自治体Web service 021114
Developers Summit 2012 16-E-1
Developers Summit 2012 16-E-1
JPC2016: PUP-01 知って得する MPN 最新情報
JPC2016: PUP-01 知って得する MPN 最新情報
YJTC18 D-7 Yahoo!ショッピングのサービスデータ活用事例
YJTC18 D-7 Yahoo!ショッピングのサービスデータ活用事例
Red Hat on Azure が選ばれる理由
Red Hat on Azure が選ばれる理由
NucliOS 概要
NucliOS 概要
OSS Market Momentum In Japan
OSS Market Momentum In Japan
全社のデータ活用を一段階上げる取り組み
全社のデータ活用を一段階上げる取り組み
基調講演「データのグループウェア化」
基調講演「データのグループウェア化」
株式会社デジタルフォルンご紹介資料_202403pdf___共に前へ時代を前へ。
株式会社デジタルフォルンご紹介資料_202403pdf___共に前へ時代を前へ。
サイエンス視点からのデータアーキテクト
サイエンス視点からのデータアーキテクト
UXデザインを活用した仮説立案から考えるデータ分析とは?
UXデザインを活用した仮説立案から考えるデータ分析とは?
プロダクトマネージャーはフレームワークを作れ
プロダクトマネージャーはフレームワークを作れ
Dxhr dxl ver20201104
Dxhr dxl ver20201104
Jaws2017 災害支援クラウド活用 20170311
Jaws2017 災害支援クラウド活用 20170311
More from DataWorks Summit/Hadoop Summit
Running Apache Spark & Apache Zeppelin in Production
Running Apache Spark & Apache Zeppelin in Production
DataWorks Summit/Hadoop Summit
State of Security: Apache Spark & Apache Zeppelin
State of Security: Apache Spark & Apache Zeppelin
DataWorks Summit/Hadoop Summit
Unleashing the Power of Apache Atlas with Apache Ranger
Unleashing the Power of Apache Atlas with Apache Ranger
DataWorks Summit/Hadoop Summit
Enabling Digital Diagnostics with a Data Science Platform
Enabling Digital Diagnostics with a Data Science Platform
DataWorks Summit/Hadoop Summit
Revolutionize Text Mining with Spark and Zeppelin
Revolutionize Text Mining with Spark and Zeppelin
DataWorks Summit/Hadoop Summit
Double Your Hadoop Performance with Hortonworks SmartSense
Double Your Hadoop Performance with Hortonworks SmartSense
DataWorks Summit/Hadoop Summit
Hadoop Crash Course
Hadoop Crash Course
DataWorks Summit/Hadoop Summit
Data Science Crash Course
Data Science Crash Course
DataWorks Summit/Hadoop Summit
Apache Spark Crash Course
Apache Spark Crash Course
DataWorks Summit/Hadoop Summit
Dataflow with Apache NiFi
Dataflow with Apache NiFi
DataWorks Summit/Hadoop Summit
Schema Registry - Set you Data Free
Schema Registry - Set you Data Free
DataWorks Summit/Hadoop Summit
Building a Large-Scale, Adaptive Recommendation Engine with Apache Flink and ...
Building a Large-Scale, Adaptive Recommendation Engine with Apache Flink and ...
DataWorks Summit/Hadoop Summit
Real-Time Anomaly Detection using LSTM Auto-Encoders with Deep Learning4J on ...
Real-Time Anomaly Detection using LSTM Auto-Encoders with Deep Learning4J on ...
DataWorks Summit/Hadoop Summit
Mool - Automated Log Analysis using Data Science and ML
Mool - Automated Log Analysis using Data Science and ML
DataWorks Summit/Hadoop Summit
How Hadoop Makes the Natixis Pack More Efficient
How Hadoop Makes the Natixis Pack More Efficient
DataWorks Summit/Hadoop Summit
HBase in Practice
HBase in Practice
DataWorks Summit/Hadoop Summit
The Challenge of Driving Business Value from the Analytics of Things (AOT)
The Challenge of Driving Business Value from the Analytics of Things (AOT)
DataWorks Summit/Hadoop Summit
Breaking the 1 Million OPS/SEC Barrier in HOPS Hadoop
Breaking the 1 Million OPS/SEC Barrier in HOPS Hadoop
DataWorks Summit/Hadoop Summit
From Regulatory Process Verification to Predictive Maintenance and Beyond wit...
From Regulatory Process Verification to Predictive Maintenance and Beyond wit...
DataWorks Summit/Hadoop Summit
Backup and Disaster Recovery in Hadoop
Backup and Disaster Recovery in Hadoop
DataWorks Summit/Hadoop Summit
More from DataWorks Summit/Hadoop Summit
(20)
Running Apache Spark & Apache Zeppelin in Production
Running Apache Spark & Apache Zeppelin in Production
State of Security: Apache Spark & Apache Zeppelin
State of Security: Apache Spark & Apache Zeppelin
Unleashing the Power of Apache Atlas with Apache Ranger
Unleashing the Power of Apache Atlas with Apache Ranger
Enabling Digital Diagnostics with a Data Science Platform
Enabling Digital Diagnostics with a Data Science Platform
Revolutionize Text Mining with Spark and Zeppelin
Revolutionize Text Mining with Spark and Zeppelin
Double Your Hadoop Performance with Hortonworks SmartSense
Double Your Hadoop Performance with Hortonworks SmartSense
Hadoop Crash Course
Hadoop Crash Course
Data Science Crash Course
Data Science Crash Course
Apache Spark Crash Course
Apache Spark Crash Course
Dataflow with Apache NiFi
Dataflow with Apache NiFi
Schema Registry - Set you Data Free
Schema Registry - Set you Data Free
Building a Large-Scale, Adaptive Recommendation Engine with Apache Flink and ...
Building a Large-Scale, Adaptive Recommendation Engine with Apache Flink and ...
Real-Time Anomaly Detection using LSTM Auto-Encoders with Deep Learning4J on ...
Real-Time Anomaly Detection using LSTM Auto-Encoders with Deep Learning4J on ...
Mool - Automated Log Analysis using Data Science and ML
Mool - Automated Log Analysis using Data Science and ML
How Hadoop Makes the Natixis Pack More Efficient
How Hadoop Makes the Natixis Pack More Efficient
HBase in Practice
HBase in Practice
The Challenge of Driving Business Value from the Analytics of Things (AOT)
The Challenge of Driving Business Value from the Analytics of Things (AOT)
Breaking the 1 Million OPS/SEC Barrier in HOPS Hadoop
Breaking the 1 Million OPS/SEC Barrier in HOPS Hadoop
From Regulatory Process Verification to Predictive Maintenance and Beyond wit...
From Regulatory Process Verification to Predictive Maintenance and Beyond wit...
Backup and Disaster Recovery in Hadoop
Backup and Disaster Recovery in Hadoop
Recently uploaded
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
Toru Tamaki
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
Toru Tamaki
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
Hiroki Ichikura
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
iPride Co., Ltd.
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
Toru Tamaki
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
FumieNakayama
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Yuma Ohgami
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
UEHARA, Tetsutaro
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
taisei2219
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
sugiuralab
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
博三 太田
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
FumieNakayama
Recently uploaded
(12)
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
Investment in Yahoo! JAPAN's dataplatform and business growth by big data
1.
2016年12月15日 ヤフー株式会社 データ&サイエンスソリューション統括本部 杉山 朋広 ヤフーのITインフラへの投資ポイントと ビッグデータ活用によるビジネス成長
2.
自己紹介 杉山 朋広 (すぎやま ともひろ) 2002年 ヤフー株式会社中途入社 2002年ー2011年 Yahoo!ウォレットの開発・運用 Yahoo!
JAPAN IDのログイン・登録・DBの運用 2012年ー現在 Hadoopクラスタの構築・運用 広告集計システムの開発 広告システム向けのデータプラットフォームの構築
3.
ヤフーとデータ基盤の紹介 これまでのIT投資とビジネス成長 これからの成長に向けて Agenda
4.
ヤフーとデータ基盤の紹介
5.
5 >3418万MAU >>110000services 2.2億商品数82%of PC users 74%of
smartphone users 100以上 DUB No.1App publisher ※1 >9007万 ※1 ゲームアプリケーションを除く ヤフーとデータ基盤の紹介(2016年第一四半期ベース) 日本最大級のポータルサイト >699億 PV/月
6.
6 ヤフーとデータ基盤の紹介 ビジネスは常に拡大
7.
7 ヤフーとデータ基盤の紹介 ビジネスは常に拡大
8.
8 ヤフーとデータ基盤の紹介:データ量とシステム規模 0 10 20 30 40 50 60 70 80 90 100 0 1,000 2,000 3,000 4,000 5,000 6,000 22000099 22001100 22001111
22001122 22001133 22001144 22001155 22001166 RRoowwHHDDFFSSSSttoorraaggee((iinnPPBB))→→ NNuummbbeerrooffNNooddeess→→ Nodes HDFS ビジネスの拡大と共にデータは増大
9.
9 0 10 20 30 40 50 60 70 80 90 100 0 1,000 2,000 3,000 4,000 5,000 6,000 22000099 22001100 22001111
22001122 22001133 22001144 22001155 22001166 RRoowwHHDDFFSSSSttoorraaggee((iinnPPBB))→→ NNuummbbeerrooffNNooddeess→→ Nodes HDFS • PV集計 • 検索リンク解析 • サービス最適化 • 顧客行動分析 • タイムライン 型広告 ヤフーとデータ基盤の紹介:データ量とシステム規模 黎明期 導入期 データ爆増期 ビジネスの拡大と共にデータは増大 • 広告リーチ予測 • 広告ターゲティング
10.
10 ヤフーとデータ基盤のご紹介 :データ基盤の概要 データ基盤は日本有数の規模 S3互換ストレージ 66000000 nnooddeess 22000000 nnooddeess 220000 ddbbss 550000 ddbbss 11..77 PPBB 11550000 nnooddeess hot warm cold
11.
11 ヤフーとデータ基盤の紹介 D&S統括本部・システム統括本部が全社基盤を担う
12.
12 ヤフーとデータ基盤の紹介 D&S統括本部はデータ利活用の専門集団 データ&サイエンスソリューション統括本部 システム統括本部 (データセンター・ネットワーク) メ デ ィ ア マ � ケ テ ィ ン グ ソ リ ュ � シ ョ ン シ ョ ッ ピ ン グ オ � ク シ ョ ン パ � ソ ナ ル サ � ビ ス 決 済 金 融 データプラットフォーム本部 サイエンス本部 データサービス本部 Yahoo! JAPAN 研究所 データ&サイエンスソリューション統括本部
13.
これまでのIT投資とビジネス成長
14.
14 0 10 20 30 40 50 60 70 80 90 100 0 1,000 2,000 3,000 4,000 5,000 6,000 22000099 22001100 22001111
22001122 22001133 22001144 22001155 22001166 RRoowwHHDDFFSSSSttoorraaggee((iinnPPBB))→→ NNuummbbeerrooffNNooddeess→→ Nodes HDFS • PV集計 • 検索リンク解析 • サービス最適化 • 顧客行動分析 • タイムライン 型広告 これまでのIT投資とビジネス成長:黎明期 黎明期 導入期 データ爆増期 Hadoop利用の初期段階 • 広告リーチ予測 • 広告ターゲティング
15.
15 これまでのIT投資とビジネス成長:黎明期:before Web Server Web Server Web Server Data Pipeline (Y!Inc origin) Teradata ORACLE MySQL Network Storage Batch C++ Batch perl Batch php • サービス追加・アクセス増加によるデータ量の増大 • PV集計など基本的な処理が長時間化 •
独自分散フレームワークの破綻 独自分散フレームワークの限界が課題
16.
16 これまでのIT投資とビジネス成長:黎明期:投資ポイント レガシーシステム Hadoop 最大並列性能 自社内利用で 30ノードの実績のみ 他者で既に 4,000ノードの実績あり 分散フレームワーク 内製で開発
hadoopがサポート 開発リソース 内製 オープンソース 利用者の開発範囲 分散フレームワークと アプリケーション アプリケーションのみ 開発リソースをアプリケーションにフォーカス 高いスケーラビリティを実現し、アプリケーション開発に集中できる Hadoopを採用
17.
17 これまでのIT投資とビジネス成長:黎明期:after • 必要な部門が必要な分だけのクラスタを入手 • 課題を持っていた部門が予算を組む Hadoop (x10〜x100) Web Server Web Server Web Server Data Pipeline (Y!Inc origin) Teradata ORACLE MySQL Network Storage Batch C++ Batch perl Batch php 予算がある部門がデータ基盤をもった
18.
18 これまでのIT投資とビジネス成長:黎明期:事例 350 400 450 500 550 600 650 700 2009Q1 2010Q1 2011Q1
2012Q1 2013Q1 2014Q1 2015Q1 億PV 月間PV数の遷移 黎明期の月間PVは既に450億を突破
19.
19 0 10 20 30 40 50 60 70 80 90 100 0 1,000 2,000 3,000 4,000 5,000 6,000 22000099 22001100 22001111
22001122 22001133 22001144 22001155 22001166 RRoowwHHDDFFSSSSttoorraaggee((iinnPPBB))→→ NNuummbbeerrooffNNooddeess→→ Nodes HDFS • PV集計 • 検索リンク解析 • サービス最適化 • 顧客行動分析 • タイムライン 型広告 これまでのIT投資とビジネス成長:導入期 黎明期 導入期 データ爆増 データ基盤の集約とマルチテナント化 • 広告リーチ予測 • 広告ターゲティング
20.
20 これまでのIT投資とビジネス成長:導入期:before • 部門個別で用意できる予算に限界 • 予算の限界からHadoopの規模も頭打ち Hadoop (x10〜x100) Web Server Web Server Web Server Data Pipeline (Y!Inc origin) Teradata ORACLE MySQL Network Storage Batch C++ Batch perl Batch php 部門個別最適の限界が課題
21.
21 これまでのIT投資とビジネス成長:導入期:投資ポイント Hadoop x100 Hadoop x50 事業部A Hadoop x50 Hadoop x30 事業部B 全社基盤化し共同利用
22.
22 これまでのIT投資とビジネス成長:導入期:投資ポイント Hadoop x 1000 Hadoop x100 Hadoop x50 事業部A Hadoop x50
Hadoop x30 事業部B 事業部A リソース 35% 事業部B リソース 25% 事業部C リソース 20% 共通 リソース 20% 全社基盤化し共同利用 全社共通予算で大規模クラスタに投資
23.
23 これまでのIT投資とビジネス成長:導入期:after • 従来の事業部予算の枠を超えた計算リソースを得ることができた • アドホックな処理が可能となりサイエンスを醸成する土壌となった Hadoop (x1000) Hadoop (x10〜x100) Web Server Web Server Web Server Data Pipeline (Y!Inc origin) Network Storage Teradata ORACLE MySQL 全体最適によるスケールメリットを享受
24.
24 これまでのIT投資とビジネス成長:導入期:事例 データ基盤の発達によりターゲティング広告を実現 • 過去のユーザの行動を解析し最適な広告を配信する • プレミアム広告売上の3割以上を占める AD ページ閲覧履歴 検索キーワード 広告クリック ヤフーの利用
最適な広告を配信 データ基盤
25.
25 これまでのIT投資とビジネス成長:導入期:データサイエンスのはじまり • YDNの広告ターゲティングのためにデータサイエンスチームを発足 • マッチングに機械学習などの手法を導入 データサイエンスが売上高アップに寄与 サイエンスチーム発足
26.
26 0 10 20 30 40 50 60 70 80 90 100 0 1,000 2,000 3,000 4,000 5,000 6,000 22000099 22001100 22001111
22001122 22001133 22001144 22001155 22001166 RRoowwHHDDFFSSSSttoorraaggee((iinnPPBB))→→ NNuummbbeerrooffNNooddeess→→ Nodes HDFS • PV集計 • 検索リンク解析 • サービス最適化 • 顧客行動分析 • タイムライン 型広告 これまでのIT投資とビジネス成長:データ爆増期 黎明期 導入期 データ爆増期 本格的なデータ利活用のはじまり • 広告リーチ予測 • 広告ターゲティング
27.
27 これまでのIT投資とビジネス成長:データ爆増期:before • いくつかの成功事例をもとにデータ利活用が促進 • すべてが同じ環境を利用することで高SLAのサービスに影響 Hadoop (x1000) Web Server Web Server Web Server Data Pipeline (Y!Inc origin) Network Storage Teradata ORACLE MySQL データ利活用の促進と性能の競争
28.
28 これまでのIT投資とビジネス成長:データ爆増期:投資ポイント Hadoop (x1000) アドホック 定常ジョブ 高SLA 大規模データ基盤への全社投資
29.
29 これまでのIT投資とビジネス成長:データ爆増期:投資ポイント Hadoop (x3000) Hive/Tez (x700) Hadoop (x1000) アドホック 定常ジョブ 高SLA
アドホック 定常ジョブ 高SLA 大規模データ基盤への全社投資 全社環境への投資、高SLAの専用環境など、全社判断で対応
30.
30 これまでのIT投資とビジネス成長:データ爆増期:after Hadoop (x3000) ObjectStore (YJ origin) cassandra Hive/Tez • 全社基盤の利用率アップにより全社のデータが集約される •
データ利用方法の多様化 マルチビッグデータ基盤の醸成 Web Server Web Server Web Server Data Pipeline (Y!Inc origin) Network Storage Teradata ORACLE MySQL
31.
31 これまでのIT投資とビジネス成長:データ爆増期:事例 データの精細化によりサービス最適化 検索 キーワード 入力補助 レコメンデーション 感情分析音声アシスト
32.
32 これまでのIT投資とビジネス成長:データ爆増期:直近の成果 • タイムライン型の広告 • 広告売上を大幅に拡大 •
データ量も増大 インフィード広告が広告売上を拡大
33.
これからの成長に向けて
34.
34 0 10 20 30 40 50 60 70 80 90 100 0 1,000 2,000 3,000 4,000 5,000 6,000 22000099 22001100 22001111
22001122 22001133 22001144 22001155 22001166 RRoowwHHDDFFSSSSttoorraaggee((iinnPPBB))→→ NNuummbbeerrooffNNooddeess→→ Nodes HDFS • PV集計 • 検索リンク解析 • サービス最適化 • 顧客行動分析 • タイムライン 型広告 これからの成長に向けて 黎明期 導入期 データ爆増 これから 技術革新による更なる最適化への挑戦 • 広告リーチ予測 • 広告ターゲティング
35.
35 これからの成長に向けて 効率化 設備投資 進化 最適化の3要素
36.
36 これからの成長に向けて:設備投資 効率化 設備投資 進化 設備投資額(億円) 180 2012年度 2015年度 380 積極的な設備投資
37.
37 これからの成長に向けて:効率化 • 海外DC利用 • 電力コスト圧縮 •
保守性重視から性能重視へ • OCP利用 • Hadoopの開発 • Cassandraの開発 データセンター ハードウェア ソフトウェア 効率化 設備投資 進化 DC・HW・SWの相乗的な効率化
38.
38 これからの成長に向けて:進化 効率化 設備投資 進化 トップベンダーとの開発協力 HORTONWORKS Teradata DATASTAX
39.
39 これからの成長に向けて:進化 効率化 設備投資 進化 国際学会への参加でサイエンス人材にもアピール 4 3 15 11 2012 2013
2014 2015 Submission of papers in International Journals 3papers were accepted in WWW 2016 2papers were accepted in WSDM 2016 UIST, Ubicomp, KDD, and more
40.
40 これからの成長に向けて:進化 効率化 設備投資 進化 シリコンバレー拠点の開設
41.
41 これからの成長に向けて:次世代基盤 New Data Pipeline (Kafka cluster) Hadoop Stream Platform • kafkaの導入によりストレージ依存を脱却 •
ストリーム処理基盤の追加 • KVS,RDBも適材適所で活用 Tez llap データ基盤全体の最適化 Web Server Web Server Web Server ObjectStore (YJ origin) cassandra Hive/Tez Teradata ORACLE MySQL
42.
スケールアウト可能な技術を採用する 全社利用によりスケールメリットを生かす 専門部隊を置き全社利用を促進・サポートする まとめ
43.
43 ご清聴ありがとうございました
Download now