SlideShare a Scribd company logo
データサイエンスと	
データエンジニア	
草薙 昭彦	(@nagix)	
MapR	Technologies
自己紹介	
•  草薙 昭彦	(@nagix)	
•  MapR	Technologies	
データエンジニア	
NS-SHAFT	
無料!
業界の話
IT業界のトレンド	
•  ビッグデータ、クラウド、IoT/M2M	
•  データ活用の位置付けの変化	
– 分析が企業の競争力に	
– リアルタイムなデータそのものがビジネス価値に
なぜ今データサイエンスか	
•  深い顧客の理解なしではビジネスは難しく
なってきている	
– Web、モバイル、SNS、センサーなど、顧客に関す
るあらゆるデータ	
•  人材の不足	
– 個人の勘と経験ではなく、学術として整備	
– 米国の大学ではコースが充実
Google	トレンド
で、なぜ今?	
•  なぜ大きな会社も小さな会社も?	
– 巨大銀行からスタートアップまで	
•  なぜいろいろな業界で?	
– 金融、Web、製造、セキュリティ、・・・	
•  なぜいろいろなアプリケーションで?	
– 広告ターゲティング、不正検知、故障予測、・・・	
•  なぜ同じタイミングで?
ありがちな回答	
より大量のデータが、より急速に生成される	
データサイズが最大容量の1台のコンピュータにも収まりきらなくなる	
データの生成や格納に必要なコストが下がり続けている	
これは正しい回答ではありません
分析のスケーリングの法則	
•  80:20	ルール	
– はじめはわずかな努力で大きな成果が得られる	
– ところが急激にリターンが減っていく	
•  一方、分析に必要なコストは	
– これまで:	規模を増やすとコストは指数関数的に
増加	
– Big	Data:	コストの増加は直線的	
•  分析のROIの構造が根本的に変わった!
2,0000 500 1000 1500
1
0
0.25
0.5
0.75
Scale
Value
データの規模、システムの規模、チームの規模	
分析で得られる価値
2,0000 500 1000 1500
1
0
0.25
0.5
0.75
Scale
Value
データの規模、システムの規模、チームの規模	
これまで:	
分析にかかるコスト
2,0000 500 1000 1500
1
0
0.25
0.5
0.75
Scale
Value
データの規模、システムの規模、チームの規模	
これまで:	
分析で得られるリターン
2,0000 500 1000 1500
1
0
0.25
0.5
0.75
Scale
Value
Big Data:	
分析にかかるコスト
2,0000 500 1000 1500
1
0
0.25
0.5
0.75
Scale
Value
Big Data:	
分析で得られるリターン
データサイエンティストって	
どういう職業?	
•  ゴール	
– データに価値を見いだし	
– データに関するストーリーを伝えること	
•  そのために	
– 必要なデータを引き出し	
– 統計や機械学習の知識を駆使してモデルを作り	
– 結果を生成	
– 顧客や経営層とのコミュニケーションを行う
データエンジニアってどういう職業?	
•  ゴール	
– データを適切な場所に適切な形式で格納し	
– 利用者がアクセスできるように整備する	
•  そのために	
– データ処理のニーズを明確化し	
– ニーズを満たすストレージ基盤を設計構築し	
– データフローやアクセスアプリケーションを整備	
•  Big	Data	の 3V	を扱えるシステムを構築する
技術の話
データサイエンティストに	
求められるスキル	
•  統計学、機械学習	
– R,	SPSS,	SAS,	Knime,	Weka,	RapidMiner,	SciPy,	…	
•  データの整形・フィルタリング・正規化・加工	
– Python,	Java,	Hadoop,	Hive,	SQL,	Spark,	Excel,	…	
•  可視化、プレゼンテーション	
•  貼っておきます	
–  データサイエンティストというかデータ分析職に就くための最低限のスキル要件とは	
hYp://tjo.hatenablog.com/entry/2015/03/13/190000	
–  データサイエンティスト養成読本	
hYp://www.amazon.co.jp/dp/4774158968
データエンジニアに求められるスキル	
•  Python, Java, Hadoop, Hive, SQL, Spark, …	
•  OS,	ネットワーク,	ストレージ,	クラウド,	…	
Image	via	Data	Science	101
大規模なデータを扱う時に重要なこと	
•  スケールアウト(水平スケーラビリティ)	
•  CPUとストレージの距離	
サーバ	 ・・・	
スケールアウト可能なアルゴリズム・データ格納方式	
共有ストレージ	
(NAS/SAN)	
サーバ	
レイテンシ	
の問題	
スループット	
の問題	
サーバ	
	
	
	
	
	
サーバ	
	
	
	
	
	
サーバ	
	
	
	
	
	
内蔵	
HDD	
/SSD	
内蔵	
HDD	
/SSD	
内蔵	
HDD	
/SSD	
CPU	 CPU	 CPU
大規模なデータを扱う時に重要なこと	
•  Data	Gravity(データの重力)	
Web	
App	
Data	
分析	
App	
Data	
会計	
App	
Data	
マーケ
App	
Data	
販売	
App	
Data	
販売	
App	
Data	
会計	
App	
マーケ	App
Hadoopって?	
サーバ	 サーバ	 サーバ	 サーバ	 サーバ	 サーバ
Hadoopって?	
サーバ	
Hadoop	Distributed	File	System	(HDFS)	
データをブロックに
分割して分散配置、	
3つのレプリカ作成
Hadoopって?	
サーバ	
Hadoop	Distributed	File	System	(HDFS)	
分割されたデータ
をMap、Reduceと
いう単位で並列分
散処理	
MapReduce
Hadoopって?	
Hadoop	Distributed	File	System	(HDFS)	
MapReduce	
Hadoop	コア
Hadoopって?	
Hadoop	Distributed	File	System	(HDFS)	
MapReduce	
Hive	
	
SQLクエリ	
エンジン	
HBase	
	
NoSQL	
データベース	
Pig	
	
データ加工	
フレームワーク	
Mahout	
	
機械学習	
Zoo	
Keeper	
	
分散レポジトリ	
・・・	
MapReduce/HDFS	
を使いやすくする
ための無数のプロ
ジェクト
Sparkって?	
•  (主に)MapReduce	の置き換え	
– バッチだけでなくインタラクティブな処理も	
– メモリを最大限利用し、より効率よく	
Spark	
Spark	
SQL	
	
SQLクエリ	
エンジン	
Spark	
Streaming	
	
ストリーム処理	
MLlib	
	
機械学習	
GraphX	
	
グラフ処理	
Spark	R	
	
R	on	Spark	
HDFS	またはその他のファイルシステム
分析と機械学習	
•  従来からの分析	
– 集計、レポート、見える化、ルールベース処理	
•  機械学習による応用	
– 予測、カテゴリ分類、レコメンド、異常検知	
•  データ分析のステップ	
1.  ビジネスとデータの理解	
2.  データの準備	
3.  モデルの作成	
4.  モデルの評価	
5.  モデルの展開
Python	と Hadoop/Spark	
•  MapReduce	を	Python	で	
– mrjob,	Pydoop	
•  Pig	
– Jython,	cpython	でユーザー定義関数を書く	
•  Hadoop	を管理する	
– snakebite	
•  Spark	を	Python	で	
– PySpark	
Hadoop	with	Python	
hYp://www.slideshare.net/DonaldMiner/hadoop-with-python
ビジネスの話
よくある悩み	
•  どこにデータがあるか分からない	
•  効果がわからないものに予算がつかない	
•  分析のスキルが足りない	
•  分析はできてもビジネスに結びつかない
ビジネスに分析を生かしている企業	
hYp://itpro.nikkeibp.co.jp/atcl/column/
14/122600137/122600002/	
	
「我々の仕事は、対話(アナログ)と
データ分析(デジタル)の比率がそれ
ぞれ50%ずつ。これが理想」	
花王・石黒勲氏	
hYp://special.nikkeibp.co.jp/ts/aricle/ae0d/
180043/	
	
「スキルが高いデータサイエンティストよ
り問題解決ができる人材」「高度な分析
技術はまず要らない」	
リコー・佐藤敏明氏
分析をビジネスに活用するために	
重要なこと	
•  分析の8割は基本的なスキルでカバーできる	
•  分析には業務知識が必須	
•  「データを中心に考える」文化の醸成	
•  ステップを踏んで少しずつ成果を出す	
•  コミュニケーション
ありがとうございました

More Related Content

What's hot

新時代のITインフラ -技術トレンドとユーザー企業の構え- (20100512)
新時代のITインフラ -技術トレンドとユーザー企業の構え- (20100512)新時代のITインフラ -技術トレンドとユーザー企業の構え- (20100512)
新時代のITインフラ -技術トレンドとユーザー企業の構え- (20100512)Jun Kawahara
 
企業が求めるデータサイエンティスト人材像-データサイエンティスト 国内企業動向調査(2019)より
企業が求めるデータサイエンティスト人材像-データサイエンティスト 国内企業動向調査(2019)より企業が求めるデータサイエンティスト人材像-データサイエンティスト 国内企業動向調査(2019)より
企業が求めるデータサイエンティスト人材像-データサイエンティスト 国内企業動向調査(2019)より
The Japan DataScientist Society
 
【資料】AIとデータプラットフォームがもたらす世界 ~Fintech, HRtechの最新事例と合わせて~
【資料】AIとデータプラットフォームがもたらす世界 ~Fintech, HRtechの最新事例と合わせて~【資料】AIとデータプラットフォームがもたらす世界 ~Fintech, HRtechの最新事例と合わせて~
【資料】AIとデータプラットフォームがもたらす世界 ~Fintech, HRtechの最新事例と合わせて~
Saharu Doi
 
スマートエスイー: 超スマート社会&DX時代のAI・IoT×ビジネスの人材育成と調査研究
スマートエスイー: 超スマート社会&DX時代のAI・IoT×ビジネスの人材育成と調査研究スマートエスイー: 超スマート社会&DX時代のAI・IoT×ビジネスの人材育成と調査研究
スマートエスイー: 超スマート社会&DX時代のAI・IoT×ビジネスの人材育成と調査研究
Hironori Washizaki
 
デジタルトランスフォーメーション(DX)におけるソフトウェアの側面とダイバーシティ・インクルーシブに関する研究実践動向
デジタルトランスフォーメーション(DX)におけるソフトウェアの側面とダイバーシティ・インクルーシブに関する研究実践動向デジタルトランスフォーメーション(DX)におけるソフトウェアの側面とダイバーシティ・インクルーシブに関する研究実践動向
デジタルトランスフォーメーション(DX)におけるソフトウェアの側面とダイバーシティ・インクルーシブに関する研究実践動向
Hironori Washizaki
 
情報通信産業のトレンド
情報通信産業のトレンド情報通信産業のトレンド
情報通信産業のトレンド
Takeshi Motohashi
 
AI・データ利活用継続の鍵はビジネススキル
AI・データ利活用継続の鍵はビジネススキルAI・データ利活用継続の鍵はビジネススキル
AI・データ利活用継続の鍵はビジネススキル
The Japan DataScientist Society
 
避けては通れないビッグデータ周辺の重要課題
避けては通れないビッグデータ周辺の重要課題避けては通れないビッグデータ周辺の重要課題
避けては通れないビッグデータ周辺の重要課題
kurikiyo
 
DXを企画・実行する為の基礎知識
DXを企画・実行する為の基礎知識DXを企画・実行する為の基礎知識
DXを企画・実行する為の基礎知識
masaaki murakami
 
コニカミノルタにおけるデータドリブンPLMの取り組み
コニカミノルタにおけるデータドリブンPLMの取り組みコニカミノルタにおけるデータドリブンPLMの取り組み
コニカミノルタにおけるデータドリブンPLMの取り組み
The Japan DataScientist Society
 
Io taiプロジェクトの進め方、組織作り 20180208_ver1.02
Io taiプロジェクトの進め方、組織作り 20180208_ver1.02Io taiプロジェクトの進め方、組織作り 20180208_ver1.02
Io taiプロジェクトの進め方、組織作り 20180208_ver1.02
Microsoft Azure Japan
 
DX紹介資料
DX紹介資料DX紹介資料
DX紹介資料
Hiroaki Sano
 
LiBRA 09.2021 / 総集編 2/2
LiBRA 09.2021 / 総集編 2/2LiBRA 09.2021 / 総集編 2/2
LiBRA 09.2021 / 総集編 2/2
Masanori Saito
 
中小企業はAI・IoTとどう向き合うか 【TIRIクロスミーティング2021】
中小企業はAI・IoTとどう向き合うか 【TIRIクロスミーティング2021】中小企業はAI・IoTとどう向き合うか 【TIRIクロスミーティング2021】
中小企業はAI・IoTとどう向き合うか 【TIRIクロスミーティング2021】
Koichi Masukura
 
日経地方創生フォーラム KDDI登壇資料
日経地方創生フォーラム KDDI登壇資料日経地方創生フォーラム KDDI登壇資料
日経地方創生フォーラム KDDI登壇資料
KDDI
 
Woven Work Design concept20200520
Woven Work Design concept20200520Woven Work Design concept20200520
Woven Work Design concept20200520
ToruTakagi
 
LiBRA 05.2021 / Juku_Biz_Strategy
LiBRA 05.2021 / Juku_Biz_StrategyLiBRA 05.2021 / Juku_Biz_Strategy
LiBRA 05.2021 / Juku_Biz_Strategy
Masanori Saito
 
データサイエンティストの就労意識
データサイエンティストの就労意識データサイエンティストの就労意識
データサイエンティストの就労意識
The Japan DataScientist Society
 
Teams を活用してメッチャマルチタスクをこなす方法 - dahatake さん流 - version 1.3
Teams を活用してメッチャマルチタスクをこなす方法 - dahatake さん流 - version 1.3Teams を活用してメッチャマルチタスクをこなす方法 - dahatake さん流 - version 1.3
Teams を活用してメッチャマルチタスクをこなす方法 - dahatake さん流 - version 1.3
Daiyu Hatakeyama
 
基礎から学ぶ!インダストリアルIoTの実現に必須のセンサ計測とエッジコンピューティング
基礎から学ぶ!インダストリアルIoTの実現に必須のセンサ計測とエッジコンピューティング基礎から学ぶ!インダストリアルIoTの実現に必須のセンサ計測とエッジコンピューティング
基礎から学ぶ!インダストリアルIoTの実現に必須のセンサ計測とエッジコンピューティング
The Japan DataScientist Society
 

What's hot (20)

新時代のITインフラ -技術トレンドとユーザー企業の構え- (20100512)
新時代のITインフラ -技術トレンドとユーザー企業の構え- (20100512)新時代のITインフラ -技術トレンドとユーザー企業の構え- (20100512)
新時代のITインフラ -技術トレンドとユーザー企業の構え- (20100512)
 
企業が求めるデータサイエンティスト人材像-データサイエンティスト 国内企業動向調査(2019)より
企業が求めるデータサイエンティスト人材像-データサイエンティスト 国内企業動向調査(2019)より企業が求めるデータサイエンティスト人材像-データサイエンティスト 国内企業動向調査(2019)より
企業が求めるデータサイエンティスト人材像-データサイエンティスト 国内企業動向調査(2019)より
 
【資料】AIとデータプラットフォームがもたらす世界 ~Fintech, HRtechの最新事例と合わせて~
【資料】AIとデータプラットフォームがもたらす世界 ~Fintech, HRtechの最新事例と合わせて~【資料】AIとデータプラットフォームがもたらす世界 ~Fintech, HRtechの最新事例と合わせて~
【資料】AIとデータプラットフォームがもたらす世界 ~Fintech, HRtechの最新事例と合わせて~
 
スマートエスイー: 超スマート社会&DX時代のAI・IoT×ビジネスの人材育成と調査研究
スマートエスイー: 超スマート社会&DX時代のAI・IoT×ビジネスの人材育成と調査研究スマートエスイー: 超スマート社会&DX時代のAI・IoT×ビジネスの人材育成と調査研究
スマートエスイー: 超スマート社会&DX時代のAI・IoT×ビジネスの人材育成と調査研究
 
デジタルトランスフォーメーション(DX)におけるソフトウェアの側面とダイバーシティ・インクルーシブに関する研究実践動向
デジタルトランスフォーメーション(DX)におけるソフトウェアの側面とダイバーシティ・インクルーシブに関する研究実践動向デジタルトランスフォーメーション(DX)におけるソフトウェアの側面とダイバーシティ・インクルーシブに関する研究実践動向
デジタルトランスフォーメーション(DX)におけるソフトウェアの側面とダイバーシティ・インクルーシブに関する研究実践動向
 
情報通信産業のトレンド
情報通信産業のトレンド情報通信産業のトレンド
情報通信産業のトレンド
 
AI・データ利活用継続の鍵はビジネススキル
AI・データ利活用継続の鍵はビジネススキルAI・データ利活用継続の鍵はビジネススキル
AI・データ利活用継続の鍵はビジネススキル
 
避けては通れないビッグデータ周辺の重要課題
避けては通れないビッグデータ周辺の重要課題避けては通れないビッグデータ周辺の重要課題
避けては通れないビッグデータ周辺の重要課題
 
DXを企画・実行する為の基礎知識
DXを企画・実行する為の基礎知識DXを企画・実行する為の基礎知識
DXを企画・実行する為の基礎知識
 
コニカミノルタにおけるデータドリブンPLMの取り組み
コニカミノルタにおけるデータドリブンPLMの取り組みコニカミノルタにおけるデータドリブンPLMの取り組み
コニカミノルタにおけるデータドリブンPLMの取り組み
 
Io taiプロジェクトの進め方、組織作り 20180208_ver1.02
Io taiプロジェクトの進め方、組織作り 20180208_ver1.02Io taiプロジェクトの進め方、組織作り 20180208_ver1.02
Io taiプロジェクトの進め方、組織作り 20180208_ver1.02
 
DX紹介資料
DX紹介資料DX紹介資料
DX紹介資料
 
LiBRA 09.2021 / 総集編 2/2
LiBRA 09.2021 / 総集編 2/2LiBRA 09.2021 / 総集編 2/2
LiBRA 09.2021 / 総集編 2/2
 
中小企業はAI・IoTとどう向き合うか 【TIRIクロスミーティング2021】
中小企業はAI・IoTとどう向き合うか 【TIRIクロスミーティング2021】中小企業はAI・IoTとどう向き合うか 【TIRIクロスミーティング2021】
中小企業はAI・IoTとどう向き合うか 【TIRIクロスミーティング2021】
 
日経地方創生フォーラム KDDI登壇資料
日経地方創生フォーラム KDDI登壇資料日経地方創生フォーラム KDDI登壇資料
日経地方創生フォーラム KDDI登壇資料
 
Woven Work Design concept20200520
Woven Work Design concept20200520Woven Work Design concept20200520
Woven Work Design concept20200520
 
LiBRA 05.2021 / Juku_Biz_Strategy
LiBRA 05.2021 / Juku_Biz_StrategyLiBRA 05.2021 / Juku_Biz_Strategy
LiBRA 05.2021 / Juku_Biz_Strategy
 
データサイエンティストの就労意識
データサイエンティストの就労意識データサイエンティストの就労意識
データサイエンティストの就労意識
 
Teams を活用してメッチャマルチタスクをこなす方法 - dahatake さん流 - version 1.3
Teams を活用してメッチャマルチタスクをこなす方法 - dahatake さん流 - version 1.3Teams を活用してメッチャマルチタスクをこなす方法 - dahatake さん流 - version 1.3
Teams を活用してメッチャマルチタスクをこなす方法 - dahatake さん流 - version 1.3
 
基礎から学ぶ!インダストリアルIoTの実現に必須のセンサ計測とエッジコンピューティング
基礎から学ぶ!インダストリアルIoTの実現に必須のセンサ計測とエッジコンピューティング基礎から学ぶ!インダストリアルIoTの実現に必須のセンサ計測とエッジコンピューティング
基礎から学ぶ!インダストリアルIoTの実現に必須のセンサ計測とエッジコンピューティング
 

Viewers also liked

最新業界事情から見るデータサイエンティストの「実像」
最新業界事情から見るデータサイエンティストの「実像」最新業界事情から見るデータサイエンティストの「実像」
最新業界事情から見るデータサイエンティストの「実像」
Takashi J OZAKI
 
5年後のデータサイエンティスト
5年後のデータサイエンティスト5年後のデータサイエンティスト
5年後のデータサイエンティストDrecom Co., Ltd.
 
ビッグデータ活用を加速する!分散SQLエンジン Spark SQL のご紹介 20161105 OSC Tokyo Fall
ビッグデータ活用を加速する!分散SQLエンジン Spark SQL のご紹介 20161105 OSC Tokyo Fallビッグデータ活用を加速する!分散SQLエンジン Spark SQL のご紹介 20161105 OSC Tokyo Fall
ビッグデータ活用を加速する!分散SQLエンジン Spark SQL のご紹介 20161105 OSC Tokyo Fall
YusukeKuramata
 
今注目のSpark SQL、知っておきたいその性能とは 20151209 OSC Enterprise
今注目のSpark SQL、知っておきたいその性能とは 20151209 OSC Enterprise今注目のSpark SQL、知っておきたいその性能とは 20151209 OSC Enterprise
今注目のSpark SQL、知っておきたいその性能とは 20151209 OSC EnterpriseYusukeKuramata
 
My sqlで2億件のシリアルデータと格闘した話
My sqlで2億件のシリアルデータと格闘した話My sqlで2億件のシリアルデータと格闘した話
My sqlで2億件のシリアルデータと格闘した話
saiken3110
 
10分でわかるRandom forest
10分でわかるRandom forest10分でわかるRandom forest
10分でわかるRandom forest
Yasunori Ozaki
 
Fractality of Massive Graphs: Scalable Analysis with Sketch-Based Box-Coverin...
Fractality of Massive Graphs: Scalable Analysis with Sketch-Based Box-Coverin...Fractality of Massive Graphs: Scalable Analysis with Sketch-Based Box-Coverin...
Fractality of Massive Graphs: Scalable Analysis with Sketch-Based Box-Coverin...
Kenko Nakamura
 
21世紀で最もセクシーな職業!?「データサイエンティスト」の実像に迫る
21世紀で最もセクシーな職業!?「データサイエンティスト」の実像に迫る21世紀で最もセクシーな職業!?「データサイエンティスト」の実像に迫る
21世紀で最もセクシーな職業!?「データサイエンティスト」の実像に迫る
Takashi J OZAKI
 
さらば!データサイエンティスト
さらば!データサイエンティストさらば!データサイエンティスト
さらば!データサイエンティスト
Shohei Hido
 
pythonでオフィス快適化計画
pythonでオフィス快適化計画pythonでオフィス快適化計画
pythonでオフィス快適化計画Kazufumi Ohkawa
 
NIPS Paper Reading, Data Programing
NIPS Paper Reading, Data ProgramingNIPS Paper Reading, Data Programing
NIPS Paper Reading, Data Programing
Kotaro Tanahashi
 
Bayesian Nonparametric Motor-skill Representations for Efficient Learning of ...
Bayesian Nonparametric Motor-skill Representations for Efficient Learning of ...Bayesian Nonparametric Motor-skill Representations for Efficient Learning of ...
Bayesian Nonparametric Motor-skill Representations for Efficient Learning of ...
Nishanth Koganti
 
Kaggle presentation
Kaggle presentationKaggle presentation
Kaggle presentation
HJ van Veen
 
NIPS2016 Supervised Word Mover's Distance
NIPS2016 Supervised Word Mover's DistanceNIPS2016 Supervised Word Mover's Distance
NIPS2016 Supervised Word Mover's Distance
Recruit Lifestyle Co., Ltd.
 
Jupyter NotebookとChainerで楽々Deep Learning
Jupyter NotebookとChainerで楽々Deep LearningJupyter NotebookとChainerで楽々Deep Learning
Jupyter NotebookとChainerで楽々Deep Learning
Jun-ya Norimatsu
 
データサイエンティストのつくり方
データサイエンティストのつくり方データサイエンティストのつくり方
データサイエンティストのつくり方
Shohei Hido
 
ビジネスの現場のデータ分析における理想と現実
ビジネスの現場のデータ分析における理想と現実ビジネスの現場のデータ分析における理想と現実
ビジネスの現場のデータ分析における理想と現実
Takashi J OZAKI
 
KantoCV/Selective Search for Object Recognition
KantoCV/Selective Search for Object RecognitionKantoCV/Selective Search for Object Recognition
KantoCV/Selective Search for Object Recognition
belltailjp
 
Res netと派生研究の紹介
Res netと派生研究の紹介Res netと派生研究の紹介
Res netと派生研究の紹介
masataka nishimori
 
Kaggle bosch presentation material for Kaggle Tokyo Meetup #2
Kaggle bosch presentation material for Kaggle Tokyo Meetup #2Kaggle bosch presentation material for Kaggle Tokyo Meetup #2
Kaggle bosch presentation material for Kaggle Tokyo Meetup #2
Keisuke Hosaka
 

Viewers also liked (20)

最新業界事情から見るデータサイエンティストの「実像」
最新業界事情から見るデータサイエンティストの「実像」最新業界事情から見るデータサイエンティストの「実像」
最新業界事情から見るデータサイエンティストの「実像」
 
5年後のデータサイエンティスト
5年後のデータサイエンティスト5年後のデータサイエンティスト
5年後のデータサイエンティスト
 
ビッグデータ活用を加速する!分散SQLエンジン Spark SQL のご紹介 20161105 OSC Tokyo Fall
ビッグデータ活用を加速する!分散SQLエンジン Spark SQL のご紹介 20161105 OSC Tokyo Fallビッグデータ活用を加速する!分散SQLエンジン Spark SQL のご紹介 20161105 OSC Tokyo Fall
ビッグデータ活用を加速する!分散SQLエンジン Spark SQL のご紹介 20161105 OSC Tokyo Fall
 
今注目のSpark SQL、知っておきたいその性能とは 20151209 OSC Enterprise
今注目のSpark SQL、知っておきたいその性能とは 20151209 OSC Enterprise今注目のSpark SQL、知っておきたいその性能とは 20151209 OSC Enterprise
今注目のSpark SQL、知っておきたいその性能とは 20151209 OSC Enterprise
 
My sqlで2億件のシリアルデータと格闘した話
My sqlで2億件のシリアルデータと格闘した話My sqlで2億件のシリアルデータと格闘した話
My sqlで2億件のシリアルデータと格闘した話
 
10分でわかるRandom forest
10分でわかるRandom forest10分でわかるRandom forest
10分でわかるRandom forest
 
Fractality of Massive Graphs: Scalable Analysis with Sketch-Based Box-Coverin...
Fractality of Massive Graphs: Scalable Analysis with Sketch-Based Box-Coverin...Fractality of Massive Graphs: Scalable Analysis with Sketch-Based Box-Coverin...
Fractality of Massive Graphs: Scalable Analysis with Sketch-Based Box-Coverin...
 
21世紀で最もセクシーな職業!?「データサイエンティスト」の実像に迫る
21世紀で最もセクシーな職業!?「データサイエンティスト」の実像に迫る21世紀で最もセクシーな職業!?「データサイエンティスト」の実像に迫る
21世紀で最もセクシーな職業!?「データサイエンティスト」の実像に迫る
 
さらば!データサイエンティスト
さらば!データサイエンティストさらば!データサイエンティスト
さらば!データサイエンティスト
 
pythonでオフィス快適化計画
pythonでオフィス快適化計画pythonでオフィス快適化計画
pythonでオフィス快適化計画
 
NIPS Paper Reading, Data Programing
NIPS Paper Reading, Data ProgramingNIPS Paper Reading, Data Programing
NIPS Paper Reading, Data Programing
 
Bayesian Nonparametric Motor-skill Representations for Efficient Learning of ...
Bayesian Nonparametric Motor-skill Representations for Efficient Learning of ...Bayesian Nonparametric Motor-skill Representations for Efficient Learning of ...
Bayesian Nonparametric Motor-skill Representations for Efficient Learning of ...
 
Kaggle presentation
Kaggle presentationKaggle presentation
Kaggle presentation
 
NIPS2016 Supervised Word Mover's Distance
NIPS2016 Supervised Word Mover's DistanceNIPS2016 Supervised Word Mover's Distance
NIPS2016 Supervised Word Mover's Distance
 
Jupyter NotebookとChainerで楽々Deep Learning
Jupyter NotebookとChainerで楽々Deep LearningJupyter NotebookとChainerで楽々Deep Learning
Jupyter NotebookとChainerで楽々Deep Learning
 
データサイエンティストのつくり方
データサイエンティストのつくり方データサイエンティストのつくり方
データサイエンティストのつくり方
 
ビジネスの現場のデータ分析における理想と現実
ビジネスの現場のデータ分析における理想と現実ビジネスの現場のデータ分析における理想と現実
ビジネスの現場のデータ分析における理想と現実
 
KantoCV/Selective Search for Object Recognition
KantoCV/Selective Search for Object RecognitionKantoCV/Selective Search for Object Recognition
KantoCV/Selective Search for Object Recognition
 
Res netと派生研究の紹介
Res netと派生研究の紹介Res netと派生研究の紹介
Res netと派生研究の紹介
 
Kaggle bosch presentation material for Kaggle Tokyo Meetup #2
Kaggle bosch presentation material for Kaggle Tokyo Meetup #2Kaggle bosch presentation material for Kaggle Tokyo Meetup #2
Kaggle bosch presentation material for Kaggle Tokyo Meetup #2
 

Similar to データサイエンスとデータエンジニア

S01 t3 data_engineer
S01 t3 data_engineerS01 t3 data_engineer
S01 t3 data_engineer
Takeshi Akutsu
 
Markezine day 2012 gdo nakazawa
Markezine day 2012 gdo nakazawaMarkezine day 2012 gdo nakazawa
Markezine day 2012 gdo nakazawaShinya Nakazawa
 
DXはなぜ進まないのか? 経営とITの観点からの課題と提言(NTTデータ テクノロジーカンファレンス 2020 発表資料)
DXはなぜ進まないのか? 経営とITの観点からの課題と提言(NTTデータ テクノロジーカンファレンス 2020 発表資料)DXはなぜ進まないのか? 経営とITの観点からの課題と提言(NTTデータ テクノロジーカンファレンス 2020 発表資料)
DXはなぜ進まないのか? 経営とITの観点からの課題と提言(NTTデータ テクノロジーカンファレンス 2020 発表資料)
NTT DATA Technology & Innovation
 
エンタープライズでのAI活用を支援する新世代データウェアハウスのあり方[ATTUNITY & インサイトテクノロジー IoT / Big Data フォー...
エンタープライズでのAI活用を支援する新世代データウェアハウスのあり方[ATTUNITY & インサイトテクノロジー IoT / Big Data フォー...エンタープライズでのAI活用を支援する新世代データウェアハウスのあり方[ATTUNITY & インサイトテクノロジー IoT / Big Data フォー...
エンタープライズでのAI活用を支援する新世代データウェアハウスのあり方[ATTUNITY & インサイトテクノロジー IoT / Big Data フォー...
Insight Technology, Inc.
 
中堅・中小製造業のDX推進のポイント
中堅・中小製造業のDX推進のポイント中堅・中小製造業のDX推進のポイント
中堅・中小製造業のDX推進のポイント
Naoshi Uchihira
 
20140608 interlop keynote
20140608 interlop keynote20140608 interlop keynote
20140608 interlop keynoteSORACOM, INC
 
デジタル化推進に向け、今できること(PMシンポジウム2019講演資料)
デジタル化推進に向け、今できること(PMシンポジウム2019講演資料)デジタル化推進に向け、今できること(PMシンポジウム2019講演資料)
デジタル化推進に向け、今できること(PMシンポジウム2019講演資料)
IT VALUE EXPERTS Inc.
 
HCCJP teradata final_20190906
HCCJP teradata final_20190906HCCJP teradata final_20190906
HCCJP teradata final_20190906
Masakazu Nomura
 
自己紹介にかえて-変化する企業ITと“ワクワク感” 桑原里恵
自己紹介にかえて-変化する企業ITと“ワクワク感” 桑原里恵自己紹介にかえて-変化する企業ITと“ワクワク感” 桑原里恵
自己紹介にかえて-変化する企業ITと“ワクワク感” 桑原里恵Sapporo Sparkle k.k.
 
ビッグデータのビジネスモデルとインターネット文化
ビッグデータのビジネスモデルとインターネット文化ビッグデータのビジネスモデルとインターネット文化
ビッグデータのビジネスモデルとインターネット文化
Hiroshi Takahashi
 
経営とIT:いま起こっていることと「これから」(20120718)
経営とIT:いま起こっていることと「これから」(20120718)経営とIT:いま起こっていることと「これから」(20120718)
経営とIT:いま起こっていることと「これから」(20120718)Jun Kawahara
 
深層学習モデルと統計モデルHR現場で適切だったのはどっち!?
深層学習モデルと統計モデルHR現場で適切だったのはどっち!?深層学習モデルと統計モデルHR現場で適切だったのはどっち!?
深層学習モデルと統計モデルHR現場で適切だったのはどっち!?
Deep Learning Lab(ディープラーニング・ラボ)
 
Data-Centric AIの紹介
Data-Centric AIの紹介Data-Centric AIの紹介
Data-Centric AIの紹介
Kazuyuki Miyazawa
 
なぜ数学と理系人材がビジネスの現場で必要とされるのか
なぜ数学と理系人材がビジネスの現場で必要とされるのかなぜ数学と理系人材がビジネスの現場で必要とされるのか
なぜ数学と理系人材がビジネスの現場で必要とされるのか
Hirofumi Ikeda
 
New Technology Trends and Effects on Business
New Technology Trends and Effects on BusinessNew Technology Trends and Effects on Business
New Technology Trends and Effects on Business
Rie Yamanaka
 
20220607佐賀経済同友会講演資料
20220607佐賀経済同友会講演資料20220607佐賀経済同友会講演資料
20220607佐賀経済同友会講演資料
KazuhitoKitamura
 
The New IP、そしてデータセンター自動化の未来へ
The New IP、そしてデータセンター自動化の未来へThe New IP、そしてデータセンター自動化の未来へ
The New IP、そしてデータセンター自動化の未来へ
Brocade
 
Digital marketing on AWS
Digital marketing on AWSDigital marketing on AWS
Digital marketing on AWS
Yuta Imai
 
DX人材ってなんなん、美味しいの?.pptx.pdf
DX人材ってなんなん、美味しいの?.pptx.pdfDX人材ってなんなん、美味しいの?.pptx.pdf
DX人材ってなんなん、美味しいの?.pptx.pdf
ssusera06cae
 

Similar to データサイエンスとデータエンジニア (20)

S01 t3 data_engineer
S01 t3 data_engineerS01 t3 data_engineer
S01 t3 data_engineer
 
Markezine day 2012 gdo nakazawa
Markezine day 2012 gdo nakazawaMarkezine day 2012 gdo nakazawa
Markezine day 2012 gdo nakazawa
 
DXはなぜ進まないのか? 経営とITの観点からの課題と提言(NTTデータ テクノロジーカンファレンス 2020 発表資料)
DXはなぜ進まないのか? 経営とITの観点からの課題と提言(NTTデータ テクノロジーカンファレンス 2020 発表資料)DXはなぜ進まないのか? 経営とITの観点からの課題と提言(NTTデータ テクノロジーカンファレンス 2020 発表資料)
DXはなぜ進まないのか? 経営とITの観点からの課題と提言(NTTデータ テクノロジーカンファレンス 2020 発表資料)
 
エンタープライズでのAI活用を支援する新世代データウェアハウスのあり方[ATTUNITY & インサイトテクノロジー IoT / Big Data フォー...
エンタープライズでのAI活用を支援する新世代データウェアハウスのあり方[ATTUNITY & インサイトテクノロジー IoT / Big Data フォー...エンタープライズでのAI活用を支援する新世代データウェアハウスのあり方[ATTUNITY & インサイトテクノロジー IoT / Big Data フォー...
エンタープライズでのAI活用を支援する新世代データウェアハウスのあり方[ATTUNITY & インサイトテクノロジー IoT / Big Data フォー...
 
中堅・中小製造業のDX推進のポイント
中堅・中小製造業のDX推進のポイント中堅・中小製造業のDX推進のポイント
中堅・中小製造業のDX推進のポイント
 
ビッグデータ
ビッグデータビッグデータ
ビッグデータ
 
20140608 interlop keynote
20140608 interlop keynote20140608 interlop keynote
20140608 interlop keynote
 
デジタル化推進に向け、今できること(PMシンポジウム2019講演資料)
デジタル化推進に向け、今できること(PMシンポジウム2019講演資料)デジタル化推進に向け、今できること(PMシンポジウム2019講演資料)
デジタル化推進に向け、今できること(PMシンポジウム2019講演資料)
 
HCCJP teradata final_20190906
HCCJP teradata final_20190906HCCJP teradata final_20190906
HCCJP teradata final_20190906
 
自己紹介にかえて-変化する企業ITと“ワクワク感” 桑原里恵
自己紹介にかえて-変化する企業ITと“ワクワク感” 桑原里恵自己紹介にかえて-変化する企業ITと“ワクワク感” 桑原里恵
自己紹介にかえて-変化する企業ITと“ワクワク感” 桑原里恵
 
ビッグデータのビジネスモデルとインターネット文化
ビッグデータのビジネスモデルとインターネット文化ビッグデータのビジネスモデルとインターネット文化
ビッグデータのビジネスモデルとインターネット文化
 
経営とIT:いま起こっていることと「これから」(20120718)
経営とIT:いま起こっていることと「これから」(20120718)経営とIT:いま起こっていることと「これから」(20120718)
経営とIT:いま起こっていることと「これから」(20120718)
 
深層学習モデルと統計モデルHR現場で適切だったのはどっち!?
深層学習モデルと統計モデルHR現場で適切だったのはどっち!?深層学習モデルと統計モデルHR現場で適切だったのはどっち!?
深層学習モデルと統計モデルHR現場で適切だったのはどっち!?
 
Data-Centric AIの紹介
Data-Centric AIの紹介Data-Centric AIの紹介
Data-Centric AIの紹介
 
なぜ数学と理系人材がビジネスの現場で必要とされるのか
なぜ数学と理系人材がビジネスの現場で必要とされるのかなぜ数学と理系人材がビジネスの現場で必要とされるのか
なぜ数学と理系人材がビジネスの現場で必要とされるのか
 
New Technology Trends and Effects on Business
New Technology Trends and Effects on BusinessNew Technology Trends and Effects on Business
New Technology Trends and Effects on Business
 
20220607佐賀経済同友会講演資料
20220607佐賀経済同友会講演資料20220607佐賀経済同友会講演資料
20220607佐賀経済同友会講演資料
 
The New IP、そしてデータセンター自動化の未来へ
The New IP、そしてデータセンター自動化の未来へThe New IP、そしてデータセンター自動化の未来へ
The New IP、そしてデータセンター自動化の未来へ
 
Digital marketing on AWS
Digital marketing on AWSDigital marketing on AWS
Digital marketing on AWS
 
DX人材ってなんなん、美味しいの?.pptx.pdf
DX人材ってなんなん、美味しいの?.pptx.pdfDX人材ってなんなん、美味しいの?.pptx.pdf
DX人材ってなんなん、美味しいの?.pptx.pdf
 

データサイエンスとデータエンジニア