データ+AIトレンド
7/12/2024 All Copyrightsreserved by Nissho Electronics USA Corp 6
Source: https://sloanreview.mit.edu/article/five-key-trends-in-ai-and-
data-science-for-2024/ (2024年1月9日)
o 生成AIを本番環境に導入している企業はわずか5~6%。
追加投資や組織変更、ビジネスプロセスの再設計、従業員の
スキル再習得が必要
o データの品質改善と多様なソースの統合が大きな課題であり、
半数以上の企業はデータに変更を加えていない
o データモデルの作成が自動化され、既存データセットやモデ
ルの再利用が容易になっている
2024年のAIとデータ サイエンスにおける
主要トレンド
7.
データ+AIトレンド
7/12/2024 All Copyrightsreserved by Nissho Electronics USA Corp 7
Source:
https://services.google.com/fh/files/misc/data_ai_trends_report.pdf
(2024年5月9日)
o 成果の出せるAIの実装にはデータガバナンスが特に重要
o モデルと運用データベースおよびベクトルサポートが相まっ
て、リアルタイムで高度にパーソナライズされ、コンテキス
トに関連性の高い体験を提供可能となる
o ライセンス契約の制限が時代遅れ。オープンソーステクノロ
ジーを利用する方向に経営者の視点がシフトしつつある
データとAIのトレンド 2024
Databricks概要
• カンファレンス
Data +AI Summit2024
• 期間
2024年6月10日~6月13日
• 会場
Moscone Convention Center
@サンフランシスコ
• 参加者
16,000名+
7/12/2024 All Copyrights reserved by Sojitz Tech‐Innovation 14
15.
Data&AI活用の3つの課題
7/12/2024 All Copyrightsreserved by Sojitz Tech‐Innovation 15
複雑化するデータ基盤とLakehouseの普及
セキュリティとガバナンスのプレッシャーへの対応
General IntelligenceからData Intelligenceへの移行
16.
Data&AI活用の3つの課題
7/12/2024 All Copyrightsreserved by Sojitz Tech‐Innovation 16
複雑化するデータ基盤とLakehouseの普及
セキュリティとガバナンスのプレッシャーへの対応
General IntelligenceからData Intelligenceへの移行
7/12/2024 All Copyrightsreserved by Sojitz Tech‐Innovation 19
Centralized
governance
One copy
of data
Gen AI
Data Governance
Data Science/ML
Data warehouse
ETL, Data Pipeline
Data&AI活用の3つの課題
7/12/2024 All Copyrightsreserved by Sojitz Tech‐Innovation 21
複雑化するデータ基盤とLakehouseの普及
セキュリティとガバナンスのプレッシャーへの対応
General IntelligenceからData Intelligenceへの移行
Data&AI活用の3つの課題
7/12/2024 All Copyrightsreserved by Sojitz Tech‐Innovation 27
複雑化するデータ基盤とLakehouseの普及
セキュリティとガバナンスのプレッシャーへの対応
General IntelligenceからData Intelligenceへの移行
28.
AIのモデルの精度はどんどん向上している
7/12/2024 All Copyrightsreserved by Sojitz Tech‐Innovation 28
0
100
20
40
60
80
2019 2020 2021 2022 2023
Open Source vs. Private Models, 5-Shot MMLU Performance Private Open Source
Falcon 180
LlaMA 2
Flan-T5-XXL
LlaMA
DBRX
LlaMA 3
GPT-2.1.5B
GPT-3
PaLM 540B
GPT 3.5
Claude 3
GPT-4
Flan-PaLM 2
PaLM 2
Claude 2 GPT-4o
Now
7/12/2024 All Copyrightsreserved by Nissho Electronics USA Corp 38
テキサスレンジャーズのデータ活用
成功の秘訣
• データ活用の勝利
選手の動作をトラッキングし、レコメンデーションを提供
データに基づくスカウティング戦略の実践
ファンとのリレーションシップ
• 10倍速い選手へのレポート提供
分散していたデータの統合を行い、サイロ化を解消
データ量は4倍に増加するも、インサイト提供の迅速化に成功
• データガバナンスが大きな課題
選手の機密情報(契約情報や医療記録)の管理
ユニティカタログを用いた包括的なガバナンス運用
Alexander Booth
Assistant Director of R&D
Texas Rangers Baseball Club
39.
STATCAST概要
7/12/2024 All Copyrightsreserved by Nissho Electronics USA Corp 39
参考:https://www.youtube.com/watch?v=5qZfFth2o5c
データ取得のためのカメラやレーダーがスタジアムに設置されている 取得したデータをリアルタイム解析
7/12/2024 All Copyrightsreserved by Nissho Electronics USA Corp 42
GMが立ち上げた「Data insight
Factory」とは?
• データのサイロ化と分析の効率化
データの深刻なサイロ化。毎年200人分の時間をデータ収集と
分析に費やす
15カ月前からデータインフラのクラウド化に着手。9カ月で
「Data Insight Factory」を完成させた。
• Data Insight Factoryの機能
顧客体験の向上、自動車の予知保全、安全性評価のためのデー
タを蓄積。来年には生成AIを実装予定
• 一元的な顧客ビューの実装
Amplifiesを活用したLakehouse CDPの実装
Brin Ames
Senior Manager Production AI Data
General Motors