SlideShare a Scribd company logo
1 of 18
動画生成AIによるシミュレーション動画は
物理法則を満たしているのか?
株式会社ARISE analytics
だだちゃ豆@dadacha__mame (noteアカウント名)
2024/3/10
©2023 ARISE analytics Reserved.
【第3回】 生成AIなんでもLT
会
会社紹介
©2023 ARISE analytics Reserved.
ARISE analyticsとは?
©2023 ARISE analytics Reserved. 2
• 社名
• 資本構成
• 営業開始
• 所在地
• 役員
• 社員数
: 株式会社ARISE analytics
: KDDI 85% Accenture 15%
: 2017年4月1日
: 渋谷区 渋谷2-21-2 渋谷ヒカリエ31F
: 代表取締役社長 家中 仁 / KDDI
: 137名/業務委託・派遣含め約500名
※2023年9月末
会社概要 事業領域
国内最大級350名を超えるデータサイエンティストが活躍
LT
©2023 ARISE analytics Reserved.
OpenAIによる動画生成AI Sora
©2023 ARISE analytics Reserved. 4
https://openai.com/sora より引用
2024年2月15日にOpenAI社が動画生成AI Soraを公開した。
ビジュアル品質を維持し、ユーザーのプロンプトに忠実に最大1分のビデオを
生成できる。
Prompt: Beautiful, snowy Tokyo city is bustling. The camera moves through the bustling city street,
following several people enjoying the beautiful snowy weather and shopping at nearby stalls.
Gorgeous sakura petals are flying through the wind along with snowflakes.
OpenAIによる動画生成AI Sora
©2023 ARISE analytics Reserved. 5
https://openai.com/sora より引用
以下の一文が気になった。
We’re teaching AI to understand and simulate the physical world
in motion, with the goal of training models that help people solve
problems that require real-world interaction.
私たちは、AIに物理世界の動きを理解しシミュレートすることを
教えています。その目標は、現実世界の相互作用を必要とする問
題を解決するのに役立つモデルを訓練することです。(ChatGPT
による日本語訳)
OpenAIによる動画生成AI Sora
©2023 ARISE analytics Reserved. 6
https://openai.com/sora より引用
以下の一文が気になった。
We’re teaching AI to understand and simulate the physical world
in motion, with the goal of training models that help people solve
problems that require real-world interaction.
(私たちは、AIに物理世界の動きを理解しシミュレートすることを
教えています。その目標は、現実世界の相互作用を必要とする問
題を解決するのに役立つモデルを訓練することです。)
いったい、どこまで物理世界の動きを理解できているの
か?
物理学的観点から考えてみる。
©2023 ARISE analytics Reserved. 7
図は、https://vis-tech.site/[流体]ゼロから分かるエネルギー保存の法則/ より引
用
最も基本的な物理法則として保存則がある。例えば、エネルギー保存則を考え
てみる。
形態は変われど、エネルギーは一定。
エネルギー保存則の概念図
物理学的観点から考えてみる。
©2023 ARISE analytics Reserved. 8
図は、https://vis-tech.site/[流体]ゼロから分かるエネルギー保存の法則/ より引
用
最も基本的な物理法則として保存則がある。例えば、エネルギー保存則を考え
てみる。
形態は変われど、エネルギーは一定。
エネルギー保存則の概念図
保存則が成り立つことをどう確認する?
対称性
保存則
ネーターの定理
©2023 ARISE analytics Reserved. 9
ネーターの定理から、系に連続的な対称性がある場合、対応する保存則が存在
するということが分かっている。
エネルギー保存則
運動量保存則
ネーターの定理
時間対称性
空間(並進)対称性
系に連続的な対称性がある場合、
対応する保存則が存在する。
・
・
・
・
・
・
対称性とは?
©2023 ARISE analytics Reserved. 10
対称性があるとは、時間や空間などの変化があった際に物理系の性質が変わら
ないこと。
時間対称性がある 時間対称性がない
時間対称性の例 空間対称性の例
空間対称性がある 空間対称性がない
t秒後
時間が経っても性質
は変わらない
時間が経つと車が消
える(性質が変わ
る)
どの方向に進んだとし
ても、性質は変わらな
い
特定方向に進むと、車が消
える(系の性質が変わる)
ある方向に進
む
ある方向に進
む
t秒後
対称性とは?
©2023 ARISE analytics Reserved. 11
対称性があるとは、時間や空間などの変化があった際に物理系の性質が変わら
ないこと。
対称性がある 対称性がない
時間対称性の例 空間対称性の例
対称性がある 対称性がない
t秒後 t秒後
時間が経っても性質
は変わらない。
時間が経つと車が消
える(性質が変わ
る)
どの方向に進んだとし
ても、性質は変わらな
い。
特定方向に進むと、車が消
える(系の性質が変わる)
「時空間の対称性がある」 = 「時空間の変化に対して一貫性がある」 動画 は、
基本的な物理法則であるエネルギー保存則と運動量保存則が成り立っているので
は?
定量的な評価を行っている事例 (概要)
©2023 ARISE analytics Reserved. 12
※ https://arxiv.org/abs/2402.17403
AIが生成した動画を3Dモデル化した上で幾何学的な類似度を評価することで、
定量的な評価を行う研究※が行われている。
AIが生成した動画 3Dモデル化 幾何学的な類似度を評価
概要
定量的な評価 (実験設定)
©2023 ARISE analytics Reserved. 13
図は https://arxiv.org/abs/2402.17403 より引用
同一プロンプトにより生成した動画を、5つの評価指標で評価している。
評価対象
同一プロンプトを用いて3つのAIでそれぞれ動画生
成
評価指標
num_pts
num_inliers_F
keep_ratio
mse
mean_err
指標 概要
初期マッチングポイントの総
数
フィルタリング後に保持され
たマッチングポイントの総数
上記の比率
幾何学的距離の平均誤差
幾何学的距離の平均二乗平方
根誤差
定量的な評価 (結果)
©2023 ARISE analytics Reserved. 14
図は、https://arxiv.org/abs/2402.17403 より引用
Soraが幾何学的な一貫性において、驚異的な性能を示している。
定性的な評価 (うまくいってそうな例)
©2023 ARISE analytics Reserved. 15
https://openai.com/sora より引用
時空間の変化に対する一貫性があり、物理法則が成り立っていそう。
定性的な評価 (うまくいってなさそうな例)
©2023 ARISE analytics Reserved. 16
https://twitter.com/sama/status/1758219575882301608 より引用
スプーンが現れたり消えたりしており、物理法則が破綻していそう。
まとめ
©2023 ARISE analytics Reserved. 17
• 物理学的な観点から動画生成AIの性能を確認した。
• Soraは物理学的な観点からも、驚異的な性能を持つAIだということが改
めて分かった。
• だたし、Soraであっても複雑な条件下では物理法則が破綻してしまって
いる事例も見られた。
• 個人的に、
• 重力加速度は一定か?など、別の物理学的な観点からも検証したい。
• 今後の動画生成AIの発展に期待したい。

More Related Content

Similar to 【第3回生成AIなんでもLT会資料】_動画生成AIと物理法則_v0.2.pptx

[よくわかるクラウドデータベース] Amazon RDS for SQL Server導入事例
[よくわかるクラウドデータベース] Amazon RDS for SQL Server導入事例[よくわかるクラウドデータベース] Amazon RDS for SQL Server導入事例
[よくわかるクラウドデータベース] Amazon RDS for SQL Server導入事例Amazon Web Services Japan
 
オープンソースがエンドユーザーイニシアティブをもたらす!? — 「シラサギ」使ったらこんなこともあんなことも —
オープンソースがエンドユーザーイニシアティブをもたらす!? — 「シラサギ」使ったらこんなこともあんなことも —オープンソースがエンドユーザーイニシアティブをもたらす!? — 「シラサギ」使ったらこんなこともあんなことも —
オープンソースがエンドユーザーイニシアティブをもたらす!? — 「シラサギ」使ったらこんなこともあんなことも —Open Source Software Association of Japan
 
絶対に押さえたい!ITSMツール導入・活用の勘所 - 第18回itSMF Japan Conference講演資料(IT VALUE EXPERTS)
絶対に押さえたい!ITSMツール導入・活用の勘所 - 第18回itSMF Japan Conference講演資料(IT VALUE EXPERTS)絶対に押さえたい!ITSMツール導入・活用の勘所 - 第18回itSMF Japan Conference講演資料(IT VALUE EXPERTS)
絶対に押さえたい!ITSMツール導入・活用の勘所 - 第18回itSMF Japan Conference講演資料(IT VALUE EXPERTS)IT VALUE EXPERTS Inc.
 
Chainerで知るdeep learning進化の歴史
Chainerで知るdeep learning進化の歴史Chainerで知るdeep learning進化の歴史
Chainerで知るdeep learning進化の歴史Hideto Masuoka
 
JPC2017 [D1-1] MS HoloLens と MS Azure で実現する製造業における経営の意思決定変革
JPC2017 [D1-1] MS HoloLens と MS Azure で実現する製造業における経営の意思決定変革JPC2017 [D1-1] MS HoloLens と MS Azure で実現する製造業における経営の意思決定変革
JPC2017 [D1-1] MS HoloLens と MS Azure で実現する製造業における経営の意思決定変革MPN Japan
 
SHIRASAGI Introduction OSC nagoya 2016
SHIRASAGI Introduction OSC nagoya 2016SHIRASAGI Introduction OSC nagoya 2016
SHIRASAGI Introduction OSC nagoya 2016Naokazu Nohara
 
【シーイーシー】サービス紹介
【シーイーシー】サービス紹介【シーイーシー】サービス紹介
【シーイーシー】サービス紹介ncwg
 
TUIゲームを作った話
TUIゲームを作った話TUIゲームを作った話
TUIゲームを作った話Shinji Miyazato
 
Customer Supportのご紹介_アディッシュ株式会社
Customer Supportのご紹介_アディッシュ株式会社Customer Supportのご紹介_アディッシュ株式会社
Customer Supportのご紹介_アディッシュ株式会社アディッシュ株式会社
 
データサイエンティストってどこへ行ったのか???
データサイエンティストってどこへ行ったのか???データサイエンティストってどこへ行ったのか???
データサイエンティストってどこへ行ったのか???Izumi Akiyama
 
Jawsug asakai27 kanako_kodera
Jawsug asakai27 kanako_koderaJawsug asakai27 kanako_kodera
Jawsug asakai27 kanako_koderaKanako Kodera
 
採用用_会社紹介資料_230612
採用用_会社紹介資料_230612採用用_会社紹介資料_230612
採用用_会社紹介資料_230612aidiot oshima
 
シラサギ紹介osc京都
シラサギ紹介osc京都シラサギ紹介osc京都
シラサギ紹介osc京都Naokazu Nohara
 
基幹系システム基盤としてのIBM Bluemix - 避けて通れない高可用性の実現
基幹系システム基盤としてのIBM Bluemix - 避けて通れない高可用性の実現基幹系システム基盤としてのIBM Bluemix - 避けて通れない高可用性の実現
基幹系システム基盤としてのIBM Bluemix - 避けて通れない高可用性の実現BMXUG
 
祝★AWSスタンダードコンサルティングパートナーに認定されました
祝★AWSスタンダードコンサルティングパートナーに認定されました祝★AWSスタンダードコンサルティングパートナーに認定されました
祝★AWSスタンダードコンサルティングパートナーに認定されましたCore Concept Technologies
 
5W1Hで考えるCCoE.pptx
5W1Hで考えるCCoE.pptx5W1Hで考えるCCoE.pptx
5W1Hで考えるCCoE.pptxTomoaki Tada
 
シラサギ紹介20170525
シラサギ紹介20170525シラサギ紹介20170525
シラサギ紹介20170525Naokazu Nohara
 
HCCソフト 2024新卒 会社説明会
HCCソフト 2024新卒 会社説明会HCCソフト 2024新卒 会社説明会
HCCソフト 2024新卒 会社説明会JiiMoya
 

Similar to 【第3回生成AIなんでもLT会資料】_動画生成AIと物理法則_v0.2.pptx (20)

[よくわかるクラウドデータベース] Amazon RDS for SQL Server導入事例
[よくわかるクラウドデータベース] Amazon RDS for SQL Server導入事例[よくわかるクラウドデータベース] Amazon RDS for SQL Server導入事例
[よくわかるクラウドデータベース] Amazon RDS for SQL Server導入事例
 
オープンソースがエンドユーザーイニシアティブをもたらす!? — 「シラサギ」使ったらこんなこともあんなことも —
オープンソースがエンドユーザーイニシアティブをもたらす!? — 「シラサギ」使ったらこんなこともあんなことも —オープンソースがエンドユーザーイニシアティブをもたらす!? — 「シラサギ」使ったらこんなこともあんなことも —
オープンソースがエンドユーザーイニシアティブをもたらす!? — 「シラサギ」使ったらこんなこともあんなことも —
 
絶対に押さえたい!ITSMツール導入・活用の勘所 - 第18回itSMF Japan Conference講演資料(IT VALUE EXPERTS)
絶対に押さえたい!ITSMツール導入・活用の勘所 - 第18回itSMF Japan Conference講演資料(IT VALUE EXPERTS)絶対に押さえたい!ITSMツール導入・活用の勘所 - 第18回itSMF Japan Conference講演資料(IT VALUE EXPERTS)
絶対に押さえたい!ITSMツール導入・活用の勘所 - 第18回itSMF Japan Conference講演資料(IT VALUE EXPERTS)
 
Chainerで知るdeep learning進化の歴史
Chainerで知るdeep learning進化の歴史Chainerで知るdeep learning進化の歴史
Chainerで知るdeep learning進化の歴史
 
JPC2017 [D1-1] MS HoloLens と MS Azure で実現する製造業における経営の意思決定変革
JPC2017 [D1-1] MS HoloLens と MS Azure で実現する製造業における経営の意思決定変革JPC2017 [D1-1] MS HoloLens と MS Azure で実現する製造業における経営の意思決定変革
JPC2017 [D1-1] MS HoloLens と MS Azure で実現する製造業における経営の意思決定変革
 
SHIRASAGI Introduction OSC nagoya 2016
SHIRASAGI Introduction OSC nagoya 2016SHIRASAGI Introduction OSC nagoya 2016
SHIRASAGI Introduction OSC nagoya 2016
 
【シーイーシー】サービス紹介
【シーイーシー】サービス紹介【シーイーシー】サービス紹介
【シーイーシー】サービス紹介
 
OSC Chiba 2017
OSC Chiba 2017OSC Chiba 2017
OSC Chiba 2017
 
TUIゲームを作った話
TUIゲームを作った話TUIゲームを作った話
TUIゲームを作った話
 
Customer Supportのご紹介_アディッシュ株式会社
Customer Supportのご紹介_アディッシュ株式会社Customer Supportのご紹介_アディッシュ株式会社
Customer Supportのご紹介_アディッシュ株式会社
 
データサイエンティストってどこへ行ったのか???
データサイエンティストってどこへ行ったのか???データサイエンティストってどこへ行ったのか???
データサイエンティストってどこへ行ったのか???
 
Jawsug asakai27 kanako_kodera
Jawsug asakai27 kanako_koderaJawsug asakai27 kanako_kodera
Jawsug asakai27 kanako_kodera
 
採用用_会社紹介資料_230612
採用用_会社紹介資料_230612採用用_会社紹介資料_230612
採用用_会社紹介資料_230612
 
シラサギ紹介osc京都
シラサギ紹介osc京都シラサギ紹介osc京都
シラサギ紹介osc京都
 
基幹系システム基盤としてのIBM Bluemix - 避けて通れない高可用性の実現
基幹系システム基盤としてのIBM Bluemix - 避けて通れない高可用性の実現基幹系システム基盤としてのIBM Bluemix - 避けて通れない高可用性の実現
基幹系システム基盤としてのIBM Bluemix - 避けて通れない高可用性の実現
 
祝★AWSスタンダードコンサルティングパートナーに認定されました
祝★AWSスタンダードコンサルティングパートナーに認定されました祝★AWSスタンダードコンサルティングパートナーに認定されました
祝★AWSスタンダードコンサルティングパートナーに認定されました
 
5W1Hで考えるCCoE.pptx
5W1Hで考えるCCoE.pptx5W1Hで考えるCCoE.pptx
5W1Hで考えるCCoE.pptx
 
シラサギ紹介20170525
シラサギ紹介20170525シラサギ紹介20170525
シラサギ紹介20170525
 
HCCソフト 2024新卒 会社説明会
HCCソフト 2024新卒 会社説明会HCCソフト 2024新卒 会社説明会
HCCソフト 2024新卒 会社説明会
 
メテオサーチチャレンジ報告 (2位解法)
メテオサーチチャレンジ報告 (2位解法)メテオサーチチャレンジ報告 (2位解法)
メテオサーチチャレンジ報告 (2位解法)
 

More from ARISE analytics

【第3回】生成AIなんでもLT会 2024_0304なんでも生成AI_sergicalsix.pptx
【第3回】生成AIなんでもLT会 2024_0304なんでも生成AI_sergicalsix.pptx【第3回】生成AIなんでもLT会 2024_0304なんでも生成AI_sergicalsix.pptx
【第3回】生成AIなんでもLT会 2024_0304なんでも生成AI_sergicalsix.pptxARISE analytics
 
めんどうな環境構築とはおさらば!Dockerの概要と使い方
めんどうな環境構築とはおさらば!Dockerの概要と使い方めんどうな環境構築とはおさらば!Dockerの概要と使い方
めんどうな環境構築とはおさらば!Dockerの概要と使い方ARISE analytics
 
【論文レベルで理解しよう!】​ 欠測値処理編​
【論文レベルで理解しよう!】​ 欠測値処理編​【論文レベルで理解しよう!】​ 欠測値処理編​
【論文レベルで理解しよう!】​ 欠測値処理編​ARISE analytics
 
【論文レベルで理解しよう!】​ 大規模言語モデル(LLM)編​
【論文レベルで理解しよう!】​ 大規模言語モデル(LLM)編​【論文レベルで理解しよう!】​ 大規模言語モデル(LLM)編​
【論文レベルで理解しよう!】​ 大規模言語モデル(LLM)編​ARISE analytics
 
【論文読み会】Signing at Scale: Learning to Co-Articulate Signs for Large-Scale Pho...
【論文読み会】Signing at Scale: Learning to Co-Articulate  Signs for Large-Scale Pho...【論文読み会】Signing at Scale: Learning to Co-Articulate  Signs for Large-Scale Pho...
【論文読み会】Signing at Scale: Learning to Co-Articulate Signs for Large-Scale Pho...ARISE analytics
 
Hierarchical Metadata-Aware Document Categorization under Weak Supervision​ (...
Hierarchical Metadata-Aware Document Categorization under Weak Supervision​ (...Hierarchical Metadata-Aware Document Categorization under Weak Supervision​ (...
Hierarchical Metadata-Aware Document Categorization under Weak Supervision​ (...ARISE analytics
 
教師なしGNNによるIoTデバイスの異常通信検知の検討
教師なしGNNによるIoTデバイスの異常通信検知の検討教師なしGNNによるIoTデバイスの異常通信検知の検討
教師なしGNNによるIoTデバイスの異常通信検知の検討ARISE analytics
 
【論文読み会】Pyraformer_Low-Complexity Pyramidal Attention for Long-Range Time Seri...
【論文読み会】Pyraformer_Low-Complexity Pyramidal Attention for Long-Range Time Seri...【論文読み会】Pyraformer_Low-Complexity Pyramidal Attention for Long-Range Time Seri...
【論文読み会】Pyraformer_Low-Complexity Pyramidal Attention for Long-Range Time Seri...ARISE analytics
 
【論文読み会】Analytic-DPM_an Analytic Estimate of the Optimal Reverse Variance in D...
【論文読み会】Analytic-DPM_an Analytic Estimate of the Optimal Reverse Variance in D...【論文読み会】Analytic-DPM_an Analytic Estimate of the Optimal Reverse Variance in D...
【論文読み会】Analytic-DPM_an Analytic Estimate of the Optimal Reverse Variance in D...ARISE analytics
 
【論文読み会】Autoregressive Diffusion Models.pptx
【論文読み会】Autoregressive Diffusion Models.pptx【論文読み会】Autoregressive Diffusion Models.pptx
【論文読み会】Autoregressive Diffusion Models.pptxARISE analytics
 
【論文読み会】BEiT_BERT Pre-Training of Image Transformers.pptx
【論文読み会】BEiT_BERT Pre-Training of Image Transformers.pptx【論文読み会】BEiT_BERT Pre-Training of Image Transformers.pptx
【論文読み会】BEiT_BERT Pre-Training of Image Transformers.pptxARISE analytics
 
【論文読み会】PiCO_Contrastive Label Disambiguation for Partial Label Learning.pptx
【論文読み会】PiCO_Contrastive Label Disambiguation for Partial Label Learning.pptx【論文読み会】PiCO_Contrastive Label Disambiguation for Partial Label Learning.pptx
【論文読み会】PiCO_Contrastive Label Disambiguation for Partial Label Learning.pptxARISE analytics
 
【論文読み会】Deep Reinforcement Learning at the Edge of the Statistical Precipice
【論文読み会】Deep Reinforcement Learning at the Edge of the Statistical Precipice【論文読み会】Deep Reinforcement Learning at the Edge of the Statistical Precipice
【論文読み会】Deep Reinforcement Learning at the Edge of the Statistical PrecipiceARISE analytics
 
【論文読み会】Alias-Free Generative Adversarial Networks(StyleGAN3)
【論文読み会】Alias-Free Generative Adversarial Networks(StyleGAN3)【論文読み会】Alias-Free Generative Adversarial Networks(StyleGAN3)
【論文読み会】Alias-Free Generative Adversarial Networks(StyleGAN3)ARISE analytics
 
【論文読み会】On the Expressivity of Markov Reward
【論文読み会】On the Expressivity of Markov Reward【論文読み会】On the Expressivity of Markov Reward
【論文読み会】On the Expressivity of Markov RewardARISE analytics
 
【論文読み会】MAUVE: Measuring the Gap Between Neural Text and Human Text using Dive...
【論文読み会】MAUVE: Measuring the Gap Between Neural Text and Human Text using Dive...【論文読み会】MAUVE: Measuring the Gap Between Neural Text and Human Text using Dive...
【論文読み会】MAUVE: Measuring the Gap Between Neural Text and Human Text using Dive...ARISE analytics
 
【論文読み会】Moser Flow: Divergence-based Generative Modeling on Manifolds
【論文読み会】Moser Flow: Divergence-based Generative Modeling on Manifolds【論文読み会】Moser Flow: Divergence-based Generative Modeling on Manifolds
【論文読み会】Moser Flow: Divergence-based Generative Modeling on ManifoldsARISE analytics
 
Counterfaual Machine Learning(CFML)のサーベイ
Counterfaual Machine Learning(CFML)のサーベイCounterfaual Machine Learning(CFML)のサーベイ
Counterfaual Machine Learning(CFML)のサーベイARISE analytics
 
【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features
【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features
【論文読み会】Deep Clustering for Unsupervised Learning of Visual FeaturesARISE analytics
 
【論文読み会】Self-Attention Generative Adversarial Networks
【論文読み会】Self-Attention Generative  Adversarial Networks【論文読み会】Self-Attention Generative  Adversarial Networks
【論文読み会】Self-Attention Generative Adversarial NetworksARISE analytics
 

More from ARISE analytics (20)

【第3回】生成AIなんでもLT会 2024_0304なんでも生成AI_sergicalsix.pptx
【第3回】生成AIなんでもLT会 2024_0304なんでも生成AI_sergicalsix.pptx【第3回】生成AIなんでもLT会 2024_0304なんでも生成AI_sergicalsix.pptx
【第3回】生成AIなんでもLT会 2024_0304なんでも生成AI_sergicalsix.pptx
 
めんどうな環境構築とはおさらば!Dockerの概要と使い方
めんどうな環境構築とはおさらば!Dockerの概要と使い方めんどうな環境構築とはおさらば!Dockerの概要と使い方
めんどうな環境構築とはおさらば!Dockerの概要と使い方
 
【論文レベルで理解しよう!】​ 欠測値処理編​
【論文レベルで理解しよう!】​ 欠測値処理編​【論文レベルで理解しよう!】​ 欠測値処理編​
【論文レベルで理解しよう!】​ 欠測値処理編​
 
【論文レベルで理解しよう!】​ 大規模言語モデル(LLM)編​
【論文レベルで理解しよう!】​ 大規模言語モデル(LLM)編​【論文レベルで理解しよう!】​ 大規模言語モデル(LLM)編​
【論文レベルで理解しよう!】​ 大規模言語モデル(LLM)編​
 
【論文読み会】Signing at Scale: Learning to Co-Articulate Signs for Large-Scale Pho...
【論文読み会】Signing at Scale: Learning to Co-Articulate  Signs for Large-Scale Pho...【論文読み会】Signing at Scale: Learning to Co-Articulate  Signs for Large-Scale Pho...
【論文読み会】Signing at Scale: Learning to Co-Articulate Signs for Large-Scale Pho...
 
Hierarchical Metadata-Aware Document Categorization under Weak Supervision​ (...
Hierarchical Metadata-Aware Document Categorization under Weak Supervision​ (...Hierarchical Metadata-Aware Document Categorization under Weak Supervision​ (...
Hierarchical Metadata-Aware Document Categorization under Weak Supervision​ (...
 
教師なしGNNによるIoTデバイスの異常通信検知の検討
教師なしGNNによるIoTデバイスの異常通信検知の検討教師なしGNNによるIoTデバイスの異常通信検知の検討
教師なしGNNによるIoTデバイスの異常通信検知の検討
 
【論文読み会】Pyraformer_Low-Complexity Pyramidal Attention for Long-Range Time Seri...
【論文読み会】Pyraformer_Low-Complexity Pyramidal Attention for Long-Range Time Seri...【論文読み会】Pyraformer_Low-Complexity Pyramidal Attention for Long-Range Time Seri...
【論文読み会】Pyraformer_Low-Complexity Pyramidal Attention for Long-Range Time Seri...
 
【論文読み会】Analytic-DPM_an Analytic Estimate of the Optimal Reverse Variance in D...
【論文読み会】Analytic-DPM_an Analytic Estimate of the Optimal Reverse Variance in D...【論文読み会】Analytic-DPM_an Analytic Estimate of the Optimal Reverse Variance in D...
【論文読み会】Analytic-DPM_an Analytic Estimate of the Optimal Reverse Variance in D...
 
【論文読み会】Autoregressive Diffusion Models.pptx
【論文読み会】Autoregressive Diffusion Models.pptx【論文読み会】Autoregressive Diffusion Models.pptx
【論文読み会】Autoregressive Diffusion Models.pptx
 
【論文読み会】BEiT_BERT Pre-Training of Image Transformers.pptx
【論文読み会】BEiT_BERT Pre-Training of Image Transformers.pptx【論文読み会】BEiT_BERT Pre-Training of Image Transformers.pptx
【論文読み会】BEiT_BERT Pre-Training of Image Transformers.pptx
 
【論文読み会】PiCO_Contrastive Label Disambiguation for Partial Label Learning.pptx
【論文読み会】PiCO_Contrastive Label Disambiguation for Partial Label Learning.pptx【論文読み会】PiCO_Contrastive Label Disambiguation for Partial Label Learning.pptx
【論文読み会】PiCO_Contrastive Label Disambiguation for Partial Label Learning.pptx
 
【論文読み会】Deep Reinforcement Learning at the Edge of the Statistical Precipice
【論文読み会】Deep Reinforcement Learning at the Edge of the Statistical Precipice【論文読み会】Deep Reinforcement Learning at the Edge of the Statistical Precipice
【論文読み会】Deep Reinforcement Learning at the Edge of the Statistical Precipice
 
【論文読み会】Alias-Free Generative Adversarial Networks(StyleGAN3)
【論文読み会】Alias-Free Generative Adversarial Networks(StyleGAN3)【論文読み会】Alias-Free Generative Adversarial Networks(StyleGAN3)
【論文読み会】Alias-Free Generative Adversarial Networks(StyleGAN3)
 
【論文読み会】On the Expressivity of Markov Reward
【論文読み会】On the Expressivity of Markov Reward【論文読み会】On the Expressivity of Markov Reward
【論文読み会】On the Expressivity of Markov Reward
 
【論文読み会】MAUVE: Measuring the Gap Between Neural Text and Human Text using Dive...
【論文読み会】MAUVE: Measuring the Gap Between Neural Text and Human Text using Dive...【論文読み会】MAUVE: Measuring the Gap Between Neural Text and Human Text using Dive...
【論文読み会】MAUVE: Measuring the Gap Between Neural Text and Human Text using Dive...
 
【論文読み会】Moser Flow: Divergence-based Generative Modeling on Manifolds
【論文読み会】Moser Flow: Divergence-based Generative Modeling on Manifolds【論文読み会】Moser Flow: Divergence-based Generative Modeling on Manifolds
【論文読み会】Moser Flow: Divergence-based Generative Modeling on Manifolds
 
Counterfaual Machine Learning(CFML)のサーベイ
Counterfaual Machine Learning(CFML)のサーベイCounterfaual Machine Learning(CFML)のサーベイ
Counterfaual Machine Learning(CFML)のサーベイ
 
【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features
【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features
【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features
 
【論文読み会】Self-Attention Generative Adversarial Networks
【論文読み会】Self-Attention Generative  Adversarial Networks【論文読み会】Self-Attention Generative  Adversarial Networks
【論文読み会】Self-Attention Generative Adversarial Networks
 

Recently uploaded

自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineerYuki Kikuchi
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...Toru Tamaki
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)Hiroki Ichikura
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案sugiuralab
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)UEHARA, Tetsutaro
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Yuma Ohgami
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfFumieNakayama
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A surveyToru Tamaki
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...博三 太田
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdftaisei2219
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfFumieNakayama
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?akihisamiyanaga1
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNetToru Tamaki
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものですiPride Co., Ltd.
 

Recently uploaded (14)

自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
 

【第3回生成AIなんでもLT会資料】_動画生成AIと物理法則_v0.2.pptx

  • 3. ARISE analyticsとは? ©2023 ARISE analytics Reserved. 2 • 社名 • 資本構成 • 営業開始 • 所在地 • 役員 • 社員数 : 株式会社ARISE analytics : KDDI 85% Accenture 15% : 2017年4月1日 : 渋谷区 渋谷2-21-2 渋谷ヒカリエ31F : 代表取締役社長 家中 仁 / KDDI : 137名/業務委託・派遣含め約500名 ※2023年9月末 会社概要 事業領域 国内最大級350名を超えるデータサイエンティストが活躍
  • 5. OpenAIによる動画生成AI Sora ©2023 ARISE analytics Reserved. 4 https://openai.com/sora より引用 2024年2月15日にOpenAI社が動画生成AI Soraを公開した。 ビジュアル品質を維持し、ユーザーのプロンプトに忠実に最大1分のビデオを 生成できる。 Prompt: Beautiful, snowy Tokyo city is bustling. The camera moves through the bustling city street, following several people enjoying the beautiful snowy weather and shopping at nearby stalls. Gorgeous sakura petals are flying through the wind along with snowflakes.
  • 6. OpenAIによる動画生成AI Sora ©2023 ARISE analytics Reserved. 5 https://openai.com/sora より引用 以下の一文が気になった。 We’re teaching AI to understand and simulate the physical world in motion, with the goal of training models that help people solve problems that require real-world interaction. 私たちは、AIに物理世界の動きを理解しシミュレートすることを 教えています。その目標は、現実世界の相互作用を必要とする問 題を解決するのに役立つモデルを訓練することです。(ChatGPT による日本語訳)
  • 7. OpenAIによる動画生成AI Sora ©2023 ARISE analytics Reserved. 6 https://openai.com/sora より引用 以下の一文が気になった。 We’re teaching AI to understand and simulate the physical world in motion, with the goal of training models that help people solve problems that require real-world interaction. (私たちは、AIに物理世界の動きを理解しシミュレートすることを 教えています。その目標は、現実世界の相互作用を必要とする問 題を解決するのに役立つモデルを訓練することです。) いったい、どこまで物理世界の動きを理解できているの か?
  • 8. 物理学的観点から考えてみる。 ©2023 ARISE analytics Reserved. 7 図は、https://vis-tech.site/[流体]ゼロから分かるエネルギー保存の法則/ より引 用 最も基本的な物理法則として保存則がある。例えば、エネルギー保存則を考え てみる。 形態は変われど、エネルギーは一定。 エネルギー保存則の概念図
  • 9. 物理学的観点から考えてみる。 ©2023 ARISE analytics Reserved. 8 図は、https://vis-tech.site/[流体]ゼロから分かるエネルギー保存の法則/ より引 用 最も基本的な物理法則として保存則がある。例えば、エネルギー保存則を考え てみる。 形態は変われど、エネルギーは一定。 エネルギー保存則の概念図 保存則が成り立つことをどう確認する?
  • 10. 対称性 保存則 ネーターの定理 ©2023 ARISE analytics Reserved. 9 ネーターの定理から、系に連続的な対称性がある場合、対応する保存則が存在 するということが分かっている。 エネルギー保存則 運動量保存則 ネーターの定理 時間対称性 空間(並進)対称性 系に連続的な対称性がある場合、 対応する保存則が存在する。 ・ ・ ・ ・ ・ ・
  • 11. 対称性とは? ©2023 ARISE analytics Reserved. 10 対称性があるとは、時間や空間などの変化があった際に物理系の性質が変わら ないこと。 時間対称性がある 時間対称性がない 時間対称性の例 空間対称性の例 空間対称性がある 空間対称性がない t秒後 時間が経っても性質 は変わらない 時間が経つと車が消 える(性質が変わ る) どの方向に進んだとし ても、性質は変わらな い 特定方向に進むと、車が消 える(系の性質が変わる) ある方向に進 む ある方向に進 む t秒後
  • 12. 対称性とは? ©2023 ARISE analytics Reserved. 11 対称性があるとは、時間や空間などの変化があった際に物理系の性質が変わら ないこと。 対称性がある 対称性がない 時間対称性の例 空間対称性の例 対称性がある 対称性がない t秒後 t秒後 時間が経っても性質 は変わらない。 時間が経つと車が消 える(性質が変わ る) どの方向に進んだとし ても、性質は変わらな い。 特定方向に進むと、車が消 える(系の性質が変わる) 「時空間の対称性がある」 = 「時空間の変化に対して一貫性がある」 動画 は、 基本的な物理法則であるエネルギー保存則と運動量保存則が成り立っているので は?
  • 13. 定量的な評価を行っている事例 (概要) ©2023 ARISE analytics Reserved. 12 ※ https://arxiv.org/abs/2402.17403 AIが生成した動画を3Dモデル化した上で幾何学的な類似度を評価することで、 定量的な評価を行う研究※が行われている。 AIが生成した動画 3Dモデル化 幾何学的な類似度を評価 概要
  • 14. 定量的な評価 (実験設定) ©2023 ARISE analytics Reserved. 13 図は https://arxiv.org/abs/2402.17403 より引用 同一プロンプトにより生成した動画を、5つの評価指標で評価している。 評価対象 同一プロンプトを用いて3つのAIでそれぞれ動画生 成 評価指標 num_pts num_inliers_F keep_ratio mse mean_err 指標 概要 初期マッチングポイントの総 数 フィルタリング後に保持され たマッチングポイントの総数 上記の比率 幾何学的距離の平均誤差 幾何学的距離の平均二乗平方 根誤差
  • 15. 定量的な評価 (結果) ©2023 ARISE analytics Reserved. 14 図は、https://arxiv.org/abs/2402.17403 より引用 Soraが幾何学的な一貫性において、驚異的な性能を示している。
  • 16. 定性的な評価 (うまくいってそうな例) ©2023 ARISE analytics Reserved. 15 https://openai.com/sora より引用 時空間の変化に対する一貫性があり、物理法則が成り立っていそう。
  • 17. 定性的な評価 (うまくいってなさそうな例) ©2023 ARISE analytics Reserved. 16 https://twitter.com/sama/status/1758219575882301608 より引用 スプーンが現れたり消えたりしており、物理法則が破綻していそう。
  • 18. まとめ ©2023 ARISE analytics Reserved. 17 • 物理学的な観点から動画生成AIの性能を確認した。 • Soraは物理学的な観点からも、驚異的な性能を持つAIだということが改 めて分かった。 • だたし、Soraであっても複雑な条件下では物理法則が破綻してしまって いる事例も見られた。 • 個人的に、 • 重力加速度は一定か?など、別の物理学的な観点からも検証したい。 • 今後の動画生成AIの発展に期待したい。