SlideShare a Scribd company logo
1 of 45
Download to read offline
Volumetric Video配信での
視聴者仮想空間位置情報を
応用したデータ削減の一検討
NTT ネットワーク基盤研究所 趙笑添, 奥山隆文
Copyright 2020 NTT CORPORATION
目次
○ Volumetric Videoとは
○ Volumetric Videoの紹介とユースケース
○ Volumetric Video制作技術
○ Volumetric Videoデータと特性
○ Volumetric Videoの再生技術
○ Volumetric Video配信へ <NWプラットフォームとして>
○ 提案:視聴者情報を用いたデータ削減手法
○ 提案手法定量評価
○ まとめ
3
Copyright 2020 NTT CORPORATION
Volumetric Videoとは
4
Copyright 2020 NTT CORPORATION
より臨場感のある映像体験へ
⚫ 臨場感の高いメディアへの追求
⚫ Volumetric Videoは新しい高臨場コンテンツ
⚫ 空間の中に入り自由視点での視聴体験が可能(6DoF)
6DoF視聴
自由視点,自由空間移動
A B
3DoF視聴
頭の回転,空間位置固定
A
モノクロ カラー 高画質カラー 360°
Volumetric
Video
0DoF視聴
視点固定
A
?
5
Copyright 2020 NTT CORPORATION
より臨場感のある映像体験へ
A
固定視界
固定地点・固定視界
での視聴
A
0DoF視聴
360°自由視界
固定地点から頭を動かし、
360度自由視界での視聴
完全自由視界
自由視界,自由空間移動
移動と視界に制限がない
3DoF視聴
A
A'
A’’
6DoF視聴
6
Volumetric Video で可能になること
好きなCG環境
配信V.V.映像
CG空間の中でV.V.映像を見る。
動き回る。
Volumetric Video再生例 Data from https://www.crescentinc.co.jp/
Volumetric Videoの利用シーン
8
会議・チャット
スポーツ ドラマ コンサート
Source: http://volumetric-video.com/volumetric-video-calls-using-ef-eve-live-streaming/, https://www.youtube.com/watch?v=Ho_8UvrAvNs, https://www.youtube.com/watch?v=DkOKrVV3SS0, https://www.youtube.com/watch?v=aeE7NledoXI
Volumetric Videoは、6自由度での高臨場体験
既存のエンターテインメントだけでなく、
将来の人と人の交流手段の一つになりうる
Volumetric Videoの市場動向
各業界がVolumetric Videoに注目
⚫ 通信キャリア業界(AT&T, Verizon等)
⚫ クラウドサービス業界(Google, Microsoft, Facebook等)
⚫ デバイス業界(Intel, Sony, HTC, MagicLeap等)
市場規模は14億ドルであり、2025年には4倍以上の58億ドルになると見込まれる
今後Volumetric Video は広く使われるコンテンツに成長する可能性
9
Holoportation
(Microsoft) 市場規模の地域ごとの変化予測
AT&T Shape の展示
(AT&T)
2025年に
4倍増加
https://youtu.be/VXKHB9vT_4o, https://youtu.be/7d59O6cfaM0,https://www.marketsandmarkets.com/Market-Reports/volumetric-video-market-259585041.html
NTTの取り組み
10
NTTコミュニケーションズ
○ 仮想現実ソリューションを展開
○ NTT Communications Forum 2018
Volumetric Videoの演劇、音楽ライブ、ア
トラクション分野への応用提案
Volumetric Videoでの狂言
Source: http://indytimeline.com/?p=122787, https://xr.docomo.ne.jp/event_case/case29/, https://www.nttdocomo.co.jp/info/news_release/2021/01/21_01.html
NTTドコモ
○ XRを使ったサービス開始
○ XRデバイスでのインタラクティブ展示
○ Volumetric Video撮影スタジオの提供
○ Docomo Open House2021
Volumetric Videoストリーミング配信を展示
ドコモXRスタジオ
(Volumetric Video 撮影スタジオ)
ドコモ×国立科学博物館
XRで楽しむ未来の展示
VRバトミントン
(Volumetric Video)
11
Copyright 2020 NTT CORPORATION
Volumetric Video撮影から再生まで
Volumetric Videoの撮影から
AR/VRデバイスで再生には、具体的に5ステップある。
撮影 V.V.データ生成
3D
レンダリング
Display表示
V.V.データ
保存・読み込み
12
Copyright 2020 NTT CORPORATION
V.V.の撮影
Volumetric Videoの撮影は、被写体を取り囲む多方向のカメラを配置することが必要。
撮影のカメラはRGBカメラ、Depthカメラの組み合わせで制作される。
Volumetric VideoのDepthカメラは、以下の手法がある。
⚫ Stereo:Intel RealSense, Stereolab ZED2など
両眼カメラを用い、右左目のピクセルの画素位置の差から物体距離を算出
⚫ Time of Flight (ToF):Microsoft Azure Kinect, LiDARなど
LED,IRやLaser光を照射し、物体で反射し戻ってくるまでの時間を計測することで距離を算出
RGB-D例:
Microsoft Azure Kinect
大規模V.V. 全方位撮影スタジオ例
IR(近赤外線)
照射モジュー
ル
IR受信カメラ
RGBカメラ
ステレオカメラ ToF方式カメラ
https://youtu.be/jJglCYFiodI, https://www.kudan.io/archives/517, https://www.crescentinc.co.jp/studio/4dviews/p_top/
Copyright 2020 NTT CORPORATION
V.V.のデータ生成
RGB-Dセンサーでの撮影後、以下のパイプラインで3D点群および3Dメッシュが生成
撮影
深度
推定
複数カメラ
深度データ合成
3D
点群
サーフェス
再構築
3D
メッシュ
ポアソンサーフェス再構築手法
https://youtu.be/jJglCYFiodI, https://www.kudan.io/archives/517,https://www.sony.jp/professional/inter-bee/2020/solution_xr-freeviewpoint/,
https://doc.cgal.org/latest/Poisson_surface_reconstruction_3/index.html
Copyright 2020 NTT CORPORATION
V.V.制作スタジオ
商用大規模スタジオ
⚫ 4D Views HOLOSYS
⚫ 8i ASPX
⚫ Microsoft Mixed Reality Capture Studio
⚫ Sony<非公開>
⚫ Canon <非公開>
既存のコンテンツ制作スタジオソリューションは、
DIYセットアップスタジオ
⚫ EF EVE (商用)
⚫ VCL3D/VolumetricCapture (Open Source)
4DViews システム VCL3D/VolumetricCapture システム
SONY システム
https://www.crescentinc.co.jp/studio/4dviews/p_top/, https://www.sony.jp/professional/inter-bee/2020/solution_xr-freeviewpoint/,
https://github.com/VCL3D/VolumetricCapture
Copyright 2020 NTT CORPORATION
V.V.の3Dデータ
○ Wavefront Obj (.obj)
text/plain形式, 1frame/file
CG映画の3Dアニメーション向けに開発
○ GL Transmission Format (.gltf, .glb)
jsonまたはbin形式, 1frame/file
Webのやり取り、表示を前提に開発
○ Alembic (.abc)
bin形式, 複数frames/file
CG映画の3Dアニメーション向けに開発
画像形式
○ Portable Network Graphics(.png)
○ JPEG
動画形式
○ MP4
3Dメッシュデータ テクスチャーデータ
Copyright 2020 NTT CORPORATION
V.V. 3Dメッシュデータ量
[1] (E. Zerman, C. Ozcinar, P. Gao, A. Smolic. “Textured mesh vs coloured point cloud: A subjective study for volumetric video compression.” Twelfth International
Conference on Quality of Multimedia Experience (QoMEX), Athlone, Ireland, May 2020.)
V.V. Data = Mesh + Texture
3.1 MB 0.9 MB
4 MB/frame
0
2
4
6
8
10
HD TV 4K TV 4K 360° 1 Volumetric
Video
2 Volumetric
Video
Data
Size
[Gbps]
非圧縮時のデータ量(2D動画はInterlaceありの場合)[2]
○Time Varying Mesh :1フレームごとに新しいデータ
○1 Volumetric Video再生に4Gbps回線
1フレームのV.V.3Dメッシュデータ量(.obj + .jpg)
Copyright 2020 NTT CORPORATION
3Dレンダリング
伝送された3Dモデルを他の3Dオブジェクトと合わせて、ディスプレイで表示するために2Dに変換をする
レンダリングで主に使われる手法は、
○ Rasterization
視界から見える3Dオブジェクトの色情報をそのまま2Dで反映
処理コストが少ない、リアルタイムで生成できる。
利用先:リアルタイム処理のゲームなどが多い。
○ Ray tracing
視界に届く光線を逆にたどることで、光の反射、屈折、光沢の表現ができる。
処理コストと時間は、大幅に多いが、現実と区別がつかないほどの写実感を実現。
利用先:映画、CG画像、(リアルタイムゲームでも技術的に可能となりつつある)
https://www.scratchapixel.com/lessons/3d-basic-rendering/rasterization-practical-implementation,
https://architizer.com/blog/practice/details/see-how-ikea-3d-models-the-rooms-in-their-catalogs/
IKEAのカタログ画像(CG制作)
Ray Tracing
Rasterization Method
Copyright 2020 NTT CORPORATION
再生
レンダリング・ゲームエンジン
空間位置、
頭の動き
2D視界映像
https://www.nttdocomo.co.jp/product/magicleap1/images/thumb_magicleap1.png,https://images-na.ssl-
images-amazon.com/images/I/61HhqOJILOL._AC_SX522_.jpg, https://www.playstation.com/ja-jp/ps-vr/,
https://images-na.ssl-images-amazon.com/images/I/51qWjFuAShL._AC_SX425_.jpg
Volumetric Videoおよび3Dメッシュデータの再生には、代表的に以下のツールがある。
これらが、VR・MRデバイスから空間位置、頭の動きを受け取り、3Dレンダリングを行い、2D映像
をデバイスに伝送する。
⚫ Unreal Engine
商用ゲーム開発ソフト
⚫ Unity
商用ゲーム開発ソフト
⚫ Blender
OpenSource
3D編集ソフト
⚫ WebXR
OpenSource
Webブラウザ上でのVRコンテンツの基盤API
19
Copyright 2020 NTT CORPORATION
Volumetric Videoの配信へ
NWプラットフォームとして
20
Copyright 2020 NTT CORPORATION
ゴール|配信NWプラットフォームの実現
NW Platform
Contents
Provider
User A
User B
高臨場体感の配信
を実現
双方向コミュニ
ケーションの実現
⚫ コンテンツプロバイダー
⇒当配信NWプラットフォームの利用で,配信システム構築コストを削減
⚫ 配信NWプラットフォーム
⇒視聴者の高臨場体感を実現
⇒視聴者同士が配信コンテンツを見ながら,コミュニケーション可能な双方向通信を実現
⚫ 視聴者
⇒FTTH・5Gのアクセス回線(100~1000Mbps)でもVolumetric Videoの高臨場視聴
⇒他視聴者とVolumetric Videoでコミュニケーション
配信NWプラットフォームとして配信することで効率的配信を実現
21
Copyright 2020 NTT CORPORATION
V.V.配信プラットフォーム
Volumetric Videoの配信手法には、
① サーバーレンダリング方式
クライアントから視界情報を受け取り、リアルタイムにサーバーでレンダリング
生成レンダリング2D映像をクライアントに伝送
② クライアントレンダリング方式
3Dメッシュデータをクライアントに伝送、クライアントのPCでレンダリング
そのままではデータが大きいため、圧縮後伝送されることが多い
22
Copyright 2020 NTT CORPORATION
既存のV.V.配信プラットフォーム
既存のV.V.配信は、
① サーバーレンダリング方式
毎ユーザーごとにレンダリング,高い遅延要件のものには向かない (VRの
全体処理許容遅延20ms達成が難しい) ,サーバー負担大
⇒同時使用者数とNWの帯域変動が視界映像全体に影響
② クライアントレンダリング方式
3Dデータ直接配信 [Orts-E. et al. (Holoportation)]
⇒再生に4Gbps必要,消費者向けの配信での適用が難しい
3Dデータ全体のLevel Of Detailの帯域に応じたデータ削減[Holostream]
⇒コンテンツ全体の品質低下により体感品質に影響
Gül, S., et al (Fraunhofer HHI )
Holoportation (Microsoft) Holostream (arcturus)
高品質 低品質
[Gül, S., et al]Gül, S., et al, (2020). Low-latency cloud-
based volumetric video streaming using head
motion prediction. NOSSDAV 2020 - Proceedings
of the 2020 Workshop on Network and Operating
System Support for Digital Audio and Video
[Orts-E. et al. ]Orts-Escolano, et al. (2016).
Holoportation: Virtual 3D teleportation in real-time.
UIST 2016 - Proceedings of the 29th Annual
Symposium on User Interface Software and
Technology, UIST ’16, 741–754
[Holostream]https://arcturus.studio/holostream
23
Copyright 2020 NTT CORPORATION
既存のV.V.配信プラットフォームでの課題
既存のクライアント配信手法では、
圧縮を用いているが,ユーザーからの情報をほとんど使われていない。
Client
NW Server/Edge Server
Contents Provider
最適に圧縮した3Dメッシュデータ
+テクスチャー
圧縮処理
②
???
ユーザーからの情報をより有効的に活用したデータ圧縮手法
があるのではないか?
24
Copyright 2020 NTT CORPORATION
提案:
視聴者仮想空間位置情報による
データ削減手法
Volumetric Video再生例 Data from https://www.crescentinc.co.jp/
26
Copyright 2020 NTT CORPORATION
27
Copyright 2020 NTT CORPORATION
提案手法の概要
◯ 視聴時,3Dデータは全面3Dである必要はない
再生時,常に一面のみの3D映像が見え,背面は視聴者から見えない
◯ Volumetric Videoの再生データの背面部は視聴に影響なく削減できる可能性
⇒4ステップの提案手法
◯ 視聴者の空間位置情報から、リアルタイムにサーバーで配信一面3Dデータを作成
◯ 一面3Dデータであるため、通常の半分のデータ量で送信が可能
3D空間
位置取得
V.V.視聴範囲の
選択
データ圧縮
リアルタイム
一面3Dデータ
生成
28
Copyright 2020 NTT CORPORATION
3D空間位置取得・V.V.視聴範囲の選択
○VRデバイスから、視聴者の仮想空間上での位置と頭の向きを取得
○視界にある3Dメッシュデータの内、視聴範囲内の頂点を選択
○インバースを取り、3Dメッシュの背面頂点を選択
視聴者とV.V.の位置関係 視界面選択 視界外選択
視聴者視点での
選択メッシュ範囲
29
Copyright 2020 NTT CORPORATION
リアルタイム一面3Dデータ生成
○ 選択された視聴者視界背面の頂点を削除
○ 視聴者の位置が変更した場合は、リアルタイムに新しい位置に基づいた背面頂点削除
元データ(削減前) 提案手法
視聴者と一面3Dデータの位置関係 視聴者視点での
一面3Dデータ 一面3Dデータを斜めから見た様子
30
Copyright 2020 NTT CORPORATION
Step4 データ圧縮
提案手法に圧縮手法[draco]を組み合わせて一面データをさらに圧縮
◯ データ量の更なる削減
◯ サーバー側のエンコード時間短縮
◯ クライアント側のディコード時間短縮
V.V. Data
Original 提案手法
提案手法
+圧縮
Z [MB]
エンコード時間の短縮のイメージ
Encoding
従来手法 X [ms]
提案手法 X-c [ms]
ディコード時間の短縮のイメージ
Decoding
■元データ ■提案手法 ■提案手法圧縮
全体データ量削減圧縮のイメージ
.obj
010
101
.obj
010
101
従来手法 Y [ms]
提案手法 Y-d [ms]
Z/a [MB] Z/b [MB]
31
Copyright 2020 NTT CORPORATION
配信NWプラットフォーム
提案手法は配信NWプラットフォーム(PF)として組み込まれ,Volumetric Video配信に適用
⚫ コンテンツプロバイダー:
当配信NWプラットフォームへダークファイバーや10G FTTH回線で大容量Volumetric Videoを伝送
⚫ NWサーバー・エッジサーバー:
視聴者情報に基づいて一面3Dデータをリアルタイム生成し、伝送
⚫ 視聴者:
FTTH・5G 回線でVolumetric Video(V.V.)を高品質V.V.の複数同時視聴
32
Copyright 2020 NTT CORPORATION
評価実験
33
Copyright 2020 NTT CORPORATION
実験概要
○ 目的:
立体空間位置に基づいたリアルタイムデータ削減手法の効果と品質を調べる
○ データセット:
[Zerman]のmattisデータの1フレーム
○ 実験CG環境:
左右前方にポイントライト配置
カメラ位置は対象Volumetric Videoの頭と同じ高さ
Mattis [Zerman]
[Zerman](E. Zerman, C. Ozcinar, P. Gao, A. Smolic. “Textured mesh vs coloured point cloud: A subjective study for volumetric video
compression.” Twelfth International Conference on Quality of Multimedia Experience (QoMEX), Athlone, Ireland, May 2020.)
実験CG環境の構成
0
500
1000
1500
2000
2500
3000
3500
Original -135 -90 -45 0 45 90 135 180
Data
size
[KB]
Angle [degree]
データ削減量
◯ 対象データに対し,視聴者視点8つを想定
◯ それぞれのカメラ位置から提案手法(背面頂点削除)を適用
◯ 元データと比べ平均57%データ量が削減
平均 57% 削減
34
提案手法を8方位で適用後のデータ量
Volumetric Video データ分割での8カメラ方位
0° 45°
90°
-45°
135°
180°
-135°
-90°
35
Copyright 2020 NTT CORPORATION
品質劣化評価
○視聴者が移動を行い、それに対応する一面3Dデータが遅れて到達した場合を想定
○元データと一面3Dデータを−20°~ + 20°の10°ずつレンダリング
一面3D
データ
Z X
Y
20°
0°
-10°
36
Copyright 2020 NTT CORPORATION
定性評価
~一面V.V.の他角度からの視聴~
0° 10° 20°
-20° -10°
37
Copyright 2020 NTT CORPORATION
定性評価
○削除された背面頂点との輪郭部がギザギザ、
不連続である
○近接視聴時には品質劣化があると感じてしまう
○10°以上ずれた視点での一面3Dデータは、
品質劣化が大きい
-20° -10°
38
Copyright 2020 NTT CORPORATION
定量評価
元データの同一角度映像との差分を2つの品質評価手法で比較
◯画素単位比較 Mean Square Error(MSE)
◯構造単位比較 Structure Similarity(SSIM)
⇒5°ずれた視点での視聴でも画素単位に品質劣化が見られる。
値:0~1
最高品質時:1
値: 0~
最高品質時:0
0.964
0.966
0.968
0.97
0.972
0.974
0.976
0.978
0.98
0.982
-20 -15 -10 -5 0 5 10 15 20
0
20
40
60
80
100
120
140
160
180
SSIM
Angle [degree]
MSE
■MSE■SSIM
5°を超えると
品質の劣化が
見られる
構造上変化は
感じにくい。
39
Copyright 2020 NTT CORPORATION
圧縮によるデータ削減効果
提案データ削減手法と圧縮を組み合わせで得られるデータ量縮小効果を調べる
⚫ 実験環境:
CPU: i7-10750H, メモリー: 32GBのPC, 圧縮手法[draco]を使用
⚫ 圧縮前元データ比較:
提案手法は元データに対して
低圧縮時に98.0%削減, 高圧縮時に98.9%削減
[draco] https://google.github.io/draco/
3101
1608
60 34
0
500
1000
1500
2000
2500
3000
3500
Original Proposed
Reduction
Low Comp. High Comp.
Data
Size
[KB]
3101
108 61
0
500
1000
1500
2000
2500
3000
3500
Original Low Comp. High Comp.
Data
Size
[KB]
提案手法(提案削減手法+従来手法[draco])
96.5%減
98.0%減
98.0%減
98.9%減
48.1%減
従来手法[draco]
40
Copyright 2020 NTT CORPORATION
*Lower is Better
圧縮によるデータ削減効果
圧縮後のデータ量比較:
⚫ 低圧縮時は,元データ圧縮後と比べ55.5%のデータ削減(108KB⇒31KB)
⚫ 高圧縮時は,元データ圧縮後と比べ55.7%のデータ削減(61KB⇒22KB)
3103
1608
0
500
1000
1500
2000
2500
3000
3500
Original Proposed
Size
[KB]
108
60
0
20
40
60
80
100
120
Original Proposed
Size
[KB]
61
34
0
10
20
30
40
50
60
70
Original Proposed
Size[KB]
51.8% 削減 55.5% 削減 55.7% 削減
圧縮前データ量
元データ/提案手法
低圧縮後データ量
元データ/提案手法
高圧縮後データ量
元データ/提案手法
圧縮
41
Copyright 2020 NTT CORPORATION
エンコード・ディコード時間の削減
*Lower is Better
高圧縮時処理時間(元データ/提案手法)
12
53
25
81
0 20 40 60 80 100
Decoding time
Encoding time
Time [ms]
Original Proposed
0.36
1.59
0.75
2.43
0 0.5 1 1.5 2 2.5 3
Decoding
Encoding
Time [s]
Original Proposed
28ms 減
13ms 減
0.84s 減
0.39s 減
1秒(30FPS)
1フレーム
低圧縮時処理時間(元データ/提案手法)
4
11
6
19
0 5 10 15 20
Decoding
Encoding
time[ms]
Original Proposed
8ms 減
2ms 減
1フレーム
0.12
0.33
0.18
0.57
0 0.1 0.2 0.3 0.4 0.5 0.6
Decoding
Encoding
time[ms]
Original Proposed
0.24s 減
0.06s 減
1秒(30FPS)
⚫ 提案手法でのデータは,圧縮時のエンコード・ディコード時間を短縮
⚫ 低圧縮時サーバーでのエンコード負担を最大8ms(42%)軽減
⚫ 低圧縮時クライアントでのディコード時間を2ms(33%)軽減
42
Copyright 2020 NTT CORPORATION
考察
提案データ削減手法は,
○ 品質を維持したままVolumetric Videoデータを
➢ 非圧縮時:平均57%削減
➢ 圧縮時でも55%削減
○ 圧縮エンコード,ディコード時間:30%以上短縮
これによりトータルの処理時間を削減できる可能性あり
今後の検討
○ ユーザー数ごとのサーバーでリアルタイム一面データ生成が必要となるため、
サーバー処理負担大きく、手法の改善が今後必要
○ 背面頂点削除手法は、背面と接続する輪郭部がギザギザしており、手法の改善が今後必要。
○ 背面頂点削除にかかる計算コストと時間は、今後調査が必要。
43
Copyright 2020 NTT CORPORATION
考察(NW観点)
NW回線で必要となる通信帯域
30FPSのコンテンツ時:
⚫ 非圧縮伝送
800Mbps回線必要⇒400Mbps回線でVolumetric Videoのメッシュ伝送が可能に
(テクスチャーは+240Mb/s必要、圧縮比率などによりさらにデータ縮小可能)⇒今後検証
⚫ 低圧縮伝送
30Mbps回線必要⇒20Mbps回線でVolumetric Videoのメッシュ伝送が可能に
エンコード・ディコード遅延があり、Volumetric Video配信と双方向コミュニケーションにおいて
全処理遅延150ms以下[3GPP]を満たせるかは高性能MECなどを使用し今後検証
エンコード時間(1秒当たり)
Data size [MB/frame] [Mb/s](30fps) [MB/frame] [Mb/s](30fps)
Before comp. 3.103 744.72 1.608 385.92
Low comp. 0.108 25.92 0.06 14.4
High comp. 0.061 14.64 0.034 8.16
元データ 提案データ削減後
Decoding time [ms] 30fps [ms] 30fps
Before comp. NONE NONE
Low comp. 0.18 0.12
High comp. 0.75 0.36
Encoding time [ms] 30fps [ms] 30fps
Before comp. NONE NONE
Low comp. 1.35 0.33
High comp. 2.34 1.59
ディコード時間(1秒当たり)
[3GPP]3GPP. (2020). 3rd Generation Partnership Project; Technical Specification Group Services and
System Aspects; Extended Reality (XR) in 5G. 0(Release 16). http://www.3gpp.org
データ量・必要伝送帯域
44
Copyright 2020 NTT CORPORATION
まとめ
この発表では、
○ Volumetric Videoの技術背景
○ 視聴者情報に基づいた配信データ削減圧縮手法の提案
⇒ 従来の57%のデータ量でVolumetric Videoの配信が可能であることを示した
今後は、
○ サーバー負荷が少ないデータ削減手法の検討
○ 消費者にはアクセス回線でスポーツや番組などのV.V.配信とユーザー間の交流会議サービスへの技術展開
ビジネス会議
スポーツ 番組
Source: http://volumetric-video.com/volumetric-video-calls-using-ef-eve-live-streaming/, https://www.youtube.com/watch?v=Ho_8UvrAvNs, https://www.youtube.com/watch?v=DkOKrVV3SS0
将来のVolumetric Videoサービス展開
Your Value Partner

More Related Content

What's hot

Project DAFTY 20140710 Tokyo MotionControl Network
Project DAFTY  20140710 Tokyo MotionControl NetworkProject DAFTY  20140710 Tokyo MotionControl Network
Project DAFTY 20140710 Tokyo MotionControl NetworkSatoshi Maemoto
 
エヌビディアが加速するディープラーニング~進化するニューラルネットワークとその開発方法について~
エヌビディアが加速するディープラーニング~進化するニューラルネットワークとその開発方法について~エヌビディアが加速するディープラーニング~進化するニューラルネットワークとその開発方法について~
エヌビディアが加速するディープラーニング~進化するニューラルネットワークとその開発方法について~NVIDIA Japan
 
2020年10月29日 Jetson Nano 2GBで始めるAI x Robotics教育
2020年10月29日 Jetson Nano 2GBで始めるAI x Robotics教育2020年10月29日 Jetson Nano 2GBで始めるAI x Robotics教育
2020年10月29日 Jetson Nano 2GBで始めるAI x Robotics教育NVIDIA Japan
 
DeNA TechCon2019 How to implement live streaming client using Unity
DeNA TechCon2019 How to implement live streaming client using UnityDeNA TechCon2019 How to implement live streaming client using Unity
DeNA TechCon2019 How to implement live streaming client using UnityTakeyuki Ogura
 
CDNとCDSPビジネスの動向と展望
CDNとCDSPビジネスの動向と展望CDNとCDSPビジネスの動向と展望
CDNとCDSPビジネスの動向と展望Masaaki Nabeshima
 
GPU クラウド コンピューティング
GPU クラウド コンピューティングGPU クラウド コンピューティング
GPU クラウド コンピューティングNVIDIA Japan
 

What's hot (10)

Kinect for Windows v2
Kinect for Windows v2Kinect for Windows v2
Kinect for Windows v2
 
Project DAFTY 20140710 Tokyo MotionControl Network
Project DAFTY  20140710 Tokyo MotionControl NetworkProject DAFTY  20140710 Tokyo MotionControl Network
Project DAFTY 20140710 Tokyo MotionControl Network
 
What is unity
What is unityWhat is unity
What is unity
 
エヌビディアが加速するディープラーニング~進化するニューラルネットワークとその開発方法について~
エヌビディアが加速するディープラーニング~進化するニューラルネットワークとその開発方法について~エヌビディアが加速するディープラーニング~進化するニューラルネットワークとその開発方法について~
エヌビディアが加速するディープラーニング~進化するニューラルネットワークとその開発方法について~
 
2020年10月29日 Jetson Nano 2GBで始めるAI x Robotics教育
2020年10月29日 Jetson Nano 2GBで始めるAI x Robotics教育2020年10月29日 Jetson Nano 2GBで始めるAI x Robotics教育
2020年10月29日 Jetson Nano 2GBで始めるAI x Robotics教育
 
DeNA TechCon2019 How to implement live streaming client using Unity
DeNA TechCon2019 How to implement live streaming client using UnityDeNA TechCon2019 How to implement live streaming client using Unity
DeNA TechCon2019 How to implement live streaming client using Unity
 
CDNとCDSPビジネスの動向と展望
CDNとCDSPビジネスの動向と展望CDNとCDSPビジネスの動向と展望
CDNとCDSPビジネスの動向と展望
 
Jetson 活用による スタートアップ企業支援
Jetson 活用による スタートアップ企業支援Jetson 活用による スタートアップ企業支援
Jetson 活用による スタートアップ企業支援
 
GPU クラウド コンピューティング
GPU クラウド コンピューティングGPU クラウド コンピューティング
GPU クラウド コンピューティング
 
Kinect
KinectKinect
Kinect
 

Similar to Volumetric video streaming data reduction using viewer's virtual 3D position

WebRTC入門+最新動向
WebRTC入門+最新動向WebRTC入門+最新動向
WebRTC入門+最新動向Ryosuke Otsuya
 
Azure Media Services 概要
Azure Media Services 概要Azure Media Services 概要
Azure Media Services 概要Daiyu Hatakeyama
 
ABEMA の視聴品質向上戦術
ABEMA の視聴品質向上戦術ABEMA の視聴品質向上戦術
ABEMA の視聴品質向上戦術Yusuke Goto
 
3Dリッチコンテンツビジネス活用のご提案ver3.1
3Dリッチコンテンツビジネス活用のご提案ver3.13Dリッチコンテンツビジネス活用のご提案ver3.1
3Dリッチコンテンツビジネス活用のご提案ver3.1ITDORAKU
 
Azure Media Services 大全
Azure Media Services 大全Azure Media Services 大全
Azure Media Services 大全Daiyu Hatakeyama
 
はじめてのKinect for windows v2
はじめてのKinect for windows v2はじめてのKinect for windows v2
はじめてのKinect for windows v2Kaoru NAKAMURA
 
ウェアラブルデバイスとモーションセンサーの融合
ウェアラブルデバイスとモーションセンサーの融合ウェアラブルデバイスとモーションセンサーの融合
ウェアラブルデバイスとモーションセンサーの融合Kaoru NAKAMURA
 
BitVisor Summit 3 「BitVisorの現状と今後」
BitVisor Summit 3 「BitVisorの現状と今後」BitVisor Summit 3 「BitVisorの現状と今後」
BitVisor Summit 3 「BitVisorの現状と今後」Takahiro Shinagawa
 
Vtuberのイベント出演を効率化する技術ワークフロー
Vtuberのイベント出演を効率化する技術ワークフローVtuberのイベント出演を効率化する技術ワークフロー
Vtuberのイベント出演を効率化する技術ワークフローVirtualCast, Inc.
 
VRライブ・コミュニケーションサービス「バーチャルキャスト」でのモノビットエンジンの採用事例と最新情報 - モノビットエンジン - GTMF 2018 O...
VRライブ・コミュニケーションサービス「バーチャルキャスト」でのモノビットエンジンの採用事例と最新情報 - モノビットエンジン - GTMF 2018 O...VRライブ・コミュニケーションサービス「バーチャルキャスト」でのモノビットエンジンの採用事例と最新情報 - モノビットエンジン - GTMF 2018 O...
VRライブ・コミュニケーションサービス「バーチャルキャスト」でのモノビットエンジンの採用事例と最新情報 - モノビットエンジン - GTMF 2018 O...Game Tools & Middleware Forum
 
革新的ブラウザゲームを支えるプラットフォーム技術
革新的ブラウザゲームを支えるプラットフォーム技術革新的ブラウザゲームを支えるプラットフォーム技術
革新的ブラウザゲームを支えるプラットフォーム技術Toru Yamaguchi
 
3Dリッチコンテンツビジネス活用のご提案ver3.1
3Dリッチコンテンツビジネス活用のご提案ver3.13Dリッチコンテンツビジネス活用のご提案ver3.1
3Dリッチコンテンツビジネス活用のご提案ver3.1ITDORAKU
 
3Dリッチコンテンツビジネス活用のご提案ver3.1
3Dリッチコンテンツビジネス活用のご提案ver3.13Dリッチコンテンツビジネス活用のご提案ver3.1
3Dリッチコンテンツビジネス活用のご提案ver3.1CRI Japan, Inc.
 
devsumi2012 17-D-1 Kinectで創る10年後のカタチ
devsumi2012 17-D-1 Kinectで創る10年後のカタチdevsumi2012 17-D-1 Kinectで創る10年後のカタチ
devsumi2012 17-D-1 Kinectで創る10年後のカタチKaoru NAKAMURA
 
VRライブ・コミュニケーションサービス「バーチャルキャスト」でのモノビットエンジンの採用事例と最新情報
VRライブ・コミュニケーションサービス「バーチャルキャスト」でのモノビットエンジンの採用事例と最新情報VRライブ・コミュニケーションサービス「バーチャルキャスト」でのモノビットエンジンの採用事例と最新情報
VRライブ・コミュニケーションサービス「バーチャルキャスト」でのモノビットエンジンの採用事例と最新情報モノビット エンジン
 

Similar to Volumetric video streaming data reduction using viewer's virtual 3D position (20)

WebRTCで動かす“テレイグジスタンス”ロボット
WebRTCで動かす“テレイグジスタンス”ロボットWebRTCで動かす“テレイグジスタンス”ロボット
WebRTCで動かす“テレイグジスタンス”ロボット
 
WebRTC入門+最新動向
WebRTC入門+最新動向WebRTC入門+最新動向
WebRTC入門+最新動向
 
Azure Media Services 概要
Azure Media Services 概要Azure Media Services 概要
Azure Media Services 概要
 
ABEMA の視聴品質向上戦術
ABEMA の視聴品質向上戦術ABEMA の視聴品質向上戦術
ABEMA の視聴品質向上戦術
 
3Dリッチコンテンツビジネス活用のご提案ver3.1
3Dリッチコンテンツビジネス活用のご提案ver3.13Dリッチコンテンツビジネス活用のご提案ver3.1
3Dリッチコンテンツビジネス活用のご提案ver3.1
 
Azure Media Services 大全
Azure Media Services 大全Azure Media Services 大全
Azure Media Services 大全
 
USTREAM(ユーストリーム)配信セミナー
USTREAM(ユーストリーム)配信セミナーUSTREAM(ユーストリーム)配信セミナー
USTREAM(ユーストリーム)配信セミナー
 
はじめてのKinect for windows v2
はじめてのKinect for windows v2はじめてのKinect for windows v2
はじめてのKinect for windows v2
 
ウェアラブルデバイスとモーションセンサーの融合
ウェアラブルデバイスとモーションセンサーの融合ウェアラブルデバイスとモーションセンサーの融合
ウェアラブルデバイスとモーションセンサーの融合
 
BitVisor Summit 3 「BitVisorの現状と今後」
BitVisor Summit 3 「BitVisorの現状と今後」BitVisor Summit 3 「BitVisorの現状と今後」
BitVisor Summit 3 「BitVisorの現状と今後」
 
Vtuberのイベント出演を効率化する技術ワークフロー
Vtuberのイベント出演を効率化する技術ワークフローVtuberのイベント出演を効率化する技術ワークフロー
Vtuberのイベント出演を効率化する技術ワークフロー
 
VRライブ・コミュニケーションサービス「バーチャルキャスト」でのモノビットエンジンの採用事例と最新情報 - モノビットエンジン - GTMF 2018 O...
VRライブ・コミュニケーションサービス「バーチャルキャスト」でのモノビットエンジンの採用事例と最新情報 - モノビットエンジン - GTMF 2018 O...VRライブ・コミュニケーションサービス「バーチャルキャスト」でのモノビットエンジンの採用事例と最新情報 - モノビットエンジン - GTMF 2018 O...
VRライブ・コミュニケーションサービス「バーチャルキャスト」でのモノビットエンジンの採用事例と最新情報 - モノビットエンジン - GTMF 2018 O...
 
Azure IoT Edge入門
Azure IoT Edge入門Azure IoT Edge入門
Azure IoT Edge入門
 
Cloud, why not?
Cloud, why not?Cloud, why not?
Cloud, why not?
 
革新的ブラウザゲームを支えるプラットフォーム技術
革新的ブラウザゲームを支えるプラットフォーム技術革新的ブラウザゲームを支えるプラットフォーム技術
革新的ブラウザゲームを支えるプラットフォーム技術
 
3Dリッチコンテンツビジネス活用のご提案ver3.1
3Dリッチコンテンツビジネス活用のご提案ver3.13Dリッチコンテンツビジネス活用のご提案ver3.1
3Dリッチコンテンツビジネス活用のご提案ver3.1
 
3Dリッチコンテンツビジネス活用のご提案ver3.1
3Dリッチコンテンツビジネス活用のご提案ver3.13Dリッチコンテンツビジネス活用のご提案ver3.1
3Dリッチコンテンツビジネス活用のご提案ver3.1
 
WebRTC の紹介
WebRTC の紹介WebRTC の紹介
WebRTC の紹介
 
devsumi2012 17-D-1 Kinectで創る10年後のカタチ
devsumi2012 17-D-1 Kinectで創る10年後のカタチdevsumi2012 17-D-1 Kinectで創る10年後のカタチ
devsumi2012 17-D-1 Kinectで創る10年後のカタチ
 
VRライブ・コミュニケーションサービス「バーチャルキャスト」でのモノビットエンジンの採用事例と最新情報
VRライブ・コミュニケーションサービス「バーチャルキャスト」でのモノビットエンジンの採用事例と最新情報VRライブ・コミュニケーションサービス「バーチャルキャスト」でのモノビットエンジンの採用事例と最新情報
VRライブ・コミュニケーションサービス「バーチャルキャスト」でのモノビットエンジンの採用事例と最新情報
 

Recently uploaded

SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものですiPride Co., Ltd.
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)UEHARA, Tetsutaro
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...博三 太田
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineerYuki Kikuchi
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfFumieNakayama
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfFumieNakayama
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案sugiuralab
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)Hiroki Ichikura
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?akihisamiyanaga1
 

Recently uploaded (9)

SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
 

Volumetric video streaming data reduction using viewer's virtual 3D position

  • 2. Copyright 2020 NTT CORPORATION 目次 ○ Volumetric Videoとは ○ Volumetric Videoの紹介とユースケース ○ Volumetric Video制作技術 ○ Volumetric Videoデータと特性 ○ Volumetric Videoの再生技術 ○ Volumetric Video配信へ <NWプラットフォームとして> ○ 提案:視聴者情報を用いたデータ削減手法 ○ 提案手法定量評価 ○ まとめ
  • 3. 3 Copyright 2020 NTT CORPORATION Volumetric Videoとは
  • 4. 4 Copyright 2020 NTT CORPORATION より臨場感のある映像体験へ ⚫ 臨場感の高いメディアへの追求 ⚫ Volumetric Videoは新しい高臨場コンテンツ ⚫ 空間の中に入り自由視点での視聴体験が可能(6DoF) 6DoF視聴 自由視点,自由空間移動 A B 3DoF視聴 頭の回転,空間位置固定 A モノクロ カラー 高画質カラー 360° Volumetric Video 0DoF視聴 視点固定 A ?
  • 5. 5 Copyright 2020 NTT CORPORATION より臨場感のある映像体験へ A 固定視界 固定地点・固定視界 での視聴 A 0DoF視聴 360°自由視界 固定地点から頭を動かし、 360度自由視界での視聴 完全自由視界 自由視界,自由空間移動 移動と視界に制限がない 3DoF視聴 A A' A’’ 6DoF視聴
  • 7. Volumetric Video再生例 Data from https://www.crescentinc.co.jp/
  • 8. Volumetric Videoの利用シーン 8 会議・チャット スポーツ ドラマ コンサート Source: http://volumetric-video.com/volumetric-video-calls-using-ef-eve-live-streaming/, https://www.youtube.com/watch?v=Ho_8UvrAvNs, https://www.youtube.com/watch?v=DkOKrVV3SS0, https://www.youtube.com/watch?v=aeE7NledoXI Volumetric Videoは、6自由度での高臨場体験 既存のエンターテインメントだけでなく、 将来の人と人の交流手段の一つになりうる
  • 9. Volumetric Videoの市場動向 各業界がVolumetric Videoに注目 ⚫ 通信キャリア業界(AT&T, Verizon等) ⚫ クラウドサービス業界(Google, Microsoft, Facebook等) ⚫ デバイス業界(Intel, Sony, HTC, MagicLeap等) 市場規模は14億ドルであり、2025年には4倍以上の58億ドルになると見込まれる 今後Volumetric Video は広く使われるコンテンツに成長する可能性 9 Holoportation (Microsoft) 市場規模の地域ごとの変化予測 AT&T Shape の展示 (AT&T) 2025年に 4倍増加 https://youtu.be/VXKHB9vT_4o, https://youtu.be/7d59O6cfaM0,https://www.marketsandmarkets.com/Market-Reports/volumetric-video-market-259585041.html
  • 10. NTTの取り組み 10 NTTコミュニケーションズ ○ 仮想現実ソリューションを展開 ○ NTT Communications Forum 2018 Volumetric Videoの演劇、音楽ライブ、ア トラクション分野への応用提案 Volumetric Videoでの狂言 Source: http://indytimeline.com/?p=122787, https://xr.docomo.ne.jp/event_case/case29/, https://www.nttdocomo.co.jp/info/news_release/2021/01/21_01.html NTTドコモ ○ XRを使ったサービス開始 ○ XRデバイスでのインタラクティブ展示 ○ Volumetric Video撮影スタジオの提供 ○ Docomo Open House2021 Volumetric Videoストリーミング配信を展示 ドコモXRスタジオ (Volumetric Video 撮影スタジオ) ドコモ×国立科学博物館 XRで楽しむ未来の展示 VRバトミントン (Volumetric Video)
  • 11. 11 Copyright 2020 NTT CORPORATION Volumetric Video撮影から再生まで Volumetric Videoの撮影から AR/VRデバイスで再生には、具体的に5ステップある。 撮影 V.V.データ生成 3D レンダリング Display表示 V.V.データ 保存・読み込み
  • 12. 12 Copyright 2020 NTT CORPORATION V.V.の撮影 Volumetric Videoの撮影は、被写体を取り囲む多方向のカメラを配置することが必要。 撮影のカメラはRGBカメラ、Depthカメラの組み合わせで制作される。 Volumetric VideoのDepthカメラは、以下の手法がある。 ⚫ Stereo:Intel RealSense, Stereolab ZED2など 両眼カメラを用い、右左目のピクセルの画素位置の差から物体距離を算出 ⚫ Time of Flight (ToF):Microsoft Azure Kinect, LiDARなど LED,IRやLaser光を照射し、物体で反射し戻ってくるまでの時間を計測することで距離を算出 RGB-D例: Microsoft Azure Kinect 大規模V.V. 全方位撮影スタジオ例 IR(近赤外線) 照射モジュー ル IR受信カメラ RGBカメラ ステレオカメラ ToF方式カメラ https://youtu.be/jJglCYFiodI, https://www.kudan.io/archives/517, https://www.crescentinc.co.jp/studio/4dviews/p_top/
  • 13. Copyright 2020 NTT CORPORATION V.V.のデータ生成 RGB-Dセンサーでの撮影後、以下のパイプラインで3D点群および3Dメッシュが生成 撮影 深度 推定 複数カメラ 深度データ合成 3D 点群 サーフェス 再構築 3D メッシュ ポアソンサーフェス再構築手法 https://youtu.be/jJglCYFiodI, https://www.kudan.io/archives/517,https://www.sony.jp/professional/inter-bee/2020/solution_xr-freeviewpoint/, https://doc.cgal.org/latest/Poisson_surface_reconstruction_3/index.html
  • 14. Copyright 2020 NTT CORPORATION V.V.制作スタジオ 商用大規模スタジオ ⚫ 4D Views HOLOSYS ⚫ 8i ASPX ⚫ Microsoft Mixed Reality Capture Studio ⚫ Sony<非公開> ⚫ Canon <非公開> 既存のコンテンツ制作スタジオソリューションは、 DIYセットアップスタジオ ⚫ EF EVE (商用) ⚫ VCL3D/VolumetricCapture (Open Source) 4DViews システム VCL3D/VolumetricCapture システム SONY システム https://www.crescentinc.co.jp/studio/4dviews/p_top/, https://www.sony.jp/professional/inter-bee/2020/solution_xr-freeviewpoint/, https://github.com/VCL3D/VolumetricCapture
  • 15. Copyright 2020 NTT CORPORATION V.V.の3Dデータ ○ Wavefront Obj (.obj) text/plain形式, 1frame/file CG映画の3Dアニメーション向けに開発 ○ GL Transmission Format (.gltf, .glb) jsonまたはbin形式, 1frame/file Webのやり取り、表示を前提に開発 ○ Alembic (.abc) bin形式, 複数frames/file CG映画の3Dアニメーション向けに開発 画像形式 ○ Portable Network Graphics(.png) ○ JPEG 動画形式 ○ MP4 3Dメッシュデータ テクスチャーデータ
  • 16. Copyright 2020 NTT CORPORATION V.V. 3Dメッシュデータ量 [1] (E. Zerman, C. Ozcinar, P. Gao, A. Smolic. “Textured mesh vs coloured point cloud: A subjective study for volumetric video compression.” Twelfth International Conference on Quality of Multimedia Experience (QoMEX), Athlone, Ireland, May 2020.) V.V. Data = Mesh + Texture 3.1 MB 0.9 MB 4 MB/frame 0 2 4 6 8 10 HD TV 4K TV 4K 360° 1 Volumetric Video 2 Volumetric Video Data Size [Gbps] 非圧縮時のデータ量(2D動画はInterlaceありの場合)[2] ○Time Varying Mesh :1フレームごとに新しいデータ ○1 Volumetric Video再生に4Gbps回線 1フレームのV.V.3Dメッシュデータ量(.obj + .jpg)
  • 17. Copyright 2020 NTT CORPORATION 3Dレンダリング 伝送された3Dモデルを他の3Dオブジェクトと合わせて、ディスプレイで表示するために2Dに変換をする レンダリングで主に使われる手法は、 ○ Rasterization 視界から見える3Dオブジェクトの色情報をそのまま2Dで反映 処理コストが少ない、リアルタイムで生成できる。 利用先:リアルタイム処理のゲームなどが多い。 ○ Ray tracing 視界に届く光線を逆にたどることで、光の反射、屈折、光沢の表現ができる。 処理コストと時間は、大幅に多いが、現実と区別がつかないほどの写実感を実現。 利用先:映画、CG画像、(リアルタイムゲームでも技術的に可能となりつつある) https://www.scratchapixel.com/lessons/3d-basic-rendering/rasterization-practical-implementation, https://architizer.com/blog/practice/details/see-how-ikea-3d-models-the-rooms-in-their-catalogs/ IKEAのカタログ画像(CG制作) Ray Tracing Rasterization Method
  • 18. Copyright 2020 NTT CORPORATION 再生 レンダリング・ゲームエンジン 空間位置、 頭の動き 2D視界映像 https://www.nttdocomo.co.jp/product/magicleap1/images/thumb_magicleap1.png,https://images-na.ssl- images-amazon.com/images/I/61HhqOJILOL._AC_SX522_.jpg, https://www.playstation.com/ja-jp/ps-vr/, https://images-na.ssl-images-amazon.com/images/I/51qWjFuAShL._AC_SX425_.jpg Volumetric Videoおよび3Dメッシュデータの再生には、代表的に以下のツールがある。 これらが、VR・MRデバイスから空間位置、頭の動きを受け取り、3Dレンダリングを行い、2D映像 をデバイスに伝送する。 ⚫ Unreal Engine 商用ゲーム開発ソフト ⚫ Unity 商用ゲーム開発ソフト ⚫ Blender OpenSource 3D編集ソフト ⚫ WebXR OpenSource Webブラウザ上でのVRコンテンツの基盤API
  • 19. 19 Copyright 2020 NTT CORPORATION Volumetric Videoの配信へ NWプラットフォームとして
  • 20. 20 Copyright 2020 NTT CORPORATION ゴール|配信NWプラットフォームの実現 NW Platform Contents Provider User A User B 高臨場体感の配信 を実現 双方向コミュニ ケーションの実現 ⚫ コンテンツプロバイダー ⇒当配信NWプラットフォームの利用で,配信システム構築コストを削減 ⚫ 配信NWプラットフォーム ⇒視聴者の高臨場体感を実現 ⇒視聴者同士が配信コンテンツを見ながら,コミュニケーション可能な双方向通信を実現 ⚫ 視聴者 ⇒FTTH・5Gのアクセス回線(100~1000Mbps)でもVolumetric Videoの高臨場視聴 ⇒他視聴者とVolumetric Videoでコミュニケーション 配信NWプラットフォームとして配信することで効率的配信を実現
  • 21. 21 Copyright 2020 NTT CORPORATION V.V.配信プラットフォーム Volumetric Videoの配信手法には、 ① サーバーレンダリング方式 クライアントから視界情報を受け取り、リアルタイムにサーバーでレンダリング 生成レンダリング2D映像をクライアントに伝送 ② クライアントレンダリング方式 3Dメッシュデータをクライアントに伝送、クライアントのPCでレンダリング そのままではデータが大きいため、圧縮後伝送されることが多い
  • 22. 22 Copyright 2020 NTT CORPORATION 既存のV.V.配信プラットフォーム 既存のV.V.配信は、 ① サーバーレンダリング方式 毎ユーザーごとにレンダリング,高い遅延要件のものには向かない (VRの 全体処理許容遅延20ms達成が難しい) ,サーバー負担大 ⇒同時使用者数とNWの帯域変動が視界映像全体に影響 ② クライアントレンダリング方式 3Dデータ直接配信 [Orts-E. et al. (Holoportation)] ⇒再生に4Gbps必要,消費者向けの配信での適用が難しい 3Dデータ全体のLevel Of Detailの帯域に応じたデータ削減[Holostream] ⇒コンテンツ全体の品質低下により体感品質に影響 Gül, S., et al (Fraunhofer HHI ) Holoportation (Microsoft) Holostream (arcturus) 高品質 低品質 [Gül, S., et al]Gül, S., et al, (2020). Low-latency cloud- based volumetric video streaming using head motion prediction. NOSSDAV 2020 - Proceedings of the 2020 Workshop on Network and Operating System Support for Digital Audio and Video [Orts-E. et al. ]Orts-Escolano, et al. (2016). Holoportation: Virtual 3D teleportation in real-time. UIST 2016 - Proceedings of the 29th Annual Symposium on User Interface Software and Technology, UIST ’16, 741–754 [Holostream]https://arcturus.studio/holostream
  • 23. 23 Copyright 2020 NTT CORPORATION 既存のV.V.配信プラットフォームでの課題 既存のクライアント配信手法では、 圧縮を用いているが,ユーザーからの情報をほとんど使われていない。 Client NW Server/Edge Server Contents Provider 最適に圧縮した3Dメッシュデータ +テクスチャー 圧縮処理 ② ??? ユーザーからの情報をより有効的に活用したデータ圧縮手法 があるのではないか?
  • 24. 24 Copyright 2020 NTT CORPORATION 提案: 視聴者仮想空間位置情報による データ削減手法
  • 25. Volumetric Video再生例 Data from https://www.crescentinc.co.jp/
  • 26. 26 Copyright 2020 NTT CORPORATION
  • 27. 27 Copyright 2020 NTT CORPORATION 提案手法の概要 ◯ 視聴時,3Dデータは全面3Dである必要はない 再生時,常に一面のみの3D映像が見え,背面は視聴者から見えない ◯ Volumetric Videoの再生データの背面部は視聴に影響なく削減できる可能性 ⇒4ステップの提案手法 ◯ 視聴者の空間位置情報から、リアルタイムにサーバーで配信一面3Dデータを作成 ◯ 一面3Dデータであるため、通常の半分のデータ量で送信が可能 3D空間 位置取得 V.V.視聴範囲の 選択 データ圧縮 リアルタイム 一面3Dデータ 生成
  • 28. 28 Copyright 2020 NTT CORPORATION 3D空間位置取得・V.V.視聴範囲の選択 ○VRデバイスから、視聴者の仮想空間上での位置と頭の向きを取得 ○視界にある3Dメッシュデータの内、視聴範囲内の頂点を選択 ○インバースを取り、3Dメッシュの背面頂点を選択 視聴者とV.V.の位置関係 視界面選択 視界外選択 視聴者視点での 選択メッシュ範囲
  • 29. 29 Copyright 2020 NTT CORPORATION リアルタイム一面3Dデータ生成 ○ 選択された視聴者視界背面の頂点を削除 ○ 視聴者の位置が変更した場合は、リアルタイムに新しい位置に基づいた背面頂点削除 元データ(削減前) 提案手法 視聴者と一面3Dデータの位置関係 視聴者視点での 一面3Dデータ 一面3Dデータを斜めから見た様子
  • 30. 30 Copyright 2020 NTT CORPORATION Step4 データ圧縮 提案手法に圧縮手法[draco]を組み合わせて一面データをさらに圧縮 ◯ データ量の更なる削減 ◯ サーバー側のエンコード時間短縮 ◯ クライアント側のディコード時間短縮 V.V. Data Original 提案手法 提案手法 +圧縮 Z [MB] エンコード時間の短縮のイメージ Encoding 従来手法 X [ms] 提案手法 X-c [ms] ディコード時間の短縮のイメージ Decoding ■元データ ■提案手法 ■提案手法圧縮 全体データ量削減圧縮のイメージ .obj 010 101 .obj 010 101 従来手法 Y [ms] 提案手法 Y-d [ms] Z/a [MB] Z/b [MB]
  • 31. 31 Copyright 2020 NTT CORPORATION 配信NWプラットフォーム 提案手法は配信NWプラットフォーム(PF)として組み込まれ,Volumetric Video配信に適用 ⚫ コンテンツプロバイダー: 当配信NWプラットフォームへダークファイバーや10G FTTH回線で大容量Volumetric Videoを伝送 ⚫ NWサーバー・エッジサーバー: 視聴者情報に基づいて一面3Dデータをリアルタイム生成し、伝送 ⚫ 視聴者: FTTH・5G 回線でVolumetric Video(V.V.)を高品質V.V.の複数同時視聴
  • 32. 32 Copyright 2020 NTT CORPORATION 評価実験
  • 33. 33 Copyright 2020 NTT CORPORATION 実験概要 ○ 目的: 立体空間位置に基づいたリアルタイムデータ削減手法の効果と品質を調べる ○ データセット: [Zerman]のmattisデータの1フレーム ○ 実験CG環境: 左右前方にポイントライト配置 カメラ位置は対象Volumetric Videoの頭と同じ高さ Mattis [Zerman] [Zerman](E. Zerman, C. Ozcinar, P. Gao, A. Smolic. “Textured mesh vs coloured point cloud: A subjective study for volumetric video compression.” Twelfth International Conference on Quality of Multimedia Experience (QoMEX), Athlone, Ireland, May 2020.) 実験CG環境の構成
  • 34. 0 500 1000 1500 2000 2500 3000 3500 Original -135 -90 -45 0 45 90 135 180 Data size [KB] Angle [degree] データ削減量 ◯ 対象データに対し,視聴者視点8つを想定 ◯ それぞれのカメラ位置から提案手法(背面頂点削除)を適用 ◯ 元データと比べ平均57%データ量が削減 平均 57% 削減 34 提案手法を8方位で適用後のデータ量 Volumetric Video データ分割での8カメラ方位 0° 45° 90° -45° 135° 180° -135° -90°
  • 35. 35 Copyright 2020 NTT CORPORATION 品質劣化評価 ○視聴者が移動を行い、それに対応する一面3Dデータが遅れて到達した場合を想定 ○元データと一面3Dデータを−20°~ + 20°の10°ずつレンダリング 一面3D データ Z X Y 20° 0° -10°
  • 36. 36 Copyright 2020 NTT CORPORATION 定性評価 ~一面V.V.の他角度からの視聴~ 0° 10° 20° -20° -10°
  • 37. 37 Copyright 2020 NTT CORPORATION 定性評価 ○削除された背面頂点との輪郭部がギザギザ、 不連続である ○近接視聴時には品質劣化があると感じてしまう ○10°以上ずれた視点での一面3Dデータは、 品質劣化が大きい -20° -10°
  • 38. 38 Copyright 2020 NTT CORPORATION 定量評価 元データの同一角度映像との差分を2つの品質評価手法で比較 ◯画素単位比較 Mean Square Error(MSE) ◯構造単位比較 Structure Similarity(SSIM) ⇒5°ずれた視点での視聴でも画素単位に品質劣化が見られる。 値:0~1 最高品質時:1 値: 0~ 最高品質時:0 0.964 0.966 0.968 0.97 0.972 0.974 0.976 0.978 0.98 0.982 -20 -15 -10 -5 0 5 10 15 20 0 20 40 60 80 100 120 140 160 180 SSIM Angle [degree] MSE ■MSE■SSIM 5°を超えると 品質の劣化が 見られる 構造上変化は 感じにくい。
  • 39. 39 Copyright 2020 NTT CORPORATION 圧縮によるデータ削減効果 提案データ削減手法と圧縮を組み合わせで得られるデータ量縮小効果を調べる ⚫ 実験環境: CPU: i7-10750H, メモリー: 32GBのPC, 圧縮手法[draco]を使用 ⚫ 圧縮前元データ比較: 提案手法は元データに対して 低圧縮時に98.0%削減, 高圧縮時に98.9%削減 [draco] https://google.github.io/draco/ 3101 1608 60 34 0 500 1000 1500 2000 2500 3000 3500 Original Proposed Reduction Low Comp. High Comp. Data Size [KB] 3101 108 61 0 500 1000 1500 2000 2500 3000 3500 Original Low Comp. High Comp. Data Size [KB] 提案手法(提案削減手法+従来手法[draco]) 96.5%減 98.0%減 98.0%減 98.9%減 48.1%減 従来手法[draco]
  • 40. 40 Copyright 2020 NTT CORPORATION *Lower is Better 圧縮によるデータ削減効果 圧縮後のデータ量比較: ⚫ 低圧縮時は,元データ圧縮後と比べ55.5%のデータ削減(108KB⇒31KB) ⚫ 高圧縮時は,元データ圧縮後と比べ55.7%のデータ削減(61KB⇒22KB) 3103 1608 0 500 1000 1500 2000 2500 3000 3500 Original Proposed Size [KB] 108 60 0 20 40 60 80 100 120 Original Proposed Size [KB] 61 34 0 10 20 30 40 50 60 70 Original Proposed Size[KB] 51.8% 削減 55.5% 削減 55.7% 削減 圧縮前データ量 元データ/提案手法 低圧縮後データ量 元データ/提案手法 高圧縮後データ量 元データ/提案手法 圧縮
  • 41. 41 Copyright 2020 NTT CORPORATION エンコード・ディコード時間の削減 *Lower is Better 高圧縮時処理時間(元データ/提案手法) 12 53 25 81 0 20 40 60 80 100 Decoding time Encoding time Time [ms] Original Proposed 0.36 1.59 0.75 2.43 0 0.5 1 1.5 2 2.5 3 Decoding Encoding Time [s] Original Proposed 28ms 減 13ms 減 0.84s 減 0.39s 減 1秒(30FPS) 1フレーム 低圧縮時処理時間(元データ/提案手法) 4 11 6 19 0 5 10 15 20 Decoding Encoding time[ms] Original Proposed 8ms 減 2ms 減 1フレーム 0.12 0.33 0.18 0.57 0 0.1 0.2 0.3 0.4 0.5 0.6 Decoding Encoding time[ms] Original Proposed 0.24s 減 0.06s 減 1秒(30FPS) ⚫ 提案手法でのデータは,圧縮時のエンコード・ディコード時間を短縮 ⚫ 低圧縮時サーバーでのエンコード負担を最大8ms(42%)軽減 ⚫ 低圧縮時クライアントでのディコード時間を2ms(33%)軽減
  • 42. 42 Copyright 2020 NTT CORPORATION 考察 提案データ削減手法は, ○ 品質を維持したままVolumetric Videoデータを ➢ 非圧縮時:平均57%削減 ➢ 圧縮時でも55%削減 ○ 圧縮エンコード,ディコード時間:30%以上短縮 これによりトータルの処理時間を削減できる可能性あり 今後の検討 ○ ユーザー数ごとのサーバーでリアルタイム一面データ生成が必要となるため、 サーバー処理負担大きく、手法の改善が今後必要 ○ 背面頂点削除手法は、背面と接続する輪郭部がギザギザしており、手法の改善が今後必要。 ○ 背面頂点削除にかかる計算コストと時間は、今後調査が必要。
  • 43. 43 Copyright 2020 NTT CORPORATION 考察(NW観点) NW回線で必要となる通信帯域 30FPSのコンテンツ時: ⚫ 非圧縮伝送 800Mbps回線必要⇒400Mbps回線でVolumetric Videoのメッシュ伝送が可能に (テクスチャーは+240Mb/s必要、圧縮比率などによりさらにデータ縮小可能)⇒今後検証 ⚫ 低圧縮伝送 30Mbps回線必要⇒20Mbps回線でVolumetric Videoのメッシュ伝送が可能に エンコード・ディコード遅延があり、Volumetric Video配信と双方向コミュニケーションにおいて 全処理遅延150ms以下[3GPP]を満たせるかは高性能MECなどを使用し今後検証 エンコード時間(1秒当たり) Data size [MB/frame] [Mb/s](30fps) [MB/frame] [Mb/s](30fps) Before comp. 3.103 744.72 1.608 385.92 Low comp. 0.108 25.92 0.06 14.4 High comp. 0.061 14.64 0.034 8.16 元データ 提案データ削減後 Decoding time [ms] 30fps [ms] 30fps Before comp. NONE NONE Low comp. 0.18 0.12 High comp. 0.75 0.36 Encoding time [ms] 30fps [ms] 30fps Before comp. NONE NONE Low comp. 1.35 0.33 High comp. 2.34 1.59 ディコード時間(1秒当たり) [3GPP]3GPP. (2020). 3rd Generation Partnership Project; Technical Specification Group Services and System Aspects; Extended Reality (XR) in 5G. 0(Release 16). http://www.3gpp.org データ量・必要伝送帯域
  • 44. 44 Copyright 2020 NTT CORPORATION まとめ この発表では、 ○ Volumetric Videoの技術背景 ○ 視聴者情報に基づいた配信データ削減圧縮手法の提案 ⇒ 従来の57%のデータ量でVolumetric Videoの配信が可能であることを示した 今後は、 ○ サーバー負荷が少ないデータ削減手法の検討 ○ 消費者にはアクセス回線でスポーツや番組などのV.V.配信とユーザー間の交流会議サービスへの技術展開 ビジネス会議 スポーツ 番組 Source: http://volumetric-video.com/volumetric-video-calls-using-ef-eve-live-streaming/, https://www.youtube.com/watch?v=Ho_8UvrAvNs, https://www.youtube.com/watch?v=DkOKrVV3SS0 将来のVolumetric Videoサービス展開