Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Wps105 m - new gpu features of nvidia's maxwell architecture (presented by nvidia)

3,923 views

Published on

DX12 + NVidia

Published in: Technology
  • Be the first to comment

  • Be the first to like this

Wps105 m - new gpu features of nvidia's maxwell architecture (presented by nvidia)

  1. 1. 林楠 – NVIDIA中国区开发者技术主管 新一代DirectX与 NVIDIA GPU在Windows系统上的开发
  2. 2. NVIDIA Maxwell架构目标 DirectX12新增硬件特性 Maxwell支持的其它新特性 新特效技术展望 演讲概要
  3. 3. 在已有的28纳米节点上用新架构来提升性能 大幅度提高能耗比 专为提供最好的DirectX 12支持而设计 专注于新的图形特性 在复杂的动态场景中提供实时全局照明(GI)效果 提供质量更高的可编程抗锯齿(AA)接口 内存工作集(working set)管理 可扩展的2D图形加速功能 为各项DirectX 12提供最佳硬件平台 NVIDIA Maxwell架构目标
  4. 4. NVIDIA Maxwell架构目标 DirectX12新增硬件特性 保守边界光栅化(Conservative Rasterization) 有序光栅视图(Raster Ordered Views) 拼接资源(Tiled Resources) Maxwell支持的其它新特性 新特效技术展望 演讲概要
  5. 5. Direct3D 12 最新高性能图形API 更加接近底层硬件, 更多直接的硬件访问 可运行于微软所支持的各种硬件平台 有多种优秀开发工具所支持 为各大硬件厂商提供支持
  6. 6. DirectX 12 特性 提升CPU效率 新的API在多核CPU上可并行渲染 每一个核上的开销也得到了有效的缩减 优化GPU效率并增加了新特性 通过使用索引来提高资源绑定的灵活性 数据管理和传输的效率更高 更加直接的工作调度模型 多种新硬件特性 NVIDIA展台提供演示
  7. 7. 常规光栅化 如果像素中心点未被三角形覆盖,则不输出 保守边界光栅化: 输出所有触及三角形的像素 应用举例: 光线追踪阴影 体素化(Voxelization) 第二代Maxwell GPU都支持此特性 GTX 960 / 970 / 980 / Titan X DX12保守边界光栅化
  8. 8. 没有ROV: pixel shader的输出是无序的 ROV可保证pixel shader按特定顺序输出 可以用来解决很多问题: 可编程的透明混合操作 高效灵活的画序无关(OIT)透明算法 延迟渲染: 任意打包g-buffer数据 第二代Maxwell GPU都支持此特性 有序化输出会带来性能损失 深度复杂性会影响性能 DX12有序光栅视图(ROVs)
  9. 9. 拼接2D & 3D贴图和数组 通过虚拟内存的方式来存储海和使用海量数据 DX11.2提供2D拼接资源 DX12增加3D拼接资源 应用 贴图流(texture streaming) / 剪切映射(Clipmaps) 自适应阴影映射(adaptive shadow map) 稀疏多分辨率渲染 (Sparse multi-resolution rendering) 稀疏体素网格(Sparse voxel grids) 第二代Maxwell GPU都支持此特性 性能取决于具体应用 DX12 拼接资源
  10. 10. NVIDIA Maxwell架构目标 DirectX12新增硬件特性 Maxwell支持的其它新特性 多向投影(Multi-Projection)加速 可编程抗锯齿 新特效技术展望 演讲概要
  11. 11. Maxwell支持: 快速geometry shader 快速多视口投射(viewport multi-casting) 可以加速以下特效: 体素化(voxelization) 渲染至立方贴图(cube-map rendering) 层叠式阴影映射(cascaded shadow maps) 多分辨率渲染(multi-resolution rendering) 第二代Maxwell GPU都支持此特性 Maxwell多向投影加速
  12. 12. 新的高级多重采样特性 pixel shader可指定所有子像素的位置 pixel shader可获知每一个子像素是否通过了深度测试 带来了一系列新的抗锯齿技术 多帧采样抗锯齿(Multi-frame sampled AA) 聚合G-Buffer抗锯齿(Aggregate G-Buffer AA) 累积抗锯齿(Accumulative AA) 第二代Maxwell GPU都支持此特性 抗锯齿质量更高,速度更快 Maxwell可编程抗锯齿
  13. 13. NVIDIA Maxwell架构目标 DirectX12新增硬件特性 Maxwell支持的其它新特性 Maxwell支持的其它新特性 光线追踪阴影(Raytraced Shadows) 稀疏流体模拟(Sparse fluid simulation) 基于体素的全局照明(Voxel Based Global Illumination) Aggregate G-Buffer AA VR Direct 演讲概要
  14. 14. 光线追踪阴影 使用光线追踪来生成精细的阴影效果 应用DX12的保守边界光栅化来加速
  15. 15. 传统的阴影映射 SM = 8K x 8K (256 MB)
  16. 16. 光线追踪阴影 SM = 3K x 3K (36 MB) PM = 1K x 1K x 64 ( 256 MB )
  17. 17. 硬件需求 最低: D3D feature level 11 推荐: D3D feature level 12 (保守边界光栅化可大幅提高速度) 哪些游戏会使用光线追踪阴影: 需要大量清晰阴影的游戏 在游戏中可能被归为“高”或“极高”级别的画面效果 已集成到Unreal 4引擎中 光线追踪阴影 – 硬件考量
  18. 18. 流体模拟往往需要大量的数据 以往的算法受限于有限的内存 使用DX12的拼接3D资源特性 仅在含有流体的网格上存储和计算 节省内存空间, 降低计算时间 稀疏流体模拟
  19. 19. 稀疏流体模拟演示
  20. 20. 硬件需求 最低及推荐: D3D feature level 12 由于缺乏拼接3D资源, D3D Feature level 11只能进行小范围的流体模拟 那些游戏会使用稀疏流体模拟: 大范围、可交互的烟雾/火焰/流水效果 在游戏中可能被归为“高”或“极高”级别的画面效果 稀疏流体模拟–硬件考量
  21. 21. 基于体素的全局照明 - VXGI 使用物理规律模拟光的传播 提供最逼真的光照效果 在Maxwell与DX12有大幅度的性能提升 利用了多种硬件新特性来加速 保守边界光栅化 多向投影加速 拼接资源
  22. 22. forums.unrealengine.com, user “rabellogp” 无间接照明
  23. 23. forums.unrealengine.com, user “rabellogp” 光照贴图 (静态)
  24. 24. forums.unrealengine.com, user “rabellogp” VXGI (动态)
  25. 25. 硬件需求 最低: D3D feature level 11 推荐: 高端DX12 feature level硬件(可利用多种新特性加速) 在游戏中的应用 精致的动态光照 在游戏中可能被归为“极高”级别的画面效果 已集成到Unreal 4引擎中 VXGI – 硬件考量
  26. 26. 延迟渲染专用 延迟渲染是现在的主流渲染方法 同MSAA相比, 效果更好, 内存占用更少 AGAA 2A与32x MSAA效果相当 使用了Maxwell提供的可编程抗锯齿特性 更快: 只处理可见的子像素 更好: 通过改编自像素位置来提升效果 聚合G-Buffer抗锯齿 - AGAA
  27. 27. AGAA演示
  28. 28. 硬件需求 最低及推荐: Maxwell GPUs (NVIDIA GTX 960/970/980/Titan X) 在游戏中的应用: 可取代MSAA, 达到更好更快的抗锯齿效果 AGAA – 硬件考量
  29. 29. 来自NVIDIA的VR技术统称 包括软件和硬件的技术 用于提高VR的渲染性能 降低响应延迟 加速立体渲染 NVIDIA VR Direct
  30. 30. 避免运动眩晕的要素: 画面帧率 > 90帧/秒 画面对头部转动的响应时间 < 20毫秒 VR Direct: 降低延迟 Scott W. Vincent 转头到画面改变 ≤ 20 ms Franklin Heijnen
  31. 31. 如何把响应时间控制在20毫秒内? 需要硬件和驱动提供“Timewarp”技术 GPU在每次输出图像至显示之前, 即时针对当前的头盔位置进行一次画面调整 VR Direct: Timewarp
  32. 32. Timewarp技术可将延迟有效的将至 20毫秒以下 对于帧率小于60的游戏也有效! 支持Timewarp技术的NVIDIA GPU: 部分500和600系列的GPU, 所有700和900系列的GPU 未来的GPU会有更好的支持 VR Direct: Timewarp
  33. 33. VR Direct: VR SLI API 左 右 同一组渲染指令
  34. 34. 发送一次渲染指令, 同时绘制双眼的图像 提升帧率 降低延迟 双卡性能难以接近单卡的两倍 很多观察点无关的工作被重复做了, 比如阴影的投射 硬件需求 NVIDIA Geforce 500及以上系列 VR Direct: VR SLI
  35. 35. 问&答

×