今天还是跟大家聊一聊最近很火的虚拟引擎,Epic Game公司的虚幻引擎5惊艳了全球游戏业,其Nanite虚拟微多边形几何技术和Lumen动态全局光照技术带来了产业界的飞跃。Nanite虚拟几何技术的出现意味着由数以亿计的多边形组成的影视级艺术作品可以被直接导入虚幻引擎,Nanite几何体可以被实时流送和缩放,因此无需再考虑多边形数量预算、多边形内存预算或绘制次数预算了。这极大地解放了数字艺术家,在未来他们只需要专注于艺术灵感,而不必被技术所掣肘。
图1. 虚幻引擎5的演示:Lumen in the Land of Nanite.
Epic Game 宣称Nanite技术可以支持具有160亿个多边形的场景渲染。显然,GPU的内存无论如何也无法容纳如此之多的几何数据,因此Nanite必然采用了与虚拟内相类似的技术。很多图形学的同行猜测Nanite虚拟多边形几何技术很可能是虚拟纹理(Virtual Texture)和几何图像(Geometry Image)的结合。上一篇文章,虚幻引擎5技术解析:几何图像的思想,发出后,很多同学询问相关的计算机图形学概念和算法,这里我们进一步给出直观详细的解释,更多细节可以在大学本科和研究生图形学课程中找到。
图2. 几何与纹理。
曲面一般表示成三角网格和纹理图像,三角网格表示曲面的几何拓扑信息,纹理图像给出曲面的颜色材质等信息。我们将三角网格映射到平面区域的过程被称为曲面参数化,将纹理图像贴合到曲面上被称为纹理贴图。图2显示了一张人脸曲面的三角网格、纹理图像;图3是图2数据的渲染结果。
图3. 几何加纹理渲染效果。
为了提高实时渲染速度,减小内存存储要求,我们为同一个几何模型准备了不同解析率的三角网格,根据细节层次(Level of Details)要求来决定所用的解析率。如图4所示,如果几何体距离镜头很远,我们用低解析率的模型;反之,如果曲面距离镜头很近,我们用高解析率的模型。不同LOD的三角网格可以采用同样的纹理图像,所以这些网格具有同样的参数化。
图4. 几何曲面的LOD表示,从低模到高模。
图5显示在渲染过程中,对于镜头可以看到的部分,曲面的解析率可以动态提高,而对于镜头看不到的部分,曲面的解析率可以动态降低。例如我们贴近佛像的头部,佛像的身体部分可以用很粗糙的三角剖分;我们从右侧观察天使的雕像,则右侧的三角剖分比左侧精细很多。
图5. 三角网格的LOD表示,局部的解析率根据视点动态变化。
类似的,纹理图像也有不同的解析率,我们将一张高清的纹理图像下采样,得到一系列的纹理图像,被称为纹理图像的mipmap金字塔。如果渲染画面的屏幕具有高解析率,曲面距离镜头很近,我们需要采用高解析率的纹理图像,否则采用金字塔高层的纹理图像。
图5. 纹理图像的mipmap pyramid.
如图6所示,反之给定低模的三角网格,我们可以依据一定的规则,将网格加细(subdivision),得到更为精细的三角网格。多次细分之后,三角网格几乎处处收敛到光滑的样条曲面。三角网格细分的规则可以写入tessellation shader,由硬件自动完成。
图6. 三角网格的细分(subdivision)。
纹理图像可以存储更多的信息,例如每个像素可以记录颜色、法向量、材质、金属、背景光、散射、高光、透明度、几何高度、几何位移等很多信息,用于描绘物体表面的细节。低模加上高模生成的法向量贴图可以提高渲染质量和速度。
图7. 法向量纹理。
在游戏中,法向量贴图经常用来增加人脸曲面的几何细节,特别是皱纹。如图8和图9所示,建模师的雕塑完成后,人物皮肤表面比较光滑,应用了法向量贴图之后,皱纹效果显现出来,同时皮肤更具质感。
图8. 左帧,没有用法向贴图;右侧,应用了法向贴图。
图9. 法向纹理用于描述人脸皱纹 ( by Alander Alexei)。
对于高质量、复杂场景的游戏,纹理图像的数据非常庞大,无法存储在GPU的内存之中,这时必须借助虚拟纹理技术(Virtual Texture)。例如游戏的场景设定在一个山峦地区,我们有航拍的地形几何数据,如图10所示,同时有不同解析度的纹理数据,例如近景拍摄的照片。我们在脑海中为地形曲面建立虚拟的坐标,并将所有的照片融合成一张巨大的纹理图像,覆盖整个游戏世界,这张笼罩乾坤的纹理图像,就被称之为虚拟纹理。
图10. 地形的几何数据。
虚拟纹理的UV坐标,被称为虚拟坐标,或者虚拟地址空间。玩家在山峦中穿行的每一刹那,都对应着虚拟地址空间中的某一个点。游戏系统实时跟踪玩家的行迹,从而得知其任意时刻的虚拟坐标。由于虚拟纹理过于巨大,我们将其切割成很多小块,每一小块被称为一个页面(page),如图11所示。任意时刻,系统只保留与玩家位置临近的少数页面在GPU显存之中,其他的页面依然放在硬盘之中。当玩家在山峦中游走,系统实时判断缺失的页面,依照一定规则(例如 Least Recently Used)淘汰过期无用的页面。这种动态更新GPU内存中页面的算法与传统的虚拟内存算法非常类似。
图11. 地形纹理的虚拟地址空间,每一个方格代表一个页面。
在现代游戏引擎中,每一帧屏幕画面被渲染两次,第一次渲染,系统计算每一个像素的虚拟坐标,由虚拟坐标决定对应的页面编号,同时根据遮挡、远近决定纹理mipmap的层次。然后,系统由虚拟坐标(页面,层次)查找对应的物理坐标,如果有页面缺失,系统去硬盘查找并调入GPU内存。我们以ID公司的游戏Rage来举例说明。图12是玩家看到的渲染画面,图13是系统第一次绘制出的画面,这里每一个方格对应一个页面,如此得到每一个像素对应的虚拟纹理坐标。图14是当前GPU内存中存储的活跃页面。
图12. 玩家眼中的游戏画面,ID公司,Rage。
图13. 虚拟纹理坐标对应的页面,每个方格对应一个页面,ID公司,Rage。
图14. GPU内存中存储的当前活跃的页面,物理内存32乘32页面,ID公司,Rage。
图15简略地给出了虚拟纹理的示意图。从虚拟地址到物理地址的映射被保存在GPU中的一张查询表格中(Page Table),这张表格一般是四叉树结构,也用纹理图像来表达。维护这张表格,动态更新物理纹理,是虚拟纹理系统的核心任务。
图15. 虚拟纹理系统原理示意图 (Mayer, Scheiblauer and Mayer)。
一旦渲染当前画面所需的页面都在GPU内存之中,系统进行第二次绘制。像素渲染器(pixel shader)可以通过查询Page Table从虚拟纹理坐标找到物理坐标,从而得到相应的纹理像素,再经过滤波,融合,得到当前像素的颜色值。当然,真实的虚拟纹理系统的算法非常复杂,软硬件分工也非常考究,这一系统对于整个游戏的质量具有决定性的影响。
图16. Graphine虚拟纹理的演示 (by Al Josha Demeulemeester)。
图16展示了Granite SDK 5.0 的虚拟纹理技术。一架双体飞机在山峦大海上空飞行,系统计算了虚拟纹理坐标,得到对应的页面编号和细节层次,调度GPU内存,从而实时渲染,得到逼真的绘制效果。
虚拟内存技术使得艺术家不再担心纹理的存储量,纹理图像可以被实时流送(页面调度)放缩(mipmap),游戏设计师不必考虑纹理的内存预算、绘制次数。这里,如果我们将“纹理”换成“几何”,我们得到是Epic Game关于Nanite虚拟几何技术的广告词。
迄今为止,几何的三角网格表示与纹理图像表示依然泾渭分明,纹理图像还是贴附在三角网格之上的。虽然虚拟纹理技术为艺术家极大地解放了纹理设计,但是对于几何依然于事无补,对于影视级别的高解析度几何曲面,系统依然无法承担。那么,我们为什么不能将几何数据也虚拟化呢?例如,我们将庞大的地形数据放在硬盘上,只在GPU Cache中保存当前活跃的页面,通过实时调度,来保证玩家的体验?理论上,这种思路没有任何障碍。
首先,我们将地形几何曲面整体参数化,如图11所示,覆盖整个虚拟地址空间,覆盖整个虚拟纹理图像;然后,我们将整个虚拟地址空间切割成页面,随机调度进入GPU内存。但是,在这里我们遇上了一个瓶颈:三角网格的不规则性。如图17所示,人脸曲面的组合结构非常不规则,我们需要存储顶点的位置信息,同时也要存储顶点之间的连接关系,如何在GPU内存页面中表达如此复杂的组合结构,并且从组合结构随机存取顶点信息,这是一个非常棘手的问题。
图17. 三角网格的不规则性。
一个简单的解决方案是将三角网格规则化,即将曲面在参数域上用规则的格点重新采样,用二维矩阵来表示曲面,这就是几何图像想法【1】的初衷。
图18. 几何图像示意图。
如图18所示,我们将大卫王雕像(top left)共形参数化到平面长方形(top right),规则采样,将三角网格转换成几何图像(middle left)和法向量纹理(middle right),几何图像中的每一个像素的红绿蓝颜色值代表相应顶点的三维位置,规则的格点(像素的行列序号)给出了顶点之间的连接关系。几何图像代表的曲面显示在下面一行,左帧是下采样得到的低模曲面,右帧是原始几何图像代表的高模曲面。如此,几何图像的LOD和纹理图像的mipmap 相统一。
在虚拟地址空间,几何图像与各种纹理图像相重合,被分割成同样的页面,在内存调度过程中同进同退,同时流送,在绘制过程中同步放缩(mipmap)。
这样的机制减少了带宽消耗和GPU内存消耗,提高了几何与纹理的局域性,更加利于visibility culling。同时,中间计算结果可以存储成一张虚拟纹理,提高GPU的任务处理的同步性,简化了绘制流程。当然,应用tessellate shader和procedure decal,我们可以动态添加更多的几何与纹理。
几何与纹理的同步虚拟化,使得游戏设计师和艺术家不再顾虑几何与纹理的存储量、内存预算与绘制次数,极大地解放了他们的艺术天性。由此,我们相信Nanite虚拟微多边形几何技术应该类似于虚拟纹理技术与几何图像技术的融合。
小结
将几何数据虚拟化,让艺术家在虚拟地址空间中纵横驰骋,的确是划时代的进步。这项技术需要将复杂场景的几何全局参数化到统一的虚拟地址空间之中,同时使得这一映射带来的畸变尽量的小。这需要微分几何的理论来保证。如图19所示,我们将欢喜佛映射到平面圆盘,左帧的参数化保持曲面局部形状不变,右帧的映射保持曲面的面积元不变。保形变换的算法对于任意拓扑曲面都适用,保面积变换的算法对于任意维数的流形都适用。计算共形几何【2】为保形变换算法奠定了理论基础,最优传输理论为保面积变换奠定了基础。因此,虚拟几何图像的理论已经完备,算法相对成熟。工业界正在开始大规模推广应用。
图19. 保形和保面积参数化。
我们期望虚拟几何与纹理技术会推进三维工业的进一步发展,例如游戏动漫、VR、AR以及医学影像。我们希望更多的年轻人不再沉湎于游戏之中,而是对其背后的数学原理与工程技术产生强烈的好奇,刻苦钻研微分几何与图形学算法,充分施展才华,为社会做出更为深刻而实质性的贡献!
图20. 虚幻引擎5的演示:Lumen in the Land of Nanite.