BlueRose 0e5712546f vault backup: 2024-11-14 12:15:34

2024-11-14 12:15:35 +08:00

9.7 KiB

Raw Blame History

移动端SSR

GBuffer

SSR计算阶段需要的WorldNormal来自GBufferA,Roughness来自GBufferB
SSR结果转换成间接高光需要的SpecularColor来自GBufferB和GbufferC

derived from BaseColor,Metalness,Specular
GBuffer.SpecularColor = ComputeF0(GBuffer.Specular,GBuffer.BaseColor,GBuffer.Metallic);

MobileBasePass片段着色器额外增加一张RT--OutColorAux,rgb通道存SpecularColor,a通道存Roughness

PIXELSHADER_EARLYDEPTHSTENCIL
void Main(
	FVertexFactory InterpolantsVSTOPS Interpolants
	, FMobileBasePassInterpolantsVSTOPS BasePassInterpolantts
	, in float4 SvPosition:SV_Position
	OPTIONAL_IsFrontFace
	, out half4 OutColor : SV_Target0
	, out half4 OutColorAux : SV_Target1
#if DEFERRED_SHADING_PATH

OutColorAux.rgb=ShadingModelContext.Specularcolor;
OutColorAux.a=GBuffer.Roughness;

其中SpecularColor初始化值为计算得到的间接高光(延迟管线是在混合阶段计算)

ShadingModelContext.SpecularColor = (DielectricSpecular -)
ShadingModelContext.SpecularColor = GetEnvBRDF(ShadingMode

TemporalAAHistory

TemporalAA多帧累积的SceneColor,用于射线RayCast交点的屏幕坐标采样获取颜色
降噪作用(SSR默认Quality每个像素打一根Ray)
移植DesktopTAA替换MobileTAA(详细见图像处)

HZBFurthest

可以理解为场景深度的Mipmap，用于RayMarching求交加速。
参考UE4.27移植（不是必须）

SSR计算

SpecularColor和Roughness从OutColorAux获取,WorldNormal通过SceneDepth重构获得

#if SHADING_PATH_DEFERRED
	FGBufferData GBuffer = GetGBufferDataFromSceneTextures(UV
#else
	FGBufferData GBuffer = (FGBufferData)0;
	GBuffer.ShadingModelID
	= SHADINGMODELID_DEFAULT_LIT;
	GBuffer.WorldNormal = normalize(ReconstructNorma1FromDept
	GBuffer.SpecularColor = MobileSceneColorAux.SampleLevel( 
	GBuffer.Roughness = MobileSceneColorAux.SampleLevel(Mobil
	GBuffer.Depth = CalcSceneDepthByTexture(UV);
#endif

SSR结果预乘SpecularColor,这样可以与SceneColorMobile做Blend One One混合

#if FEATURE_LEVEL == FEATURE_LEVEL_ES3_1
Outcolor.rgb*=GBuffer.SpecularColor;
#endif

结论

不足:重建的WorldNormal是面法线,没有延迟管线GBuffer的像素级法线,某些角度反射结果会有差异
早期的方案:OutColorAux的rg通道存WorldNormal,a通道存Roughness,b通道存SpecularColor的灰度值(某些光照环境下结果不准确,放弃)

实时平面反射

平面反射与DepthPass的兼容问题修改。

需求

在包含平面反射(裁剪平面开启)的场景中,开启Full Prepass的情况下,平面反射绘制的内容出现深度遮挡错误

裁剪平面 平面反射的裁剪平面(Global Clip Plane)用于保证绘制结果的正确--那些在反射相机的视锥体内,但在反射平面下方的物体不应该参与反射,需要被剔除掉

硬件实现 默认实现是通过SV_ClipDistance语义在模型的光栅化阶段剔除,但不是所有的平台都支持,移动平台BasePass走的是PS的clip剔除

实现方法

自定义语义 DepthOnlyVS设置ClipDistance值,通过自定义语义插值传递给片段着色器DepthOnlyPS。

struct FDepthonlyVSTOPS
{
#if USE_PS_CLIP_PLANE
	float OutclipDistance : OUTCLIPDIST;
#endif

PS剔除在DepthOnlyPS中用clip函数剔除(负值表示在裁剪平面以下,会被剔除)

#if USE_PS_CLIP_PLANE
	clip(Interpolants.OutClipDistance);
#endif

PS绑定条件在移动平台,当场景包含平面反射的情况下走DepthOnlyPS

结论

Depth Pass走PS会有额外开销,但仅限场景中包含平面反射的时候,其它情况下Depth Pass仍然可以不需要PS
另一种修改方案:当场景中包含平面反射的时候关闭Full Prepass,在某些效果依赖Full Prepass的时候不行(详细见接下来动态阴影分享)

CSM策略优化

移除视锥外物体的阴影渲染

ModulatedShadow渲染管线改造

需求

在角色展示时CSM阴影精度不够,阴影效果不稳定(ViewDependentWholeScene的阴影方式)
解决方案:Modulated Shadow具有独立的阴影视锥和阴影深度图区域,在阴影精度方面更有优势(Per-Object的阴影方式)

问题1:阴影重叠

Modulated Shadow独立计算各个投影物体的阴影,与SceneColorMobile相乘输出,导致投影重叠区域多次与阴影颜色相乘被压黑
解决方案:增加一个中间RenderTarget,做为每个Per-Object阴影视锥的输出目标,最后对RT统一阴影颜色处理后,再与SceneColorMobile相乘输出

问题2:透明物体无阴影接收

阴影方式处理依赖场景深度,而透明物体不写场景深度
解决方案:透明物体的阴影Receive还是走CSM

问题3:在MobileBasePass之后计算

阴影信息需要早于MobileBassPass构造好,用于着色计算
考虑过的方案:MobileBassPass用上一帧的Modulated Shadow信息,但存在阴影拖影和透明物体阴影结合的问题
最终方案:参考UE4.27移植并开启Full Prepass,在MobileBassPass之前获得场景深度,构造好Modulated Shadow

结论

项目应用两套阴影方案:角色展示场景主要用Modulated Shadow,满足高精度的阴影效果需求,战斗场景用CSM,效率优先

特效性能 Separate Translucency透明渲染管线改进

修改方案:参考非移动端做透明渲染RenderPass与MobileBasePass分离。

SeparateTranslucencyColor 申请低分辨率的RenderTarget用于透明绘制,然后Upsample到SceneColorMobile上
SeparateTranslucencyDepth SceneDepth需要跟SeparateTranslucencyColor做同比例Downsample

注意:SceneDepth的Resolve跨RenderPass渲染目标改变,基于Memoryless的SceneDepth获取方式需要改为从Texture中获取,比如:DepthFade,LookupDeviceZ

重设SceneTextures 增加EMobileSceneTextureSetupMode去设置降分辨率后的SceneDepthTexture

(buseSeparateTranslucencyDepth && SceneContext.SeparaateTranslucencyDepth)
SceneTextureParameters.SceneDepthTexture=GetRDG(SceneContext.Separate

进一步需求

角色的透明材质不想受降透明分辨率影响 1.保证角色渲染的精度;2.透明和不透明的衔接部分因为精度不一样出现裂缝问题

解决方案

通过扩展材质上的SeparateTranslucency的勾选项灵活控制走Normal还是SeparateTranslucencyPass

与其他透明的乱序问题

通过角色透明写CustomeDepth,其他透明判断CustomDepth解决

结论

通过透明渲染分辨率可根据机型、画质和场景的不同灵活控制特效的GPU开销
透明渲染Pass拆分产生了更多的透明渲染乱序问题,通过设置Sort Priority,配合CustomDepth解决
SceneCapture下的透明渲染:还是走Normal Translucency (SceneCapture需要使用alpha通道)

图像处理 Desktop Temporal AA移动端移植

需求

MSAA对Depth Resolve支持的不好,无法满足渲染管线特性扩展的需求(SSPR、AO和Full Prepass等都需要Depth的Resolve)
TemporalAA通过每帧使用不同的像素抖动Jitter,把采样结果分散到多帧,累积到History帧与当前帧混合,可以达到很好的抗锯效果
MobileTAA只做两帧混合,抗锯效果不够,而且没有基于Velocity的像素修正,快速移动会有鬼影(Ghosting)

解决方案

增加Velocity Pass

可移动模型:更新Primitive的LocalToWorld和PreviousLocalToWorld
骨骼模型:需要上一帧的骨骼矩阵计算顶点位置,使用SRV Buffer代替Uniform Buffer传递骨骼变换矩阵(UniformBuffer有大小上限)
VS计算出顶点当前和上一帧的屏幕空间坐标,传递给PS计算差值作为Velocity输出

// 3d velocity,includes camera an object motion
float3 Velocity = float3(ScreenPos - PrevScreenPos, DeeviceZ - PrevDeviceZ);

Reprojection位置纠正

在后期阶段,通过变换计算当前屏幕坐标在上一帧中的屏幕坐标,再结合Velocity数据对History帧做正确采样

float2 BackN = PosN.xy - PrevScreen;

BackN = DecodeVelocityFromTexture(EncodedVeloc:ty).xy;

HistoryScreenPosition = InputParams.ScreenPoS -BackN;

结论

TAA整体抗锯效果最好,而且基于多帧的时间域实现,可以更好的与新渲染特性兼容,且对SSR起到降噪的作用
TAA后期位置需放在Bloom之前,避免放在Bloom之后产生的flicker
在后期的末端加上FXAA,弥补TAA在后期管线上靠前对有些效果(比如AfterTonemap)抗锯不生效的问题

图像处理 Mobile FSR

具体方案

从UE5移植Mobile FSR 1.0，主要包含针对移动端优化的Upscale和锐化两个Pass。

3D UMG

Canvas Panel 3D

继承自Canvas Panel,增加透视相关参数,比如Camera的Anchor、FOV和Panel的Rotation、Offset等参数,OnPaint时转换成ViewProjection矩阵传递给Widget
优点:1.顶点还是2D,没有增加渲染开销;2.可在编辑器实时预览3D效果
不足:只有Canvas的深度信息,无法做顶点级别的深度效果

场景交互3DUI

新增SeparateTranslucencyAfterPostProcess半透明材质标识,对应新增一个Mesh Pass和Processor收集此类型MeshBatch,放在Tonemap之后绘制
解决默认的WidgetComponent受到Tonemap影响带来的色差问题
本质上是Mesh的透明渲染,有顶点级别的深度信息,可以访问SceneDepth来实现场景交互

需处理的问题

Tonemap之后绘制,需跳过MobileBasePass的颜色纠正和Android平台的Y轴翻转
TAA早于TranslucencyAfterPostprocess Pass生效,在该Pass绘制前,View的投影矩阵像素Jitter需去掉(HackRemoveTemporalAAProjectionJitter)

结论

Canvas Panel3D类型满足最常用的界面需求;TranslucencyAfterPostprocess类型满足与场景交互的界面需求
抗锯齿:Canvas Panel 3D类型通过带MSAA的中间RenderTarget方式处理;TranslucencyAfterPostprocess类型依靠后期末尾的FXAA
其他:使用第三方NiagaraUIRenderer插件来满足UMG上显示特效的需求

9.7 KiB Raw Blame History Unescape Escape

移动端SSR

GBuffer

TemporalAAHistory

HZBFurthest

SSR计算

结论

实时平面反射

需求

实现方法

结论

CSM策略优化

ModulatedShadow渲染管线改造

需求

问题1:阴影重叠

问题2:透明物体无阴影接收

问题3:在MobileBasePass之后计算

结论

特效性能 Separate Translucency透明渲染管线改进

进一步需求

解决方案

与其他透明的乱序问题

结论

图像处理 Desktop Temporal AA移动端移植

需求

解决方案

结论

图像处理 Mobile FSR

具体方案

3D UMG

场景交互3DUI

需处理的问题

结论

9.7 KiB

Raw Blame History