BlueRoseNote/02-Note/演讲与教程笔记/虚幻开放日2024/虚幻引擎4移动端渲染管线改造总结分享.md

# 移动端SSR
## GBuffer
- SSR计算阶段需要的WorldNormal来自GBufferA,Roughness来自GBufferB
- SSR结果转换成间接高光需要的SpecularColor来自GBufferB和GbufferC
```c++
derived from BaseColor,Metalness,Specular
GBuffer.SpecularColor = ComputeF0(GBuffer.Specular,GBuffer.BaseColor,GBuffer.Metallic);

```

MobileBasePass片段着色器额外增加一张RT--OutColorAux,rgb通道存SpecularColor,a通道存Roughness
```c++
PIXELSHADER_EARLYDEPTHSTENCIL
void Main(
	FVertexFactory InterpolantsVSTOPS Interpolants
	, FMobileBasePassInterpolantsVSTOPS BasePassInterpolantts
	, in float4 SvPosition:SV_Position
	OPTIONAL_IsFrontFace
	, out half4 OutColor : SV_Target0
	, out half4 OutColorAux : SV_Target1
#if DEFERRED_SHADING_PATH
```

```c++
OutColorAux.rgb=ShadingModelContext.Specularcolor;
OutColorAux.a=GBuffer.Roughness;
```

- 其中SpecularColor初始化值为计算得到的间接高光(延迟管线是在混合阶段计算)
```c++
ShadingModelContext.SpecularColor = (DielectricSpecular -)
ShadingModelContext.SpecularColor = GetEnvBRDF(ShadingMode
```

## TemporalAAHistory
- TemporalAA多帧累积的SceneColor,用于射线RayCast交点的屏幕坐标采样获取颜色
- 降噪作用(SSR默认Quality每个像素打一根Ray)
- 移植DesktopTAA替换MobileTAA(详细见图像处)

## HZBFurthest
- 可以理解为场景深度的Mipmap，用于RayMarching求交加速。
- 参考UE4.27移植（不是必须）

## SSR计算
- SpecularColor和Roughness从OutColorAux获取,WorldNormal通过SceneDepth重构获得
```c++
#if SHADING_PATH_DEFERRED
	FGBufferData GBuffer = GetGBufferDataFromSceneTextures(UV
#else
	FGBufferData GBuffer = (FGBufferData)0;
	GBuffer.ShadingModelID
	= SHADINGMODELID_DEFAULT_LIT;
	GBuffer.WorldNormal = normalize(ReconstructNorma1FromDept
	GBuffer.SpecularColor = MobileSceneColorAux.SampleLevel(
	GBuffer.Roughness = MobileSceneColorAux.SampleLevel(Mobil
	GBuffer.Depth = CalcSceneDepthByTexture(UV);
#endif
```

- SSR结果预乘SpecularColor,这样可以与SceneColorMobile做Blend One One混合
```c++
#if FEATURE_LEVEL == FEATURE_LEVEL_ES3_1
Outcolor.rgb*=GBuffer.SpecularColor;
#endif
```

## 结论
- 不足:重建的WorldNormal是面法线,没有延迟管线GBuffer的像素级法线,某些角度反射结果会有差异
- 早期的方案:OutColorAux的rg通道存WorldNormal,a通道存Roughness,b通道存SpecularColor的灰度值(某些光照环境下结果不准确,放弃)

# 实时平面反射
平面反射与DepthPass的兼容问题修改。
## 需求
在包含平面反射(裁剪平面开启)的场景中,开启Full Prepass的情况下,平面反射绘制的内容出现深度遮挡错误

**裁剪平面**
平面反射的裁剪平面(Global Clip Plane)用于保证绘制结果的正确--那些在反射相机的视锥体内,但在反射平面下方的物体不应该参与反射,需要被剔除掉

**硬件实现**
默认实现是通过SV_ClipDistance语义在模型的光栅化阶段剔除,但不是所有的平台都支持,移动平台BasePass走的是PS的clip剔除

## 实现方法
1. 自定义语义
DepthOnlyVS设置ClipDistance值,通过自定义语义插值传递给片段着色器DepthOnlyPS。
```c++
struct FDepthonlyVSTOPS
{
#if USE_PS_CLIP_PLANE
	float OutclipDistance : OUTCLIPDIST;
#endif
```

2. PS剔除
在DepthOnlyPS中用clip函数剔除(负值表示在裁剪平面以下,会被剔除)
```c++
#if USE_PS_CLIP_PLANE
	clip(Interpolants.OutClipDistance);
#endif
```

3. PS绑定条件
在移动平台,当场景包含平面反射的情况下走DepthOnlyPS

## 结论
- Depth Pass走PS会有额外开销,但仅限场景中包含平面反射的时候,其它情况下Depth Pass仍然可以不需要PS
- 另一种修改方案:当场景中包含平面反射的时候关闭Full Prepass,在某些效果依赖Full Prepass的时候不行(详细见接下来动态阴影分享)

# CSM策略优化
- 移除视锥外物体的阴影渲染

# ModulatedShadow渲染管线改造
## 需求
- 在角色展示时CSM阴影精度不够,阴影效果不稳定(ViewDependentWholeScene的阴影方式)
- 解决方案:Modulated Shadow具有独立的阴影视锥和阴影深度图区域,在阴影精度方面更有优势(Per-Object的阴影方式)

## 问题1:阴影重叠
- Modulated Shadow独立计算各个投影物体的阴影,与SceneColorMobile相乘输出,导致投影重叠区域多次与阴影颜色相乘被压黑
- 解决方案:增加一个中间RenderTarget,做为每个Per-Object阴影视锥的输出目标,最后对RT统一阴影颜色处理后,再与SceneColorMobile相乘输出
## 问题2:透明物体无阴影接收
- 阴影方式处理依赖场景深度,而透明物体不写场景深度
- 解决方案:透明物体的阴影Receive还是走CSM
## 问题3:在MobileBasePass之后计算
- 阴影信息需要早于MobileBassPass构造好,用于着色计算
- 考虑过的方案:MobileBassPass用上一帧的Modulated Shadow信息,但存在阴影拖影和透明物体阴影结合的问题
- 最终方案:参考UE4.27移植并开启Full Prepass,在MobileBassPass之前获得场景深度,构造好Modulated Shadow

## 结论
项目应用两套阴影方案:角色展示场景主要用Modulated Shadow,满足高精度的阴影效果需求,战斗场景用CSM,效率优先

# 特效性能 Separate Translucency透明渲染管线改进
修改方案:参考非移动端做透明渲染RenderPass与MobileBasePass分离。

1. SeparateTranslucencyColor
申请低分辨率的RenderTarget用于透明绘制,然后Upsample到SceneColorMobile上
2. SeparateTranslucencyDepth
SceneDepth需要跟SeparateTranslucencyColor做同比例Downsample

注意:SceneDepth的Resolve跨RenderPass渲染目标改变,基于Memoryless的SceneDepth获取方式需要改为从Texture中获取,比如:DepthFade,LookupDeviceZ

3. 重设SceneTextures
增加EMobileSceneTextureSetupMode去设置降分辨率后的SceneDepthTexture
```c++
(buseSeparateTranslucencyDepth && SceneContext.SeparaateTranslucencyDepth)
SceneTextureParameters.SceneDepthTexture=GetRDG(SceneContext.Separate
```

## 进一步需求
- 角色的透明材质不想受降透明分辨率影响
1.保证角色渲染的精度;2.透明和不透明的衔接部分因为精度不一样出现裂缝问题
## 解决方案
- 通过扩展材质上的SeparateTranslucency的勾选项灵活控制走Normal还是SeparateTranslucencyPass
## 与其他透明的乱序问题
- 通过角色透明写CustomeDepth,其他透明判断CustomDepth解决

## 结论
- 通过透明渲染分辨率可根据机型、画质和场景的不同灵活控制特效的GPU开销
- 透明渲染Pass拆分产生了更多的透明渲染乱序问题,通过设置Sort Priority,配合CustomDepth解决
- SceneCapture下的透明渲染:还是走Normal Translucency (SceneCapture需要使用alpha通道)

# 图像处理 Desktop Temporal AA移动端移植
## 需求
- MSAA对Depth Resolve支持的不好,无法满足渲染管线特性扩展的需求(SSPR、AO和Full Prepass等都需要Depth的Resolve)
- TemporalAA通过每帧使用不同的像素抖动Jitter,把采样结果分散到多帧,累积到History帧与当前帧混合,可以达到很好的抗锯效果
- MobileTAA只做两帧混合,抗锯效果不够,而且没有基于Velocity的像素修正,快速移动会有鬼影(Ghosting)

## 解决方案
**增加Velocity Pass**
- 可移动模型:更新Primitive的LocalToWorld和PreviousLocalToWorld
- 骨骼模型:需要上一帧的骨骼矩阵计算顶点位置,使用SRV Buffer代替Uniform Buffer传递骨骼变换矩阵(UniformBuffer有大小上限)
- VS计算出顶点当前和上一帧的屏幕空间坐标,传递给PS计算差值作为Velocity输出
```c++
// 3d velocity,includes camera an object motion
float3 Velocity = float3(ScreenPos - PrevScreenPos, DeeviceZ - PrevDeviceZ);
```

**Reprojection位置纠正**
- 在后期阶段,通过变换计算当前屏幕坐标在上一帧中的屏幕坐标,再结合Velocity数据对History帧做正确采样
```c++
float2 BackN = PosN.xy - PrevScreen;

BackN = DecodeVelocityFromTexture(EncodedVeloc:ty).xy;

HistoryScreenPosition = InputParams.ScreenPoS -BackN;
```

## 结论
- TAA整体抗锯效果最好,而且基于多帧的时间域实现,可以更好的与新渲染特性兼容,且对SSR起到降噪的作用
- TAA后期位置需放在Bloom之前,避免放在Bloom之后产生的flicker
- 在后期的末端加上FXAA,弥补TAA在后期管线上靠前对有些效果(比如AfterTonemap)抗锯不生效的问题

# 图像处理 Mobile FSR
## 具体方案
从UE5移植Mobile FSR 1.0，主要包含针对移动端优化的Upscale和锐化两个Pass。

# 3D UMG
Canvas Panel 3D
- 继承自Canvas Panel,增加透视相关参数,比如Camera的Anchor、FOV和Panel的Rotation、Offset等参数,OnPaint时转换成ViewProjection矩阵传递给Widget
- 优点:1.顶点还是2D,没有增加渲染开销;2.可在编辑器实时预览3D效果
- 不足:只有Canvas的深度信息,无法做顶点级别的深度效果

## 场景交互3DUI
- 新增SeparateTranslucencyAfterPostProcess半透明材质标识,对应新增一个Mesh Pass和Processor收集此类型MeshBatch,放在Tonemap之后绘制
- 解决默认的WidgetComponent受到Tonemap影响带来的色差问题
- 本质上是Mesh的透明渲染,有顶点级别的深度信息,可以访问SceneDepth来实现场景交互
## 需处理的问题
- Tonemap之后绘制,需跳过MobileBasePass的颜色纠正和Android平台的Y轴翻转
- TAA早于TranslucencyAfterPostprocess Pass生效,在该Pass绘制前,View的投影矩阵像素Jitter需去掉(HackRemoveTemporalAAProjectionJitter)

## 结论
- Canvas Panel3D类型满足最常用的界面需求;TranslucencyAfterPostprocess类型满足与场景交互的界面需求
- 抗锯齿:Canvas Panel 3D类型通过带MSAA的中间RenderTarget方式处理;TranslucencyAfterPostprocess类型依靠后期末尾的FXAA
- 其他:使用第三方NiagaraUIRenderer插件来满足UMG上显示特效的需求