Unity ImageEffect 效率分析

发表于2016-05-10

一、问题

Unity引擎里对渲染后期处理效果很多，如Bloom、运动模糊、景深等效果。实现过程是在作用的摄像机上加脚本并实现OnRenderImage方法，Graphics.Blit(source, destination, material)；使用材质material的shader处理帧缓存的数据，再拷贝回屏幕帧缓存。

使用ImageEffect之后，发现在某些机型上（华为mate7、三星N7100），运行效率极低，明显卡顿。UnityProfiler查看真机渲染情况

二、调查分析

Unity文档并没有相关的详细介绍，实现的细节也不得而知。论坛里Camera.AAResolve解释为与抗锯齿有关系，关闭全屏抗锯齿之后测试，确实不会卡顿了。

目前主流移动 GPU 由三家公司生产，英国 Imagination 公司的 SGX 系列，美国高通公司的 Adreno 系列，以及著名显卡芯片商美国 NVIDIA 公司的移动 GeForce 系列。Arm的mali作为非主流，但在市场上有不小的份额，华为Mate7、三星N7100的GPU正是mali系列。

使用Mali Graphics Debugger查看渲染如图：

在前2个drawcall里都调用了glReadPixels接口

在glReadPixels的最后个参数不为空，则表示数据从显存传输到系统内存，从CPU到GPU的逆向传输，这是非常缓慢的过程，并且是阻塞模式。

看看其它机型渲染情况，下面是高通的gpu，使用adrenoprofiler查看。

它并没有调用glReadPixels，而是使用了glBindFramebuffer。FBO(Frame buffer object)在使用前需要绑定，void glBindFramebuffer(GLenum target, GLuint id)；第一个参数是指定绑定操作，读、写或可读可写。第二个参数指定绑定的对象，如果是0，则是默认的帧缓存对象。

这是使用了改变渲染目标缓存的方法。

由此可知不同硬件上处理的方式不一样，具体是因为Unity内部实现的原因或是硬件支持不够。查看opengl版本的版本历史和发展