CSharpGL实现顺序无关的半透明渲染

发表于2018-03-13

在 GL.Enable(GL_BLEND) 后渲染半透明物体时，由于顶点被渲染的顺序固定，渲染出来的结果往往很奇怪。红宝书里提到一个OIT(Order-Independent-Transparency)的渲染方法，很好的解决了这个问题。半透明渲染这个功能太有用了，于是就把这个方法加入CSharpGL中。

效果图

如下图所示，左边是常见的blend方法，右边是OIT渲染的结果。可以看到左边的渲染结果有些诡异，右边的就正常了。

网络允许的话可以看一下视频，更直观。

或者也可以看红宝书里的例子：左边是常见的blend方法，右边是OIT渲染的结果。

下载

CSharpGL

实现原理

源头

为什么通常的blend方式会有问题？因为blend的结果是与source、dest两个颜色的出现顺序相关的。就是说blend(blend(ColorA, ColorB), ColorC)≠blend(ColorA,blend(ColorB, ColorC))。

那么很显然的一个想法是，分两遍渲染，第一遍：把这个位置上的所有Color都存到一个链表里，第二遍：根据每个Color的深度值进行排序，然后进行blend操作。这就解决了blend顺序的问题。

W*H个链表

显然，为了对宽度、高度分别为Width、Height的窗口实施OIT渲染，必须为此窗口上的每个像素分别设置一个链表，用于存储投影到此像素上的各个Color。这就是W*H个链表的由来。

当然了，这个链表要由GLSL shader来操作。shader本身似乎没有操作链表的功能。那么就用一个大大的VBO来代替。这个VBO存储了所有的W*H个链表。

你可以想象，在第一遍渲染时，这个VBO的第二个位置上可能是第一个像素的第二个Color，也可能是第二个像素的第一个Color。这就意味着我们还需要一个数组来存放W*H个链表的头结点。这个数组我们用一个2DTexture实现，其大小正好等于Width*Height就可以了。

★这个Texture不像一般的Texture那样用于给模型贴图，而是用作记录头结点的信息。★

初始化

初始化工作主要包含这几项：创建和清空头结点Texture、链表VBO。

protected override void DoInitialize()
        ｛
            // Create head pointer texture
            GL.GetDelegateFor<GL.glActiveTexture>()(GL.GL_TEXTURE0);
            GL.GenTextures(1, head_pointer_texture);
            GL.BindTexture(GL.GL_TEXTURE_2D, head_pointer_texture[0]);
            GL.TexParameteri(GL.GL_TEXTURE_2D, GL.GL_TEXTURE_MIN_FILTER, (int)GL.GL_NEAREST);
            GL.TexParameteri(GL.GL_TEXTURE_2D, GL.GL_TEXTURE_MAG_FILTER, (int)GL.GL_NEAREST);
            GL.TexImage2D(GL.GL_TEXTURE_2D, 0, GL.GL_R32UI, MAX_FRAMEBUFFER_WIDTH, MAX_FRAMEBUFFER_HEIGHT, 0, GL.GL_RED_INTEGER, GL.GL_UNSIGNED_INT, IntPtr.Zero);
            GL.BindTexture(GL.GL_TEXTURE_2D, 0);
            GL.GetDelegateFor<GL.glBindImageTexture>()(0, head_pointer_texture[0], 0, true, 0, GL.GL_READ_WRITE, GL.GL_R32UI);
            // Create buffer for clearing the head pointer texture
            GL.GetDelegateFor<GL.glGenBuffers>()(1, head_pointer_clear_buffer);
            GL.BindBuffer(BufferTarget.PixelUnpackBuffer, head_pointer_clear_buffer[0]);
            GL.GetDelegateFor<GL.glBufferData>()(GL.GL_PIXEL_UNPACK_BUFFER, MAX_FRAMEBUFFER_WIDTH * MAX_FRAMEBUFFER_HEIGHT * sizeof(uint), IntPtr.Zero, GL.GL_STATIC_DRAW);
            IntPtr data = GL.MapBuffer(BufferTarget.PixelUnpackBuffer, MapBufferAccess.WriteOnly);
            unsafe
            ｛
                var array = (uint*)data.ToPointer();
                for (int i = 0; i < MAX_FRAMEBUFFER_WIDTH * MAX_FRAMEBUFFER_HEIGHT; i++)
                ｛
                    array[i] = 0;
                ｝
            ｝
            GL.UnmapBuffer(BufferTarget.PixelUnpackBuffer);
            GL.BindBuffer(BufferTarget.PixelUnpackBuffer, 0);
            // Create the atomic counter buffer
            GL.GetDelegateFor<GL.glGenBuffers>()(1, atomic_counter_buffer);
            GL.BindBuffer(BufferTarget.AtomicCounterBuffer, atomic_counter_buffer[0]);
            GL.GetDelegateFor<GL.glBufferData>()(GL.GL_ATOMIC_COUNTER_BUFFER, sizeof(uint), IntPtr.Zero, GL.GL_DYNAMIC_COPY);
            GL.BindBuffer(BufferTarget.AtomicCounterBuffer, 0);
            // Create the linked list storage buffer
            GL.GetDelegateFor<GL.glGenBuffers>()(1, linked_list_buffer);
            GL.BindBuffer(BufferTarget.TextureBuffer, linked_list_buffer[0]);
            GL.GetDelegateFor<GL.glBufferData>()(GL.GL_TEXTURE_BUFFER, MAX_FRAMEBUFFER_WIDTH * MAX_FRAMEBUFFER_HEIGHT * 3 * Marshal.SizeOf(typeof(vec4)), IntPtr.Zero, GL.GL_DYNAMIC_COPY);
            GL.BindBuffer(BufferTarget.TextureBuffer, 0);
            // Bind it to a texture (for use as a TBO)
            GL.GenTextures(1, linked_list_texture);
            GL.BindTexture(GL.GL_TEXTURE_BUFFER, linked_list_texture[0]);
            GL.GetDelegateFor<GL.glTexBuffer>()(GL.GL_TEXTURE_BUFFER, GL.GL_RGBA32UI, linked_list_buffer[0]);
            GL.BindTexture(GL.GL_TEXTURE_BUFFER, 0);
            GL.GetDelegateFor<GL.glBindImageTexture>()(1, linked_list_texture[0], 0, false, 0, GL.GL_WRITE_ONLY, GL.GL_RGBA32UI);
            GL.ClearDepth(1.0f);
        ｝
DoInitialize

2遍渲染

渲染过程主要有3步：重置链表、头结点、计数器等；1遍渲染填充链表；2遍渲染排序+blend。

protected override void DoRender(RenderEventArgs arg)
        ｛
            this.depthTestSwitch.On();
            this.cullFaceSwitch.On();
            // Reset atomic counter
            GL.GetDelegateFor<GL.glBindBufferBase>()(GL.GL_ATOMIC_COUNTER_BUFFER, 0, atomic_counter_buffer[0]);
            IntPtr data = GL.MapBuffer(BufferTarget.AtomicCounterBuffer, MapBufferAccess.WriteOnly);
            unsafe
            ｛
                var array = (uint*)data.ToPointer();
                array[0] = 0;
            ｝
            GL.UnmapBuffer(BufferTarget.AtomicCounterBuffer);
            GL.GetDelegateFor<GL.glBindBufferBase>()(GL.GL_ATOMIC_COUNTER_BUFFER, 0, 0);
            // Clear head-pointer image
            GL.BindBuffer(BufferTarget.PixelUnpackBuffer, head_pointer_clear_buffer[0]);
            GL.BindTexture(GL.GL_TEXTURE_2D, head_pointer_texture[0]);
            GL.TexSubImage2D(TexSubImage2DTarget.Texture2D, 0, 0, 0, arg.CanvasRect.Width, arg.CanvasRect.Height, TexSubImage2DFormats.RedInteger, TexSubImage2DType.UnsignedByte, IntPtr.Zero);
            GL.BindTexture(GL.GL_TEXTURE_2D, 0);
            GL.BindBuffer(BufferTarget.PixelUnpackBuffer, 0);
            //
            // Bind head-pointer image for read-write
            GL.GetDelegateFor<GL.glBindImageTexture>()(0, head_pointer_texture[0], 0, false, 0, GL.GL_READ_WRITE, GL.GL_R32UI);
            // Bind linked-list buffer for write
            GL.GetDelegateFor<GL.glBindImageTexture>()(1, linked_list_texture[0], 0, false, 0, GL.GL_WRITE_ONLY, GL.GL_RGBA32UI);
            mat4 model = mat4.identity();
            mat4 view = arg.Camera.GetViewMat4();
            mat4 projection = arg.Camera.GetProjectionMat4();
            this.buildListsRenderer.SetUniformValue("model_matrix", model);
            this.buildListsRenderer.SetUniformValue("view_matrix", view);
            this.buildListsRenderer.SetUniformValue("projection_matrix", projection);
            this.resolve_lists.SetUniformValue("model_matrix", model);
            this.resolve_lists.SetUniformValue("view_matrix", view);
            this.resolve_lists.SetUniformValue("projection_matrix", projection);
            // first pass
            this.buildListsRenderer.Render(arg);
            // second pass
            this.resolve_lists.Render(arg);
            GL.GetDelegateFor<GL.glBindImageTexture>()(1, 0, 0, false, 0, GL.GL_WRITE_ONLY, GL.GL_RGBA32UI);
            GL.GetDelegateFor<GL.glBindImageTexture>()(0, 0, 0, false, 0, GL.GL_READ_WRITE, GL.GL_R32UI);
            this.cullFaceSwitch.Off();
            this.depthTestSwitch.Off();
        ｝
protected override void DoRender(RenderEventArgs arg)

Shader:填充链表

1遍渲染时，用一个fragment shader来填充链表：

#version 420 core
layout (early_fragment_tests) in;
layout (binding = 0, r32ui) uniform uimage2D head_pointer_image;
layout (binding = 1, rgba32ui) uniform writeonly uimageBuffer list_buffer;
layout (binding = 0, offset = 0) uniform atomic_uint list_counter;
layout (location = 0) out vec4 color;
in vec4 surface_color;
uniform vec3 light_position = vec3(40.0, 20.0, 100.0);
void main(void)
｛
    uint index;
    uint old_head;
    uvec4 item;
    index = atomicCounterIncrement(list_counter);
    old_head = imageAtomicExchange(head_pointer_image, ivec2(gl_FragCoord.xy), uint(index));
    item.x = old_head;
    item.y = packUnorm4x8(surface_color);
    item.z = floatBitsToUint(gl_FragCoord.z);
    item.w = 255 / 4;
    imageStore(list_buffer, int(index), item);
    color = surface_color;
｝

Shader:排序、blend

2遍渲染时，用另一个fragment shader来排序和blend。

#version 420 core
/*
 * OpenGL Programming Guide - Order Independent Transparency Example
 *
 * This is the resolve shader for order independent transparency.
 */
// The per-pixel image containing the head pointers
layout (binding = 0, r32ui) uniform uimage2D head_pointer_image;
// Buffer containing linked lists of fragments
layout (binding = 1, rgba32ui) uniform uimageBuffer list_buffer;
// This is the output color
layout (location = 0) out vec4 color;
// This is the maximum number of overlapping fragments allowed
#define MAX_FRAGMENTS 40
// Temporary array used for sorting fragments
uvec4 fragment_list[MAX_FRAGMENTS];
void main(void)
｛
    uint current_index;
    uint fragment_count = 0;
    current_index = imageLoad(head_pointer_image, ivec2(gl_FragCoord).xy).x;
    while (current_index != 0 && fragment_count < MAX_FRAGMENTS)
    ｛
        uvec4 fragment = imageLoad(list_buffer, int(current_index));
        fragment_list[fragment_count] = fragment;
        current_index = fragment.x;
        fragment_count++;
    ｝
    uint i, j;
    if (fragment_count > 1)
    ｛
        for (i = 0; i < fragment_count - 1; i++)
        ｛
            for (j = i + 1; j < fragment_count; j++)
            ｛
                uvec4 fragment1 = fragment_list[i];
                uvec4 fragment2 = fragment_list[j];
                float depth1 = uintBitsToFloat(fragment1.z);
                float depth2 = uintBitsToFloat(fragment2.z);
                if (depth1 < depth2)
                ｛
                    fragment_list[i] = fragment2;
                    fragment_list[j] = fragment1;
                ｝
            ｝
        ｝
    ｝
    vec4 final_color = vec4(0.0);
    for (i = 0; i < fragment_count; i++)
    ｛
        vec4 modulator = unpackUnorm4x8(fragment_list[i].y);
        final_color = mix(final_color, modulator, modulator.a + fragment_list[i].w / 255);
    ｝
    color = final_color;
    // color = vec4(float(fragment_count) / float(MAX_FRAGMENTS));
｝
resolve_lists.frag

总结

经过这个OIT问题的练习，我忽然明白了一些modern opengl的设计思想。

在modern opengl看来，Texture虽然名为Texture，告诉我们它是用于给模型贴图的，但是，Texture实际上可以用作各种各样的事（例如OIT里用作记录各个头结点）。

一个VBO不仅仅可以用于存储顶点位置、法线、颜色等信息，也可以用作各种各样的事（例如OIT里用作存储W*H个链表，这让我想起了我的（小型单文件NoSQL数据库SharpFileDB）里的文件链表，两者何其相似）。

为什么会这样？

因为modern opengl是用GLSL shader来实施渲染的。Shader是一段程序，程序的创造力是无穷无尽的，你可以以任何方式使用opengl提供的资源（Texture，VBO等等）。唯一固定不变的，就是modern opengl的渲染管道（pipeline，“管道”太玄幻了，其实就是渲染过程的意思）。

记住pipeline的工作流程，认识opengl的各种资源，发挥想象力。

2遍渲染的成功试验，从侧面印证了上述推断，也说明了opengl只是负责渲染，至于渲染之后是不是画到画布或者其他什么地方，都是可以控制的。

甚至，“渲染”的目的本就不必是为了画图。这就是compute shader的由来了吧。

如社区发表内容存在侵权行为，您可以点击这里查看侵权投诉指引

标签：

渲染半透明 OpenGL List 模型贴图 Array

首页

出海助力

开发者社区

大奖赛

同行

合作案例

关于我们

CSharpGL实现顺序无关的半透明渲染