如何更快地绘制许多带纹理的四边形,并保留 glScissor(或类似的东西)

How to draw many textured quads faster, and retain glScissor (or something like it)?

本文关键字:glScissor 保留 绘制 何更快 许多带 纹理 四边形      更新时间:2023-10-16

我正在使用OpenGL 4和C++11。

目前,我使用单独的VAO与单独的VBO和IBO进行一大堆单独的调用glDrawElements

我这样做是因为每个纹理坐标都会发生变化,而我的顶点数据具有纹理坐标。我知道这个顶点数据中有一些多余的位置信息;但是,它始终是 -1,-1,1,1,1,因为我在顶点着色器中使用平移和缩放矩阵来定位和缩放顶点数据。

VAO、VBO、IBO、位置和缩放矩阵以及纹理 ID 存储在对象中。它是每个四边形一个对象。

目前,某些绘图将如下所示:

  1. 通过 ( glDrawElements(GL_TRIANGLES, 6, GL_UNSIGNED_INT,0) 绘制一个四边形对象。绑定的 VBO 只有 -1,-1,1,1,1,IBO 给我画了一个四边形。绑定的 VBO 包含公共纹理的纹理坐标(用于为所有绘制的四边形设置纹理的相同纹理)。着色器上的矩阵变换可以定位它。
  2. 对另一个四元对象重复此操作
  3. 调用glEnable(GL_SCISSOR_TEST),并在调用glScissor时使用预览四边形的位置信息
  4. 绘制下一个四边形对象;实际上只显示前一个四边形对象可见的部分。
  5. 绘制另一个四边形对象

我现在得到的性能是可以接受的,但我希望它更快,因为我只是触及了我的想法的表面。所以我正在考虑优化。到目前为止,我已经读到我应该:

  1. 从我的顶点数据中删除位置信息,只保留纹理坐标。而是在绘制四边形的开头绑定单个位置 VBO,以便所有人都使用它。

    但我不确定这将如何工作?因为我在任何时候只能有一个 VBO 处于活动状态。

    然后,我是否必须在绘制每个四边形之前调用glBufferSubData并更新纹理坐标?这是更好的性能还是更差的性能(对每个对象的glBindVertexArray调用还是对glBufferSubData的调用?

    我是否还会将位置和比例作为矩阵传递给着色器,我会借此机会更新顶点的位置信息以及纹理坐标吗?哪个会更快?

  2. 创建一个带或不带 IBO 的大 VBO,并更新其中每个四边形的位置的顶点数据(而不是使用变换和缩放矩阵)。这似乎很难管理。

    即使我确实设法做到了这一点;我只有一个glDraw电话;听起来很快。这是真的吗?单个glBindVertexArray调用对多个调用的性能影响是什么?

    我认为没有任何方法可以使用此方法来实现我现在正在进行的glScissor调用之类的东西?

  3. 我读过的另一个选项是实例化。所以我画了四边形,无论我需要多少次;这意味着我会向着色器传递一个平移矩阵数组和一个纹理坐标数组?

    这会快很多吗?

    我想我可以通过传递一个额外的布尔数组来做一些类似于glScissor测试的事情,该数组定义了当前四边形是否应该只在前一个的范围内绘制。但是,我认为这意味着对于每个gl_InstanceID,我都必须遍历所有以前的实例以查找真值和假值,而且看起来会很慢。

我试图通过不单独实现所有这些来节省时间。希望专家可以指出我哪个可能更好。如果有人有更好的主意,请告诉我。

  1. 您可以将多个 VBO 附加到不同的属性!

按照 seqence 将 2 个 VBO 绑定到 attribs 0 和 1,请注意,glBindBuffer() 暂时绑定缓冲区,并且实际的 VBO 赋值是在 glVertexAttribPointer() 期间进行的。

glBindBuffer(GL_ARRAY_BUFFER,buf1);
glVertexAttribPointer(0, ...);
glEnableVertexAttribArray(0);
glBindBuffer(GL_ARRAY_BUFFER,buf2);
glVertexAttribPointer(1, ...);
glEnableVertexAttribArray(1);

提供四边形位置和大小的最快方法是使用纹理并在顶点着色器中对其进行采样。当然,您至少需要RGBA(x,y,宽度,高度)16位/通道纹理。但是你可以使用 glTexSubImage2D() 更新四边形位置,或者你甚至可以通过 FBO 渲染它们。

除此之外的所有内容都会执行得更慢,当然,如果您愿意,我们可以详细说明在 vbos 中使用制服、属性或使用没有启用数组的属性。

把所有放在一起:

  • 使用单个 VBO,在其中存储四 ID (INT) + 纹理数据
  • 准备 x,y,w,h 纹理,定义从四边形 id 到此纹理 texcoord 的映射,即:U=quad_id&0xFF , v=(quad_id>>8) (对于纹理 256x256 最大 65536 四边形)
  • 使用顶点着色器从该纹理中采样置换和大小(对于存储在属性中的给定quad_id(或使用 vertex_ID/4 或 vertex_ID/6)
  • 填充 VBO 和纹理
  • 使用绘制元素的单个绘制数组绘制所有内容