顶点属性 - 对顶点位置使用短点而不是浮点数

Vertex attributes - using short instead of float for vertex positions

本文关键字：顶点浮点数属性位置更新时间：2023-10-16

目前我有以下设置，到目前为止工作正常。

struct Vertex {
    glm::vec3 position;
    glm::vec3 normal;
    glm::vec2 texCoord;
}
std::vector<Vertex> vertices;

顶点属性：

glEnableVertexAttribArray(0);
glVertexAttribPointer(0, 3, GL_FLOAT, GL_FALSE, sizeof(Vertex), (void*) offsetof(Vertex, Vertex::position)); 
glEnableVertexAttribArray(1);
glVertexAttribPointer(1, 3, GL_FLOAT, GL_FALSE, sizeof(Vertex), (void*) offsetof(Vertex, Vertex::normal));
glEnableVertexAttribArray(2);
glVertexAttribPointer(2, 2, GL_FLOAT, GL_FALSE, sizeof(Vertex), (void*) offsetof(Vertex, Vertex::texCoord));

现在，我想通过将顶点属性从浮点数更改为短线来提高性能。我尝试从顶点位置开始。

OpenGL的顶点规范最佳实践告诉我：

职位 [...] 为此，请重新排列模型空间数据，以便将所有位置打包在原点周围的 [-1， 1] 框中。您可以通过在所有位置中查找 XYZ 中的最小/最大值来做到这一点。然后从所有顶点位置减去最小/最大框的中心点;然后将所有位置缩放最小/最大框的宽度/高度/深度的一半。您需要保持中心点和比例因子。构建模型到视图矩阵（或模型到任意矩阵）时，需要在转换堆栈的顶部应用中心点偏移和缩放（因此在最后，就在绘制之前）。

我也读了这个线程。

这就是为什么我添加了这个预处理步骤，将所有顶点映射到 [-1,1]

for (auto& v : vertices) {
    v.position = (v.position - center) * halfAxisLengths;
}

并在顶点着色器中重新填充它

vec4 rescaledPos = vec4(in_pos, 1.0) * vec4(halfAxisLengths, 1.0) + vec4(center, 0.0);
gl_Position = P * V * M * rescaledPos;

我的顶点属性使用 GL_SHORT 而不是 GL_FLOAT ，并将规范化设置为 GL_TRUE ：

glEnableVertexAttribArray(0);
glVertexAttribPointer(0, 3, GL_SHORT, GL_TRUE, sizeof(Vertex), (void*) offsetof(Vertex, Vertex::position));

结果，我只是得到了一堆三角形，但没有增加 fps 的模型。

这是将顶点属性设置为短的正确方法吗？

还是必须更改完整的顶点结构？如果是，最好的方法是什么（带有短裤的glm矢量？

一个工作的例子会很棒，我找不到。

我调整了顶点缓冲区的数据结构：

struct newVertex {
    GLshort position[4]; // for GL_SHORT
    GLint normal; // for GL_INT_2_10_10_10_REV
    GLshort texCoord[2]; // for GL_SHORT
};

结果，我获得了~20%的性能提升。

还是必须更改完整的顶点结构？

是的，OpenGL不会神奇地为您进行转换。但是，如果性能是您的目标...

现在，我想通过将顶点属性从浮点数更改为短线来提高性能。

这实际上会损害性能。GPU 针对将矢量处理为浮点值进行了优化。这反过来又会影响内存接口，该接口旨在为 32 位对齐的访问提供最佳性能。通过提交为 16 位短整数，您将强制当前 GPU 行执行次优内存访问和中间转换步骤。

如果性能是您的目标，请坚持单精度浮点数。如果你不相信我：基准测试它。