计算数组c++的平均值

calculating the mean of an array c++

本文关键字：平均值 c++ 数组计算更新时间：2023-10-16

当我试图用两种方法计算数组的平均值时，遇到了一个问题。以下是代码：

float sum1, sum2, tmp, mean1, mean2;
double sum1_double, sum2_double, tmp_double;
int i, j;
int Nt=29040000;  //array size
int piecesize=32;
int Npiece=Nt/piecesize;
float* img;
float* d_img;
double* img_double;
img_double = (double*)calloc(Nt, sizeof(double));
cudaHostAlloc((void**)&img, sizeof(float)*Nt, cudaHostAllocDefault);
cudaMalloc((void**)&d_img, sizeof(float)*Nt);
...
//Some calculation is done in GPU and the results are stored in d_img;
...    
cudaMemcpy(img, d_img, Nt*sizeof(float), cudaMemcpyDeviceToHost);
for (i=0;i<Nt;i++) img_double[i]=(double)img[i];
//Method 1
sum1=0;
for (i=0;i<Nt;i++) 
{ sum1 += img[i]; }
sum1_double=0;
for (i=0;i<Nt;i++) 
{ sum1_double += img_double[i]; }
//Method 2
sum2=0;
for (i=0;i<Npiece;i++)
{   tmp=0; 
for (j=0;j<piecesize;j++)
{ tmp += img[i*piecesize+j];}
sum2 += tmp;
}
sum2_double=0;
for (i=0;i<Npiece;i++)
{   tmp_double=0; 
for (j=0;j<piecesize;j++)
{ tmp_double += img_double[i*piecesize+j];}
sum2_double += tmp_double;
}
mean1=sum1/(float)Nt;
mean2=sum2/(float)Nt;
mean1_double=sum1_double/(double)Nt;
mean2_double=sum2_double/(double)Nt;
cout<<setprecision(15)<<mean1<<endl;
cout<<setprecision(15)<<mean2<<endl;
cout<<setprecision(15)<<mean1_double<<endl;
cout<<setprecision(15)<<mean2_double<<endl;

输出：

132.221862792969
129.565872192383
129.565938340543
129.565938340543

两种方法得到的结果，mean1=129.6，mean2=132.2，有显著差异。我可以知道为什么吗？

提前感谢！

原因是浮点运算不精确。当你累加整数时，当abs(值(大于2²⁴时，float就变得不精确了(我假设这里是IEEE-754 32位(。例如，float无法精确存储16777217(根据舍入模式，它将变为16777216或16777218(。

假设您的第二次计算是更精确的计算，因为由于单独的tmp累积，损失的精度较小。

将sum1、sum2、tmp变量更改为long long int，希望两种计算都能得到相同的结果。

注意：我假设您的img存储整数数据。如果它存储浮动，那么没有简单的方法可以完美地解决这个问题。一种方法是对sum1、sum2和tmp使用double而不是float。差异会存在，但会小得多。还有一些技术可以比简单的求和更精确地计算CCD_ 12。就像卡汉总结。