时间花在哪里

Where is the time being spent?

本文关键字:在哪里 时间      更新时间:2023-10-16

我有一个包含记录元素的xml文件。我正在将记录元素内的数据转换为PCAP格式。 代码如下所示。在 do 循环中,我只花费了 6 毫秒,但是当我在循环的边界上花费时间时,它表明我花费了 43 毫秒。这种差异从何而来?另外,我是循环内的内存新手。这是可以接受的做法,还是我应该将内存归零并重用它?重用会带来任何性能提升吗?循环内的时间如下所示

2012-05-14 07:26:48 线程ID(19404( 跟踪:开始时间:1030466589,结束时间:1030466589

2012-05-14 07:26:48 线程ID(19404( 跟踪:开始时间:1030466590,结束时间:1030466590

2012-05-14 07:26:48 线程ID(19404( 跟踪:开始时间:1030466591,结束时间:1030466591

2012-05-14 07:26:48 线程ID(19404( 跟踪:开始时间:1030466591,结束时间:1030466591

2012-05-14 07:26:48 线程 ID(19404( 跟踪:开始时间:1030466592,结束时间:1030466592

2012-05-14 07:26:48 线程ID(19404( 跟踪:开始时间:1030466593,结束时间:1030466593

2012-05-14 07:26:48 线程ID(19404( 跟踪:开始时间:1030466593,结束时间:1030466593

2012-05-14 07:26:48 线程ID(19404( 跟踪:开始时间:1030466594,结束时间:1030466594

2012-05-14 07:26:48 线程ID(19404( 跟踪:开始时间:1030466595,结束时间:1030466595

但是在 do 循环边界上的时间是2012-05-14 07:26:48 线程ID(19404( 跟踪:开始时间:1030466584,结束时间:1030466627

        static struct tms st_cpu;
        static struct tms et_cpu;
        clock_t end_time;
        clock_t start_time;
        char szData[100] = {0};
        clock_t st_total_time;
        clock_t et_total_time;
        static struct tms st_total_cpu;
        static struct tms et_total_cpu;
        st_total_time = times(&st_total_cpu);
        do {
        char *pBuffer = new char[m_nBufferLen];
        memset(pBuffer,0,m_nBufferLen);
            if(fgets(pBuffer,m_nBufferLen,fpcap) != NULL)
            {
                    char *pRecord = NULL;
                    if((pRecord = strstr(pBuffer,"<rec ")) != NULL)
                    {
                            start_time = times(&st_cpu);
                            CXMLParser objXMLParser(pBuffer);
                            objXMLParser.ProcessRecord();
                            objPCAPGenerator.GeneratePCAPRecord(&objXMLParser);
                            end_time = times(&et_cpu);
                            sprintf(szData,"start Time:%ld,End Time:%ld",start_time,end_time);
                            CLog::PrintLog(DBG_TRACE,"%s",szData);

                            sprintf(szData,"Real Time: %ld,UserTime:%ld,SystemTime:%ld",
                                            end_time-start_time,
                                            (et_cpu.tms_utime + et_cpu.tms_cutime) - (st_cpu.tms_utime + st_cpu.tms_cutime),
                                            (et_cpu.tms_stime + et_cpu.tms_cstime) -(st_cpu.tms_stime + st_cpu.tms_cstime)
                                            );
                            CLog::PrintLog(DBG_TRACE,"%s",szData);
                    }
            }
            else
            {
                    bEnd = true;
            }
    }while(bEnd != true);
    et_total_time = times(&et_total_cpu);
    sprintf(szData,"start Time:%ld,End Time:%ld",st_total_time,et_total_time);
    CLog::PrintLog(DBG_TRACE,"%s",szData);

    sprintf(szData,"Total Real Time: %ld,Total UserTime:%ld,Total SystemTime:%ld",
                    et_total_time-st_total_time,
                    (et_total_cpu.tms_utime + et_total_cpu.tms_cutime) - (st_total_cpu.tms_utime + st_total_cpu.tms_cutime),
                    (et_total_cpu.tms_stime + et_total_cpu.tms_cstime) -(st_total_cpu.tms_stime + st_total_cpu.tms_cstime)
                    );
    CLog::PrintLog(DBG_TRACE,"%s",szData);

一般来说,分配内存是一项相对昂贵的操作,因此如果这是性能关键型代码,则绝对应该重用分配的内存块。

另外,请记住删除您正在分配的内存。我看不到它现在正在完成。

当然,您可以并且应该分析您的代码,但仅从一瞥中,我看到了两个基本问题:

  1. 您正在为每次迭代重新分配缓冲区。这是必要的还是可以使用相同的缓冲区?顺便说一句,您无需在读取之前将其内存为 0,只需在字符串读取后放置一个尾随零即可。

  2. 是否有必要在每次迭代中从文件中读取? 如果文件很大并且无法放入内存,这当然是必要的。 如果文件具有已知的相对较小的大小,只需将其读取到一个大缓冲区,然后解析它,它会快得多。