Как посчитать время выполнения программы си

Содержание

Мне нужно вычислить время выполнения кода кода С++ за считанные секунды. Он должен работать как на Windows, так и на Unix-машинах.

Я использую код для этого кода. (импорт до этого)

clock_t startTime = clock(); // some code here // to compute its execution duration in runtime cout

Однако для небольших входов или коротких операторов, таких как a = a + 1, я получаю результат “0 секунд”. Я думаю, что это должно быть что-то вроде 0,0000001 секунд или что-то в этом роде.

Я помню, что System.nanoTime() в Java работает очень хорошо в этом случае. Однако я не могу получить такую же точную функциональность из clock() функции С++.

У вас есть решение?

Лучший ответ:

Вы можете использовать эту функцию, которую я написал. Вы вызываете GetTimeMs64() , и он возвращает количество миллисекунд, прошедших с момента unix с использованием системных часов – точно так же, как time(NULL) , за исключением миллисекунд.

Он работает как с окнами, так и с linux; он безопасен по потоку.

Получение времени и даты в C/C++ Windows

Обратите внимание, что гранулярность составляет 15 мс на окнах; на linux он зависит от реализации, но обычно он составляет 15 мс.

#ifdef _WIN32 #include #else #include #include #endif /* Remove if already defined */ typedef long long int64; typedef unsigned long long uint64; /* Returns the amount of milliseconds elapsed since the UNIX epoch. Works on both * windows and linux. */ uint64 GetTimeMs64() < #ifdef _WIN32 /* Windows */ FILETIME ft; LARGE_INTEGER li; /* Get the amount of 100 nano seconds intervals elapsed since January 1, 1601 (UTC) and copy it * to a LARGE_INTEGER structure. */ GetSystemTimeAsFileTime( li.LowPart = ft.dwLowDateTime; li.HighPart = ft.dwHighDateTime; uint64 ret = li.QuadPart; ret -= 116444736000000000LL; /* Convert from file time to UNIX epoch time. */ ret /= 10000; /* From 100 nano seconds (10^-7) to 1 millisecond (10^-3) intervals */ return ret; #else /* Linux */ struct timeval tv; gettimeofday( uint64 ret = tv.tv_usec; /* Convert from micro seconds (10^-6) to milliseconds (10^-3) */ ret /= 1000; /* Adds the seconds (10^0) after converting them to milliseconds (10^-3) */ ret += (tv.tv_sec * 1000); return ret; #endif >

У меня есть другой рабочий пример, который использует микросекунды (UNIX, POSIX и т.д.).

#include typedef unsigned long long timestamp_t; static timestamp_t get_timestamp () < struct timeval now; gettimeofday ( return now.tv_usec + (timestamp_t)now.tv_sec * 1000000; >. timestamp_t t0 = get_timestamp(); // Process timestamp_t t1 = get_timestamp(); double secs = (t1 — t0) / 1000000.0L;

Здесь файл, где мы закодировали это:

Вот простое решение в С++ 11, которое дает вам удовлетворительное разрешение.

#include #include class Timer < public: Timer() : beg_(clock_::now()) <>void reset() < beg_ = clock_::now(); >double elapsed() const < return std::chrono::duration_cast(clock_::now() — beg_).count(); > private: typedef std::chrono::high_resolution_clock clock_; typedef std::chrono::duration > second_; std::chrono::time_point beg_; >;

Или на * nix, для С++ 03

Вычислительная сложность алгоритма

#include #include class Timer < public: Timer() < clock_gettime(CLOCK_REALTIME, >double elapsed() < clock_gettime(CLOCK_REALTIME, return end_.tv_sec — beg_.tv_sec + (end_.tv_nsec — beg_.tv_nsec) / 1000000000.; >void reset() < clock_gettime(CLOCK_REALTIME, >private: timespec beg_, end_; >;

Вот пример использования:

int main()
#include using namespace boost; int main (int argc, const char * argv[]) < progress_timer timer; // do stuff, preferably in a 100x loop to make it take longer. return 0; >

Когда progress_timer выходит за пределы области видимости, он распечатает время, прошедшее с момента его создания.

UPDATE. Я сделал простую отдельную замену (OSX/iOS, но легко переносится): https://github.com/catnapgames/TestTimerScoped

Windows предоставляет функцию QueryPerformanceCounter(), а Unix имеет gettimeofday() Обе функции могут измерять как минимум 1 разницу в микросекундах.

В некоторых программах, которые я написал, я использовал RDTS для этой цели. RDTSC – это не время, а количество циклов от начала процессора. Вы должны откалибровать его в своей системе, чтобы получить результат во втором, но это очень удобно, когда вы хотите оценить производительность, даже лучше использовать количество циклов напрямую, не пытаясь изменить их на секунды.

(ссылка выше на французскую страницу wikipedia, но она содержит образцы кода на С++, английская версия здесь)

Я предлагаю использовать стандартные библиотечные функции для получения информации о времени из системы.

Если вы хотите более точное разрешение, выполните больше итераций выполнения. Вместо того, чтобы запускать программу один раз и получать образцы, запустите ее 1000 раз и более.

Лучше запускать внутренний цикл несколько раз с временной синхронизацией производительности только один раз и средним путем деления повторений внутреннего цикла, чем на несколько раз и в среднем на выполнение всего (цикл + время выполнения производительности). Это уменьшит накладные расходы на код синхронизации производительности по сравнению с фактическим профилированным сектором.

Оберните свои таймерные вызовы для соответствующей системы. Для Windows QueryPerformanceCounter работает довольно быстро и “безопасно”.

Вы можете использовать “rdtsc” на любом современном ПК X86, но могут возникнуть проблемы с некоторыми многоядерными машинами (скачкообразная перестройка ядра может изменить таймер) или если у вас включен какой-то ускоренный шаг.

Полное надежное решение для планирования потоков, которое должно давать одинаковое время для каждого теста, состоит в том, чтобы скомпилировать вашу программу, чтобы она не зависела от ОС, и загрузить компьютер, чтобы запустить программу в среде без ОС. Тем не менее, это в значительной степени непрактично и в лучшем случае будет сложно.

Хорошей заменой освобождению от ОС является просто установление привязки текущего потока к 1 ядру и приоритету наивысшего. Эта альтернатива должна обеспечивать достаточно последовательные результаты.

Также вам следует отключить оптимизации, которые будут мешать отладке, что для g++ или gcc означает добавление -Og в командную строку, чтобы предотвратить оптимизацию тестируемого кода. Флаг -O0 не должен использоваться, потому что он вводит дополнительные ненужные издержки, которые будут включены в результаты синхронизации, таким образом искажая синхронизированную скорость кода.

Напротив, если предположить, что вы используете -Ofast (или, по крайней мере, -O3 ) в окончательной сборке, и игнорировать проблему “мертвого” удаления кода, -Og выполняет очень мало оптимизаций по сравнению с -Ofast ; таким образом, -Og может исказить реальную скорость кода в конечном продукте.

Кроме того, все тесты скорости (до некоторой степени) ложны: в конечном продукте, скомпилированном с помощью -Ofast , каждый фрагмент/раздел/функция кода не изолирован; скорее, каждый фрагмент кода непрерывно перетекает в следующий, что позволяет компилятору потенциально объединять, объединять и оптимизировать куски кода повсюду.

В то же время, если вы тестируете фрагмент кода, который интенсивно использует realloc() , тогда фрагмент кода может работать медленнее в производственном продукте с достаточно высокой фрагментацией памяти. Следовательно, выражение “целое больше, чем сумма его частей” применимо к этой ситуации, поскольку код в окончательной рабочей сборке может выполняться заметно быстрее или медленнее, чем отдельный фрагмент, который вы тестируете на скорость.

Частичное решение, которое может уменьшить несоответствие, заключается в использовании -Ofast для тестирования скорости с добавлением asm volatile(«» :: «r»(var)) к переменным, участвующим в тесте, для предотвращения мертвого кода/устранения петель.

Вот пример того, как тестировать функции квадратного корня на компьютере с Windows.

// set USE_ASM_TO_PREVENT_ELIMINATION to 0 to prevent ‘asm volatile(«» :: «r»(var))’ // set USE_ASM_TO_PREVENT_ELIMINATION to 1 to enforce ‘asm volatile(«» :: «r»(var))’ #define USE_ASM_TO_PREVENT_ELIMINATION 1 #include #include #include #include #include #include #include #pragma intrinsic(__rdtsc) #include class Timer < public: Timer() : beg_(clock_::now()) <>void reset() < beg_ = clock_::now(); >double elapsed() const < return std::chrono::duration_cast(clock_::now() — beg_).count(); > private: typedef std::chrono::high_resolution_clock clock_; typedef std::chrono::duration > second_; std::chrono::time_point beg_; >; unsigned int guess_sqrt32(register unsigned int n) < register unsigned int g = 0x8000; if(g*g >n) < g ^= 0x8000; >g |= 0x4000; if(g*g > n) < g ^= 0x4000; >g |= 0x2000; if(g*g > n) < g ^= 0x2000; >g |= 0x1000; if(g*g > n) < g ^= 0x1000; >g |= 0x0800; if(g*g > n) < g ^= 0x0800; >g |= 0x0400; if(g*g > n) < g ^= 0x0400; >g |= 0x0200; if(g*g > n) < g ^= 0x0200; >g |= 0x0100; if(g*g > n) < g ^= 0x0100; >g |= 0x0080; if(g*g > n) < g ^= 0x0080; >g |= 0x0040; if(g*g > n) < g ^= 0x0040; >g |= 0x0020; if(g*g > n) < g ^= 0x0020; >g |= 0x0010; if(g*g > n) < g ^= 0x0010; >g |= 0x0008; if(g*g > n) < g ^= 0x0008; >g |= 0x0004; if(g*g > n) < g ^= 0x0004; >g |= 0x0002; if(g*g > n) < g ^= 0x0002; >g |= 0x0001; if(g*g > n) < g ^= 0x0001; >return g; > unsigned int empty_function( unsigned int _input ) < return _input; >unsigned long long empty_ticks=0; double empty_seconds=0; Timer my_time; template void benchmark( char* function_name, auto (*function_to_do)( auto ) ) < register unsigned int i=benchmark_repetitions; register unsigned long long start=0; my_time.reset(); start=__rdtsc(); while ( i— ) < auto result = (*function_to_do)( i if ( function_name == nullptr ) < empty_ticks = (__rdtsc()-start); empty_seconds = my_time.elapsed(); std::coutelse < std::cout> int main( void ) < void* Cur_Thread= GetCurrentThread(); void* Cur_Process= GetCurrentProcess(); unsigned long long Current_Affinity; unsigned long long System_Affinity; unsigned long long furthest_affinity; unsigned long long nearest_affinity; if( ! SetThreadPriority(Cur_Thread,THREAD_PRIORITY_TIME_CRITICAL) ) < SetThreadPriority( Cur_Thread, THREAD_PRIORITY_HIGHEST ); >if( ! SetPriorityClass(Cur_Process,REALTIME_PRIORITY_CLASS) ) < SetPriorityClass( Cur_Process, HIGH_PRIORITY_CLASS ); >GetProcessAffinityMask( Cur_Process, System_Affinity ); furthest_affinity = 0x8000000000000000ULL>>__builtin_clzll(Current_Affinity); nearest_affinity = 0x0000000000000001ULL( nullptr, empty_function ); benchmark( «Standard Square Root», standard_sqrt ); benchmark( «Original Guess Square Root», original_guess_sqrt32 ); benchmark( «New Guess Square Root», new_guess_sqrt32 ); SetThreadPriority( Cur_Thread, THREAD_PRIORITY_IDLE ); SetPriorityClass( Cur_Process, IDLE_PRIORITY_CLASS ); SetProcessAffinityMask( Cur_Process, nearest_affinity ); SetThreadAffinityMask( Cur_Thread, nearest_affinity ); for (;;) < getchar(); >return 0; >

Измерить время исполнения кода на C/C++ с помощью функции clock()

Доброго времени суток! Представьте, вы написали очень крутую программу, она решает поставленную задачу, алгоритм отточен до мельчайших деталей, код отрефакторен так, что сам господь улыбнется при его чтении, все отлично! Вы пришли на работу(учебу, тусовку пограмистов) и всем его показали, и тут «Васек» спросит: «А быстро работает?». И тут вы понимаете свою ошибку!

Не измерили скорость работы программы! Не потестировали с разной нагрузкой, и вообще, там может быть куча дыр связанных, которые покажутся только при стрессовой нагрузке.

Ладно, хватит. На самом деле, я просто хотел написать о том, как измерить скорость исполнения любого участка кода. Сделать это можно на любом языке программирования, каждый язык каким либо образом да сможет обратиться к системе и спросить текущее время в миллисекундах.

Я расскажу про C/C++ просто потому что именно на этих языках чаще всего измерял скорость работы кода, для самых разнообразных учебных задач. От сортировки пузырьком до топологической сортировки графов.

Специальный тип данных clock_t в C/C++

Это не что иное, как алиас(кличка, переименование) стандартного арифметического типа данных. В значение ставится количество процессорных тиков с момента его запуска. Получить это значение можно с помощью функции clock() из библиотеки . Для того, чтобы перевести количество тиков в секунды используется константа из той же библиотеки CLOCKS_PER_SEC . Просто делим и получаем ответ.

//Специальный тип данных из библиотеки time.h clock_t currentTime; //Берем текущее системное время currentTime = clock(); //Участок кода, который нужно измерить for(int i = 0; i < 9000; i++) < i *= i; >//Берем разницу currentTime = clock() — currentTime; //Переводим в секунды currentTime = (double)currentTime / CLOCKS_PER_SEC;

Источник: mindhalls.ru

Windows: Как рассчитать время выполнения приложения c/С++?

Я делаю тест сравнения производительности. Я хочу записать время выполнения для моего тестового приложения С++ и сравнить его при разных обстоятельствах. Двумя случаями, которые следует сравнить, являются: 1) установлен и активен драйвер файловой системы и 2) также, когда тот же драйвер файловой системы не установлен и не активен.
Серия тестов будет проводиться в нескольких операционных системах, а два прогона, описанных выше, будут выполняться для каждой операционной системы и ее настройки. Результаты будут сравниваться только между двумя случаями для данной операционной системы и настройки.
Я понимаю, что при запуске приложения c/С++ в операционной системе, которая не является системой реального времени, нет способа получить реальное время, которое потребовалось для запуска приложения. Я не думаю, что это большая проблема, если тестовое приложение работает довольно долгое время, поэтому планирование, приоритеты, переключение и т.д. Процессора незначительно.
Отредактировано: только для платформы Windows
Как я могу генерировать некоторые точные результаты времени выполнения приложения в моем тестовом приложении?

спросил(а) 2010-01-21T01:14:00+03:00 13 лет, 5 месяцев назад

Источник: progi.pro

Измерить время исполнения кода на C/C++ с помощью функции clock()

Специальный тип данных clock_t в C/C++

Windows: Как рассчитать время выполнения приложения c/С++?

Составьте блок схему и программу вычисления значения функции вариант 3

Напиши программу которая в последовательности натуральных чисел определяет количество чисел кратных

Как записать музыку на сд диск в формате сд программа

Какая нужна программа на телефон чтобы скачивать музыку на телефон

Если не хватает места на диске с для установки программы

Задачи по ознакомлению с формой и геометрическими фигурами в программе радуга

Как расширение имени файла связано с форматом файла и программой обработки

Что программа 12111 переводит число 50 в число 20 определите значение b