Кажусь ими используемый в консервном заводе (Фрукты и Овощи). Старая DOS-программа, которые набирают номер через модем на 28.8 Кбит/с, раскрыла груду и их печать к ТОЧЕЧНОЙ МАТРИЦЕ.
Использовался, потому что мы могли углерод копировать его.....
(Все еще не смотрите, почему это могло быть обновлено для использования лазерного принтера и печати дважды?)
Вопрос - то, что Вы подразумеваете под флопс? Если все, о чем Вы заботитесь, - то, сколько из самых простых операций с плавающей точкой на часы, это, вероятно, 3x Ваша тактовая частота, но это почти столь же бессмысленно как bogomips. Некоторая операция в секунду с плавающей точкой занимает много времени (разделитесь для начинающих), добавьте и умножьтесь, обычно быстры (один на fp единицу на часы). Следующий выпуск является производительностью памяти, существует причина, последняя классическая CRAY имела 31 сегмент памяти, в конечном счете производительность ЦП ограничена тем, как быстро можно считать и записать в память, поэтому в какой уровень кэширования проблема помещается? Linpack был реальным сравнительным тестом однажды, теперь он помещается в кэш (L2, если не L1), и больше чистого теоретического сравнительного теста ЦП. И конечно, Ваш SSE (и т.д.) единицы могут добавить производительность с плавающей точкой также.
Какой дистрибутив Вы выполняете?
Это было похоже на хороший указатель: http://linuxtoolkit.blogspot.com/2009/04/intel-optimized-linpack-benchmark-for.html
http://onemansjourneyintolinux.blogspot.com/2008/12/show-us-yer-flops.html
http://www.phoronix-test-suite.com/ мог бы быть более легким способом установить сравнительный тест флопс.
Тем не менее я действительно задаюсь вопросом, почему Вы заботитесь, для чего Вы используете его? Если Вы просто хотите бессмысленное число, Ваши системы bogomips находится все еще тут же в dmesg.
Одним сравнительным тестом, который традиционно использовался для измерения флопс, является Linpack. Другим общим сравнительным тестом флопс является Точильный камень.
Больше чтения: запись "флопс" Википедии, запись Точильного камня, запись Linpack
Я настоятельно рекомендую готовую-к-управляемому сборку linpack от Intel: http://software.intel.com/en-us/articles/intel-math-kernel-library-linpack-download/
Поскольку Вы упоминаете кластер, мы использовали комплект HPCC. Это прилагает немного усилий, чтобы установить и настроиться, но в нашем случае точка не хвастала по сути, это была часть критериев допустимости для кластера; некоторое сравнительное тестирование производительности, по моему скромному мнению, жизненно важно, чтобы гарантировать, что аппаратные средства работают, как рекламируется, все является подключаемым с помощью кабеля вместе правильно и т.д.
Теперь, если Вы просто хотите теоретический пик число флопс, что каждый легок. Просто проверьте некоторую статью о ЦП (скажите на realworldtech.com или somesuch) надевать информацию, сколько DP флопс ядро процессора может сделать на такт (с текущим x86 ЦП этому обычно 4 года). Затем общий пик флопс справедлив
количество ядер * флопс/цикл * частота
Затем для кластера с сетью IB необходимо смочь поразить приблизительно 80% пика флопс на HPL (какой BTW является одним из сравнительных тестов в HPCC).
apparently there's a "sysbench" benchmark package and command:
sudo apt-get install sysbench
(or brew install sysbench
OS X)
run it like this:
sysbench --test=cpu --cpu-max-prime=20000 --num-threads=2 run
output for comparisons:
total time: 15.3047s
ref: http://www.midwesternmac.com/blogs/jeff-geerling/2013-vps-benchmarks-linode
Для приблизительных оценок:
Raspberry Pi 2 : 299,93 * 10 ^ 6 FLOPS ( источник )
Raspberry Pi 3: 462,07 * 10 ^ 6 FLOPS ( источник )
cd benchmarks_2017 / linux / mkl / benchmarks / linpack
./ runme_xeon64
На Thinkpad T460p ( Intel i7-6700HQ CPU ) это дает:
This is a SAMPLE run script for SMP LINPACK. Change it to reflect
the correct number of CPUs/threads, problem input files, etc..
./runme_xeon64: 33: [: -gt: unexpected operator
Mi 21. Dez 11:50:29 CET 2016
Intel(R) Optimized LINPACK Benchmark data
Current date/time: Wed Dec 21 11:50:29 2016
CPU frequency: 3.491 GHz
Number of CPUs: 1
Number of cores: 4
Number of threads: 4
Parameters are set to:
Number of tests: 15
Number of equations to solve (problem size) : 1000 2000 5000 10000 15000 18000 20000 22000 25000 26000 27000 30000 35000 40000 45000
Leading dimension of array : 1000 2000 5008 10000 15000 18008 20016 22008 25000 26000 27000 30000 35000 40000 45000
Number of trials to run : 4 2 2 2 2 2 2 2 2 2 1 1 1 1 1
Data alignment value (in Kbytes) : 4 4 4 4 4 4 4 4 4 4 4 1 1 1 1
Maximum memory requested that can be used=9800701024, at the size=35000
=================== Timing linear equation system solver ===================
Size LDA Align. Time(s) GFlops Residual Residual(norm) Check
1000 1000 4 0.014 46.5838 1.165068e-12 3.973181e-02 pass
1000 1000 4 0.010 64.7319 1.165068e-12 3.973181e-02 pass
1000 1000 4 0.009 77.3583 1.165068e-12 3.973181e-02 pass
1000 1000 4 0.010 67.0096 1.165068e-12 3.973181e-02 pass
2000 2000 4 0.064 83.6177 5.001027e-12 4.350281e-02 pass
2000 2000 4 0.063 84.5568 5.001027e-12 4.350281e-02 pass
5000 5008 4 0.709 117.6800 2.474679e-11 3.450740e-02 pass
5000 5008 4 0.699 119.2350 2.474679e-11 3.450740e-02 pass
10000 10000 4 4.895 136.2439 9.069137e-11 3.197870e-02 pass
10000 10000 4 4.904 135.9888 9.069137e-11 3.197870e-02 pass
15000 15000 4 17.260 130.3870 2.052533e-10 3.232773e-02 pass
15000 15000 4 18.159 123.9303 2.052533e-10 3.232773e-02 pass
18000 18008 4 31.091 125.0738 2.611497e-10 2.859910e-02 pass
18000 18008 4 31.869 122.0215 2.611497e-10 2.859910e-02 pass
20000 20016 4 44.877 118.8622 3.442628e-10 3.047480e-02 pass
20000 20016 4 44.646 119.4762 3.442628e-10 3.047480e-02 pass
22000 22008 4 57.918 122.5811 4.714135e-10 3.452918e-02 pass
22000 22008 4 57.171 124.1816 4.714135e-10 3.452918e-02 pass
25000 25000 4 86.259 120.7747 5.797896e-10 3.297056e-02 pass
25000 25000 4 83.721 124.4356 5.797896e-10 3.297056e-02 pass
26000 26000 4 97.420 120.2906 5.615238e-10 2.952660e-02 pass
26000 26000 4 96.061 121.9924 5.615238e-10 2.952660e-02 pass
27000 27000 4 109.479 119.8722 5.956148e-10 2.904520e-02 pass
30000 30000 1 315.697 57.0225 8.015488e-10 3.159714e-02 pass
35000 35000 1 2421.281 11.8061 1.161127e-09 3.370575e-02 pass
Performance Summary (GFlops)
Size LDA Align. Average Maximal
1000 1000 4 63.9209 77.3583
2000 2000 4 84.0872 84.5568
5000 5008 4 118.4575 119.2350
10000 10000 4 136.1164 136.2439
15000 15000 4 127.1586 130.3870
18000 18008 4 123.5477 125.0738
20000 20016 4 119.1692 119.4762
22000 22008 4 123.3813 124.1816
25000 25000 4 122.6052 124.4356
26000 26000 4 121.1415 121.9924
27000 27000 4 119.8722 119.8722
30000 30000 1 57.0225 57.0225
35000 35000 1 11.8061 11.8061
Residual checks PASSED
End of tests
Done: Mi 21. Dez 12:58:23 CET 2016