Оценить флопс в Linux?

Кажусь ими используемый в консервном заводе (Фрукты и Овощи). Старая DOS-программа, которые набирают номер через модем на 28.8 Кбит/с, раскрыла груду и их печать к ТОЧЕЧНОЙ МАТРИЦЕ.

Использовался, потому что мы могли углерод копировать его.....

(Все еще не смотрите, почему это могло быть обновлено для использования лазерного принтера и печати дважды?)

13
задан 25 November 2009 в 23:37
6 ответов

Вопрос - то, что Вы подразумеваете под флопс? Если все, о чем Вы заботитесь, - то, сколько из самых простых операций с плавающей точкой на часы, это, вероятно, 3x Ваша тактовая частота, но это почти столь же бессмысленно как bogomips. Некоторая операция в секунду с плавающей точкой занимает много времени (разделитесь для начинающих), добавьте и умножьтесь, обычно быстры (один на fp единицу на часы). Следующий выпуск является производительностью памяти, существует причина, последняя классическая CRAY имела 31 сегмент памяти, в конечном счете производительность ЦП ограничена тем, как быстро можно считать и записать в память, поэтому в какой уровень кэширования проблема помещается? Linpack был реальным сравнительным тестом однажды, теперь он помещается в кэш (L2, если не L1), и больше чистого теоретического сравнительного теста ЦП. И конечно, Ваш SSE (и т.д.) единицы могут добавить производительность с плавающей точкой также.

Какой дистрибутив Вы выполняете?

Это было похоже на хороший указатель: http://linuxtoolkit.blogspot.com/2009/04/intel-optimized-linpack-benchmark-for.html

http://onemansjourneyintolinux.blogspot.com/2008/12/show-us-yer-flops.html

http://www.phoronix-test-suite.com/ мог бы быть более легким способом установить сравнительный тест флопс.

Тем не менее я действительно задаюсь вопросом, почему Вы заботитесь, для чего Вы используете его? Если Вы просто хотите бессмысленное число, Ваши системы bogomips находится все еще тут же в dmesg.

5
ответ дан 2 December 2019 в 21:25
  • 1
    Phoronix, кажется, точно, что я искал - спасибо! Единственная причина я хотел это, состояла в том, потому что я заполнял обзор, который спросил, сколько терафлопов вычислительной мощности я имею. Обзор wasn' t ужасно важный, таким образом, я wasn' t касавшийся точности ответа. Однако, это было бы довольно аккуратно, чтобы смочь сказать, " Наш кластер может сделать X терафлопы " Хотя, как Вы указываете, то число doesn' t обязательно имеют много реального значения. –  molecularbear 26 November 2009 в 04:06

Одним сравнительным тестом, который традиционно использовался для измерения флопс, является Linpack. Другим общим сравнительным тестом флопс является Точильный камень.

Больше чтения: запись "флопс" Википедии, запись Точильного камня, запись Linpack

1
ответ дан 2 December 2019 в 21:25
  • 1
    Я ценю Ваш ответ, однако моя цель состоит в том, чтобы получить быстрый n' грязная оценка флопс. Whetstone и Linpack имеют ту же проблему как HPL - я начинаю читать об этом, затем заблудился в сайте после сайта что весь взгляд 20 лет. Когда мне действительно удается найти исходный код, я can' t, кажется, компилируют его, не устанавливая набор зависимых библиотек - даже затем я сталкиваюсь с ошибками. Я мог получить всю эту работу материала, но it' s не достаточно важный для проведения времени. Надо надеяться, там существует некоторое относительно современное программное обеспечение, которое Просто перебрасывают Работы для ballparking. –  molecularbear 26 November 2009 в 00:32
  • 2
    Оценка? Затем it' s о 4*Hz: для ЦП на 1 ГГц it' s приблизительно 4 Гфлопса :)) –  kolypto 26 November 2009 в 03:43

Я настоятельно рекомендую готовую-к-управляемому сборку linpack от Intel: http://software.intel.com/en-us/articles/intel-math-kernel-library-linpack-download/

1
ответ дан 2 December 2019 в 21:25

Поскольку Вы упоминаете кластер, мы использовали комплект HPCC. Это прилагает немного усилий, чтобы установить и настроиться, но в нашем случае точка не хвастала по сути, это была часть критериев допустимости для кластера; некоторое сравнительное тестирование производительности, по моему скромному мнению, жизненно важно, чтобы гарантировать, что аппаратные средства работают, как рекламируется, все является подключаемым с помощью кабеля вместе правильно и т.д.

Теперь, если Вы просто хотите теоретический пик число флопс, что каждый легок. Просто проверьте некоторую статью о ЦП (скажите на realworldtech.com или somesuch) надевать информацию, сколько DP флопс ядро процессора может сделать на такт (с текущим x86 ЦП этому обычно 4 года). Затем общий пик флопс справедлив

количество ядер * флопс/цикл * частота

Затем для кластера с сетью IB необходимо смочь поразить приблизительно 80% пика флопс на HPL (какой BTW является одним из сравнительных тестов в HPCC).

1
ответ дан 2 December 2019 в 21:25

apparently there's a "sysbench" benchmark package and command:

sudo apt-get install sysbench (or brew install sysbench OS X)

run it like this:

sysbench --test=cpu --cpu-max-prime=20000 --num-threads=2 run

output for comparisons:

 total time:                          15.3047s

ref: http://www.midwesternmac.com/blogs/jeff-geerling/2013-vps-benchmarks-linode

7
ответ дан 2 December 2019 в 21:25

Для приблизительных оценок:

Linpack

  1. Загрузить ( ссылка )
  2. Распаковать
  3. cd benchmarks_2017 / linux / mkl / benchmarks / linpack
  4. ./ runme_xeon64
  5. Подождите некоторое время (более 1 часа)

На Thinkpad T460p ( Intel i7-6700HQ CPU ) это дает:

This is a SAMPLE run script for SMP LINPACK. Change it to reflect
the correct number of CPUs/threads, problem input files, etc..
./runme_xeon64: 33: [: -gt: unexpected operator
Mi 21. Dez 11:50:29 CET 2016
Intel(R) Optimized LINPACK Benchmark data

Current date/time: Wed Dec 21 11:50:29 2016

CPU frequency:    3.491 GHz
Number of CPUs: 1
Number of cores: 4
Number of threads: 4

Parameters are set to:

Number of tests: 15
Number of equations to solve (problem size) : 1000  2000  5000  10000 15000 18000 20000 22000 25000 26000 27000 30000 35000 40000 45000
Leading dimension of array                  : 1000  2000  5008  10000 15000 18008 20016 22008 25000 26000 27000 30000 35000 40000 45000
Number of trials to run                     : 4     2     2     2     2     2     2     2     2     2     1     1     1     1     1    
Data alignment value (in Kbytes)            : 4     4     4     4     4     4     4     4     4     4     4     1     1     1     1    

Maximum memory requested that can be used=9800701024, at the size=35000

=================== Timing linear equation system solver ===================

Size   LDA    Align. Time(s)    GFlops   Residual     Residual(norm) Check
1000   1000   4      0.014      46.5838  1.165068e-12 3.973181e-02   pass
1000   1000   4      0.010      64.7319  1.165068e-12 3.973181e-02   pass
1000   1000   4      0.009      77.3583  1.165068e-12 3.973181e-02   pass
1000   1000   4      0.010      67.0096  1.165068e-12 3.973181e-02   pass
2000   2000   4      0.064      83.6177  5.001027e-12 4.350281e-02   pass
2000   2000   4      0.063      84.5568  5.001027e-12 4.350281e-02   pass
5000   5008   4      0.709      117.6800 2.474679e-11 3.450740e-02   pass
5000   5008   4      0.699      119.2350 2.474679e-11 3.450740e-02   pass
10000  10000  4      4.895      136.2439 9.069137e-11 3.197870e-02   pass
10000  10000  4      4.904      135.9888 9.069137e-11 3.197870e-02   pass
15000  15000  4      17.260     130.3870 2.052533e-10 3.232773e-02   pass
15000  15000  4      18.159     123.9303 2.052533e-10 3.232773e-02   pass
18000  18008  4      31.091     125.0738 2.611497e-10 2.859910e-02   pass
18000  18008  4      31.869     122.0215 2.611497e-10 2.859910e-02   pass
20000  20016  4      44.877     118.8622 3.442628e-10 3.047480e-02   pass
20000  20016  4      44.646     119.4762 3.442628e-10 3.047480e-02   pass
22000  22008  4      57.918     122.5811 4.714135e-10 3.452918e-02   pass
22000  22008  4      57.171     124.1816 4.714135e-10 3.452918e-02   pass
25000  25000  4      86.259     120.7747 5.797896e-10 3.297056e-02   pass
25000  25000  4      83.721     124.4356 5.797896e-10 3.297056e-02   pass
26000  26000  4      97.420     120.2906 5.615238e-10 2.952660e-02   pass
26000  26000  4      96.061     121.9924 5.615238e-10 2.952660e-02   pass
27000  27000  4      109.479    119.8722 5.956148e-10 2.904520e-02   pass
30000  30000  1      315.697    57.0225  8.015488e-10 3.159714e-02   pass
35000  35000  1      2421.281   11.8061  1.161127e-09 3.370575e-02   pass

Performance Summary (GFlops)

Size   LDA    Align.  Average  Maximal
1000   1000   4       63.9209  77.3583 
2000   2000   4       84.0872  84.5568 
5000   5008   4       118.4575 119.2350
10000  10000  4       136.1164 136.2439
15000  15000  4       127.1586 130.3870
18000  18008  4       123.5477 125.0738
20000  20016  4       119.1692 119.4762
22000  22008  4       123.3813 124.1816
25000  25000  4       122.6052 124.4356
26000  26000  4       121.1415 121.9924
27000  27000  4       119.8722 119.8722
30000  30000  1       57.0225  57.0225 
35000  35000  1       11.8061  11.8061 

Residual checks PASSED

End of tests

Done: Mi 21. Dez 12:58:23 CET 2016
3
ответ дан 2 December 2019 в 21:25

Теги

Похожие вопросы