вторник, 12 октября 2010 г.

Рейтинги для тугодумов

Недавно заметил в отчетах генерируемых решателем ANSYS (solver output) одну строчку, которой раньше  не было. Ну, или, по крайней мере, не обращал внимание.
Equation solver computational rate .
Эта строчка отдает значение в попугаях Mflops. Очень уж заинтересовал этот момент. Ведь есть стандартные результаты для LinPack для многих машин. А даже если и нет, то получить рейтинг можно достаточно быстро. В то же время есть ряд данных о скорости решения тех или иных задач ANSYS’ом на разных компьютерах. Но в целом переход от линпаковских попугаев к ансисовским часам получается затрудненным. В итоге, раз уже и ансис выдает статистику не только по времени, но и по попугаям появилось желание сделать статистику более полной. Может быть, получится +/- устойчиво предсказывать результаты эффективности перехода на более мощную технику. Понятное дело, что при работе ансиса не только процессор играет роль, но и совокупная скорость всех подсистем. При этом для разных задач на конечную скорость влияют совершенно разные параметры, но, все же, захотелось это проверить более подробно.
По последним решаемым задачам могу сказать следующее. На машине Intel Core2 Quad Q9400 с 2.66 Ггц и 8 Гб ОЗУ на которой линпак выдает от 33до 36 Гфлопс. На контактных задачах, полностью умещающихся в память, ансис выдает от 4.4 до 13.2 в тех же единицах. На задаче о частотах  и формах (см. тут) 5.3. Больше всего значений рейтинга вращается около 5 Гфлопс. Единственный раз вывалилась цифра 13, на задаче с очень большим количеством контактных поверхностей. Для выводов этого мало, но первичную оценку сделать можно: В среднем для ансиса, на одной машине, количество попугаев следует делить на 6. Далее, зная скорость обоих машин и время счета на одной из них, можно приблизительно вычислить время счета на другой. Более подробно о попугаях и флопсах можно будет говорить, когда будет устойчивая статистика по нескольким машинам и разным задачам. Особенно интересно в этом ключе вычислить коэффициент для кластерных решений.

2 комментария:

  1. здравствуйте, у Вас уже второй интересный пост про высокопроизводительные вычисления DANSYS, кстати Вы могли бы сверять время счета, количество и объем операций ввода/вывода, объем памяти для формирования глобальной матрицы, используя команду DSPOPTION для решателя DSPARSE с опцией PERFORMANCE. К тому же по этим результатам можно сравниться с результатами замеров/бенчмарков на сайте www.ansys.com, естественно проводя расчет тех же задач

    ОтветитьУдалить
  2. Спасибо за отзыв.
    Как говорится - о чем болит о том и говорим. После долгого перерыва снова пришлось вспомнить об основной специальности, вот и написал.
    Я точно не знаю что конкретно у нас меряли, и как. Этим занимались другие люди, которые сейчас ушли из института на более оплачиваемые работы. Результаты остались, но это надо вникать. Вроде мерялись и размеры задачи и скорость выполнения тех или иных операций. С http://www1.ansys.com/cgi-bin/HardwareSupport/ANSYSBenchmarks.exe сравнения проводились. Но тут скорее вопрос в другом. Результаты линпака для машины можно получить существенно быстрее чем для ансиса. Более того для этого нет надобности ставить ансис и пр. А так можно заранее "узнать" на сколько быстрее могут решаться стандартные задачи, для конкретной группы людей на новом аппаратном обеспечении.
    А то допустим для нашего кластера теоретическая производительность ~570 Гфлоп, с общим размером задачи под 128 млн. доф. А в реальности, из-за меньшего чем нужно объема оперативки на головном узле, получили около 60 млн. доф, а производительность... врать не буду - не помню, но существенно меньше. А тут вопрос не только ж в том, чтобы выпендрится в стиле "а у нас кластер с такой-то производительностью", а чтобы знать на что именно мы можем рассчитывать в реальности.

    ОтветитьУдалить

Related Posts Plugin for WordPress, Blogger...
Rambler's Top100