Параллельные тесты NAS - NAS Parallel Benchmarks

Параллельные тесты NAS
Оригинальный автор (ы)Программа численного аэродинамического моделирования НАСА
Разработчики)НАСА Advanced Supercomputing Division
изначальный выпуск1991 (1991)
Стабильный выпуск
3.4
Интернет сайтНАС.nasa.gov/Программного обеспечения/ НПБ/

Параллельные тесты NAS (НПБ) представляют собой набор ориентиры оценка эффективности высокоэффективных параллельно суперкомпьютеры. Они разрабатываются и поддерживаются НАСА Подразделение Advanced Supercomputing (NAS) (бывшая Программа численного аэродинамического моделирования НАСА) на базе Исследовательский центр НАСА Эймса. NAS запрашивает результаты производительности для NPB из всех источников.[1]

История

Мотивация

Традиционные тесты, существовавшие до NPB, такие как Ливерморские петли, то Тест LINPACK и Программа тестирования ядра NAS, обычно специализировались для векторных компьютеров. Как правило, они страдали от недостатков, включая ограничения настройки, препятствующие параллелизму, и недостаточный размер проблем, что делало их непригодными для высокопараллельных систем. Столь же непригодными оказались полномасштабные тесты приложений из-за высокой стоимости переноса и отсутствия инструментов автоматического распараллеливания программного обеспечения.[2] В результате в 1991 году были разработаны НПБ.[3] и выпущен в 1992 г.[4] для устранения связанного с этим отсутствия тестов, применимых к высокопараллельным машинам.

НПБ 1

Первая спецификация NPB признала, что тесты должны включать

  • новые алгоритмические и программные методы с параллельной поддержкой,
  • универсальность и архитектурная нейтральность,
  • легкая проверка правильности результатов и показателей производительности,
  • возможность установки новых систем с повышенной мощностью,
  • и готовность к распространению.

В свете этих руководящих принципов было сочтено единственным жизнеспособным подходом использовать набор «бумажных и карандашных» тестов, которые определяли набор проблем только алгоритмически и оставляли большинство деталей реализации на усмотрение разработчика в определенных необходимых пределах.

NPB 1 определила восемь тестов, каждый из которых относится к двум размерам задач, названных Класс А и Класс B. Примеры кодов, написанных на Фортран 77 были поставлены. Они использовали небольшой размер задачи Класс S и не предназначались для сравнительного анализа.[2]

НПБ 2

С момента выпуска NPB 1 обнаружил два основных недостатка. Во-первых, из-за спецификации «бумага и карандаш» поставщики компьютеров обычно сильно настраивали свои реализации, так что их производительность становилась трудной для научных программистов. Во-вторых, многие из этих реализаций были проприетарными и не были общедоступными, что фактически скрывало их методы оптимизации. Во-вторых, масштабы проблем NPB 1 отставали от развития суперкомпьютеров, поскольку последние продолжали развиваться.[3]

НПБ 2, выпущенный в 1996 г.,[5][6] поставляется с реализациями исходного кода для пяти из восьми тестов, определенных в NPB 1, чтобы дополнять, но не заменять NPB 1. Он расширил тесты с помощью актуального размера проблемы Класс C. Также были внесены поправки в правила предоставления результатов сравнительного анализа. Новые правила включали явные запросы для выходных файлов, а также измененные исходные файлы и сценарии сборки, чтобы гарантировать общедоступность изменений и воспроизводимость результатов.[3]

NPB 2.2 содержал реализации еще двух тестов.[5] НПБ 2.3 1997 г. был первым полным внедрением в MPI.[4] Он поставлялся с последовательными версиями тестов, согласованными с параллельными версиями, и определял размер проблемы. Класс W для систем с малой памятью.[7] NPB 2.4 2002 г. предложил новую реализацию MPI и представил еще одну проблему еще большего размера. Класс D.[6] Он также добавил к одному тесту Ввод / вывод -интенсивные подтипы.[4]

НПБ 3

NPB 3 сохранил реализацию MPI из NPB 2 и имеет больше разновидностей, а именно OpenMP,[8] Ява[9] и Высокопроизводительный Фортран.[10] Эти новые параллельные реализации были получены из последовательных кодов в NPB 2.3 с дополнительной оптимизацией.[7] NPB 3.1 и NPB 3.2 добавили еще три теста,[11][12] которые, однако, были доступны не во всех реализациях; НПБ 3.3 представил Класс E размер проблемы.[7] На основе однозонного NPB 3 был выпущен набор многозонных тестов, использующих гибридную модель программирования MPI / OpenMP под названием НПБ-Мульти-Зона (НПБ-МЗ) для «тестирования эффективности парадигм и инструментов многоуровневого и гибридного распараллеливания».[1][13]

Тесты

Начиная с NPB 3.3, одиннадцать тестов определены, как показано в следующей таблице.

Контрольный показательНазвание происходит от[2]Доступно сОписание[2]Замечания
MGMultiграммизбавлятьНПБ 1[2]Приближайте решение к трехмерной дискретное уравнение Пуассона используя V-цикл многосеточный метод
CGConjugate граммсияющийОцените наименьшее собственное значение большого редкий симметричный положительно определенная матрица с использованием обратная итерация с метод сопряженных градиентов как подпрограмму для решения системы линейных уравнений
FTБыстрый Fкурьер ТпреобразоватьРешите трехмерную уравнение в частных производных (PDE) с помощью быстрое преобразование Фурье (БПФ)
ЯВЛЯЕТСЯяцелый SортСортируйте маленькие целые числа, используя ведро сортировка[5]
EPEmbarrassingly ппараллельноСоздавать независимые Гауссовский случайные вариации с использованием Полярный метод Марсальи
BTBзамок ТридиагональныйРешите синтетическую систему нелинейные уравнения в частных производных используя три разных алгоритма, включающих блок трехдиагональный, скаляр пятиугольник и симметричный последовательное чрезмерное расслабление (SSOR) ядра решателя соответственно
  • В тесте BT есть подтипы с интенсивным вводом-выводом[4]
  • Все три теста имеют многозонные версии[13]
SPSCalar пэнтадиагональный[6]
LULцветущийUpper симметричный Гаусс-Зейдель[6]
UAUструктурированный Аадаптивный[11]НПБ 3.1[7]Решать Уравнение тепла с конвекцией и диффузией от движущегося шара. Сетка адаптивна и пересчитывается на каждом 5-м шаге.
ОКРУГ КОЛУМБИЯDАта Cубе оператор[12]
DTDАта Трафтинг[7]НПБ 3,2[7]

Рекомендации

  1. ^ а б «Изменения параллельных тестов NAS». НАСА Advanced Supercomputing Division. Получено 2009-02-23.
  2. ^ а б c d е Бейли, Д .; Barszcz, E .; Barton, J .; Браунинг, Д .; Carter, R .; Dagum, L .; Fatoohi, R .; Fineberg, S .; Frederickson, P .; Виратунга, С. (март 1994 г.), «Параллельные тесты NAS» (PDF), Технический отчет NAS RNR-94-007, Исследовательский центр НАСА Эймса, Моффетт Филд, Калифорния
  3. ^ а б c Bailey, D .; Harris, T .; Saphir, W .; van der Wijngaart, R .; Ву, А .; Ярроу, М. (декабрь 1995 г.), «Параллельные тесты NAS 2.0» (PDF), Технический отчет NAS NAS-95-020, Исследовательский центр НАСА Эймса, Моффетт Филд, Калифорния
  4. ^ а б c d Wong, P .; ван дер Вейнгаарт, Р. (январь 2003 г.), "NAS Parallel Benchmarks I / O Version 2.4" (PDF), Технический отчет NAS NAS-03-002, Исследовательский центр НАСА Эймса, Моффетт Филд, Калифорния
  5. ^ а б c Saphir, W .; van der Wijngaart, R .; Ву, А .; Тысячелистник М., Новые реализации и результаты параллельных тестов NAS 2 (PDF), Исследовательский центр НАСА Эймса, Моффетт Филд, Калифорния
  6. ^ а б c d ван дер Вейнгаарт, Р. (октябрь 2002 г.), "Параллельные тесты NAS, версия 2.4" (PDF), Технический отчет NAS NAS-02-007, Исследовательский центр НАСА Эймса, Моффетт Филд, Калифорния
  7. ^ а б c d е ж «Изменения параллельных тестов NAS». НАСА Advanced Supercomputing Division. Получено 2009-03-17.
  8. ^ Jin, H .; Фрумкин, М .; Ян, Дж. (Октябрь 1999 г.), «Реализация параллельных тестов NAS в OpenMP и ее производительность» (PDF), Технический отчет NAS NAS-99-011, Исследовательский центр НАСА Эймса, Моффетт Филд, Калифорния
  9. ^ Фрумкин, М .; Шульц, М .; Jin, H .; Ян, Дж., «Реализация параллельных тестов NAS на Java» (PDF), Технический отчет NAS NAS-02-009, Исследовательский центр НАСА Эймса, Моффетт Филд, Калифорния
  10. ^ Фрумкин, М .; Jin, H .; Ян, Дж. (Сентябрь 1998 г.), «Реализация параллельных тестов NAS в высокопроизводительном Fortran» (PDF), Технический отчет NAS NAS-98-009, Исследовательский центр НАСА Эймса, Моффетт Филд, Калифорния
  11. ^ а б Feng, H .; van der Wijngaart, F .; Biswas, R .; Мавриплис, К. (июль 2004 г.), «Тест параллельного тестирования неструктурированных адаптивных (UA) NAS, версия 1.0» (PDF), Технический отчет NAS NAS-04-006, Исследовательский центр НАСА Эймса, Моффетт Филд, Калифорния
  12. ^ а б Фрумкин, М .; Шабанов, Л. (сентябрь 2004 г.), «Тестирование производительности памяти с помощью оператора куба данных» (PDF), Технический отчет NAS NAS-04-013, Исследовательский центр НАСА Эймса, Моффетт Филд, Калифорния
  13. ^ а б van der Wijngaart, R .; Джин, Х. (июль 2003 г.), «Параллельные тесты NAS, многозонные версии» (PDF), Технический отчет NAS NAS-03-010, Исследовательский центр НАСА Эймса, Моффетт Филд, Калифорния

внешняя ссылка