Производительность на ватт - Performance per watt

В вычисление, производительность на ватт является мерой энергоэффективность конкретного компьютерная архитектура или же компьютерное железо. Буквально он измеряет скорость вычислений, которую может выполнить компьютер для каждого ватт потребляемой мощности. Этот показатель обычно измеряется производительностью на LINPACK эталонный тест при попытке сравнить вычислительные системы.

Здание системных проектировщиков параллельные компьютеры, Такие как Оборудование Google, выбирайте процессоры на основе их производительности на ватт мощности, потому что стоимость питания процессора превышает стоимость самого процессора.[1]

Определение

Используемые показатели производительности и энергопотребления зависят от определения; разумные показатели эффективности ФЛОПЫ, MIPS, или счет для любого тест производительности. В зависимости от целей метрики могут использоваться несколько показателей использования энергии; например, метрика может учитывать только электрическую мощность, подаваемую на машину напрямую, в то время как другая может включать всю мощность, необходимую для работы компьютера, например системы охлаждения и мониторинга. Измерение мощности часто представляет собой среднюю мощность, используемую во время выполнения теста, но могут использоваться и другие меры использования мощности (например, пиковая мощность, мощность в режиме ожидания).

Например, ранний UNIVAC I компьютер выполнял приблизительно 0,015 операций в ватт-секунду (выполнение 1905 операций в секунду (OPS) при потреблении 125 кВт). В Fujitsu FR-V VLIW /векторный процессор система на чипе в варианте с 4 ядрами FR550, выпущенном в 2005 году, он выполняет 51 гигабайт в секунду при потребляемой мощности 3 Вт, что дает 17 миллиардов операций на ватт-секунду.[2][3] Это улучшение более чем в триллион раз за 54 года.

Большая часть энергии, потребляемой компьютером, преобразуется в тепло, поэтому системе, которая потребляет меньше ватт для выполнения работы, потребуется меньше охлаждения для поддержания заданного уровня. Рабочая Температура. Снижение требований к охлаждению облегчает успокоить компьютер. Более низкое энергопотребление также может снизить затраты на эксплуатацию и снизить воздействие на окружающую среду от включения компьютера (см. зеленые вычисления ) .Если установлен там, где ограничено климат-контроль, компьютер с меньшей мощностью будет работать при более низкой температуре, что может сделать его более надежным. В среде с контролируемым климатом сокращение прямого энергопотребления может также способствовать экономии энергии для управления климатом.

Вычислительное энергопотребление иногда также измеряется путем сообщения энергии, необходимой, например, для выполнения определенного теста. EEMBC EnergyBench. Цифры энергопотребления для стандартной рабочей нагрузки могут облегчить оценку эффекта от улучшения энергоэффективность.

Производительность (в операциях в секунду) на ватт также можно записать как в операциях / ватт-секунду или в операциях / джоуль, поскольку 1 ватт = 1 джоуль в секунду.

FLOPS на ватт

Экспоненциальный рост производительности суперкомпьютера на ватт по данным Зеленый500 список. Красные кресты обозначают самый энергоэффективный компьютер, а синие - компьютер с рейтингом 500.

FLOPS на ватт это обычная мера. Словно ФЛОПЫ (Плавающая точка Операций в секунду), на которой он основан, обычно этот показатель применяется к научные вычисления и моделирования с участием многих плавающая точка расчеты.

Примеры

По состоянию на июнь 2016 г., то Зеленый500 в списке два самых эффективных суперкомпьютера самые высокие - оба основаны на одном и том же многоядерный ускоритель PEZY-SCnp Японские технологии в дополнение к процессорам Intel Xeon - оба на RIKEN верхний - 6673,8 MFLOPS / ватт; и третье место занимает китайская технология Sunway TaihuLight (машина гораздо большего размера, она занимает 2-е место в рейтинге TOP500, остальных нет в этом списке) при 6051,3 MFLOPS / ватт.[4]

В июне 2012 года список Green500 оценил BlueGene / Q, питание BQC 16C как самый эффективный суперкомпьютер в TOP500 по показателю FLOPS на ватт при 2100,88 MFLOPS / ватт.[5]

В ноябре 2010 года машина IBM, Синий Джин / Q достигает 1,684 MFLOPS / ватт.[6][7]

9 июня 2008 года CNN сообщила, что IBM Roadrunner суперкомпьютер достигает 376 MFLOPS / Вт.[8][9]

Как часть Intel с Тера-шкала В рамках исследовательского проекта команда создала 80-ядерный ЦП, который обеспечивает производительность более 16 000 MFLOPS / ватт.[10][11] Будущее этого процессора не определено.

Microwulf, недорогой настольный компьютер Кластер Беовульф из четырех двухъядерных Athlon 64 X2 3800+ компьютеров, производительность 58 MFLOPS / Вт.[12]

Kalray разработал 256-ядерный ЦП VLIW, обеспечивающий производительность 25 000 MFLOPS / ватт. Ожидается, что следующее поколение достигнет 75 000 MFLOPS / Вт.[13] Однако в 2019 году их последний чип для встраиваемых систем является 80-ядерным и требует до 4 терафлопс при 20 Вт.[14]

Адаптева объявил о Богоявление V, 1024-ядерный 64-разрядный RISC-процессор, рассчитанный на производительность 75 Гфлопс / ватт,[15][16] в то время как позже они объявили, что Epiphany V вряд ли станет доступным в качестве коммерческого продукта.

Патент США 10,020,436, Июль 2018 г. заявляет о трех интервалах: 100, 300 и 600 Гфлопс / ватт.

Список Green500

В списке Green500 представлены компьютеры из TOP500 список суперкомпьютеров по энергоэффективность, обычно измеряется как LINPACK FLOPS на ватт.[17][18]

По состоянию на ноябрь 2012 г., Appro International, Inc. Суперкомпьютер Xtreme-X (Маяк ) возглавил список Green500 с показателем 2499 LINPACK MFLOPS / Вт.[19] Beacon развернут NICS Университета Теннесси и представляет собой GreenBlade GB824M, Xeon E5-2670 на базе, восемь ядер (8C), 2,6 ГГц, Infiniband FDR, компьютер Intel Xeon Phi 5110P.[20]

По состоянию на июнь 2013 г., то Евротек суперкомпьютер Eurora в Cineca возглавил список Green500 с показателем 3208 LINPACK MFLOPS / Вт.[21] Суперкомпьютер Cineca Eurora оснащен двумя процессорами Intel Xeon E5-2687W и двумя подключенными через PCI-e ускорителями NVIDIA Tesla K20 на каждый узел. Водяное охлаждение и конструкция электроники позволяют достичь очень высокой плотности с максимальной производительностью 350 терафлопс на стойку.[22]

По состоянию на ноябрь 2014 г.суперкомпьютер L-CSC Ассоциация Гельмгольца на GSI в Дармштадт Германия возглавила список Green500 с показателем 5271 MFLOPS / Вт и стала первым кластером, эффективность которого превысила 5 GFLOPS / Вт. Он работает на Intel Xeon E5-2690 Процессоры с Intel Ivy Bridge Архитектура и AMD FirePro S9150 Ускорители GPU. Он использует в стойках водяное охлаждение и Градирни для уменьшения энергии, необходимой для охлаждения.[23]

По состоянию на август 2015 г., то Суперкомпьютер Shoubu из RIKEN за пределами Токио Япония возглавила список Green500 с показателем 7032 MFLOPS / Вт. Первые три суперкомпьютера в списке использовали ускорители PEZY-SC (GPU -как это использовать OpenCL )[24] к PEZY Computing с 1024 ядрами каждое и эффективностью 6–7 Гфлопс / Вт.[25][26]

По состоянию на июнь 2019 г., DGX SaturnV Volta, используя NVIDIA DGX-1 Вольта 36, Xeon E5-2698v4 20C 2,2 ГГц, Infiniband EDR, NVIDIA Tesla V100 »возглавляет список Green500 с показателем 15 113 MFLOPS / Вт и занимает лишь 469-е место в Top500.[27] Он лишь немного эффективнее, чем гораздо больший Саммит занял 2-е место, а 1-е место в Top500 с 14 719 MFLOPS / Вт, используя IBM МОЩНОСТЬ9 ЦП, а также с графическими процессорами Nvidia Tesla V100.

По состоянию на июнь 2020 г., Японский Предпочитаемые сети суперкомпьютер, использующий собственные чипы (и Intel), «MN-Core Server, Xeon 8260M 24C 2,4 ГГц, MN-Core, RoCEv2 / MN-Core DirectConnect» возглавляет список Green500 с 21 108 MFLOPS / Вт, занимая лишь 393-е место Top500. Из крупных систем, входящих в топ-10 Топ500 В списке Green500 суперкомпьютер Selene занимает второе место в списке Green500 (седьмое место в Top500), используя графические процессоры Nvidia и процессоры AMD, которые почти не уступают по эффективности, но намного больше - 20518 MFLOPS / Вт, а суперкомпьютер HPC5 занимает 6-е место в обоих списках, также используя графические процессоры Nvidia, но IBM Мощность ЦП, и аналогично Summit предыдущий суперкомпьютер, который теперь занимает второе место (8-е место в green500), а текущий суперкомпьютер Fugaku (9-е место в Green500) использует процессоры на базе ARM британского дизайна с расширениями набора команд, разработанными японским производителем Fuijitu. суперкомпьютера, в то время как графические процессоры отсутствуют на 14,665 MFLOPS / Вт.[28]

Топ-10 позиций GREEN500 в ноябре 2020 года[29]
КлассифицироватьСпектакль
на ватт
(GFLOPS /Ватт )
ИмяМодель
Процессоры, межсоединения
ПродавецСайт
Страна, год
Rmax
(PFLOPS )
ЗвонокEfficacité
Energétique
(GFLOPS /Ватт )
НомАрхитектура
Type decesses, Bus d'interconnexion
VendeurСайт
Платит, анне
Rmax
(PFLOPS )
126.195NVIDIA DGX SuperPODNVIDIA DGX SuperPOD
AMD EPYC 7742 64C 2,25 ГГц, NVIDIA A100, Mellanox HDR Infiniband
NVIDIAКорпорация NVIDIA
  Соединенные Штаты, 2020
2.356
226.039МН-3Сервер MN-Core
Xeon Platinum 8260M 24C 2,4 ГГц, предпочтительные сети MN-Core, MN-Core DirectConnect,
Предпочитаемые сетиПредпочитаемые сети,
  Япония, 2020
1.652
325.008Бустерный модуль JUWELSБык
Sequana XH2000, AMD EPYC 7402 24C 2,8 ГГц, NVIDIA A100, Mellanox HDR InfiniBand / ParTec ParaStation ClusterSuite
Атос Forschungszentrum Juelich (FZJ),
 Германия,2020
44.120
424.262Спартанский2Бык
Sequana XH2000, AMD EPYC 7402 24C 2,8 ГГц, NVIDIA A100, Mellanox HDR Infiniband, Atos
Атос
 Франция,2020
2.566
523.983Селена NVIDIA DGX A100
AMD EPYC 7742 64C 2,25 ГГц, NVIDIA A100, Mellanox HDR Infiniband, Nvidia
Корпорация NVIDIA
  Соединенные Штаты, 2020
63.460
616.876Прототип A64FXFujitsu A64FX
Fujitsu A64FX 48C 2 ГГц, межсоединение Tofu D
FujitsuНумазу
  Япония, 2018
1.999
715.771AiMOSIBM Power System AC922
IBM POWER9 20C, 3,45 ГГц, двухканальный Mellanox EDR Infiniband, NVIDIA Volta GV100
IBMПолитехнический институт Ренсселера,тройка,
 Соединенные Штаты,2018
8.045
815.740HPC5 PowerEdge C4140
Xeon Gold 6252 24C 2,1 ГГц, NVIDIA Tesla V100, Mellanox HDR Infiniband,
Dell EMCEni S.p.A.,
  Италия,2020
35.450
915.574СаториIBM Power System AC922
IBM POWER9 20C 2,4 ГГц, Infiniband EDR, NVIDIA Tesla V100 SXM2
IBMMIT / MGHPCC,Холиок, Массачусетс,
 Соединенные Штаты,2018
1.464
1012.723ФугакуСуперкомпьютер Fugaku
A64FX 48C 2,2 ГГц, межсоединение Tofu D,
FujitsuRIKEN Центр вычислительных наук,
  Япония, 2020
442.010

Эффективность GPU

Блоки обработки графики (GPU) продолжают увеличивать потребление энергии, в то время как разработчики процессоров недавно сосредоточились на повышении производительности на ватт. Высокопроизводительные графические процессоры могут потреблять большое количество энергии, поэтому для управления энергопотреблением графического процессора требуются интеллектуальные методы.[30] Такие меры, как Результаты 3DMark2006 на ватт может помочь определить более эффективные графические процессоры.[31] Однако это может не адекватно отражать эффективность при типичном использовании, когда много времени тратится на выполнение менее сложных задач.[32]

В современных графических процессорах потребление энергии является важным ограничением максимальных вычислительных возможностей, которые могут быть достигнуты. Конструкции графических процессоров обычно хорошо масштабируются, что позволяет производителю размещать несколько микросхем на одной видеокарте или использовать несколько видеокарт, работающих параллельно. Пиковая производительность любой системы существенно ограничена количеством потребляемой мощности и количеством тепла, которое она может рассеять. Следовательно, производительность на ватт конструкции графического процессора напрямую влияет на пиковую производительность системы, в которой используется эта конструкция.

Поскольку графические процессоры также могут использоваться для некоторых вычисления общего назначения, иногда их производительность измеряется в терминах, также применяемых к процессорам, например, FLOPS на ватт.

Вызовы

Хотя производительность на ватт полезна, требования к абсолютной мощности также важны. Заявления об улучшенной производительности на ватт могут использоваться для маскировки возрастающих требований к мощности. Например, хотя архитектуры графических процессоров нового поколения могут обеспечивать лучшую производительность на ватт, продолжающееся повышение производительности может свести на нет повышение эффективности, и графические процессоры продолжают потреблять большое количество энергии.[33]

Контрольные показатели, измеряющие мощность при большой нагрузке, могут не отражать типичный КПД должным образом. Например, 3DMark подчеркивает 3D-производительность графического процессора, но многие компьютеры тратят большую часть своего времени на выполнение менее интенсивных задач отображения (простоя, 2D-задачи, отображение видео). Таким образом, эффективность графической системы в 2D или в режиме ожидания может иметь не меньшее значение для общей энергоэффективности. Аналогичным образом, системы, которые проводят большую часть своего времени в режиме ожидания или мягкий не обладают адекватным КПД под нагрузкой. Чтобы помочь решить эту проблему, некоторые тесты, например SPECpower, включать измерения на нескольких уровнях нагрузки.[34]

КПД некоторых электрических компонентов, таких как регуляторы напряжения, уменьшается с повышением температуры, поэтому потребляемая мощность может увеличиваться с увеличением температуры. Источники питания, материнские платы и некоторые видеокарты - вот некоторые из подсистем, на которые это влияет. Таким образом, их потребляемая мощность может зависеть от температуры, и при измерении следует учитывать температурную зависимость.[35][36]

Производительность на ватт также обычно не включает полную затраты на жизненный цикл. Поскольку производство компьютеров энергоемкое, а компьютеры часто имеют относительно короткий срок службы, энергия и материалы используются в производстве, распространении и т. Д. утилизация и переработка отходов часто составляют значительную часть их стоимости, энергопотребления и воздействия на окружающую среду.[37][38]

Энергия, необходимая для управления микроклиматом вокруг компьютера, часто не учитывается при расчете мощности, но может быть значительной.[39]

Другие меры по энергоэффективности

SWaP (пространство, мощность и производительность) - это Sun Microsystems метрика для дата-центры, объединяя мощность и пространство:

Где производительность измеряется любым подходящим тестом, а пространство - это размер компьютера.[40]

Смотрите также

Контрольные показатели энергоэффективности
  • Средняя мощность процессора (ACP) - показатель энергопотребления при запуске нескольких стандартных тестов
  • EEMBC - EnergyBench
  • SPECpower - эталонный тест для веб-серверов под управлением Java (серверные Java-операции на джоуль)
Другой

Примечания и ссылки

  1. ^ Google предупреждает, что мощность может стоить больше, чем серверы, CNET, 2006 г.
  2. ^ «Fujitsu разрабатывает многоядерный процессор для высокопроизводительных цифровых потребительских товаров» (Пресс-релиз). Fujitsu. 2020-02-07. В архиве из оригинала на 2019-03-25. Получено 2020-08-08.
  3. ^ Одночиповый многоядерный процессор FR-V: FR1000 В архиве 2015-04-02 в Wayback Machine Fujitsu
  4. ^ «Список Green500 на июнь 2016 года».
  5. ^ «Список Green500». Зеленый500. Архивировано из оригинал на 2012-07-03.
  6. ^ «Список суперкомпьютеров Top500 раскрывает тенденции в вычислительной технике». IBM ... Система BlueGene / Q .. установив рекорд энергоэффективности со значением 1,680 Мфлопс / ватт, что более чем вдвое превышает показатели следующей лучшей системы.
  7. ^ «IBM Research - явный победитель в категории« 500 зеленых »». 2010-11-18.
  8. ^ «Правительство представляет самый быстрый компьютер в мире». CNN. Архивировано из оригинал на 2008-06-10. выполнение 376 миллионов вычислений на каждый ватт потребляемой электроэнергии.
  9. ^ "IBM Roadrunner выигрывает золото в гонке в петафлопс". Архивировано из оригинал на 13.06.2008.
  10. ^ «Intel выжимает из одного процессора 1,8 терафлопс». TG Daily. Архивировано из оригинал на 2007-12-03.
  11. ^ «Исследовательский чип Teraflops». Технологии и исследования Intel.
  12. ^ Джоэл Адамс. «Микровульф: энергоэффективность». Микровульф: персональный портативный кластер Беовульфа.
  13. ^ «MPPA MANYCORE - Многоядерные процессоры - KALRAY - Agile Performance».
  14. ^ «Kalray объявляет об отказе от ленты Coolidge по техпроцессу TSMC 16NM». Kalray. 2019-07-31. Получено 2019-08-12.
  15. ^ Олофссон, Андреас. «Epiphany-V: 1024-ядерный 64-разрядный RISC-процессор». Получено 6 октября 2016.
  16. ^ Олофссон, Андреас. "Epiphany-V: 1024-битная 64-битная RISC-система на кристалле" (PDF). Получено 6 октября 2016.
  17. ^ "Грин500". Архивировано из оригинал на 20.06.2016.
  18. ^ «Список Green 500 в рейтинге суперкомпьютеров». iTnews Австралия. Архивировано из оригинал на 2008-10-22.
  19. ^ «Суперкомпьютер Университета Теннесси устанавливает мировой рекорд энергоэффективности». Новости Национального института вычислительных наук. Университет Теннесси и Национальная лаборатория Ок-Ридж. Получено 21 ноября 2012.
  20. ^ «Маяк - Appro GreenBlade - список Green500». top500.org. Получено 21 ноября 2012.
  21. ^ «Eurotech Eurora, прототип PRACE, развернутый Cineca и INFN, занимает первое место в списке Green500». Cineca. Cineca. Получено 28 июн 2013.
  22. ^ «Еврора - Аврора Тигон - Список Top500». top500.org. Получено 28 июн 2013.
  23. ^ «Список Green500 - ноябрь 2014 г.». Архивировано из оригинал на 22 февраля 2015 г.
  24. ^ Хиндриксен, Винсент (2 августа 2015 г.). «Известные и неизвестные об ускорителе PEZY-SC в RIKEN». StreamHPC. Получено 2019-10-21.
  25. ^ Тиффани, Тиффани (4 августа 2015 г.). «Япония занимает первые три места в списке Green500». HPCWire. Получено 8 января 2016.
  26. ^ «PEZY и ExaScaler входят в список Green500 с иммерсивным охлаждением». ВнутриHPC. 23 сентября 2015 г.. Получено 8 января 2016.
  27. ^ «Июнь 2019 | ТОП500 суперкомпьютерных сайтов». www.top500.org. Получено 2019-08-12.
  28. ^ https://www.top500.org/lists/green500/2020/06/
  29. ^ «Ноябрь 2019». www.top500.org. Получено 2020-11-19.
  30. ^ Миттал, Спарш; Веттер, Джеффри С. (июль 2014 г.). «Обзор методов анализа и повышения энергоэффективности GPU». Опросы ACM Computing. Ассоциация вычислительной техники (опубликовано в январе 2015 г.). 47 (2). Дои:10.1145/2636342. ISSN  0360-0300. Получено 2020-08-08.
  31. ^ Этвуд, Джефф (18 августа 2006 г.). «Энергопотребление видеокарты».
  32. ^ «Энергопотребление видеокарты». Xbit Labs. Архивировано из оригинал на 2011-09-04.
  33. ^ Тим Смолли. "Производительность за что?". Bit Tech. Получено 2008-04-21.
  34. ^ «SPEC запускает стандартизированный тест энергоэффективности». ZDNet.
  35. ^ Майк Чин. "Видеокарта Asus EN9600GT Silent Edition". Бесшумный обзор ПК. п. 5. Получено 2008-04-21.
  36. ^ Майке Чин (19 марта 2008 г.). «80 Plus расширяет подиум для бронзы, серебра и золота». Бесшумный обзор ПК. Получено 2008-04-21.
  37. ^ Майк Чин. «Анализ жизненного цикла и обзор Eco PC». Обзор Eco PC. Архивировано из оригинал на 2008-03-04.
  38. ^ Эрик Уильямс (2004). «Энергоемкость компьютерного производства: гибридная оценка, сочетающая процессные и экономические методы ввода-вывода». Environ. Sci. Technol. 38 (22): 6166–74. Bibcode:2004EnST ... 38.6166W. Дои:10.1021 / es035152j. PMID  15573621.
  39. ^ У-чун Фэн (2005). «Важность низкого энергопотребления в высокопроизводительных вычислениях». КТ смотреть ежеквартально. 1 (5).
  40. ^ Гринхилл, Дэвид. "SWaP Космические ватты и мощность" (PDF). Агентство по охране окружающей среды США Energystar. Получено 14 ноября 2013.

дальнейшее чтение

внешняя ссылка