Ампер (микроархитектура) - Ampere (microarchitecture)

Nvidia Ampere
Процесс изготовления
История
Предшественник
ПреемникБункер

Ампер это кодовое имя для графический процессор (GPU) микроархитектура, разработанная Nvidia в качестве преемника как Вольта и Тьюринг Архитектура, официально анонсированная 14 мая 2020 года. Названа в честь французского математика и физика. Андре-Мари Ампер.[1][2] Nvidia анонсировала следующее поколение GeForce 30 серии потребительские графические процессоры на специальном мероприятии GeForce 1 сентября 2020 г.[3][4] Nvidia анонсировала графический процессор A100 80GB на SC20 16 ноября 2020 года.[5]

Подробности

Архитектурные улучшения архитектуры Ampere включают следующее:

  • CUDA Вычислительные возможности 8.0 для A100 и 8.6 для серия GeForce 30[6]
  • TSMC с 7 нм FinFET процесс для A100
  • Пользовательская версия Samsung с 8 нм процесс (8N) для серии GeForce 30[7]
  • Тензорные ядра третьего поколения с поддержкой FP16, bfloat16, TensorFloat-32 (TF32) и FP64 и ускорением разреженности[8]
  • Ядра трассировки лучей второго поколения; одновременная трассировка лучей, затенение и вычисления для серии GeForce 30
  • Память с высокой пропускной способностью 2 (HBM2) на A100 40 ГБ и A100 80 ГБ
  • GDDR6X память для GeForce RTX 3090 и 3080
  • Два ядра FP32 на SM на графических процессорах GA10x
  • NVLink 3.0 с пропускной способностью 50 Гбит / с на пару[8]
  • PCI Express 4.0 с поддержкой SR-IOV (SR-IOV зарезервирован только для A100)
  • Функция виртуализации многоэкземплярного графического процессора (MIG) и разделения графического процессора в A100 с поддержкой до семи экземпляров
  • PureVideo набор функций K аппаратного декодирования видео с AV1 аппаратное декодирование[9] для серии GeForce 30 и набор функций J для A100
  • 5 NVDEC для A100
  • Добавляет новый аппаратный 5-ядерный JPEG декодировать (NVJPG) с YUV420, YUV422, YUV444, YUV400, RGBA. Не следует путать с Nvidia NVJPEG (С ускорением на GPU библиотека для кодирования / декодирования JPEG)

Чипсы

  • GA100
  • GA102
  • GA104

Сравнение вычислительных возможностей: GP100, GV100 и GA100[10]

Возможности GPUNVIDIA Tesla P100NVIDIA Tesla V100NVIDIA A100
Кодовое имя GPUGP100GV100GA100
Архитектура GPUNVIDIA ПаскальNVIDIA VoltaNVIDIA Ampere
Вычислительные возможности6.07.08.0
Потоки / Деформация323232
Максимальное количество короблений / SM646464
Максимальное количество потоков / SM204820482048
Максимальное количество блоков резьбы / SM323232
Максимум 32-битных регистров / SM655366553665536
Максимальное количество регистров / блок655366553665536
Максимальное количество регистров / поток255255255
Максимальный размер блока резьбы102410241024
Ядра FP32 / SM646464
Отношение регистров SM к ядрам FP32102410241024
Размер общей памяти / SM64 КБНастраивается до 96 КБНастраивается до 164 КБ

Сравнение матрицы поддержки точности[11][12]

Поддерживаемые точности CUDA CoreПоддерживаемая точность тензорного ядра
FP16FP32FP64INT1 (двоичный)INT4INT8TF32bfloat16 (BF16)FP16FP32FP64INT1 (двоичный)INT4INT8TF32bfloat16 (BF16)
NVIDIA Тесла P4НетдадаНетНетдаНетНетНетНетНетНетНетНетНетНет
NVIDIA P100дададаНетНетНетНетНетНетНетНетНетНетНетНетНет
NVIDIA VoltaдададаНетНетдаНетНетдаНетНетНетНетНетНетНет
NVIDIA ТьюрингдададаНетНетдаНетНетдаНетНетдададаНетНет
NVIDIA A100дададаНетНетдаНетдадаНетдададададада

Сравнение производительности декодирования

Параллельные потокиДекодирование H.264 (1080p30)Декодирование H.265 (HEVC) (1080p30)Декодирование VP9 (1080p30)
V100162222
A10075157108

Ускоритель A100 и DGX A100

14 мая 2020 года был анонсирован и выпущен ускоритель A100 на базе Ampere.[8] A100 имеет 19,5 терафлопс производительности FP32, 6912 ядер CUDA, 40 ГБ графической памяти и 1,6 ТБ / с пропускной способности графической памяти.[13] Ускоритель A100 изначально был доступен только в 3-м поколении. DGX сервер, в том числе 8 А100.[8] Также в DGX A100 входит 15 ТБ PCIe поколение 4 NVMe место хранения,[13] два 64-ядерных AMD Рим 7742 процессора, 1 ТБ оперативной памяти и Mellanox -питание межблочного соединения HDR InfiniBand. Начальная цена DGX A100 составляла 199 000 долларов.[8]

Сравнение ускорителей, используемых в DGX:[8][14]

Ускоритель
A100 80 ГБ
A100
V100
P100
АрхитектураЯдра CUDA FP32Ядра FP64 (без Tensor)INT32 ЯдраBoost ClockЧасы памятиШирина шины памятиПропускная способность памятиVRAMОдинарная точностьДвойная точность (FP64)INT8 (не тензорный)INT8 ТензорINT32FP16FP16 Тензорbfloat16 ТензорTensorFloat-32 (TF32) ТензорFP64 ТензорСоединитьGPUРазмер кэша L1Размер кэша L2Размер кристалла графического процессораКоличество транзисторовTDPПроизводственный процесс
Ампер6912345669121410 МГц3,2 Гбит / с HBM25120 бит2039 ГБ / сек80 ГБ19,5 терафлопс9.7 терафлопсНет данных624 ТОПов19,5 ТОПов78 терафлопс312 терафлопс312 терафлопс156 терафлопс19,5 терафлопс600 ГБ / секGA10020736 КБ (192 КБx108)40960 КБ826 мм254,2B400 ВтTSMC 7 нм N7
Ампер6912345669121410 МГц2,4 Гбит / с HBM25120 бит1555 ГБ / сек40 ГБ19,5 терафлопс9.7 терафлопсНет данных624 ТОПов19,5 ТОПов78 терафлопс312 терафлопс312 терафлопс156 терафлопс19,5 терафлопс600 ГБ / секGA10020736 КБ (192 КБx108)40960 КБ826 мм254,2B400 ВтTSMC 7 нм N7
Вольта5120256051201530 МГц1,75 Гбит / с HBM24096 бит900 ГБ / сек16 ГБ / 32 ГБ15.7 терафлопс7,8 терафлопс62 ТОПовНет данных15.7 ТОПы31,4 терафлопс125 терафлопсНет данныхНет данныхНет данных300 ГБ / секGV10010240 КБ (128 КБ x 80)6144 КБ815 мм221,1B300 Вт / 350 ВтTSMC 12 нм FFN
Паскаль35841792Нет данных1480 МГц1,4 Гбит / с HBM24096 бит720 ГБ / сек16 ГБ10.6 терафлопс5.3 TFLOPНет данныхНет данныхНет данных21.2 терафлопсНет данныхНет данныхНет данныхНет данных160 ГБ / секGP1001344 КБ (24 КБ x 56)4096 КБ610 мм215.3B300 ВтTSMC 16 нм FinFET +


Продукты с использованием Ampere

Рекомендации

  1. ^ Отдел новостей, NVIDIA. «Новый графический процессор NVIDIA Ampere Data Center в полном объеме». Отдел новостей NVIDIA Newsroom.
  2. ^ «Подробнее об архитектуре NVIDIA Ampere». Блог разработчиков NVIDIA. 14 мая 2020.
  3. ^ Отдел новостей, NVIDIA. «NVIDIA делает величайший скачок в истории с графическими процессорами серии GeForce RTX 30». Отдел новостей NVIDIA Newsroom.
  4. ^ "NVIDIA GeForce Ultimate Countdown". NVIDIA.
  5. ^ https://nvidianews.nvidia.com/news/nvidia-doubles-down-announces-a100-80gb-gpu-supercharging-worlds-most-powerful-gpu-for-ai-supercomputing
  6. ^ «I.7. Вычислительные возможности 8.x». docs.nvidia.com. Получено 23 сентября, 2020.
  7. ^ Б., Доминик. «Старая 8-нанометровая технология Samsung в основе чудовищных карт NVIDIA Ampere». SamMobile. Получено 19 сентября, 2020.
  8. ^ а б c d е ж Смит, Райан (14 мая 2020 г.). «NVIDIA Ampere Unleashed: NVIDIA анонсирует новую архитектуру графического процессора, графический процессор A100 и ускоритель». AnandTech.
  9. ^ «Графические процессоры серии GeForce RTX 30: открывая новую эру видеоконтента с декодированием AV1». NVIDIA.
  10. ^ "Архитектура графического процессора NVIDIA A100 с тензорным ядром" (PDF). www.nvidia.com. Получено 18 сентября, 2020.
  11. ^ «Тензорные ядра NVIDIA: универсальность для высокопроизводительных вычислений и искусственного интеллекта». NVIDIA.
  12. ^ "Абстрактный". docs.nvidia.com.
  13. ^ а б Том Уоррен; Джеймс Винсент (14 мая 2020 г.). «Первый графический процессор Ampere от Nvidia предназначен для центров обработки данных и искусственного интеллекта, а не для вашего ПК». Грань.
  14. ^ «Тестирование NVIDIA Tesla V100: почти невероятная мощность графического процессора». TweakTown. 17 сентября 2017 года.

внешняя ссылка