Nvidia Tesla - Nvidia Tesla

Nvidia Tesla
Графический процессор Nvidia Tesla
Дата выхода2 мая 2007 г.

Nvidia Tesla было имя Nvidia линейка продуктов, ориентированная на потоковая обработка или же универсальные графические процессоры (ГПГПУ), названный в честь новатор-электрик Никола Тесла. Его продукты начали использовать графические процессоры от G80 серии и продолжили сопровождать выпуск новых чипов. Их можно программировать с помощью CUDA или же OpenCL API.

Линия продуктов Nvidia Tesla конкурировала с AMD Radeon Instinct и Intel Ксеон Пхи линейки глубокого обучения и видеокарт.

Nvidia отказалась от бренда Tesla в мае 2020 года, как сообщается, из-за возможной путаницы с марка автомобилей.[1] Его новые графические процессоры брендированы Графические процессоры Nvidia Data Center,[2] как в графическом процессоре Ampere A100.[3]

Обзор

Nvidia Tesla C2075

Предлагая вычислительную мощность, намного превышающую традиционную микропроцессоры, продукция Tesla нацелена на высокопроизводительные вычисления рынок.[4] По состоянию на 2012 год, Nvidia Teslas - одни из самых быстрых в мире суперкомпьютеры, включая Саммит в Национальная лаборатория Окриджа и Тяньхэ-1А, в Тяньцзинь, Китай.

Карты Tesla имеют в четыре раза большую производительность с двойной точностью, чем карты Ферми -на основе карты Nvidia GeForce аналогичной производительности одинарной точности.[нужна цитата ]В отличие от потребителя Nvidia GeForce карты и профессиональные Nvidia Quadro карты, карты Tesla изначально не могли выводить изображения на отображать. Однако последние продукты Tesla C-класса включали один порт Dual-Link DVI.[5]

Как часть Проект Денвер, Nvidia намеревается встраивать процессорные ядра ARMv8 в свои графические процессоры.[6] Это будет 64-битное продолжение 32-битной Тегра чипсы.

Tesla P100 использует TSMC с 16 нанометров FinFET процесс производства полупроводников, который более продвинут, чем 28 нанометров процесс, ранее использовавшийся AMD и графические процессоры Nvidia в период с 2012 по 2016 год. P100 также использует Samsung с HBM2 объем памяти.[7]

Приложения

Продукты Tesla в основном используются для моделирования и крупномасштабных вычислений (особенно вычислений с плавающей запятой), а также для создания высококачественных изображений в профессиональных и научных областях.[8]

В 2013 году на оборонную промышленность приходилось менее одной шестой продаж Tesla, но Сумит Гупта прогнозировал увеличение продаж в геопространственный интеллект рынок.[9]

Характеристики

Модель Микро-
архитектура
ЗапускЧипсыОсновные часы
(МГц )
Шейдерыобъем памятиВычислительная мощность (GFLOPS )[а]CUDA
вычислить
способность[b]
TDP
(Вт)
Примечания, form_factor
Ядра Cuda
(общий)
Базовые часы (МГц )Максимальное усиление
Часы (МГц )[c]
Тип автобусаШирина автобуса
(кусочек )
Размер
(ГБ )
Часы
(МТ / с )
Пропускная способность
(ГБ / с)
Одинарная точность
(MAD + MUL)
Одинарная точность
(MAD или FMA )
Двойная точность
(FMA )
ЕдиницыМГцМГцW
Вычислительный модуль C870 GPU[d]Тесла2 мая 2007 г.1 × G806001281350Нет данныхGDDR33841.5160076.8518.4345.6Нет1.0170.9Внутренний графический процессор PCIe (полноразмерный, с двумя слотами)
Настольный компьютер D870[d]2 мая 2007 г.2 × G806002561350Нет данныхGDDR32× 3842× 1.516002× 76.81036.8691.2Нет1.0520Рабочий стол или 3U монтаж в стойку внешние графические процессоры
Вычислительный сервер S870 GPU[d]2 мая 2007 г.4 × G806005121350Нет данныхGDDR34× 3844× 1.516004× 76.82073.61382.4Нет1.01U монтаж в стойку внешние графические процессоры, подключение через 2 × PCIe (× 16)
Вычислительный модуль C1060 GPU[e]9 апреля 2009 г.1 × GT2006022401296[11]Нет данныхGDDR351241600102.4933.12622.0877.761.3187.8Внутренний графический процессор PCIe (полноразмерный, с двумя слотами)
Вычислительный сервер S1070 GPU "400 конфигурация"[e]1 июня 2008 г.4 × GT2006029601296Нет данныхGDDR34× 5124× 41538.44× 98.53732.52488.3311.01.38001U монтаж в стойку внешние графические процессоры, подключение через 2 × PCIe (× 8 или × 16)
Вычислительный сервер S1070 GPU "конфигурация 500"[e]1440Нет данных4147.22764.8345.6
Вычислительный сервер S1075 GPU[e][12]1 июня 2008 г.4 × GT2006029601440Нет данныхGDDR34× 5124× 41538.44× 98.54147.22764.8345.61.31U монтаж в стойку внешние графические процессоры, подключение через 1 × PCIe (× 8 или × 16)
Система визуальных вычислений Quadro Plex 2200 D2[f]2 × GT200GL6484801296Нет данныхGDDR32× 5122× 416002× 102.41866.21244.2155.51.3Рабочий стол или 3U монтаж в стойку внешние графические процессоры с 4 двухканальными выходами DVI
Система визуальных вычислений Quadro Plex 2200 S4[f]4 × GT200GL6489601296Нет данныхGDDR34× 5124× 416004× 102.43732.52488.3311.01.312001U монтаж в стойку внешние графические процессоры, подключение через 2 × PCIe (× 8 или × 16)
Вычислительный модуль C2050 GPU[13]Ферми25 июля 2011 г.1 × GF1005754481150Нет данныхGDDR53843[грамм]3000144Нет1030.4515.22.0247Внутренний графический процессор PCIe (полноразмерный, с двумя слотами)
Вычислительный модуль M2050 GPU[14]25 июля 2011 г.Нет данных3092148.4Нет225
Вычислительный модуль C2070 GPU[13]25 июля 2011 г.1 × GF1005754481150Нет данныхGDDR53846[грамм]3000144Нет1030.4515.22.0247Внутренний графический процессор PCIe (полноразмерный, с двумя слотами)
Вычислительный модуль C2075 GPU[15]25 июля 2011 г.Нет данных3000144Нет225
Вычислительный модуль M2070 / M2070Q GPU[16]25 июля 2011 г.Нет данных3132150.336Нет225
Вычислительный модуль M2090 GPU[17]25 июля 2011 г.1 × GF1106505121300Нет данныхGDDR53846[грамм]3700177.6Нет1331.2665.62.0225Внутренний графический процессор PCIe (полноразмерный, с двумя слотами)
Вычислительный сервер S2050 GPU25 июля 2011 г.4 × GF10057517921150Нет данныхGDDR54× 3844× 3[грамм]34× 148.4Нет4121.62060.82.09001U монтаж в стойку внешние графические процессоры, подключение через 2 × PCIe (× 8 или × 16)
Вычислительный сервер S2070 GPUНет данных4× 6[грамм]Нет
Графический ускоритель K10[18]Кеплер1 мая 2012 г.2 × ГК104Нет данных3072745?GDDR52× 2562× 450002× 160Нет4577190.73.0225Внутренний графический процессор PCIe (полноразмерный, с двумя слотами)
Графический ускоритель K20[19][20]12 ноября 2012 г.1 × GK110Нет данных2496706758GDDR532055200208Нет352411753.5225Внутренний графический процессор PCIe (полноразмерный, с двумя слотами)
Графический ускоритель K20X[21]12 ноября 2012 г.1 × GK110Нет данных2688732?GDDR538465200250Нет393513123.5235Внутренний графический процессор PCIe (полноразмерный, с двумя слотами)
Графический ускоритель K40[22]8 октября 2013 г.1 × ГК110БНет данных2880745875GDDR538412[грамм]6000288Нет4291–50401430–16803.5235Внутренний графический процессор PCIe (полноразмерный, с двумя слотами)
Графический ускоритель K80[23]17 ноября 2014 г.2 × ГК210Нет данных4992560875GDDR52× 3842× 1250002× 240Нет5591–87361864–29123.7300Внутренний графический процессор PCIe (полноразмерный, с двумя слотами)
Графический ускоритель M4[24][25]Максвелл10 ноября 2015 г.1 × GM206Нет данных10248721072GDDR51284550088Нет1786–219555.81–68.615.250–75Внутренний графический процессор PCIe (половинной высоты, один слот)
Графический ускоритель M6[26]30 августа 2015 г.1 × GM204-995-A1Нет данных15367221051GDDR525684600147.2Нет2218–322969.3–100.95.275–100Внутренний графический процессор MXM
Графический ускоритель M10[27]4 × GM107Нет данных25601033?GDDR54× 1284× 851884× 83Нет5289165.35.2225Внутренний графический процессор PCIe (полноразмерный, с двумя слотами)
Графический ускоритель M40[25][28]10 ноября 2015 г.1 × GM200Нет данных30729481114GDDR5384126000288Нет5825–6844182.0–213.95.2250Внутренний графический процессор PCIe (полноразмерный, с двумя слотами)
Графический ускоритель M60[29]30 августа 2015 г.2 × GM204-895-A1Нет данных40968991178GDDR52× 2562× 850002× 160Нет7365–9650230.1–301.65.2225–300Внутренний графический процессор PCIe (полноразмерный, с двумя слотами)
Графический ускоритель P4[30]Паскаль13 сентября 2016 г.1 × GP104Нет данных25608101063GDDR525686000192.0Нет4147–5443129.6–170.16.150-75PCIe карта
Графический ускоритель P6[31][32]24 марта 2017 г.1 × GP104-995-A1Нет данных204810121506GDDR5256163003192.2Нет6169192.86.190MXM карта
Графический ускоритель P40[30]13 сентября 2016 г.1 × GP102Нет данных384013031531GDDR5384247200345.6Нет10007–11758312.7–367.46.1250PCIe карта
Графический ускоритель P100 (мезонин)[33][34]5 апреля 2016 г.1 × GP100-890-A1Нет данных358413281480HBM24096161430732Нет9519–106094760–53046.0300NVLink карта
Графический ускоритель P100 (карта 16 ГБ)[35]20 июня 2016 г.1 × GP100Нет данных11261303Нет8071‒93404036‒4670250PCIe карта
Графический ускоритель P100 (карта 12 ГБ)[35]20 июня 2016 г.Нет данных307212549Нет8071‒93404036‒4670
GPU-ускоритель V100 (мезонин)[36][37][38]Вольта1 × GV100-895-A1Нет данных5120Неизвестно1455HBM2409616 или 321750900Нет1489974507.0300Карта NVlink
Графический ускоритель V100 (карта PCIe)[36][37][38]21 июня 2017 г.1 × GV100Нет данныхНеизвестно1370Нет140287014250Карта PCIe
Графический ускоритель T4 (карта PCIe)[39][40]Тьюринг12 сентября 2018 г.1 × ТУ104-895-А1Нет данных25605851590GDDR625616Неизвестно320Нет8100Неизвестно7.570Карта PCIe
Модель Микро-
архитектура
ЗапускЧипсыОсновные часы
(МГц )
Шейдерыобъем памятиВычислительная мощность (GFLOPS )[а]CUDA
вычислить
способность
TDP
(Вт)
Примечания, форм-фактор
Ядра Cuda
(общий)
Базовые часы (МГц )Максимальное усиление
Часы (МГц )[c]
Тип автобусаШирина автобуса
(кусочек )
Размер
(ГБ )
Часы
(МТ / с )
Пропускная способность
(общий)
(ГБ / с)
Одинарная точность
(MAD + MUL)
Одинарная точность
(MAD или FMA )
Двойная точность
(FMA )

Примечания

  1. ^ а б Для расчета вычислительной мощности см. Tesla (микроархитектура) # Производительность, Ферми (микроархитектура) # Производительность, Кеплер (микроархитектура) # Производительность, Максвелл (микроархитектура) # Производительность, или же Паскаль (микроархитектура) # Производительность. Диапазон чисел определяет минимальную и максимальную вычислительную мощность при базовой и максимальной тактовой частоте соответственно.
  2. ^ Версия базовой архитектуры согласно CUDA руководство по программированию.
  3. ^ а б Ускорение графического процессора - это функция по умолчанию, которая увеличивает тактовую частоту ядра при сохранении предопределенного бюджета мощности карты. Доступны несколько тактовых импульсов разгона, но в этой таблице перечислены самые высокие тактовые частоты, поддерживаемые каждой картой.[10]
  4. ^ а б c Спецификации, не указанные Nvidia, предположительно основаны на GeForce 8800 GTX
  5. ^ а б c d Спецификации, не указанные Nvidia, предположительно основаны на GeForce GTX 280
  6. ^ а б Спецификации, не указанные Nvidia, предполагают, что они основаны на Quadro FX 5800
  7. ^ а б c d е ж При включенном ECC часть выделенной памяти используется для битов ECC, поэтому доступная пользовательская память уменьшается на 12,5%. (например, общий объем памяти 4 ГБ дает 3,5 ГБ доступной пользователю памяти.)

Смотрите также

Рекомендации

  1. ^ Касас, Алекс (19 мая 2020 г.). «NVIDIA отказывается от бренда Tesla, чтобы не путать с Tesla». Wccftech. Получено 8 июля 2020.
  2. ^ https://www.nvidia.com/en-us/data-center/data-center-gpus/
  3. ^ «Графические процессоры NVIDIA A100 питают современный центр обработки данных». NVIDIA. Получено 8 июля 2020.
  4. ^ «Высокопроизводительные вычисления - суперкомпьютерные вычисления с помощью графических процессоров Tesla».
  5. ^ «Профессиональные решения для рабочих станций».
  6. ^ «Nvidia интегрирует процессоры ARM в Tesla». 1 ноября 2012 г.
  7. ^ Уолтон, Марк (6 апреля 2016 г.). «Nvidia представляет первую видеокарту Pascal - чудовищную Tesla P100». Ars Technica. Получено 19 июн 2019.
  8. ^ Краткое техническое описание Tesla (PDF)
  9. ^ «Nvidia гонится за обороной и разведывательными независимыми разработчиками с графическими процессорами». www.theregister.com. Получено 8 июля 2020.
  10. ^ «Повышение производительности графического процессора Nvidia для Tesla» (PDF). Январь 2014. Получено 7 декабря 2015.
  11. ^ "Плата вычислительного процессора Tesla C1060" (PDF). Nvidia.com. Получено 11 декабря 2015.
  12. ^ «Разница между Tesla S1070 и S1075». 31 октября 2008 г.. Получено 29 января 2017. S1075 имеет одну интерфейсную карту
  13. ^ а б «Вычислительный процессор Tesla C2050 и Tesla C2070» (PDF). Nvidia.com. Получено 11 декабря 2015.
  14. ^ «Двухслотовые вычислительные процессорные модули Tesla M2050 и Tesla M2070 / M2070Q» (PDF). Nvidia.com. Получено 11 декабря 2015.
  15. ^ "Плата вычислительного процессора Tesla C2075" (PDF). Nvidia.com. Получено 11 декабря 2015.
  16. ^ Рука, Рэндалл (23 августа 2010 г.). "Технические характеристики NVidia Tesla M2050 и M2070 / M2070Q OnlineVizWorld.com". VizWorld.com. Получено 11 декабря 2015.
  17. ^ "Двухслотовый вычислительный процессор Tesla M2090" (PDF). Nvidia.com. Получено 11 декабря 2015.
  18. ^ «Ускоритель Tesla K10 GPU» (PDF). Nvidia.com. Получено 11 декабря 2015.
  19. ^ «Активный ускоритель Tesla K20 GPU» (PDF). Nvidia.com. Получено 11 декабря 2015.
  20. ^ «Ускоритель Tesla K20 GPU» (PDF). Nvidia.com. Получено 11 декабря 2015.
  21. ^ «Графический ускоритель Tesla K20X» (PDF). Nvidia.com. Получено 11 декабря 2015.
  22. ^ «Ускоритель Tesla K40 GPU» (PDF). Nvidia.com. Получено 11 декабря 2015.
  23. ^ «Ускоритель Tesla K80 GPU» (PDF). Images.nvidia.com. Получено 11 декабря 2015.
  24. ^ «Nvidia анонсирует серверные карты Tesla M40 и M4 - машинное обучение в центре обработки данных». Anandtech.com. Получено 11 декабря 2015.
  25. ^ а б «Ускорение приложений гипермасштабируемых центров обработки данных с помощью графических процессоров Tesla | Parallel Forall». Devblogs.nvidia.com. 10 ноября 2015 г.. Получено 11 декабря 2015.
  26. ^ «Тесла М6» (PDF). Images.nvidia.com. Получено 28 мая 2016.
  27. ^ «Тесла М10» (PDF). Images.nvidia.com. Получено 29 октября 2016.
  28. ^ «Тесла М40» (PDF). Images.nvidia.com. Получено 11 декабря 2015.
  29. ^ «Тесла М60» (PDF). Images.nvidia.com. Получено 27 мая 2016.
  30. ^ а б Смит, Райан (13 сентября 2016 г.). «Nvidia анонсирует Tesla P40 и Tesla P4 - сетевой вывод, большой и маленький». Анандтех. Получено 13 сентября 2016.
  31. ^ «Тесла Р6» (PDF). www.nvidia.com. Получено 7 марта 2019.
  32. ^ "Технические характеристики Tesla P6". www.techpowerup.com. Получено 7 марта 2019.
  33. ^ Смит, Райан (5 апреля 2016 г.). «Nvidia анонсирует ускоритель Tesla P100 - Pascal GP100 для высокопроизводительных вычислений». Anandtech.com. Anandtech.com. Получено 5 апреля 2016.
  34. ^ Харрис, Марк. «Внутри Pascal: новейшая вычислительная платформа Nvidia». Получено 13 сентября 2016.
  35. ^ а б Смит, Райан (20 июня 2016 г.). «NVidia анонсирует PCI Express Tesla P100». Anandtech.com. Получено 21 июн 2016.
  36. ^ а б Смит, Райан (10 мая 2017 г.). «Основной живой блог конференции по технологиям графических процессоров Nvidia 2017». Анандтех. Получено 10 мая 2017.
  37. ^ а б Смит, Райан (10 мая 2017 г.). «Представлена ​​NVIDIA Volta: анонсированы графический процессор GV100 и ускоритель Tesla V100». Анандтех. Получено 10 мая 2017.
  38. ^ а б О, Нейт (20 июня 2017 г.). «NVIDIA официально объявляет о выпуске V100, который будет доступен позже в этом году». Anandtech.com. Получено 20 июн 2017.
  39. ^ "NVIDIA TESLA T4 TENSOR CORE GPU". NVIDIA. Получено 17 октября 2018.
  40. ^ «Краткое описание продукта NVIDIA Tesla T4 Tensor Core» (PDF). www.nvidia.com. Получено 10 июля 2019.

внешняя ссылка