Экскаватор (микроархитектура) - Excavator (microarchitecture)
Общая информация | |
---|---|
Запущен | 2015 |
Общий производитель (ы) | |
Архитектура и классификация | |
Мин. размер элемента | Объемный кремний 28 нм (GF28A)[1] |
Набор инструкций | AMD64 (x86-64 ) |
Продукты, модели, варианты | |
Основное имя (я) | |
История | |
Предшественник | Steamroller - Family 15h (3-го поколения) |
Преемник | Дзен |
Семейство экскаваторов AMD 15h это микроархитектура разработан AMD преуспеть Семейство паровых катков 15h для использования в AMD APU процессоры и обычные CPU. 12 октября 2011 года AMD объявила Excavator как кодовое название для четвертого поколения. Бульдозер -производное ядро.
Экскаватор на базе ВСУ для основных приложений называется Карризо и был выпущен в 2015 году.[2][3]В Карризо APU разработан, чтобы быть HSA 1.0 совместимый.[4]Вариант APU и CPU на базе экскаватора, названный Торонто для серверного и корпоративного рынков.[5]
Экскаватор был последней модификацией "Бульдозер" семья, с двумя новыми микроархитектурами, заменяющими Excavator годом позже.[6][7]Excavator сменил x86-64 Дзен архитектура в начале 2017 года.[8][9]
Архитектура
Экскаватор добавил аппаратную поддержку новых инструкций, таких как AVX2, ИМТ2 и RDRAND.[10]Экскаватор разработан с использованием библиотек высокой плотности (также известных как «тонкие»), обычно используемых для GPU уменьшить потребление электроэнергии и размер кристалла, обеспечивающий 30-процентное увеличение эффективное использование энергии.[11] Excavator может обрабатывать на 15% больше инструкций за такт по сравнению с предыдущим ядром Steamroller от AMD.[12]
Особенности и ASIC
В следующей таблице показаны особенности AMD с ВСУ (смотрите также: Список ускоренных процессоров AMD ).
Кодовое название | Сервер | Базовый | Торонто | |||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Микро | Киото | |||||||||||||||||
Рабочий стол | Основной поток | Карризо | Бристольский хребет | Рэйвен Ридж | Пикассо | Ренуар | ||||||||||||
Вход | Llano | Троица | Richland | Кавери | ||||||||||||||
Базовый | Кабини | |||||||||||||||||
Мобильный | Спектакль | Ренуар | ||||||||||||||||
Основной поток | Llano | Троица | Richland | Кавери | Карризо | Бристольский хребет | Рэйвен Ридж | Пикассо | ||||||||||
Вход | Дали | |||||||||||||||||
Базовый | Десна, Онтарио, Сакате | Кабини, Темаш | Бима, Маллинз | Карризо-Л | Stoney Ridge | |||||||||||||
Встроенный | Троица | Белоголовый орлан | Мерлин Сокол, Коричневый сокол | Большая Рогатая Сова | Серый ястреб | Онтарио, Закате | Кабини | Степной орел, Венценосный орел, LX-Семья | Калифорнийский сокол | Полосатая пустельга | ||||||||
Платформа | Высокая, стандартная и низкая мощность | Низкая и сверхнизкая мощность | ||||||||||||||||
Вышел | Август 2011 г. | Октябрь 2012 г. | Июн 2013 | Январь 2014 г. | Июн 2015 | Июн 2016 | Октябрь 2017 | Янв 2019 | Март 2020 г. | Январь 2011 г. | Май 2013 | Апрель 2014 г. | Май 2015 г. | Февраль 2016 г. | Апрель 2019 | |||
ЦПУ микроархитектура | K10 | Копер | Каток | Экскаватор | "Экскаватор + "[13] | Дзен | Дзен + | Дзен 2 | Рысь | Ягуар | Пума | Пума +[14] | "Экскаватор + " | Дзен | ||||
ЭТО | x86-64 | x86-64 | ||||||||||||||||
Разъем | Рабочий стол | Высокого класса | Нет данных | Нет данных | ||||||||||||||
Основной поток | Нет данных | AM4 | ||||||||||||||||
Вход | FM1 | FM2 | FM2 +[а] | Нет данных | ||||||||||||||
Базовый | Нет данных | Нет данных | AM1 | Нет данных | ||||||||||||||
Другой | FS1 | FS1 +, FP2 | FP3 | FP4 | FP5 | FP6 | FT1 | FT3 | FT3b | FP4 | FP5 | |||||||
PCI Express версия | 2.0 | 3.0 | 2.0 | 3.0 | ||||||||||||||
Fab. (нм ) | GF 32ШП (HKMG ТАК ЧТО Я ) | GF 28ШП (HKMG навалом) | GF 14LPP (FinFET масса) | GF 12LP (FinFET оптом) | TSMC N7 (FinFET оптом) | TSMC N40 (масса) | TSMC N28 (HKMG навалом) | GF 28SHP (HKMG навалом) | GF 14LPP (FinFET масса) | |||||||||
Умереть площадь (мм2) | 228 | 246 | 245 | 245 | 250 | 210[15] | 156 | 75 (+ 28 FCH ) | 107 | ? | 125 | 149 | ||||||
Мин. TDP (Вт) | 35 | 17 | 12 | 10 | 4.5 | 4 | 3.95 | 10 | 6 | |||||||||
Макс ВСУ TDP (Вт) | 100 | 95 | 65 | 18 | 25 | |||||||||||||
Максимальная базовая частота APU (ГГц) | 3 | 3.8 | 4.1 | 4.1 | 3.7 | 3.8 | 3.6 | 3.7 | 3.8 | 1.75 | 2.2 | 2 | 2.2 | 3.2 | 3.3 | |||
Максимальное количество APU на узел[b] | 1 | 1 | ||||||||||||||||
Максимум ЦПУ[c] ядра на ВСУ | 4 | 8 | 2 | 4 | 2 | |||||||||||||
Максимум потоки на ядро процессора | 1 | 2 | 1 | 2 | ||||||||||||||
Целочисленная структура | 3+3 | 2+2 | 4+2 | 4+2+1 | 1+1+1+1 | 2+2 | 4+2 | |||||||||||
i386, i486, i586, CMOV, NOPL, i686, PAE, Бит NX, CMPXCHG16B, AMD-V, RVI, ПРО и 64-битный LAHF / SAHF | ||||||||||||||||||
IOMMU[d] | Нет данных | |||||||||||||||||
ИМТ1, AES-NI, CLMUL, и F16C | Нет данных | |||||||||||||||||
MOVBE | Нет данных | |||||||||||||||||
AVIC, ИМТ2 и RDRAND | Нет данных | |||||||||||||||||
ADX, SHA, RDSEED, SMAP, SMEP, XSAVEC, XSAVES, XRSTORS, CLFLUSHOPT и CLZERO | Нет данных | Нет данных | ||||||||||||||||
WBNOINVD, CLWB, RDPID, RDPRU и MCOMMIT | Нет данных | Нет данных | ||||||||||||||||
FPUs на основной | 1 | 0.5 | 1 | 1 | 0.5 | 1 | ||||||||||||
Трубы на FPU | 2 | 2 | ||||||||||||||||
Ширина трубы FPU | 128 бит | 256 бит | 80-битный | 128 бит | ||||||||||||||
ЦПУ Набор инструкций SIMD уровень | SSE4a[e] | AVX | AVX2 | SSSE3 | AVX | AVX2 | ||||||||||||
3DNow! | 3DNow! + | Нет данных | Нет данных | |||||||||||||||
PREFETCH / PREFETCHW | ||||||||||||||||||
FMA4, LWP, TBM, и XOP | Нет данных | Нет данных | Нет данных | Нет данных | ||||||||||||||
FMA3 | ||||||||||||||||||
L1 кэш данных на ядро (КиБ) | 64 | 16 | 32 | 32 | ||||||||||||||
Кэш данных L1 ассоциативность (способы) | 2 | 4 | 8 | 8 | ||||||||||||||
Кешей инструкций L1 на основной | 1 | 0.5 | 1 | 1 | 0.5 | 1 | ||||||||||||
Максимальный общий кэш инструкций L1 APU (КиБ) | 256 | 128 | 192 | 256 | 512 | 64 | 128 | 96 | 128 | |||||||||
Кэш инструкций L1 ассоциативность (способы) | 2 | 3 | 4 | 8 | 2 | 3 | 4 | |||||||||||
Кеши L2 на основной | 1 | 0.5 | 1 | 1 | 0.5 | 1 | ||||||||||||
Максимальный общий объем кеш-памяти второго уровня APU (МиБ) | 4 | 2 | 4 | 1 | 2 | 1 | ||||||||||||
Кэш L2 ассоциативность (способы) | 16 | 8 | 16 | 8 | ||||||||||||||
Всего ВСУ Кэш L3 (МиБ) | Нет данных | 4 | 8 | Нет данных | 4 | |||||||||||||
Кэш APU L3 ассоциативность (способы) | 16 | 16 | ||||||||||||||||
Схема кеш-памяти L3 | Жертва | Нет данных | Жертва | Жертва | ||||||||||||||
Максимальный запас DRAM поддерживать | DDR3-1866 | DDR3-2133 | DDR3-2133, DDR4-2400 | DDR4-2400 | DDR4-2933 | DDR4-3200, LPDDR4-4266 | DDR3L-1333 | DDR3L-1600 | DDR3L-1866 | DDR3-1866, DDR4-2400 | DDR4-2400 | |||||||
Максимум DRAM каналов на APU | 2 | 1 | 2 | |||||||||||||||
Максимальный запас DRAM пропускная способность (ГБ / с) на APU | 29.866 | 34.132 | 38.400 | 46.932 | 68.256 | 10.666 | 12.800 | 14.933 | 19.200 | 38.400 | ||||||||
GPU микроархитектура | TeraScale 2 (VLIW5) | TeraScale 3 (VLIW4) | GCN 2-го поколения | GCN 3-го поколения | GCN 5-го поколения[16] | TeraScale 2 (VLIW5) | GCN 2-го поколения | GCN 3-го поколения[16] | GCN 5-го поколения | |||||||||
GPU Набор инструкций | TeraScale Набор инструкций | Набор инструкций GCN | TeraScale Набор инструкций | Набор инструкций GCN | ||||||||||||||
Максимальная базовая частота графического процессора (МГц) | 600 | 800 | 844 | 866 | 1108 | 1250 | 1400 | 2100 | 538 | 600 | ? | 847 | 900 | 1200 | ||||
Максимальное количество базовых графических процессоров GFLOPS[f] | 480 | 614.4 | 648.1 | 886.7 | 1134.5 | 1760 | 1971.2 | 2150.4 | 86 | ? | ? | ? | 345.6 | 460.8 | ||||
3D двигатель[грамм] | До 400: 20: 8 | До 384: 24: 6 | До 512: 32: 8 | До 704: 44: 16[17] | До 512:?:? | 80:8:4 | 128:8:4 | До 192:?:? | До 192:?:? | |||||||||
IOMMUv1 | IOMMUv2 | IOMMUv1 | ? | IOMMUv2 | ||||||||||||||
Видео декодер | УВД 3.0 | УВД 4.2 | УВД 6.0 | VCN 1.0[18] | VCN 2.0[19] | УВД 3.0 | УВД 4.0 | УВД 4.2 | УВД 6.0 | УВД 6.3 | VCN 1.0 | |||||||
Кодировщик видео | Нет данных | VCE 1.0 | VCE 2.0 | VCE 3.1 | Нет данных | VCE 2.0 | VCE 3.1 | |||||||||||
Энергосбережение GPU | PowerPlay | PowerTune | PowerPlay | PowerTune[20] | ||||||||||||||
TrueAudio | Нет данных | [21] | Нет данных | |||||||||||||||
FreeSync | 1 2 | 1 2 | ||||||||||||||||
HDCP[час] | ? | 1.4 | 1.4 2.2 | ? | 1.4 | 1.4 2.2 | ||||||||||||
PlayReady[час] | Нет данных | 3.0 еще нет | Нет данных | 3.0 еще нет | ||||||||||||||
Поддерживаемые дисплеи[я] | 2–3 | 2–4 | 3 | 3 (рабочий стол) 4 (мобильный, встроенный) | 4 | 2 | 3 | 4 | ||||||||||
/ DRM / radeon [j][23][24] | Нет данных | Нет данных | ||||||||||||||||
/ drm / amdgpu [j][25] | Нет данных | [26] | Нет данных | [26] |
- ^ Модели APU: A8-7680, A6-7480. Только процессор: Athlon X4 845.
- ^ ПК будет одним узлом.
- ^ APU сочетает в себе процессор и графический процессор. У обоих есть ядра.
- ^ Требуется поддержка прошивки.
- ^ Нет SSE4. Нет SSSE3.
- ^ Одинарная точность производительность рассчитывается исходя из базовой (или ускоренной) тактовой частоты ядра на основе FMA операция.
- ^ Унифицированные шейдеры : блоки наложения текстуры : единицы вывода рендеринга
- ^ а б Для воспроизведения защищенного видеоконтента также требуется поддержка карты, операционной системы, драйверов и приложений. Для этого также необходим совместимый дисплей HDCP. HDCP является обязательным для вывода определенных аудиоформатов, что накладывает дополнительные ограничения на настройку мультимедиа.
- ^ Чтобы питать более двух дисплеев, дополнительные панели должны иметь собственный DisplayPort поддерживать.[22] В качестве альтернативы можно использовать активные адаптеры DisplayPort-to-DVI / HDMI / VGA.
- ^ а б DRM (Менеджер прямого рендеринга ) является компонентом ядра Linux. Поддержка в этой таблице относится к самой последней версии.
Процессоров
Линии ВСУ
Есть три ВСУ объявленные или выпущенные линии:
- Бюджетные и основные рынки (настольные и мобильные): Карризо ВСУ
- В Карризо мобильные APU были запущены в 2015 году на базе Экскаватор ядра x86 и особенности Гетерогенная системная архитектура для интегрированного разделения задач между процессорами и графическими процессорами, что позволяет графическому процессору выполнять вычислительные функции, которые, как утверждается, обеспечивают больший прирост производительности, чем только уменьшение размера функции.[4]
- Карризо APU для настольных ПК были выпущены в 2018 году. Основной продукт (A8-7680) имеет 4 ядра Excavator и графический процессор на основе архитектуры GCN1.2. Также выпущен APU начального уровня (A6-7480) с 2 ядрами Excavator.
- Бюджетные и основные рынки (настольные и мобильные): Бристольский хребет, и Stoney Ridge (для ноутбуков начального уровня), APU[27]
- В APU Bristol Ridge используются розетка AM4 и DDR4 RAM
- APU Bristol Ridge имеют до 4 ядер ЦП Excavator и до 8 ядер третьего поколения. GCN Ядра GPU
- Повышение производительности процессора до 20% по сравнению с Carrizo
- TDP от 15 Вт до 65 Вт, 15–35 Вт для мобильных устройств
- Рынки предприятий и серверов: Торонто ВСУ
- В Торонто APU для серверного и корпоративного рынков включает четыре основных модуля процессора x86 Excavator и Вулканические острова встроенное ядро графического процессора.
- В Экскаватор ядер имеет большее преимущество с МПК чем Каток. Улучшение составляет 4–15%.
- Поддержка для HSA /hUMA, DDR3 /DDR4, PCIe 3.0, GCN 1.2[4][5][9]
- В Торонто APU был доступен в BGA и SoC варианты. Вариант SoC имел южный мост на том же кристалле, что и APU, для экономии места и энергии, а также для оптимизации рабочих нагрузок.
- Полная система с APU Toronto будет иметь максимальную потребляемую мощность 70 Вт.[5]
Линии CPU Desktop
Нет планов на Каток (3-е поколение Бульдозер ) или Excavator (4-е поколение Bulldozer) на настольных платформах высокого класса.
2 февраля 2016 года был анонсирован процессор Excavator для настольных ПК под названием Athlon X4 845.[28]В 2017 году были выпущены еще три настольных процессора (Athlon X4 9x0). Они выпускаются под Socket AM4 с TDP 65 Вт. Фактически, это APU с отключенными графическими ядрами.
Модель процессора | Частота (ГГц) | Ядра | TDP (Ватт) | Разъем | Кэш L1D | Кэш L2 | PCI Express 3.0 | Относительный МПК | Заблокировано |
---|---|---|---|---|---|---|---|---|---|
Athlon X4 845 (Carrizo) | 3,5 (3,8 турбо) | 4 | 65 | Розетка FM2 + (906) | 4 * 32 КБ | 2 * 1 МБ | X8 | 1.0 | да |
Athlon X4 940 (Бристольский хребет) | 3,2 (3,6 турбо) | 4 | 65 | Разъем AM4 (1331) | 4 * 32 КБ | 2 * 1 МБ | X16 | 1.1 | Нет |
Athlon X4 950 (Бристольский хребет) | 3,5 (3,8 турбо) | 4 | 65 | Разъем AM4 (1331) | 4 * 32 КБ | 2 * 1 МБ | X16 | 1.1 | Нет |
Athlon X4 970 (Бристольский хребет) | 3,8 (4,0 турбо) | 4 | 65 | Разъем AM4 (1331) | 4 * 32 КБ | 2 * 1 МБ | X16 | 1.1 | Нет |
Линии сервера
Дорожные карты AMD Opteron на 2015 год показывают, что на базе экскаватора Торонто ВСУ и Торонто ЦП, предназначенный для приложений кластера с 1 процессором (1P):[5]
- Для кластеров веб-служб и корпоративных служб 1P:
- Торонто Процессор - четырехъядерный процессор x86 Excavator, архитектура
- планы на Кембридж CPU - 64-битный AArch64 основной
- Для вычислительных и мультимедийных кластеров 1P:
- Торонто APU - четырехъядерный процессор x86 Excavator, архитектура
- Для серверов 2P / 4P:
- Варшава Процессор - 12/16 ядер x86 Копер (Бульдозер 2-го поколения) (Opteron 6338P и 6370P )
- нет планов на Каток (3-е поколение Бульдозер ) или Excavator (4-е поколение Bulldozer) на многопроцессорных платформах высокого класса
Рекомендации
- ^ http://www.extremetech.com/computing/176919-amd-leak-confirms-that-excavator-apu-will-be-28nm-and-that-some-production-is-moving-back-to-globalfoundries
- ^ Рейнольдс, Сэм (31 октября 2013 г.). «Новые подтвержденные подробности о линейке APU AMD 2014 года, Кавери отложен». Vr-zone.com. Получено 24 ноября, 2013.
- ^ «AMD обновляет дорожную карту продукта на 2014 и 2015 годы». Digitimes.com. 26 августа 2013 г.. Получено 24 ноября, 2013.
- ^ а б c Хахман, Марк (21 ноября 2014 г.). «AMD представляет высокопроизводительный APU Carrizo, первый чип, полностью поддерживающий дерзкую технологию HSA». PCWorld. Получено 15 января, 2015.
- ^ а б c d Муджтаба, Хасан (26 декабря 2013 г.). «Дорожная карта AMD Opteron раскрывает подробности APU нового поколения Toronto и Carrizo». WCCF Tech. Получено 15 января, 2015.
- ^ http://www.bit-tech.net/news/hardware/2014/09/11/amd-zen/1
- ^ «Архивная копия». Архивировано из оригинал на 2014-05-13. Получено 2014-05-22.CS1 maint: заархивированная копия как заголовок (связь)
- ^ Моаммер, Халид (9 сентября 2014 г.). «Высокопроизводительное ядро AMD следующего поколения x86 - это Zen». WCCF Tech. Получено 15 января, 2015.
- ^ а б Муджтаба, Хасан (5 мая 2014 г.). «AMD объявляет план развития на 2014–2016 годы - 20-нанометровые ядра Project SkyBridge и K12 64-битные ядра ARM на 2016 год». WCCF Tech. Получено 15 января, 2015.
- ^ «Архитектура AMD Carrizo подробно и исследована». Extremetech.com. 2 июня 2015 г.. Получено 3 марта, 2019.
- ^ http://www.tomshardware.com/news/Steamroller-High_Density_Libraries-hot-chips-cpu-gpu,17218.html
- ^ http://wccftech.com/amd-carrizo-apu-architecture-hot-chips/
- ^ «AMD представляет APU 7-го поколения: Excavator mk2 в Бристоль-Ридж и Стони-Ридж для ноутбуков». 31 мая 2016. Получено 3 января 2020.
- ^ Семейство APU AMD Mobile Carrizo, призванное обеспечить значительный скачок в производительности и энергоэффективности в 2015 году » (Пресс-релиз). 20 ноября 2014 г.. Получено 16 февраля 2015.
- ^ «Руководство по сравнению мобильных процессоров, версия 13.0, стр. 5: Полный список мобильных процессоров AMD». TechARP.com. Получено 13 декабря 2017.
- ^ а б «Графические процессоры AMD VEGA10 и VEGA11 обнаружены в драйвере OpenCL». VideoCardz.com. Получено 6 июн 2017.
- ^ Катресс, Ян (1 февраля 2018 г.). «Ядра Zen и Vega: APU Ryzen для AM4 - AMD Tech Day на CES: Обнародована дорожная карта 2018, с APU Ryzen, Zen + на 12-нм, Vega на 7-нм». Анандтех. Получено 7 февраля 2018.
- ^ Ларабель, Майкл (17 ноября 2017 г.). «Поддержка кодирования Radeon VCN появляется в Mesa 17.4 Git». Фороникс. Получено 20 ноября 2017.
- ^ Лю, Лев (2020-09-04). "Добавить поддержку Renoir VCN decode". Получено 2020-09-11.
Имеет тот же блок VCN2.x, что и Navi1x
- ^ Тони Чен; Джейсон Гривз, «Архитектура AMD Graphics Core Next (GCN)» (PDF), AMD, получено 13 августа 2016
- ^ «Технический взгляд на архитектуру AMD Kaveri». Полуточный. Получено 6 июля 2014.
- ^ «Как подключить три или более монитора к графической карте AMD Radeon ™ HD 5000, HD 6000 и HD 7000?». AMD. Получено 8 декабря 2014.
- ^ Эйрли, Дэвид (26 ноября 2009 г.). «DisplayPort поддерживается драйвером KMS, встроенным в ядро Linux 2.6.33». Получено 16 января 2016.
- ^ "Матрица функций Radeon". freedesktop.org. Получено 10 января 2016.
- ^ Дойче, Александр (16 сентября 2015). "XDC2015: AMDGPU" (PDF). Получено 16 января 2016.
- ^ а б Мишель Дэнзер (17 ноября 2016 г.). "[ОБЪЯВЛЕНИЕ] xf86-video-amdgpu 1.2.0". lists.x.org.
- ^ Катресс, Ян (1 июня 2016 г.). «AMD представляет APU 7-го поколения». Anandtech.com. Получено 1 июня 2016.
- ^ Джефф Кампман (2 февраля 2016 г.). «AMD ставит Excavator на рабочий стол с Athlon X4 845».