Блок тензорной обработки - Tensor Processing Unit
Дизайнер | |
---|---|
Введено | Май 2016 |
Тип | Нейронная сеть Машинное обучение |
Блок тензорной обработки (ТПУ) является AI-ускоритель специализированная интегральная схема (ASIC) разработан Google специально для нейронная сеть машинное обучение, в частности, используя собственные TensorFlow программного обеспечения.[1] Google начал использовать TPU внутри компании в 2015 году, а в 2018 году сделал их доступными для использования третьими сторонами, как в рамках своей облачной инфраструктуры, так и предлагая меньшую версию чипа для продажи.
Обзор
Блок обработки тензора был анонсирован в мае 2016 г. Google I / O, когда компания заявила, что ТПУ уже использовался внутри их дата-центры больше года.[2][3] Чип был специально разработан для Google TensorFlow framework, символьная математическая библиотека, которая используется для машинное обучение такие приложения, как нейронные сети.[4] Однако по состоянию на 2017 год Google все еще использовал Процессоры и GPU для других типов машинное обучение.[2] Другой AI-ускоритель дизайны появляются и от других поставщиков и нацелены на встроенный и робототехника рынки.
TPU от Google являются проприетарными. Некоторые модели доступны в продаже, и 12 февраля 2018 г. Нью-Йорк Таймс сообщил, что Google «позволит другим компаниям покупать доступ к этим чипам через свою службу облачных вычислений».[5] Google заявил, что они использовались в AlphaGo против Ли Седола серия человек-машина Идти игры[3] а также в AlphaZero система, которая произвела Шахматы, Сёги и Go, играя в программы только на основании правил игры, и впоследствии превзошли ведущие программы в этих играх.[6] Google также использовал TPU для Google Street View обработки текста и смог найти весь текст в базе данных Street View менее чем за пять дней. В Google Фото, отдельный ТПУ может обрабатывать более 100 миллионов фотографий в день. Он также используется в RankBrain которые Google использует для предоставления результатов поиска.[7]
По сравнению с графический процессор, он разработан для большого объема вычислений с низкой точностью (например, всего лишь 8 бит точность)[8] с большим количеством операций ввода / вывода на джоуль, и отсутствует оборудование для растеризации /наложение текстуры.[3] ТПУ ASIC смонтированы в радиаторе, который может поместиться в слот жесткого диска в центре обработки данных. стойка, согласно с Норман Джуппи.[2]
Продукты
TPUv1 | TPUv2 | TPUv3 | TPUv4[9] | Edge v1 | |
---|---|---|---|---|---|
Дата появления | 2016 | 2017 | 2018 | 2020 | 2018 |
Узел процесса | 28 нм | 20 нм? | 12 нм? | ? | |
Размер матрицы (мм2) | 331 | ? | ? | ? | |
Встроенная память (МиБ) | 28 | ? | ? | ? | |
Тактовая частота (МГц) | 700 | ? | ? | ? | |
Память (ГБ) | 8 ГБ DDR3 | 16 ГБ HBM | 32 ГБ HBM | ? | |
Расчетная мощность (Вт) | 40 | 200 | 250 | ? | 2 |
ТОПЫ | 23 | 45 | 90 | ? | 4 |
ТПУ первого поколения
ТПУ первого поколения - это 8 бит матричное умножение двигатель, приводимый в движение Инструкции CISC хост-процессором через PCIe 3.0 автобус. Изготовлен на 28 нм процесс с размером матрицы ≤ 331мм2. В Тактовая частота 700МГц и у него есть Тепловая схема питания из 28–40W. Имеет 28МиБ встроенной памяти и 4МиБ из 32-битный аккумуляторы взяв результаты 256 × 256 систолический массив 8-битного множители.[10] В пакете TPU 8ГиБ из двойной канал 2133 МГц DDR3 SDRAM предлагая пропускную способность 34 ГБ / с.[11] Команды передают данные на хост или с него, выполняют матричное умножение или извилины, и применить функции активации.[10]
ТПУ второго поколения
ТПУ второго поколения было анонсировано в мае 2017 года.[12] Google заявил, что дизайн TPU первого поколения был ограничен пропускная способность памяти и используя 16 ГБ из Память с высокой пропускной способностью во втором поколении увеличена пропускная способность до 600 ГБ / с и производительность до 45 тераФЛОПЫ.[11] Затем TPU объединяются в четырехчиповые модули с производительностью 180 терафлопс.[12] Затем 64 из этих модулей собираются в блоки с 256 микросхемами с производительностью 11,5 петафлопс.[12] Примечательно, что в то время как TPU первого поколения были ограничены целыми числами, TPU второго поколения также могут рассчитывать в плавающая точка. Это делает TPU второго поколения полезными как для обучения, так и для вывода моделей машинного обучения. Google заявила, что эти TPU второго поколения будут доступны на Google Compute Engine для использования в приложениях TensorFlow.[13]
ТПУ третьего поколения
ТПУ третьего поколения анонсировали 8 мая 2018 года.[14] Google объявила, что сами процессоры вдвое мощнее TPU второго поколения и будут развертываться в модулях с в четыре раза большим количеством микросхем, чем предыдущее поколение.[15][16] Это приводит к 8-кратному увеличению производительности на модуль (до 1024 чипов на модуль) по сравнению с развертыванием TPU второго поколения.
Edge TPU
Эта статья использование внешние ссылки может не следовать политикам или рекомендациям Википедии.Март 2020 г.) (Узнайте, как и когда удалить этот шаблон сообщения) ( |
В июле 2018 года Google анонсировал Edge TPU. Edge TPU - это специально разработанный Google ASIC чип, предназначенный для запуска моделей машинного обучения (ML) для периферийные вычисления, что означает, что он намного меньше и потребляет гораздо меньше энергии по сравнению с TPU, размещенными в центрах обработки данных Google (также известных как Облачные TPU ). В январе 2019 года Google сделал Edge TPU доступным для разработчиков с линейкой продуктов под Коралловый бренд. Edge TPU способен выполнять 4 триллиона операций в секунду при использовании 2 Вт.[17]
Предлагаемые продукты включают одноплатный компьютер (SBC), а система на модуле (SoM), а USB аксессуар, мини PCI-e карта и M.2 карта. В SBC Совет разработчиков Coral и Коралловый SoM оба работают под управлением ОС Mendel Linux - производной от Debian. Продукты USB, PCI-e и M.2 функционируют как надстройки к существующим компьютерным системам и поддерживают системы Linux на базе Debian на хостах x86-64 и ARM64 (включая Raspberry Pi ).
Среда выполнения машинного обучения, используемая для выполнения моделей на Edge TPU, основана на TensorFlow Lite.[18] Edge TPU способен только ускорять операции прямого прохода, что означает, что он в первую очередь полезен для выполнения выводов (хотя можно выполнять упрощенное обучение передачи на Edge TPU.[19]). Edge TPU также поддерживает только 8-битную математику, а это означает, что для обеспечения совместимости сети с Edge TPU ее необходимо обучить с помощью TensorFlow. обучение с учетом квантования техники, или с конца 2019 года также можно использовать посттренировочное квантование.
12 ноября 2019 г. Asus объявил пару одноплатный компьютер (SBC) с Edge TPU. В Плата Asus Tinker Edge T и Tinker Edge R предназначен для Интернет вещей и край AI. Поддержка SBC Android и Debian операционные системы.[20][21] ASUS также продемонстрировала мини-ПК Asus PN60T с Edge TPU.[22]
2 января 2020 года Google анонсировал модуль Coral Accelerator и Coral Dev Board Mini, которые будут продемонстрированы на Выставка CES 2020 позже в том же месяце. Модуль Coral Accelerator - это многокристальный модуль с интерфейсами Edge TPU, PCIe и USB для упрощения интеграции. Coral Dev Board Mini меньше SBC с модулем Coral Accelerator и MediaTek 8167s SoC.[23][24]
Пиксельное нейронное ядро
15 октября 2019 года Google объявил Пиксель 4 смартфон с Пиксельное нейронное ядро, который содержит экземпляр архитектуры Edge TPU.[25]
Смотрите также
- Блок обработки зрения аналогичное устройство, специализирующееся на обработке изображений.
- TrueNorth аналогичное устройство, моделирующее импульсные нейроны вместо тензоров низкой точности.
- Блок нейронной обработки
- Когнитивный компьютер
- Тензорное ядро, аналогичная архитектура предложена Nvidia
использованная литература
- ^ "Блоки обработки тензорных облаков (TPU)". Google Cloud. Получено 20 июля 2020.
- ^ а б c «Tensor Processing Unit Google объяснил: так выглядит будущее вычислений». TechRadar. Получено 2017-01-19.
- ^ а б c Джуппи, Норм (18 мая 2016 г.). "Google расширяет задачи машинного обучения с помощью специального чипа TPU". Блог Google Cloud Platform. Получено 2017-01-22.
- ^ «TensorFlow: машинное обучение с открытым исходным кодом» «Это программное обеспечение для машинного обучения, используемое для различных задач восприятия и понимания языка» - Джеффри Дин, минута 0:47 / 2:17 из ролика Youtube
- ^ «Google делает свои специальные чипы AI доступными для других». Нью-Йорк Таймс. Получено 2018-02-12.
- ^ МакГурти, Колин (6 декабря 2017 г.). "AlphaZero DeepMind сокрушает шахматы". Chess24.com.
- ^ «Tensor Processing Unit Google может продвинуть закон Мура на 7 лет вперед». PCWorld. Получено 2017-01-19.
- ^ Армасу, Лучиан (19 мая 2016 г.). «Представлен большой чип Google для машинного обучения: модуль тензорной обработки с 10-кратной эффективностью (обновлено)». Оборудование Тома. Получено 2016-06-26.
- ^ Следите за обновлениями, скоро появится дополнительная информация о TPU v4, Дата обращения 6 августа 2020.
- ^ а б Jouppi, Norman P .; Янг, Клифф; Патил, Нишант; Паттерсон, Дэвид; Агравал, Гаурав; Баджва, Раминдер; Бейтс, Сара; Бхатия, Суреш; Боден, Нан; Borchers, Al; Бойл, Рик; Кантин, Пьер-Люк; Чао, Клиффорд; Кларк, Крис; Кориелл, Джереми; Дейли, Майк; Дау, Мэтт; Дин, Джеффри; Гелб, Бен; Гаеммагами, Тара Вазир; Готтипати, Раджендра; Гулланд, Уильям; Хагманн, Роберт; Хо, К. Ричард; Хогберг, Дуг; Ху, Джон; Хундт, Роберт; Больно, Дэн; Ибарз, Джулиан; Джеффи, Аарон; Яворский, Алек; Каплан, Александр; Хайтан, Харшит; Кох, Энди; Кумар, Навин; Лейси, Стив; Лаудон, Джеймс; Закон, Джеймс; Ле, Диемту; Лири, Крис; Лю, Чжуюань; Удача, Кайл; Лундин, Алан; Маккин, Гордон; Маджоре, Адриана; Махони, Мэр; Миллер, Киран; Нагараджан, Рахул; Нараянасвами, Рави; Ni, Ray; Никс, Кэти; Норри, Томас; Омерник, Марк; Пенуконда, Нараяна; Фелпс, Энди; Росс, Джонатан; Росс, Мэтт; Салек, Амир; Самадиани, Эмад; Северн, Крис; Сизиков Григорий; Снелхэм, Мэтью; Саутер, Джед; Стейнберг, Дэн; Свинг, Энди; Тан, Мерседес; Торсон, Грегори; Тиан, Бо; Тома, Хория; Таттл, Эрик; Васудеван, Виджай; Уолтер, Ричард; Ван, Уолтер; Уилкокс, Эрик; Юн, До Хён (26 июня, 2017). In-Datacenter Анализ производительности Tensor Processing Unit ™. Торонто, Канада. arXiv:1704.04760.
- ^ а б Кеннеди, Патрик (22 августа 2017 г.). «Пример использования Google TPU и GDDR5 от Hot Chips 29». Служить дому. Получено 23 августа 2017.
- ^ а б c Брайт, Питер (17 мая 2017 г.). "Google привносит в свое вычислительное облако 45 процессоров тензорного потока терафлопс". Ars Technica. Получено 30 мая 2017.
- ^ Кеннеди, Патрик (17 мая 2017 г.). "Подробная информация о Google Cloud TPU раскрыта". Служить дому. Получено 30 мая 2017.
- ^ Фрумусану, Андре (8 мая 2018 г.). "Живой блог основного выступления Google I / O". Получено 9 мая 2018.
- ^ Фельдман, Майкл (11 мая 2018 г.). "Google представляет процессор TPU третьего поколения". 500 лучших. Получено 14 мая 2018.
- ^ Тайч, Пауль (10 мая 2018 г.). "Разрушение сопроцессора Google TPU 3.0 AI". Следующая платформа. Получено 14 мая 2018.
- ^ «Тесты производительности Edge TPU». Коралловый. Получено 2020-01-04.
- ^ «Повышение интеллектуальности с помощью Cloud IoT». Блог Google. 2018-07-25. Получено 2018-07-25.
- ^ "Переобучить модель классификации изображений на устройстве". Коралловый. Получено 2019-05-03.
- ^ «組 込 み 総 合 技術 展 & IoT 総 合 技術 展「 ET & IoT Technology 2019 」に 出 展 す る こ と 発 表». Asus.com (по-японски). Получено 2019-11-13.
- ^ Шилов, Антон. «ASUS и Google объединились для создания компьютеров размером с кредитную карту Tinker Board, ориентированных на ИИ». Anandtech.com. Получено 2019-11-13.
- ^ Офранк, Жан-Люк (29.05.2019). «ASUS Tinker Edge T и CR1S-CM-A SBC с технологией Google Coral Edge TPU и процессором NXP i.MX 8M». CNX Software - Новости встраиваемых систем. Получено 2019-11-14.
- ^ «Новые продукты Coral на 2020 год». Блог разработчиков Google. Получено 2020-01-04.
- ^ «Модуль-ускоритель». Коралловый. Получено 2020-01-04.
- ^ «Представляем следующее поколение моделей технического зрения на устройстве: MobileNetV3 и MobileNetEdgeTPU». Блог Google AI. Получено 2020-04-16.