Асинхронный массив простых процессоров - Asynchronous array of simple processors

В асинхронный массив простых процессоров (Как можно скорее) представляет собой двумерный массив программируемых процессоров пониженной сложности с небольшими блокнот воспоминания соединены реконфигурируемым ячеистая сеть. AsAP был разработан исследователями из Лаборатории вычислений СБИС (VCL) в Калифорнийский университет в Дэвисе и обеспечивает высокую производительность и энергоэффективность при использовании относительно небольшой площади схемы.

Процессоры AsAP хорошо подходят для внедрения в будущие производственные технологии и синхронизируются с глобально асинхронный локально синхронный (ГАЛС) мода. Отдельные генераторы полностью останавливаются (только утечка) за 9 циклов, когда нет работы, и перезапускаются на полной скорости менее чем за один цикл после того, как работа станет доступной. Чип не требует кварцевые генераторы, петли фазовой автоподстройки частоты, петли с задержкой блокировки, Глобальный тактовый сигнал или любых сигналов, связанных с глобальной частотой или фазой.

Многопроцессорная архитектура эффективно использует параллелизм на уровне задач во многих сложных DSP приложений, а также эффективно выполняет множество больших задач, используя мелкозернистый параллелизм.

Ключевая особенность

Блок-схемы одиночного процессора AsAP и микросхемы 6x6 AsAP 1.0

AsAP использует несколько новых ключевых функций, четыре из которых:

  • Многопроцессорная архитектура (CMP), разработанная для достижения высокой производительности и низкого энергопотребления для многих приложений DSP.
  • Небольшой объем памяти и простая архитектура каждого процессора для достижения высокой энергоэффективности.
  • Глобальная асинхронная локально синхронная синхронизация (GALS) упрощает дизайн часов, значительно упрощает масштабируемость и может использоваться для дальнейшего уменьшить рассеиваемую мощность.
  • Межпроцессорная связь осуществляется ближайшей соседней сетью, чтобы избежать длинных глобальных проводов и повысить масштабируемость до больших массивов и в передовых технологиях производства. Каждый процессор может получать данные от любых двух соседей и отправлять данные любой комбинации своих четырех соседей.

Чип AsAP 1: 36 процессоров

Фотография кристалла 36-процессорного чипа AsAP первого поколения

Чип, содержащий 36 программируемых процессоров (6x6), был заклеен в мае 2005 года в 0,18 мкм CMOS с использованием технологии синтезированных стандартных ячеек и является полностью функциональным. Процессоры на микросхеме работают с тактовой частотой от 520 МГц до 540 МГц при напряжении 1,8 В, и каждый процессор в среднем рассеивает 32 мВт при выполнении приложений на частоте 475 МГц.

Большинство процессоров работают с тактовой частотой более 600 МГц при напряжении 2,0 В, что делает AsAP одним из самых известных изготовленных процессоров (программируемых или непрограммируемых) с самой высокой тактовой частотой, когда-либо разработанных в университете; он является вторым по величине в опубликованных научных статьях.

При 0,9 В средняя мощность приложения на процессор составляет 2,4 мВт при 116 МГц. Каждый процессор занимает всего 0,66 мм².

Чип AsAP 2: 167 процессоров

Фотография кристалла 167-процессорной микросхемы AsAP 2 второго поколения

65-нм CMOS второго поколения содержит 167 процессоров с выделенными быстрое преобразование Фурье (БПФ), Декодер Витерби, и видео оценка движения процессоры; 16 КБ общей памяти; и межпроцессорное соединение на большом расстоянии. Программируемые процессоры могут индивидуально и динамически изменить их напряжение питания и тактовая частота. Чип полностью исправен. Процессоры работают с тактовой частотой до 1,2 ГГц при напряжении 1,3 В, что считается самой высокой тактовой частотой процессора, разработанной в любом университете. При 1,2 В они работают на частоте 1,07 ГГц и 47 мВт при 100% активности. При 0,675 В они работают на частоте 66 МГц и 608 мкВт при 100% активности. Эта рабочая точка обеспечивает 1 триллион MAC или же арифметико-логическое устройство (ALU) операций / сек с рассеиваемой мощностью всего 9,2 Вт. Из-за своего MIMD Архитектура и остановка тонкозернистого тактового генератора, эта энергоэффективность в расчете на одну операцию почти совершенно постоянна для самых разных рабочих нагрузок, что не является случаем для многих архитектур.

Приложения

Завершено кодирование многих DSP и общих задач для AsAP. Сопоставленные задачи включают: фильтры, сверточные кодеры, перемежители, сортировка, квадратный корень, КОРДИК sin / cos / arcsin / arccos, матричное умножение, генераторы псевдослучайных чисел, быстрые преобразования Фурье (БПФ) длиной 32–1024, полный k = 7 Декодер Витерби, а JPEG кодировщик, полностью совместимый процессор основной полосы частот для IEEE 802.11a / g передатчик и приемник беспроводной локальной сети, а также полный CAVLC блок сжатия для H.264 энкодер. блокирует штекер напрямую, без каких-либо изменений. Результаты по мощности, пропускной способности и площади обычно во много раз лучше, чем у существующих программируемых процессоров DSP.

Архитектура позволяет четко разделить программирование и межпроцессорную синхронизацию, полностью реализуемую аппаратно. Недавно законченный C компилятор и инструмент автоматического сопоставления еще больше упрощают программирование.

Смотрите также

Рекомендации

  • Чыонг, декан; Уэйн Х. Ченг; Тинуш Мохсенин; Жии Ю; Энтони Т. Якобсон; Гури Ландж; Майкл Дж. Миувзен; Ань Т. Тран; Чжибинь Сяо; Эрик В. Ворк; Джереми В. Уэбб; Пол В. Мехиа; Беван М. Баас (апрель 2009 г.). "Вычислительная платформа на 167 процессоров в 65 нм CMOS". Журнал IEEE по твердотельным схемам. 44 (4). Архивировано из оригинал на 21.06.2015.
  • Чыонг, декан; Ченг, Уэйн; Мохсенин, Тинуш; Ю, Чжи; Джейкобсон, Тони; Ландж, Гури; Meeuwsen, Майкл; Ватник, Кристина; Мехиа, Пол; Тран, Ань; Уэбб, Джереми; Работай, Эрик; Сяо, Чжибинь; Баас, Беван М. (июнь 2008 г.). «65-нм вычислительная платформа на 167 процессоров с динамическим напряжением питания на каждый процессор и динамическим масштабированием тактовой частоты». В материалах симпозиума IEEE по схемам СБИС, 2008 г.. Гонолулу, штат Гавайи. С. 22–23. Архивировано из оригинал на 2014-12-25.
  • Баас, Беван; Ю, Чжи; Meeuwsen, Майкл; Саттари, Омар; Апперсон, Райан; Работай, Эрик; Уэбб, Джереми; Лай, Майкл; Мохсенин, Тинуш; Чыонг, декан; Чунг, Джейсон (март – апрель 2007 г.). «AsAP: многофункциональная многоядерная платформа для приложений DSP». IEEE Micro. 27 (2). Архивировано из оригинал на 2015-06-25.
  • Баас, Беван; Ю, Чжи; Meeuwsen, Майкл; Саттари, Омар; Апперсон, Райан; Работай, Эрик; Уэбб, Джереми; Лай, Майкл; Гурман, Даниэль; Чен, Чи; Чунг, Джейсон; Чыонг, декан; Мохсенин, Тинуш (август 2006 г.). «Аппаратное обеспечение и приложения AsAP: асинхронный массив простых процессоров». В материалах симпозиума IEEE HotChips по высокопроизводительным микросхемам (HotChips 2006). Стэнфорд.
  • Ю, Чжи; Meeuwsen, Майкл; Апперсон, Райан; Саттари, Омар; Лай, Майкл; Уэбб, Джереми; Работай, Эрик; Мохсенин, Тинуш; Сингх, Мандип; Баас, Беван М. (февраль 2006 г.). «Асинхронный массив простых процессоров для приложений DSP». В материалах Международной конференции по твердотельным схемам IEEE (ISSCC '06). Сан-Франциско, Калифорния. С. 428–429, 663. Архивировано с оригинал на 2014-12-25.

внешняя ссылка