Вычисления с памятью - Computing with Memory

Вычисления с памятью относится к вычислительным платформам, где ответ функции хранится в массиве памяти, одномерном или двумерном, в виде таблицы поиска (LUT) и функции оцениваются путем извлечения значений из LUT. Эти вычислительные платформы могут следовать либо чисто пространственной модели вычислений, как в программируемая вентильная матрица (FPGA) или временная вычислительная модель, в которой функция оценивается через несколько тактов. Последний подход направлен на сокращение накладных расходов на программируемое межсоединение в FPGA за счет складывания ресурсов межсоединения внутри вычислительного элемента. Он использует плотные двумерные массивы памяти для хранения больших LUT с несколькими входами и несколькими выходами. Вычисления с памятью отличаются от вычислений в памяти или процессор в памяти (PIM) концепции, широко исследуемые в контексте интеграции процессора и памяти на одном чипе для уменьшения задержки памяти и увеличения пропускной способности. Эти архитектуры стремятся сократить расстояние, которое данные перемещаются между процессором и памятью. В Проект Berkeley IRAM является одним из заметных достижений в области архитектур PIM.

подробности

Платформы с памятью обычно используются для обеспечения преимущества реконфигурируемости оборудования. Реконфигурируемые вычислительные платформы предлагают преимущества с точки зрения снижения стоимости проектирования, раннего вывода на рынок, быстрого создания прототипов и легко настраиваемых аппаратных систем. ПЛИС представляют собой популярную реконфигурируемую вычислительную платформу для реализации цифровых схем. Они следуют чисто пространственной вычислительной модели. С момента своего создания в 1985 году базовая структура ПЛИС по-прежнему состояла из двумерного массива блоков конфигурируемой логики (CLB) и программируемой матрицы межсоединений.[1] На производительность ПЛИС и рассеиваемую мощность в значительной степени влияет продуманная архитектура программируемых межсоединений (PI).[2][3] Эффективный способ уменьшить влияние архитектуры PI в FPGA - разместить небольшие LUT в непосредственной близости (называемые кластерами) и разрешить внутрикластерную связь с использованием локальных межсоединений. Благодаря преимуществам кластерной архитектуры FPGA, основные поставщики FPGA включили ее в свои коммерческие продукты.[4][5] Также были проведены исследования по снижению накладных расходов из-за PI в мелкозернистых ПЛИС путем сопоставления более крупных LUT с несколькими входами и выходами во встроенные блоки памяти. Хотя он следует аналогичной модели пространственных вычислений, часть логических функций реализована с использованием блоков встроенной памяти, а оставшаяся часть реализована с использованием меньших LUT.[6] Такое разнородное отображение может улучшить площадь и производительность за счет уменьшения доли программируемых межсоединений.

В отличие от чисто пространственной вычислительной модели ПЛИС, также была исследована реконфигурируемая вычислительная платформа, которая использует временную вычислительную модель (или комбинацию как временной, так и пространственной). [7][8] в контексте повышения производительности и энергии по сравнению с обычными ПЛИС. Эти платформы, называемые вычислениями на основе памяти (MBC), используют плотный двумерный массив памяти для хранения LUT. Такие фреймворки полагаются на нарушение сложной функции (ж) на небольшие подфункции; представление подфункций как LUT с множеством входов и выходов в массиве памяти; и оценивая функцию ж за несколько циклов. MBC может использовать преимущества наноразмерной памяти в виде высокой плотности, низкого энергопотребления и высокой производительности.[8]

Каждый вычислительный элемент включает в себя двумерный массив памяти для хранения LUT, небольшой контроллер для последовательной оценки подфункций и набор временных регистров для хранения промежуточных выходных данных из отдельных разделов. Фреймворк быстрой локальной маршрутизации внутри каждого вычислительного блока генерирует адрес для доступа к LUT. Несколько таких вычислительных элементов могут быть пространственно связаны с использованием программируемой архитектуры межсоединений, подобной ПЛИС, что позволяет отображать большие функции. Выполнение внутри вычислительных элементов с локальным мультиплексированием по времени может значительно снизить потребность в программируемых межсоединениях, что приведет к значительному улучшению продукта с задержкой энергии и лучшей масштабируемости производительности по поколениям технологий. Массив памяти внутри каждого вычислительного элемента может быть реализован с помощью память с адресацией по содержимому (CAM), чтобы значительно снизить требования к памяти для определенных приложений.[7]

Смотрите также

использованная литература

  1. ^ К. Комптон и С. Хаук, "Вычислительная техника: обзор систем и программного обеспечения", Обзоры ACM, Vol. 34, No. 2, июнь 2002 г.
  2. ^ С. М. Тримбергер, Технология программируемых вентильных матриц, Норвелл, Массачусетс: Kluwer, 1994.
  3. ^ А. Рахман, С. Дас, А. П. Чандракасан, Р. Рейф, «Требования к проводке и технология трехмерной интеграции для программируемых вентильных матриц», IEEE Trans. по очень крупномасштабным системам интеграции, Vol. 11, No. 1, февраль, 2003 г.
  4. ^ Xilinx Corporation
  5. ^ Altera Corporation
  6. ^ Дж. Конг и С. Сюй, «Отображение технологий для ПЛИС со встроенными блоками памяти», Симпозиум по программируемой вентильной матрице, 1998 г.
  7. ^ а б С. Пол и С. Бхуниа, "Реконфигурируемые вычисления с использованием адресуемой памяти для повышения производительности и использования ресурсов", Конференция по автоматизации проектирования, 2008 г.
  8. ^ а б С. Пол, С. Чаттерджи, С. Мукхопадхьяй и С. Бхуния, «Наномасштабные реконфигурируемые вычисления с использованием энергонезависимого 2-мерного массива STTRAM», Международная конференция по нанотехнологиям, 2009 г.