SWAR - SWAR

SIMD в регистре (SWAR) - это метод выполнения параллельных операций с данными, содержащимися в регистр процессора. SIMD означает одна инструкция, несколько данных.

Многие современные компьютерные процессоры общего назначения имеют некоторые положения SIMD, в виде группы регистров и инструкций по их использованию. SWAR относится к использованию этих регистров и инструкций, в отличие от использования специализированных механизмов обработки, разработанных для лучшего выполнения операций SIMD. Это также относится к использованию SIMD с регистрами общего назначения и инструкциями, которые не предназначались для этого в то время, посредством различных новых программных уловок.^[1]

SWAR архитектуры

Архитектура SWAR включает в себя инструкции, явно предназначенные для выполнения параллельных операций с данными, которые хранятся в независимых подсловах или полях регистра. Архитектура с поддержкой SWAR включает в себя набор инструкций, достаточный для того, чтобы данные, хранящиеся в этих полях, обрабатывались независимо, даже если архитектура не включает инструкции, которые явно предназначены для этой цели.

Ранним примером архитектуры SWAR был Intel Pentium с MMX, который реализовал Набор удлинителей MMX. В Intel Pentium, напротив, не содержал таких инструкций, но все же мог действовать как архитектура SWAR за счет тщательного ручного кодирования или методов компиляции.

Ранние архитектуры SWAR включают DEC Alpha МВИ, Hewlett-Packard's PA-RISC МАКСИМУМ, Silicon Graphics Incorporated MIPS MDMX, и Sun SPARC V9 ВИС. Как и MMX, многие наборы команд SWAR предназначены для более быстрого кодирования видео.^[2]

История модели программирования SWAR

Уэсли А. Кларк представила операции с разделенными подсловными данными в 1950-х годах. Это можно рассматривать как очень раннего предшественника SWAR.

С появлением в 1996 году расширений мультимедийных команд Intel MMX, настольные процессоры с возможностями параллельной обработки SIMD стали обычным явлением. Раньше эти инструкции можно было использовать только с помощью рукописного кода сборки.

Осенью 1996 года профессор Хэнк Дитц был преподавателем курса «Конструирование компиляторов» в Школе электротехники и вычислительной техники Университета Пердью. Для этого курса он назначил серию проектов, в которых студенты будут создавать простой компилятор, ориентированный на MMX. Язык ввода был подмножеством диалекта MasPar MPL называется NEMPL (не совсем MPL).

В течение семестра помощнику преподавателя курса Рэндаллу (Рэнди) Фишеру стало ясно, что существует ряд проблем с MMX, которые затрудняют создание серверной части компилятора NEMPL. Например, MMX имеет инструкцию для умножения 16-битных данных, но не для умножения 8-битных данных. Язык NEMPL не учитывает эту проблему, позволяя программисту писать программы, требующие 8-битного умножения.

Архитектура Intel x86 была не единственной архитектурой, включающей параллельные инструкции, подобные SIMD. Солнце ВИС, SGI MDMX, и другие наборы мультимедийных инструкций были добавлены к существующим архитектурам наборов инструкций других производителей для поддержки так называемых новые средства массовой информации Приложения. Эти расширения имели значительные различия в точности данных и поддерживаемых типах инструкций.

Дитц и Фишер начали разработку идеи четко определенной модели параллельного программирования, которая позволила бы программированию ориентироваться на модель без знания специфики целевой архитектуры. Эта модель станет основой диссертации Фишера. Аббревиатура «SWAR» была придумана Дитцем и Фишером однажды в офисе Хэнка в здании MSEE в Университете Пердью.^[3]Это относится к этой форме параллельной обработки, архитектурам, которые изначально предназначены для выполнения этого типа обработки, и модели программирования общего назначения, которая является диссертацией Фишера.

Проблема компиляции для этих самых разных архитектур обсуждалась в статье, представленной на LCPC98.^[2]

Некоторые приложения SWAR

Обработка SWAR использовалась при обработке изображений,^[4]криптографические пары,^[5]растровая обработка.^[6]Вычислительная гидродинамика,^[7]и коммуникации.^[8]

Смотрите также

Агрегат - SWAR: SIMD в регистре
Двигатели SIMD: векторный процессор, процессор массива, цифровой сигнальный процессор, потоковый процессор.
SWAR на x86 процессоры: MMX, 3DNow!, SSE, SSE2, SSE3

использованная литература

^ Фишер, Рэндалл Дж (2003). SIMD общего назначения в регистре: параллельная обработка на потребительских микропроцессорах (PDF) (Кандидат наук.). Университет Пердью.
^ ^а ^б Фишер, Рэндалл Дж .; Генри Дж. Дитц (август 1998 г.). С. Чаттерджи; Дж. Ф. Принс; Л. Картер; Ж. Ферранте; Z. Li; D. Sehr; П.-С.Ю (ред.). «Компиляция для SIMD в регистре». Материалы 11-го международного семинара по языкам и компиляторам для параллельных вычислений.
^ Дитц, Хэнк. «Агрегированные магические алгоритмы».
^ Padua, Flavio L.C .; Pereira, Guilherme A. S .; Нето, Хосе П. де Кейруш; Кампос, Марио Ф. М .; Фернандес, Антонио О. (2001). «Улучшение времени обработки больших изображений за счет параллелизма на уровне команд» (PDF). Цитировать журнал требует | журнал = (Помогите)
^ Грабхер, Филипп; Иоганн Гросшедль; Дэн Пейдж (2009). О программной параллельной реализации криптографических пар. Избранные области криптографии. Конспект лекций по информатике. 5381. С. 35–50. Дои:10.1007/978-3-642-04159-4_3. ISBN 978-3-642-04158-7.
^ Персада, Онил Назра; Тьерри Губье (12–14 сентября 2004 г.). «Ускорение обработки растровых изображений с помощью мелкозернистого и крупного параллелизма в GRASS». Материалы конференции пользователей FOSS / GRASS 2004 г..
^ Хаузер, Томас; Т. И. Маттокс; Р. П. Лебо; Х. Г. Дитц; П. Г. Хуан (апрель 2003 г.). «Оптимизация кода для сложных микропроцессоров, применяемых в программном обеспечении CFD». Журнал SIAM по научным вычислениям. 25 (4): 1461–1477. Дои:10.1137 / S1064827502410530. ISSN 1064-8275.
^ Спраклен, Лоуренс А. (2001). SWAR-системы и коммуникационные приложения (PDF) (Кандидат наук.). Университет Абердина.

[1] Фишер, Рэндалл Дж (2003). SIMD общего назначения в регистре: параллельная обработка на потребительских микропроцессорах (PDF) (Кандидат наук.). Университет Пердью.

[LCPC98-2] а ^б Фишер, Рэндалл Дж .; Генри Дж. Дитц (август 1998 г.). С. Чаттерджи; Дж. Ф. Принс; Л. Картер; Ж. Ферранте; Z. Li; D. Sehr; П.-С.Ю (ред.). «Компиляция для SIMD в регистре». Материалы 11-го международного семинара по языкам и компиляторам для параллельных вычислений.

[3] Дитц, Хэнк. «Агрегированные магические алгоритмы».

[4] Padua, Flavio L.C .; Pereira, Guilherme A. S .; Нето, Хосе П. де Кейруш; Кампос, Марио Ф. М .; Фернандес, Антонио О. (2001). «Улучшение времени обработки больших изображений за счет параллелизма на уровне команд» (PDF). Цитировать журнал требует | журнал = (Помогите)

[5] Грабхер, Филипп; Иоганн Гросшедль; Дэн Пейдж (2009). О программной параллельной реализации криптографических пар. Избранные области криптографии. Конспект лекций по информатике. 5381. С. 35–50. Дои:10.1007/978-3-642-04159-4_3. ISBN 978-3-642-04158-7.

[6] Персада, Онил Назра; Тьерри Губье (12–14 сентября 2004 г.). «Ускорение обработки растровых изображений с помощью мелкозернистого и крупного параллелизма в GRASS». Материалы конференции пользователей FOSS / GRASS 2004 г..

[7] Хаузер, Томас; Т. И. Маттокс; Р. П. Лебо; Х. Г. Дитц; П. Г. Хуан (апрель 2003 г.). «Оптимизация кода для сложных микропроцессоров, применяемых в программном обеспечении CFD». Журнал SIAM по научным вычислениям. 25 (4): 1461–1477. Дои:10.1137 / S1064827502410530. ISSN 1064-8275.

[8] Спраклен, Лоуренс А. (2001). SWAR-системы и коммуникационные приложения (PDF) (Кандидат наук.). Университет Абердина.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]