Гигиенический макрос - Википедия - Hygienic macro

Гигиенические макросы находятся макросы чье расширение гарантированно не вызовет случайных захватывать из идентификаторы. Они являются особенностью языки программирования Такие как Схема,[1] Дилан,[2] Ржавчина, и Юля. Общая проблема случайного захвата была хорошо известна в Лисп сообщества до внедрения гигиенических макросов. Создатели макросов будут использовать языковые функции, которые будут генерировать уникальные идентификаторы (например, gensym), или использовать скрытые идентификаторы, чтобы избежать проблемы. Гигиенические макросы - это программное решение проблемы захвата, встроенное в сам макрорасширитель. Термин «гигиена» был придуман в статье Кольбекера и др. 1986 года, в которой было введено макрорасширение гигиены, вдохновленное терминологией, используемой в математике.[3]

Проблема гигиены

В языках программирования, которые имеют негигиеничные макросистемы, существующие привязки переменных могут быть скрыты от макроса привязками переменных, которые создаются во время его расширения. В C, эту проблему можно проиллюстрировать следующим фрагментом:

#define INCI (i) do {int a = 0; ++ i; } пока (0)int главный(пустота){    int а = 4, б = 8;    INCI(а);    INCI(б);    printf("a теперь% d, b теперь% d п", а, б);    возвращаться 0;}

Выполнение вышеуказанного через Препроцессор C производит:

int главный(пустота){    int а = 4, б = 8;    делать { int а = 0; ++а; } пока (0);    делать { int а = 0; ++б; } пока (0);    printf("a теперь% d, b теперь% d п", а, б);    возвращаться 0;}

Переменная а объявленный в верхней области видимости затенен а переменная в макросе, которая вводит новый объем. В результате выполнение программы никогда не меняет его, как показывает вывод скомпилированной программы:

А сейчас 4, б сейчас 9

Самое простое решение - дать макросам имена переменных, которые не конфликтуют ни с одной переменной в текущей программе:

#define INCI (i) do {int INCIa = 0; ++ i; } пока (0)int главный(пустота){    int а = 4, б = 8;    INCI(а);    INCI(б);    printf("a теперь% d, b теперь% d п", а, б);    возвращаться 0;}

Пока переменная с именем INCIa создается, это решение дает правильный результат:

А сейчас 5, б сейчас 9

Проблема решена для текущей программы, но это решение не является надежным. Переменные, используемые внутри макроса и в остальной части программы, должны синхронизироваться программистом. В частности, с помощью макроса INCI по переменной INCIa будет терпеть неудачу так же, как и исходный макрос для переменной а.

«Гигиеническая проблема» может выходить за рамки переменных привязок. Учти это Common Lisp макрос:

(дефмакро мой-если (условие &тело тело) `(если (нет ,условие)    (прогноз      ,@тело)))

Хотя в этом макросе нет ссылок на переменные, предполагается, что символы «if», «not» и «progn» связаны со своими обычными определениями. Если, однако, вышеуказанный макрос используется в следующем коде:

(флет ((нет (Икс) Икс))  (мой-если т    (формат т "Это не следует печатать!")))

Определение «не» было изменено на местном уровне, поэтому расширение мой-если изменения. (Переопределение стандартных функций и операторов, глобально или локально, фактически вызывает неопределенное поведение согласно ANSI Common Lisp. Такое использование может быть диагностировано реализацией как ошибочное.)

С другой стороны, гигиенические макросистемы автоматически сохраняют лексическую область видимости всех идентификаторов (таких как «если» и «не»). Это свойство называется ссылочная прозрачность.

Конечно, проблема может возникнуть для программно определенных функций, которые не защищены таким же образом:

(дефмакро мой-если (условие &тело тело) `(если (определяемый пользователем оператор ,условие)    (прогноз      ,@тело)))(флет ((определяемый пользователем оператор (Икс) Икс))  (мой-если т    (формат т "Это не следует печатать!")))

Решение этой проблемы в Common Lisp - использование пакетов. В мой-если макрос может находиться в собственном пакете, где определяемый пользователем оператор является частным символом в этом пакете. Символ определяемый пользователем оператор в коде пользователя тогда будет другой символ, не связанный с тем, который используется в определении мой-если макрос.

Между тем, такие языки, как Схема которые используют гигиенические макросы, предотвращают случайный захват и автоматически обеспечивают ссылочную прозрачность как часть процесса расширения макроса. В случаях, когда требуется захват, некоторые системы позволяют программисту явно нарушать гигиенические механизмы макросистемы.

Например, следующая схема реализации мой-если будет иметь желаемое поведение:

(определить-синтаксис мой-если  (синтаксические правила ()    ((_ условие тело ...)     (если (нет условие)         (начинать тело ...)))))(позволять ((нет (лямбда (Икс) Икс)))  (мой-если #t    (отображать "Это не следует печатать!")    (новая линия)))

Стратегии, используемые в языках, в которых отсутствуют гигиенические макросы

На некоторых языках, таких как Common Lisp, Схема и другие Лисп В языковой семье макросы являются мощным средством расширения языка. Здесь недостаток гигиены в обычных макросах решается несколькими стратегиями.

Запутывание
Если во время раскрытия макроса требуется временное хранилище, можно использовать необычные имена переменных в надежде, что те же имена никогда не будут использоваться в программе, использующей макрос.
Создание временного символа
В некоторых языках программирования возможно создание нового имени переменной или символа и привязка к временному месту. Система языковой обработки гарантирует, что это никогда не конфликтует с другим именем или местоположением в среде выполнения. Ответственность за выбор использования этой функции в теле определения макроса возлагается на программиста. Этот метод использовался в Маклисп, где функция с именем генсим может использоваться для создания нового имени символа. Подобные функции (обычно называемые генсим также) существуют во многих Lisp-подобных языках, включая широко используемые Common Lisp стандарт[4] и Элисп.
Неограниченный символ времени чтения
Это похоже на первое решение в том, что одно имя используется несколькими расширениями одного и того же макроса. Однако, в отличие от необычного имени, используется неинтернированный символ времени чтения (обозначенный #: обозначение), для которого невозможно находиться вне макроса.
Пакеты
Вместо необычного имени или неорганизованного символа макрос просто использует частный символ из пакета, в котором он определен. Символ не встречается случайно в коде пользователя. Пользовательский код должен попасть внутрь пакета, используя двойное двоеточие (::), чтобы дать себе разрешение на использование частного символа, например классные макросы :: секрет-сим. В этот момент вопрос о случайном несоблюдении гигиены остается спорным. Таким образом, система пакетов Lisp обеспечивает жизнеспособное и полное решение проблемы макросигиены, которую можно рассматривать как пример конфликта имен.
Гигиеническое преобразование
Процессор, отвечающий за преобразование шаблонов входной формы в выходную форму, обнаруживает конфликты символов и разрешает их, временно изменяя имена символов. Такой вид обработки поддерживается в Scheme's let-синтаксис и определить-синтаксис системы создания макросов. Основная стратегия - выявить привязки в определении макроса и замените эти имена генсимами, а также для определения свободные переменные в определении макроса и убедитесь, что эти имена ищутся в области определения макроса, а не в области, в которой макрос использовался.
Буквальные объекты
В некоторых языках расширение макроса не обязательно должно соответствовать текстовому коду; вместо расширения до выражения, содержащего символ ж, макрос может производить расширение, содержащее фактический объект, на который указывает ж. Точно так же, если макросу необходимо использовать локальные переменные или объекты, определенные в пакете макроса, он может расширяться до вызова закрывающего объекта, чья включающая лексическая среда соответствует определению макроса.

Реализации

Макросистемы, которые автоматически обеспечивают соблюдение гигиены, возникли в Scheme. Оригинал алгоритм (Алгоритм KFFD) для гигиенической макросистемы был представлен Кольбекером в 1986 году.[3] В то время реализация Scheme не применяла стандартной макросистемы. Вскоре после этого, в 87-м, Кольбекер и Палочка предложили декларативный язык на основе шаблонов для написания макросов, который был предшественником синтаксические правила макросъемка, принятая стандартом R5RS.[1][5] Синтаксические замыкания, альтернативный гигиенический механизм, были предложены Боуденом и Рисом в 1988 году в качестве альтернативы системе Колбекера и др.[6] В отличие от алгоритма KFFD, синтаксические замыкания требуют от программиста явного указания разрешения области действия идентификатора. В 1993 году Дибвиг и др. представил синтаксис-регистр макросистема, которая использует альтернативное представление синтаксиса и автоматически поддерживает гигиену.[7] В синтаксис-регистр система может выразить синтаксические правила язык шаблонов как производный макрос.

Период, термин система макросов может быть неоднозначным, потому что в контексте схемы он может относиться как к конструкции сопоставления с образцом (например, правила синтаксиса), так и к структуре для представления синтаксиса и управления им (например, case-case, синтаксические замыкания). Синтаксис-правила - это высокоуровневый сопоставление с образцом средство, которое пытается упростить написание макросов. Тем не мение, синтаксические правила не может кратко описать определенные классы макросов и недостаточен для выражения других макросистем. Правила синтаксиса описаны в документе R4RS в приложении, но не обязательны. Позже R5RS принял его как стандартное средство макроса. Вот пример синтаксические правила макрос, меняющий местами значения двух переменных:

(определить-синтаксис замена!  (синтаксические правила ()    ((_ а б)     (позволять ((темп а))       (набор! а б)       (набор! б темп)))))

Из-за недостатков чисто синтаксические правила На основе макросистемы, низкоуровневые макросистемы также были предложены и реализованы для Scheme. Syntax-case - одна из таких систем. В отличие от синтаксические правила, синтаксис-регистр содержит как язык сопоставления с образцом, так и средство низкого уровня для написания макросов. Первый позволяет писать макросы декларативно, а второй позволяет реализовать альтернативные интерфейсы для написания макросов. Предыдущий пример обмена почти идентичен в синтаксис-регистр потому что язык сопоставления с образцом похож:

(определить-синтаксис замена!  (лямбда (stx)    (синтаксис-регистр stx ()      ((_ а б)       (синтаксис        (позволять ((темп а))          (набор! а б)          (набор! б темп)))))))

Тем не мение, синтаксис-регистр более мощный, чем синтаксические правила. Например, синтаксис-регистр макросы могут указывать побочные условия в правилах сопоставления с образцом с помощью произвольных функций схемы. В качестве альтернативы, разработчик макросов может отказаться от использования интерфейса сопоставления с образцом и напрямую манипулировать синтаксисом. С использованием данные-> синтаксис функция, макросы синтаксического регистра также могут намеренно захватывать идентификаторы, нарушая тем самым гигиену. В R6RS Стандарт схемы принял макросистему синтаксического регистра.[8]

Синтаксические замыкания и явное переименование[9] две другие альтернативные макросистемы. Обе системы являются более низкоуровневыми, чем синтаксические правила, и оставляют соблюдение гигиены на усмотрение автора макроса. Это отличается как от синтаксических правил, так и от синтаксического регистра, которые по умолчанию автоматически обеспечивают соблюдение гигиены. Приведенные выше примеры подкачки показаны здесь с использованием синтаксического закрытия и реализации явного переименования соответственно:

;; синтаксические замыкания(определить-синтаксис замена!   (sc-макротрансформатор    (лямбда (форма среда)      (позволять ((а (закрытый синтаксис (кадр форма) среда))            (б (закрытый синтаксис (caddr форма) среда)))        `(позволять ((темп ,а))           (набор! ,а ,б)           (набор! ,б темп))))));; явное переименование(определить-синтаксис замена! (эр-макротрансформатор  (лямбда (форма переименовать сравнивать)    (позволять ((а (кадр форма))          (б (caddr форма))          (темп (переименовать темп)))      `(,(переименовать 'позволять) ((,темп ,а))           (,(переименовать 'набор!) ,а ,б)           (,(переименовать 'набор!) ,б ,темп))))))

Языки с гигиеническими макросистемами

  • Схема - правила синтаксиса, регистр синтаксиса, синтаксические замыкания и другие.
  • Ракетка - ответвление Scheme. Его макросистема изначально была основана на синтаксическом регистре, но теперь имеет больше функций.
  • Nemerle[10]
  • Дилан
  • Эликсир[11]
  • Ним
  • Ржавчина
  • Haxe
  • Мэри2 - макротела с областью видимости на языке, производном от Algol68, около 1978 г.
  • Юля[12]
  • Раку - поддерживает как гигиенические, так и антисанитарные макросы[13]

Критика

Гигиенические макросы обеспечивают некоторую безопасность для программиста за счет ограничения возможностей макросов. Как прямое следствие, макросы Common Lisp намного более мощные, чем макросы Scheme, с точки зрения того, что с ними можно сделать. Дуг Хойт, автор Let Over Lambda, заявил:[14]

Почти все подходы к уменьшению воздействия захвата переменных служат только для уменьшения того, что вы можете сделать с помощью defmacro. Гигиенические макросы - это в лучшем случае поручень безопасности для новичков; в худшем случае они образуют электрический забор, запирая своих жертв в продезинфицированной и безопасной тюрьме.

— Дуг Хойт

Смотрите также

Примечания

  1. ^ а б Ричард Келси; Уильям Клингер; Джонатан Рис; и другие. (Август 1998 г.). "Пересмотренный5 Отчет об алгоритмической языковой схеме ». Вычисление высшего порядка и символическое вычисление. 11 (1): 7–105. Дои:10.1023 / А: 1010051815785.
  2. ^ Файнберг, Н .; Keene, S.E .; Matthews, R.O .; Витингтон, П. Т. (1997), Программирование Дилана: объектно-ориентированный и динамический язык, Addison Wesley Longman Publishing Co., Inc.
  3. ^ а б Kohlbecker, E .; Фридман, Д. П .; Felleisen, M .; Дуба Б. (1986). «Гигиеническое макрорасширение» (PDF). Конференция ACM по LISP и функциональному программированию.
  4. ^ «CLHS: функция GENSYM».
  5. ^ Kohlbecker, E; Жезл М. (1987). «Макро-пример: получение синтаксических преобразований из их спецификаций» (PDF). Симпозиум по принципам языков программирования.
  6. ^ Bawden, A; Рис, Дж. (1988). "Синтаксические замыкания" (PDF). Лисп и функциональное программирование.
  7. ^ Дибвиг, К; Hieb, R; Брюггерман, С (1993). «Синтаксическая абстракция в схеме» (PDF). Лисп и символьные вычисления. 5 (4): 295–326. Дои:10.1007 / BF01806308.
  8. ^ Спербер, Майкл; Дибвиг, Р. Кент; Флэтт, Мэтью; Ван Страатен, Антон; и другие. (Август 2007 г.). "Пересмотренный6 Отчет об алгоритмической языковой схеме (R6RS) ». Руководящий комитет схемы. Получено 2011-09-13.
  9. ^ Клингер, Уилл (1991). «Гигиенические макросы за счет явного переименования». ACM SIGPLAN Lisp указатели. 4 (4): 25–28. Дои:10.1145/1317265.1317269.
  10. ^ Скальски, К .; Москаль, М; Ольшта, П, Метапрограммирование в Nemerle (PDF), заархивировано из оригинал (PDF) на 2012-11-13
  11. ^ «Макросы».
  12. ^ «Метапрограммирование · Язык Джулии».
  13. ^ «Синопсис 6: Подпрограммы». Архивировано из оригинал на 2014-01-06. Получено 2014-06-03.
  14. ^ [1], Let Over Lambda - 50 лет Лиспби Дуг Хойт

Рекомендации