Встроенный ассемблер - Inline assembler

В компьютерное программирование, встроенный ассемблер это особенность некоторых компиляторы что позволяет писать низкоуровневый код на язык ассемблера быть встроенным в программу, среди кода, который иначе был скомпилирован из язык более высокого уровня такие как C или Ада.

Мотивация и альтернативы

Встраивание кода на ассемблере обычно выполняется по одной из трех причин:[1]

  • Оптимизация: Программисты могут использовать код на языке ассемблера для реализации наиболее чувствительных к производительности частей своей программы. алгоритмы, код, который может быть более эффективным, чем тот, который в противном случае мог бы быть сгенерирован компилятором.
  • Доступ к конкретному процессору инструкции: Большинство процессоров предлагают специальные инструкции, например Сравнить и поменять местами и Тест и установка инструкции, которые могут быть использованы для построения семафоры или другие примитивы синхронизации и блокировки. Практически каждый современный процессор имеет эти или похожие инструкции, поскольку они необходимы для реализации многозадачность. Примеры специализированных инструкций можно найти в SPARC ВИС, Intel MMX и SSE, и Motorola Altivec наборы инструкций.
  • Доступ к специальным соглашения о вызовах еще не поддерживается компилятором.
  • Системные вызовы и прерывания: языки высокого уровня редко имеют прямую возможность выполнять произвольные системные вызовы, поэтому используется ассемблерный код. Прямые прерывания используются еще реже.
  • Для создания специальных директив для компоновщика или ассемблера, например, для изменения секционирования, макросов или создания псевдонимов символов.

С другой стороны, встроенный ассемблер представляет собой прямую проблему для самого компилятора, поскольку он усложняет анализ того, что делается с каждой переменной, ключевой частью распределения регистров.[2] Это означает, что производительность может снизиться. Встроенный ассемблер также усложняет перенос и сопровождение программы в будущем.[1]

Альтернативные средства часто предоставляются как способ упростить работу как компилятору, так и программисту. Внутренние функции для специальных инструкций предоставляются большинством компиляторов, а оболочки C-функций для произвольных системных вызовов доступны на каждом Unix Платформа.

Синтаксис

В языковых стандартах

Стандарт ISO C ++ и стандарты ISO C (приложение J) определяют условно поддерживаемый синтаксис для встроенного ассемблера:

Объявление asm имеет вид
  asm-декларация:
     как м ( строковый литерал ) ;
Объявление asm поддерживается условно; его значение определяется реализацией.[3]

Это определение, однако, редко используется в реальном C, поскольку оно одновременно слишком либерально (в интерпретации) и слишком ограничено (в использовании только одного строкового литерала).

В реальных компиляторах

На практике встроенная сборка, работающая со значениями, редко бывает автономной в виде свободно плавающего кода. Поскольку программист не может предсказать, какому регистру присвоена переменная, компиляторы обычно предоставляют способ их замены в качестве расширения.

Как правило, компиляторы C / C ++ поддерживают два типа встроенной сборки:

  • как м (или __как м__) в GCC. GCC использует прямое расширение правил ISO: шаблон кода сборки записывается в виде строк, а входы, выходы и закрытые регистры указываются после строк в двоеточиях. Переменные C используются напрямую, а имена регистров заключаются в строковые литералы.[4]
  • __как м в Microsoft Visual C ++ (MSVC), компилятор Borland / Embarcadero C и потомки. Этот синтаксис вообще не основан на правилах ISO; программисты просто пишут ASM внутри блока без необходимости соответствия синтаксису C. Переменные доступны, как если бы они были регистрами, и разрешены некоторые выражения C.[5] Эта функция недоступна в версиях MSVC x86_64 или ARM.

Два семейства расширений представляют собой разные представления о разделении труда при выполнении встроенной сборки. Форма GCC сохраняет общий синтаксис языка и разделяет то, что компилятору нужно знать: что необходимо и что нужно изменить. Он явно не требует, чтобы компилятор понимал имена инструкций, так как компилятору нужно только подставить в свои назначения регистров плюс несколько mov операции для обработки требований ввода. Форма MSVC встроенного предметно-ориентированный язык обеспечивает некоторую простоту написания, но требует, чтобы сам компилятор знал об именах кодов операций и их свойствах затирания, что требует дополнительного внимания при обслуживании и переносе.[6]

GNAT (интерфейс GCC на языке Ada), LLVM, а Язык программирования Rust использует синтаксис, аналогичный синтаксису GCC.[7][8] В Язык программирования D использует DSL, аналогичный расширению MSVC официально для x86_64,[9] но LDC на основе LLVM также обеспечивает синтаксис в стиле GCC для каждой архитектуры.[10]

С тех пор язык Rust перешел на синтаксис, абстрагирующийся от встроенных параметров сборки, чем версия LLVM (в стиле GCC). Он предоставляет достаточно информации, чтобы можно было преобразовать блок во внешнюю сборку, если бэкэнд не может обрабатывать встроенную сборку.[6]

Примеры

Системный вызов в GCC

Как правило, прямой вызов операционной системы невозможен в системе, использующей защищенную память. ОС работает на более привилегированном уровне (режим ядра), чем пользовательский (пользовательский режим); а (программное обеспечение) прервать используется для запросов к операционной системе. Это редко встречается в языках высокого уровня, поэтому функции оболочки для системных вызовов написаны с использованием встроенного ассемблера.

В следующем примере кода C показана оболочка системного вызова x86 в Синтаксис ассемблера AT&T, с использованием Ассемблер GNU. Такие вызовы обычно пишутся с помощью макросов; полный код включен для ясности. В этом конкретном случае оболочка выполняет системный вызов номера, указанного вызывающей стороной, с тремя операндами, возвращая результат.[11]

Напомним, что GCC поддерживает оба базовый и расширенный сборка. Первый просто дословно передает текст ассемблеру, а второй выполняет некоторые подстановки для расположения регистров.[4]

внешний int errno;int syscall3(int число, int arg1, int arg2, int arg3){  int res;  __как м__ летучий (    "int $ 0x80"        / * делаем запрос в ОС * /    : "= а" (res),      / * возвращаем результат в формате eax ("a") * /      "+ b" (arg1),     / * передать arg1 в ebx ("b") [как вывод "+", потому что системный вызов может его изменить] * /      "+ c" (arg2),     / * передать arg2 в ecx ("c") [то же самое] * /      "+ d" (arg3)      / * передать arg3 в edx ("d") [то же самое] * /    : "а"  (число)       / * передать номер системного вызова в eax ("a") * /    : "объем памяти", "cc",  / * сообщаем компилятору, что память и коды условий были изменены * /      "esi", "эди", "ebp"); / * они тоже затерты * /  / * Операционная система вернет отрицательное значение при ошибке;   * обертки возвращают -1 при ошибке и устанавливают глобальную переменную errno * /  если (-125 <= res && res < 0) {    errno = -res;    res   = -1;  }  вернуть res;}

Специфическая для процессора инструкция на языке D

Этот пример встроенной сборки из Язык программирования D показывает код, который вычисляет тангенс x, используя x86 с FPU (x87 ) инструкции.

// Вычислить тангенс xнастоящий загар(настоящий Икс){   как м   {       поле     Икс[EBP]                  ; // загружаем x       fxam                            ; // тест на нечетные значения       fstsw   ТОПОР                      ;       сахф                            ;       jc      триггер                 ; // C0 = 1: x - NAN, бесконечность или пусто                                         // 387-е могут обрабатывать денормальные значенияSC18:  фптан                           ;       fstp    ST(0)                   ; // дамп X, который всегда равен 1       fstsw   ТОПОР                      ;       сахф                            ; // если (! (fp_status & 0x20)) перейти к Lret       jnp     Лрет                    ; // C2 = 1: x вне допустимого диапазона, уменьшить аргумент       fldpi                           ; // загружаем пи       FXCH                            ;SC17:  fprem1                          ; // напоминание (частичное)       fstsw   ТОПОР                      ;       сахф                            ;       jp      SC17                    ; // C2 = 1: частичное напоминание, нужно зациклить        fstp    ST(1)                   ; // удаляем пи из стека       jmp     SC18                    ;   }триггер:   вернуть настоящий.нан;Лрет:   ;}

Для читателей, незнакомых с программированием x87, fstsw-sahf с последующей идиомой условного перехода используется для доступа к битам C0 и C2 слова состояния FPU x87. fstsw сохраняет статус в универсальном регистре; sahf устанавливает Регистр ФЛАГОВ в старшие 8 бит регистра; и переход используется для определения того, какой бит флага соответствует биту состояния FPU.[12]

Рекомендации

  1. ^ а б "DontUseInlineAsm". GCC Wiki. Получено 21 января 2020.
  2. ^ Стригель, Бен. ""Для компилятора капля встроенной сборки подобна пощечине."". Reddit. Получено 15 января 2020.
  3. ^ C ++, [dcl.asm]
  4. ^ а б "Расширенный Asm - инструкции ассемблера с операндами выражения C". Использование компилятора GNU C. Получено 15 января 2020.
  5. ^ «Встроенный ассемблер». docs.microsoft.com.
  6. ^ а б Дантрас, Аманьё (13 декабря 2019 г.). "Rust RFC-2873: стабильный встроенный asm". Получено 15 января 2020. Однако можно реализовать поддержку встроенной сборки без поддержки со стороны серверной части компилятора, используя вместо этого внешний ассемблер. Pull Request для отслеживания статуса
  7. ^ «Справочник по языку LLVM: встроенные выражения ассемблера». Документация LLVM. Получено 15 января 2020.
  8. ^ «Встроенная сборка». Документация Rust (1.0.0). Получено 15 января 2020.
  9. ^ «Встроенный ассемблер». Язык программирования D. Получено 15 января 2020.
  10. ^ "Выражения встроенного ассемблера LDC". D Вики. Получено 15 января 2020.
  11. ^ системный вызов (2) – Linux Программиста Руководство - Системные вызовы
  12. ^ «FSTSW / FNSTSW - сохранить слово состояния x87 FPU». Форма инструкции FNSTSW AX используется в основном при условном переходе ...

внешняя ссылка