Язык программирования низкого уровня - Low-level programming language

А язык программирования низкого уровня это язык программирования что дает мало или нет абстракция с компьютера архитектура набора команд - команды или функции на языке соответствуют инструкциям процессора. Обычно это относится либо к Машинный код или язык ассемблера. Из-за низкой (отсюда и самого слова) абстракции между языком и машинным языком низкоуровневые языки иногда описываются как «близкие к оборудованию». Программы, написанные на языках низкого уровня, как правило, относительно непереносной, поскольку он оптимизирован для определенного типа системной архитектуры.

Низкоуровневые языки могут преобразовываться в машинный код без компилятора или интерпретатора - языки программирования второго поколения используйте более простой процессор, называемый ассемблер - и полученный код запускается непосредственно на процессоре. Программу, написанную на языке низкого уровня, можно заставить работать очень быстро, с небольшим объем памяти. Эквивалентная программа в язык высокого уровня может быть менее эффективным и использовать больше памяти. Языки низкого уровня просты, но считаются сложными в использовании из-за многочисленных технических деталей, которые программист должен помнить. Для сравнения: язык программирования высокого уровня изолирует семантику выполнения компьютерной архитектуры от спецификации программы, что упрощает разработку.

Машинный код

Лицевая панель миникомпьютера PDP-8 / E. Ряд переключателей внизу можно использовать для переключения программы на машинном языке.

Машинный код это единственный язык, который компьютер может обрабатывать напрямую без предварительного преобразования. В настоящее время программисты почти никогда не пишут программы непосредственно в машинном коде, потому что это требует внимания ко многим деталям, которые язык высокого уровня обрабатывает автоматически. Более того, он требует запоминания или поиска числовых кодов для каждой инструкции, и его чрезвычайно трудно изменить.

Истинный Машинный код это поток сырых, обычно двоичный, данные. Программист, кодирующий "машинный код", обычно кодирует инструкции и данные в более удобочитаемой форме, например десятичный, восьмеричный, или же шестнадцатеричный который переводится во внутренний формат программой, называемой грузчик или переключился в память компьютера из Передняя панель.

Хотя мало программ написано на машинном языке, программисты часто становятся искусными в чтении, работая с дампы керна или отладка с лицевой панели.

Пример: функция в шестнадцатеричном представлении 32-битной x86 машинный код для расчета пth Число Фибоначчи:

8B542408 83FA0077 06B80000 0000C383FA027706 B8010000 00C353BB 01000000B9010000 008D0419 83FA0376 078BD989C14AEBF1 5BC3

язык ассемблера

Языки второго поколения предоставляют один уровень абстракции поверх машинного кода. В первые дни программирования на таких компьютерах, как TX-0 и PDP-1, первое, что сделали хакеры из Массачусетского технологического института, - это написали ассемблеры.[1]язык ассемблера мало семантика или формальная спецификация, являющаяся лишь отображением удобочитаемых символов, включая символьные адреса, на коды операций, адреса, числовые константы, струны и так далее. Обычно один машинная инструкция представлен в виде одной строки ассемблерного кода. Сборщики производят объектные файлы это может ссылка на сайт с другими объектными файлами или быть загружен самостоятельно.

Большинство сборщиков предоставляют макросы для генерации общих последовательностей инструкций.

Пример: то же самое Число Фибоначчи калькулятор, как указано выше, но на языке ассемблера x86-64 с использованием Синтаксис AT&T:

_fib:        движение $1, % eax.fib_loop:        cmpl $1, % edi        jbe .fib_done        движение % eax, % ecx        добавить % ebx, % eax        движение % ecx, % ebx        subl $1, % edi        jmp .fib_loop.fib_done:        Ret

В этом примере кода аппаратные особенности процессора x86-64 (его регистры ) называются и управляются напрямую. Функция загружает свой ввод из % edi в соответствии с Система V ABI и выполняет свои вычисления, манипулируя значениями в EAX, EBX, и ECX регистрируется до завершения и возвращается. Обратите внимание, что в этом ассемблере нет концепции возврата значения. Результат сохранен в EAX зарегистрироваться, RET просто перемещает обработку кода в место кода, хранящееся в стеке (обычно это инструкция сразу после той, которая вызвала эту функцию), и автор вызывающего кода должен знать, что эта функция сохраняет свой результат в EAX и получить его оттуда. язык ассемблера x86-64 не устанавливает стандарта для возврата значений из функции (и поэтому фактически не имеет понятия функции); вызывающий код проверяет состояние после возврата из процедуры, если ему нужно извлечь значение.

Сравните это с той же функцией в C:

беззнаковый выдумать(беззнаковый п) {   если (!п)       вернуть 0;   еще если (п <= 2)       вернуть 1;   еще {       беззнаковый а, c;       за (а = c = 1; ; --п) {           c += а;           если (п <= 2) вернуть c;           а = c - а;       }   }}

Этот код очень похож по структуре на пример на языке ассемблера, но есть существенные различия с точки зрения абстракции:

  • Вход (параметр п) - это абстракция, которая не указывает место хранения на оборудовании. На практике компилятор C следует одному из многих возможных соглашения о вызовах чтобы определить место хранения ввода.
  • Версия на языке ассемблера загружает входной параметр из стека в регистр и на каждой итерации цикла уменьшает значение в регистре, никогда не изменяя значение в ячейке памяти в стеке. Компилятор C может загрузить параметр в регистр и сделать то же самое или обновить значение везде, где оно хранится. Какой из них он выбирает, это решение о реализации, полностью скрытое от автора кода (и одно без побочные эффекты, благодаря стандартам языка C).
  • Локальные переменные a, b и c являются абстракциями, которые не определяют какое-либо конкретное место хранения на оборудовании. Компилятор C решает, как на самом деле хранить их для целевой архитектуры.
  • Функция возврата указывает значение, которое нужно вернуть, но не указывает как он возвращен. Компилятор C для любой конкретной архитектуры реализует стандарт механизм возврата значения. Компиляторы для архитектуры x86 обычно (но не всегда) используют регистр EAX для возврата значения, как в примере на языке ассемблера (автор примера на языке ассемблер имеет выбранный чтобы скопировать соглашение C, но язык ассемблера этого не требует).

Эти абстракции делают код C компилируемым без изменений на любой архитектуре, для которой был написан компилятор C. Код языка ассемблера x86 специфичен для архитектуры x86.

Низкоуровневое программирование на языках высокого уровня

В конце 1960-х гг. языки высокого уровня такие как PL / S, Блаженство, BCPL, расширенный АЛГОЛ (за Большие системы Берроуза ) и C включает некоторую степень доступа к функциям программирования низкого уровня. Один из способов для этого - Встроенная сборка, в котором код сборки встроен в язык высокого уровня, поддерживающий эту функцию. Некоторые из этих языков также позволяют директивы оптимизации компилятора чтобы настроить способ использования компилятором архитектуры целевого процессора.

Рекомендации

  1. ^ Леви, Стивен (1994). Хакеры: Герои компьютерной революции. Книги пингвинов. п. 32. ISBN  0-14-100051-1.