Резьбовой код - Threaded code

В Информатика, многопоточный код это метод программирования, в котором код имеет форму, которая по существу полностью состоит из вызовов подпрограммы. Часто используется в компиляторы, которые могут генерировать код в этой форме или сами реализовываться в этой форме. Код может быть обработан переводчик или это может быть просто последовательность Машинный код вызов инструкции.

Потоковый код лучше плотность чем код, сгенерированный альтернативными методами генерации и альтернативными соглашения о вызовах. В кэшированных архитектурах он может выполняться немного медленнее.[нужна цитата ] Однако программа, которая достаточно мала, чтобы поместиться в компьютерный процессор с тайник может работать быстрее, чем большая программа, страдающая от многих промахи в кеше.[1] Небольшие программы также могут быстрее переключаться между потоками, когда другие программы заполнили кэш.

Потоковый код наиболее известен тем, что он используется во многих компиляторах языки программирования, такие как Четвертый, многие реализации БАЗОВЫЙ, некоторые реализации КОБОЛ, ранние версии B,[2] и другие языки для маленьких миникомпьютеры и для любительские радиоспутники.[нужна цитата ]

История

Обычный способ создания компьютерных программ - использовать компилятор переводить исходный код (написано в некоторых символический язык ) к Машинный код. Результирующий исполняемый файл обычно быстрый, но, поскольку он специфичен для оборудование платформа, она не портативна. Другой подход - создать инструкции для виртуальная машина и использовать переводчик на каждой аппаратной платформе. Интерпретатор создает экземпляр среды виртуальной машины и выполняет инструкции. Таким образом, нужно компилировать только интерпретатор.

У ранних компьютеров было относительно мало памяти. Например, большинство Данные General Nova, IBM 1130, и многие из первых микрокомпьютеры было установлено всего 4 КБ ОЗУ. Следовательно, много времени было потрачено на то, чтобы найти способы уменьшить размер программы, чтобы она уместилась в доступной памяти.

Одно из решений - использовать интерпретатор, который читает символический язык понемногу и вызывает функции для выполнения действий. Поскольку исходный код обычно плотнее чем результирующий машинный код, это может уменьшить общее использование памяти. Это была причина Microsoft BASIC переводчик:[а] собственный код должен был использовать 4 КБ памяти таких машин, как Альтаир 8800 с исходным кодом пользователя. Компилятор выполняет перевод с исходного языка в машинный код, поэтому компилятор, исходный код и вывод должны находиться в памяти одновременно. В интерпретаторе нет вывода. Код создается построчно, выполняется, а затем удаляется.

Потоковый код - это стиль форматирования скомпилированного кода, который минимизирует использование памяти. Вместо того, чтобы записывать каждый шаг операции при каждом его появлении в программе, как это было обычно в макроассемблеры например, компилятор записывает каждый общий бит кода в подпрограмму. Таким образом, каждый бит существует только в одном месте в памяти (см. "Не повторяйся "). Приложение верхнего уровня в этих программах может состоять только из вызовов подпрограмм. Многие из этих подпрограмм, в свою очередь, также состоят только из вызовов подпрограмм нижнего уровня. Этот метод -рефакторинг кода - по-прежнему широко используется сегодня, хотя и по разным причинам.

Мэйнфреймы и некоторые ранние микропроцессоры, такие как RCA 1802 требуется несколько инструкций для вызова подпрограммы. В приложении верхнего уровня и во многих подпрограммах эта последовательность постоянно повторяется, и только адрес подпрограммы изменяется от одного вызова к другому. Это означает, что программа, состоящая из множества вызовов функций, также может иметь значительное количество повторяющегося кода.

Чтобы решить эту проблему, системы с многопоточным кодом использовали псевдокод для представления вызовов функций одним оператором. Во время выполнения крошечный «интерпретатор» просматривает код верхнего уровня, извлекает адрес подпрограммы в памяти и вызывает ее. В других системах эта же базовая концепция реализована как разделительный стол, таблица отправки, или таблица виртуальных методов, все из которых состоят из таблицы адресов подпрограмм.

В 1970-х разработчики оборудования приложили значительные усилия, чтобы сделать вызов подпрограмм более быстрым и простым. В улучшенных конструкциях для вызова подпрограммы используется только одна инструкция, поэтому использование псевдо-инструкции не экономит места.[нужна цитата ] Кроме того, выполнение этих вызовов практически не требует дополнительных затрат. Сегодня, хотя почти все языки программирования сосредоточены на изоляции кода в подпрограммах, они делают это для ясности кода и удобства обслуживания, а не для экономии места.

Системы с многопоточным кодом экономят место, заменяя этот список вызовов функций, где только адрес подпрограммы изменяется от одного вызова к другому, списком токенов выполнения, которые по сути являются вызовами функций с удаленными кодами операций вызова, оставляя позади только список адресов.[3][4][5][6][7]

За прошедшие годы программисты создали множество вариаций этого «интерпретатора» или «небольшого селектора». Конкретный адрес в списке адресов может быть извлечен с помощью индекса, регистр общего назначения или указатель. Адреса могут быть прямыми или косвенными, смежными или несмежными (связаны указателями), относительными или абсолютными, разрешенными во время компиляции или динамически построенными. Ни один вариант не является «лучшим» для всех ситуаций.

Развитие

Чтобы сэкономить место, программисты сжали списки вызовов подпрограмм в простые списки адресов подпрограмм и использовали небольшой цикл для вызова каждой подпрограммы по очереди. Например, следующий псевдокод использует эту технику для сложения двух чисел A и B. В этом примере список помечен нить и переменная ip (Указатель инструкции) отслеживает наше место в списке. Другая переменная зр (Указатель стека) содержит адрес в другом месте памяти, доступный для временного хранения значения.

Начните:  ip = &нить  // указывает на адрес '& pushA', а не на текстовую метку 'thread'верх:  Прыгать *ip++  // следуем ip до адреса в потоке, следуем за этим адресом до подпрограммы, продвигаем ipнить:  &pushA  &pushB  &Добавить  ...pushA:  *зр++ = А  // следуем sp до доступной памяти, сохраняем там A, продвигаемся к следующему sp   Прыгать верхpushB:  *зр++ = B  Прыгать верхДобавить:  добавить = *--зр  // указываем sp на последнее значение, сохраненное в стеке, следуем за ним, чтобы скопировать это значение  *зр++ = *--зр + добавить  // копируем другое значение из стека, складываем, копируем сумму в стек  Прыгать верх


Цикл вызова в верх настолько прост, что его можно повторять в конце каждой подпрограммы. Теперь управление перескакивает один раз, с конца одной подпрограммы на начало другой, вместо двойного перехода через верх. Например:

Начните:  ip = &нить  // ip указывает на & pushA (который указывает на первую инструкцию pushA)  Прыгать *ip++  // отправляем управление первой инструкции pushA и продвигаем ip к & pushBнить:  &pushA  &pushB  &Добавить  ...pushA:  *зр++ = А  // следуем sp до доступной памяти, сохраняем там A, продвигаемся к следующему sp   Прыгать *ip++  // отправляем управление туда, где ip говорит (то есть pushB) и продвигаем ippushB:  *зр++ = B  Прыгать *ip++Добавить:  добавить = *--зр  // указываем sp на последнее значение, сохраненное в стеке, следуем за ним, чтобы скопировать это значение  *зр++ = *--зр + добавить  // копируем другое значение из стека, складываем, копируем сумму в стек  Прыгать *ip++

Это называется прямой многопоточный код (DTC). Хотя этот метод и старше, первым широко распространенным использованием термина «многопоточный код», вероятно, является статья Джеймса Р. Белла 1973 года «Потоковый код».[8]

В 1970 г. Чарльз Х. Мур изобрели более компактное устройство, косвенный многопоточный код (ITC) для его виртуальной машины Forth. Мур пришел к такой договоренности, потому что Новая звезда миникомпьютеры имели косвенный бит по каждому адресу, что сделало ИТЦ простым и быстрым. Позже он сказал, что нашел это настолько удобным, что распространил его на все более поздние разработки Форта.[9]

Сегодня некоторые компиляторы Forth генерируют код с прямыми потоками, а другие генерируют код с косвенными потоками. Исполняемые файлы в любом случае действуют одинаково.

Модели с резьбой

Практически весь исполняемый многопоточный код использует тот или иной из этих методов для вызова подпрограмм (каждый метод называется «потоковой моделью»).

Прямая резьба

Адреса в потоке - это адреса машинного языка. Эта форма проста, но может иметь накладные расходы, поскольку поток состоит только из машинных адресов, поэтому все дополнительные параметры должны загружаться косвенно из памяти. Некоторые системы Forth создают код с прямыми потоками. На многих машинах прямое выполнение потоков выполняется быстрее, чем выполнение подпрограмм (см. Ссылку ниже).

Пример стековой машины может выполнять последовательность «нажать A, нажать B, добавить». Это может быть переведено в следующий поток и подпрограммы, где ip инициализируется адресом, помеченным нить (т.е. адрес, где & pushA хранится).

Начните:  ip = &нить  // ip указывает на & pushA (который указывает на первую инструкцию pushA)  Прыгать *ip++  // отправляем управление первой инструкции pushA и продвигаем ip к & pushBнить:  &pushA  &pushB  &Добавить  ...pushA:  *зр++ = А  Прыгать *ip++ // отправляем управление туда, где ip говорит (то есть pushB) и продвигаем ippushB:  *зр++ = B  Прыгать *ip++Добавить:  добавить = *--зр  *зр++ = *--зр + добавить  Прыгать *ip++

В качестве альтернативы в поток могут быть включены операнды. Это может устранить некоторую косвенность, необходимую выше, но увеличивает поток:

Начните:  ip = &нить  Прыгать *ip++нить:  &От себя  &А  // адрес, где хранится A, а не буквальный A  &От себя  &B  &Добавить  ...От себя:  *зр++ = *ip++  // должен переместить ip за адрес операнда, так как это не адрес подпрограммы  Прыгать *ip++Добавить:  добавить = *--зр  *зр++ = *--зр + добавить  Прыгать *ip++

Непрямая резьба

Косвенная многопоточность использует указатели на места, которые, в свою очередь, указывают на машинный код. За косвенным указателем могут следовать операнды, которые хранятся в косвенном «блоке», а не повторяются в потоке. Таким образом, косвенный код часто более компактен, чем код с прямым потоком. Косвенное обращение обычно делает его медленнее, хотя обычно все же быстрее, чем интерпретаторы байт-кода. Если операнды обработчика включают как значения, так и типы, экономия места по сравнению с кодом с прямыми потоками может быть значительной. Старые системы FORTH обычно производят непрямый многопоточный код.

Например, если цель состоит в том, чтобы выполнить «push A, push B, add», можно использовать следующее. Вот, ip инициализируется для адресации &нить, каждый фрагмент кода (От себя, Добавить) находится путем двойного косвенного обращения через ip и косвенный блок; и любые операнды фрагмента находятся в косвенном блоке, следующем за адресом фрагмента. Это требует сохранения текущий подпрограмма в ip, в отличие от всех предыдущих примеров, где он содержал Следующий вызываемая подпрограмма.

Начните:  ip = &нить  // указывает на '& i_pushA'  Прыгать *(*ip)  // следуем указателям на 1-ю инструкцию 'push', НЕ продвигать ip поканить:  &i_pushA  &i_pushB  &я добавить  ...i_pushA:  &От себя  &Аi_pushB:  &От себя  &Bя добавить:  &ДобавитьОт себя:  *зр++ = *(*ip + 1)  // ищем 1 после начала косвенного блока для адреса операнда  Прыгать *(*++ip)  // продвижение IP в потоке, переход через следующий косвенный блок к следующей подпрограммеДобавить:  добавить = *--зр  *зр++ = *--зр + добавить  Прыгать *(*++ip)

Подпрограмма потоковой передачи

Так называемый «код с подпрограммой» (также «код с потоком вызовов») состоит из серии инструкций «вызова» на машинном языке (или адресов функций для «вызова», в отличие от использования «перехода» в прямом потоке. ). Ранние компиляторы для АЛГОЛ, Fortran, Cobol и некоторые системы Forth часто создавали программный код. Код во многих из этих систем работает со стеком операндов «последним вошел - первым ушел» (LIFO), для которого теория компиляторов была хорошо развита. Большинство современных процессоров имеют специальную аппаратную поддержку для инструкций «вызова» и «возврата» подпрограмм, поэтому накладные расходы, связанные с одной дополнительной машинной инструкцией на отправку, несколько уменьшаются.

Антон Эртль, Gforth соавтор компилятора заявил, что «в отличие от популярных мифов, потоки подпрограмм обычно медленнее, чем прямые потоки».[10] Однако последние тесты Ertl[1] показывают, что потоки подпрограмм быстрее, чем прямые потоки, в 15 из 25 тестовых случаев. В частности, он обнаружил, что прямая многопоточность - самая быстрая модель на процессорах Xeon, Opteron и Athlon, непрямая - самая быстрая на процессорах Pentium M, а подпрограмма - на процессорах Pentium 4, Pentium III и PPC.

В качестве примера потоковой передачи вызовов для «push A, push B, add»:

нить:  вызов pushA  вызов pushB  вызов Добавить  RetpushA:  *зр++ = А  RetpushB:  *зр++ = B  RetДобавить:  добавить = *--зр  *зр++ = *--зр + добавить  Ret

Распределение токенов

Код с токен-нитями использует списки из 8 или 12 битов.[нужна цитата ] индексы к таблице указателей. Он очень компактен, не требует особых усилий со стороны программиста. Обычно это от половины до трех четвертей размера других потоков, которые сами по себе составляют от четверти до восьмой размера непоточного кода. Указатели таблицы могут быть косвенными или прямыми. Некоторые компиляторы Forth создают код с токен-нитями. Некоторые программисты считают "p-код "порожденный некоторыми Паскаль компиляторы, а также байткоды использован .СЕТЬ, Ява, BASIC и некоторые C компиляторы, которые будут распределять токены.

Исторически распространенным подходом является байт-код, который использует 8-битные коды операций и, часто, виртуальную машину на основе стека. Типичный переводчик известен как "переводчик декодирования и отправки ", и имеет форму:

Начните:  vpc = &нитьверх:  я = расшифровать(vpc++)  / * может быть реализовано просто как: return * vpc * /  адрес = Таблица[я]  Прыгать *адреснить:  / * Содержит байт-код, а не машинные адреса. Следовательно, он более компактный. * /  1 / * pushA * /  2 / * pushB * /  0 /*Добавить*/Таблица:  &Добавить    / * таблица [0] = адрес машинного кода, реализующего байт-код 0 * /  &pushA  /* Таблица 1] ... */  &pushB  /* Таблица 2] ... */pushA:  *зр++ = А  Прыгать верхpushB:  *зр++ = B  Прыгать верхДобавить:  добавить = *--зр  *зр++ = *--зр + добавить  Прыгать верх

Если виртуальная машина использует только инструкции байтового размера, декодировать () это просто выборка из нить, но часто встречаются обычно используемые 1-байтовые инструкции плюс несколько менее распространенных многобайтовых инструкций (см. компьютер со сложной системой команд ), в таком случае декодировать () более сложный. Декодирование однобайтовых кодов операций может быть очень просто и эффективно обработано таблицей переходов, использующей код операции непосредственно в качестве индекса.

Для инструкций, в которых отдельные операции просты, например, «нажать» и «добавить», накладные расходы участие в принятии решения о том, что выполнять, превышает затраты на его выполнение, поэтому такие интерпретаторы часто намного медленнее, чем машинный код. Однако для более сложных («составных») инструкций процент служебных данных пропорционально менее значим.

Как это ни парадоксально, но токен-многопоточный код может иногда работать быстрее, чем эквивалентный машинный код - когда машинный код слишком велик, чтобы поместиться в кеш, но чем выше плотность кода многопоточного кода, особенно кода с токенами, позволяет ему полностью поместиться в высокоскоростной кэш.[4]

Резьба по Хаффману

Потоковый код Хаффмана состоит из списков токенов, хранящихся как Коды Хаффмана. Код Хаффмана - это строка битов переменной длины, которая идентифицирует уникальный токен. Потоковый интерпретатор Хаффмана находит подпрограммы с помощью индексной таблицы или дерева указателей, по которым можно перемещаться с помощью кода Хаффмана. Многопоточный код Хаффмана - одно из самых компактных представлений компьютерных программ. Индекс и коды выбираются путем измерения частоты вызовов каждой подпрограммы в коде. При частых звонках даются кратчайшие коды. Операции с примерно равными частотами задаются кодами с примерно равной битовой длиной. Большинство потоковых систем Хаффмана были реализованы как Forth-системы с прямыми потоками и использовались для упаковки больших объемов медленно работающего кода в небольшие, дешевые микроконтроллеры. Самые опубликованные[11] использовались в смарт-картах, игрушках, калькуляторах и часах. Бит-ориентированный токенизированный код, используемый в PBASIC можно рассматривать как разновидность кода Хаффмана.

Менее используемая резьба

Примером является распараллеливание строк, в котором операции идентифицируются строками, обычно поиск осуществляется с помощью хеш-таблицы. Это использовалось в самых ранних реализациях Forth Чарльза Х. Мура и в Университет Иллинойса экспериментальный компьютерный язык с аппаратной интерпретацией. Он также используется в Башфорт.

РПЛ

HP с РПЛ, впервые представленный в HP-18C Calculator 1986 года - это тип проприетарного гибридного языка с прямой и косвенной потоковой интерпретацией, который, в отличие от других TIL, позволяет встраивать «объекты» RPL в «поток выполнения», т.е. Поток адресов, по которому продвигается указатель интерпретатора. «Объект» RPL можно рассматривать как особый тип данных, структура которого в памяти содержит адрес «пролога объекта» в начале объекта, а затем следуют данные или исполняемый код. Пролог объекта определяет, как тело объекта должно выполняться или обрабатываться. Использование «внутреннего цикла РПЛ»[12], который был изобретен и опубликован (и запатентован [13] ) Уильяма К. Уикса в 1986 году и опубликованного в "Programming Environments", Institute for Applied Forth Research, Inc., 1988, выполнение выглядит следующим образом:

  1. Разыменовать IP (указатель инструкции) и сохранить его в O (указатель текущего объекта)
  2. Увеличить IP на длину одного указателя адреса
  3. Разыменовать O и сохранить его адрес в O_1 (это второй уровень косвенности)
  4. Передайте управление следующему указателю или встроенному объекту, установив ПК (счетчик программ) на O_1 плюс один указатель адреса
  5. Вернуться к шагу 1

Более точно это можно представить следующим образом:

    O = [I] I = I + Δ PC = [O] + Δ

Где выше, O - текущий указатель объекта, I - указатель интерпретатора, Δ - длина одного адресного слова, а оператор «[]» означает «разыменование».

Когда управление передается указателю объекта или встроенному объекту, выполнение продолжается следующим образом:

PROLOG -> PROLOG (Адрес пролога в начале кода пролога указывает на себя) ЕСЛИ O + Δ = / = PC THEN GOTO INDIRECT (Тест на прямое выполнение) O = I - Δ (Исправьте O, чтобы указать на начало встроенного объект) I = I + α (исправьте I, чтобы он указывал после встроенного объекта, где α - длина объекта) INDIRECT (остальная часть пролога)

На HP Сатурн Для микропроцессоров, использующих RPL, существует третий уровень косвенного обращения, который стал возможным благодаря уловке архитектуры / программирования, которая обеспечивает более быстрое выполнение.[12]

ветви

Во всех интерпретаторах ветвь просто изменяет указатель потока (ip над). Условная ветвь для перехода, если значение вершины стека равно нулю, может быть закодировано следующим образом. Обратите внимание, что & поток [123] - это место перехода, а не адрес обработчика. Значит, его нужно пропустить (ip ++) независимо от того, взята ли ветка.

нить:  ...  &brz  &нить[123]  ...brz:  tmp = ip++  если (*зр++ == 0)    ip = tmp  Прыгать *ip++

Общие удобства

Разделение стеков данных и возврата в машине устраняет большую часть кода управления стеком, существенно уменьшая размер многопоточного кода. Принцип двойного стека возник трижды независимо: для Большие системы Берроуза, Четвертый, и PostScript. Он используется в некоторых Виртуальные машины Java.

Три регистры часто присутствуют в многопоточной виртуальной машине. Другой существует для передачи данных между подпрограммы ('слова'). Эти:

  • ip или я (указатель инструкции ) виртуальной машины (не путать с счетчик команд базового оборудования, реализующего виртуальную машину)
  • w (рабочий указатель)
  • rp или r (возврат стек указатель)
  • sp или s (параметр указатель стека для передачи параметров между словами)

Часто с резьбой виртуальные машины, такие как реализации Forth, в основе своей имеют простую виртуальную машину, состоящую из трех примитивы. Это:

  1. гнездо, также называется докол
  2. разложить, или semi_s (; s)
  3. Следующий

В виртуальной машине с косвенными потоками, приведенной здесь, операции следующие:

 Следующий:   *ip++ -> ш   Прыгать **ш++ гнездо:   ip -> *rp++   ш -> ip   Следующий разложить:   *--rp -> ip   Следующий

Это возможно[нужна цитата ] самый простой и быстрый интерпретатор или виртуальная машина.

Смотрите также

Заметки

  1. ^ Дартмутский ОСНОВНОЙ, на котором в конечном итоге основана MS, был компилятором, который работал на мэйнфреймах.

использованная литература

  1. ^ а б «Скорость различных методов диспетчеризации переводчиков V2».
  2. ^ Деннис М. Ричи, «Развитие языка Си», 1993. Цитата: «Компилятор B на PDP-7 не генерировал машинные инструкции, а вместо этого генерировал« многопоточный код »...»
  3. ^ Дэвид Фрех."muforth readme".section "Простой и хвосторекурсивный собственный компилятор".
  4. ^ а б Стив Хеллер.«Эффективное программирование на C / C ++: меньше, быстрее, лучше».2014. Глава 5: «Вам нужен переводчик?» С. 195.
  5. ^ Жан-Поль Трембле; Соренсон П.Г.«Теория и практика написания компиляторов».1985.p. 527
  6. ^ "Беспроводной мир: электроника, радио, телевидение, Том 89".п. 73.
  7. ^ «Байт, Том 5».1980.p. 212
  8. ^ Белл, Джеймс Р. (1973). «Резьбовой код». Коммуникации ACM. 16 (6): 370–372. Дои:10.1145/362248.362270.
  9. ^ Мур, Чарльз Х., опубликовал заметки в четвертом выпуске журнала Byte Magazine.
  10. ^ Эртл, Антон. "Что такое резьбовой код?".
  11. ^ Латендресс, Марио; Фили, Марк. Генерация быстрых интерпретаторов для байт-кода, сжатого по Хаффману. Эльзевир. CiteSeerX  10.1.1.156.2546.
  12. ^ а б Басби, Джонатан. «Объяснение внутреннего цикла РПЛ», «Музей калькуляторов HP», 7 сентября 2018, проверено 27 декабря 2019 г.
  13. ^ Уикс, Уильям К. (30 мая 1986 г.). «Система и метод обработки данных для прямого и косвенного выполнения однородно структурированных типов объектов». uspto.gov. Получено 27 декабря, 2019.

внешние ссылки