Сравнение Object Pascal и C - Comparison of Object Pascal and C

Компьютер языки программирования C и Object Pascal имеют схожие времена происхождения, влияния и цели. Оба они использовались для разработки (и компиляции) собственных компиляторов в самом начале своей жизни.

И C, и Pascal являются старыми языками программирования: исходное определение Pascal появилось в 1969 году, а первый компилятор - в 1970 году. Первая версия C появилась в 1972 году. Хотя C не сильно изменился со временем, Pascal сильно изменился, и в настоящее время подавляющее большинство программирования на Pascal выполняется в современных Object Pascal, а не в старом процедурном Паскале. Старый процедурный Паскаль сегодня по существу ограничен программированием микроконтроллеров с помощью таких инструментов, как mikroPascal, в то время как Object Pascal является основным диалектом и используется с такими инструментами, как Delphi, Lazarus (IDE) и Free Pascal.

Здесь задокументирован современный Object Pascal, используемый во Free Pascal и Delphi. Документированный C - это C99, стандартизированный в 1999 году.

Синтаксис

Синтаксически Object Pascal гораздо больше похож на Algol, чем C. Ключевые слова английского языка сохраняются там, где C использует символы пунктуации - в Pascal есть и, или же, и мод где C использует &&, ||, и % Например. Однако C на самом деле более похож на Algol, чем Pascal в отношении (простых) объявлений, сохраняя имя типа имя-переменной синтаксис. Например, C может принимать объявления в начале любого блока, а не только внешнего блока функции.

Использование точки с запятой

Другое, более тонкое отличие - роль точка с запятой. В точках с запятой Паскаля отдельный отдельные утверждения в составном утверждении, тогда как они прекратить оператор в C. Они также синтаксически являются частью самого оператора в C (преобразование выражения в оператор). Это различие проявляется прежде всего в двух ситуациях:

  • не может быть точка с запятой непосредственно перед еще в Паскале, тогда как в C это обязательно (если не используется оператор блока)
  • последнее заявление перед конец после точки с запятой не требуется

Лишнюю точку с запятой можно поставить в последней строке перед конец, тем самым формально вставив пустой оператор.

Комментарии

В традиционном C есть только / * блокировать комментарии * /. Начиная с C99, есть также // Строчные комментарии . В Object Pascal есть { заблокировать комментарии }, (* заблокировать комментарии *), и // Строчные комментарии.

Идентификаторы и ключевые слова

Си и Паскаль различаются интерпретацией верхнего и нижнего регистра. C чувствителен к регистру, а Паскаль - нет, поэтому MyLabel и mylabel являются разными именами в C, но идентичными в Паскале. В обоих языках идентификаторы состоят из букв и цифр с правилом, согласно которому первый символ не может быть цифрой. В языке C подчеркивание считается буквой, поэтому даже _abc является допустимым именем. Имена с начальным подчеркиванием часто используются для различения специальных системных идентификаторов в C.Паскаль также принимает символ _ как часть идентификаторов, никакой разницы с C.

И C, и Паскаль используют ключевые слова (слова зарезервированы для использования самим языком). Примеры если, пока, const, за и идти к, которые являются ключевыми словами, которые являются общими для обоих языков. В C имена основных встроенных типов также являются ключевыми словами (например, int, char) или комбинации ключевых слов (например, беззнаковый символ), а в Паскале имена встроенных типов являются предопределенными обычными идентификаторами.

Однако последние компиляторы Object Pascal позволяют экранировать ключевые слова с помощью &, эта функция в основном нужна при прямом взаимодействии с внешними системами ООП, такими как COM и COCOA, которые могут использовать поля и методы, основанные на ключевых словах Pascal. У C нет возможности избежать ключевых слов.

Определения, объявления и блоки

В Паскале процедура определения начинаются с ключевых слов процедура или же функция и определения типов с тип. В C определения функций определяются синтаксическим контекстом, в то время как определения типов используют ключевое слово typedef. Оба языка используют сочетание ключевых слов и знаков препинания для определений сложных типов; например, массивы определяются ключевым словом множество в Паскале и пунктуацией в C, а перечисления определяются ключевым словом перечислить на языке C, но с помощью знаков препинания на языке Паскаля.

В функциях Паскаля начинать и конец разграничивают блок операторов (собственно), в то время как функции C используют "{" и "}" для разграничения блока операторов, которым необязательно предшествуют объявления. C (до C99) строго определяет, что любые объявления должны выполняться перед операторы в конкретном блоке, но позволяют блокам появляться внутри блоков, что позволяет обойти это. Паскаль строго следит за тем, чтобы объявления были перед операторами, но допускает определения типов и функций - не только объявлений переменных - которые должны быть инкапсулированы определениями функций на любом уровне глубины.

Выполнение

Грамматики обоих языков примерно одинакового размера. С точки зрения реализации основное различие между двумя языками заключается в том, что разбирать C необходимо иметь доступ к таблице символов для типов, тогда как в Паскале такая конструкция только одна - присваивание. Например, фрагмент C X * Y; может быть декларацией Y быть объектом, тип которого указатель на Икс, или оператор-выражение, умножающее Икс и Y. Соответствующий фрагмент Паскаля вар Y: ^ X; однозначно без таблицы символов.

Простые типы

Целые числа

Паскаль требует, чтобы все объявления переменных и функций явно указывали их тип. В традиционном C имя типа может быть опущено в большинстве контекстов, а тип по умолчанию int (что соответствует целое число в Pascal) тогда неявно предполагается (однако такие значения по умолчанию считаются плохой практикой в ​​C и часто помечаются предупреждениями).

C подходит для разных размеров и подписанный и неподписанный режимы для целых чисел с помощью модификаторов, таких как длинный, короткая, подписанный, беззнаковыйи т. д. Точное значение результирующего целочисленного типа зависит от машины, однако, что может быть гарантированным, что длинный интервал не короче чем int и int не короче чем короткий int. Однако в стандарте C указаны как минимум минимальные размеры типов, что гарантирует char быть одиноким байт и int быть не менее двух байтов.

Поддиапазоны

В Паскале аналогичный конец выполняется объявлением поддиапазон целого числа (компилятор может затем выделить меньший объем памяти для объявленной переменной):

тип а = 1..100;     б = -20..20;     c = 0..100000;

Эта функция поддиапазона не поддерживается C.

Основное, хотя и тонкое различие между C и Pascal заключается в том, как они продвигают целочисленные операции. В Паскале все операции с целыми числами или целыми поддиапазонами имеют такой же эффект, как если бы все операнды были преобразованы в полное целое число. В C есть определенные правила относительно того, как продвигать различные типы целых чисел, обычно с результирующим типом операции между двумя целыми числами, имеющими точность, которая больше или равна точности операндов. Это может сделать машинный код, сгенерированный из C, эффективным на многих процессорах. Компилятор Паскаля с высокой степенью оптимизации может уменьшить, но не устранить этот эффект в соответствии со стандартными правилами Паскаля.

(Единственная) реализация C до стандарта, а также Small-C et al. разрешенное целое число и указатель типы, которые можно относительно свободно смешивать.

Типы персонажей

В C тип символа char которое является целым числом не длиннее, чем короткий int,. Такие выражения, как 'x' + 1 поэтому совершенно законны, как и такие заявления, как int я = 'я'; и char c = 74;.

Эта целочисленная природа char (восьмибитный байт на большинстве машин) ясно иллюстрируется такими объявлениями, как

беззнаковый char uc = 255;  / * общий предел * /подписанный char sc = -128;   / * общий отрицательный предел * /

Был ли char тип следует рассматривать как подписанный или же беззнаковый по умолчанию зависит от реализации.

В Паскале символы и целые числа являются разными типами. Встроенные функции компилятора ord () и chr () может использоваться для преобразования типов отдельных символов в соответствующее целочисленное значение используемого набора символов и наоборот. например в системах, использующих набор символов ASCII ord ('1') = 49 и chr (9) является символом TAB.

В добавление к Char типа, Object Pascal также имеет WideChar для представления символов Юникода. В C это обычно реализуется как макрос или typedef с именем wchar_t, который является просто псевдонимом для int.

Булевы типы

В Паскале логический перечислимый тип. Возможные значения логический находятся ложный и истинный, с порядковым номером false = 0 и true = 1, остальные значения не определены. Для преобразования в целое число, ord используется:

я := ord(б);

Стандартной функции для целое число к логическийОднако на практике преобразование выполняется просто:

б := логический(я); // Будет вызывать правильные ошибки проверки диапазона для неопределенных значений при включенной проверке диапазона.

C имеет бинарные операторы отношения (<,>, ==,! =, <=,> =), Которые можно рассматривать как логический в том смысле, что они всегда дают нулевые или единичные результаты. Как и все тесты (&&, ||,?:, если, покаи т.д.) выполняются нулевыми проверками, ложный представлен нулем, а истинный представлен любым другим значением.

Для взаимодействия с COM в Object Pascal добавлены ByteBool, WordBool и LongBool тип, размер которого соответствует их префиксу и который следует за таблицей истинности C.

Free Pascal добавил правильные логические типы Паскаля с суффиксом размера (логическое 8, 16, 32, 64) для взаимодействия с GLIB, который использует gboolean, 32-битный логический тип с таблицей истинности Паскаля.

Побитовые операции

Программист на C может иногда использовать побитовый операторы для выполнения логических операций. Следует проявлять осторожность, потому что семантика различается, когда операнды используют более одного бита для представления значения.

У Паскаля есть другой, более абстрактный, высокоуровневый метод работы с побитовыми данными, наборы. Наборы позволяют программисту устанавливать, очищать, пересекать и объединять побитовые значения данных, а не использовать прямые побитовые операторы. Пример;

Паскаль:

Положение дел := Положение дел + [StickyFlag]; // или Включить (Статус, StickyFlag);Положение дел := Положение дел - [StickyFlag]; // или исключить (Статус, StickyFlag);если (StickyFlag в Положение дел) тогда ...

C:

Положение дел |= StickyFlag;Положение дел &= ~StickyFlag;если (Положение дел & StickyFlag) { ...

Хотя битовые операции над целыми числами и операции над наборами можно считать аналогичными, если наборы реализованы с использованием битов, нет прямой параллели между их использованием, если не возможно нестандартное преобразование между целыми числами и наборами.

Паскаль также мог выполнять побитовые операции точно так же, как C, с помощью и, или же, нет и xor операторы. Эти операторы обычно работают с логическими значениями, но когда операнды являются целыми числами, они действуют как побитовые операторы. Это стало возможным благодаря тому, что логические и целые числа являются разными несовместимыми типами. Следовательно, приведенный выше код C может быть записан на Паскале как:

Положение дел := Положение дел или же StickyFlag;Положение дел := Положение дел и нет StickyFlag;если Положение дел и StickyFlag <> 0 тогда ...

Продвинутые типы

Тип строки

В C строка остается указателем на первый элемент ноль-терминированный массив символов, как это было в 1972 году. Остается использовать поддержку библиотеки из <string.h> манипулировать строками.

Object Pascal имеет много строковых типов, потому что, когда вводится новый тип, старый сохраняется для обратной совместимости. Это произошло дважды, один раз с Delphi 2 (введение ansistring) и Delphi 2009 (Unicodestring). Помимо основных строковых типов (short-, ansi-, wide-, unicodestring) и соответствующих символьных типов (ansichar, widechar = unicodechar), все типы, производные от символьного типа, также имеют некоторые строковые свойства (указатель на char, массив символов , динамический массив символов, указатель на массив символов и т. д.).

В Object Pascal нить является типом, управляемым компилятором, и подсчитывается количество ссылок (если это необходимо), то есть управление его хранилищем осуществляется компилятором (или, точнее, кодом времени выполнения, вставленным компилятором в исполняемый файл). Конкатенация строк выполняется с помощью + оператор, а сравнение строк можно выполнить с помощью стандартных операторов отношения (с учетом регистра): < <= = <> >= >.

Object Pascal также предоставляет C-совместимые строки типа PAnsiChar, с процедурами манипуляции, определенными в Струны единица. Кроме того, Object Pascal предоставляет широкий спектр типов строк:

  • ShortString, который внутренне является
    множество [0 .. N] из Char;
    где N - максимальное количество символов, которое может быть сохранено, и 0-й индекс, содержащий длину строки. Максимально 255 символов могут быть сохранены в ShortString, потому что верхний предел беззнакового байта равен 255, а массив контейнеров определен таким образом, чтобы содержать максимум 255 символов данных (помните, что 0-й индекс содержит длину строки). N задается либо в определении типа, либо в объявлении переменной (см. Пример ниже)
  • AnsiString, динамическая версия неограниченного размера и подсчета ссылок ShortString. Начиная с Delphi 2009, в нем есть поле, которое сигнализирует о кодировке содержимого.
  • WideString, в Windows (win32 / 64 / ce), совместимом с COM BSTR, UCS2 / UTF16, пересчитывается с помощью COM. В системах, отличных от Windows, равно Unicodestring.
  • UnicodeString, подобно WideString, но закодирован в UTF-16

Для удобства равнина Нить предоставляется тип, который, в зависимости от переключателя компилятора, может означать ShortString, AnsiString или же UnicodeString. Используется дополнительное соглашение: если задано ограничение на количество символов, это будет ShortString, иначе это другое.

Короткий- и Анси Струны можно свободно перемешивать при манипуляциях со струнами; при необходимости компилятор выполнит тихое преобразование. Обратите внимание, что если тип целевой строки ShortString, может произойти тихое усечение из-за максимально допустимой длины.

Пример:

тип  TString80 = Нить[80];вар  SS  : ShortString;  s80 : Нить[80]; // объявляем (короткую) строку максимальной длины 80  s80t: TString80; // то же, что и выше  астр: AnsiString;  s   : Нить; // может означать String [255], AnsiString или UnicodeStringначинать  SS := астр + s80; // ДА, это возможно, и преобразование выполняется компилятором прозрачноконец;

Тип массива

Статический массив

В C нет реальной концепции массива; существует только псевдоконструкция для объявления хранилища для нескольких переменных одного и того же типа. Массивы в C не знают своей длины, и на них ссылаются через указатель на первый элемент, поэтому они всегда основаны на 0. Пример:

// объявляем int "массив" с именем a длиной 10int а[10];// выводим первый элемент, а точнее элемент по адресу, удерживаемому на + 0printf("% d",а[0]);// выводим второй элемент, а точнее элемент по адресу, удерживаемому на + 1printf("% d",а[1]);// передаем массив в функцию, а точнее передаем указатель на первый элементнекоторая функция(а);// то же, что и вышенекоторая функция(&а[0]);

Чтобы получить длину массива, нужно вычислить размер (<переменная_массива>) / размер (<базовый_тип>). Следовательно, чтобы подсчитать длину целочисленного массива, используйте: размер (интарр) / размер (число). Распространенная ошибка - вычислять это в функции, ожидающей в качестве аргумента массив. Несмотря на свой внешний вид, функция может принимать в качестве аргумента только указатель, а не реальный массив. Следовательно, внутри функции массив рассматривается как простой указатель. Пример:

// Эта функция принимает НЕ массив, а указатель на int// Семантически это то же самое, что: int * aпустота func(int а[]) {  // НЕПРАВИЛЬНЫЙ! Вернет sizeof (указатель) / sizeof (int)  int len = размер(а) / размер(int);}int главный() {  int а[5];  // правильно, вернет 5  int len = размер(а) / размер(int);  func(а);  возвращаться 0;}

Распространенное решение вышеупомянутой проблемы - всегда передавать длину массива в качестве аргумента функции, а функции, ожидающие аргумент массива, также должны предоставлять заполнитель для его длины.

Несмотря на то, что он рассматривается как указатель, не все конструкции стиля указателя можно использовать для создания массива. Например, этот код компилируется нормально, но при выполнении вызовет нарушение прав доступа:

пустота func(int *а) {  // ОШИБКА ВЫПОЛНЕНИЯ! a распределяется статически  а = (int*) маллок(размер(int) * 10);}int главный() {  int а[5];  func(а);}

При разработке такого кода следует проявлять осторожность, и в документации следует четко указать это, чтобы пользователи не совершили такую ​​ошибку.

Назначение между статическими массивами не допускается, и необходимо использовать memcpy функция и ее варианты для копирования данных между массивами.

В Паскале массив объявляется с использованием множество ключевое слово, определяющее его нижнюю и верхнюю границу, а также его базовый тип. Последний обычно определяется как тип диапазона. Например:

тип  T10IntegerArray = множество [1 .. 10] из Целое число;  TNegativeLowerBoundArray = множество [-5 .. 5] из Целое число;  TNamedIndexTypeArray = множество [Низкий(Char) .. Высоко(Char)] из Целое число;вар  IntegerArray: T10IntegerArray;  NegArray: TNegativeLowerBoundArray;  NamedIndexTypeArray: TNamedIndexTypeArray;

Массивы знают свои верхние и нижние границы (и неявно их длину), и границы передаются, когда функция ожидает массив в качестве аргумента. Функции Низкий(), Высоко() и Длина() получить нижнюю границу, верхнюю границу и длину массива соответственно в любом контексте.

Без явного приведения массивы не могут и не будут преобразованы в указатели, и это ошибка времени компиляции. Это свойство типобезопасного программирования.

Допускается присвоение статических массивов. Присвоение копирует все элементы из исходного массива в место назначения. Обязательно, чтобы верхняя и нижняя границы были совместимы между источником и местом назначения. Если они чем-то отличаются, то можно использовать Двигаться для частичного копирования данных. Однако поскольку Двигаться это низкоуровневая функция, использовать ее нужно осторожно. В обязанности программиста входит обеспечение того, чтобы перемещение данных не превышало границы ни места назначения, ни источника. Пример:

тип  TArray1 = множество [1 .. 10] из Целое число;  TArray2 = множество [1 .. 5] из Целое число;вар  а,б: TArray1;  c: TArray2;начинать  а := б; // OK  // Копируем все элементы от c до a, перезаписывая элементы от 1-го индекса до 1-го индекса + Length (c)  Двигаться(c,а,Длина(c) * Размер(Целое число));  // Копируем все элементы из c в a, начиная с индекса 5 a  Двигаться(c,а[5],Длина(c) * Размер(Целое число));  // Копируем первые 5 элементов из b в c  Двигаться(б,c,5 * Размер(Целое число));конец.

Динамический массив

В C нет языковой поддержки для объявления и использования динамических массивов. Однако из-за синтаксиса разыменования указателя динамический массив может быть реализован с помощью функций управления памятью, обычно из <stdlib.h>. Пример:

int размер = 10;int *а = (int*) маллок(размер(int) * размер); // выделяем динамический массив целых чисел размером 10int я;за (я = 0; я < размер; я++)  ... // делаем что-нибудь с [i]размер *= 2;int *темп = перераспределить(а,размер(int) * размер); // удваиваем пространство, сохраняя существующие элементыесли (темп == НОЛЬ)  ошибка("Недостаточно памяти!");а = темп;... // делаем что-нибудь ссвободный(а); // освобождаем хранилище

Как можно видеть, длина снова не поддерживается автоматически, и при перераспределении следует использовать дополнительную переменную для защиты от ошибки недостаточного объема памяти. Присвоение между динамическими массивами следует правилу присвоения указателя.

Object Pascal обеспечивает поддержку динамических массивов на уровне языка. Он объявлен без указания верхней и нижней границы. Тогда нужно позвонить SetLength () функция для выделения памяти. Динамические массивы в Object Pascal подсчитываются по ссылкам, поэтому не нужно беспокоиться об освобождении памяти. Динамические массивы всегда начинаются с нуля. Три функции Низкий(), Высоко() и Длина() все равно будет правильно получать нижнюю границу, верхнюю границу и длину массива. Пример:

тип  TIntArray = множество из Целое число;  T2DimIntArray = множество из множество из Целое число;вар  а  : TIntArray;  а2 : T2DimIntArray;  я,j: Целое число;начинать  SetLength(а,10); // выделяем 10 хранилищ  за я := Низкий(а) к Высоко(а) делать    ... // делаем что-нибудь с [i]  SetLength(а2,10,10); // выделяем хранилище 10 x 10  за я := Низкий(а2) к Высоко(а2) делать    за j := Низкий(а2[я]) к Высоко(а2[я]) делать      ... // делаем что-нибудь с a [i, j]конец;

Присваивание между динамическими массивами копирует ссылку исходного массива на место назначения. Если требуется настоящая копия, можно использовать Копировать функция. Пример:

тип  TIntegerArray = множество из Целое число;вар  а,б: TIntegerArray;начинать  ... // инициализируем a и b  а := б; // a теперь указывает на тот же массив, на который указывает b  а[1] := 0; // b [1] также должно быть 0 после этого  а := Копировать(б,3,5); // Копируем 5 элементов из b, начиная с индекса 3                    // однако a будет обращаться к нему от 0 до 4конец.

дальнейшее чтение

  • Free Pascal: Справочник по языку [1]