Обычная грамматика - Regular grammar

В теоретическая информатика и формальная теория языка, а регулярная грамматика это формальная грамматика то есть право-регулярное или левое-правильное. Каждая регулярная грамматика описывает обычный язык.

Строго регулярные грамматики

А правильная грамматика (также называемый праволинейная грамматика ) это формальная грамматика (N, Σ, п, S) такой, что все правила производства в п имеют одну из следующих форм:

А → а, куда А это нетерминальный в N и а является терминалом в Σ
А → аБ, куда А и B не являются терминалами в N и а находится в Σ
А → ε, где А в N а ε обозначает пустой строкой, т.е. строка длины 0.

В лево-регулярная грамматика (также называемый леволинейная грамматика ) все правила подчиняются формам

А → а, куда А нетерминал в N и а является терминалом в Σ
А → Ба, куда А и B находятся в N и а находится в Σ
А → ε, где А в N а ε - пустая строка.

А регулярная грамматика является лево-регулярной или правосторонней грамматикой.

Некоторые учебники и статьи запрещают пустые производственные правила и предполагают, что пустая строка отсутствует в языках.

Расширенные регулярные грамматики

An расширенная правосторонняя грамматика это тот, в котором все правила подчиняются одному из

А → ш, куда А нетерминал в N и ш находится в (возможно, пустой) цепочке терминалов Σ^*
А → wB, куда А и B находятся в N и ш находится в Σ^*.

Некоторые авторы называют этот тип грамматики правильная грамматика (или же праволинейная грамматика)^[1] и тип над строго правильно-регулярная грамматика (или же строго право-линейная грамматика).^[2]

An расширенная лево-регулярная грамматика это тот, в котором все правила подчиняются одному из

А → ш, куда А нетерминал в N и ш находится в Σ^*
А → Чб, куда А и B находятся в N и ш находится в Σ^*.

Примеры

Пример правильно регулярной грамматики грамм с N = {S, A}, Σ = {a, b, c}, п состоит из следующих правил

S → aS

S → bA

A → ε

А → сА

и S - начальный символ. Эта грамматика описывает тот же язык, что и регулярное выражение a * bc *, а именно. набор всех строк, состоящий из произвольного числа "а"s, за которым следует сингл"б", а затем произвольно много"c"с.

Несколько более длинная, но более явная расширенная правосторонняя грамматика грамм для того же регулярного выражения дается N = {S, A, B, C}, Σ = {a, b, c}, где п состоит из следующих правил:

S → A

А → а

А → Б

B → bC

C → ε

С → сС

... где каждая заглавная буква соответствует фразам, начинающимся со следующей позиции в регулярном выражении.

В качестве примера из области языков программирования множество всех строк, обозначающих число с плавающей запятой, может быть описано расширенной правильной правильной грамматикой. грамм с N = {S, A, B, C, D, E, F}, Σ = {0,1,2,3,4,5,6,7,8,9, +, -,., E}, где S - начальный символ, а п состоит из следующих правил:

S → + А	А → 0А	В → 0С	С → 0С	D → + E	E → 0F	F → 0F
S → -A	А → 1А	Б → 1С	С → 1С	D → -E	E → 1F	F → 1F
S → A	А → 2А	В → 2С	С → 2С	D → E	E → 2F	F → 2F
	А → 3А	В → 3С	С → 3С		E → 3F	F → 3F
	А → 4А	В → 4С	С → 4С		E → 4F	F → 4F
	А → 5А	В → 5С	С → 5С		E → 5F	F → 5F
	А → 6А	В → 6С	С → 6С		E → 6F	F → 6F
	А → 7А	В → 7С	С → 7С		E → 7F	F → 7F
	А → 8А	В → 8С	С → 8С		E → 8F	F → 8F
	А → 9А	В → 9С	С → 9С		E → 9F	F → 9F
	А → .B		C → eD			F → ε
	А → Б		C → ε

Выразительная сила

Существует прямое взаимно однозначное соответствие между правилами (строго) праворегулярной грамматики и правилами грамматики. недетерминированный конечный автомат, так что грамматика генерирует именно тот язык, который принимает автомат.^[3] Следовательно, правильно-регулярные грамматики порождают в точности все обычные языки. Леворегулярные грамматики описывают инверсии всех таких языков, то есть в точности и регулярные языки.

Каждая строгая правильно-регулярная грамматика является расширенной правильно-регулярной, в то время как любую расширенную право-регулярную грамматику можно сделать строгой, вставив новые нетерминалы, так что результат порождает тот же язык; следовательно, расширенные правые регулярные грамматики также порождают регулярные языки. Аналогичным образом поступают и расширенные лево-регулярные грамматики.

Если пустое производство запрещено, могут быть сгенерированы только все обычные языки, которые не включают пустую строку.^[4]

Хотя обычные грамматики могут описывать только обычные языки, обратное неверно: обычные языки также могут быть описаны с помощью нерегулярных грамматик.

Смешивание левых регулярных и правых регулярных правил

Если разрешено смешивание левых регулярных и правых регулярных правил, мы все равно имеем линейная грамматика, но не обязательно регулярный. Более того, такая грамматика не обязательно должна генерировать регулярный язык: все линейные грамматики могут быть легко приведены в эту форму, и, следовательно, такие грамматики могут генерировать в точности все линейные языки, в том числе нерегулярные.

Например, грамматика грамм с N = {S, A}, Σ = {a, b}, п с начальным символом S и правила

S → aA

А → Sb

S → ε

генерирует ${displaystyle {a ^ {i} b ^ {i}: igeq 0}}$ , парадигматический нерегулярный линейный язык.

Смотрите также

Регулярное выражение, компактная запись для регулярных грамматик
Грамматика регулярных деревьев, обобщение от строк к деревьям
Грамматика префиксов
Иерархия Хомского
Перрен, Доминик (1990), «Конечные автоматы», в Левен, Ян ван (редактор), Формальные модели и семантика, Справочник по теоретической информатике, B, Elsevier, стр. 1–58.
Пин, Жан-Эрик (Октябрь 2012 г.). Математические основы теории автоматов (PDF)., глава III

Струны
Строковая метрика	Приблизительное соответствие строк Битап алгоритм Расстояние Дамерау – Левенштейна Изменить расстояние Сопоставление гештальт-паттернов Расстояние Хэмминга Расстояние Яро – Винклера Расстояние Ли Автомат Левенштейна Расстояние Левенштейна Алгоритм Вагнера – Фишера
Алгоритм поиска строки	Алгоритм Апостолико – Джанкарло Алгоритм поиска строки Бойера – Мура Алгоритм Бойера – Мура – Хорспула Алгоритм Кнута – Морриса – Пратта Алгоритм Рабина – Карпа
Поиск по нескольким строкам	Ахо-Корасик Комментарий-алгоритм Вальтера
Регулярное выражение	Сравнение движков регулярных выражений Обычная грамматика Конструкция Томпсона Недетерминированный конечный автомат
Выравнивание последовательности	Алгоритм Хиршберга Алгоритм Нидлмана – Вунша Алгоритм Смита – Уотермана
Структура данных	DAFSA Массив суффиксов Суффикс-автомат Суффиксное дерево Обобщенное суффиксное дерево Веревка Тернарное дерево поиска Trie
Другой	Парсинг Сопоставление с образцом Сжатое сопоставление с образцом Самая длинная общая подпоследовательность Самая длинная общая подстрока Последовательный анализ паттернов Сортировка