Морфологический словарь - Morphological dictionary

В области компьютерная лингвистика, а морфологический словарь это лингвистический ресурс, содержащий соответствия между поверхностной формой и лексическими формами слов. Поверхностные формы слов встречаются в любом тексте. Соответствующей лексической формой поверхностной формы является лемма за которым следует грамматическая информация (например, часть речи, Пол и номер ). По-английски дайте, дает, давая, дал и данный поверхностные формы глагола дайте. Лексической формой будет глагол «давать». Есть два вида морфологических словарей: выровненные и невыровненные.

Выровненные морфологические словари

В выровненном морфологическом словаре соответствие между поверхностной формой и лексической формой слова выравнивается на уровне символов, например:

(h, h) (o, o) (u, u) (s, s) (e, e) (s, ⟨n⟩), (θ, ⟨pl⟩)

Где θ - пустой символ, а n⟩ означает «существительное», а ⟨pl⟩ означает «множественное число».

В этом примере левая часть - это поверхностная форма (вход), а правая часть - лексическая форма (выход). Этот порядок используется в морфологический анализ где лексическая форма генерируется из поверхностной формы. В морфологическом поколении этот порядок будет обратным.

Формально, если Σ - алфавит входных символов, а - алфавит выходных символов, выровненный морфологический словарь - это подмножество , куда:

- это алфавит всех возможных выравниваний, включая пустой символ. То есть выровненный морфологический словарь - это набор строк в .

Несогласованный морфологический словарь

Невыровненный морфологический словарь - это просто набор пар входных и выходных строк. Невыровненный морфологический словарь представит предыдущий пример как:

(дома, дом⟨n⟩⟨pl⟩)

Можно преобразовать невыровненный словарь в выровненный словарь. Помимо тривиальных выравниваний влево или вправо, возможны лингвистически мотивированные выравнивания, которые выравнивают символы по их соответствующим морфемам.

Лексическая двусмысленность

Часто существует более одной лексической формы, связанной с поверхностной формой слова. Например, «дом» может быть существительным в единственном числе, / haʊs /, или может быть глаголом в настоящем времени, / haʊz /. В результате этого необходимо иметь функцию, которая связывает входные строки с соответствующими им выходными строками.

Если мы определим множество входных слов таких, что , функция соответствия будет определяется как .

Список онлайн-морфологических словарей