Морфологический словарь - Morphological dictionary
Эта статья не цитировать любой источники.Февраль 2015 г.) (Узнайте, как и когда удалить этот шаблон сообщения) ( |
В области компьютерная лингвистика, а морфологический словарь это лингвистический ресурс, содержащий соответствия между поверхностной формой и лексическими формами слов. Поверхностные формы слов встречаются в любом тексте. Соответствующей лексической формой поверхностной формы является лемма за которым следует грамматическая информация (например, часть речи, Пол и номер ). По-английски дайте, дает, давая, дал и данный поверхностные формы глагола дайте. Лексической формой будет глагол «давать». Есть два вида морфологических словарей: выровненные и невыровненные.
Выровненные морфологические словари
В выровненном морфологическом словаре соответствие между поверхностной формой и лексической формой слова выравнивается на уровне символов, например:
- (h, h) (o, o) (u, u) (s, s) (e, e) (s, ⟨n⟩), (θ, ⟨pl⟩)
Где θ - пустой символ, а n⟩ означает «существительное», а ⟨pl⟩ означает «множественное число».
В этом примере левая часть - это поверхностная форма (вход), а правая часть - лексическая форма (выход). Этот порядок используется в морфологический анализ где лексическая форма генерируется из поверхностной формы. В морфологическом поколении этот порядок будет обратным.
Формально, если Σ - алфавит входных символов, а - алфавит выходных символов, выровненный морфологический словарь - это подмножество , куда:
- это алфавит всех возможных выравниваний, включая пустой символ. То есть выровненный морфологический словарь - это набор строк в .
Несогласованный морфологический словарь
Невыровненный морфологический словарь - это просто набор пар входных и выходных строк. Невыровненный морфологический словарь представит предыдущий пример как:
- (дома, дом⟨n⟩⟨pl⟩)
Можно преобразовать невыровненный словарь в выровненный словарь. Помимо тривиальных выравниваний влево или вправо, возможны лингвистически мотивированные выравнивания, которые выравнивают символы по их соответствующим морфемам.
Лексическая двусмысленность
Часто существует более одной лексической формы, связанной с поверхностной формой слова. Например, «дом» может быть существительным в единственном числе, / haʊs /, или может быть глаголом в настоящем времени, / haʊz /. В результате этого необходимо иметь функцию, которая связывает входные строки с соответствующими им выходными строками.
Если мы определим множество входных слов таких, что , функция соответствия будет определяется как .