BulNet - BulNet
Эта статья может быть слишком техническим для большинства читателей, чтобы понять. Пожалуйста помогите улучшить это к сделать понятным для неспециалистов, не снимая технических деталей. (Апрель 2020) (Узнайте, как и когда удалить этот шаблон сообщения) |
Болгарский WordNet (BulNet) - это электронный многоязычный словарь синоним устанавливает вместе с их пояснительными определениями и наборами семантических отношений с другими словами в языке.[1][2]
Он следует за Принстонским WordNet (PWN) фреймворк, реализующий традиционный семантические сети структура которого состоит из узлов и отношений между узлами.[3][4][5]
Общая информация
BulNet был запущен в рамках проекта, финансируемого ЕС БалкаНет - Многоязычная семантическая сеть балканских языков. После завершения BalkaNet. Развитие BulNet продолжалось при поддержке правительства Болгарии.
Содержание BulNet
Категории
По состоянию на 2015 год BulNet содержал более 80 000 синоним наборы, распределенные по девяти частям речи - существительным, глаголам, прилагательным, наречиям, местоимениям, предлоги, союзы, частицы и междометия.
Слова, включенные в BulNet, были отобраны по разным критериям. Основными критериями являются частотный анализ употребления слов в больших корпусах текста и включения синсеты. Синсеты включают те, которые уже представлены в словарях других языков, и синсеты, которые соответствуют часто встречающимся смыслам слов в параллельных корпусах.
Synsets
Каждый синсет кодирует отношение эквивалентности между несколькими лексический элементы - LITERALS (по крайней мере, один должен быть явно представлен в SYNSET), каждый из которых имеет уникальное значение (определяется значением SENSE), которые относятся к одной и той же части речи (заданной как значение POS) и представляют одно и то же лексическое значение (заданное как значение DEF). Каждый набор synset связан со своим аналогом в PWN 3.0 с помощью уникального идентификационного номера - ID. Общие синсеты в балканских языках обозначены как подмножества общих понятий - BCS.
В одноязычный В базе данных набор synset должен быть связан по крайней мере с одним другим набором synset через внутриязыковую связь. Необязательная информация также может быть закодирована, например, примеры использования, стилистические особенности, морфологические или синтаксические свойства, автор и данные последнего редактирования.
Семантические отношения
Большое количество отношений, закодированных в BulNet, эффективно иллюстрирует семантическое и производное богатство языка, которое предлагает разнообразные возможности для многочисленных приложений многоязычной базы данных. BulNet предлагает лингвистические решения на семантическом уровне, такие как варианты выбора синонимов, запросы семантических отношений слова в лексической системе языка (антонимия, холонимия и т. д.), запросы с объяснительным определением и эквиваленты перевода для лексического элемента.
BulNet - это электронный многоязычный словарь наборов синонимов вместе с их пояснительными определениями и наборами семантических отношений с другими словами языка.[1][2]
Гидра
Hydra - это независимая от ОС система, предназначенная для разработки, проверки и исследования Wordnet. Программа позволяет пользователям просматривать и редактировать любое количество одноязычных сетей слов за раз. Отдельные словосочетания синхронизируются, так что эквивалентные наборы синонимов или синсеты могут просматриваться и исследоваться параллельно.[6]
Рекомендации
- ^ а б Коева, С. Деривационные и морфосемантические отношения в болгарском Wordnet. В интеллектуальных информационных системах, XVI, Варшава, Академическое издательство, 2008, 359–389. ISBN 978-83-60434-44-4. «Архивная копия» (PDF). Архивировано из оригинал (PDF) на 2011-07-08. Получено 2015-05-12.CS1 maint: заархивированная копия как заголовок (связь)
- ^ а б Цветана Димитрова, Екатерина Тарпоманова и Борислав Ризов. Справляемся с выводом в болгарском Wordnet. В: Heili Orav, Christiane Fellbaum и Piek Vossen (Eds.) Proceedings of the Seven Global Wordnet Conference, Tartu, Estonia, 2014, pp. 109-117. [1].
- ^ Коева С., Тотков Г., Генов А. В сторону болгарского WordNet. Румынский журнал информационных наук и технологий, Vol. 7, № 1-2, 45-61, 2004. ISSN 1453-8245.
- ^ Коева С. Болгарский WordNet - развитие и перспективы. В Международной конференции «Когнитивное моделирование в лингвистике», Варна, 2005, 270-271.
- ^ Коева, С. Болгарский Wordnet - состояние, применение и перспективы. В болгаро-американских диалогах, Академическое издательство проф. М. Дринова, София, 2010, 120-132. ISBN 978-954-322-383-1.
- ^ Борислав Ризов. Hydra: программная система для Wordnet. В: Heili Orav, Christiane Fellbaum и Piek Vossen (Eds.) Proceedings of the Seven Global Wordnet Conference, Tartu, Estonia, 2014, pp. 142-147. [2].