Разбирать чаще - Parse thicket
![]() | Эта статья нужны дополнительные цитаты для проверка.Ноябрь 2013) (Узнайте, как и когда удалить этот шаблон сообщения) ( |
А разбирать чаще график, представляющий синтаксический структура абзаца текста в обработка естественного языка. Чаща разбора включает дерево синтаксического анализа для каждого предложения этого абзаца плюс несколько дуг для других отношений между словами, кроме синтаксических.[1] Чащи анализа могут быть построены как для деревьев синтаксического анализа округов, так и для деревьев разбора зависимостей. Отношения, которые связывают деревья синтаксического анализа в зарослях синтаксического анализа:[2]
- Coreferences;
- Тот же объект / подобъект / супер-объект;
- Риторическая структура и др. дискурсивное отношение;
- Речевой акт основанные на отношениях.
Чтобы оценить сходство между текстами, такими как вопрос и его варианты ответов, можно обобщить схемы синтаксического анализа. [3]
На изображении чаще всего сопоставления и связи сущность-сущность показаны сплошным красным цветом, а отношения риторика / речевой акт показаны пунктирным красным. Используется анализатор ETAP и программа визуализации дерева.[4]
![](http://upload.wikimedia.org/wikipedia/commons/thumb/c/c9/Parse_thicket_constructed_from_parse_trees_for_sentences.jpg/220px-Parse_thicket_constructed_from_parse_trees_for_sentences.jpg)
Чтобы вычислить обобщение двух зарослей синтаксического анализа, необходимо найти их максимально общий подграфик (подгруппу).[5]
![](http://upload.wikimedia.org/wikipedia/commons/thumb/0/0a/Matching_two_parse_thickets.jpg/220px-Matching_two_parse_thickets.jpg)
![](http://upload.wikimedia.org/wikipedia/commons/thumb/8/8d/Matching_of_parse_thicket_for_answer_and_question.jpg/220px-Matching_of_parse_thicket_for_answer_and_question.jpg)
Рекомендации
- ^ Галицкий Б, Кузнецов С.О., Усиков Д.А. Анализировать представление зарослей для поиска по нескольким предложениям. Конспект лекций по информатике. 2013;7735:1072-1091. Дои:10.1007/978-3-642-35786-2_12.
- ^ Галицкий Б, Ильвовский Д, Кузнецов С.О., Строк Ф. Соответствующие наборы деревьев синтаксического анализа для ответов на вопросы, состоящие из нескольких предложений. Последние достижения в обработке естественного языка. 2013.
- ^ Галицкий Б. Машинное обучение синтаксических деревьев разбора для поиска и классификации текста. Инженерные приложения искусственного интеллекта. 2013;26(3):153-172. Дои:10.1016 / j.engappai.2012.09.017.
- ^ Богуславский И., Иомдин Л., Сизов В. Интерактивное преобразование с помощью системы ЭТАП-3. Культура, язык и информационные технологии. 2003.
- ^ Галицкий Б., Ильвовский Д., Кузнецов С.О., Строк Ф. Нахождение максимальных общих зарослей подпарсинга для поиска по нескольким предложениям. Конспект лекций по искусственному интеллекту. 2013;8323.
внешняя ссылка
- [Кодовая страница Google https://code.google.com/p/relevance-based-on-parse-trees/ ]
- [Стэнфордское НЛП http://nlp.stanford.edu/ ]
- [Компонент подобия OpenNLP https://issues.apache.org/jira/browse/OPENNLP/component/12316412 ]