Компьютерное рецензирование - Computer-assisted reviewing
Эта статья не цитировать любой источники.Сентябрь 2008 г.) (Узнайте, как и когда удалить этот шаблон сообщения) ( |
Компьютерное рецензирование (МАШИНА) инструменты - это части программного обеспечения, основанные на сравнении и анализе текста. алгоритмы. Эти инструменты фокусируются на различиях между двумя документами, принимая во внимание особенности каждого документа. шрифт с помощью интеллектуального анализа.
Обнаружение различий
Интеллектуальный анализ, используемый инструментами CAR, обнаруживает, что различия не имеют одинакового значения в зависимости от их типа и / или поля / темы документа. Например, разница в номере не одинакова, если этот номер представляет собой дату, цену, номер страницы, номер цифры, часть адреса, сноску, номер пункта списка, номер заголовка и т. Д. .
- различие номера заголовка или номера элемента списка может не представлять интереса, если эти числа будут пересчитаны позже перед печатью или публикацией с помощью инструмента обработки текста,
- небольшая разница в числах, например, от «1» до «единицы» или от «1» до «1», часто представляет второстепенный интерес, в зависимости от темы и области документа.
- в то время как некоторые другие различия в числах могут сильно повредить документу.
Эти инструменты интересны в различных приложениях:
- сравнение документа и его обновленной / измененной версии. Основная цель состоит в том, чтобы выделить изменения, внесенные третьим лицом или программой обработки текста.
- сравнение редактируемого документа двух форматов файлов: Слово, ТЕКСТ, PDF, HTML, XML. Основная цель - выделить различия, связанные с изменением формата или программным обеспечением преобразования / переформатирования. Часто проблемы с простым преобразованием кодировки символов могут стать причиной катастрофы.
Для перевода
Инструменты компьютерного рецензирования для перевода (CART) - это инструменты CAR, которые позволяют проводить многоязычные сравнения. Это подразумевает возможность сопоставления каждой части текста из одного документа с другим, принимая во внимание специфику каждого языка: форматы даты / чисел, знаки препинания (например, Французский /английский кавычки ) и т. д. Лучшие инструменты CART способны находить соответствия между существительными или глагольными группами, что подразумевает поиск терминологических и синтаксических элементов с помощью лингвистических анализаторов.
Примеры применения
- Автор книги обновляет свой документ (часто в формате Word), пока он получает корректуру принтера (часто в формате PDF) или перевод на другой язык.
- Контент-менеджер веб-сайта, который должен обеспечивать согласованность обновлений и версий своих HTML-страниц на разных языках.
- Принтер, который должен обеспечивать согласованность и качество своего процесса, возможно, с использованием проприетарных форматов XML / SGML, некоторых автоматических обработок, возможных ручных вмешательств, выполняемых им самим или субподрядчиком.
- Редактор, через который проходят документы от всех участников.
- В MediaWiki "история" на каждой странице - это АВТОМОБИЛЬНЫЙ инструмент