ROUGE (метрическая система) - ROUGE (metric)

РУЖ, или же Ориентированный на отзыв дублер для оценки листинга,[1] представляет собой набор показателей и программный пакет, используемый для оценки автоматическое обобщение и машинный перевод программное обеспечение в обработка естественного языка. Показатели сравнивают автоматически созданное резюме или перевод со ссылкой или набором ссылок (созданных человеком), резюме или перевод.

Метрики

Доступны следующие пять показателей оценки.

  • ROUGE-N: перекрытие N-граммов[2] между системным и справочным сводками.
    • ROUGE-1 относится к перекрытию униграмма (каждое слово) между системным и справочным сводками.
    • ROUGE-2 относится к перекрытию биграммы между системным и справочным сводками.
  • ROUGE-L: самая длинная общая подпоследовательность (LCS)[3] на основе статистики. Самая длинная общая проблема подпоследовательности естественным образом учитывает схожесть структуры на уровне предложений и автоматически определяет наиболее длинные совпадения в последовательности n-граммов.
  • ROUGE-W: взвешенная статистика на основе LCS, которая поддерживает последовательные LCS.
  • ROUGE-S: Пропустить-биграмма[4] основанная на статистике совместной встречаемости. Пропустить-биграмму - это любая пара слов в порядке их предложения.
  • ROUGE-SU: статистика совместной встречаемости на основе скип-биграмм и униграммы.

Смотрите также

Рекомендации

  1. ^ Линь, Чин-Ю. 2004. ROUGE: Пакет для автоматической оценки резюме. В материалах семинара по ветвям обобщения текстов (WAS 2004), Барселона, Испания, 25-26 июля 2004 г.
  2. ^ Линь, Чин-Ю и Э. Hovy 2003. Автоматическая оценка сводок с использованием статистики совпадения N-грамм. В материалах конференции языковых технологий 2003 г. (HLT-NAACL 2003), Эдмонтон, Канада, 27 мая - 1 июня 2003 г.
  3. ^ Лин, Чин-Ю и Франц Йозеф Оч. 2004a. Автоматическая оценка качества машинного перевода с использованием статистики самой длинной общей подпоследовательности и пропускной биграммы. В материалах 42-го ежегодного собрания Ассоциации компьютерной лингвистики (ACL 2004), Барселона, Испания, 21–26 июля 2004 г.
  4. ^ Лин, Чин-Ю и Франц Йозеф Оч. 2004a. Автоматическая оценка качества машинного перевода с использованием статистики самой длинной общей подпоследовательности и пропускной биграммы. В материалах 42-го ежегодного собрания Ассоциации компьютерной лингвистики (ACL 2004), Барселона, Испания, 21–26 июля 2004 г.

внешняя ссылка