ROUGE (метрическая система) - ROUGE (metric)
РУЖ, или же Ориентированный на отзыв дублер для оценки листинга,[1] представляет собой набор показателей и программный пакет, используемый для оценки автоматическое обобщение и машинный перевод программное обеспечение в обработка естественного языка. Показатели сравнивают автоматически созданное резюме или перевод со ссылкой или набором ссылок (созданных человеком), резюме или перевод.
Метрики
Доступны следующие пять показателей оценки.
- ROUGE-N: перекрытие N-граммов[2] между системным и справочным сводками.
- ROUGE-1 относится к перекрытию униграмма (каждое слово) между системным и справочным сводками.
- ROUGE-2 относится к перекрытию биграммы между системным и справочным сводками.
- ROUGE-L: самая длинная общая подпоследовательность (LCS)[3] на основе статистики. Самая длинная общая проблема подпоследовательности естественным образом учитывает схожесть структуры на уровне предложений и автоматически определяет наиболее длинные совпадения в последовательности n-граммов.
- ROUGE-W: взвешенная статистика на основе LCS, которая поддерживает последовательные LCS.
- ROUGE-S: Пропустить-биграмма[4] основанная на статистике совместной встречаемости. Пропустить-биграмму - это любая пара слов в порядке их предложения.
- ROUGE-SU: статистика совместной встречаемости на основе скип-биграмм и униграммы.
Смотрите также
- BLEU
- F-мера
- МЕТЕОР
- NIST (метрическая система)
- Разделение имен существительных
- Коэффициент ошибок в словах (WER)
Рекомендации
- ^ Линь, Чин-Ю. 2004. ROUGE: Пакет для автоматической оценки резюме. В материалах семинара по ветвям обобщения текстов (WAS 2004), Барселона, Испания, 25-26 июля 2004 г.
- ^ Линь, Чин-Ю и Э. Hovy 2003. Автоматическая оценка сводок с использованием статистики совпадения N-грамм. В материалах конференции языковых технологий 2003 г. (HLT-NAACL 2003), Эдмонтон, Канада, 27 мая - 1 июня 2003 г.
- ^ Лин, Чин-Ю и Франц Йозеф Оч. 2004a. Автоматическая оценка качества машинного перевода с использованием статистики самой длинной общей подпоследовательности и пропускной биграммы. В материалах 42-го ежегодного собрания Ассоциации компьютерной лингвистики (ACL 2004), Барселона, Испания, 21–26 июля 2004 г.
- ^ Лин, Чин-Ю и Франц Йозеф Оч. 2004a. Автоматическая оценка качества машинного перевода с использованием статистики самой длинной общей подпоследовательности и пропускной биграммы. В материалах 42-го ежегодного собрания Ассоциации компьютерной лингвистики (ACL 2004), Барселона, Испания, 21–26 июля 2004 г.