Богатый язык представления - Rich Representation Language

В Богатый язык представления, часто сокращенно RRL, это компьютерная анимация язык, специально разработанный для облегчения взаимодействия двух или более анимированных персонажей.[1][2][3] Исследование финансировалось Европейская комиссия как часть NECA Project. Структура NECA (Net Environment for Embodied Emotional Conversational Agents), в рамках которой был разработан RRL, была ориентирована не на анимацию фильмов, а на создание интеллектуальных «виртуальных персонажей», которые взаимодействуют внутри виртуальный мир и разговаривать с эмоциональный контент в сочетании с подходящими выражения лица.[3]

RRL был новаторским исследовательским усилием, которое повлияло на дизайн других языков, таких как Язык разметки игрока в котором расширены части конструкции РРЛ.[4] Дизайн языка специально предназначен для уменьшения обучения, необходимого для моделирования взаимодействия нескольких персонажей в виртуальном мире, и для автоматической генерации большей части лицевая анимация так же хорошо как скелетная анимация исходя из содержания разговоров. Из-за взаимозависимости невербальная коммуникация компоненты, такие как черты лица произносимых слов, анимация на языке невозможна без учета контекст сцены в котором происходит анимация - например, гнев против радости.[5]

Проблемы языкового дизайна

Область применения RRL состоит из сцен с двумя или более виртуальными персонажами. Для представления этих сцен требуется несколько типов информации, например позы тела, выражения лица, семантическое содержание смысл разговоров и т. д. Проблема проектирования состоит в том, что часто информация одного типа зависит от информации другого типа, например положение тела, выражение лица и смысловое содержание разговора необходимо согласовывать. Примером может служить то, что в гневном разговоре семантика разговора диктует положение тела и выражения лица, отличные от которых сильно отличаются от радостного разговора. Следовательно, любые команды в языке для управления выражением лица должны по своей сути зависеть от контекста разговора.[3]

Различные типы информации, используемые в RRL, требуют разных форм выражения в пределах языка, например: в то время как семантическая информация представлена грамматики, компонент выражения лица требует примитивов графических манипуляций.[3]

Ключевой целью при разработке RRL была простота разработки, чтобы сделать сцены и конструкцию взаимодействия доступными для пользователей, не обладающих глубокими знаниями программирования. Более того, дизайн был направлен на возможность постепенного развития в естественной форме, чтобы сцены могли быть частично прототипированы, а затем улучшены до более естественного вида визуализации, например через позднее добавление мигания или дыхания.[3]

Описание сцены

Заимствуя театральную терминологию, каждый сеанс взаимодействия между синтетическими персонажами в RRL называется место действия. Описание сцены определяет содержание, время и эмоциональные характеристики, используемые в сцене. Конкретный модуль под названием аффективный рассуждающий вычисляет эмоциональные примитивы вовлеченных в сцену, включая тип и интенсивность эмоций, а также их причины. Аффективный рассуждающий использует измерения эмоций такие как интенсивность и напористость.[3]

Хотя XML используется в качестве базового формата представления, сцены описываются на более высоком уровне в объектно-ориентированной структуре. В этой структуре узлы (то есть объекты) соединяются стрелками или ссылками. Например, сцена - это узел верхнего уровня, связанный с другими. Сцена может иметь три конкретных атрибута: агенты / люди, которые участвуют в сцене, представление дискурса, которое обеспечивает основу для разговоров, и историю, которая записывает временные отношения между различными действиями.[3]

Описания сцен передаются в модуль генерации естественного языка, который производит подходящие предложения. Для создания естественного течения в разговоре требуется высокая степень репрезентативной силы эмоциональных элементов. RRL использует систему представления дискурса, основанную на стандартном методе референты и условия. Аффективный рассуждающий предоставляет подходящую информацию для выбора слов и структур, соответствующих конкретным предложениям.[3]

Синтез речи и эмоциональные маркеры

Компонент синтеза речи сильно зависит от семантической информации и поведения модуля назначения жестов. Компонент синтеза речи должен работать до системы назначения жестов, потому что он включает информацию о времени для произнесенных слов и эмоциональных междометия. После интерпретации произносимого текста на естественном языке этот компонент добавляет просодический структура, такая как ритм, ударение и интонации.[3]

Элементы речи, обогащенные ударением, интонацией и эмоциональными маркерами, передаются в систему определения жестов.[3] RRL поддерживает три отдельных аспекта управления эмоциями. Во-первых, для сцен и конкретных предложений могут быть предусмотрены специальные теги эмоций. Ряд специальных команд поддерживает отображение широкого спектра эмоций на лицах анимированных персонажей.[3]

Во-вторых, есть встроенные механизмы для согласования определенных черт лица с эмоциональными позами тела. В-третьих, определенные эмоциональные междометия, такие как вздохи, зевки, хихиканья и т. Д., Могут чередоваться в действиях для повышения правдоподобности высказываний персонажа.[3]

Назначение жестов и движения тела

В РРЛ термин жест используется в общем смысле и применяется к выражению лица, позе тела и правильным жестам. При назначении жестов обрабатываются три уровня информации:[3]

  • Назначение определенных жестов в сцене определенным модулям, например "по очереди "обрабатываются в модуле генерации естественного языка.
  • Уточнение и проработка задания жестов после синтеза речи первого уровня, например добавление к разговору моргания и дыхания.
  • Интерфейс для внешних модулей, которые обрабатывают рендеринг для конкретного игрока, например MPEG-4 Параметры анимации лица (ФАПы).

Система присвоения жестов имеет определенные типы жестов, такие как движения тела (например, пожатие плечами как безразличие против опущенных плеч грусти), символические движения (жесты, которые условно сигнализируют да / нет), иконические (например, имитация телефона с помощью пальцев), дейктические (показывающие жесты), контраст (например, с одной стороны, но с другой стороны), черты лица (например, приподнятые брови, хмурый взгляд, удивление или пристальный взгляд).[3]

Смотрите также

Рекомендации

  1. '^ Интеллектуальные виртуальные агенты: 6-я международная рабочая конференция Джонатан Мэтью Грэтч 2006 ISBN  3-540-37593-7 стр. 221
  2. ^ Управляемая данными 3D-анимация лица Автор: Чжиган Дэн, Ульрих Нойман, 2007 г. ISBN  1-84628-906-8 стр.54
  3. ^ а б c d е ж грамм час я j k л м п P. Piwek, et. аль RRL: расширенный язык представления для описания поведения агентов в "Протоколах семинара AAMAS-02 по воплощенным разговорным агентам", 16 июля 2002 г., Болонья, Италия.
  4. ^ Технологии интерактивного цифрового повествования и развлечений Стефан Гёбель, 2004 г. ISBN  3-540-22283-9 стр. 83
  5. ^ Интерактивное повествование: Первая совместная международная конференция, под редакцией Ульрике Спирлинг, Николас Силас, 2008 г. ISBN  3-540-89424-1 стр.93