Государственный наблюдатель - Википедия - State observer

В теория управления, а государственный наблюдатель это система, которая дает оценку внутреннее состояние данной реальной системы, из измерений Вход и вывод реальной системы. Обычно он реализуется на компьютере и служит основой для многих практических приложений.

Знание состояния системы необходимо для решения многих теория управления проблемы; например, стабилизация системы с помощью государственная обратная связь. В большинстве практических случаев физическое состояние системы не может быть определено прямым наблюдением. Вместо этого через выходные сигналы системы наблюдаются косвенные эффекты внутреннего состояния. Простым примером является транспорт в туннеле: скорости и скорости, с которыми транспортные средства входят в туннель и покидают его, можно наблюдать напрямую, но точное состояние внутри туннеля можно только оценить. Если система наблюдаемый, можно полностью восстановить состояние системы по ее выходным измерениям с помощью наблюдателя состояния.

Типичная модель наблюдателя

Линейные, скользящие режимы и кубические наблюдатели входят в число нескольких структур наблюдателей, используемых для оценки состояния линейных систем. Структура линейного наблюдателя описана в следующих разделах.

Случай с дискретным временем

Предполагается, что состояние линейной, неизменной во времени физической системы с дискретным временем удовлетворяет

где в то время , состояние растения; это его входы; и это его выходы. Эти уравнения просто говорят, что текущие выходы предприятия и его будущее состояние определяются исключительно его текущими состояниями и текущими входами. (Хотя эти уравнения выражаются через дискретный шагов по времени, очень похожие уравнения верны для непрерывный системы). Если эта система наблюдаемый затем выход завода, , можно использовать для управления состоянием наблюдателя.

Модель наблюдателя физической системы затем обычно выводится из приведенных выше уравнений. Могут быть включены дополнительные условия, чтобы гарантировать, что при получении последовательных измеренных значений входов и выходов объекта состояние модели сходится к состоянию объекта. В частности, выходные данные наблюдателя могут быть вычтены из выходных данных объекта, а затем умножены на матрицу ; затем это добавляется к уравнениям состояния наблюдателя для получения так называемого Люенбергер наблюдатель, определяемый уравнениями ниже. Обратите внимание, что переменные наблюдателя состояния обычно обозначаются «шляпой»: и чтобы отличить их от переменных уравнений, которым удовлетворяет физическая система.

Наблюдатель называется асимптотически устойчивым, если ошибка наблюдателя сходится к нулю, когда . Для наблюдателя Люенбергера ошибка наблюдателя удовлетворяет . Таким образом, наблюдатель Люенбергера для этой системы с дискретным временем асимптотически устойчив, когда матрица имеет все собственные значения внутри единичной окружности.

Для целей управления выход системы наблюдателя возвращается на вход наблюдателя и объекта через матрицу коэффициентов усиления. .

Уравнения наблюдателя становятся:

или, проще говоря,

Из-за принцип разделения мы знаем, что можем выбирать и самостоятельно без ущерба для общей стабильности систем. Как правило, полюса наблюдателя обычно выбираются так, чтобы сходиться в 10 раз быстрее полюсов системы .

Случай непрерывного времени

Предыдущий пример был для наблюдателя, реализованного в системе LTI с дискретным временем. Однако процесс аналогичен для случая непрерывного времени; наблюдатель получает выбраны так, чтобы динамика ошибок в непрерывном времени асимптотически сходилась к нулю (т. е. когда это Матрица Гурвица ).

Для линейной системы с непрерывным временем

куда , наблюдатель похож на описанный выше случай дискретного времени:

.

Ошибка наблюдателя удовлетворяет уравнению

.

Собственные значения матрицы может быть выбран произвольно путем соответствующего выбора усиления наблюдателя когда пара наблюдается, т.е. наблюдаемость условие выполнено. В частности, это может быть сделано Гурвицем, поэтому ошибка наблюдателя когда .

Пикинг и другие методы наблюдателя

Когда наблюдатель получает высокий, линейный наблюдатель Люенбергера очень быстро сходится к состояниям системы. Однако высокое усиление наблюдателя приводит к явлению обострения, при котором начальная ошибка оценки может быть недопустимо большой (т. Е. Непрактичной или небезопасной для использования).[1] Как следствие, доступны нелинейные методы наблюдения с высоким коэффициентом усиления, которые быстро сходятся без явления обострения. Например, управление скользящим режимом может быть использован для разработки наблюдателя, который сводит одну оценочную ошибку состояния к нулю за конечное время даже при наличии ошибки измерения; другие состояния имеют ошибку, которая ведет себя аналогично ошибке наблюдателя Люенбергера после того, как пиковое значение утихло. Наблюдатели в скользящем режиме также обладают привлекательными свойствами устойчивости к шуму, похожими на Фильтр Калмана.[2][3]Другой подход заключается в применении нескольких наблюдателей, что значительно улучшает переходные процессы и снижает выбросы наблюдателя. Многократный наблюдатель может быть адаптирован к любой системе, в которой применяется High Gain Observer.[4]Кубические наблюдатели[5] предлагаются также для улучшения качества наблюдения. Эти наблюдатели содержат кубический член в динамике ошибки оценки. Кубический наблюдатель может использоваться для уменьшения явления пика и повышения качества наблюдателя. Кубический наблюдатель описывается следующими уравнениями:

Динамика ошибки оценки этого наблюдателя описывается следующим образом:

Динамика ошибки оценивания будет устойчивой, если существует положительно определенная симметричная матрица удовлетворение:

Матрица можно выбрать как . Такой выбор гарантирует устойчивость и однозначность происхождения как точки равновесия динамики ошибки оценивания.

Государственные наблюдатели для нелинейных систем

Наблюдатели с высоким коэффициентом усиления, скользящий режим и расширенные наблюдатели являются наиболее распространенными наблюдателями для нелинейных систем. Чтобы проиллюстрировать применение наблюдателей скользящего режима для нелинейных систем, сначала рассмотрим нелинейную систему без входа:

куда . Также предположим, что есть измеримый выход данный

Существует несколько не приближенных подходов к конструированию наблюдателя. Приведенные ниже два наблюдателя также применимы к случаю, когда система имеет вход. То есть,

.

Линеаризуемая динамика ошибок

Одно предложение Кренера и Исидори[6] и Кренер и Репдек[7] может применяться в ситуации, когда существует линеаризующее преобразование (т. е. диффеоморфизм, как тот, который используется в линеаризация обратной связи ) так что в новых переменных уравнения системы читаются

Тогда наблюдатель Люенбергера имеет вид

.

Ошибка наблюдателя для преобразованной переменной удовлетворяет тому же уравнению, что и в классическом линейном случае.

.

Как показали Готье, Хаммури и Осман[8]и Хаммури и Киннарт,[9] если существует преобразование такая, что система может быть преобразована к виду

тогда наблюдатель оформлен как

,

куда является изменяющимся во времени усилением наблюдателя.

Чиккарелла, Далла Мора и Джермани[10] получили более продвинутые и общие результаты, устраняя необходимость в нелинейном преобразовании и доказывая глобальную асимптотическую сходимость оцениваемого состояния к истинному состоянию, используя только простые предположения о регулярности.

Наблюдатель в скользящем режиме

Как обсуждалось выше для линейного случая, явление пика, присутствующее у наблюдателей Люенбергера, оправдывает использование наблюдатель скользящего режима. Наблюдатель скользящего режима использует нелинейную обратную связь с высоким коэффициентом усиления, чтобы приводить оценочные состояния в гиперповерхность где нет разницы между расчетным и измеренным выходом. Нелинейное усиление, используемое в наблюдателе, обычно реализуется с помощью масштабированной функции переключения, например сигнум (т. е. sgn) оцениваемой - измеренной выходной ошибки. Следовательно, из-за этой обратной связи с высоким коэффициентом усиления векторное поле наблюдателя имеет складку, так что траектории наблюдателя скользить по кривая, на которой расчетный выход в точности соответствует измеренному. Итак, если система наблюдаемый на выходе все состояния наблюдателя будут переведены в фактические состояния системы. Кроме того, при использовании знака ошибки для управления наблюдателем скользящего режима траектории наблюдателя становятся нечувствительными ко многим видам шума. Следовательно, некоторые наблюдатели скользящего режима обладают привлекательными свойствами, аналогичными свойствам Фильтр Калмана но с более простой реализацией.[2][3]

По предположению Дракунова,[11] а наблюдатель скользящего режима также может быть разработан для класса нелинейных систем. Такого наблюдателя можно записать в терминах исходной оценки переменной и имеет вид

куда:

  • В вектор расширяет скаляр сигнум функция к размеры. То есть,
для вектора .
  • Вектор имеет компоненты, которые являются функцией вывода и его повторяющиеся производные Ли. Особенно,
куда это яth Производная Ли выходной функции вдоль векторного поля (т.е. вдоль траектории нелинейной системы). В особом случае, когда система не имеет ввода или имеет относительная степень из п, это коллекция вывода и это производные. Потому что обратное Линеаризация якобиана из должен существовать, чтобы этот наблюдатель был хорошо определен, преобразование гарантированно будет местным диффеоморфизм.
где для каждого , элемент и достаточно большой, чтобы обеспечить доступность скользящего режима.
  • Вектор наблюдателя таково, что
куда вот нормальный сигнум функция определен для скаляров, и обозначает «оператор эквивалентного значения» разрывной функции в скользящем режиме.

Кратко эту идею можно пояснить следующим образом. Согласно теории скользящих режимов, для описания поведения системы после запуска скользящего режима функция следует заменить эквивалентными значениями (см. эквивалентный контроль в теории скользящие режимы ). На практике он переключается (дребезжит) с высокой частотой, при этом медленная составляющая равна эквивалентному значению. Применяя соответствующий фильтр нижних частот, чтобы избавиться от высокочастотной составляющей, можно получить значение эквивалентного управления, которое содержит больше информации о состоянии оцениваемой системы. Описанный выше наблюдатель использует этот метод несколько раз для получения идеального состояния нелинейной системы за конечное время.

Модифицированная ошибка наблюдения может быть записана в преобразованных состояниях . Особенно,

и так

Так:

  1. Так долго как , первая строка динамики ошибки, , будет соответствовать достаточным условиям для входа в скользящий режим за конечное время.
  2. Вдоль поверхность, соответствующая эквивалентный контроль будет равен , и так . Следовательно, пока , вторая строка динамики ошибки, , войдет в скользящий режим за конечное время.
  3. Вдоль поверхность, соответствующая эквивалентный контроль будет равен . Следовательно, пока , то th строка динамики ошибки, , войдет в скользящий режим за конечное время.

Итак, при достаточно большом В результате все оцененные наблюдателем состояния достигают фактических состояний за конечное время. Фактически, увеличение позволяет сходимость за любое желаемое конечное время, пока каждый функция может быть ограничена с уверенностью. Следовательно, требование, чтобы отображение это диффеоморфизм (т.е. что его Линеаризация якобиана является обратимым) утверждает, что сходимость оцененного выхода подразумевает сходимость оцененного состояния. То есть требование является условием наблюдаемости.

В случае наблюдателя скользящего режима для системы с входом необходимы дополнительные условия, чтобы ошибка наблюдения не зависела от входа. Например, что

не зависит от времени. Тогда наблюдатель

Мульти наблюдатель

Множественный наблюдатель расширяет структуру High Gain Observer с одного до нескольких наблюдателей, при этом многие модели работают одновременно. Он состоит из двух уровней: первый состоит из нескольких наблюдателей с высоким коэффициентом усиления с разными состояниями оценки, а второй определяет веса важности наблюдателей первого уровня. Алгоритм прост в реализации и не содержит рискованных операций вроде дифференцирования.[4] Идея множественных моделей ранее применялась для получения информации в адаптивном управлении.[12]

Предположим, что число Наблюдателей с высоким коэффициентом усиления равно n + 1.

куда - индекс наблюдателя. Наблюдатели первого уровня имеют такое же усиление но они отличаются начальным состоянием . Во втором слое все из наблюдатели объединяются в одного для получения единой оценки вектора состояния

куда весовые коэффициенты. Эти коэффициенты изменяются, чтобы обеспечить оценку на втором уровне и улучшить процесс наблюдения.

Предположим, что

и

куда это некоторый вектор, который зависит от ошибка наблюдателя .

Некоторые преобразования сводятся к задаче линейной регрессии

Эта формула дает возможность оценить . Для построения многообразия нам понадобится отображение между и гарантия того, что вычисляется на основе измеряемых сигналов. Первым делом необходимо устранить явление парковки для от ошибки наблюдателя

.

Рассчитать временная производная от найти отображение m привести к определяется как

куда - некоторая постоянная времени. Обратите внимание, что реле на обоих и его интегралы, следовательно, легко доступны в системе управления. Дальше определяется оценочным законом; и тем самым доказывает, что многообразие измеримо. Во втором слое за вводится как оценки коэффициенты. Ошибка отображения указывается как

куда . Если коэффициенты равны , то ошибка отображения Теперь можно рассчитать из приведенного выше уравнения и, следовательно, явление обострения уменьшено благодаря свойствам коллектора. Созданное отображение дает большую гибкость в процессе оценки. Даже можно оценить стоимость во втором слое и для расчета состояния .[4]

Ограничивающие наблюдатели

Граница[13] или интервальные наблюдатели[14][15] представляют собой класс наблюдателей, которые обеспечивают две оценки состояния одновременно: одна из оценок обеспечивает верхнюю границу реального значения состояния, а вторая дает нижнюю границу. Тогда известно, что реальная ценность государства всегда находится в пределах этих двух оценок.

Эти оценки очень важны для практических приложений,[16][17] поскольку они позволяют каждый раз узнавать точность оценки.

Математически можно использовать двух наблюдателей Люенбергера, если правильно выбран, используя, например, позитивные системы характеристики:[18] один для верхней границы (это гарантирует, что сходится к нулю сверху, когда , при отсутствии шума и неуверенность ), а нижняя оценка (это гарантирует, что сходится к нулю снизу). То есть всегда

Смотрите также

Рекомендации

Встроенные ссылки
  1. ^ Халил, Х.К. (2002), Нелинейные системы (3-е изд.), Верхняя Сэдл-Ривер, Нью-Джерси: Prentice Hall, ISBN  978-0-13-067389-3
  2. ^ а б Уткин, Вадим; Гульднер, Юрген; Ши, Цзинсинь (1999), Управление скользящим режимом в электромеханических системах, Филадельфия, Пенсильвания: Taylor & Francis, Inc., ISBN  978-0-7484-0116-1
  3. ^ а б Дракунов, С.В. (1983), «Адаптивный квазиоптимальный фильтр с разрывными параметрами», Автоматизация и дистанционное управление, 44 (9): 1167–1175
  4. ^ а б c Bernat, J .; Степьен, С. (2015), «Мульти-моделирование как новая схема оценки для наблюдателей с высоким коэффициентом усиления», Международный журнал контроля, 88 (6): 1209–1222, Bibcode:2015IJC .... 88.1209B, Дои:10.1080/00207179.2014.1000380, S2CID  8599596
  5. ^ Поделиться Pasand MM. Кубические наблюдатели типа Люенбергера для оценки состояния линейных систем. Int J Адаптировать процесс сигнала управления. 2020; 1–14. https://doi.org/10.1002/acs.3125
  6. ^ Krener, A.J .; Исидори, Альберто (1983), "Линеаризация путем ввода вывода и нелинейных наблюдателей", Системные и контрольные письма, 3: 47–52, Дои:10.1016/0167-6911(83)90037-3
  7. ^ Krener, A.J .; Respondek, W. (1985), "Нелинейные наблюдатели с линеаризуемой динамикой ошибок", SIAM Journal по управлению и оптимизации, 23 (2): 197–216, Дои:10.1137/0323016
  8. ^ Gauthier, J.P .; Hammouri, H .; Осман, С. (1992), "Простой наблюдатель для приложений нелинейных систем к биореакторам", IEEE Transactions по автоматическому контролю, 37 (6): 875–880, Дои:10.1109/9.256352
  9. ^ Hammouri, H .; Киннарт, М. (1996), "Новая процедура изменяющейся во времени линеаризации вплоть до ввода вывода", Системные и контрольные письма, 28 (3): 151–157, Дои:10.1016/0167-6911(96)00022-9
  10. ^ Ciccarella, G .; Далла Мора, М .; Германи, А. (1993), "Наблюдатель типа Люенбергера для нелинейных систем", Международный журнал контроля, 57 (3): 537–556, Дои:10.1080/00207179308934406
  11. ^ Дракунов, С.В. (1992), «Наблюдатели скользящего режима на основе эквивалентного метода контроля», Материалы 31-й конференции IEEE по решениям и контролю (CDC) (Тусон, Аризона, 16–18 декабря): 2368–2370, Дои:10.1109 / CDC.1992.371368, ISBN  978-0-7803-0872-5, S2CID  120072463
  12. ^ Narendra, K.S .; Хан, З. (август 2012 г.). «Новый подход к адаптивному управлению с использованием нескольких моделей». Международный журнал адаптивного управления и обработки сигналов. 26 (8): 778–799. Дои:10.1002 / acs.2269. ISSN  1099-1115.
  13. ^ http://www.nt.ntnu.no/users/skoge/prost/proceedings/ecc03/pdfs/437.pdf
  14. ^ http://www.nt.ntnu.no/users/skoge/prost/proceedings/cdc-2008/data/papers/1446.pdf
  15. ^ https://hal.archives-ouvertes.fr/hal-01276439/
  16. ^ http://www.iaeng.org/publication/WCE2010/WCE2010_pp656-661.pdf
  17. ^ Хадж-Садок, М.З .; Gouzé, J.L. (2001). «Оценка неопределенных моделей процессов активного ила с интервальными наблюдателями». Журнал управления процессами. 11 (3): 299–310. Дои:10.1016 / S0959-1524 (99) 00074-8.
  18. ^ Айт Рами, М., Тадео, Ф., Хельмке, У. (2011), «Положительные наблюдатели для линейных положительных систем и их значение», Международный журнал контроля 84
Общие ссылки
  • Зонтаг, Эдуардо (1998), Математическая теория управления: детерминированные конечномерные системы. Второе издание, Спрингер, ISBN  978-0-387-98489-6