Идентифицируемость - Identifiability

В статистика, идентифицируемость это свойство, которое модель должен удовлетворять для точного вывод быть возможным. Модель идентифицируемый если теоретически возможно узнать истинные значения основных параметров этой модели после получения из нее бесконечного числа наблюдений. Математически это равносильно утверждению, что разные значения параметров должны генерировать разные распределения вероятностей наблюдаемых переменных. Обычно модель идентифицируема только при определенных технических ограничениях, и в этом случае набор этих требований называется условия идентификации.

Модель, которую невозможно идентифицировать, называется неидентифицируемый или же неидентифицируемый: два или более параметризации находятся наблюдательно эквивалентный. В некоторых случаях, даже если модель не идентифицируема, все же возможно узнать истинные значения определенного подмножества параметров модели. В этом случае мы говорим, что модель частично идентифицируемый. В других случаях можно узнать местоположение истинного параметра до определенной конечной области пространства параметров, и в этом случае модель установить идентифицируемый.

Помимо строго теоретического исследования свойств модели, идентифицируемость можно рассматривать в более широком контексте, когда модель тестируется с экспериментальными наборами данных, используя анализ идентифицируемости.[1]

Определение

Позволять быть статистическая модель где пространство параметров либо конечномерна, либо бесконечномерна. Мы говорим что является идентифицируемый если отображение является один к одному:[2]

Это определение означает, что различные значения θ должны соответствовать различным распределениям вероятностей: если θ1θ2, то также пθ1пθ2.[3] Если распределения определены в терминах функции плотности вероятности (pdfs), то два pdf-файла следует считать разными, только если они различаются по набору ненулевой меры (например, две функции ƒ1(Икс) = 10 ≤ Икс < 1 и ƒ2(Икс) = 10 ≤ Икс ≤ 1 отличаются только в одной точке Икс = 1 - набор мера ноль - и поэтому не могут рассматриваться как отдельные файлы PDF).

Идентифицируемость модели в смысле обратимости карты эквивалентно возможности узнать истинный параметр модели, если модель можно наблюдать бесконечно долго. Действительно, если {Икст} ⊆ S - последовательность наблюдений из модели, то по сильный закон больших чисел,

для каждого измеримого множества А ⊆ S (здесь 1{...} это индикаторная функция ). Таким образом, с бесконечным количеством наблюдений мы сможем найти истинное распределение вероятностей п0 в модели, и поскольку условие идентифицируемости выше требует, чтобы карта быть обратимым, мы также сможем найти истинное значение параметра, который сгенерировал данное распределениеп0.

Примеры

Пример 1

Позволять быть нормальный семья в масштабе местности:

потом

Это выражение равно нулю почти для всех Икс только когда все его коэффициенты равны нулю, что возможно только при |σ1| = |σ2| и μ1 = μ2. Поскольку в параметре масштаба σ ограничено, чтобы быть больше нуля, мы заключаем, что модель идентифицируема: ƒθ1 = ƒθ2θ1 = θ2.

Пример 2

Позволять быть стандартом модель линейной регрессии:

(где 'обозначает матрицу транспонировать ). Тогда параметр β идентифицируема тогда и только тогда, когда матрица обратимо. Таким образом, это условие идентификации в модели.

Пример 3

Предполагать классический ошибки в переменных линейная модель:

куда (ε,η,Икс*) являются совместно нормальными независимыми случайными величинами с нулевым математическим ожиданием и неизвестными дисперсиями, и только переменные (Икс,у) наблюдаются. Тогда эта модель не идентифицируется,[4] только произведение βσ² есть (где σ² это дисперсия скрытого регрессора Икс*). Это тоже пример установить идентифицируемый модель: хотя точное значение β невозможно узнать, мы можем гарантировать, что он должен лежать где-то в интервале (βyx, 1÷βху), куда βyx коэффициент при OLS регресс у на Икс, и βху коэффициент регрессии OLS Икс на у.[5]

Если мы откажемся от предположения о нормальности и потребуем, чтобы Икс* мы нет нормально распределенный, сохраняя только условие независимости ε ⊥ η ⊥ Икс*, то модель становится идентифицируемой.[4]

Программного обеспечения

В случае оценки параметров в частично наблюдаемых динамических системах вероятность профиля может также использоваться для структурного и практического анализа идентифицируемости.[6] Реализация [1] доступен в MATLAB Toolbox Гончарный круг.

Смотрите также

Рекомендации

Цитаты

  1. ^ Raue, A .; Kreutz, C .; Maiwald, T .; Bachmann, J .; Шиллинг, М .; Klingmuller, U .; Тиммер, Дж. (1 августа 2009 г.). «Структурный и практический анализ идентифицируемости частично наблюдаемых динамических моделей с использованием вероятности профиля». Биоинформатика. 25 (15): 1923–1929. Дои:10.1093 / биоинформатика / btp358. PMID  19505944.
  2. ^ Леманн и Казелла 1998, Определение 1.5.2
  3. ^ ван дер Ваарт 1998, п. 62
  4. ^ а б Reiersøl 1950
  5. ^ Казелла и Бергер 2001, п. 583
  6. ^ Рауэ, А; Kreutz, C; Maiwald, T; Бахманн, Дж; Шиллинг, М; Klingmüller, U; Тиммер, Дж (2009), «Структурный и практический анализ идентифицируемости частично наблюдаемых динамических моделей с использованием вероятности профиля», Биоинформатика, 25 (15): 1923–9, Дои:10.1093 / биоинформатика / btp358, PMID  19505944, заархивировано из оригинал 13 января 2013 г.

Источники

дальнейшее чтение

  • Вальтер, Э.; Пронзато, Л. (1997), Идентификация параметрических моделей по экспериментальным данным., Springer

Эконометрика