Доверительный регион - Confidence region

В статистика, а область доверия является многомерным обобщением доверительный интервал. Это набор точек в п-мерное пространство, часто представляемое как эллипсоид вокруг точки, которая является приблизительным решением проблемы, хотя могут встречаться и другие формы.

Интерпретация

Доверительный интервал вычисляется таким образом, что если бы набор измерений повторялся много раз и доверительный интервал вычислялся бы одинаково для каждого набора измерений, то в определенном процентном соотношении (например, 95%) доверительный интервал был бы включите точку, представляющую "истинные" значения набора оцениваемых переменных. Однако если определенные предположения о априорные вероятности сделаны, это делает нет означает, что при вычислении одной доверительной области существует 95% -ная вероятность того, что "истинные" значения лежат внутри области, поскольку мы не предполагаем какого-либо конкретного распределения вероятностей "истинных" значений, и мы можем иметь или не иметь другая информация о том, где они могут солгать.

Случай независимых, одинаково нормально распределенных ошибок

Предположим, мы нашли решение к следующей переопределенной проблеме:

где Y является п-мерный вектор-столбец, содержащий наблюдаемые значения зависимая переменная, Икс является п-от-п матрица наблюдаемых значений независимые переменные (которая может представлять физическую модель), которая считается точно известной, вектор-столбец, содержащий п параметры, которые необходимо оценить, и является п-мерный вектор-столбец ошибок, которые считаются равными независимо распределенный с нормальные распределения с нулевым средним и каждый с той же неизвестной дисперсией .

Сустав 100 (1 -α)% доверительной области для элементов представлен набором значений вектора б которые удовлетворяют следующему неравенству:[1]

где переменная б представляет любую точку в доверительной области, п - количество параметров, т.е. количество элементов вектора - вектор оцениваемых параметров, а s2 это уменьшенный хи-квадрат, объективная оценка из равно

В дальнейшем, F это квантильная функция из F-распределение, с участием п и степени свободы, это Статистическая значимость уровень, а символ означает транспонировать из .

Выражение можно переписать как:

где - ковариационная матрица, масштабированная методом наименьших квадратов .

Приведенное выше неравенство определяет эллипсоидальный регион в п-мерное декартово пространство параметров Rп. Центр эллипсоида находится по оценке . По словам Пресса и др., Построить эллипсоид легче после выполнения разложение по сингулярным числам. Длины осей эллипсоида пропорциональны обратным величинам значений на диагоналях диагональной матрицы, а направления этих осей задаются строками 3-й матрицы разложения.

Взвешенные и обобщенные методы наименьших квадратов

Теперь рассмотрим более общий случай, когда некоторые отдельные элементы знали ненулевые ковариация (другими словами, ошибки в наблюдениях не распределяются независимо) и / или стандартные отклонения ошибок не все равны. Предположим, что ковариационная матрица является , где V является п-от-п невырожденная матрица, равная в более конкретном случае, рассмотренном в предыдущем разделе (где я это единичная матрица,) но здесь допускается ненулевое значение недиагональные элементы представляющие ковариацию пар отдельных наблюдений, а также не обязательно равные всем диагональным элементам.

Можно найти[2] невырожденная симметричная матрица п такой, что

В результате, п является квадратным корнем из ковариационной матрицы V.

Проблема наименьших квадратов

затем можно преобразовать, умножив каждый член слева на обратное к п, формируя новую постановку задачи

где

и

Совместная доверительная область для параметров, т.е. для элементов , тогда ограничен эллипсоидом, задаваемым формулой:[3]

Здесь F представляет собой процентную точку F-распространение и количества п и н-п являются степени свободы которые являются параметрами этого распределения.

Нелинейные задачи

Области достоверности могут быть определены для любого распределения вероятностей. Экспериментатор может выбрать уровень значимости и форму области, а затем размер области определяется распределением вероятностей. Естественный выбор - использовать в качестве границы набор точек с постоянным (хи-квадрат ) значения.

Один из подходов заключается в использовании линейного приближения к нелинейной модели, которое может быть близким приближением в окрестности решения, а затем применить анализ для линейной задачи, чтобы найти приблизительную доверительную область. Это может быть разумным подходом, если доверительная область не очень велика и вторые производные модели также не очень велики.

Начальная загрузка также могут быть использованы подходы.[4]

Видеть Методики количественной оценки неопределенности для прямого распространения неопределенности для связанных понятий.

Смотрите также

Примечания

  1. ^ Дрейпер и Смит (1981, с. 94)
  2. ^ Дрейпер и Смит (1981, с. 108)
  3. ^ Дрейпер и Смит (1981, стр. 109)
  4. ^ Хаттон Т.Дж., Бакстон Б.Ф., Хаммонд П., Поттс HWW (2003). Оценка средних траекторий роста в пространстве форм с использованием сглаживания ядра. IEEE Transactions по медицинской визуализации, 22(6):747-53

Рекомендации

  • Draper, N.R .; Х. Смит (1981) [1966]. Прикладной регрессионный анализ (2-е изд.). США: John Wiley and Sons Ltd. ISBN  0-471-02995-5.
  • Press, W.H .; Теукольский С.А. В. Т. Феттерлинг; Б.П. Фланнери (1992) [1988]. Числовые рецепты на языке C: искусство научных вычислений (2-е изд.). Кембридж, Великобритания: Издательство Кембриджского университета.

внешняя ссылка