Уменьшенная статистика хи-квадрат - Reduced chi-squared statistic

В статистике уменьшенная статистика хи-квадрат широко используется в степень соответствия тестирование. Он также известен как среднеквадратичное взвешенное отклонение (ТБО) в изотопное датирование[1] и отклонение удельного веса в контексте взвешенный метод наименьших квадратов.[2][3]

Его квадратный корень называется стандартная ошибка регрессии,[4] стандартная ошибка регрессии,[5][6] или же стандартная ошибка уравнения[7](видеть Обычный метод наименьших квадратов # Приведенный хи-квадрат )

Определение

Он определяется как хи-квадрат на степень свободы:[8][9][10][11][12][13][14][15]

где хи-квадрат - это взвешенная сумма квадратов отклонения:

со входами: отклонение , наблюдения О, и расчетные данные C.[8]Степень свободы, , равно количеству наблюдений п минус количество подобранных параметров м.

В взвешенный метод наименьших квадратов, определение часто записывают в матричных обозначениях как

куда р - вектор невязок, а W - матрица весов, обратная входной (диагональной) ковариационной матрице наблюдений.

Обсуждение

Как показывает практика, когда известна дисперсия ошибки измерения априори, а указывает на плохую подгонку модели. А указывает, что соответствие не полностью захватило данные (или что дисперсия ошибки была недооценена). В принципе, значение вокруг указывает, что степень соответствия между наблюдениями и оценками соответствует дисперсии ошибки. А указывает на то, что модель «переобладает» данные: либо модель неверно соответствует шуму, либо дисперсия ошибки была переоценена.[16]

Когда дисперсия ошибки измерения известна лишь частично, приведенный хи-квадрат может служить оценкой поправки. апостериорный, видеть средневзвешенное арифметическое # Поправка на чрезмерную или недостаточную дисперсию.

Приложения

Геохронология

В геохронология, MSWD - это мера согласия, которая учитывает относительную важность как внутренней, так и внешней воспроизводимости, с наиболее распространенным использованием в изотопном датировании.[17][18][1][19][20][21]

Обычно, когда:

MSWD = 1, если данные о возрасте соответствуют одномерному нормальному распределению в т (для среднего арифметического возраста) или журнала (т) (для среднего геометрического возраста) пространства, или если композиционные данные соответствуют двумерному нормальному распределению в [log (U /Он ),бревно(Чт / He)] - пространство (для центральной эпохи).

СКВО <1, если наблюдаемый разброс меньше, чем предсказано аналитическими погрешностями. В этом случае данные считаются «недисперсными», что указывает на завышение аналитических неопределенностей.

MSWD> 1, если наблюдаемый разброс превышает предсказанный аналитическими погрешностями. В этом случае данные считаются «чрезмерно рассредоточенными». Эта ситуация является скорее правилом, чем исключением в геохронологии (U-Th) / He, что указывает на неполное понимание изотопной системы. Было предложено несколько причин для объяснения чрезмерной дисперсии данных (U-Th) / He, включая неравномерное распределение U-Th и радиационное повреждение.

Часто геохронолог определяет серию измерений возраста на одном образце с измеренным значением. имеющий вес и связанная ошибка для каждого определения возраста. Что касается взвешивания, можно либо взвесить все измеренные возрасты одинаково, либо взвесить их в соответствии с долей выборки, которую они представляют. Например, если две трети образца использовались для первого измерения и одна треть для второго и последнего измерения, то можно было бы взвесить первое измерение вдвое, чем второе.

Среднее арифметическое определение возраста:

но это значение может вводить в заблуждение, если каждое определение возраста не имеет одинакового значения.

Когда можно предположить, что каждое измеренное значение имеет одинаковый вес или значимость, смещенное и несмещенное (или "образец "и" совокупность "соответственно) оценки дисперсии рассчитываются следующим образом:

Стандартное отклонение - это квадратный корень из дисперсии.

Когда отдельные определения возраста не имеют одинакового значения, лучше использовать взвешенное среднее значение для получения «среднего» возраста следующим образом:

Можно показать, что смещенная взвешенная оценка дисперсии

который может быть вычислен на лету как

Несмещенная взвешенная оценка выборочной дисперсии может быть вычислена следующим образом:

Опять же, соответствующее стандартное отклонение - это квадратный корень из дисперсии.

Несмещенная взвешенная оценка выборочной дисперсии также может быть вычислена на лету следующим образом:

Невзвешенный средний квадрат взвешенных отклонений (невзвешенный СКВО) затем может быть вычислен следующим образом:

По аналогии средневзвешенный квадрат взвешенных отклонений (взвешенное СКВО) можно рассчитать следующим образом:

Анализ Раша

При анализе данных на основе Модель Раша, статистика приведенного хи-квадрата называется среднеквадратической статистикой для оборудования, а взвешенная по информации статистика приведенного хи-квадрата называется статистикой среднего квадрата бесконечности.[22]

Рекомендации

  1. ^ а б Вендт И. и Карл К., 1991, Статистическое распределение среднеквадратичного взвешенного отклонения, Химическая геология, 275–285.
  2. ^ Линейная алгебра, геодезия и GPSАвтор: Гилберт Стрэнг, Кай Борре.
  3. ^ Оценка параметров и проверка гипотез в линейных моделях, Карл-Рудольф Кох [1]
  4. ^ Джулиан Фарауэй (2000), Практическая регрессия и Anova с использованием R
  5. ^ Kenney, J .; Удерживая, Э. С. (1963). Математика статистики. ван Ностранд. п. 187.
  6. ^ Цвиллинджер, Д. (1995). Стандартные математические таблицы и формулы. Чепмен и Холл / CRC. п. 626. ISBN  0-8493-2479-3.
  7. ^ Хаяси, Фумио (2000). Эконометрика. Издательство Принстонского университета. ISBN  0-691-01018-8.CS1 maint: ref = harv (связь)
  8. ^ а б Лауб, Чарли; Куль, Тоня Л. (н.о.), Насколько плохо хорошо? Критический взгляд на подгонку моделей отражательной способности с использованием приведенной статистики хи-квадрат (PDF), Калифорнийский университет, Дэвис, архивировано из оригинал (PDF) 6 октября 2016 г., получено 30 мая 2015
  9. ^ Тейлор, Джон Роберт (1997), Введение в анализ ошибок, University Science Books, стр. 268
  10. ^ Киркман, Т. В. (нет данных), Подгонка кривой хи-квадрат, получено 30 мая 2015
  11. ^ Бевингтон 1969, п. 85
  12. ^ Измерения и их неопределенности: Практическое руководство по современному анализу ошибок, Авторы Ифан Хьюз, Томас Хейз [2]
  13. ^ Работа с неопределенностями: руководство по анализу ошибок, Манфред Дросг [3]
  14. ^ Практическая статистика для астрономов, Дж. В. Уолл, К. Р. Дженкинс
  15. ^ Вычислительные методы в физике и технике, Сэмюэл Шоу Мин Вонг [4]
  16. ^ Бевингтон, Филип Р. (1969), Обработка данных и анализ ошибок для физических наук, Нью-Йорк: Макгроу-Хилл, стр. 89, За χ2 тесты, χν2 должно быть примерно равно единице.
  17. ^ Дикин, А. П. 1995. Геология радиогенных изотопов. Издательство Кембриджского университета, Кембридж, Великобритания, 1995 г., ISBN  0-521-43151-4, ISBN  0-521-59891-5
  18. ^ Макдугалл И. и Харрисон Т. М. 1988. Геохронология и термохронология 40Ar /39Метод Ar. Издательство Оксфордского университета.
  19. ^ Лэнс П. Блэк, Сандра Л. Камо, Шарлотта М. Аллен, Джон Н. Алейников, Дональд В. Дэвис, Рассел Дж. Корш, Крис Фудулис, 2003. ТЕМОРА 1: новый стандарт циркона для фанерозойской U – Pb геохронологии. Химическая геология 200, 155–170.
  20. ^ М. Дж. Штрейл, Р. Дж. Филлипс, М. П. Сирл, Д. Дж. Уотерс и М. С. А. Хорствуд 2009. Эволюция и хронология метаморфического комплекса Пангонг, примыкающего к модельному и U-Pb геохронологии Каракорамский разлом, Ладакх: ограничения термобарометрии, метаморфического моделирования и геохронологии U-Pb. Журнал Геологического общества 166, 919–932 Дои:10.1144/0016-76492008-117
  21. ^ Роджер Пауэлл, Джанет Хергт, Джон Вудхед 2002. Улучшение изохронных вычислений с помощью надежной статистики и начальной загрузки. Химическая геология 185, 191–204.
  22. ^ Линакр, Дж. М. (2002). «Что означают Infit и Outfit, Mean-Square и Standardized?». Сделки по измерению Раша. 16 (2): 878.