Т-статистика - T-statistic
Эта статья нужны дополнительные цитаты для проверка.Апрель 2020) (Узнайте, как и когда удалить этот шаблон сообщения) ( |
В статистика, то т-статистический - это отношение отклонения оценочного значения параметра от его предполагаемого значения к его стандартная ошибка. Он используется в проверка гипотезы через Студенты т-тест. T-статистика используется в T-тесте, чтобы определить, следует ли вам поддерживать или отклонять нулевую гипотезу. Он очень похож на Z-оценка но с той разницей, что T-статистика используется, когда размер выборки невелик или стандартное отклонение генеральной совокупности неизвестно. Например, T-статистика используется для оценки Средняя численность населения из выборочное распределение из образец означает если население стандартное отклонение неизвестно. Он также используется вместе с p-значение при запуске проверки гипотез, где p-значение говорит нам, каковы шансы того, что результаты получатся.
Определение и особенности
Позволять быть оценщик параметра β в некоторых статистическая модель. Затем т-статистикой для этого параметра является любое количество вида
куда β0 - неслучайная известная константа, которая может совпадать или не совпадать с фактическим неизвестным значением параметра β, и это стандартная ошибка оценщика за β.
По умолчанию отчеты статистических пакетов т-статистический с β0 = 0 (эти т-статистика используется для проверки значимости соответствующего регрессора). Однако когда т-статистика необходима для проверки гипотезы о форме ЧАС0: β = β0, то ненулевое β0 может быть использовано.
Если является обыкновенный метод наименьших квадратов оценщик в классическом модель линейной регрессии (то есть с нормально распределенный и гомоскедастический условия ошибки), и если истинное значение параметра β равно β0, то выборочное распределение из т-статистический Студенты т-распределение с (п - к) степени свободы, где п - количество наблюдений, а k количество регрессоров (включая перехват)[нужна цитата ].
В большинстве моделей оценщик является последовательный за β и распространяется асимптотически нормально. Если истинное значение параметра β равно β0 и количество правильно оценивает асимптотическую дисперсию этой оценки, то т-статистик асимптотически будет иметь стандартный нормальный распределение.
В некоторых моделях распределение т-статистическое распределение отличается от нормального распределения даже асимптотически. Например, когда Временные ряды с единичный корень регрессирует в расширенный тест Дики – Фуллера, тест т-statistic будет асимптотически иметь одно из распределений Дики – Фуллера (в зависимости от настройки теста).
Использовать
Чаще всего, т статистика используется в Студенты т-тесты, форма статистическая проверка гипотез, а при вычислении некоторых доверительные интервалы.
Ключевое свойство т статистика такова, что это основное количество - хотя его распределение определяется в терминах выборочного среднего, его выборочное распределение не зависит от параметров генеральной совокупности, и поэтому его можно использовать независимо от того, какими они могут быть.
Также можно разделить остаточный по образцу стандартное отклонение:
для вычисления оценки количества стандартных отклонений данный образец от среднего значения, как образец версии z-оценка, z-оценка, требующая параметров популяции.
Прогноз
Учитывая нормальное распределение с неизвестным средним значением и дисперсией т-статистика будущего наблюдения после того, как один сделал п наблюдения, это вспомогательная статистика - основная величина (не зависит от значений μ и σ2), которая является статистикой (вычисляется на основе наблюдений). Это позволяет вычислить частотный интервал прогноза (прогнозирующий доверительный интервал ) через следующее t-распределение:
Решение для дает прогнозное распределение
из которого можно вычислить прогнозные доверительные интервалы - учитывая вероятность п, можно вычислить такие интервалы, что 100п% случаев, следующее наблюдение попадет в этот интервал.
История
Период, термин "т-статистический сокращенно от «статистика проверки гипотез».[нужна цитата ] В статистике t-распределение было впервые получено как апостериорное распределение в 1876 г. Helmert[1][2][3] и Люрот.[4][5][6] T-распределение также появилось в более общей форме как тип Пирсона. IV распространение в Карл Пирсон Бумага 1895 года.[7] Однако T-распределение, также известное как Распределение Т студентов получил свое название от Уильям Сили Госсет который впервые опубликовал его в английской литературе в своей статье 1908 года под названием Биометрика под псевдонимом "Студент"[8][9] потому что его работодатель предпочитал сотрудникам использовать псевдонимы при публикации научных статей вместо их настоящего имени, поэтому он использовал имя «Студент», чтобы скрыть свою личность.[10] Госсет работал в Пивоварня Guinness в Дублин, Ирландия, и интересовался проблемами малых образцов - например, химическими свойствами ячменя, где размер выборки может составлять всего 3. Следовательно, вторая версия этимологии термина Студент заключается в том, что Guinness не хотел, чтобы их конкуренты знали что они использовали t-тест для определения качества сырья. Хотя это был Уильям Госсет, в честь которого был написан термин «Студент», на самом деле он возник благодаря работе Рональд Фишер что это распределение стало известно как "Студенческое распределение"[11][12] и "T-тест Стьюдента "
Связанные понятия
- z-оценка (стандартизация): Если параметры популяции известны, то вместо вычисления t-статистики можно вычислить z-оценку; аналогично, а не использовать т-тест, используется z-тест. Это редко за пределами стандартизированное тестирование.
- Студентизованный остаток: В регрессивный анализ, стандартные ошибки оценок в разных точках данных различаются (сравните среднюю и конечную точки простая линейная регрессия ), и, таким образом, необходимо разделить разные остатки на разные оценки ошибки, получив то, что называется стьюдентизированные остатки.
Смотрите также
- F-тест
- т2-статистический
- Т-распределение студентов
- T-тест Стьюдента
- Проверка гипотезы
- Распределения сложенных t и половин t
- Распределение хи-квадрат
Рекомендации
- ^ Сабо, Иштван (2003), Einführung in die Technische Mechanik, Springer Berlin Heidelberg, стр. 196–199, Дои:10.1007/978-3-642-61925-0_16, ISBN 978-3-540-13293-6 Отсутствует или пусто
| название =
(помощь);| chapter =
игнорируется (помощь) - ^ Шливич, Б. (октябрь 1937 г.). "Untersuchungen über den anastomotischen Kanal zwischen der Arteria coeliaca und mesenterica superior und damit в Zusammenhang stehende Fragen". Zeitschrift für Anatomie und Entwicklungsgeschichte. 107 (6): 709–737. Дои:10.1007 / bf02118337. ISSN 0340-2061. S2CID 27311567.
- ^ Гельмерт (1876 г.). "Die Genauigkeit der Formel von Peters zur Berechnung des wahrscheinlichen Beobachtungsfehlers directer Beobachtungen gleicher Genauigkeit". Astronomische Nachrichten (на немецком). 88 (8–9): 113–131. Bibcode:1876AN ..... 88..113H. Дои:10.1002 / asna.18760880802.
- ^ Люрот, Дж. (1876 г.). "Vergleichung von zwei Werthen des wahrscheinlichen Fehlers". Astronomische Nachrichten (на немецком). 87 (14): 209–220. Bibcode:1876AN ..... 87..209L. Дои:10.1002 / asna.18760871402.
- ^ Пфанзагл Дж, Шейнин О (1996). «Исследования по истории вероятности и статистики. XLIV. Предшественник t-распределения». Биометрика. 83 (4): 891–898. Дои: 10.1093 / biomet / 83.4.891. МИСТЕР 1766040.
- ^ Шейнин, Оскар (1995). «Работа Гельмерта по теории ошибок». Архив истории точных наук. 49 (1): 73–104. Дои:10.1007 / BF00374700. ISSN 0003-9519. S2CID 121241599.
- ^ Пирсон, К. (1895-01-01). «Вклад в математическую теорию эволюции. II. Косые вариации в однородном материале». Философские труды Королевского общества A: математические, физические и инженерные науки. 186: 343–414 (374). Дои: 10.1098 / rsta.1895.0010. ISSN 1364-503X
- ^ "Ученик" [Уильям Сили Госсет ] (1908 г.). «Вероятная ошибка среднего» (PDF). Биометрика. 6 (1): 1–25. Дои: 10.1093 / biomet / 6.1.1. HDL: 10338.dmlcz / 143545. JSTOR 2331554
- ^ «Таблица T | История таблицы T, этимология, таблица T с одним концом, таблица T с двумя хвостами и T-статистика».
- ^ Wendl MC (2016). «Псевдонимная слава». Наука. 351 (6280): 1406. DOI: 10.1126 / science.351.6280.1406. PMID 27013722
- ^ «Оригинальный PDF». Дои:10.15438 / рр.5.1.7. Цитировать журнал требует
| журнал =
(помощь) - ^ Уолпол, Рональд Э. (2006). Вероятность и статистика для инженеров и ученых. Майерс, Х. Раймонд. (7-е изд.). Нью-Дели: Пирсон. ISBN 81-7758-404-9. OCLC 818811849.