Полнота (статистика) - Completeness (statistics)
эта статья нужны дополнительные цитаты для проверка.Август 2009 г.) (Узнайте, как и когда удалить этот шаблон сообщения) ( |
В статистика, полнота является собственностью статистика по отношению к модели для набора наблюдаемых данных. По сути, это гарантирует, что распределения, соответствующие разным значениям параметров, различны.
Это тесно связано с идеей идентифицируемость, но в статистическая теория это часто встречается как условие, наложенное на достаточная статистика из которых выводятся определенные результаты оптимальности.
Определение
Рассмотрим случайная переменная Икс распределение вероятностей которого принадлежит параметрическая модель пθ параметризованныйθ.
Сказать Т является статистика; то есть состав измеримая функция со случайной выборкой Икс1,...,Иксп.
Статистика Т как говорят полный для распределения Икс если для каждой измеримой функции г,:[1]
Статистика Т как говорят ограниченно полный для распределения Икс если эта импликация верна для любой измеримой функции грамм это тоже ограничено.
Пример 1: модель Бернулли
Модель Бернулли допускает полную статистику.[2] Позволять Икс быть случайный пример размера п так что каждый Икся имеет то же самое Распределение Бернулли с параметром п. Позволять Т быть количеством единиц, наблюдаемых в образце. Т это статистика Икс который имеет биномиальное распределение с параметрами (п,п). Если пространство параметров для п равно (0,1), то Т это полная статистика. Чтобы увидеть это, обратите внимание, что
Отметим также, что ни п ни 1 -п может быть 0. Следовательно если и только если:
Об обозначении п/(1 − п) к р, получается:
Во-первых, обратите внимание, что диапазон р это положительные реалы. Также E (грамм(Т)) это многочлен в р и, следовательно, может быть идентичным 0, только если все коэффициенты равны 0, то есть грамм(т) = 0 для всехт.
Важно отметить, что результат, что все коэффициенты должны быть равны 0, был получен из-за диапазона значений р. Если бы пространство параметров было конечным и с числом элементов меньше или равным п, можно было бы решить линейные уравнения в грамм(т), полученные подстановкой значений р и получите решения отличные от 0. Например, если п = 1, а пространство параметров - {0,5}, одно наблюдение и одно значение параметра, Т не полный. Обратите внимание на это с определением:
тогда E (грамм(Т)) = 0 хотя грамм(т) не 0 для т = 0 ни для т = 1.
Отношение к достаточной статистике
Для некоторых параметрических семейств полный достаточная статистика не существует (например, см. Galili and Meilijson 2016 [3]). Также минимально достаточный статистика не обязательна. (Случай, когда нет минимально достаточной статистики, был показан Бахадур в 1957 г.[нужна цитата ]) При мягких условиях всегда существует минимальная достаточная статистика. В частности, эти условия всегда выполняются, если случайные величины (связанные с пθ ) все дискретны или все непрерывны.[нужна цитата ]
Важность полноты
Понятие полноты имеет множество приложений в статистике, особенно в следующих двух теоремах математической статистики.
Теорема Лемана – Шеффе
Полнота происходит в Теорема Лемана – Шеффе,[4]в котором говорится, что если статистика несмещена, полный и достаточно для какого-то параметра θ, то это лучшая несмещенная оценка среднегоθ. Другими словами, эта статистика имеет меньший ожидаемый убыток для любого выпуклый функция потерь; во многих практических приложениях с квадратичной функцией потерь она имеет меньшую среднеквадратичную ошибку среди любых оценок с тем же ожидаемое значение.
Существуют примеры, когда минимальная достаточная статистика не завершено то существует несколько альтернативных статистических данных для объективной оценки θ, в то время как у некоторых из них дисперсия ниже, чем у других.[5]
Смотрите также несмещенная оценка с минимальной дисперсией.
Теорема Басу
Ограниченная полнота происходит в Теорема Басу,[6] который утверждает, что статистика, которая является как ограниченно полный и достаточно является независимый любой вспомогательная статистика.
Теорема Бахадура
Ограниченная полнота также встречается в Теорема Бахадура. В случае, если существует хотя бы один минимально достаточный статистика, статистика, которая достаточно и ограниченно полная, обязательно минимально достаточная.
Примечания
Эта статья включает в себя список общих Рекомендации, но он остается в основном непроверенным, потому что ему не хватает соответствующих встроенные цитаты.Февраль 2012 г.) (Узнайте, как и когда удалить этот шаблон сообщения) ( |
- ^ Янг, Г. А. и Смит, Р. Л. (2005). Основы статистического вывода. (стр.94). Издательство Кембриджского университета.
- ^ Казелла, Г. и Бергер, Р. Л. (2001). Статистические выводы. (стр. 285–286). Duxbury Press.
- ^ Тал Галили и Исаак Мейлиджсон (31 марта 2016 г.). «Пример улучшаемого улучшения Рао – Блэквелла, неэффективной оценки максимального правдоподобия и несмещенной обобщенной байесовской оценки». Американский статистик. 70 (1): 108–113. Дои:10.1080/00031305.2015.1100683. ЧВК 4960505. PMID 27499547.CS1 maint: использует параметр авторов (ссылка на сайт)
- ^ Казелла, Джордж; Бергер, Роджер Л. (2001). Статистические выводы (2-е изд.). Duxbury Press. ISBN 978-0534243128.
- ^ Тал Галили и Исаак Мейлиджсон (31 марта 2016 г.). «Пример улучшаемого улучшения Рао – Блэквелла, неэффективной оценки максимального правдоподобия и несмещенной обобщенной байесовской оценки». Американский статистик. 70 (1): 108–113. Дои:10.1080/00031305.2015.1100683. ЧВК 4960505. PMID 27499547.CS1 maint: использует параметр авторов (ссылка на сайт)
- ^ Казелла, Г. и Бергер, Р. Л. (2001). Статистические выводы. (стр.287). Duxbury Press.
Рекомендации
- Басу, Д. (1988). Дж. К. Гош (ред.). Статистическая информация и правдоподобие: сборник критических статей доктора Д. Басу.. Конспект лекций по статистике. 45. Springer. ISBN 978-0-387-96751-6. Г-Н 0953081.CS1 maint: ref = harv (ссылка на сайт)
- Бикель, Питер Дж.; Доксум, Челл А. (2001). Математическая статистика, Том 1: Основные и избранные темы (Вторая (обновленная печать 2007 г.) издания Holden-Day 1976 г.). Пирсон Прентис – Холл. ISBN 978-0-13-850363-5. Г-Н 0443141.CS1 maint: ref = harv (ссылка на сайт)
- Э. Л., Леманн; Романо, Джозеф П. (2005). Проверка статистических гипотез. Тексты Springer в статистике (Третье изд.). Нью-Йорк: Спрингер. С. xiv + 784. ISBN 978-0-387-98864-1. Г-Н 2135927. Архивировано из оригинал на 02.02.2013.CS1 maint: ref = harv (ссылка на сайт)
- Lehmann, E.L .; Шеффе, Х. (1950). «Полнота, близость регионов и объективная оценка. I.» Санкхья: Индийский статистический журнал. 10 (4): 305–340. Дои:10.1007/978-1-4614-1412-4_23. JSTOR 25048038. Г-Н 0039201.
- Lehmann, E.L .; Шеффе, Х. (1955). «Полнота, близость регионов и объективная оценка. II». Санкхья: Индийский статистический журнал. 15 (3): 219–236. Дои:10.1007/978-1-4614-1412-4_24. JSTOR 25048243. Г-Н 0072410.