Основы статистики - Foundations of statistics

В основы статистики касаются эпистемологический дебаты в статистика о том, как следует вести индуктивный вывод из данных. Среди вопросов, рассмотренных в статистические выводы это вопрос Байесовский вывод против частотный вывод, различие между Фишер "проверка значимости" и Нейман –Пирсон "проверка гипотез" и принцип правдоподобия следует соблюдать. Некоторые из этих вопросов безрезультатно обсуждались на протяжении 200 лет.^[1]

Bandyopadhyay & Forster^[2] описывают четыре статистические парадигмы: «(i) классическая статистика или статистика ошибок, (ii) байесовская статистика, (iii) статистика, основанная на правдоподобии, и (iv) Акаике-информационный критерий статистика на основе ".

Текст Сэвиджа Основы статистики был процитирован более 15000 раз на Google ученый.^[3] В нем говорится следующее.

Все согласны с тем, что статистика так или иначе зависит от вероятности. Но что касается того, что такое вероятность и как она связана со статистикой, то со времен Вавилонской башни редко было такое полное разногласие и нарушение связи. Несомненно, большая часть разногласий носит чисто терминологический характер и исчезнет при достаточно тщательном анализе.^[4]

«Проверка значимости» Фишера против «проверки гипотезы Неймана – Пирсона»

В процессе развития классической статистики во второй четверти 20 века были разработаны две конкурирующие модели индуктивного статистического тестирования.^[5]^[6] Их относительные достоинства горячо обсуждались^[7] (более 25 лет) до смерти Фишера. Несмотря на то, что гибрид этих двух методов широко преподается и используется, философские вопросы, поднятые в ходе дискуссии, не решены.

Проверка значимости

Фишер популяризировал тестирование значимости, прежде всего в двух популярных и очень влиятельных книгах.^[8]^[9] Стиль письма Фишера в этих книгах был основан на примерах и относительно слаб на объяснениях. В книгах не хватало доказательств или выводов статистических критериев значимости (которые ставили статистическую практику выше статистической теории). Более пояснительные и философские работы Фишера были написаны намного позже.^[10] Кажется, есть некоторые различия между его более ранними практиками и его более поздними взглядами.

Фишер был мотивирован на получение научных экспериментальных результатов без явного влияния предшествующего мнения. Тест значимости - это вероятностная версия Modus tollens, классическая форма дедуктивного вывода. Критерий значимости может быть упрощенно сформулирован: «Если свидетельство достаточно не согласуется с гипотезой, отвергните гипотезу». В приложении статистика рассчитывается на основе экспериментальных данных, определяется вероятность превышения этой статистики, и вероятность сравнивается с пороговым значением. Порог (числовая версия «достаточно несогласованный») произвольный (обычно определяется по соглашению). Обычное применение метода - решение о том, имеет ли лечение отчетный эффект, на основе сравнительного эксперимента. Статистическая значимость - это мера вероятности, а не практического значения. Это можно рассматривать как требование к статистическому сигналу / шуму. Метод основан на предположении существования воображаемой бесконечной популяции, соответствующей нулевой гипотезе.

Для проверки значимости требуется только одна гипотеза. Результат проверки - отвергнуть гипотезу (или нет), простая дихотомия. Тест позволяет различать истинность гипотезы и недостаточность доказательств для опровержения гипотезы; так что это похоже на уголовный процесс, в котором оценивается вина подсудимого (например, уголовный процесс, в котором подсудимый считается невиновным, пока его вина не будет доказана).

Проверка гипотезы

Нейман & Пирсон совместно работали над другой, но связанной проблемой - выбором среди конкурирующих гипотез, основываясь только на экспериментальных данных. Наиболее цитируемые из их совместных работ относятся к 1933 году.^[11] Знаменитый результат этой статьи - Лемма Неймана – Пирсона.. В лемме говорится, что отношение вероятностей является отличным критерием для выбора гипотезы (при произвольном пороге сравнения). В статье доказана оптимальность T-тест Стьюдента (один из тестов значимости). Нейман выразил мнение, что проверка гипотез является обобщением и улучшением проверки значимости. Обоснование их методов можно найти в их совместных статьях.^[12]

Для проверки гипотез требуется несколько гипотез. Всегда выбирается гипотеза, множественный выбор. Недостаток доказательств - это не вопрос немедленного рассмотрения. Метод основан на предположении о повторной выборке одной и той же совокупности (классическое частотное допущение), хотя это предположение подвергалось критике со стороны Фишера (Рубин, 2020).^[13]

Основания несогласия

Продолжительность спора позволила обсудить широкий круг вопросов, которые считаются основополагающими для статистики.

Пример обмена с 1955–1956 гг.
Атака Фишера^[14]	Опровержение Неймана^[15]	Обсуждение
Повторный отбор одной и той же популяции Такая выборка является основой частотной вероятности. Фишер предпочел исходный вывод	Теория фидуциального вывода ошибочна. Парадоксы обычны	Атака Фишера на основе частотной вероятности провалилась, но не без результата. Он выделил конкретный случай (таблица 2 × 2), когда две школы тестирования достигли разных результатов. Этот случай - один из нескольких, которые все еще вызывают беспокойство. Комментаторы считают, что «правильный» ответ зависит от контекста.^[16] Фидуциарная вероятность оказалась не очень успешной, поскольку практически не было сторонников, в то время как частотная вероятность остается господствующей интерпретацией.
Ошибки типа II Которые следуют из альтернативной гипотезы	Чисто вероятностная теория тестов требует альтернативной гипотезы.	Атака Фишера на ошибки типа II со временем сошла на нет. За прошедшие годы статистика отделила исследовательское от подтверждающего. В современных условиях концепция ошибок типа II используется в расчетах мощности для проверки гипотезы. определение размера выборки.
Индуктивное поведение (Против индуктивное мышление, Предпочтение Фишера)		Атака Фишера на индуктивное поведение была в значительной степени успешной из-за его выбора поля битвы. В то время как оперативные решения обычно производятся по множеству критериев (например, по стоимости), научные выводы из экспериментов обычно основываются только на вероятности.

В ходе этого обмена мнениями Фишер также обсудил требования к индуктивному выводу с конкретной критикой функций затрат, наказывающих за ошибочные суждения. Нейман возразил, что их использовали Гаусс и Лаплас. Этот обмен аргументами произошел 15 лет после в учебниках начали преподавать гибридную теорию статистического тестирования.

Фишер и Нейман расходились во мнениях относительно основ статистики (хотя и были едины в яростном противодействии байесовской точке зрения).^[16]):

Интерпретация вероятности
- Разногласия по поводу индуктивного рассуждения Фишера и индуктивного поведения Неймана содержали элементы разделения байесовского / частотного. Фишер был готов изменить свое мнение (придя к предварительному заключению) на основе рассчитанной вероятности, в то время как Нейман был более склонен изменить свое наблюдаемое поведение (принятие решения) на основе рассчитанной стоимости.
Правильная постановка научных вопросов с особым вниманием к моделированию^[7]^[17]
Разумно ли отвергать гипотезу, основанную на низкой вероятности, не зная вероятности альтернативы
Можно ли когда-нибудь принять гипотезу на основе данных
- В математике дедукция доказывает, контрпримеры опровергают
- В попперовской философии науки успехи достигаются, когда теории опровергаются.
Субъективность. Хотя Фишер и Нейман пытались свести к минимуму субъективность, оба признали важность «здравого смысла». Каждый обвинял другого в субъективности.
- Фишер субъективно выбрал нулевую гипотезу.
- Нейман – Пирсон субъективно выбрал критерий отбора (который не ограничивался вероятностью).
- И то и другое субъективно определены числовые пороги.

Фишера и Неймана разделяли взгляды и, возможно, язык. Фишер был ученым и интуитивным математиком. Индуктивное рассуждение было естественным. Нейман был строгим математиком. Его убедили дедуктивные рассуждения, а не расчет вероятности, основанный на эксперименте.^[5] Таким образом, в основе лежало столкновение между прикладным и теоретическим, между наукой и математикой.

Связанная история

Нейман, который занимал то же здание в Англии, что и Фишер, согласился занять должность на западном побережье Соединенных Штатов Америки в 1938 году. Его шаг фактически положил конец его сотрудничеству с Пирсоном и их разработке проверки гипотез.^[5] Дальнейшее развитие продолжили другие.

К 1940 году в учебниках была представлена гибридная версия значимости и проверки гипотез.^[18] Ни один из директоров не принимал личного участия в дальнейшем развитии гибрида, о котором сегодня говорится во вводной статистике.^[6]

Позже статистика развивалась в различных направлениях, включая теорию принятия решений (и, возможно, теорию игр), байесовскую статистику, исследовательский анализ данных, надежную статистику и непараметрическую статистику. Проверка гипотез Неймана – Пирсона внесла большой вклад в теорию принятия решений, которая очень широко используется (например, в статистическом контроле качества). Проверка гипотез легко обобщается для принятия априорных вероятностей, что придает ей байесовский оттенок. Проверка гипотез Неймана – Пирсона стала абстрактным математическим предметом, преподаваемым в аспирантуре по статистике.^[19] в то время как большая часть того, что преподается студентам и используется под знаком проверки гипотез, принадлежит Фишеру.

Современное мнение

Никаких серьезных сражений между двумя классическими школами тестирования не возникало в течение десятилетий, но снайперская стрельба продолжается (возможно, поощряется сторонниками других противоречий). После нескольких поколений споров практически нет шансов, что одна из теорий статистического тестирования заменит другую в обозримом будущем.

Гибрид двух конкурирующих школ тестирования можно рассматривать совершенно по-разному - как несовершенное соединение двух математически дополняющих друг друга идей.^[16] или как фундаментально ошибочный союз философски несовместимых идей.^[20] Фишер пользовался некоторыми философскими преимуществами, в то время как Нейман и Пирсон использовали более строгую математику. Проверка гипотез противоречивый среди некоторых пользователей, но самая популярная альтернатива (доверительные интервалы) основана на той же математике.

История развития оставила тестирование без единого цитируемого авторитетного источника гибридной теории, отражающей общепринятую статистическую практику. Объединенная терминология также несколько противоречива. Существуют убедительные эмпирические доказательства того, что выпускники (и преподаватели) вводного курса статистики плохо понимают значение проверки гипотез.^[21]

Резюме

Интерпретация вероятности не решена (но фидуциальная вероятность - сирота).
Ни один метод испытаний не был отклонен. Оба широко используются для разных целей.
Тексты объединили два метода тестирования под термином «проверка гипотез».
- Математики утверждают (за некоторыми исключениями), что проверка значимости - это частный случай проверки гипотез.
- Другие рассматривают проблемы и методы как отдельные (или несовместимые).
Спор отрицательно сказался на статистическом образовании.

Байесовский вывод против частотного вывода

Две разные интерпретации вероятности (основанные на объективных свидетельствах и субъективных степенях веры) существуют уже давно. Гаусс и Лаплас могли обсуждать альтернативы более 200 лет назад. Как следствие, возникли две конкурирующие школы статистики. Классическая логическая статистика получила широкое развитие во второй четверти 20 века.^[6] большая часть его является реакцией на (байесовскую) вероятность того времени, в котором использовалась спорная принцип безразличия установить априорные вероятности. Реабилитация байесовского вывода была реакцией на ограничения частотной вероятности. Последовали новые реакции. Хотя философские интерпретации устарели, статистическая терминология - нет. Текущие статистические термины «байесовский» и «частотный» стабилизировались во второй половине 20 века.^[22] Терминология (философская, математическая, научная, статистическая) сбивает с толку: «классическая» интерпретация вероятности - байесовская, а «классическая» статистика - частотная. «Frequentist» также имеет разные интерпретации - разные в философии, чем в физике.

Нюансы философского вероятностные интерпретации обсуждаются в другом месте. В статистике альтернативные интерпретации включить анализ разных данных с использованием разных методов на основе разных моделей для достижения немного разных целей. Любое статистическое сравнение конкурирующих школ учитывает прагматические критерии, выходящие за рамки философских.

Основные участники

Двумя основными участниками частотных (классических) методов были: Фишер и Нейман.^[5] Интерпретация вероятности Фишером была своеобразной (но строго небайесовской). Взгляды Неймана были строго частотными. Три основных участника байесовской статистической философии, математики и методов ХХ века: де Финетти,^[23] Джеффрис^[24] и Дикарь.^[25] Сэвидж популяризировал идеи де Финетти в англоязычном мире и сделал байесовскую математику строгой. В 1965 году двухтомник Денниса Линдли «Введение в вероятность и статистику с байесовской точки зрения» представил байесовские методы широкой аудитории. Статистика улучшилась за последние три поколения; «Авторитетные» взгляды первых участников не совсем актуальны.

Контрастные подходы

Заключение частотника

Вывод частичного и лаконичного характера описан выше в («проверка значимости» Фишера против «проверки гипотезы Неймана-Пирсона»). Заключение Frequentist объединяет несколько различных точек зрения. Результат может подтверждать научные выводы, принимать оперативные решения и оценивать параметры с учетом или без доверительные интервалы. Заключение частотного анализа основано исключительно на (одном наборе) свидетельств.

Байесовский вывод

Классическое частотное распределение описывает вероятность данных. Использование Теорема Байеса позволяет более абстрактное понятие - вероятность гипотезы (соответствующей теории) с учетом данных. Эта концепция когда-то была известна как «обратная вероятность». Байесовский вывод обновляет оценку вероятности гипотезы по мере получения дополнительных свидетельств. Байесовский вывод явно основан на доказательствах и предшествующем мнении, что позволяет ему основываться на множестве наборов доказательств.

Сравнение характеристик

Фреквентисты и байесовцы используют разные модели вероятностей. Специалисты по частотности часто считают параметры фиксированными, но неизвестными, в то время как байесовцы назначают распределения вероятностей аналогичным параметрам. Следовательно, байесовцы говорят о вероятностях, которые не существуют для частотников; Байесовец говорит о вероятности теории, в то время как настоящий частотный специалист может говорить только о согласованности свидетельств с теорией. Пример: частотный специалист не говорит, что существует 95% -ная вероятность того, что истинное значение параметра находится в пределах доверительного интервала, вместо этого заявляя, что 95% доверительных интервалов содержат истинное значение.

Эфрона^[26] сравнительные прилагательные
	Байесовский	Частотник
Основа Результирующая характеристика _ Идеальное приложение Целевая аудитория Характеристики моделирования	Вера (ранее) Принципиальная философия Одна раздача Динамический (повторная выборка) Индивидуальный (субъективный) Агрессивный	Поведение (метод) Оппортунистические методы Многие дистрибутивы (бутстрап?) Статический (один образец) Сообщество (цель) Оборонительный

Альтернативное сравнение^[27]^[28]
	Байесовский	Частотник
Сильные стороны	Завершить Последовательный Предписывающий _ _ _ _ _ Сильный вывод из модели	Выводы хорошо откалиброваны Нет необходимости указывать предыдущие распределения Гибкий спектр процедур Беспристрастность, достаточность, несостоятельность ... Широко применимо и надежно Асимптотическая теория Легко интерпретировать Можно рассчитать вручную Формулировка и оценка сильной модели
Недостатки	Слишком субъективно для научных выводов Отрицает роль рандомизации для дизайна Требует и полагается на полную спецификацию модели (вероятностную и априорную) _ _ _ Формулировка и оценка слабой модели	Неполный Неоднозначный Несвязный Не предписывающий Нет единой теории (Более?) Акцент на асимптотических свойствах Слабый вывод из модели

Математические результаты

Ни одна из школ не застрахована от математической критики и не принимает ее без борьбы. Парадокс Штейна (например) проиллюстрировал, что найти «плоское» или «неинформативное» априорное распределение вероятностей в больших измерениях сложно.^[1] Байесовцы считают это второстепенным по отношению к ядру своей философии, в то же время находя частотный подход, пронизанный несоответствиями, парадоксами и плохим математическим поведением. Часто частотники могут объяснить большинство. Некоторые из «плохих» примеров - это экстремальные ситуации, такие как оценка веса стада слонов по измерению веса одного («слонов Басу»), что не позволяет статистически оценить изменчивость весов. В принцип правдоподобия был полем битвы.

Статистические результаты

Обе школы достигли впечатляющих результатов в решении реальных задач. Классическая статистика, по сути, имеет более длинный послужной список, потому что многочисленные результаты были получены с помощью механических калькуляторов и распечатанных таблиц специальных статистических функций. Байесовские методы оказались очень успешными при анализе информации, которая естественно последовательно отбирается (радар и сонар). Многие байесовские методы и некоторые недавние частотные методы (такие как бутстрап) требуют вычислительной мощности, широко доступной только в последние несколько десятилетий. Активно обсуждается сочетание байесовских и частотных методов.^[29]^[27] но высказываются оговорки относительно значения результатов и уменьшения разнообразия подходов.

Философские результаты

Байесовцы объединены в противовес ограничениям частотности, но с философской точки зрения разделены на многочисленные лагеря (эмпирические, иерархические, объективные, личные, субъективные), каждый с разным акцентом. Один (частотный) философ статистики отметил отход от области статистики к философской вероятностные интерпретации за последние два поколения.^[30] Бытует мнение, что успехи в байесовских приложениях не оправдывают поддерживающую философию.^[31] Байесовские методы часто создают полезные модели, которые не используются для традиционных выводов и мало связаны с философией.^[32] Ни одна из философских интерпретаций вероятности (частотная или байесовская) не кажется надежной. Частотный подход слишком жесткий и ограничительный, в то время как байесовский взгляд может быть одновременно объективным и субъективным и т. Д.

Иллюстративные цитаты

"при тщательном использовании частотный подход дает широко применимые, хотя иногда и неуклюжие ответы"^[33]
«Настаивание на беспристрастных [частотных] методах может привести к отрицательным (но беспристрастным) оценкам дисперсии; использование значений p в нескольких тестах может привести к вопиющим противоречиям; обычные доверительные интервалы 0,95 могут фактически состоять из целой реальной линии. Неудивительно, что математикам часто трудно поверить в то, что традиционные статистические методы являются разделом математики ».^[34]
«Байесианство - это изящная и полностью принципиальная философия, а частотный подход - это набор оппортунистических, индивидуально оптимальных методов».^[26]
"в многопараметрических задачах плоские априорные значения могут дать очень плохие ответы"^[33]
«[Правило Байеса] гласит, что существует простой и элегантный способ объединить текущую информацию с предыдущим опытом, чтобы определить, сколько известно. Это означает, что достаточно надежные данные приведут к согласию ранее разрозненных наблюдателей. Оно полностью использует имеющиеся информации, и это дает решения с наименьшим возможным количеством ошибок ".^[35]
«Байесовская статистика - это утверждения вероятности, частотная статистика - оценка вероятностных утверждений».^[36]
«[S] татистов часто помещают в обстановку, напоминающую парадокс Эрроу, когда нас просят предоставить информативные и непредвзятые оценки, а также достоверные утверждения, правильные при условии наличия данных, а также лежащих в их основе истинных параметров».^[36] (Это противоречивые требования.)
«формальные логические аспекты часто являются относительно небольшой частью статистического анализа»^[33]
«Две философии, байесовская и частотная, скорее ортогональны, чем противоположны».^[26]
«Гипотеза, которая может быть верной, отвергается, потому что она не может предсказать наблюдаемые результаты, которых не было. Это кажется замечательной процедурой».^[24]

Резюме

У байесовской теории есть математическое преимущество
- Вероятность частичного использования имеет проблемы существования и согласованности
- Но найти хорошие априорные решения для применения байесовской теории остается (очень?) Сложно.
Обе теории имеют впечатляющие записи об успешном применении.
Ни одна из поддерживающих философских интерпретаций вероятности не является надежной.
Растет скептицизм в отношении связи между приложением и философией.
Некоторые статистики рекомендуют активное сотрудничество (помимо прекращения огня)

Принцип правдоподобия

Вероятность - это синоним вероятности в обычном использовании. В статистике это не так. Вероятность относится к переменным данным для фиксированной гипотезы, в то время как вероятность относится к различным гипотезам для фиксированного набора данных. Повторные измерения фиксированной длины с помощью линейки генерируют набор наблюдений. Каждый фиксированный набор условий наблюдений связан с распределением вероятностей, и каждый набор наблюдений можно интерпретировать как выборку из этого распределения - частотный подход к вероятности. В качестве альтернативы набор наблюдений может быть результатом выборки любого из ряда распределений (каждое из которых является результатом набора условий наблюдений). Вероятностная связь между фиксированной выборкой и переменным распределением (возникающая в результате гипотезы переменной) называется правдоподобием - байесовским взглядом на вероятность. Набор измерений длины может включать показания, снятые осторожными, трезвыми, отдохнувшими, заинтересованными наблюдателями при хорошем освещении.

Вероятность - это вероятность (или нет) по другому имени, которая существует из-за ограниченного частотного определения вероятности. Вероятность - это концепция, представленная и продвинутая Фишер в течение более 40 лет (хотя существовали и предыдущие ссылки на эту концепцию, а поддержка Фишера была нерешительной).^[37] Концепция была принята и существенно изменена Джеффрис.^[38] В 1962 г. Бирнбаум «доказал» принцип правдоподобия из допущений, приемлемых для большинства статистиков.^[39] «Доказательство» оспаривается статистиками и философами. Принцип гласит, что вся информация в образце содержится в функция правдоподобия, которое считается допустимым распределением вероятностей байесовцами (но не частотниками).

Некоторые (частотные) тесты значимости не соответствуют принципу правдоподобия. Байесовцы принимают принцип, который согласуется с их философией (возможно, поощряемый замешательством частотников). «[T] правдоподобный подход совместим с байесовским статистическим выводом в том смысле, что апостериорное байесовское распределение для параметра по теореме Байеса находится путем умножения априорного распределения на функцию правдоподобия».^[37] Frequentists интерпретируют этот принцип неблагоприятно для байесовцев, поскольку он не предполагает заботы о надежности доказательств. «Принцип правдоподобия байесовской статистики подразумевает, что информация о дизайне эксперимента, на основе которого собираются доказательства, не входит в статистический анализ данных».^[40] Многие байесовцы (например, Savage)^[41] признать это значение как уязвимость.

Принцип правдоподобия ставит в затруднительное положение обе основные философские школы статистики; Он ослабил оба, а не благоприятствовал ни одному из них. Его самые решительные сторонники утверждают, что он предлагает лучшую основу для статистики, чем любая из двух школ. «Вероятность [L] действительно выглядит очень хорошо, когда ее сравнивают с этими [байесовскими и частотными] альтернативами».^[42] Среди этих сторонников - статистики и философы науки.^[43] Хотя байесовцы признают важность вероятности для вычислений, они считают, что апостериорное распределение вероятностей является надлежащей основой для вывода.^[44]

Моделирование

Выводная статистика основана на статистические модели. Например, большая часть классической проверки гипотез основывалась на предполагаемой нормальности данных. Для уменьшения зависимости от этого предположения были разработаны надежные и непараметрические статистики. Байесовская статистика интерпретирует новые наблюдения с точки зрения предшествующих знаний - предполагая смоделированную преемственность между прошлым и настоящим. План экспериментов предполагает наличие определенных знаний об этих факторах, которые необходимо контролировать, варьировать, рандомизировать и наблюдать. Статистики хорошо осведомлены о трудностях доказательства причинной связи (в большей степени ограничение моделирования, чем математическое), говоря: "корреляция не подразумевает причинно-следственной связи ".

Более сложная статистика использует более сложные модели, часто с намерением найти скрытую структуру, лежащую в основе набора переменных. По мере роста сложности моделей и наборов данных,^[а]^[b] были подняты основополагающие вопросы об обоснованности моделей и обоснованности выводов, сделанных на их основе. Диапазон противоречивых мнений о моделировании велик.

Модели могут быть основаны на научной теории или на специальном анализе данных. Подходы используют разные методы. У каждого есть защитники.^[46]
Сложность модели - это компромисс. Информационный критерий Акаике и байесовский информационный критерий - это два менее субъективных подхода к достижению этого компромисса.^[47]
Были высказаны принципиальные оговорки даже в отношении простых регрессионные модели используется в социальных науках. Длинный список допущений, присущих действительности модели, обычно не упоминается и не проверяется. Благоприятное сравнение между наблюдениями и моделью часто считается достаточным.^[48]
Байесовская статистика настолько сильно фокусируется на апостериорной вероятности, что игнорирует фундаментальное сравнение наблюдений и модели.^[32]
Традиционные модели, основанные на наблюдениях, не подходят для решения многих важных проблем. Необходимо использовать гораздо более широкий спектр моделей, включая алгоритмические модели. «Если модель плохо подражает природе, выводы могут быть неверными».^[49]
Моделирование часто выполняется плохо (используются неправильные методы) и плохо сообщается.^[50]

В отсутствие строгого философского консенсуса в обзоре статистического моделирования многие статистики принимают предостерегающие слова статистика Джордж Бокс: "Все модели неправильные, но некоторые из них полезны."

Другое чтение

Краткое введение в основы статистики см. Стюарт, А .; Орд, Дж.(1994). «Глава 8 - Вероятность и статистический вывод». Продвинутая теория статистики Кендалла. Vol. I: теория распределения (6-е изд.). Эдвард Арнольд.

В его книге Статистика как главный аргумент, Роберт П. Абельсон формулирует позицию, согласно которой статистика служит стандартизированным средством урегулирования споров между учеными, которые в противном случае могли бы аргументировать достоинства своей собственной позиции. до бесконечности. С этой точки зрения статистика - это форма риторики; как и любые другие средства разрешения споров, статистические методы могут быть успешными только в том случае, если все стороны согласны с используемым подходом.^[51]

Смотрите также

Сноски

^ Некоторые большие модели пытаются предсказать поведение избирателей в Соединенных Штатах Америки. Население составляет около 300 миллионов человек. На каждого избирателя может повлиять множество факторов. О некоторых осложнениях поведения избирателей (которые легче всего понять туземцы) см .: Гельман.^[45]
^ Эфрон (2013) упоминает миллионы точек данных и тысячи параметров из научных исследований.^[26]

Цитаты

^ ^а ^б Эфрон 1978.
^ Bandyopadhyay & Forster 2011.
^ "цитаты Сэвиджа (1972)". Google ученый.
^ Дикарь 1972.
^ ^а ^б ^c ^d Леманн 2011.
^ ^а ^б ^c Gigerenzer et al. 1989 г..
^ ^а ^б Louçã 1993.
^ Фишер 1925.
^ Фишер 1935.
^ Фишер 1956.
^ Нейман и Пирсон 1933.
^ Нейман и Пирсон 1967.
^ Рубин, М (2020). ""Повторная выборка из той же популяции? "Критика ответов Неймана и Пирсона Фишеру". Европейский журнал философии науки. 10 (42): 1–15. Дои:10.1007 / s13194-020-00309-6.
^ Фишер 1955.
^ Нейман 1956 г..
^ ^а ^б ^c Леманн 1993.
^ Ленхард 2006.
^ Halpin & Stam 2006.
^ Леманн и Романо 2005.
^ Хаббард и Баярри c. 2003 г..
^ Сотос и др. 2007 г..
^ Финберг 2006.
^ де Финетти 1964.
^ ^а ^б Джеффрис 1939.
^ Дикарь 1954.
^ ^а ^б ^c ^d Эфрон 2013.
^ ^а ^б Маленький 2005.
^ Yu 2009.
^ Бергер 2003.
^ Мэйо 2013.
^ Сенн 2011.
^ ^а ^б Гельман и Шализи 2012.
^ ^а ^б ^c Кокс 2005.
^ Бернардо 2008.
^ Касс c. 2012 г..
^ ^а ^б Гельман 2008.
^ ^а ^б Эдвардс 1999.
^ Олдрич 2002.
^ Бирнбаум 1962.
^ Backe 1999.
^ Дикарь 1960, п. 585.
^ Forster & Sober 2001.
^ Роял 1997.
^ Линдли 2000.
^ Гельман. "Красно-синий разговор UBC" (PDF). Статистика. Columbia U.
^ Табачник и Фиделл 1996.
^ Форстер и Собер 1994.
^ Фридман 1995.
^ Брейман 2001.
^ Подбородок нет данных.
^ Абельсон, Роберт П. (1995). Статистика как главный аргумент. Лоуренс Эрлбаум Ассошиэйтс. ISBN 978-0-8058-0528-4. ... цель статистики состоит в том, чтобы организовать полезный аргумент на основе количественных свидетельств, используя форму принципиальной риторики.

использованная литература

Олдрич, Джон (2002). "Как вероятность и идентификация стали байесовскими" (PDF). Международный статистический обзор. 70 (1): 79–98. Дои:10.1111 / j.1751-5823.2002.tb00350.x.CS1 maint: ref = harv (ссылка на сайт)
Бакке, Эндрю (1999). «Принцип правдоподобия и достоверность экспериментов». Философия науки. 66: S354 – S361. Дои:10.1086/392737.CS1 maint: ref = harv (ссылка на сайт)
Bandyopadhyay, Prasanta; Форстер, Малькольм, ред. (2011). Философия статистики. Справочник по философии науки. 7. Оксфорд: Северная Голландия. ISBN 978-0444518620.CS1 maint: ref = harv (ссылка на сайт) Текст представляет собой сборник сочинений.
Бергер, Джеймс О. (2003). "Могли ли Фишер, Джеффрис и Нейман договориться о тестировании?". Статистическая наука. 18 (1): 1–32. Дои:10.1214 / сс / 1056397485.CS1 maint: ref = harv (ссылка на сайт)
Бернардо, Хосе М. (2008). «Комментарий к статье Гельмана». Байесовский анализ. 3 (3): 453. Дои:10.1214 / 08-BA318REJ.CS1 maint: ref = harv (ссылка на сайт)
Бирнбаум, А. (1962). «Об основах статистического вывода». J. Amer. Статист. Assoc. 57 (298): 269–326. Дои:10.1080/01621459.1962.10480660.CS1 maint: ref = harv (ссылка на сайт)
Брейман, Лео (2001). «Статистическое моделирование: две культуры». Статистическая наука. 16 (3): 199–231. Дои:10.1214 / сс / 1009213726.CS1 maint: ref = harv (ссылка на сайт)
Чин, Винн В. (нет данных). «Моделирование структурных уравнений в исследованиях ИБ - Понимание перспектив LISREL и PLS». Архивировано из оригинал на 2011-07-20. Получено 2013-09-16.CS1 maint: ref = harv (ссылка на сайт) Конспект лекций Хьюстонского университета?
Кокс, Д. Р. (2005). «Частичная и байесовская статистика: критика». Статистические проблемы физики элементарных частиц, астрофизики и космологии. PHYSTAT05. CiteSeerX 10.1.1.173.4608.CS1 maint: ref = harv (ссылка на сайт)
де Финетти, Бруно (1964). «Предвидение: его логические законы, его субъективные источники». В Кибурге, Х. Э. (ред.). Исследования субъективной вероятности. Х. Э. Смоклер. Нью-Йорк: Вили. С. 93–158.CS1 maint: ref = harv (ссылка на сайт) Перевод французского оригинала 1937 года с добавленными позже примечаниями.
Эдвардс, A.W.F. (1999). "Вероятность".CS1 maint: ref = harv (ссылка на сайт) Предварительная версия статьи для Международной энциклопедии социальных и поведенческих наук.
Эфрон, Брэдли (2013). «250-летний аргумент: вера, поведение и бутстрап». Бюллетень Американского математического общества. Новая серия. 50 (1): 129–146. Дои:10.1090 / s0273-0979-2012-01374-5.CS1 maint: ref = harv (ссылка на сайт)
Эфрон, Брэдли (1978). «Споры в основах статистики» (PDF). Американский математический ежемесячник. 85 (4): 231–246. Дои:10.2307/2321163. JSTOR 2321163. Архивировано из оригинал (PDF) 14 июля 2010 г.. Получено 1 ноября 2012.CS1 maint: ref = harv (ссылка на сайт)
Финберг, Стивен Э. (2006). «Когда байесовский вывод стал« байесовским »?». Байесовский анализ. 1 (1): 1–40. Дои:10.1214 / 06-ba101.CS1 maint: ref = harv (ссылка на сайт)
Фишер, Р.А. (1925). Статистические методы для научных работников. Эдинбург: Оливер и Бойд.CS1 maint: ref = harv (ссылка на сайт)
Фишер, Рональд А., сэр (1935). Дизайн экспериментов. Эдинбург: Оливер и Бойд.CS1 maint: ref = harv (ссылка на сайт)
Фишер, Р. (1955). «Статистические методы и научная индукция» (PDF). Журнал Королевского статистического общества, серия B. 17 (1): 69–78.CS1 maint: ref = harv (ссылка на сайт)
Фишер, Рональд А., сэр (1956). Логика научного вывода. Эдинбург: Оливер и Бойд.CS1 maint: ref = harv (ссылка на сайт)
Форстер, Малькольм; Собер, Эллиотт (1994). «Как определить, когда более простые, более унифицированные или менее специальные теории обеспечат более точные прогнозы». Британский журнал философии науки. 45 (1): 1–36. Дои:10.1093 / bjps / 45.1.1.CS1 maint: ref = harv (ссылка на сайт)
Форстер, Малькольм; Собер, Эллиотт (2001). «Почему вероятность». Вероятность и доказательства: 89–99.CS1 maint: ref = harv (ссылка на сайт)
Фридман, Дэвид (март 1995 г.). «Некоторые вопросы в основании статистики». Основы науки. 1 (1): 19–39. Дои:10.1007 / BF00208723.CS1 maint: ref = harv (ссылка на сайт)
Гельман, Андрей (2008). "Ответить". Байесовский анализ. 3 (3): 467–478. Дои:10.1214 / 08-BA318REJ.CS1 maint: ref = harv (ссылка на сайт) - Шутка переросла в серьезное обсуждение байесовских проблем 5 авторами (Гельман, Бернардо, Кадане, Сенн, Вассерман) на страницах 445-478.
Гельман, Андрей; Шализи, Косма Рохилла (2012). «Философия и практика байесовской статистики». Британский журнал математической и статистической психологии. 66 (1): 8–38. arXiv:1006.3868. Дои:10.1111 / j.2044-8317.2011.02037.x. ЧВК 4476974. PMID 22364575.CS1 maint: ref = harv (ссылка на сайт)
Гигеренцер, Герд; Свиджтинк, Зенон; Портер, Теодор; Дастон, Лоррейн; Битти, Джон; Крюгер, Лоренц (1989). «Часть 3: Эксперты по выводам». Империя случая: как вероятность изменила науку и повседневную жизнь. Издательство Кембриджского университета. С. 70–122. ISBN 978-0-521-39838-1.CS1 maint: ref = harv (ссылка на сайт)
Halpin, P.F .; Стам, Х.Дж. (зима 2006 г.). «Индуктивный вывод или индуктивное поведение: Фишер и Нейман: подходы Пирсона к статистическому тестированию в психологических исследованиях (1940–1960)». Американский журнал психологии. 119 (4): 625–653. Дои:10.2307/20445367. JSTOR 20445367. PMID 17286092.CS1 maint: ref = harv (ссылка на сайт)
Хаббард, Раймонд; Баярри, М.Дж. (ок. 2003 г.). "п-значения не являются вероятностями ошибки » (PDF). Архивировано из оригинал (PDF) 4 сентября 2013 г.. Получено 3 сентября 2013.CS1 maint: ref = harv (ссылка на сайт) - Рабочий документ, объясняющий разницу между доказательствами Фишера. п-значение и частота ошибок типа I Неймана – Пирсона ${ displaystyle alpha}$ .
Джеффрис, Х. (1939). Теория вероятности. Издательство Оксфордского университета.CS1 maint: ref = harv (ссылка на сайт)
Касс (ок. 2012 г.). «Почему так получается, что правило Байеса не только привлекает внимание стольких людей, но и вдохновляет религиозную преданность и споры, неоднократно, на протяжении многих лет?» (PDF).CS1 maint: ref = harv (ссылка на сайт)
Леманн, Э. (Декабрь 1993 г.). «Теории проверки гипотез Фишера, Неймана – Пирсона: одна теория или две?». Журнал Американской статистической ассоциации. 88 (424): 1242–1249. Дои:10.1080/01621459.1993.10476404.CS1 maint: ref = harv (ссылка на сайт)
Леманн, Э. Л. (2011). Фишер, Нейман и создание классической статистики. Нью-Йорк: Спрингер. ISBN 978-1441994998.CS1 maint: ref = harv (ссылка на сайт)
Lehmann, E.L .; Романо, Джозеф П. (2005). Проверка статистических гипотез (3-е изд.). Нью-Йорк: Спрингер. ISBN 978-0-387-98864-1.CS1 maint: ref = harv (ссылка на сайт)
Ленхард, Йоханнес (2006). «Модели и статистический вывод: противоречие между Фишером и Нейманом-Пирсоном». Br. J. Philos. Наука. 57: 69–91. Дои:10.1093 / bjps / axi152.CS1 maint: ref = harv (ссылка на сайт)
Линдли, Д.В. (2000). «Философия статистики». Журнал Королевского статистического общества, серия D. 49 (3): 293–337. Дои:10.1111/1467-9884.00238.CS1 maint: ref = harv (ссылка на сайт)
Литтл, Родерик Дж. (2006). «Калиброванный Байесовский протокол: дорожная карта Байеса / частотного анализа». 60 (3). Цитировать журнал требует | журнал = (Помогите)CS1 maint: ref = harv (ссылка на сайт)
Louçã, Франсиско (2008). «Должен ли самый широкий пробел в статистике - как и почему Фишер выступил против Неймана и Пирсона» (PDF).CS1 maint: ref = harv (ссылка на сайт) Рабочий документ содержит многочисленные цитаты из первоисточников спора.
Мэйо, Дебора Г. (Февраль 2013). «Обсуждение: байесовские методы: применяются? Да. Философская защита? В движении». Американский статистик. 67 (1): 11–15. Дои:10.1080/00031305.2012.752410. S2CID 11215443.CS1 maint: ref = harv (ссылка на сайт)
Нейман, Дж.; Пирсон, Э.С. (1 января 1933 г.). «К проблеме наиболее эффективных проверок статистических гипотез». Фил. Пер. R. Soc. Лондон. А. 231 (694–706): 289–337. Bibcode:1933РСПТА.231..289Н. Дои:10.1098 / рста.1933.0009.CS1 maint: ref = harv (ссылка на сайт)
Нейман, Дж. (1967). Совместные статистические работы Дж. Неймана и Э.С. Пирсон. Издательство Кембриджского университета.CS1 maint: ref = harv (ссылка на сайт)
Нейман, Ежи (1956). «Примечание к статье сэра Рональда Фишера». Журнал Королевского статистического общества, серия B. 18 (2): 288–294.CS1 maint: ref = harv (ссылка на сайт)
Ройалл, Ричард (1997). Статистические данные: парадигма вероятности. Чепмен и Холл. ISBN 978-0412044113.CS1 maint: ref = harv (ссылка на сайт)
Сэвидж, Л.Дж. (1972). Основы статистики (второе изд.).CS1 maint: ref = harv (ссылка на сайт)
Сенн, Стивен (2011). «Вы можете верить, что вы байесовец, но, вероятно, ошибаетесь». RMM. 2: 48–66.CS1 maint: ref = harv (ссылка на сайт)
Сотос, Ана Элиза Кастро; ван Хоф, Стейн; ван ден Ноортгейт, Вим; Онгена, Патрик (2007). «Неправильные представления студентов о статистических выводах: обзор эмпирических данных исследований по статистическому образованию». Обзор образовательных исследований. 2 (2): 98–113. Дои:10.1016 / j.edurev.2007.04.001.CS1 maint: несколько имен: список авторов (ссылка на сайт) CS1 maint: ref = harv (ссылка на сайт)
Стюарт, А .; Орд, Дж. (1994). Продвинутая теория статистики Кендалла. Vol. I: Теория распределения. Эдвард Арнольд.
Табачник, Барбара Дж .; Фиделл, Линда С. (1996). Использование многомерной статистики (3-е изд.). ISBN 978-0-673-99414-1. Основные компоненты - это эмпирический подход, в то время как факторный анализ и моделирование структурных уравнений обычно являются теоретическими подходами (стр. 27).CS1 maint: ref = harv (ссылка на сайт)
Ю, Юэ (2009). "Байесовец против частотного" (PDF).CS1 maint: ref = harv (ссылка на сайт) - Конспект лекций? Иллинойский университет в Чикаго

дальнейшее чтение

Барнетт, Вик (1999). Сравнительный статистический вывод (3-е изд.). Вайли. ISBN 978-0-471-97643-1.
Кокс, Дэвид Р. (2006). Принципы статистического вывода. Издательство Кембриджского университета. ISBN 978-0-521-68567-2.
Эфрон, Брэдли (1986), «Почему не все байесовцы? (С обсуждением)», Американский статистик, 40 (1): 1–11, Дои:10.2307/2683105, JSTOR 2683105.
Хорошо, И. Дж. (1988), «Связь между статистикой и философией науки», Статистическая наука, 3 (4): 386–397, Дои:10.1214 / сс / 1177012754, JSTOR 2245388
Кадане, Дж. Б.; Schervish, M.J .; Зайденфельд, Т. (1999). Переосмысление основ статистики. Издательство Кембриджского университета. - Байесовский.
Мэйо, Дебора Г. (1992), «Пирсон отверг философию статистики Неймана – Пирсона?», Синтез, 90 (2): 233–262, Дои:10.1007 / BF00485352, S2CID 14236921.

внешние ссылки

«Вероятностная интерпретация». Стэнфордская энциклопедия философии. Пало-Альто, Калифорния: Стэнфордский университет.
«Философия статистики». Стэнфордская энциклопедия философии. Пало-Альто, Калифорния: Стэнфордский университет.

[46] Некоторые большие модели пытаются предсказать поведение избирателей в Соединенных Штатах Америки. Население составляет около 300 миллионов человек. На каждого избирателя может повлиять множество факторов. О некоторых осложнениях поведения избирателей (которые легче всего понять туземцы) см .: Гельман.^[45]

[47] Эфрон (2013) упоминает миллионы точек данных и тысячи параметров из научных исследований.^[26]

[FOOTNOTEEfron1978-1] а ^б Эфрон 1978.

[FOOTNOTEBandyopadhyayForster2011-2] Bandyopadhyay & Forster 2011.

[3] "цитаты Сэвиджа (1972)". Google ученый.

[FOOTNOTESavage1972-4] Дикарь 1972.

[FOOTNOTELehmann2011-5] а ^б ^c ^d Леманн 2011.

[FOOTNOTEGigerenzerSwijtinkPorterDaston1989-6] а ^б ^c Gigerenzer et al. 1989 г..

[FOOTNOTELouçã1993-7] а ^б Louçã 1993.

[FOOTNOTEFisher1925-8] Фишер 1925.

[FOOTNOTEFisher1935-9] Фишер 1935.

[FOOTNOTEFisher1956-10] Фишер 1956.

[FOOTNOTENeymanPearson1933-11] Нейман и Пирсон 1933.

[FOOTNOTENeymanPearson1967-12] Нейман и Пирсон 1967.

[Rubin_(2020)-13] Рубин, М (2020). ""Повторная выборка из той же популяции? "Критика ответов Неймана и Пирсона Фишеру". Европейский журнал философии науки. 10 (42): 1–15. Дои:10.1007 / s13194-020-00309-6.

[FOOTNOTEFisher1955-14] Фишер 1955.

[FOOTNOTENeyman1956-15] Нейман 1956 г..

[FOOTNOTELehmann1993-16] а ^б ^c Леманн 1993.

[FOOTNOTELenhard2006-17] Ленхард 2006.

[FOOTNOTEHalpinStam2006-18] Halpin & Stam 2006.

[FOOTNOTELehmannRomano2005-19] Леманн и Романо 2005.

[FOOTNOTEHubbardBayarric._2003-20] Хаббард и Баярри c. 2003 г..

[FOOTNOTESotosVanhoofNoortgateOnghena2007-21] Сотос и др. 2007 г..

[FOOTNOTEFienberg2006-22] Финберг 2006.

[FOOTNOTEde_Finetti1964-23] де Финетти 1964.

[FOOTNOTEJeffreys1939-24] а ^б Джеффрис 1939.

[FOOTNOTESavage1954-25] Дикарь 1954.

[FOOTNOTEEfron2013-26] а ^б ^c ^d Эфрон 2013.

[FOOTNOTELittle2005-27] а ^б Маленький 2005.

[FOOTNOTEYu2009-28] Yu 2009.

[FOOTNOTEBerger2003-29] Бергер 2003.

[FOOTNOTEMayo2013-30] Мэйо 2013.

[FOOTNOTESenn2011-31] Сенн 2011.

[FOOTNOTEGelmanShalizi2012-32] а ^б Гельман и Шализи 2012.

[FOOTNOTECox2005-33] а ^б ^c Кокс 2005.

[FOOTNOTEBernardo2008-34] Бернардо 2008.

[FOOTNOTEKassc._2012-35] Касс c. 2012 г..

[FOOTNOTEGelman2008-36] а ^б Гельман 2008.

[FOOTNOTEEdwards1999-37] а ^б Эдвардс 1999.

[FOOTNOTEAldrich2002-38] Олдрич 2002.

[FOOTNOTEBirnbaum1962-39] Бирнбаум 1962.

[FOOTNOTEBacke1999-40] Backe 1999.

[FOOTNOTESavage1960585-41] Дикарь 1960, п. 585.

[FOOTNOTEForsterSober2001-42] Forster & Sober 2001.

[FOOTNOTERoyall1997-43] Роял 1997.

[FOOTNOTELindley2000-44] Линдли 2000.

[45] Гельман. "Красно-синий разговор UBC" (PDF). Статистика. Columbia U.

[FOOTNOTETabachnickFidell1996-48] Табачник и Фиделл 1996.

[FOOTNOTEForsterSober1994-49] Форстер и Собер 1994.

[FOOTNOTEFreedman1995-50] Фридман 1995.

[FOOTNOTEBreiman2001-51] Брейман 2001.

[FOOTNOTEChinn.d.-52] Подбородок нет данных.

[53] Абельсон, Роберт П. (1995). Статистика как главный аргумент. Лоуренс Эрлбаум Ассошиэйтс. ISBN 978-0-8058-0528-4. ... цель статистики состоит в том, чтобы организовать полезный аргумент на основе количественных свидетельств, используя форму принципиальной риторики.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]

[33]

[34]

[35]

[36]

[37]

[38]

[39]

[40]

[41]

[42]

[43]

[44]

[а]

[b]

[46]

[47]

[48]

[49]

[50]

[51]

[45]