История статистики - History of statistics
Статистика в современном понимании этого слова начала развиваться в 18 веке в ответ на новые потребности индустриализации. суверенные государства. Развитие статистики было, в частности, тесно связано с развитием европейских государств после Вестфальский мир (1648 г.), а с развитием теория вероятности, которые помещают статистику по фирме теоретические основы (видетьистория вероятности ).
Раньше значение ограничивалось информацией о состояниях, в частности демография например, население. Позднее он был расширен, чтобы включить все наборы информации всех типов, а позже он был расширен, чтобы включить анализ и интерпретацию таких данных. Говоря современным языком, «статистика» означает оба набора собранной информации, как в национальные счета и записи температуры, и аналитическая работа, которая требует статистические выводы. Статистическая деятельность часто связана с моделями, выраженными с использованием вероятности, отсюда и связь с теорией вероятностей. Высокие требования к обработке данных сделали статистику ключевым приложением вычислений; видеть история вычислительной техники. Ряд статистических концепций оказывает важное влияние на широкий круг наук. К ним относятся дизайн экспериментов и подходы к статистическому выводу, такие как Байесовский вывод, каждая из которых может рассматриваться как имеющая свою последовательность в развитии идей, лежащих в основе современной статистики.
Вступление
К 18 веку термин "статистика "назначил систематический сбор из демографический и экономический данные по штатам. По крайней мере, на протяжении двух тысячелетий эти данные представляли собой в основном таблицы человеческих и материальных ресурсов, которые могли облагаться налогом или использоваться в военных целях. В начале 19 века сбор данных усилился, и значение термина «статистика» расширилось и теперь включает дисциплину, связанную со сбором, обобщением и анализом данных. Сегодня данные собираются, статистика вычисляется и широко распространяется в правительстве, бизнесе, большинстве наук и спорте и даже во многих сферах деятельности. Электронный компьютеры ускорили более детальный статистический расчет даже если они облегчили сбор и агрегирование данных. Один аналитик данных может иметь доступный набор файлов данных с миллионами записей, каждая из которых содержит десятки или сотни отдельных измерений. Они собирались с течением времени в результате компьютерной деятельности (например, фондовой биржи) или компьютеризированных датчиков, кассовых регистров и т. Д. Затем компьютеры создают простые и точные сводки и позволяют проводить более утомительный анализ, например, требующий инвертирования большой матрицы или выполнения сотен шагов итераций, которые никогда не будут выполняться вручную. Более быстрые вычисления позволили статистикам разработать методы, требующие "интенсивного использования компьютера", которые могут рассматривать все перестановки, или использовать рандомизацию, чтобы посмотреть на 10 000 перестановок проблемы, чтобы оценить ответы, которые нелегко определить количественно с помощью одной теории.
Период, термин "математическая статистика "обозначает математические теории вероятность и статистические выводы, которые используются в статистическая практика. Однако связь между статистикой и теорией вероятностей возникла довольно поздно. В 19 веке статистика все чаще использовалась теория вероятности, первые результаты которого были обнаружены в 17-18 вв., в частности, при анализе азартные игры (играть в азартные игры). К 1800 году астрономия использовала вероятностные модели и статистические теории, в частности метод наименьших квадратов. Ранняя теория вероятностей и статистика были систематизированы в 19 веке, и социологи использовали статистические рассуждения и вероятностные модели для развития новых наук экспериментальная психология и социология, и учеными-физиками в термодинамика и статистическая механика. Развитие статистических рассуждений было тесно связано с развитием индуктивная логика и научный метод, которые вызывают озабоченность у статистиков от более узкой области математической статистики. Большая часть теоретических работ была уже доступна к тому времени, когда появились компьютеры для их использования. К 1970-м годам Джонсон и Коц выпустил четырехтомный Сборник статистических распределений (1-е изд., 1969-1972), который до сих пор является бесценным ресурсом.
Прикладную статистику можно рассматривать не как область математика но автономный математическая наука, подобно Информатика и исследование операций. В отличие от математики, статистика возникла в Государственное управление. Заявки возникли рано демография и экономика; Сегодня крупные области микро- и макроэкономики - это «статистика» с упором на анализ временных рядов. С акцентом на обучение на основе данных и составление точных прогнозов статистика также формировалась по областям академических исследований, включая психологическое тестирование, медицину и эпидемиология. Идеи статистического тестирования во многом совпадают с наука принятия решений. Заботясь о поиске и эффективном представлении данные, статистика пересекается с информационная наука и Информатика.
Этимология
- Искать статистика в Викисловарь, бесплатный словарь.
Период, термин статистика в конечном итоге происходит от Новая латынь statisticum collegium ("Государственный совет") и Итальянский слово statista ("государственный деятель" или "политик "). Немецкий Статистик, впервые представленный Готфрид Ахенвалл (1749), первоначально обозначенный как анализ данные о государственный, что означает "наука о государстве" (тогда называемая политическая арифметика по-английски). Он приобрел значение сбора и классификации данных в целом в начале 19 века. Он был введен на английский язык в 1791 г. Сэр Джон Синклер когда он опубликовал первый из 21 тома под названием Статистический отчет Шотландии.[1]
Таким образом, первоначальная основная цель Статистик это данные, которые будут использоваться правительственными и (часто централизованными) административными органами. Сбор данных о штатах и населенных пунктах продолжается, в основном национальные и международные статистические службы. Особенно, переписи предоставлять часто обновляемую информацию о численность населения.
Первой книгой, в названии которой была «статистика», была «Вклад в статистику естественного движения населения» (1845) Фрэнсиса Г.П. Нейсона, актуария Управления по делам инвалидов и общей жизни.[нужна цитата ]
Истоки теории вероятностей
Основные формы статистики использовались с начала цивилизации. Ранние империи часто сопоставляли переписи населения или регистрировали торговлю различными товарами. В династия Хан и Римская империя были одними из первых государств, которые начали тщательно собирать данные о численности населения империи, географической области и богатстве.
Использование статистических методов восходит к 5 веку до нашей эры. Историк Фукидид в его История Пелопоннесской войны[2] описывает, как афиняне рассчитывали высоту стены Плата подсчитав количество кирпичей в не оштукатуренном участке стены, достаточно близко к ним, чтобы можно было их сосчитать. Подсчет несколько раз повторил несколько солдат. Наиболее частое значение (в современной терминологии - Режим ), определенное таким образом, было принято за наиболее вероятное значение количества кирпичей. Умножение этого значения на высоту кирпичей, использованных в стене, позволило афинянам определить высоту лестниц, необходимых для масштабирования стен.[нужна цитата ]
Формы вероятность и статистика были разработаны Аль-Халиль (717–786 гг. Н. Э.), Арабский математик изучение криптология. Он написал Книга криптографических сообщений который содержит первое использование перестановки и комбинации перечислить все возможные арабский слова с гласными и без них.[3]
Самое раннее письмо на статистика был найден в арабской книге IX века под названием Рукопись по расшифровке криптографических сообщений, написано Аль-Кинди (801–873). В своей книге Аль-Кинди дал подробное описание того, как использовать статистику и частотный анализ расшифровать зашифрованный Сообщения. Этот текст, возможно, послужил началом как статистики, так и криптоанализ.[4][5] Аль-Кинди также использовал самое раннее известное использование статистические выводы, в то время как он и другие арабские криптологи разработали ранние статистические методы для расшифровка зашифрованные сообщения. Важный вклад Ибн Адлан (1187–1268) был на размер образца для использования частотного анализа.[3]
В Испытание Pyx это проверка чистоты чеканки Королевский монетный двор который проводится на регулярной основе с 12 века. Само испытание основано на методах статистической выборки. После чеканки серии монет - первоначально из десяти фунтов серебра - одну монету поместили в Pyx - коробку в Вестминстерское аббатство. По истечении определенного периода - теперь один раз в год - монеты удаляются и взвешиваются. Затем образец монет, извлеченный из коробки, проверяется на чистоту.
В Nuova Cronica, 14 век история Флоренции флорентийским банкиром и чиновником Джованни Виллани, включает много статистической информации о населении, постановлениях, торговле и торговле, образовании и религиозных объектах и был описан как первое введение статистики как положительный элемент в истории,[6] хотя ни термина, ни концепции статистики как отдельной области еще не существовало. Но это оказалось неверным после повторного открытия Аль-Кинди книга о частотный анализ.[4][5]
Арифметика иметь в виду, хотя это понятие было известно грекам, оно не было обобщено более чем на два значения до 16 века. Изобретение десятичной системы Саймон Стевин в 1585 году, вероятно, облегчил эти вычисления. Этот метод впервые был принят в астрономию Тихо Браге который пытался уменьшить ошибки в своих оценках местоположения различных небесных тел.
Идея медиана возник в Эдвард Райт книга по навигации (Определенные ошибки в навигации) в 1599 г. в разделе об определении местоположения по компасу. Райт считал, что это значение, скорее всего, будет правильным значением в серии наблюдений.
Рождение статистики часто датируется 1662 годом, когда Джон Граунт, вместе с Уильям Петти, развитые ранние человеческие статистические и перепись методы, которые послужили основой для современных демография. Он произвел первые таблица жизни, давая вероятность выживания для каждого возраста. Его книга Естественные и политические наблюдения, сделанные на счетах смертности использовал анализ смертность рулонов, чтобы сделать первую статистически обоснованную оценку населения Лондон. Он знал, что в Лондоне ежегодно совершается около 13 000 похорон и что на одиннадцать семей ежегодно умирают три человека. Он подсчитал из приходских записей, что средний размер семьи составлял 8 человек, и подсчитал, что население Лондона составляло около 384 000 человек; это первое известное использование оценщик соотношения. Лаплас в 1802 году аналогичным методом оценивал население Франции; видеть Оценка отношения § История для подробностей.
Хотя первоначальный объем статистики ограничивался данными, полезными для управления, в XIX веке этот подход был распространен на многие области научного или коммерческого характера. Математические основы предмета во многом основывались на новых теория вероятности, впервые в 16 веке Джероламо Кардано, Пьер де Ферма и Блез Паскаль. Кристиан Гюйгенс (1657) дал самую раннюю известную научную трактовку этого предмета. Якоб Бернулли с Ars Conjectandi (посмертно, 1713 г.) и Авраам де Муавр с Доктрина шансов (1718) рассматривал этот предмет как раздел математики. В своей книге Бернулли представил идею представления полной уверенности как единицы, а вероятности как числа от нуля до единицы.
Ключевым ранним применением статистики в 18 веке было исследование соотношение полов человека при рождении.[7] Джон Арбетнот изучал этот вопрос в 1710 году.[8][9][10][11] Арбутнот исследовал записи о рождении в Лондоне за каждый из 82 лет с 1629 по 1710 год. Каждый год число рожденных в Лондоне мужчин превышало число женщин. Если рассматривать большее количество мужских или женских рождений как равновероятные, вероятность наблюдаемого результата составляет 0,5 ^ 82, или примерно 1 из 4,8360,0000,0000,0000,0000,0000; говоря современным языком, п-ценить. Это исчезающе малое, что приводит Арбетнота к тому, что это произошло не случайно, а по божественному провидению: «Отсюда следует, что правит искусство, а не случайность». Эта и другие работы Арбетнота считаются "первым использованием тесты значимости "[12] первый пример рассуждения о Статистическая значимость и моральная уверенность,[13] и «… возможно, первый опубликованный отчет о непараметрический тест …",[9] в частности знаковый тест; см. подробности на Знаковый тест § История.
Формальное изучение теория ошибок может быть прослежен до Роджер Котс ' Опера Разное (посмертно, 1722 г.), но мемуары подготовили Томас Симпсон в 1755 г. (напечатано 1756 г.) впервые применил теорию к обсуждению ошибок наблюдения. В перепечатке (1757 г.) этого мемуара излагается аксиомы что положительные и отрицательные ошибки равновероятны, и что существуют определенные назначаемые пределы, в которые можно предположить, что все ошибки находятся; обсуждаются непрерывные ошибки и дается кривая вероятности. Симпсон обсудил несколько возможных распределений ошибок. Он первым рассмотрел равномерное распределение а затем дискретный симметричный треугольное распределение с последующим непрерывным симметричным треугольным распределением. Тобиас Майер в своем исследовании либрация из Луна (Kosmographische Nachrichten, Nuremberg, 1750), изобрел первый формальный метод оценки неизвестных величин путем обобщения усреднения наблюдений при идентичных обстоятельствах до усреднения групп подобных уравнений.
Роджер Джозеф Боскович в 1755 году на основе его работы о форме земли, предложенной в его книге De Litteraria Expeditione per pontificiam ditionem ad dimetiendos duos meridiani gradus a PP. Maire et Boscovicli что истинная ценность серии наблюдений будет такой, которая минимизирует сумму абсолютных ошибок. В современной терминологии это значение - медиана. Первый пример того, что позже стало известно как нормальная кривая, был изучен Авраам де Муавр который построил эту кривую 12 ноября 1733 г.[14] де Муавр изучал количество выпавших орлов при подбрасывании «честной» монеты.
В 1761 г. Томас Байес доказано Теорема Байеса и в 1765 г. Джозеф Пристли изобрел первый график графики.
Иоганн Генрих Ламберт в его книге 1765 года Anlage zur Architectonic предложил полукруг как распределение ошибок:
с -1 < Икс < 1.
Пьер-Симон Лаплас (1774) сделал первую попытку вывести правило комбинирования наблюдений из принципов теории вероятностей. Он изобразил закон вероятности ошибок кривой и вывел формулу для среднего трех наблюдений.
Лаплас в 1774 году заметил, что частота ошибки может быть выражена как экспоненциальная функция от ее величины, если не учитывать ее знак.[15][16] Это распределение теперь известно как Распределение Лапласа. Лагранж предложил параболическое распределение ошибок в 1776 г.
В 1778 году Лаплас опубликовал свой второй закон ошибок, в котором он отметил, что частота ошибки пропорциональна экспоненте квадрата ее величины. Впоследствии это было открыто заново Гаусс (возможно, в 1795 году) и сейчас наиболее известен как нормальное распределение что имеет центральное значение в статистике.[17] Это распределение впервые было названо нормальный распределение по К. С. Пирс в 1873 году, который изучал ошибки измерения при падении предмета на деревянную основу.[18] Он выбрал термин нормальный из-за его частого появления в естественных переменных.
Лагранж также предложил в 1781 году два других распределения ошибок: распределение приподнятого косинуса и логарифмическое распределение.
Лаплас дал (1781 г.) формулу закона легкости ошибки (термин, обусловленный Жозеф Луи Лагранж, 1774), но тот, который привел к неуправляемым уравнениям. Даниэль Бернулли (1778) ввел принцип максимального произведения вероятностей системы одновременных ошибок.
В 1786 г. Уильям Плейфэр (1759-1823) ввел идею графического представления в статистику. Он изобрел линейный график, гистограмма и гистограмма и включил их в свои работы по экономика, то Коммерческий и политический атлас. За этим последовало в 1795 году его изобретение круговая диаграмма и круговая диаграмма, которую он использовал для отображения эволюции импорта и экспорта Англии. Эти последние диаграммы привлекли всеобщее внимание, когда он опубликовал примеры в своей Статистический Бревиарий в 1801 г.
Лапласа при исследовании движений Сатурн и Юпитер в 1787 г. обобщил метод Майера с использованием различных линейных комбинаций одной группы уравнений.
В 1791 г. Сэр Джон Синклер ввел термин «статистика» на английский язык в своей Статистические отчеты Шотландии.
В 1802 году Лаплас оценил население Франции в 28 328 612 человек.[19] Он рассчитал эту цифру, используя количество рождений в предыдущем году и данные переписи для трех общин. Данные переписи этих общин показали, что в них проживает 2 037 615 человек, а число рождений - 71 866 человек. Предполагая, что эти образцы были репрезентативными для Франции, Лаплас произвел свою оценку для всего населения.
В метод наименьших квадратов, который использовался для минимизации ошибок в данных измерение, был опубликован независимо Адриан-Мари Лежандр (1805), Роберт Адрейн (1808), и Карл Фридрих Гаусс (1809). Гаусс использовал этот метод в своем знаменитом предсказании 1801 г. карликовая планета Церера. Наблюдения, на которых основывал свои расчеты Гаусс, были сделаны итальянским монахом Пиацци.
Методу наименьших квадратов предшествовало использование среднего наклона регрессии. Этот метод минимизирует сумму абсолютных отклонений. Метод оценки этого наклона был изобретен Роджер Джозеф Боскович в 1760 г. он применил его к астрономии.
Период, термин вероятная ошибка (der wahrscheinliche Fehler) - среднее отклонение от среднего - было введено в 1815 году немецким астрономом Фредерик Вильгельм Бессель. Антуан Огюстен Курно в 1843 г. впервые употребил термин медиана (Валер Медиан) для значения, которое делит распределение вероятностей на две равные половины.
Другими участниками теории ошибок были Эллис (1844 г.), Де Морган (1864), Глейшер (1872 г.), и Джованни Скиапарелли (1875).[нужна цитата ] Формула Петерса (1856) для , "вероятная ошибка" отдельного наблюдения широко использовалась и вдохновляла надежная статистика (устойчивы к выбросы: видеть Критерий Пирса ).
В XIX веке авторы статистическая теория включен Лаплас, С. Лакруа (1816), Литтроу (1833), Дедекинд (1860), Гельмерт (1872), Лоран (1873), Лиагре, Дидион, Де Морган и Логический.
Густав Теодор Фехнер использовали медианное значение (Centralwerth) в социологических и психологических явлениях.[20] Ранее он использовался только в астрономии и смежных областях. Фрэнсис Гальтон использовал английский термин медиана впервые в 1881 г., ранее употребляя термины среднее значение в 1869 г. и средний в 1880 г.[21]
Адольф Кетле (1796–1874), другой важный основатель статистики, ввел понятие «среднего человека» (l'homme moyen) как средство понимания сложных социальных явлений, таких как показатели преступности, процент брака, и уровень самоубийств.[22]
Первые тесты нормального распределения были изобретены немецким статистиком. Вильгельм Лексис в 1870-х гг. Единственные доступные ему наборы данных, которые он смог показать, были нормально распределенными, - это коэффициенты рождаемости.
Развитие современной статистики
Хотя истоки статистической теории лежат в достижениях теории вероятностей XVIII века, современная область статистики возникла только в конце XIX - начале XX века в три этапа. Первую волну на рубеже веков возглавляли работы Фрэнсис Гальтон и Карл Пирсон, который превратил статистику в строгую математическую дисциплину, используемую для анализа не только в науке, но также в промышленности и политике. Вторая волна 1910-1920-х годов была инициирована Уильям Сили Госсет, и достигла своей кульминации в понимании Рональд Фишер. Это включало разработку лучшего дизайн экспериментов модели, проверка гипотез и методы для использования с небольшими выборками данных. Последняя волна, которая в основном представляла собой усовершенствование и расширение более ранних разработок, возникла в результате совместной работы между Эгон Пирсон и Ежи Нейман в 1930-е гг.[23] Сегодня статистические методы применяются во всех областях, связанных с принятием решений, для точных выводов на основе сопоставленного массива данных и для принятия решений в условиях неопределенности на основе статистической методологии.
Первые статистические органы были созданы в начале 19 века. В Королевское статистическое общество была основана в 1834 году и Флоренс Найтингейл, ее первая женщина-член, стала пионером в применении статистического анализа к проблемам здоровья для содействия пониманию эпидемиологии и практики общественного здравоохранения. Однако методы, которые использовались тогда, сегодня не считаются современной статистикой.
В Оксфорд ученый Фрэнсис Исидро Эджворт книга, Метретике: или метод измерения вероятности и полезности (1887) рассматривал вероятность как основу индуктивного мышления, а его более поздние работы были сосредоточены на «философии случая».[24] Его первая статья по статистике (1883 г.) исследовала закон ошибки (нормальное распределение ), и его Методы статистики (1885) представил раннюю версию t распределение, то Расширение Эджворта, то Серия Эджворта, метод вариационного преобразования и асимптотическая теория оценок максимального правдоподобия.
Норвежский Андерс Николай Кийр представил концепцию стратифицированная выборка в 1895 г.[25] Артур Лайон Боули ввел новые методы выборки данных в 1906 г. при работе над социальной статистикой. Хотя статистические исследования социальных условий начались с Чарльз Бут «Жизнь и труд людей в Лондоне» (1889–1903) и Сибом Раунтри "Бедность. Исследование городской жизни" (1901), Боули, ключевое нововведение состояло в использовании случайная выборка техники. Его усилия увенчались его Новый обзор жизни и труда Лондона.[26]
Фрэнсис Гальтон считается одним из основных основоположников статистической теории. Его вклад в эту область включал введение концепций стандартное отклонение, корреляция, регресс и применение этих методов к изучению множества характеристик человека, включая рост, вес, длину ресниц. Он обнаружил, что многие из них можно подогнать к нормальному распределению кривой.[27]
Гальтон представил доклад Природа в 1907 г. о полезности медианы.[28] Он проверил точность 787 предположений о весе быка на сельской ярмарке. Фактический вес составлял 1208 фунтов: среднее предположение было 1198. Предположения были явно ненормально распределены.
Публикация Гальтона Естественное наследование в 1889 году вызвал интерес блестящего математика, Карл Пирсон,[29] затем работая в Университетский колледж Лондона, а затем он основал дисциплину математической статистики.[30] Он подчеркивал статистическую основу научных законов и продвигал их изучение, а его лаборатория привлекала студентов со всего мира, которых привлекали его новые методы анализа, в том числе Удный Йоль. Его работа расширилась, чтобы охватить области биология, эпидемиология, антропометрия, лекарство и социальные история. В 1901 г. Уолтер Велдон, Основатель биометрия, и Гальтон, он основал журнал Биометрика как первый журнал математической статистики и биометрии.
Его работа и работа Гальтона лежат в основе многих «классических» статистических методов, которые широко используются сегодня, в том числе Коэффициент корреляции, определяемый как продукт-момент;[31] в метод моментов для подгонки распределений к образцам; Система непрерывных кривых Пирсона это составляет основу теперь обычных непрерывных распределений вероятностей; Расстояние Ци предшественник и частный случай Расстояние Махаланобиса[32] и P-значение, определяемую как вероятностную меру дополнения мяч с предполагаемым значением в качестве центральной точки и расстоянием хи в качестве радиуса.[32] Он также ввел термин «стандартное отклонение».
Он также основал теория проверки статистических гипотез,[32] Критерий хи-квадрат Пирсона и Анализ главных компонентов.[33][34] В 1911 году он основал первый в мире университетский статистический факультет в Университетский колледж Лондона.
Вторая волна математической статистики была основана Рональд Фишер кто написал два учебника, Статистические методы для научных работников, опубликовано в 1925 г. и План экспериментов в 1935 году они должны были определить академические дисциплины в университетах по всему миру. Он также систематизировал предыдущие результаты, поставив их на прочную математическую основу. В своей основополагающей статье 1918 г. Корреляция между родственниками на основе предположения о менделевской наследственности, первое использование статистического термина, отклонение. В 1919 г. Экспериментальная станция Ротамстед он начал серьезное исследование обширных собраний данных, записанных за многие годы. В результате появилась серия отчетов под общим названием Исследования по изменчивости сельскохозяйственных культур. В 1930 году он опубликовал Генетическая теория естественного отбора где он применил статистику к эволюция.
В течение следующих семи лет он первым внедрил принципы дизайн экспериментов (см. ниже) и разработал свои исследования дисперсионного анализа. Он продолжил свои исследования статистики малых выборок. Возможно, что еще более важно, он начал свой систематический подход к анализу реальных данных как трамплин для разработки новых статистических методов. Он разработал вычислительные алгоритмы для анализа данных из его сбалансированных экспериментальных проектов. В 1925 году эта работа привела к публикации его первой книги, Статистические методы для научных работников.[35] В последующие годы эта книга претерпела множество изданий и переводов и стала стандартным справочником для ученых во многих дисциплинах.В 1935 году за этой книгой последовала План экспериментов, который также получил широкое распространение.
В дополнение к дисперсионному анализу Фишер назвал и продвигал метод максимальная вероятность оценка. Фишер также создал концепции достаточность, вспомогательная статистика, Линейный дискриминатор Фишера и Информация Fisher. Его статья О распределении, дающем функции ошибок нескольких хорошо известных статистик (1924) представлены Критерий хи-квадрат Пирсона и Уильям Сили Госсет с т в тех же рамках, что и Гауссово распределение, а его собственный параметр в дисперсионном анализе Z-распределение Фишера (чаще используется десятилетия спустя в форме F распределение ).[36]Уровень значимости 5%, по-видимому, был введен Фишером в 1925 году.[37] Фишер заявил, что отклонения, превышающие вдвое стандартное отклонение, считаются значительными. Ранее значительными считались отклонения, превышающие трехкратную вероятную ошибку. Для симметричного распределения вероятная ошибка составляет половину межквартильного размаха. Для нормального распределения вероятная ошибка составляет примерно 2/3 стандартного отклонения. Похоже, что критерий 5% Фишера был основан на предыдущей практике.
Среди других важных вкладов в это время Чарльз Спирман с коэффициент ранговой корреляции это было полезным расширением коэффициента корреляции Пирсона. Уильям Сили Госсет, английский статистик, более известный под псевдонимом Ученик, представил Распределение Стьюдента, непрерывное распределение вероятностей, полезное в ситуациях, когда размер выборки мал и стандартное отклонение генеральной совокупности неизвестно.
Эгон Пирсон (Сын Карла) и Ежи Нейман ввел понятие "Тип II "ошибка, сила теста и доверительные интервалы. Ежи Нейман в 1934 г. показал, что стратифицированная случайная выборка в целом является лучшим методом оценки, чем целенаправленная (квотная) выборка.[38]
Дизайн экспериментов
Эта секция слишком полагается на Рекомендации к основные источники.Февраль 2012 г.) (Узнайте, как и когда удалить этот шаблон сообщения) ( |
В 1747 году, работая хирургом на HM Bark Солсбери, Джеймс Линд провел контролируемый эксперимент по разработке лекарства от цинга.[39] В этом исследовании кейсы его испытуемых «были настолько похожи, насколько я мог их представить», то есть он предоставил строгие требования для входа, чтобы уменьшить посторонние вариации. Мужчины были парными, что обеспечивало блокировка. С современной точки зрения, главное, чего не хватает, - это рандомизированное распределение субъектов для лечения.
Линда сегодня часто называют экспериментатором, который постоянно учитывает каждый фактор.[40] Аналогичные однофакторные эксперименты (OFAT) проводились в Ротамстедская исследовательская станция в 1840-х годах сэром Джон Лоз определить оптимальные неорганические удобрения для пшеницы.[40]
Теория статистического вывода была разработана Чарльз С. Пирс в "Иллюстрации логики науки "(1877–1878) и"Теория вероятного вывода "(1883), две публикации, в которых подчеркивалась важность рандомизационных выводов в статистике. В другом исследовании Пирс случайным образом распределял добровольцев по ослепленный, дизайн с повторными мерами оценить их способность различать веса.[41][42][43][44]
Эксперимент Пирса вдохновил других исследователей в области психологии и образования, которые разработали исследовательскую традицию рандомизированных экспериментов в лабораториях и специализированных учебниках в 1800-х годах.[41][42][43][44] Пирс также подготовил первую англоязычную публикацию на оптимальный дизайн за регресс -модели в 1876 г.[45] Новаторский оптимальный дизайн за полиномиальная регрессия было предложено Gergonne в 1815 г.[нужна цитата ] В 1918 г. Кирстин Смит опубликовал оптимальные планы для многочленов шестой степени (и меньше).[46]
Было впервые предложено использование последовательности экспериментов, дизайн каждого из которых может зависеть от результатов предыдущих экспериментов, включая возможное решение прекратить эксперименты.[47] к Авраам Вальд в контексте последовательной проверки статистических гипотез.[48] Доступны опросы оптимальных последовательные планы,[49] и из адаптивный дизайн.[50] Одним из специфических типов последовательного дизайна является «двурукий бандит», обобщенный на многорукий бандит, над которым раньше работали Герберт Роббинс в 1952 г.[51]
Термин «план экспериментов» (DOE) происходит от ранних статистических работ, выполненных Сэр Рональд Фишер. Его описал Андерс Халд как «гений, который практически в одиночку создал основы современной статистической науки».[52] Фишер инициировал принципы дизайн экспериментов и подробно остановился на своих исследованиях "дисперсионный анализ «. Возможно, что еще более важно, Фишер начал свой систематический подход к анализу реальных данных как трамплин для разработки новых статистических методов. Он начал уделять особое внимание трудозатратам, связанным с необходимыми вычислениями, выполняемыми вручную, и разработал методы. которые были столь же практичны, сколь и основаны на строгости. В 1925 году эта работа завершилась публикацией его первой книги, Статистические методы для научных работников.[53] В последующие годы она вошла во множество изданий и переводов и стала стандартной справочной работой для ученых во многих дисциплинах.[54]
Методология планирования экспериментов была предложена Рональд А. Фишер в своей новаторской книге План экспериментов (1935), который также стал стандартом.[55][56][57][58] В качестве примера он описал, как проверить гипотеза что некая дама могла определить только по вкусу, было ли сначала добавлено в чашку молоко или чай. Хотя это звучит как легкомысленное заявление, оно позволило ему проиллюстрировать наиболее важные идеи экспериментального дизайна: см. Леди дегустация чая.
Сельскохозяйственная наука достижения служили для удовлетворения сочетания большего количества городского населения и меньшего количества ферм. Но для ученых-растениеводов, чтобы должным образом учитывать сильно различающиеся географические климатические условия и потребности выращивания, было важно дифференцировать местные условия выращивания. Чтобы экстраполировать эксперименты с местными культурами на национальный масштаб, им пришлось экономно расширить тестирование образцов культур на все население. По мере развития статистических методов (в первую очередь эффективности запланированных экспериментов вместо экспериментов по одному фактору), репрезентативный факторный план экспериментов начал делать возможным значимое распространение результатов экспериментальной выборки на популяцию в целом. .[нужна цитата ] Но было трудно решить, насколько репрезентативна была выбрана выборка сельскохозяйственных культур.[нужна цитата ] Методология факторного дизайна показала, как оценивать и корректировать любые случайные отклонения в выборке, а также в процедурах сбора данных.
Байесовская статистика
Период, термин Байесовский относится к Томас Байес (1702–1761), которые доказали, что вероятностные пределы могут быть наложены на неизвестное событие. Однако это было Пьер-Симон Лаплас (1749–1827), который ввел (в качестве принципа VI) то, что сейчас называется Теорема Байеса и применил его к небесная механика, медицинская статистика, надежность, и юриспруденция.[59] Когда было недостаточно знаний для определения информированного априора, Лаплас использовал униформа приоры, по его "принцип недостаточной причины ".[59][60] Лаплас принял единообразные априорные решения скорее из соображений математической простоты, чем из философских соображений.[59] Лаплас также представил[нужна цитата ] примитивные версии сопряженные приоры и теорема из фон Мизес и Бернштейн, согласно которому апостериорные элементы, соответствующие изначально различающимся априорным признакам, в конечном итоге согласуются с увеличением числа наблюдений.[61] Этот ранний байесовский вывод, в котором использовались единообразные априорные значения, следующие за Лапласом. принцип недостаточной причины, назывался "обратная вероятность " (потому что это делает вывод назад от наблюдений к параметрам или от следствий к причинам[62]).
После 1920-х гг. обратная вероятность был в значительной степени вытеснен[нужна цитата ] набором методов, разработанных Рональд А. Фишер, Ежи Нейман и Эгон Пирсон. Их методы стали называть частотная статистика.[62] Фишер отверг байесовскую точку зрения, написав, что «теория обратной вероятности основана на ошибке и должна быть полностью отвергнута».[63] Однако в конце своей жизни Фишер выразил большее уважение к эссе Байеса, которое, как полагал Фишер, предвосхитило его собственное: реперный подход к вероятности; Фишер по-прежнему утверждал, что взгляды Лапласа на вероятность были «ложным вздором».[63] Нейман начинал как «квазибайесовец», но впоследствии развил доверительные интервалы (ключевой метод в частотной статистике), потому что «вся теория выглядела бы лучше, если бы она была построена с самого начала без ссылки на байесовство и априорные факторы».[64]Слово Байесовский появился примерно в 1950 году, а к 1960-м годам он стал термином, предпочитаемым теми, кто недоволен ограниченностью частотной статистики.[62][65]
В ХХ веке идеи Лапласа получили дальнейшее развитие в двух разных направлениях, что привело к цель и субъективный течения в байесовской практике. В потоке объективистов статистический анализ зависит только от предполагаемой модели и проанализированных данных.[66] Не нужно принимать никаких субъективных решений. Напротив, «субъективные» статистики отрицают возможность полностью объективного анализа для общего случая.
В дальнейшем развитии идей Лапласа субъективные идеи предшествовали объективистским позициям. Идея о том, что «вероятность» следует интерпретировать как «субъективную степень веры в предложение», была предложена, например, Джон Мейнард Кейнс в начале 1920-х гг.[нужна цитата ] Эта идея была развита Бруно де Финетти в Италии (Fondamenti Logici del Ragionamento Probabilistico, 1930) и Фрэнк Рэмси в Кембридже (Основы математики, 1931).[67] Подход был разработан для решения проблем с частотное определение вероятности но также с более ранним объективистским подходом Лапласа.[66] Субъективные байесовские методы получили дальнейшее развитие и популяризацию в 1950-х годах. Л.Дж. Сэвидж.[нужна цитата ]
Объективный байесовский вывод получил дальнейшее развитие Гарольд Джеффрис на Кембриджский университет. Его основополагающая книга «Теория вероятностей» впервые появилась в 1939 году и сыграла важную роль в возрождении теории вероятностей. Байесовский взгляд на вероятность.[68][69] В 1957 г. Эдвин Джейнс продвигал концепцию максимальная энтропия для построения априорных значений, что является важным принципом при формулировке объективных методов, в основном для дискретных задач. В 1965 г. Деннис Линдли Двухтомный труд «Введение в вероятность и статистику с байесовской точки зрения» познакомил широкую аудиторию с байесовскими методами. В 1979 г. Хосе-Мигель Бернардо представил справочный анализ,[66] который предлагает общую применимую основу для объективного анализа.[70] Среди других известных сторонников байесовской теории вероятностей: I.J. Хороший, Б.О. Купман, Говард Райффа, Роберт Шлайфер и Алан Тьюринг.
В 1980-х годах наблюдался резкий рост исследований и приложений байесовских методов, в основном связанный с открытием Цепь Маркова Монте-Карло методы, которые удалили многие из вычислительные проблемы и растущий интерес к нестандартным и сложным приложениям.[71] Несмотря на рост байесовских исследований, большая часть обучения в бакалавриате по-прежнему основана на частотной статистике.[72] Тем не менее, байесовские методы широко распространены и используются, например, в области машинное обучение.[73]
Важные участники статистики
Рекомендации
- ^ Болл, Филипп (2004). Критическая масса. Фаррар, Штраус и Жиру. п. 53. ISBN 978-0-374-53041-9.
- ^ Фукидид (1985). История Пелопоннесской войны. Нью-Йорк: Penguin Books, Ltd. стр. 204.
- ^ а б Бромелинг, Лайл Д. (1 ноября 2011 г.). «Отчет о ранних статистических выводах в арабской криптологии». Американский статистик. 65 (4): 255–257. Дои:10.1198 / tas.2011.10191. S2CID 123537702.
- ^ а б Сингх, Саймон (2000). Кодовая книга: наука секретности от древнего Египта до квантовой криптографии (1-е изд. Якорных книг). Нью-Йорк: якорные книги. ISBN 978-0-385-49532-5.
- ^ а б Ибрагим А. Аль-Кади "Истоки криптологии: вклад арабов", Криптология, 16 (2) (апрель 1992), стр. 97–126.
- ^ Виллани, Джованни. Encyclopdia Britannica. DVD Encyclopdia Britannica 2006 Ultimate Reference Suite. Проверено 4 марта 2008.
- ^ Брайан, Эрик; Джейссон, Мари (2007). «Физико-теология и математика (1710–1794)». Происхождение соотношения полов человека при рождении. Springer Science & Business Media. С. 1–25. ISBN 978-1-4020-6036-6.
- ^ Джон Арбетнот (1710). «Аргумент в пользу Божественного провидения, взятый из постоянной закономерности, наблюдаемой в рождении обоих полов» (PDF). Философские труды Лондонского королевского общества. 27 (325–336): 186–190. Дои:10.1098 / рстл.1710.0011. S2CID 186209819.
- ^ а б Коновер, У.Дж. (1999), "Глава 3.4: Знаковый тест", Практическая непараметрическая статистика (Третье изд.), Wiley, стр. 157–176, ISBN 978-0-471-16068-7
- ^ Спрент, П. (1989), Прикладные методы непараметрической статистики (Второе изд.), Chapman & Hall, ISBN 978-0-412-44980-2
- ^ Стиглер, Стивен М. (1986). История статистики: измерение неопределенности до 1900 г.. Издательство Гарвардского университета. стр.225–226. ISBN 978-0-67440341-3.
- ^ Беллхаус, П. (2001), «Джон Арбетнот», в книге «Статистики веков» К. Хейде и Э. Сенета, Springer, стр. 39–42, ISBN 978-0-387-95329-8
- ^ Халд, Андерс (1998), «Глава 4. Случайность или замысел: критерии значимости», История математической статистики с 1750 по 1930 гг., Wiley, стр. 65
- ^ де Муавр, А. (1738) Учение о шансах. Лесопад
- ^ Лаплас, П-С (1774 г.). "Mémoire sur la probabilité desasons par les évènements". Mémoires de l'Académie Royale des Sciences Présentés par Divers Savants. 6: 621–656.
- ^ Уилсон, Эдвин Бидвелл (1923) «Первый и второй законы ошибки», Журнал Американской статистической ассоциации, 18 (143), 841-851 JSTOR 2965467
- ^ Хэвил Дж (2003) Гамма: исследование константы Эйлера. Princeton, NJ: Princeton University Press, p. 157
- ^ К. С. Пирс (1873) Теория ошибок наблюдений. Отчет суперинтендантского исследования побережья США, Вашингтон, правительственная типография. Приложение № 21: 200-224
- ^ Кокран В.Г. (1978) "Оценки отношения Лапласа". С. 3-10. В Дэвиде Х.А., (ред.). Вклад в выборку обследований и прикладную статистику: статьи в честь Х. О. Хартли. Academic Press, Нью-Йорк ISBN 978-1483237930
- ^ Кейнс, JM (1921) Трактат о вероятности. Часть II Глава XVII §5 (стр 201)
- ^ Гальтон Ф. (1881) Отчет Антропометрического комитета, стр. 245-260. Отчет 51-го заседания Британской ассоциации содействия развитию науки
- ^ Стиглер (1986, Глава 5: Две попытки Кетле)
- ^ Хелен Мэри Уокер (1975). Исследования по истории статистического метода. Арно Пресс. ISBN 9780405066283.
- ^ (Стиглер 1986, Глава 9: Следующее поколение: Эджворт)
- ^ Bellhouse DR (1988) Краткая история методов случайной выборки. Справочник по статистике. Том 6, с. 1–14, Elsevier
- ^ Боули, AL (1906). «Обращение к Секции экономической науки и статистики Британской ассоциации развития науки». J R Stat Soc. 69: 548–557. Дои:10.2307/2339344. JSTOR 2339344.
- ^ Гальтон, Ф (1877 г.). «Типичные законы наследственности». Природа. 15 (388): 492–553. Дои:10.1038 / 015492a0.
- ^ Гальтон, Ф (1907). «Один голос, одна ценность». Природа. 75 (1948): 414. Дои:10.1038 / 075414a0. S2CID 4053860.
- ^ Стиглер (1986, Глава 10: Пирсон и Йоль)
- ^ Варберг, Дейл Э. (1963). «Развитие современной статистики». Учитель математики. 56 (4): 252–257. JSTOR 27956805.
- ^ Стиглер, С. М. (1989). "Отчет Фрэнсиса Гальтона об изобретении корреляции". Статистическая наука. 4 (2): 73–79. Дои:10.1214 / сс / 1177012580.
- ^ а б c Пирсон, К. (1900). «О критерии, согласно которому данная система отклонений от вероятного в случае коррелированной системы переменных такова, что можно разумно предположить, что она возникла в результате случайной выборки». Философский журнал. Серия 5. 50 (302): 157–175. Дои:10.1080/14786440009463897.
- ^ Пирсон, К. (1901). «На прямых и плоскостях, наиболее приближенных к системам точек, находится пространство». Философский журнал. 6 серия. 2 (11): 559–572. Дои:10.1080/14786440109462720.
- ^ Джоллифф, И. Т. (2002). Анализ главных компонентов, 2-е изд.. Нью-Йорк: Springer-Verlag.
- ^ Коробка, Р. А. Фишер, стр 93–166
- ^ Агрести, Алан; Дэвид Б. Хичкок (2005). «Байесовский вывод для категориального анализа данных» (PDF). Статистические методы и приложения. 14 (3): 298. Дои:10.1007 / s10260-005-0121-y. S2CID 18896230.
- ^ Фишер Р.А. (1925) Статистические методы для научных работников, Эдинбург: Оливер и Бойд
- ^ Neyman, J (1934) О двух различных аспектах репрезентативного метода: метод стратифицированной выборки и метод целенаправленного отбора. Журнал Королевского статистического общества 97 (4) 557-625 JSTOR 2342192
- ^ Данн, Питер (январь 1997 г.). "Джеймс Линд (1716-94) из Эдинбурга и лечение цинги". Архивы болезней детства: издание для плода и новорожденного. 76 (1): 64–65. Дои:10.1136 / fn.76.1.F64. ЧВК 1720613. PMID 9059193.
- ^ а б Клаус Хинкельманн (2012). Планирование и анализ экспериментов, специальные конструкции и приложения. Джон Вили и сыновья. п. xvii. ISBN 9780470530689.
- ^ а б Чарльз Сандерс Пирс и Джозеф Джастроу (1885). "О небольших различиях в ощущениях". Воспоминания Национальной академии наук. 3: 73–83.
- ^ а б Взлом, Ян (Сентябрь 1988 г.). «Телепатия: истоки рандомизации в экспериментальном дизайне». Исида. 79 (Специальный выпуск об артефактах и экспериментах, номер 3): 427–451. Дои:10.1086/354775. JSTOR 234674. МИСТЕР 1013489.
- ^ а б Стивен М. Стиглер (Ноябрь 1992 г.). «Исторический взгляд на статистические концепции в психологии и образовательных исследованиях». Американский журнал образования. 101 (1): 60–70. Дои:10.1086/444032.
- ^ а б Труди Деуэ (декабрь 1997 г.). «Обман, эффективность и случайные группы: психология и постепенное возникновение дизайна случайных групп» (PDF). Исида. 88 (4): 653–673. Дои:10.1086/383850. PMID 9519574.
- ^ Пирс, К.С. (1876 г.). «Записка по теории экономики исследований». Отчет об исследовании побережья: 197–201., фактически опубликовано в 1879 г., NOAA PDF Eprint.
Перепечатано в Сборник статей 7, пункты 139–157, также в Сочинения 4, pp. 72–78, и в Пирс, К. (Июль – август 1967 г.). «Записка по теории экономики исследований». Исследование операций. 15 (4): 643–648. Дои:10.1287 / opre.15.4.643. JSTOR 168276. - ^ Смит, Кирстин (1918). «О стандартных отклонениях скорректированных и интерполированных значений наблюдаемой полиномиальной функции и ее констант, а также о рекомендациях, которые они дают для правильного выбора распределения наблюдений». Биометрика. 12 (1/2): 1–85. Дои:10.2307/2331929. JSTOR 2331929.
- ^ Джонсон, Н. (1961). «Последовательный анализ: опрос». Журнал Королевского статистического общества, Серия A. Vol. 124 (3), 372–411. (страницы 375–376)
- ^ Вальд, А. (1945) "Последовательная проверка статистических гипотез", Анналы математической статистики, 16 (2), 117–186.
- ^ Чернова, Х. (1972) Последовательный анализ и оптимальный дизайн, СИАМ Монография. ISBN 978-0898710069
- ^ Закс, С. (1996) "Адаптивные конструкции для параметрических моделей". В: Ghosh, S. и Rao, C. R., (Eds) (1996). «Планирование и анализ экспериментов», Справочник по статистике, Том 13. Северная Голландия. ISBN 0-444-82061-2. (страницы 151–180)
- ^ Роббинс, Х. (1952). «Некоторые аспекты последовательного планирования экспериментов». Бюллетень Американского математического общества. 58 (5): 527–535. CiteSeerX 10.1.1.335.3232. Дои:10.1090 / S0002-9904-1952-09620-8.
- ^ Халд, Андерс (1998) История математической статистики. Нью-Йорк: Вили.[страница нужна ]
- ^ Коробка, Джоан Фишер (1978) Р. А. Фишер: жизнь ученого, Wiley. ISBN 0-471-09300-9 (стр 93–166)
- ^ Эдвардс, A.W.F. (2005). "Р. А. Фишер, Статистические методы для научных работников, 1925 г.". В Граттан-Гиннесс, Айвор (ред.). Знаменитые труды по западной математике 1640-1940 гг.. Амстердам Бостон: Эльзевир. ISBN 9780444508713.
- ^ Стэнли, Дж. К. (1966). "Влияние" Плана экспериментов "Фишера на образовательные исследования тридцать лет спустя". Американский журнал исследований в области образования. 3 (3): 223–229. Дои:10.3102/00028312003003223. S2CID 145725524.
- ^ Box, JF (февраль 1980 г.). «Р. А. Фишер и план экспериментов, 1922-1926». Американский статистик. 34 (1): 1–7. Дои:10.2307/2682986. JSTOR 2682986.
- ^ Йетс, Фрэнк (Июнь 1964 г.). «Сэр Рональд Фишер и план экспериментов». Биометрия. 20 (2): 307–321. Дои:10.2307/2528399. JSTOR 2528399.
- ^ Стэнли, Джулиан К. (1966). "Влияние" Плана экспериментов "Фишера на образовательные исследования тридцать лет спустя". Американский журнал исследований в области образования. 3 (3): 223–229. Дои:10.3102/00028312003003223. JSTOR 1161806. S2CID 145725524.
- ^ а б c Стиглер (1986, Глава 3: Обратная вероятность)
- ^ Холд (1998)[страница нужна ]
- ^ Люсьен Ле Кам (1986) Асимптотические методы в статистической теории принятия решений: Страницы 336 и 618–621 (фон Мизес и Бернштейн).
- ^ а б c Стивен. Э. Файнберг, (2006) Когда байесовский вывод стал «байесовским»? В архиве 2014-09-10 на Wayback Machine Байесовский анализ, 1 (1), 1–40. См. Страницу 5.
- ^ а б Олдрич, А (2008). "Р. А. Фишер по теореме Байеса и Байеса" (PDF). Байесовский анализ. 3 (1): 161–170. Дои:10.1214 / 08-ba306.
- ^ Нейман, Дж. (1977). «Частотная вероятность и частотная статистика». Синтез. 36 (1): 97–131. Дои:10.1007 / BF00485695. S2CID 46968744.
- ^ Джефф Миллер, «Самые ранние известные варианты использования некоторых слов математики (B)» «Термин байесовский вошел в обращение примерно в 1950 году. Р. А. Фишер использовал его в заметках, которые он писал, чтобы сопровождать статьи в его« Вкладах в математическую статистику »(1950). Фишер считал, что аргумент Байеса почти исчез, и единственной недавней работой, в которой он серьезно принимался, был Гарольд Джеффрис Теория вероятностей (1939). В 1951 г. Л. Дж. Сэвидж, рассматривая «Статистические функции принятия решений» Уолда, сослался на «современную или небайесовскую статистическую теорию» («Теория статистических решений», Журнал Американской статистической ассоциации, 46, с. 58.). Однако вскоре после этого Сэвидж из небайесовца превратился в байесовца ».
- ^ а б c Бернардо Дж. (2005). «Справочный анализ». Байесовское мышление - моделирование и вычисления. Справочник по статистике. 25. С. 17–90. Дои:10.1016 / S0169-7161 (05) 25002-2. ISBN 9780444515391.
- ^ Гиллис, Д. (2000), Философские теории вероятностей. Рутледж. ISBN 0-415-18276-X стр. 50–1
- ^ Э. Т. Джейнс. Теория вероятностей: логика науки Издательство Кембриджского университета, (2003). ISBN 0-521-59271-2
- ^ О'Коннор, Джон Дж.; Робертсон, Эдмунд Ф., «История статистики», Архив истории математики MacTutor, Сент-Эндрюсский университет.
- ^ Бернардо Дж. М. и Смит А. Ф. М. (1994). «Байесовская теория». Чичестер: Вайли.
- ^ Wolpert, RL (2004). «Разговор с Джеймсом О. Бергером». Статистическая наука. 9: 205–218. Дои:10.1214/088342304000000053. МИСТЕР 2082155.
- ^ Бернардо, Дж. М. (2006). «Учебник по байесовской математической статистике» (PDF). Материалы седьмой Международной конференции по статистике преподавания [CDROM]. Сальвадор (Баия), Бразилия: Международная ассоциация статистического образования.
- ^ Бишоп, К. (2007) Распознавание образов и машинное обучение. Springer ISBN 978-0387310732
Библиография
- Фридман, Д. (1999). «От ассоциации к причинно-следственной связи: некоторые замечания по истории статистики». Статистическая наука. 14 (3): 243–258. Дои:10.1214 / сс / 1009212409. (Доработанная версия 2002 г. )
- Халд, Андерс (2003). История вероятностей и статистики и их применения до 1750 г.. Хобокен, Нью-Джерси: Уайли. ISBN 978-0-471-47129-5.
- Халд, Андерс (1998). История математической статистики с 1750 по 1930 гг.. Нью-Йорк: Вили. ISBN 978-0-471-17912-2.
- Коц, С., Джонсон, Н.Л. (1992,1992,1997). Прогресс в статистике, Том I, II, III. Springer ISBN 0-387-94037-5, ISBN 0-387-94039-1, ISBN 0-387-94989-5
- Пирсон, Эгон (1978). История статистики XVII и XVIII веков на фоне меняющегося фона интеллектуальной, научной и религиозной мысли (Лекции Карла Пирсона, прочитанные в Университетском колледже Лондона во время академических сессий 1921-1933 годов). Нью-Йорк: MacMillan Publishing Co., Inc., стр. 744. ISBN 978-0-02-850120-8.
- Сальсбург, Дэвид (2001). Дама, дегустирующая чай: как статистика произвела революцию в науке в двадцатом веке. ISBN 0-7167-4106-7
- Стиглер, Стивен М. (1986). История статистики: измерение неопределенности до 1900 г.. Belknap Press / Harvard University Press. ISBN 978-0-674-40341-3.
- Стиглер, Стивен М. (1999) Статистика на столе: история статистических концепций и методов. Издательство Гарвардского университета. ISBN 0-674-83601-4
- Дэвид, Х.А. (1995). «Первое (?) Появление общих терминов в математической статистике». Американский статистик. 49 (2): 121–133. Дои:10.2307/2684625. JSTOR 2684625.
внешняя ссылка
- JEHPS: Последние публикации по истории вероятности и статистики
- Электронный журнал по истории вероятности и статистики / Journ @ l Electronique d'Histoire des Probabilités et de la Statistique
- Цифры из истории вероятности и статистики (Саутгемптонский университет)
- Материалы для истории статистики (Йоркский университет)
- Вероятность и статистика самых ранних использований страниц (Саутгемптонский университет)
- Самые ранние случаи использования символов в теории вероятностей и статистике на Самые ранние случаи использования различных математических символов