Саберметрика - Sabermetrics

Саберметрика или же SABRmetrics это эмпирический анализ бейсбол, особенно бейсбольная статистика которые измеряют активность в игре.

Саберметристы собирают и обобщают соответствующие данные из этого игрового действия, чтобы ответить на конкретные вопросы. Этот термин происходит от аббревиатуры SABR, которая означает Общество американских исследований бейсбола, основанная в 1971 году. Термин «саберметрика» был придуман Билл Джеймс, который является одним из ее пионеров и часто считается ее самым известным защитником и публичным лицом.[1]

Ранняя история

Генри Чедвик, спортивный обозреватель из Нью-Йорка, разработал коробка счет в 1858 году. Это был первый способ, которым статистики смогли описать вид спорта, как бейсбол, путем численного отслеживания различных аспектов игры.[2] Создание таблицы результатов дало бейсбольным статистикам сводную информацию об индивидуальных и командных выступлениях в данной игре.[3]

Исследования саберметрики начались в середине 20 века с работ Эрншоу Кук, один из первых саберметристов. Книга Кука 1964 года Процент бейсбола был одним из первых в своем роде.[4] Сначала большинство организованных бейсбольных команд и профессионалов считали работу Кука бессмысленной. Идея науки о бейсбольной статистике начала приобретать законность в 1977 году, когда Билл Джеймс начал выпускать Рефераты по бейсболу, его ежегодный сборник данных по бейсболу.[5][6] Однако идеи Джеймса не получили широкого признания.[1]

Билл Джеймс считал, что существует широко распространенное заблуждение относительно того, как игра в бейсбол, утверждая, что этот вид спорта не определяется его правилами, а на самом деле, как резюмировал профессор инженерии Ричард Дж. Пуэрцер, «определяется условиями, в которых проводится игра. - в частности, стадионы, но также игроки, этика, стратегии, оборудование и ожидания публики ».[2] Саберметристы, которых иногда считают бейсбольными статистиками, начали пытаться заменить давнюю любимую статистику, известную как средний уровень.[7][8] Было заявлено, что средний командный результат относительно плохо подходит для командных забегов.[7] Саберметрические рассуждения говорят, что пробежки выигрывают в играх с мячом, и что хорошим показателем достоинства игрока является его способность помогать своей команде набирать больше пробежек, чем команде соперника.

До того, как Билл Джеймс популяризировал саберметрию, Дэйви Джонсон использовал IBM System / 360 у владельца команды Джерольд Хоффбергер пивоварня написать FORTRAN бейсбол компьютерное моделирование играя за Балтимор Иволги в начале 1970-х гг. Он использовал свои результаты в неудачной попытке продвинуться до своего менеджера. Эрл Уивер идея, что он должен быть вторым в очереди. Он написал IBM BASIC программы, чтобы помочь ему управлять Приливные воды, и став менеджером Нью-Йорк Метс в 1984 году он поручил сотруднику команды написать dBASE II приложение для компиляции и хранения расширенные метрики по статистике команды.[9] Крейг Р. Райт был еще одним сотрудником Высшей бейсбольной лиги, работая с Техасские Рейнджерс в начале 1980-х гг. За время работы в «Рейнджерс» он стал известен как первый сотрудник фронт-офиса в истории MLB, который работал под названием Sabermetrician.[10][11]

Дэвид Смит основанный Ретросит в 1989 году с целью компьютеризации общего счета всех когда-либо сыгранных бейсбольных матчей высшей лиги, чтобы более точно собирать и сравнивать статистику игры.

В Окленд Атлетикс начал использовать количественный подход к бейсболу, сосредоточившись на саберметрических принципах в 1990-х годах. Первоначально это началось с Сэнди Алдерсон в качестве бывшего генерального менеджера команды, когда он использовал эти принципы для получения относительно недооцененных игроков.[1] Его идеи получили продолжение, когда Билли Бин занял пост генерального директора в 1997 году, на этой должности он работал до 2015 года, и нанял своего помощника Пол ДеПодеста.[8] Благодаря статистическому анализу, проведенному Бином и ДеПодестой в сезоне 2002 года, «Окленд А» выиграли 20 игр подряд. Это был исторический момент для франшизы, когда 20-я игра была сыграна в Колизее округа Аламеда.[12] Его подходы к бейсболу вскоре получили национальное признание, когда Майкл Льюис опубликовано Moneyball: искусство выигрывать в несправедливой игре в 2003 году, чтобы подробно описать использование Бином Sabermetrics. В 2011 году вышел фильм по книге Льюиса, также называемый Moneyball - был выпущен и дал широкое представление о методах, используемых в офисе Oakland Athletics.

Традиционные измерения

Sabermetrics был создан для любителей бейсбола, чтобы узнать о спорте с помощью объективных данных. Это выполняется путем оценки игроков во всех аспектах игры, в частности, в ударе, подаче и подаче. Эти меры оценки обычно формулируются с точки зрения либо запусков, либо командных побед, поскольку более старые статистические данные были сочтены неэффективными.

Измерения ватина

Традиционным показателем эффективности ватина считается деление ударов на общее количество ударов. Билл Джеймс, наряду с другими отцами саберметрии, обнаружил, что эта мера ошибочна, поскольку она игнорирует любой другой способ, которым отбивающий может достичь базы, кроме удара.[13] Это привело к созданию Базовый процент, который учитывает прогулки и пробежки. Чтобы вычислить процентное значение на базе, общее количество ударов + основание по шарам + попадание по высоте делится на количество ударов по летучим мышам + базы по шарам + удары по высоте + жертвоприношение мух.[14]:11

Другая проблема с традиционным измерением среднего показателя заключается в том, что он не различает попадания (то есть одиночные, парные, тройные и хоум-раны) и придает каждому удару равную ценность.[13] Таким образом, мера, которая различает эти четыре результата попаданий, процент забивания, был создан. Чтобы рассчитать процент забивания, общее количество оснований всех ударов делится на общее количество времени на летучей мыши. Стивен Джей Гулд предположил, что исчезновение среднего показателя ватина .400 на самом деле является признаком общего улучшения показателей.[15][16] Это потому, что в современную эпоху игроки больше сосредотачиваются на силовых ударах, чем на обычных.[16] Таким образом, стало более ценно сравнивать игроков, используя процент пробок и процент на базе по сравнению со средним показателем.[15]

Эти два улучшенных саберметрических показателя являются важными навыками для измерения в тесте, и они были объединены для создания современной статистики OPS. На базе плюс пробка представляет собой сумму процентного отношения на базе и процента закупоривания. Эта современная статистика стала полезной при сравнении игроков и является мощным методом прогнозирования пробежек, набранных определенным игроком.[17]

Некоторые из других статистических данных, которые саберметристы используют для оценки результатов ватин, следующие: взвешенное на основе среднего, среднее среднее, пробеги созданы, и эквивалентное среднее.

Измерения тангажа

Традиционным показателем качки считается среднее количество пробежек. Он рассчитывается путем деления количества заработанные пробеги разрешено количеством поданных иннингов и умножением на девять из-за девяти подач. Эта статистика показывает количество пробежек, которое питчер допускает за игру. Это оказалось ошибочным, поскольку оно не отделяет способности питчера от способностей полевых игроков, с которыми он играет.[18] Еще одна классическая мера качки - кувшин. процент выигрыша. Процент выигрыша рассчитывается путем деления выигрышей на количество решений (выигрыши плюс проигрыши). Эта статистика также может быть ошибочной, так как она зависит от того, как партнеры питчера по команде выступают на тарелке и на поле.

Саберметристы пытались найти различные меры по измерению качки, которые не включают в себя выступления полевых игроков. Одна из самых ранних разработок и одна из самых популярных в использовании - это прогулки плюс хиты за подачу (WHIP), который, хотя и не полностью независим от защиты, имеет тенденцию указывать, сколько раз питчер, вероятно, поставит игрока на базу (либо по мячу, либо по подаче, либо по базе) и, таким образом, как эффективные бьющие против определенного питчера в достижении базы. Более поздняя разработка - создание статистика подачи независимой защиты (DIPS) система. Ворос МакКракен приписывают разработку этой системы в 1999 году.[19] Благодаря своему исследованию Маккракен смог показать, что между питчерами практически нет разницы в количестве ударов, которые они допускают, независимо от их уровня мастерства.[20] Некоторые примеры этой статистики: независимая от обороны ERA, выставляя независимую качку, и оборонно-независимый компонент ERA. Другие саберметристы продолжили работу в DIPS, например, Том Танго кто управляет Танго в бейсболе сайт sabermetrics.

Бейсбольный проспект создал другую статистику, названную периферическое ЭРА. Этот показатель производительности питчера учитывает удары, прогулки, разрешенные хоум-раны и аутинги с поправкой на приблизительные факторы.[18] Когда дело доходит до боковой стены, каждая площадка имеет разные размеры, поэтому размер питчера не должен быть одинаковым для каждого из этих парков.[21]

Среднее количество ударов по мячам в игре (BABIP) - еще одно полезное измерение для определения производительности питчера.[20] Когда у питчера высокий BABIP, он часто показывает улучшения в следующем сезоне, в то время как питчер с низким BABIP часто показывает его снижение в следующем сезоне.[20] Это основано на статистической концепции регресс к среднему значению. Другие создали различные средства, пытаясь количественно оценить отдельные передачи на основе характеристик поля, в отличие от заработанных пробежек или ударов мячей.

Высшая математика

Ценность перед заменяющим игроком (VORP) считается популярной саберметрической статистикой. Эта статистика показывает, какой вклад игрок вносит в свою команду по сравнению с фальшивым заменяющим игроком, который показывает результаты ниже среднего. Это измерение было основано Китом Вулнером, бывшим автором саберметрической группы / веб-сайта. Бейсбольный проспект.

Победы выше замены (WAR) - еще одна популярная саберметрическая статистика, которая оценивает вклад игрока в его команду.[22] Подобно VORP, WAR сравнивает определенного игрока с игроком замещающего уровня, чтобы определить количество дополнительных побед, которые игрок предоставил своей команде.[23] Значения WAR меняются в зависимости от позиции попадания и в значительной степени определяются успешным выступлением игрока и количеством его игрового времени.[23]

Количественный анализ в бейсболе

Многие традиционные и современные статистические данные, такие как ERA и Wins Shared, не дают полного представления о том, что происходит на поле.[14]:189–198 Простых соотношений недостаточно для понимания статистических данных бейсбола. Структурированный количественный анализ способен объяснить многие аспекты игры, например, выяснить, как часто команде следует пытаться воровать.[24]

Связанные ставки в бейсболе

Связанные ставки может использоваться в бейсболе для точного расчета различных ходов в игре. Например, если бегуна отправляют домой с третьего места, можно использовать соответствующие ставки, чтобы показать, был ли бросок с дальнего поля своевременным или он был правильно срезан перед тарелкой.[14]:189–198 Связанные ставки также могут помочь в определении того, как быстро игрок может перемещаться по базам после удара по мячу, информация, которая помогает в разработке отчетов разведки и индивидуальном развитии игрока.

Импульс и сила

Импульс и сила - аналогичные приложения исчисления в бейсболе. В частности, средняя сила, действующая на летучую мышь при ударе по мячу, может быть рассчитана путем объединения различных концепций в рамках прикладного исчисления. Во-первых, изменение мяча импульс внешней силой F (t). Импульс можно найти, умножив массу на скорость. Внешняя сила F (t) является непрерывной функцией времени.

Приложения

Sabermetrics может использоваться для нескольких целей, но наиболее распространенными являются оценка прошлой производительности и прогнозирование будущей производительности для определения вклада игрока в его команду.[17] Это может быть полезно при определении того, кто должен выиграть награды в конце сезона, например, MVP, и при определении ценности совершения определенной сделки.

Большинство бейсболистов, как правило, несколько лет играют в низших лигах, прежде чем их вызывают в высшую лигу. Конкурентные различия вкупе с приблизительными эффектами затрудняют точное сравнение статистики игрока. Саберметристы смогли решить эту проблему, скорректировав статистику низшей лиги игрока, также известную как эквивалент низшей лиги.[17] Благодаря этим корректировкам команды могут посмотреть на результаты игрока как в AA, так и в AAA, чтобы определить, подходит ли он для участия в крупных турнирах.

Прикладная статистика

Методы Sabermetrics обычно используются для трех целей:

  1. Чтобы сравнить ключевые показатели определенных игроков в реальных условиях. Оценка прошлых выступлений игрока дает возможность аналитического обзора. Сравнение этих данных между игроками может помочь понять ключевые моменты, такие как их рыночная стоимость. Таким образом можно определить роль и зарплату, которая должна быть предоставлена ​​этому игроку.
  2. Обеспечить прогноз будущих результатов данного игрока или команды. Когда доступны прошлые данные об эффективности команды или конкретного игрока, Sabermetrics можно использовать для прогнозирования средних будущих результатов в следующем сезоне. Таким образом, с определенной вероятностью можно сделать прогноз о количестве выигрышей и проигрышей.
  3. Обеспечить полезную функцию вклада игрока в его команду. Анализируя данные, можно понять, какой вклад вносит игрок в успех / неудачу своей команды. Учитывая эту корреляцию, можно объективно подписать или отпустить игроков с определенными характеристиками.

Машинное обучение для прогнозирования исхода игры

А машинное обучение Модель может быть построена с использованием наборов данных, имеющихся в таких источниках, как baseball-reference. Эта модель дает оценки вероятности исхода конкретных игр или результатов конкретных игроков. Эти оценки становятся все более точными при применении к большому количеству событий в долгосрочной перспективе. Исход игры (выигрыш / проигрыш) рассматривается как имеющий биномиальное распределение.

Прогнозы могут быть сделаны с использованием модели логистической регрессии с объясняющими переменными, включая: подсчитанные пробежки оппонентов, подсчитанные пробежки, время локаутов у бита, процент побед и кнут питчера.

Последние достижения

Многие саберметристы все еще усердно работают, чтобы внести свой вклад в эту область, создавая новые меры и задавая новые вопросы. Два Билла Джеймса Исторический бейсбол Аннотация редакции и Выигрывайте акции Книга продолжала продвигать область саберметрии спустя 25 лет после того, как он помог начать движение.[25] Его бывший помощник Роб Нейер, который сейчас является старшим писателем ESPN.com и национальным бейсбольным редактором SBNation, также работал над популяризацией саберметрики с середины 1980-х годов.[26]

Нейт Сильвер, бывший писатель и управляющий партнер Бейсбольный проспект, изобрел ПЕКОТА. Этот акроним означает Эмпирическое сравнение игроков и алгоритм оптимизации теста,[27] и представляет собой саберметрическую систему для прогнозирования результатов игрока Высшей лиги бейсбола. Проще говоря, это предполагает, что карьера игрока пойдет по той же траектории, что и игроки, на которую они похожи сейчас. Эта система принадлежала Бейсбольный проспект с 2003 г. и помогает авторам веб-сайта изобретать или улучшать широко используемые саберметрические методы и методы.[28]

Начиная с бейсбольного сезона 2007 года, MLB начала изучать технологии, позволяющие записывать подробную информацию о каждой подаче, используемой в игре.[13] Это стало известно как PITCHf / x система, которая может записывать скорость шага в точке его выхода и по мере того, как он пересекает пластину, а также местоположение и угол прорыва определенных питчей через видеокамеры.[13] FanGraphs - это веб-сайт, который поддерживает эту систему, а также анализ данных от игры к игре. Веб-сайт также специализируется на публикации расширенной бейсбольной статистики, а также графики, которые оценивают и отслеживают выступления игроков и команд.

В популярной культуре

Смотрите также

Рекомендации

Примечания
  1. ^ а б c Льюис, Майкл М. (2003). Moneyball: искусство выигрывать в несправедливой игре. Нью-Йорк: В. В. Нортон. ISBN  0-393-05765-8.
  2. ^ а б Пуэрцер, Ричард Дж. (Осень 2002 г.). «От научного бейсбола до саберметрики: профессиональный бейсбол как отражение инженерии и менеджмента в обществе». NINE: Журнал истории и культуры бейсбола. 11: 34–48. Дои:10.1353 / н. 2002.0042.
  3. ^ «Зал славы - Генри Чедвик». Архивировано из оригинал на 2008-04-12.
  4. ^ Альберт, Джеймс; Джей М. Беннетт (2001). Кривой мяч: бейсбол, статистика и роль случая в игре. Springer. С. 170–171. ISBN  0-387-98816-5.
  5. ^ "Билл Джеймс, помимо бейсбола". Аналитический центр с Беном Ваттенбергом. PBS. 28 июня 2005 г.. Получено 2 ноября, 2007.
  6. ^ Акман, Д. (20 мая 2007 г.). «Султан статистики». Журнал "Уолл Стрит. Получено 2 ноября, 2007.
  7. ^ а б Джарвис, Дж. (29 сентября 2003 г.). "Обзор показателей оценки результатов деятельности бейсболистов". Получено 2007-11-02.
  8. ^ а б Кипен, Д. (1 июня 2003 г.). "Совершенно новая игра Билли Бина". Хроники Сан-Франциско. Получено 2 ноября, 2007.
  9. ^ Портер, Мартин (1984-05-29). "Компьютер переходит на летучую мышь". Журнал ПК. п. 209. Получено 24 октября 2013.
  10. ^ RotoJunkie - Roto 101 - Sabermetric Glossary (на базе evoArticles) В архиве 2007-09-10 на Wayback Machine
  11. ^ BaseballsPast.com
  12. ^ «Хронология франшизы».
  13. ^ а б c d Альберт, Джим (2010). «Саберметрика: прошлое, настоящее и будущее» (PDF). В Джозефе А. Галлиане (ред.). Математика и спорт. 43. Автор: Математическая ассоциация Америки. MAA. С. 3–14. ISBN  9780883853498. JSTOR  10.4169 / j.ctt6wpwsw.4.
  14. ^ а б c Джон Т. Саккоман; Габриэль Р. Коста; Майкл Р. Хубер (2009). Практика саберметрики: использование науки бейсбольной статистики на практике. Соединенные Штаты Америки: McFarland & Company. ISBN  978-0-7864-4177-8.
  15. ^ а б Гулд, Стивен Джей (2003). "Почему никто больше не попадает в рейтинг .400". Триумф и трагедия в Мадвилле: страсть к бейсболу на всю жизнь. W. W. Norton & Company. стр.151–172. ISBN  0-393-05755-0.
  16. ^ а б Агонистас, Дан (4 августа 2004 г.). "Куда делись .400 нападающие?". Получено 30 августа 2016. ... Обсуждение вращалось вокруг эссе, которое Гулд написал для Обнаружить в 1986 году, и это было переиздано в его книге 1996 года. Аншлаг И в Триумф и трагедия под заголовком "Почему никто больше не попадает в рейтинг .400" ...
  17. ^ а б c Грабинер, Дэвид Дж. «Саберметрический манифест». Бейсбольный архив.
  18. ^ а б Маккракен, Ворос (23 января 2001 г.). "Питчинг и защита: насколько хорошо у херлеров контроль?". Бейсбольный проспект.
  19. ^ Баско, Дэн; Дэвис, Майкл (осень 2010). «Многообразие DIPS: история и обзор». Журнал исследований бейсбола. 32 (2).
  20. ^ а б c Болл, Андрей (17 января 2014 г.). "Как саберметрика меняет бейсбол?". За гранью очков.
  21. ^ Баумер, Бенджамин; Цимбалист, Андрей (2014). Саберметрическая революция: оценка роста аналитики в бейсболе. Университет Пенсильвании Press.
  22. ^ Фанграфы: ВОЙНА
  23. ^ а б Шенфилд, Дэвид (19 июля 2012 г.). «О чем мы говорим, когда говорим о ВОЙНЕ». ESPN.com.
  24. ^ "Изменяющийся расчет отловленных краж | FanGraphs Baseball". FanGraphs Бейсбол. Получено 2016-12-06.
  25. ^ Нейер, Роб (5 ноября 2002 г.). «Red Sox нанимает Джеймса в качестве консультанта». ESPN.com. Получено 7 марта, 2009.
  26. ^ Джаффе, К. (22 октября 2007 г.). "Интервью Роба Нейера". The Hardball Times. Получено 2 ноября, 2007.
  27. ^ «Бейсбольный проспект | Глоссарий». www.baseballprospectus.com. Получено 2016-05-05.
  28. ^ «Бейсбольный проспект». Получено 2012-03-04.

внешняя ссылка