Количественная оценка высоты тона - Pitch quantification

Количественная оценка высоты тона это попытка описать качество звука с помощью одного числового значения на основе измеримый аспекты личности бейсбольное поле. Существует два основных типа количественной оценки высоты тона. Первый ориентирован на результат. Это означает, что результат данного шага (т. Е. ходить, из, домой бежать и т. д.) - это компонент, используемый для вычисления общего числового значения, описывающего качество звука. Другой вид количественной оценки основного тона не учитывает результат основного тона при расчете качества. Скорее это тесто независимый. Его качество можно оценить независимо от того, что тесто делает со смолой.

В 2006 г. PITCHf / x камеры были установлены в каждом MLB стадион. Эти камеры могут отслеживать «скорость, движение, точка спуска, вращение и расположение "[1] на каждой брошенной подаче. Когда эти данные были обнародованы, появилось много различных попыток количественной оценки звука. В 2010 году Ник Штайнер объяснил, что кувшины имеют относительно очень слабый контроль над своей высотой тона из-за того, что на поле влияет множество других факторов, таких как тесто, то судья, защита, и окружающая среда. Задача бейсбольная статистика попытка количественно оценить подачу - это изолировать игру питчера от факторов, находящихся вне его контроля.[2] На протяжении многих лет многие специалисты по статистике бейсбола пытались создать статистику, которая делает это.

Линейные веса шага

Линейные веса, или пробежки ватином, - центральная концепция анализа бейсбола. Линейные веса - это тип бейсбольной статистики, в которой используется «взвешенная система для измерения воздействия ударов».[3] Они сравнивают способности конкретного игрока со способностями среднего игрока. Фердинанд Коул Лейн первым начал исследовать линейные веса и создал начальную систему весов. Позже Джордж Линдси разработал матрицу ожидаемых результатов, «которая сообщает нам вероятность получения результата в конкретном исходном состоянии».[4] В 1984 году Пит Палмер расширил работу Линдси и создал Систему линейных весов.

Количество шагов является важным элементом линейных весов. Подсчет подачи важен, потому что качество бита игрока будет зависеть от количества подач. Например, если отбивающему бросают первую подачу бита (счет 1-0), его результативность будет выше, чем средняя пробежка ватина. Однако, если первый брошенный мяч является ударом (счет 0–1), то результат отбрасывания ниже среднего. Проще говоря, линейные веса количественно определяют тот факт, что команды с большей вероятностью забьют больше пробежек в таких ситуациях, как базы загружены и нет аутов, чем в таких ситуациях, как человек на первом и двух аутах. Для получения значений, присвоенных каждой исходной ситуации, берется «среднее увеличение ожидаемой продолжительности пробега от каждого события».[5] Результаты представляют собой значение относительно среднего.[6] «Линейные веса - это просто эмпирический среднее влияние, которое событие оказывает на процесс подсчета очков ».[7] В следующей таблице показано значение пробега для любого конкретного количества шагов.

Таблица 1 - Прогон значения любого заданного числа

СчитатьВатин
0-00.000
1-00.038
2-00.140
3-00.220
0-1-0.044
1-1-0.015
2-10.037
3-10.142
0-2-0.106
1-2-0.082
2-2-0.039
3-20.059

[8]

Пит Палмер объяснил линейные веса следующим образом:

    «Линейные веса делают очень агрессивное событие и рассматривают его с точки зрения его воздействия на команду - среднюю команду, так что человеку не выгодна его личная репутация из-за того, что ему повезло убрать с пивоваров или пострадают из-за того, что мяч убивает мяч. В традиционной бейсбольной статистике взаимосвязь между индивидуальными результатами и командной игрой выражена плохо или вообще не указана. В линейных весах это предельно ясно: линейная прогрессия, сумма различных атакующих событий, когда взвешенные по их точно прогнозируемым количествам пробежек, суммируют пробежки, внесенные этим тестирующим или этой командой, выше среднего показателя по лиге ».[9]

Например, предположим, что тесто попадает в мяч и бежит на первую базу при счете 0-2 (2 удара). Чтобы рассчитать линейный вес этого шага, мы должны сравнить этот пробег со средним пробегом. Средний Один стоит ватин бежит. Значение сингла при счете 0-2 равно в соответствии с таблицей 1. Окончательное значение рассчитывается путем вычитания значения счета, когда мяч был введен в игру, из значения внешний вид пластины в соответствии с ватин бежит. Таким образом, .[10]

cLWTS

Адаптация линейных весов была предложена Гарретом Шиадо в январе 2016 года. Он представил статистику под названием «Линейные веса контекстного типа шага» (cLWTS). Шиаду, будучи неудовлетворенным неспособностью линейных весов дать предсказательную ценность питчингу, искал статистические данные, которые помещали питчи в контекст и давали объяснение корреляции между значениями высоты тона и последовательностью. Что отличает cLWTS от традиционных линейных весов, так это то, что cLWTS понимает, что конкретный шаг не полностью определяет результат этого шага. Существуют и другие факторы, влияющие на результат подачи, которые не связаны с качеством самой подачи. Таким образом, cLWTS принимает во внимание весь контекст того, что происходит после броска площадки, и признает только «необходимый вес в отношении того, сколько ответственности действительно заслуживает питчер. При этом мы также хотим контролировать внешние эффекты текущего состояния игры и другие факторы окружающей среды. В конечном итоге, cLWTS оценивается кумулятивно и для каждого поля как для питчеров, так и для нападающих, судя по изменению ожидаемой продолжительности пробега для каждого типа поля ».[11] Сила этой конкретной статистики заключается в ее предсказательной способности. Однако на cLWTS накладываются многие из тех же ограничений, что и на метрику ERA, поскольку cLWTS просто удаляет передачи, содержащие одну или несколько ошибок в игре. Другими словами, питчеры наказываются за «ошибки в игре и бросках их защитников».[12] Исправление этой ошибки в cLWTS в настоящее время продолжается.

Джереми Гринхаус

Один из самых ранних методов количественной оценки питча, «Stuff» Джереми Гринхауса, был опубликован в 2009 году, вскоре после публикации данных Pitchf / x в 2008 году. Эта попытка количественной оценки способностей питчера использует переменную отклика ожидаемого забега. значение и три независимых переменных: скорость, горизонтальное движение и вертикальное движение. Для этих переменных выполняется лессовая регрессия, чтобы получить числовое значение для описания материала питчера.[13] Некоторые из созданных таблиц лидеров теплицы не содержат многих ожидаемых лучших питчеров. Помимо создания таблиц лидеров, эта методика количественной оценки высоты тона не велась.

Roegele

В марте 2013 года Джон Рогеле попытался начать с изучения полей в зоне удара, чтобы определить, как выглядит успешное поле, а затем работать в обратном направлении, чтобы определить, насколько хорошо питчер выполняет передачи, обладающие качествами успеха.[14] Основной переменной, которую он считал, было местоположение. Рогеле определил, что двумя наиболее важными факторами, влияющими на расположение, являются комбинация рук питчера и бьющего. В отличие от линейных весов, эта статистика не использует счетчик высоты тона. Скорее, Рогеле разделил зону удара на 9 секций. Он вычислил число, представляющее успех любой подачи, которая входит в любую из девяти секций, на основе типа подачи и комбинации рук питчера и бэттера для данной подачи. Эта статистика также не зависит от теста. Он не принимает во внимание исход поля, а только то, насколько хорошо питчер определяет свое положение в зоне удара. Однако по сравнению с хорошо известными показателями питчинга эта статистика не оправдала себя. Позже в 2013 году Рогеле добавил скорость к своей статистике, пытаясь уточнить ее и сделать более совместимой с другими показателями.[15] Рогеле считает, что следующим шагом в уточнении этой статистики будет рассмотрение полей за пределами зоны удара. По состоянию на октябрь 2015 года Рогеле продолжает уточнять свою статистику, добавляя такие переменные, как температура.[16]

QOP

Качество подачи, или QOP, - это статистика, разработанная доктором Джейсоном Уилсоном и Джарвисом Грейнером в 2014 году. Они стремились создать статистику, которая производила бы универсальное измерение качества подачи независимо от ее результата, контекста подачи или типа подачи. Для этого используются три ключевых качества поля: траектория, местоположение и скорость.[17] Это делает QOP полностью объективным, поскольку каждую из этих переменных можно измерить с помощью PITCHf / x данные. Шкала QOP составляет примерно от 0 до 10. Исторические данные Высшая лига данные с 2008 по 2015 гг. иметь в виду около 4,5 и медиана из 5.[18]

Чтобы разработать QOP, они сначала разработали индекс Грейнера. Индекс Грейнера (GI) оценивается по шкале от 0 до 100, и он оценивает питчи в зависимости от их уровня сложности для отбивающего. Индекс Грейнера рассчитывается по следующей формуле, полученной из модели множественной регрессии:

рейтинг = -2.51rise + 1.88breakpoint - 0.47knee_dist + 0.51total break[19]

Например, предположим, что один шаг имеет подъем на 3 дюйма, общий излом на 0,47 дюйма, точку излома 21,5 дюйма и изменение местоположения на 8 дюймов. Расчет GI будет следующим:

После публикации индекса Greiner Index он был обновлен и теперь включает все участки с параметром 2D местоположения. Благодаря сочетанию GI и скорости был разработан QOP. Собственный линейная модель для QOP не публикуется и находится на рассмотрении.

Следующие компоненты влияют на общую оценку QOP следующим образом:

Повышенный подъем ---> более низкое QOP (для шаров)

Увеличенный общий перерыв ---> более высокий QOP

Увеличенный поздний вертикальный разрыв ---> более высокое QOP

Увеличенный горизонтальный разрыв ---> более высокое QOP

Близость к углам зона удара ---> более высокое QOP

Повышенная скорость ---> более высокое QOP

Грайнер и Уилсон хотели разработать статистику, которую могли бы использовать тренеры по питкам и разведчики для развития и определения потенциала питчера. Кроме того, в 2015 году они предположили, что QOP имеет потенциал для прогнозирования (и, следовательно, предотвращения) травм, а также для количественной оценки теста.[20] Статистика QOP рассчитывается QOPBASEBALL.[21]

Strike Zone плюс / минус

В феврале 2015 года Джо Росалес и Скотт Спратт представили систему количественной оценки полей, которая фокусируется не на конкретных качествах самой площадки, а на ее обрамлении в зоне удара и результирующем звонке, сделанном игроком. ловец как мяч или удар. Они назвали свою систему Strike Zone Plus / Minus. Эта система была разработана, потому что они заметили, что две передачи могут быть брошены в одном и том же месте, и одну можно назвать ударом, а другую - мячом. Зона удара не всегда наблюдается со 100-процентной точностью. Таким образом, Росалес и Спратт подумали, что, возможно, некоторые питчеры «обладают большей способностью» бросать пограничные передачи, которые называются ударами.[22] Зона удара плюс / минус «разделяет баллы в зависимости от того, называется ли подача мячом или забастовкой, между кетчером, питчером, отбивающим и участвующим судьей».[23] Несмотря на то, что в открытом доступе существует множество различных методологий кадрирования поля, Розалес и Спратт заявляют, что их система уникальна, поскольку питчеры, отбивающие и судьи рассматриваются как «независимые действующие лица», а не как переменные, с помощью которых можно регулировать работу ловца. Многие другие методики не учитывают ничего, кроме ловушки. К каждому человеку относятся как к независимому, потому что у кэтчера есть свои навыки приема, у питчера - собственная способность определять местоположение, у отбивающего - свой уникальный язык тела, а у судьи - личные стандарты. Таким образом, этот метод рассматривает каждого из четырех человек как значимых участников и делит оценку результата каждого шага между четырьмя на основе индивидуальных тенденций. Strike Zone Plus / Minus также уникальна тем, что в ней используются данные «Baseball Info Solutions» о том, где кэтчер устанавливает свою цель для поля, что позволяет [им] включить команду питчера (насколько близко он подходит к цели) в [их] система."[24] В конечном итоге Strike Zone Plus / Minus - это ориентированная на результат мера качества подачи, и она направлена ​​на уточнение процесса определения этого результата (мяч или удар). Его объем ограничен в общем поиске статистических данных количественной оценки поля, потому что он не может дать никакой информации о поле, которое не является мячом или ударом. Таким образом, Strike Zone Plus / Minus не может помочь количественно оценить любую подачу, которая фактически используется. Розалес и Спратт видят ценность системы Strike Zone Plus / Minus в отношении рыночной стоимости ловцов свободного агента.

Шварц и Шварц

Филлиппа и Тим Шварц стремились ввести статистику количественного определения высоты звука, не зависящую от теста. Они признали, что некоторые хорошие передачи приводят к хоум-ранам, а некоторые плохие - к аутам. Поэтому они разработали статистику для измерения качества подачи на основе различных основных условий, а не на основе оценки пробега. Они решили основывать свою статистику на следующих переменных питча:

C = количество шагов

D = дескриптор высоты тона

Дескриптор высоты тона (D) определяется рядом выбранных ковариат: местоположение шага, скорость, тип, рука питчера и т. Д.[25] Чтобы учесть сложную взаимосвязь между качеством основного тона и ковариатами, для получения оценки общего качества основного тона используется методология случайного леса. Метод случайного леса, в котором «важные» ковариаты определяются по разбиениям в дереве ... привлекателен, когда мы заранее не знаем, какие переменные (например, местоположение шага, скорость шага, тип шага, ручная работа) являются предсказательными ».[26]Они использовали эту статистику для описания изменения качества подачи во время игры, а также для оценки навыков питчеров, как и ERA.

Таблица результатов

Метод количественной оценки высоты тонаДата:Авторы):Пояснительная переменная (и):Переменные ответа:Цель / Аудитория:
Линейные веса1984Фердинанд Колд Лейн, Джордж Линдси, Пит ПалмерКоличество шаговСреднее влияние события на процесс подсчета очковНасколько хорошо тесто / кувшин выступил на определенном поле / использовал его
Оранжерейный материал2009Джереми ГринхаусСкорость, горизонтальное движение, вертикальное движениеОжидаемый пробегТаблицы лидеров
Roegele2013Джон РогельРасположение зоны удара, комбинация рук питчера и бьющего, скорость (добавлено позже)Ожидаемый WOBAОценить качество подачи
QOP2014Джейсон Уилсон и Джарвис ГрейнерПодъем, точка останова, вертикальный разрыв, горизонтальный разрыв, местоположение, скоростьНабор тренировочных данных о качестве значений высоты звука (QOPV), оцененный судейской коллегией по шкале от 0 до 10Оцените качество подачи
Strike Zone плюс / минус2015Джо Росалес и Скотт СпраттРасположение, количество шагов, расстояние по горизонтали, бьющая рукаВероятность того, что поле назовут забастовкойРыночная стоимость ловцов свободного агента
cLWTS2016Гаррет ШиадуЛинейные веса, контекстСреднее влияние события на процесс подсчета очковДобавить контекст к линейным весам
Шварц и Шварц2017Филиппа Шварц, Майк Гросскопф, Дерек Бингэм и Тим Б. ШварцКоличество шагов, тип шага, местоположение, скоростьБазы за подачуОцените навыки питчеров

Рекомендации

  1. ^ "Что такое PITCHF / x?". FanGraphs.
  2. ^ Штайнер, Ник. "За пределами DIPS". The Hardball Times.
  3. ^ Джордан, J.T. «Понимание линейных весов». Аллея троек.
  4. ^ Джордан, J.T. «Понимание линейных весов». Аллея троек.
  5. ^ Джордан, J.T. «Понимание линейных весов». Аллея троек.
  6. ^ «Линейные веса». FanGraphs.
  7. ^ Джордан, J.T. «Понимание линейных весов». Аллея троек.
  8. ^ Уолш, Джон. «В поисках лучшей подачи». The Hardball Times.
  9. ^ Джордан, J.T. «Понимание линейных весов». Аллея троек.
  10. ^ Уолш, Джон. «В поисках лучшей подачи». The Hardball Times.
  11. ^ Шиаду, Гарретт. «Введение в cLWTS: включение данных презентации в контекст». Сабермидж.
  12. ^ Шиаду, Гарретт. «Представляем cLWTS: Ввод данных презентации в контекст». Сабермидж.
  13. ^ Теплица, Джереми. "Об этом". Бейсбольные аналитики.
  14. ^ Рогеле, Джон. "Качество поля Strike Zone, Часть 1: Местоположение". SB Nation.
  15. ^ Рогеле, Джон. "Качество поля. Часть II: Расположение зоны удара и теперь со скоростью!". SB Nation.
  16. ^ Рогеле, Джон. «Забастовка 2015». The Hardball Times.
  17. ^ Уилсон / Грейнер, Джейсон / Уэйн. "Количественная оценка высоты тона, часть I". QOP Бейсбол.
  18. ^ Уилсон / Грейнер, Джейсон / Уэйн. "Количественная оценка высоты тона, часть I". QOP Бейсбол.
  19. ^ Уилсон / Грейнер, Джейсон / Джарвис. «Индекс Curveball: количественная оценка разбивания мячей для питчеров». ШАНС.
  20. ^ 2015 Sabre конференция
  21. ^ api.qopbaseball.com
  22. ^ Розалес / Спратт, Джо / Скотт. "Кто несет ответственность за объявленную забастовку?" (PDF). Конференция MIT Sloan по спортивной аналитике.
  23. ^ Розалес / Спратт, Джо / Скотт. "Кто несет ответственность за объявленную забастовку?" (PDF). Конференция MIT Sloan по спортивной аналитике.
  24. ^ Розалес / Спратт, Джо / Скотт. "Кто несет ответственность за объявленную забастовку?" (PDF). Конференция MIT Sloan по спортивной аналитике.
  25. ^ Swartz & Swartz, 2017, The Quality of Pitches in Major League Baseball, The American Statistician, в печати.
  26. ^ Swartz & Swartz, 2017, The Quality of Pitches in Major League Baseball, The American Statistician, в печати.