Насколько вероятно появление нового Лестера?

Последние 3 сезона топ-6 в Английской Премьер-лиге остаются без изменений, причём «Большая Шестёрка» отрывалась от остальных команд как минимум на 8 очков. Тем не менее, ещё совсем недавно мы были свидетелями одного из самых сенсационных результатов в истории спорта.

В 2016 году в английском футболе случилось поистине удивительное событие – АПЛ, лигу, многими болельщиками считающуюся сильнейшей в мире, выиграл Лестер Сити – клуб, который перед началом сезона занимал предпоследнее место в лиге по суммарной трансферной стоимости игроков команды, за год до этого чудом сохранил место в АПЛ (выиграв 7 матчей из 9 на финише чемпионата), а двумя годами ранее поднялся в элиту из Чемпионшипа. За всю историю АПЛ, начиная с 1992 года, лигу выигрывали только 5 клубов – Манчестер Юнайтед, Арсенал, Челси, Манчестер Сити и Блэкбэрн Роверс, причём последний выиграл лишь однажды и уже довольно давно – в 1995 году, – а потому успех Лестера казался ещё более невероятным. Перед началом сезона букмекеры давали коэффициент 5000:1 на победу Лестера, и после окончания чемпионата они понесли рекордные убытки[1]. Но насколько вероятной была победа Лестера на самом деле?

В своей статье 2018 года американские исследователи Craig A. Heard и A. John Bailer анализируют вероятность появления в АПЛ второго Лестера. Конечно, на итоговую позицию команды влияет множество факторов, но исследователи решили сосредоточиться на изучении влияния места, занятого командой в предыдущем сезоне, на результат в сезоне нынешнем. Для этого они берут стартовые и финальные позиции и набранные очки команд за сезоны 1996/97–2015/16 и проводят симуляции с помощью метода Монте-Карло, используя вероятности набрать определённое количество очков при условии, что в предыдущем сезоне команда заняла определённое место.

Рисунок 1 показывает, какие места в итоговой таблице занимали команды, начинавшие с определённых позиций по итогам предыдущего сезона. Как видно из таблицы, до Лестера чемпионом никогда не становилась команда, закончившая предыдущий сезон вне призовой тройки. В то же время, действующий чемпион лишь раз не попал даже в Лигу Европы – этим чемпионом стал Челси всё в том же сезоне 2015/2016. Из других интересных наблюдений можно заметить достижения Ипсвича в начале века – сначала Ипсвич забрался на 5 место в свой первый же сезон в АПЛ, а на следующий год занял 18 место и вылетел в обратно в Чемпионшип.

Рисунок 2 показывает, сколько очков набирали команды, начинавшие с определённых позиций по итогам предыдущего сезона. Выбросы, то есть команды, набравшие значительно больше или значительно меньше среднего количества очков для команды с соответствующей стартовой позицией, выделены отдельно. Из рисунка можно заметить, что практически нет разницы между очками, набираемыми призёрами предыдущего чемпионата. В то же время можно заметить, что разница между командами, стартующими с позиций с 7 по 20, довольно невелика; таким образом, ни одна команда за пределами топ-6 не может чувствовать себя спокойно в борьбе за выживание. На этом рисунке Лестер и Челси из сезона 2015/16 выделяются так же отчётливо, как и на предыдущем.

Рисунок 3 показывает среднее число очков, набранное командами с определёнными стартовыми позициями дома, в гостях и в целом, а для погрешности взято значение в 2 стандартных отклонения от среднего значения. Как видно из этого рисунка, для команд из топ-4 преимущество домашнего поля является намного более существенным, чем для других команд. Это преимущество достаточно ярко выражено у команд 5-6, в то время как для команд 7-12 разница уже почти незаметна, а для команд 13-20 и вовсе заметен обратный тренд – аутсайдеры в среднем берут больше очков на выезде, чем дома. Авторы исследования объясняют эту неожиданную статистику тем, что фавориты исторически берут хотя бы одно очко на выезде, играя против аутсайдеров; тем не менее, мне это объяснение кажется неубедительным, и в будущих исследованиях стоит проверять другие гипотезы.

На основании рисунка 3 авторы делят команды на группы мест 1-4, 5-6 и 7-20, а затем считают вероятность победы более рейтинговой команды[2], используя исторические данные по 19 сезонам, предшествовавшим победе Лестера. Результаты приведены на рисунке 4.

Из этого рисунка заметно, что преимущество домашнего поля играет большую роль для более рейтинговой команды. Кроме того, вероятность победы увеличивается при росте разницы в начальных позициях команд, причём особенно ярко это выражено для команд 1-4 и 5-6. Для команд 7-20 вероятность победы фаворита увеличивается, но не так сильно, что ещё раз свидетельствует о высокой плотности команд в нижней части таблицы.

Симуляция

Сама симуляция проводилась следующим образом. Авторы посчитали вероятность победы, ничьей и поражения для каждой пары команд с определёнными стартовыми позициями, учитывая фактор домашнего/гостевого поля. Кроме того, каждой команде была присвоена некоторая разница забитых и пропущенных мячей, выбранная случайным образом из всех разниц, которых добивались команды с данной начальной позицией. Исследователи провели 10.000 симуляций, для каждой получив итоговую таблицу. Далее, на основе симуляций была посчитана вероятность для команды со стартовой позицией i занять итоговое место j. Результат сравнения этих вероятностей с вероятностями, полученными из анализа 19 предыдущих чемпионатов, представлены на рисунке 5.

На этом рисунке тёмно-красными обозначены квадратики, в которых смоделированное значение вероятности намного выше наблюдавшейся вероятности, а тёмно-синими – наоборот. Например, действующий чемпион защищает свой титул намного реже, чем предсказывает моделирование (30% против 54%), а вот серебряный призёр предыдущего чемпионата выигрывает чемпионат в новом сезоне намного чаще, чем в симуляции (50% против 24%). Авторы предполагают, что такое расхождение действительных результатов с прогнозом объясняется большими инвестициями и более сильной мотивацией у серебряного призёра, нежели у чемпиона. Кроме того, против чемпиона все стараются показать свою лучшую игру, поэтому защищать титул сложнее, чем бороться за него со второго места. Что интересно, ни одна команда из топ-4 по итогам предыдущего сезона не вылетала в новом сезоне.

Из 10000 симулированных сезонов только в одном победила команда, начинавшая сезон с 14 места в предыдущем сезоне (как Лестер в сезоне 2015/16). Из команд, начинавших сезон с 7-20 места, только 4 команды (7, 9, 11 и 14) смогли выиграть хотя бы один сезон, причём команда с 11 места выиграла трижды! Таким образом, эмпирическая вероятность того, что одна из команд 7-20 выиграет лигу, составляет 7/10000, что примерно равно 1/1428 или 0,07%. Учитывая то, что вероятности выиграть лигу для каждой из команд 7-20 примерно равны, вероятность победы в лиге для каждой конкретной команды намного ниже и равна примерно 1/20000 или 0,005%.

Например, по результатам 20 симуляций вероятность того, что команда 14 выиграет лигу, составляют 1/66667 или 0,0015%. Таким образом, коэффициент 5000:1, который букмекеры давали на Лестер перед началом сезона, можно назвать достаточно консервативным.

Возвращаясь к вопросу в заголовке статьи – авторы считают появление нового Лестера не слишком вероятным и сообщают, что не планируют делать ставки на подобные события в ближайшее время.

Библиография:

C. Heard, J. Bailer. (2018). Defying the Odds: How Likely Are We to See Another Team Pull a ‘Leicester’ and Win the EPL? CHANCE, 31:3, pp. 59-66.

[1] По информации «Рейтинга Букмекеров», крупнейшие британские и российские букмекеры понесли большие убытки.

[2] Более рейтинговая – любая команда с более высокой стартовой позицией (более высоким местом в предыдущем сезоне). Например, 1 для 3 и 8 для 19 будут более рейтинговыми.

Фотография:

URL

Автор