Xg статистика в футболе что это
Статистика xG: что это и как использовать в ставках на спорт?
В футбольной аналитике используют много статистических параметров. Сами по себе цифры обычно ничего не значат. Их всегда нужно рассматривать в контексте ситуации: как складывался тот или иной матч, какой стиль игры у команды, какая тактическая расстановка. Статистические параметры бывают точными и вероятностными. К первым относится, например, число ударов в створ ворот. О примере статистических параметров второго типа пойдет речь в этой статье: мы объясним, что такое xG-статистика.
Что такое статистика xG?
Термин xG расшифровывается как «expected goals», а переводится как «ожидаемые голы».
Вес каждого удара определяется на основе ряда параметров. Этот вес варьируется в зависимости от лиги. Основные факторы, которые учитывают различные xG-модели:
Суммируя веса каждого созданного момента, мы получаем результат матча, ожидаемый на основании этих моментов. К примеру, счет матча «Спартак» – ЦСКА в 20-м туре РФПЛ 2017/2018 в цифрах xG выглядит так: 2.67 — 0.42. В реальности – 3:0.
Историческая справка
Создателем первой системы xG по праву считается норвежский тренер Эгиль Ольсен. Он известен своей успешной работой со сборной своей страны. При нем Норвегия дважды отбиралась на чемпионат мира (1994, 1998). Ольсен знаменит еще и тем, что одним из первых начал использовать видеоанализ матчей вкупе с анализом статистических параметров.
При подготовке к разбору игр норвежский тренер делил все удары по воротам на три типа: опасные, средней опасности и неопасные. Удары распределялись по группам в зависимости от того, на каком расстоянии от ворот их наносили. Соответственно, чем дальше точка удара, тем вероятность забить меньше.
Философия Ольсена заключалась в том, что его команда должна стремиться к тому, чтобы как можно больше ударов в атаке были «опасными» и чтобы защита допускала как можно меньше «опасных» ударов.
Оверперформ и андерперформ в xG-статистике
В упомянутом ранее матче «Спартака» и ЦСКА реальный счет соответствовал ожидаемому по xG. «Красно-белые» создавали много моментов, которые команда конвертировала в голы. Но так бывает не всегда. Например, матч «Арсенал» – «Манчестер Юнайтед» в 15-м туре АПЛ 2017/2018, который окончился со счетом 1:3. В числах xG счет этого матча должен был выглядеть так: 4.55 — 2.12. Существенная разница.
Значит ли это, что модель xG не может предсказывать матчи и не показывает мастерство команды в создании моментов? Не совсем. Методология xG помогает проанализировать то, насколько хуже или лучше команда выступила относительно моментов, которые она создала и допустила.
Все тот же матч «Арсенала» и «Манчестер Юнайтед» ознаменовался прекрасной игрой стража ворот «красных дьяволов» Давида Де Хеа. Он обновил свой же рекорд сезона 2017/2018 по числу сейвов в матче – 7. «Арсенал» действительно создавал много моментов, но мяч упорно не залетал в ворота. В этой встрече у «Арсенала» был сильный «андерперформ» (от англ. «underperform» – выступление ниже ожиданий). Он составил +3.55 (xG-GF). Это означает, что команда достаточно много создала, но не конвертировала моменты в реальные голы.
В футболе не всегда получается превратить моменты в голы. Иногда это дело случая. Но на дистанции подобные расхождения становятся частью статистических флуктуаций. То есть по недобору голов в одном матче можно предположить, что в последующих команда исправится.
Другая крайность – это «оверперформ» (от англ. «overperform» – выступление выше ожиданий). Он возникает тогда, когда команда забивает больше, чем показывает модель xG. Такое часто бывает. Канонический для пример этого явления – «Спартак» образца сезона 2016/17.
В том сезоне «Спартак» стал триумфатором первенства, но по xG был почти самым крупным «оверперформером». Проще говоря, его победы были неожиданными. Вы помните голы Дениса Глушакова с дальних дистанций, которые приносили победы «красно-белым»? Такие удары имеют низкий вес: с подобных дистанций почти невозможно постоянно забивать и приносить результат. Тем не менее такими ударами были добыты важные победы «Спартака». Подобный ритм сложно поддерживать на дистанции в два и более сезонов.
Сложности xG
Есть несколько моментов, которые пока никак не учитываются xG-моделями. К примеру, ненанесенные удары. Представим ситуацию, что игрок вышел на ударную позицию, но промахнулся по мячу. Такой момент не будет учитываться в xG. Впрочем, на длительной дистанции – в сезон или несколько сезонов – подобное нивелируется.
Несмотря на проблемные элементы xG-системы, которые также включают трактовку автоголов, пенальти, непробитых ударов, на длительной дистанции xG-статистика достаточно близко отражает действительную силу команд. С начала сезона АПЛ 2017/2018 статистику xG стали представлять в эфире BBC наряду с другими статистическими параметрами, по которым оценивается матч, вроде процента владения мячом или точных передач.
Статистика xG и ставки на спорт
xG может быть полезен и в ставках на спорт. Нужно понимать, что это не единственный параметр, который следует использовать для ставок. Нужно всегда исходить из того, почему цифры вышли именно такими. Надо учитывать форму игроков и то, в каком состоянии они подходят к встрече.
Важно помнить и то, что любые статистические параметры склонны к регрессии к среднему, о которой мы еще поговорим. То есть статистический всплеск на дистанции нивелируется падением. Например, нападающему сложно удержать высокую результативность на длительной дистанции, через какое-то время он перестанет забивать больше ожидаемого по xG. Та же логика применима к командам. Удачные серии, когда команда создает меньше, чем в реальности забивает, заканчиваются. И такие серии можно отслеживать и прогнозировать.
Полезные ресурсы об xG:
Материал подготовил: Кирилл Орлов
Анализировать xG статистику проще, чем кажется. Разбираемся, где смотреть хайповые футбольные метрики
В первой части этой рубрики мы разбирали сервисы для анализа коэффициентов букмекерской линии. Во второй части поговорим о популярной продвинутой футбольной статистике: где смотреть и с чем есть.
xG («expected goals») – это модель ожидаемых голов aka метод оценки качества моментов aka попытка более точно оценить результат матча в отрыве от счета на табло aka переоцененная метрика, не учитывающая контекст. Все по-разному оценивают эту модель, кто-то может считать ее прорывной, кто-то относится, мягко говоря, скептически, и у обеих сторон найдется достаточное количество аргументов. Лично я со своей дилетантской оценкой нахожусь где-то посередине, скорее ближе к первому варианту, оценивая мнение более компетентных ребят и вообще суть всей этой затеи. Но, кто бы что ни говорил, в любом случае, это есть, это данность, это интересно, и это может быть неплохим дополнительным инструментом для беттеров.
Еще одна проблема метрики – тонкости непосредственно самих подсчетов и вечные дискуссии по этому поводу. Из всего многообразия задротских твиттер-аккаунтов, блокнотов, сайтов и платных ресурсов предлагаю сегодня остановиться на двух наиболее актуальных, удобных и доступных для нас источниках на сегодняшний день: Understat и xScore. Отзывы по обоим сайтам и их работе можете чекнуть самостоятельно. При этом в нашем материале тоже будет парочка сравнительных моментов.
Understat
Сайт предоставляет бесплатные данные по топовым лигам, интуитивно понятен в использовании без знания языка, имеет весьма широкий функционал и является сейчас, пожалуй, самым используемым и цитируемым источником.
Рассмотрим основной функционал на примере АПЛ.
В основной табличке мы видим количество матчей, побед, ничьих, поражений, забитых/пропущенных голов, очков, ну и, соответственно, интересные нам xG (ожидаемые голы команды), xGA (ожидаемые пропущенные голы) и xPTS (ожидаемые очки). Все столбики можно сортировать, выше можно выбирать нужные временные отрезки и выстраивать таблицу по ним. Присутствует и сортировка по домашним/выездным матчам. Также можно добавить дополнительные метрики с помощью иконки “настройки” в правом верхнем углу. Например, интенсивность прессинга команд (PPDA), но сегодня говорим только конкретно про xG.Зеленые и красные дополнительные цифры показывают, насколько команда недобирает, или наоборот, перебирает голов/очков относительно голевых моментов в их матчах. Например, у «Лестера» мы видим 54 в графе забитых голов, но наиграли они только на 43, соответственно сайт указывает на перебор почти в 11 пунктов. А пропущенных у них 27 вместо ожидаемых 35. Как логичное следствие этого – 50 набранных очков вместо ожидаемых 43 (upd: материал готовился до поражения от «Норвича»).
При этом любопытно, что ближайшие преследователи, «Челси» и «МЮ», наоборот прилично недобирают. Отталкиваясь от этих данных и от того, что «Челси» уже с огромной долей вероятности вылетел из ЛЧ, можно предположить, что «Лестер» все-таки не сможет удержать третью строчку. Котировки на такой маркет предлагаются букмекерами в районе 4. Но тут нужно смотреть календари и т.д., а этот материал все же не про прогнозы.
Вообще, эти самые ожидаемые очки (xPTS) – одна из причин моего лояльного отношения к xG-статистике в целом, поскольку постоянно наблюдаются эти закономерности. Одни из самых ярких примеров нынешнего сезона – «Кальяри» в Италии и «Шальке» в Германии, которые дико оверперформили и шли необоснованно высоко согласно xG-статистике. Как следствие, мы видим, что одни не могут выиграть в чемпионате десять матчей кряду, у вторых одна победа в восьми матчах (upd: прибавляйте к этому еще по одному поражению, в последнем туре они снова проиграли). С командами хай-лвла это, как правило, работает хуже, там свои особенности, но вот на подобном уровне, на дистанции, команды зачастую приходят к своим реальным цифрам, которые отображает нам xG статистика.
Кстати, один из факторов, влияющих на такой перебор очков у «Лестера» – это Джейми Варди, положивший в этом сезоне АПЛ уже 17 мячей из тех ситуаций, в которых он, по мнению Understat, должен был забивать 13. Это, конечно, капля в море для общей картины, но я подвожу к тому, что во второй таблице в разделе выбранного чемпионата вы можете посмотреть индивидуальные показатели всех игроков.
Тут у нас тоже доступны любые сортировки: по датам, позициям, столбикам и т.д. В самой таблице: игрок, его клуб, количество матчей, количество сыгранных минут, количество забитых мячей, ассисты, xG (сколько должен был забить игрок исходя из расчетов нейросетей этого ресурса), xA (сколько должны были забить после его ассистов), ну и xG90/xA90 – это то же самое, только в пересчете на 90 минут игрового времени футболиста.
Также сайт имеет весьма интересное и приятное наполнение по каждому отдельно взятому матчу. Там мы можем посмотреть:
2. Временные диаграммы
4. Сводную таблицу по всем футболистам
Ну а перейдя на страничку конкретной команды, помимо непосредственно результатов матчей, можно ознакомиться с более углубленными данными. В каких ситуациях команда чаще всего создает и допускает моменты (с игры, с угловых, со штрафных), при какой расстановке, при какой ситуации в счете, на каких минутах, из каких зон, и так далее.
xScore
Второй сайт нашего обзора – xScore. Русскоязычный ресурс с упором в сторону беттинга (хотя вроде как за андерстатом тоже наши стоят), где помимо xG статистики можно увидеть различные статьи на эту тему, неплохой контент на ютуб-канале, а также платные услуги: собственный обучающий курс, инструментарий для беттеров и другие уникальные задумки авторов.
На данный момент сайт находится в реестре Роскомнадзора и для доступа к нему нужно использовать VPN.
xG от xScore рассчитывается на основе данных, которые собираются собственной командой статистиков. Статистики вручную собирают все необходимые данные: положение вратаря, защитников, степень заблокированности удара. Они вносят на сайт все ключевые параметры удара, и на их основе нейросеть сайта рассчитывает xG. Таким образом, xScore повышает точность своей статистики, их основная задача – показать более реальную картину, которая складывалась на поле во время матча.
Эта часть материала не ради того, чтобы показать, что один сайт лучше другого, или что методы xScore гораздо правильнее и намного точнее, чем классические модели. При подготовке материала появилась возможность взять комментарий со стороны сайта для полноты картины, и вот какую отличительную особенность они выделяют в первую очередь, приводя конкретные примеры своей работы:
К примеру, на 72 минуте матча «Шеффилд» – «Манчестер Сити» Агуэро бьет по пустым воротам, находясь во вратарской. Understat оценил этот момент в 0,63xG, оценка на сайте xScore 0,98xG.
Еще один пример: в матче «Арсенал» – «Челси» Жоржиньо бьет по пустым воротам, ему не мешают ни защитники, ни вратарь. Оценка Understat – 0,60xG, xScore оценил данный момент в 0,92xG.
В бесплатном доступе на xScore те же шесть основных чемпионатов, а вместе с ними Украина и Беларусь. Всего на сайте 76 дивизионов, среди которых можно найти совсем экзотические. Например, чемпионат Марокко, Эквадора, Исландии и Азербайджана, вторые лиги Южной Кореи, Турции, Норвегии и даже шесть дивизионов Италии, включая Примаверу. Подписка на xG статистику от xScore возможна на 12 месяцев, стоимость доступа ко всей базе матчей составляет 449$ в год с возможностью рассрочки.
Основная таблица не сильно отличается от андерстата, те же знакомые параметры, но здесь же, в общей таблице, есть удобная сортировка по минутам матча. Эта функция может быть полезна для лайва, например, в плане голов в концовке матча, да и вообще отслеживания статистически интересных временных интервалов. Своеобразным аналогом xPTS у хскора является GD-xGD: показатель, оценивающий везение команд в предыдущих матчах на основе показателя разницы забитых и пропущенных голов, а также разницы ОЖИДАЕМЫХ забитых и пропущенных голов. Как Understat нам указывал на перебор очков у «Ливерпуля» и «Лестера», на недобор очков у «Челси», так и xScore в плане везения команд показывает примерно то же самое.
Ниже идет еще одна таблица, которая может быть полезна при анализе под лайв. Это статистика команд в конкретных ситуациях по ходу матча: при счете 0:0, при ничьей, при различной разнице в счете.
Также стоит отметить блоговый раздел сайта «xTalk», где пользователи делятся своими наработками, стратегиями, результатами и формируют определенное комьюнити. Можно создать свой блог, подписываться на других блогеров и формировать свою ленту, обсуждать публикации в комментариях.
На этом все, надеемся, этот материал будет полезен для вас. В первую очередь для тех, кто был далек от этой темы и кому раньше было лень во все это вникать, поскольку зачастую подобные материалы написаны более сложным языком.
Что такое xG-показатель при анализе футбольных матчей
На дворе XXI век, и футбол все больше превращается в игру технологий и глубокого анализа. Для лучшего понимания сути спортивного процесса придумано огромное множество разнообразных статистических элементов. Это уже не просто удары в створ или поданные угловые. Мир футбола оцифровывается, и одной из новинок на рынке стал показатель xG в футболе. Кратко о главном: xG расшифровывается как ‘expected goals’ и дословно переводится как «ожидаемые голы».
Как считать xG?
Статистический показатель xG давно перестал быть тайной футбольных клубов за семью печатями. Сейчас посчитать «ожидаемые голы» может любой, кто обладает необходимыми данными. Есть много различных моделей подсчета xG, но все они основаны на количестве и качестве ударов по воротам.
Модель xG так же, как и футбол в целом, не стоит на месте, получает развитие от года к году. Сейчас стали считать показатель xGa, который отражает, сколько опасных моментов позволяет создавать команда у своих ворот. Или показатель xP — потенциально набранные очки при реализованных моментах.
Почему xG не всегда бывает прав?
Показатель xG давно вошел в обиход не только футбольных аналитиков и тренеров, но и обычных поклонников спорта номер один. В английской Премьер-лиге с сезона-2018/19 статистику xG показывают как один из предматчевых раскладов наряду со стартовым составом.
Тем не менее xG, как и любая другая статистика, имеет погрешности и неточности. Невозможно превратить сухие цифры создаваемых моментов в реальные голы. Нельзя учесть силу и мотивацию соперника, настрой игроков, правильность выбранной тактики, фактор быстрого гола и многое другое. Фактически xG — это просто цифра, дающая подсказку до игры, но никак не основа анализа будущего матча. Поэтому пользоваться xG-статистикой в футболе надо с глазами, открытыми на все остальные входящие данные.
Как использовать xG в ставках на спорт?
Игроки на ставках быстро осознали потенциал xG-статистики для ставок. Фактически после каждой игры можно без просмотра матча узнать, сколько каждая команда создала реальных голевых моментов. С накоплением данных xG становится еще более интересным показателем: понятно, сколь много конкретный клуб атакует и сколько при этом реализует своих возможностей.
То есть игрок, имея статистику по xG, может спрогнозировать количество моментов, которое команда создаст в предстоящем матче. Правда, никто не гарантирует, что количество обязательно перерастет в качество.
Для лучшего использования показатель xG в футболе, как и любую другую статистику, стоит рассматривать в совокупности со многими параметрами. Определяющее значение имеет качество игроков в составе клуба: даже с невысокой статистикой xG можно забивать много голов, если есть хорошая реализация. И наоборот.
Пожалуй, модель xG лучше всего подходит для ставок вдолгую, на перспективу. Имея данные о первой части сезона, можно спрогнозировать, сколько голов сможет забивать команда во второй части цикла. Однако и тут не стоит полностью полагаться только на xG, ведь в клубе может случиться что угодно — от смены футбольного менталитета до замены тренера.
Что же такое xG модель? И как её можно применять в ставках на футбол?
Всем привет друзья, по традиции, после выпуска видео, мы выпускаем текстовый формат информации, которую вы могли узнать из видео. Это будет полезно будет тем, кто лучше обучается в текстовом. В последних двух выпусках мы затронули очень важную тему, без которой прогнозирование по футболу в 2018 году просто невозможно. Речь пойдет о моделе xG.
В самом начале статьи хотелось бы напомнить вам, что для обучения заработку ставками лучше всего пользоваться сайтом https://xscore.win Так же данный сайт является мировым лидером в области xG статистики.
Что же такое xG модель? xG («expected goals») – это модель ожидаемых голов. В основе её лежит показатель ударов по воротам, на основе которого мы можем оценить сколько реально голов должна была забить команда, если учесть все удары которые она нанесла. Это очень похоже на EV показатель в покере, так что тем кто играет в покер профессионально это все должно быть очень знакомо.
xG работает следующим образом, каждому удару в матче присваивается коэффициент опасности. Коэффициент опасности это по сути ВЕРОЯТНОСТЬ ЗАБИТЬ ГОЛ.
В совокупности эта система нам показывает, что непосредственно сами голы – очень ненадежный показатель команды в конкретном матче. Она помогает выявить недооцененные команды, которым сейчас не везет и напротив команды, которым очень сильно везет. Из-за чего слабая часть пула игроков которая не учитывает данный показатель, будет их недооценивать или напротив переоценивать.
К примеру, если команда за 10 матчей набрала 18.4 ожидаемых голов по xG, а её фактический результат составляет всего 8 голов за 10 туров, то это говорит о том, что данной команде очень сильно не везет в атаке и стоит рассмотреть ставки на нее в дальнейшем, особенно против команд, которым наоборот везет. Или же рассмотреть ставки на тотал больше этой команды, который так же будет недооценен, ведь данная команда забила намного меньше голов, чем должна была. Так как базовая статистика которую мы привыкли видеть, никак не отображает показатель везения. Если вы в базовой статистике увидите команду с 8 голами за 10 туров, то решите, что это слабо результативная команда, хотя на самом деле проблема команды заключается в том, что на данный момент у команды черная полоса с реализацией моментов.
Футбол спорт с очень низкой результативности и голы как правило не показывают реальную ситуацию на поле. Поэтому чтобы нам лучше ориентироваться в футболе, система xG приходит нам на помощь помогая оценить качество игры команд лучше, чем это делают голы или турнирная таблица. На основе xG строят ставки в настоящее время все серьёзные бетторы.
Кстати, помимо xG голов, есть еще множество других интересных статистических показателей, работающих по тому же принципу и на которые практически никогда не обращают внимание. Например, любой навес с фланга несет в себе %, при котором нападающий ударит с опасной зоны и будет иметь высокую вероятность забить гол. Поэтому если футболист попытался навесить в опасную зону, а его навес блокировали, то этот навес все равно включал в себя % гола. На сленге футбольных комментаторов это называется «назревает гол», это фактически, когда не видно ни одного удара по воротам, зато регулярно идут навесы или прострелы в опасную зону, которые не проходят по причине блокировки защитниками или неточности навеса.
Но нас интересует тот факт, что никогда такой навес или пас не пойдет ни в одну популярную статистику, которую смогут использовать большинство игроков. Поэтому если вы пользуетесь таким продвинутым методом, то сможете быть далеко впереди пула игроков.
И xG, как я уже сказал ранее, способна выявить недооцененные команды, которые хорошо выступают из матча к матчу и должны выигрывать большинство матчей, но им не везет, и из-за неудачных стечений обстоятельств они регулярно теряют очки и получают незаслуженную критику в свой адрес.
До появления xG все удары в статистике были безликими сухими числами, и это была главная проблема.
Равнялся этому (С 3 минуты, 22 секунды)
Рассмотрим два удара из видео выше.
В первом случае Квальярелла бьет рабочей правой ногой с очень близкого расстояния, практически без помех, вероятность гола в этом моменте должна быть близка к 100%.
Во втором же моменте Д’Алесандро бьет из-за предела штрафной, при этом удару предшествуют события, которые явно не повышают вероятность забить гол. Я имею в виду неудобную для удара позицию с разворота, так же впереди и по бокам от него 4 игрока соперника. Все это в сумме уменьшает вероятность забить гол. Из этой позиции в такой ситуации он забьет не чаще, чем 1 раз из 20-25 ударов. А значит максимальная вероятность забить гол здесь не более 4-5%.
Как вы видите удару Квальяреллы он присвоил 84%, а удару Д’Алессандро 3%.
Давайте теперь рассмотрим какие же факторы влияют на вероятность гола в том или ином моменте?
На самом деле факторов, влияющих на вероятность гола во время удара бесчисленное количество, вплоть до того в каком настроении игрок, куда дует ветер в данный момент или что ел сегодня на завтрак игрок. Все эти факторы безусловно так или иначе влияют на вероятность поразить ворота, но во-первых эти факторы относятся к разряду тех, которые практически невозможно отследить и просчитать, а во-вторых эти факторы очень слабо влияют на вероятности, по сравнению с некоторыми другими, которые непосредственно очень сильно влияют на вероятности и являются ключевыми.
Я выделю три ключевых фактора, которые влияют на вероятность гола:
1. Расстояние до ворот.
2. Угол относительно линии, делящей поле пополам в продольном направлении. Относительно этой линии строится угол от точки удара до точки середины ворот. (см. скрин ниже)
Теперь я пробегусь вкратце по этим 3 факторам и начну с первого, а именно с расстояния до ворот. К примеру, если игрок бьет с 80 метров, то какие бы не были данные у двух остальных факторов, вероятность забить гол будет низкая.
Что касается второго пункта, если игрок бьет с нулевого угла, то его уже не спасет маленькое расстояние до ворот и отсутствие помех в виде защитников. Так как поразить ворота с острого угла очень тяжело.
То же самое справедливо и с блокировкой мяча. Если вплотную на расстоянии 10 сантиметров перед мячом 3 игрока соперника, плюс вратарь на линии, то все остальные факторы уже не важны, так как поразить ворота с такой позиции практически невозможно, т.к. практически все удары будут заблокированы соперником, а значит вероятность гола здесь близка к нулю.
Так что эти 3 фактора являются по сути равномерными, и их вы можете ставить в любой последовательности, так как каждый из них существенно влияет на вероятность поразить ворота.
Есть и другие факторы, такие как скилл игрока, скилл вратаря, какой частью тела бьет игрок, сколько игрок пробежал перед ударом и многое другое, все это безусловно тоже важно, но все эти факторы значительно уступают по важности 3 вышеперечисленным, так как не влияют существенно на вероятность забить гол. Да от этих факторов вероятность реализации изменяется, но не настолько сильно как от основных факторов.
Вот так на основании различных факторов и определяется вероятность гола для каждого удара, то есть вне зависимости от того куда полетел мяч после удара, на трибуны или в сетку ворот на оценку вероятностей это не влияет никоим образом, оценка вероятности происходит в момент удара.
Посчитав вероятности гола во всех ударах команды за матч, мы складываем эти вероятности и получаем альтернативный счет матча по xG. И с помощью этого альтернативного счета по xG мы и можем строить всевозможные модели прогнозирования вероятностей исходов событий. О них мы поговорим в следующих статьях!