6 letnie Expected Points – Analiza na podstawie BUNDESLIGi (2014-2020)

Zainspirowany m.in profilem „O futbolu statystycznie” (na twiterze: @OFutboluStat), a także swoim zamiłowaniem do matematyki, statystyki i analiz w Excell’u postanowiłem tuż po zdanej sesji zabrać się za pierwszy wpis na nowo-starej stronie. Mój pierwszy tekst będzie dotyczył 6 letniej analizy wskaźnika Expected Points na podstawie Niemieckiej Bundesligi. Zapraszam.

Czym jest Expected Points oraz Expected Goals

Jeśli pojęcie xPTS (Expected Points) oraz xG (Expected Goals) jest Ci obce to zapraszam do zapoznania się z nim w tym artkule. Który gorąco polecam.

TeamPTSxPTS
1Bayern Munich4837.65-10.35
2RasenBallsport Leipzig4142.31+1.31
3Wolfsburg3833.17-4.83
4Eintracht Frankfurt3637.22+1.22
5Bayer Leverkusen3530.94-4.06
6Borussia Dortmund3240.27+8.27
7Borussia M.Gladbach3231.40-0.60
8Freiburg3025.39-4.61
9Union Berlin2930.66+1.66
10VfB Stuttgart2530.56+5.56
11Werder Bremen2221.06-0.94
12Hoffenheim2224.79+2.79
13Augsburg2217.76-4.24
14FC Cologne2120.66-0.34
15Hertha Berlin1724.83+7.83
16Arminia Bielefeld1713.91-3.09
17Mainz 051322.24+9.24
18Schalke 04811.40+3.40
Aktualna na zdień 11 II 2021 tabela Bundesligi
Źródło: https://understat.com/league/Bundesliga

Na przykładzie Schalke 04 wskażę dane o, których będę najczęsciej wspominał w analizie:

PKT8
xPTS11.40
Różnica* (xPTS-PKT)+3.40
Najczęsciej wspominane dane w analizie



*Często w tekście będzie wytępować różnica, różnica EP to chodzi mi o tą wartość.

Expected Points dla poszczególnych sezonów.


Bez zaskoczenia na czele podsumowania (zarówno średniej i sumy EP) znalazł sie Bayern Monachium – co nikogo nie zaskakuje – największa różnica pomiędzy puntkami a modelem „EP”. Co jasno wskazuje, że posiada ponadprzeciętnych zawodników, którzy w rzeczywistości wg modelu powinni zdobyć mniej punktów. Drugie miejsce dla RB (Red Bull) Lipsk to również brak zaskoczenia w tym zestawieniu, jednak czy nie spodziewaliśmy się tam (lub w TOP 3) Borussi Dortmund? Borusia w zestawianiu znajduje się pośrodku stawki ze średnim wskaźnikiem 0,54 na sezon. Możemy powiedzieć, że przez 6 analizowanych sezonów ich faktyczny dorobek punkotwy zrównał się z modelem Expected Points. Poza Unionem i Fortuną Dusseldorf (które mają mało sezonów w analizowanym okresie) w czołówce zaskasuje pozycja Herty Berlin, analiza wskazuje, że ta ekipa powinna zdobyć więcej puntków niż faktycznie miała. Na drugim biegunie możemy wyróżnić ekipy: Stugarttu, Koloni oraz Eintracht, Mainz i Ausburg. Możemy powiedzieć, że te ekipy zdobywają średnio o co najmniej 2 pkt mniej niż wynika to z modelu „EP”.

Expected Points dla poszczególnych sezonów Bundesligi – opracowanie własne na podstawie danych z serwisu understat.com

Na drugim biegunie znajduje się drużyna z Koloni oraz Stuggartu, które powinny w analizowanych okresach zdobyć odpowiednio o prawie 5 pkt więcej niż faktycznie miały.

Ciekawym statystycznie sezonem jest 2015/2016 gdzie średnia EP wyniosła zaledwie 0,09.

Wartością średnia EP dla analizowanego okresu jest wartość 1,98 a więc, zespoły średnio zdobywają o prawie 2 pkt mniej niż powinny.


Możemy również zauważyć, że tylko w jednym przypadku w sezonie 2018/2019 zespół (Beyern) ma „EP” na zielono. Czyli tylko w jednym przypadku na 18 miejsc na podium, który powinien zdobyć więcej punktów niż miał faktycznie znalazł się na podium na koniec sezonu.

Pozycja w tabeli w poszczególnych sezonach, na samym dole pogrubiona korelacja Pearsona ( Expected Points i pozycji w tabeli) – opracowanie własne
Średnia Expected Points dla analizowanych sezonów.
Suma Expected Points dla analizowanych sezonów.

Miejsca w tabeli na koniec sezonu zestawiłem z różnicą punktów na koniec sezonu z modelem Expected Points, dane te posłużyły do analizy korelacji Pearsona.

Głównym założeniem tej analizy była odpowiedź na tezę:

czy zespół, który zdobywa więcej/mniej puntków niż zakłada model Expected Points ma większe/mniejsze szanse na wyższą/niższą pozycję na koniec sezonu w tabeli?


Sezon

Korelacja Pearsona
SezonKorelacja Pearsona
2014/20150,6634893671
2015/20160,6144286275
2016/20170,7021303869
2017/20180,6627459893
2018/20190,5777344724
2019/20200,5942952153
Całość0,6318651813
Korelacja Pearsona dla poszczególnych sezonów – opracowanie własne

Korelacja Persona wskazuje na korelację silną [korelacja silna zawiera się w warościach pomiędzy 0,5-0,7], korelacja dotyczy pozycji w tabeli z różnicą wartości „EP” a punktami zdobytymi. Wynika z niej prosty przepis na wyższe miejsce w tabeli jest skorelowane z ujemnym stosunekem zdobytych puntków do „EP” – czyli zespół musi posiadać lepszych zawodników niż zakłada model, którzy lepiej wykorzsytują sytuacje przez to wskaźnik jest ujemny.

Wniosek jest prosty, ważną składową, która przybliża do wyższego miejsca w tabeli jest ujemny stosunek xPTS do punktów.

Kacper.


Jeśli zaciekawił Cię temat to polecam zajrzeć na:

https://analizadanychwpilce.com/2021/02/13/oczekiwana-liczba-goli-xg/?fbclid=IwAR2Onh4VPp04pxnIX9KT1J4bI0v8dVMBe4Q2ejjzowjDs-J1Mjbs-7tjbvg
(https://analizadanychwpilce.com/)

Źródła:

understat.com/

clubelo.com/

https://analizadanychwpilce.com/

Skomentuj

Wprowadź swoje dane lub kliknij jedną z tych ikon, aby się zalogować:

Logo WordPress.com

Komentujesz korzystając z konta WordPress.com. Wyloguj /  Zmień )

Zdjęcie na Google

Komentujesz korzystając z konta Google. Wyloguj /  Zmień )

Zdjęcie z Twittera

Komentujesz korzystając z konta Twitter. Wyloguj /  Zmień )

Zdjęcie na Facebooku

Komentujesz korzystając z konta Facebook. Wyloguj /  Zmień )

Połączenie z %s