čtvrtek 22. října 2015

Synot liga: předpokládaný vs. skutečný bodový zisk


Nejvyšší česká fotbalová soutěž má za sebou deset kol, tedy třetinu soutěže. Ideální čas bilancovat. Po grafech znázorňujících počty střel, efektivnost střelby atd. jsem se rozhodl ještě podívat, jak si vedou jednotlivé týmy v porovnání s tím, co se od nich z hlediska bodového zisku očekávalo.

Asi tušíme, že například Jablonec nebo Bohemians nasbírali v dosavadním průběhu ligy méně bodů, než by se čekalo, a naopak Zlín či Slavia jich mají na svém kontě překvapivě víc. Ale o kolik konkrétně jich má ten který tým víc nebo míň jsem nikde neviděl a tak je na čase to spočítat.

Postup je jednoduchý. Porovnáme skutečný bodový zisk s tím, co od klubů očekávali bookmakeři, případně rating Elo. Spočítal jsem obě varianty, výsledky jsou vesměs podobné plus mínus. V případě bookmakerů jsem použil předzápasové kurzy ze stránek liga.cz a u ELO ratingu jsem použil server clubelo.com.

Co je to Elo? Použiji definici z wikipedie: Elo (též koeficient Elo nebo rating Elo) je statistické ohodnocení výkonnosti hráče či týmu na základě výsledků jeho her podle systému, jehož autorem byl Arpad Elo. Systém Elo byl zaveden nejdříve v šachu (v USA od roku 1959, celosvětově od roku 1970), lze ho však použít pro jakoukoli hru, v níž se střetávají dvojice hráčů nebo družstev. Může se také použít v jiných oblastech, například pro hodnocení obtížnosti otázek a schopností žáků při učení.

Club Elo do koeficientu započítává nejen výsledky z domácí ligy a poháru, ale i z evropských soutěží (Ligy mistrů, Evropské ligy) a umožňuje porovnávat sílu klubů nejen v rámci jednotlivých lig, ale i napříč mezi soutěžemi. Nejvyšší Elo v české lize mají Viktoria Plzeň (1660) a Sparta Praha (1669) a z tohohle pohledu by se svou silou neztratily oba české velkokluby ani v Bundeslize.

Rating českých klubů podle Elo Club (k 22.10.)



Ale pojďme k výpočtu předpokládaných bodů. Použil jsem metodologii Simona Gleavese, kterou před pár lety zveřejnil na svém blogu Scoreboard Journalism. Připomenu, že Simon Gleave se zabývá analýzou sportovních statistik ve společnosti Infostrada. Na twitteru má handle @SimonGleave.

Postup výpočtu

1.    Vezmeme předzápasové kurzy k jednotlivým zápasům na výhru domácích, remízu, výhru hostí.
2.    Číslo 1 vydělíme kurzy a dostaneme pravděpodobnost (šance) každé z variant.
3.    Výsledné číslo ale ještě je obvykle třeba upravit, protože součet pravděpodobností bývá zpravidla větší než 1 kvůli ziskové marži sázkové kanceláře (bookmakera).
4.    Pokud nám např. součet pravděpodobností vyjde 1,07, tak tímto číslem podělíme čísla, která nám vyšla v bodě 2. Teď už nám součet bude vycházet 1.
5.    Vypočítáme předpokládaný bodový zisk obou týmů v daném zápase tím, že pravděpodobnost výhry vynásobíme 3 a pravděpodobnost remízy vynásobíme 1.

V případě stránek clubelo.com už jsou u zápasů k dispozici předzápasové pravděpodobnosti, takže můžeme přejít rovnou k bodu 5. Konkrétně před utkání  Jablonec – Slavia Praha byla podle eloclub.com pravděpodobnost výhry domácích 63 % (použijeme desetinná čísla, tedy 0,63), remízy 22 % (0,22) a výhry hostů 15 % (0,15).

V případě Jablonce byl předpokládaný bodový zisk 3*0,63+0,22, tedy 2,11 bodu. V případě Slavie 3*0,15+0,22, tedy 0,67 bodu. Takhle to spočítáme pro všechny dosud odehrané zápasy, sečteme předpokládané body a porovnáme je se skutečným bodovým ziskem.

Dobré je, že porovnání skutečného bodového zisku s předpokládaným bodovým ziskem nám zohlední náročnost rozlosování. Vidíme tak např., zda mají Liberec či Slavia tolik bodů na svém kontě díky tomu, že měli snadný los, nebo díky tomu, že na rozdíl od předpokladů dokázali bodovat i proti silnějším soupeřům.

Rozdíl mezi skutečným a předpokládaným bodoým ziskem se tak dá využít i při vytváření pořadí aktuální formy klubů.

Teď se dostáváme ke konkrétním číslům ze Synot ligy po deseti odehraných kolech. Podle Club Elo si nejlépe nad očekávání vedou Slavia, Liberec, Mladá Boleslav a Zlín. Naopak nejhůře si vedou Jablonec, Jihlava, Baník a Bohemians. V ligové tabulce je sice se 4 body poslední Baník Ostrava ale nejvíce za očekáváními zaostávají Klokani.

Předpokládaný bodový zisk vs. skutečnost (Club Elo)



U Jablonce vyšel rozdíl mezi skutečností a předpoklady jen zhruba mínus tři body (podle Club Elo). V případě kurzů bookmakerů to vychází víc, mínus 4,56. Každopádně Club Elo i bookmakeři ve svých předpokladech považovali a nadále považují Jablonec z hlediska síly za český klub číslo tři.

Jinak, Sparta a Plzeň jsou lehce v plusu. Vzhledem k tomu, že oba kluby jdou v každém kole do zápasů jako velcí favorité, se u nich nedá očekávat příliš vysoký kladný bodový rozdíl.

Předpokládaný bodový zisk vs. skutečnost (bookmakeři)


Pro porovnání ještě přidávám tabulku s tím, jak to vychází podle kurzů přebraných z liga.cz. Ale u těchto dat si nejsem jistý, kdy před zápasem byly zaznamenány. Kurzy se jak víme hýbou, do budoucna budu raději používat při výpočtu předpokládaných bodů stránky Club Elo.

Jarek Krejčí (@championship365)



Žádné komentáře:

Okomentovat