středa 24. února 2016

Kvalita vs. nahodilost: co více ovlivňuje tabulku české fotbalové ligy?

Inspirován staršími blogy Jamese Graysona, Martina Eastwooda či Phila Birnbauma a také knihou The Success Equation od Michaela Mauboussina jsem se rozhodl spočítat, jak velký vliv mají kvalita týmů (skill, talent) a nahodilost (randomness, luck) na podobu tabulky české fotbalové ligy. Třicet zápasů se může zdát někomu dost na to, aby konečné pořadí v tabulce odráželo kvality jednotlivých týmů, avšak zcela tomu tak není.

Fotbal je hra, v které padá málo branek, o vítězství, prohře mohou rozhodovat milimetry, sporná rozhodnutí rozhodčí, vynucená střídání v průběhu utkání atd., navíc rozdíly v kvalitě tým zejména ze středu tabulky bývají minimální a tak štěstí (smůla, náhoda…) mají velký vliv na pořadí tabulky i po 30 odehraných kolech a dokonce i po 38 kolech hraných v např. v Premier League.

Leicester City byl v minulé sezóně po třicet odehraných zápasech na poslední příčce Premier League, nakonec se mohutným finišem zachránil. O mistrovi Premier League v sezóně 2011/12 rozhodlo jen lepší skóre Manchesteru City. Ten přitom po 30 kolech ztrácel na Man United 3 body a po 32 dokonce 8. Jak je vidět, stačí pár kol navíc a tabulka (a posezónní komentáře a rozbory novinářů) mohou vypadat úplně jinak.

Při výpočtu jsem použil čísla z předchozích deseti sezón české fotbalové ligy a postupoval podle J. Graysona. Postup naleznete například zde (anglicky), trochu se obávám, že sám bych se do toho při vysvětlování zamotal. Tak mi můžete věřit, a nebo si výsledek sami spočítat.

Každopádně po výpočtech mi vyšlo, že po 30 odehraných kolech má na bodový zisk v Synot lize ze 60 % vliv kvalita jednotlivých týmů a ze 40 % nahodilost. Poměr mezi kvalitou a náhodou se v průběhu sezóny vyvíjí. Při menším počtu zápasů, zejména v úvodních fázích sezóny a v její první polovině převládá vliv nahodilosti.

Samozřejmě rozdíl mezi kvalitou Sparty, Plzně a zbytkem ligy je natolik velký, že se zpravidla síla obou klubů projeví už v úvodních fázích sezóny. Na druhou stranu bodový rozdíl mezi oběma kluby po 10, 20 či 30 kolech může být dán nahodilostí, zvlášť když se jedná jen o pár bodů (viz příklad Man City a Man United).

M. Eastwoodovi na příkladu Premier League vyšlo, že kvalita začíná mít navrch nad nahodilostí po zhruba 20 odehraných kolech. Po 30 kolech Premier League je poměr stejný jako v české lize, takže usuzuju, že někde okolo 20 kola se to láme i v Synot lize. Prostě a jednoduše, čím více kol, tím víc tabulka odráží kvalitu (sílu) jednotlivých týmů a tím více má signál navrch nad pouhým šumem.

Související odkazy:
The variance of points in the Premiership and La Liga (J. Grayson)

How Much Does Luck Affect Football Results? (M. Eastwood)

Luck vs. talent in the NHL standings (P. Birnbaum)

Skill, Luck, and the NHL’s Shortened Season (M. Mauboussin)

Luck and Skill Untangled: The Science of Success (M. Mauboussin)