čtvrtek 27. srpna 2015

Fotbalová analytika: Total shots ratio plus něco k Synot lize



Na mém twitterovém účtu zveřejněné statistiky o počtech střel jednotlivých týmů v Synot lize doplněné o ukazatel Total shots ratio (v hokeji označované jako Corsi) měly slušný ohlas, tudíž jsem se rozhodl trochu rozvést teorii, aby bylo jasné, jaký je smysl TSR a dalších podobných ukazatelů (Shots on target ratio, Expected goals ratio). 

Total shots ratio je poměrový ukazatel střel pro a proti (nutno dodat všech střel i těch mimo i zblokovaných). Výpočet je TSR= střely pro / (střely pro+střely proti). Síla tohoto ukazatele je především v tom, že do určité míry dokáže predikovat budoucí výkony týmu a to dokonce lépe, než počet bodů, které tým získal v dosavadním průběhu sezóny.

Důvodem je to, že góly jsou ve fotbale poměrně vzácné, mnohdy se v jednotlivých zápasech stane, že tým soupeře výrazně přestřílí a dá třeba jen jednu branku, zatím co soupeř dvakrát kopne do míče a jsou z toho dva góly. Tabulka pak zejména po pár odehraných kolech neodráží realitu toho, jak silný je ten který tým. 

Po 10, 15 či 20 odehraných kolech nám pořadí podle TSR může napovědět o možném konečném umístění týmu více než pořadí v ligové tabulce a platí to zejména v případech, kdy se postavení v tabulce výrazně odlišuje od seřazení dle TSR.

Podle analýzy dat, které dělal na číslech z Premier League James Grayson (viz jeho blog https://jameswgrayson.wordpress.com), však týmy, které více kontrolují míč a častěji střílí, mají lepší výsledky a na konci sezóny lepší umístění v tabulce, než týmy které bývají přestříleny. U těch je naopak větší pravděpodobnost, že se budou pohybovat v dolní polovině tabulky či dokonce hrát o záchranu. 

Zde je k tomu odkaz na jeden z článků pana Graysona - https://jameswgrayson.wordpress.com/2012/07/15/another-post-about-tsr/.

Korelace samozřejmě není stoprocentní a ani 38 kol v Premier League či pouhých 30 kol v Synot lize obvykle nestačí na to, aby pořadí v ligové tabulce naplno zohlednilo kvalitu jednotlivých týmů. Mimochodem i v hokejové NHL, kde má základní část 82 zápasů, se díky štěstí způsobenému např. pozitivní odchylkou v úspěšnosti zakončení, může do play-off dostat slabší tým.

Tudíž je dobré společně s TSR sledovat i další ukazatele, jako jsou úspěšnost střelby a naopak kolik ze střeleckých pokusů soupeřů skončí v síti. Tyto hodnoty mohou hodně napovědět, např. proč ten který tým střílí málo gólů – může to být jen prostě trocha smůly, zvláště pokud si tým podle statistik vypracovává dost střeleckých příležitostí.

Tady je tabulka ze statsbomb.com z údaji o průměrném počtu střel v jednotlivých sezónách Premier League a úspěšností zakončení, jak všech střel tak jen střel jdoucích mezi tyče (Shots on target).


Jak vidno, úspěšnost zakončení střel i střel na bránu je sezónu co sezónu hodně podobná. Příliš velké odchylky ani nejsou mezi jednotlivými týmy. Chelsea či Manchester City nedávají více gólů proto, že by měly výrazně nadprůměrnou úspěšnost zakončení, ale proto, že si vytvářejí více střeleckých příležitostí.
Samořejmě že TSR má mnohé mouchy a mnohé kluby ať už v Anglii či Německu zaměstnávající týmy matematicky zdatných analytiků jsou bezpochyby mnohem dál, co se vyhodnocování herních fundamentů týče.


TSR nám neříká o kvalitě střel, to se snaží řešit Expected goals modely, které na základě vstupních údajů (kupř. vzdálenost od brány, střelecký úhel, typ přihrávky, rychlost útoku atd.) dávají každé střele pravděpodobnost, s jakou mohla skončit v síti.


Také TSR neřeší tzv. score effects. Je totiž obvyklé, že prohrávající týmy po inkasované brance zvýší herní a střeleckou aktivitu (vedoucí týmy mají často tendenci hrát o něco defenzivněji). Takže střeleckou bilanci často prohrávajících týmů může nafouknout právě tato skutečnost.

A pak je tu třeba to, že výsledky a stejně tak TSR jsou ovlivněny rozlosováním ligy. Tým s těžším losem na úvod sezóny bude po pár odehraných kolech vypadat než podobně silný tým s lehčími soupeři. Ale to samé se dá ještě ve větší míře říci o ligové tabulce. 

Každopádně po pouhých pěti kolech vypadá pořadí v Synot lize dle TSR následovně a myslím, že přestože je to jen pět kol, tak v top 3 a asi i v top 6 jsou týmy, od kterých se umístění v top 3, resp. v top 6 očekává i na konci sezóny. Poslední je neustále hráče prodávající Baník.


Možná překvapením je pro někoho umístění Příbrami a Slovácka. Opět zdůrazním, že prediktivní síla TSR bude větší po 10 či 15 kolech, ale myslím, že Příbram je v ligové tabulce vysoko jen díky neudržitelně vysoké úspěšnosti zakončení (přes 20 %) a u Slovácka situaci trochu zkresluje utkání v Plzni, kde na jeho bránu šlo 36 střel.


Pak je tu ještě Slavia, fanoušci to sice vidí v této sezóně většinou na střed tabulky. Ale opět, Slavia dala 10 gólů z 50 střel (20 % úspěšnost), normál je asi někde v rozmeží 10 – 13 %. Milan Škoda dal 6 gólů z pouhých 16 střel (37,5 %). Takže to, že má Slavia na svém kontě 10 gólů není výsledkem silné ofenzívy a časté střelby, což je varovné znamení. A nejde bože, kdyby odešel Škoda do zahraničí.

Na začátku jsem zmínil i Shots on target ratio. Je to stejný ukazatel jako TSR, akorát počítaný pouze ze střel jdoucích na bránu. Těchto střel je míň, takže na začátku sezóny má SoTR menší vypovídací hodnotu, ale s přibývajícími koly by měl konvergovat k TSR.

Na závěr jen to, že TSR může mít v různých ligových soutěžích odlišnou vypovídací hodnotu a užitečnost. Většina analýz byla Graysonem a dalšími dělána na datech z Premier League, problematické může být využití TSR např. v Major League Soccer, kde díky systému draftů a platových stropů nejsou tak velké rozdíly v kvalitě jednotlivých týmů.

Jaroslav Krejčí
@championship365
jarek.krejci@gmail.com

Žádné komentáře:

Okomentovat