Na mém twitterovém účtu zveřejněné statistiky o počtech
střel jednotlivých týmů v Synot lize doplněné o ukazatel Total shots ratio (v hokeji označované
jako Corsi) měly slušný ohlas, tudíž
jsem se rozhodl trochu rozvést teorii, aby bylo jasné, jaký je smysl TSR a
dalších podobných ukazatelů (Shots on target ratio, Expected goals ratio).
Total shots ratio je poměrový ukazatel střel pro a proti
(nutno dodat všech střel i těch mimo i zblokovaných). Výpočet je TSR= střely pro / (střely pro+střely proti).
Síla tohoto ukazatele je především v tom, že do určité míry dokáže predikovat
budoucí výkony týmu a to dokonce lépe, než počet bodů, které tým získal v dosavadním
průběhu sezóny.
Důvodem je to, že góly jsou ve fotbale poměrně vzácné,
mnohdy se v jednotlivých zápasech stane, že tým soupeře výrazně přestřílí
a dá třeba jen jednu branku, zatím co soupeř dvakrát kopne do míče a jsou z toho
dva góly. Tabulka pak zejména po pár odehraných kolech neodráží realitu toho,
jak silný je ten který tým.
Po 10, 15 či 20 odehraných kolech nám pořadí podle TSR může
napovědět o možném konečném umístění týmu více než pořadí v ligové tabulce
a platí to zejména v případech, kdy se postavení v tabulce výrazně
odlišuje od seřazení dle TSR.
Podle analýzy dat, které dělal na číslech z Premier League
James Grayson (viz jeho blog https://jameswgrayson.wordpress.com),
však týmy, které více kontrolují míč a častěji střílí, mají lepší výsledky a na
konci sezóny lepší umístění v tabulce, než týmy které bývají přestříleny.
U těch je naopak větší pravděpodobnost, že se budou pohybovat v dolní polovině
tabulky či dokonce hrát o záchranu.
Zde je k tomu odkaz na jeden z článků pana Graysona - https://jameswgrayson.wordpress.com/2012/07/15/another-post-about-tsr/.
Korelace samozřejmě není stoprocentní a ani 38 kol v Premier
League či pouhých 30 kol v Synot lize obvykle nestačí na to, aby pořadí v ligové
tabulce naplno zohlednilo kvalitu jednotlivých týmů. Mimochodem i v hokejové
NHL, kde má základní část 82 zápasů, se díky štěstí způsobenému např. pozitivní
odchylkou v úspěšnosti zakončení, může do play-off dostat slabší tým.
Tudíž je dobré společně s TSR sledovat i další
ukazatele, jako jsou úspěšnost střelby a naopak kolik ze střeleckých pokusů
soupeřů skončí v síti. Tyto hodnoty mohou hodně napovědět, např. proč ten
který tým střílí málo gólů – může to být jen prostě trocha smůly, zvláště pokud
si tým podle statistik vypracovává dost střeleckých příležitostí.
Tady je tabulka ze statsbomb.com z údaji o průměrném
počtu střel v jednotlivých sezónách Premier League a úspěšností zakončení,
jak všech střel tak jen střel jdoucích mezi tyče (Shots on target).
Jak vidno, úspěšnost zakončení střel i střel na bránu je
sezónu co sezónu hodně podobná. Příliš velké odchylky ani nejsou mezi
jednotlivými týmy. Chelsea či Manchester City nedávají více gólů proto, že by
měly výrazně nadprůměrnou úspěšnost zakončení, ale proto, že si vytvářejí více
střeleckých příležitostí.
Samořejmě že TSR má mnohé mouchy a mnohé kluby ať už v Anglii
či Německu zaměstnávající týmy matematicky zdatných analytiků jsou bezpochyby
mnohem dál, co se vyhodnocování herních fundamentů týče.
- Statistická revoluce v Brentfordu (můj článek na premierleague.cz - http://www.premierleague.cz/clanek-blog/blog/statisticka-revoluce-v-brentfordu/?aktualitaId=12649
TSR nám neříká o kvalitě střel, to se snaží řešit Expected
goals modely, které na základě vstupních údajů (kupř. vzdálenost od brány,
střelecký úhel, typ přihrávky, rychlost útoku atd.) dávají každé střele
pravděpodobnost, s jakou mohla skončit v síti.
- Paul Riley (expected goals model, xG model postavený na střelách jdoucích na bránu) https://public.tableau.com/profile/paul.riley#!/vizhome/PremierLeague201516xGMap/PremierLeague201516xGDashboard
-
XG statistiky Michaela Caleyho (zatím jen z minulé sezóny)
http://cartilagefreecaptain.sbnation.com/2014/2/12/5404348/english-premier-league-shot-statistics
Také TSR neřeší tzv. score effects. Je totiž obvyklé, že
prohrávající týmy po inkasované brance zvýší herní a střeleckou aktivitu
(vedoucí týmy mají často tendenci hrát o něco defenzivněji). Takže střeleckou
bilanci často prohrávajících týmů může nafouknout právě tato skutečnost.
A pak je tu třeba to, že výsledky a stejně tak TSR jsou
ovlivněny rozlosováním ligy. Tým s těžším losem na úvod sezóny bude po pár
odehraných kolech vypadat než podobně silný tým s lehčími soupeři. Ale to
samé se dá ještě ve větší míře říci o ligové tabulce.
Možná překvapením je pro někoho umístění Příbrami a
Slovácka. Opět zdůrazním, že prediktivní síla TSR bude větší po 10 či 15
kolech, ale myslím, že Příbram je v ligové tabulce vysoko jen díky
neudržitelně vysoké úspěšnosti zakončení (přes 20 %) a u Slovácka situaci trochu
zkresluje utkání v Plzni, kde na jeho bránu šlo 36 střel.
Pak je tu ještě Slavia, fanoušci to sice vidí v této sezóně většinou na střed tabulky. Ale opět, Slavia dala 10 gólů z 50 střel (20 % úspěšnost), normál je asi někde v rozmeží 10 – 13 %. Milan Škoda dal 6 gólů z pouhých 16 střel (37,5 %). Takže to, že má Slavia na svém kontě 10 gólů není výsledkem silné ofenzívy a časté střelby, což je varovné znamení. A nejde bože, kdyby odešel Škoda do zahraničí.
Na začátku jsem zmínil i Shots on target ratio. Je to stejný
ukazatel jako TSR, akorát počítaný pouze ze střel jdoucích na bránu. Těchto
střel je míň, takže na začátku sezóny má SoTR menší vypovídací hodnotu, ale s přibývajícími
koly by měl konvergovat k TSR.
Na závěr jen to, že TSR může mít v různých ligových
soutěžích odlišnou vypovídací hodnotu a užitečnost. Většina analýz byla
Graysonem a dalšími dělána na datech z Premier League, problematické může
být využití TSR např. v Major League Soccer, kde díky systému draftů a
platových stropů nejsou tak velké rozdíly v kvalitě jednotlivých týmů.
Jaroslav Krejčí
@championship365
jarek.krejci@gmail.com
jarek.krejci@gmail.com
Žádné komentáře:
Okomentovat