středa 18. listopadu 2015

Expected goals potvrzují dominanci Arsenalu a Man City

Anglická Premier League má odehráno už dvanáct kol a ligová tabulka začíná mít s přibývajícími koly větší informační hodnotu. Přesto je ale dobré nesledovat jen počty bodů či vstřelených a inkasovaných branek. Tato čísla zachycují to, co se už stalo a vzhledem k tomu, že ve fotbale padá málo gólů, může být pořadí v tabulce hodně o náhodě, štěstí.

Tím nechci snižovat výkony a kvalitu týmů jako jsou West Ham United (momentálně 6.) nebo Leicester City (dokonce 3.), ale z hlediska nástroje fotbalové analytiky, jakým jsou Expected goals (ExpG), se jim příliš velké šance na konečné umístění v TOP 4 nedávají.

Naopak Chelsea podle některých modelů a statistik vypadá lépe, než napovídá tabulka. Pro tento blog jsem využil primárně data, která zveřejňuje Michael Caley (@MC_of_A).

Modely ExpG se snaží kvantifikovat kvalitu šancí a střeleckých pokusů. Existují různé modely ExpG, ale obvyklými vstupními parametry jsou lokace střely, typ střely (noha, hlava, přímý kop), rychlost útoku, informace o typu přihrávky (např. centr, přihrávka mezi obránce). Z anglických klubů využívá svůj vlastní ExpG model například Arsenal.

Zde je graf od nizozemského novináře a analytika s přezdívkou @11tegen11. Ten znázorňuje predikční sílu jednotlivých ukazatelů po určitém počtu odehraných kol. Jak vidět, nejlépe z toho v Premier League (a dalších čtyřech předních evropských ligách) vychází Expected goals. Větší predikční sílu než dosud nasbírané body má dokonce i tak jednoduchý ukazatel, jakým je Shots on Target Ratio.

Graf 1



Zdroj: The best predictor for future performance is Expected Goals

Napřed se podívejme na ofenzivní část ExpG. Můžeme tak porovnat skutečnost (kolik tým nastřílel gólů) s čísly Cayleho modelu. Téměř vždy tam bude odchylka, jde o to, že pokud model ukáže, že tým měl nastřílet 10 gólů a ve skutečnosti jich dal např. 16, tak jsou na místě pochyby o udržitelnosti takové střelecké potence. A naopak, pokud tým nastřílel v reálu výrazně méně gólů, než podle ExpG měl, je tam podle všeho prostor pro zlepšení.

Jako nejofenzivnější tým v dosavadním průběhu ligy vychází podle Caleyho ExpG modelu Arsenal. Ve skutečnosti dal (jen) 22 gólů, takže za modelem zaostává, což může být pro další průběh sezóny pozitivní znamení, protože Gunners mají zdá se z hlediska střílení gólů na víc. Man City vychází v souladu s ExpG (v reálu dal 26 gólů).

Graf 2



Fanoušky Spurs asi potěší, že jejich tým je v pořadí vytvořených ExpG třetí. Manchester United svázaný taktikou Louise van Gaala je zhruba uprostřed. Zajímavý je Bournemouth. Tým Eddieho Howea se sice prezentuje pohledným útočným kombinačním fotbalem, ale v ExpG na tom vychází nejhůř společně s WBA. Cherries si sice v počtu střel nevedou nejhůř, problémem je kvalita střeleckých pokusů a šancí.

Jak je vidět z grafu číslo 3, Bournemouth má společně s Watfordem nejnižší průměrnou hodnotu ExpG na jednu střelu. A ke špičce v tomto ohledu naopak patří Arsenal a Manchester City. Pěkně je vidět, že United střeleckou aktivitou zrovna nehýří, ale kompenzují si to důrazem na kvalitu. Ale Gunners a Citizens ukazují, že lze střílet často a ještě k tomu kvalitně.

Graf 3



První čtyřku týmů, jež si vedou nejlépe z hlediska defenzivního komponentu ExpG (viz pravá polovina grafu 1), tvoří oba manchesterské kluby a kluby ze severního Londýna. Nejméně gólů dostal v reálu Man United (8). Tým van Gaala, jak v ExpG tak v ExpG proti překonává předpoklady, je dost možné, že model tento i jiné nedokáží vyčíslit všechny taktické aspekty hry United… a genialitu van Gaala :)

Zastavme se u Chelsea. Ta je momentálně v tabulce Premier League až 16. s 11 body a záporným skóre 16:23. Podle Caleyho ExpG čísel vychází skóre Chelsea lépe: 13.5:12.6. Tato divergence modelu a skutečnosti napovídá, že Blues nejsou tak špatným týmem a neměli by mít problém s boji o záchranu. 

Podle statistik o přihrávkách ve finální třetině hřiště nebo přímo v pokutovém území je Chelsea týmem, který kontroluje hru, dokáže se dostat do vápna, ale tam z nějakého důvodu selhává (http://objective-football.blogspot.com.es/2015/10/18-yard-box.html). Ale to by vydalo na samostatnou analýzu.

Na závěr ještě dva grafy. První znázorňuje pořadí týmů podle poměru ExpG pro a proti (ExpG Ratio). Caley zveřejňuje běžný poměr i poměr upravený o sílu dosavadních soupeřů (strength of schedule – SOS). Dávám zde upravenou (adjusted) verzi. Chelsea z toho vychází poměrně dobře oproti reálu. Ale na obhájce je to i tak bída.

Graf 4



Leicester a West Ham vidíme níže, než v reálné ligové tabulce. Ale získané body už jim nikdo nesebere, tak mají možnost zaútočit na příčky zajišťující Evropskou ligu. Tottenham Hotspur je třetí hned za dvěma největšími kandidáty na titul. Bournemouth a Sunderland vypadají jako největší adepti na sestup. 

Poslední graf z Caleyho twitterového profilu ukazuje momentální šance týmů na umístění v TOP 4. Projekce je dělaná na základě Expected Goals. Podrobnější popis modelu ExpG i projekce naleznete přímo na jeho stránkách. (http://cartilagefreecaptain.sbnation.com/2015/10/19/9295905/premier-league-projections-and-new-expected-goals)


-------------------------------------------------------

* Leicester jsem jen naťuknul, velké pochyby nad udržitelností výborných výsledků má například Mark Taylor - http://thepowerofgoals.blogspot.cz/2015/11/will-leicester-emulate-wbas-hot-start.html

** O West Ham United natočil před zhruba třemi týdny dobré video (v angličtině) Joel Salamon, performance analytik Bristol City. Hammers tehdy byli ještě v první čtyřce.



*** Bournemouth má nejenže střelecké pokusy s nejnižší průměrnou hodnotou ExpG, ale dokonce soupeřům umožňuje nejnebezpečnější střely a šance. Vražedná (sestupová) kombinace. I když na druhou stranu je možné, že měl Bournemouth dosud smůlu a tyto hodnoty se v dalším průběhu sezóny zlepší ve prospěch Cherries.

čtvrtek 12. listopadu 2015

Manchester United: nudný a nudnější

Na hlavu manažera Manchester United Louise van Gaala se už od jeho příchodu na Old Trafford valí kritika kvůli neatraktivnímu hernímu stylu. V poslední době kritické hlasy ještě zesílily poté, co United nebyl schopný skórovat ve třech soutěžních zápasech v řadě. Po domácí remíze 0:0 v derby s Manchesterem City následovaly bezgólové zápasy s Middlesbrough (D) a Crystal Palace (V).

Následně Rudí ďáblové na Old Trafford zdolali CSKA (1:0) a West Brom (2:0), ale rukopis všech zápasů byl podobný. Hra založená primárně na držení míče, velkém množství přihrávek do stran a dozadu, mnohdy absence momentu překvapení či zrychlení ve finální fázi, zřejmě z obav, že ztráta míče by mohla znamenat rychlý protiútok soupeře.

Na jednu stranu pochopitelné, na druhou stranu van Gaal investoval do posil hodně peněz a má v dispozici kvalitní kádr, s kterým by si mohl dovolit hrát odvážnější fotbal. I když vypadá to, že stále není spokojen a spekuluje se o snaze přivést v lednu Sadia Maného ze Southamptonu či Ayoze Pereze z Newcastlu.

Pojďme se podívat na pár čísel. Z hlediska počtu střel vypadá útočná aktivita United opravdu bídně. Tým je v této sezóně Premier League podle průměrného počtu střel až 16. s 10,3 střelami na zápas.  O něco lépe je na tom dokonce i Aston Villa. Z týmů první šestky aktuální tabulky nastřílel United nejméně gólů (17).























Na grafu je vývoj průměrného počtu střel United za posledních sedm sezón (včetně této po 12 odehraných kolech).

Možná vás zaujme, že střelecká aktivita začala klesat už za Alexe Fergusona, což možná souviselo s tím, jak stárly některé opory typu Paula Scholese či Ryana Giggse, nešlo už sázet na výjimečnost Cristiana Ronalda a tak Ferguson přizpůsobil hru nové realitě. Ale stále to vedlo ke dvěma titulům v tomto období (2010/11 a 2012/13).

Druhý graf ukazuje, kolik střel (pro i proti) jste mohli vidět v průměru v zápasech daného týmu v dosavadním průběhu této sezóny. Ani z tohoto hlediska to není pro diváka žádná zábava.



United nejen málo střílí, ale díky výborné organizaci hry, koncentraci, napadání ve středu hřiště dokáže tým výrazně omezit počet střel soupeřů (což ukazuje už i první graf). A tak je na tom nejlépe z celé ligy v počtu inkasovaných branek.

Problémem United není, že by se nedokázal dostat do útočné finální třetiny hřiště, ale ať už ze zmíněné opatrnosti, snahy nechybovat či ve snaze vytvořit si co nejkvalitnější střelecké pozice neproměňuje svou územní převahu ve střelecké pokusy. Pěkně to znázorňuje grafika Bena Torvaneyho z Analytics FC. Čísla jsou sice z minulé sezóny, ale hra United se zas tolik nezměnila.


United často drží míč v tzv. Zone 14, oblasti ve středu hřiště před šestnáctkou soupeře, ale namísto přihrávek dopředu, do pokutového území si hráči hodně přihrávají do stran. Údaj na vodorovné ose znázorňuje úhel přihrávky (0 = dopředu, 1 = dozadu).

Uvidíme, co přinesou další týdny a měsíce. Van Gaal vždy patřil k pragmatičtějším manažerům. Dost možná cítí, že týmu stále něco chybí k tomu, aby se vyrovnal Arsenalu a Manchesteru City v ofenzivní aktivitě.

Třeba „nástavba“ v podobě útočného fotbalu teprve přijde, ale moc bych na to nesázel. Stejně tak si nemyslím, že United v této sezóně získají titul. Spíš bude pro van Gaala cílem kvalifikovat se pro další ročník Ligy mistrů a v evropské soutěži dojít co nejdál.  A defenzivní pojetí hry funguje, takže na tom nebude hned tak něco měnit.

středa 4. listopadu 2015

Score effects - vliv skóre na střeleckou aktivitu

Po každém kole na svém profilu na Tableau zveřejňuji aktualizovaná čísla ze Synot ligy – počty střel, střely na bránu (pro i proti), poměrové ukazatele (Shots on Target Ratio, Total Shots Ratio), údaj o PDO či o úspěšnosti zakončení (% podíl gólů ku počtu střel na bránu).

Je dobré sledovat i další dostupné statistiky než jen ligovou tabulku a počty vstřelených a inkasovaných branek, a to kvůli tomu, že gólů je ve fotbale málo, důležitou roli hraje náhoda a někdy i například silný tým může mít horší výsledkové období, přestože v zápasech hraje dobře, vytváří si střelecké příležitosti a šance.

Je však mít na paměti, že i na počty střel mají vliv různé faktory. Rozlosování, hra 11 na 10 nebo naopak hra bez vyloučeného hráče…

Hodně důležité jsou pak tzv. score effects. Zjednodušeně, počty střel se odvíjí i od toho, zda váš týmy nebo tým soupeře v zápasech obvykle vede či naopak musí často dotahovat. To asi intuitivně cítíme i bez hlubších analýz.

U české ligy nemáme potřebná veřejně dostupná data a tak si vypomůžu analýzami dat z Premier League.  U score effects jde o to, že dotahující týmy ve snaze srovnat zvyšují svou útočnou a střeleckou aktivitu a naopak vedoucí týmy mají tendenci se stáhnout, hrát o něco defenzivněji a sázet na protiútoky.

Samozřejmě se to může lišit tým od týmu, ale score effects je dobré vést v patrnosti i kvůli tomu, že analýzy zjistily, že dotahující týmy (v průměru) sice střílí častěji ale kvalita střel je nižší než za rovnovážného stavu nebo když tým vede.

Vedoucí tým má tu výhodu, že se nemusí hrnout do útoku, může vyčkávat na chyby soupeře a ze zabezpečené obrany se pokoušet navýšit skóre z rychlých protiútoků. Střelecké příležitosti či šance pak vzhledem k otevřenější obraně soupeře mají větší šanci na úspěch.

Score effects nejsou po celý zápas stejné. Jak spočítal Gary Gellade (@GarryGelade), míra střelecké aktivity dotahujícího týmu roste s přibývajícími minutami. Týmy se nezačínají vrhat (bezhlavě) do útočení, pokud inkasují někdy v úvodu zápasu, ale jejich aktivita narůstá s tím, jak se blíží konec zápasu.

Pěkně to znázorňuje následující graf z dílny p. Geladeho, jehož společnost Business Analytic spolupracuje v oblasti fotbalové analytiky se špičkovými kluby (jeho linkedin profil uvádí Chelsea, PSG a Real Madrid).


Zdroj: http://business-analytic.co.uk/

Barva teček znázorňuje kolik % ze zápasu bylo odehráno. Můžeme pěkně vidět, že po 25 % odehraných minut nejsou v zápase score effects tolik vidět. V polovině zápasu už je rozdíl mezi dotahujícími (Behind) a vedoucími (In front) týmy zřetelnější a po 75 % odehraných minut už je rozdíl v intenzitě střelby enormní.


Zdroj: statsbomb.com

Druhý graf ukazuje vliv score effects na úspěšnost střelby (Scoring %), úspěšnost zásahů (Save %) a PDO (součet % úsp. střelby a % úsp. zásahů).


Jablonec a score effects

Nemám potřebná data, ale je možné, že score effects do určité míry stojí za podprůměrnou úspěšností střelby Jablonce. Tým od Nisy je po 12. kole až devátý s 16 body. Přitom z hlediska počtu střel, střel na bránu má společně se Spartou a Plzní nejlepší útok a obranu v lize.

Na rozdíl od dvou favoritů na zisk na titul však Jablonec musel v této sezóně často dotahovat. Namátkou dvakrát ve Zlíně a doma proti Bohemians, Liberci či Dukle a tím mohou být čísla do jisté míry zkreslena.

Plzeň v této ligové sezóně dotahovala jen 71 minut, Sparta cca 80. Naproti tomu Jablonec strávil dotahováním náskoku soupeřů 335 minut (nepočítal jsem nastavený čas).

Zatím co Sparta má poměr počtu vstřelených gólů ku počtu střel na bránu okolo 40 %, Plzeň zhruba 32 %, tak Jablonec jen necelých 25 %.

Samozřejmě ve hře nejsou jen score effects, Plzni se střelecky chytil Ďuriš, Sparta má Lafatu a Fataie, Jablonec ale zatím svého střelce hledá, jak ukázal poslední zápas na Slovácku. V tom se sice Jablonec ujal vedení v 38. minutě, ale klidně mohl jít do šaten s pohodlným náskokem a odvézt si tři body. Nakonec bral jen jeden.

Ale jak píšu, vzhledem k nedostatku dat nevím, jaký průběh má střelecká aktivita Jablonce a dalších týmů v Synot lize. Ale to, co víme o score effects v Premier League, myslím platí i v české nejvyšší soutěži.

Na závěr přidávám pár dokazů k tématu. V tom druhém je i video s vystoupením Garry Geladeho na OptaPro forum.

http://business-analytic.co.uk/blog/uncategorized/a-bit-more-on-game-state/

http://business-analytic.co.uk/blog/uncategorized/goals-change-games-the-effect-of-game-state-on-attack-intensity/

http://statsbomb.com/2013/12/score-effects/

http://www.optasportspro.com/about/optapro-blog/posts/2014/blog-assessing-the-use-of-game-state-in-predictive-models/mbuBlogsyPost

http://objective-football.blogspot.com.es/2015/08/201516-score-effects.html