středa 23. prosince 2015

Leicester titul nezíská (nejspíš)

Sedmnáct kol odehráno a na první příčce Premier League se překvapivě drží Leicester City, tým v minulé sezóně vážně ohrožený sestupem. V této sezóně měly Lišky opět patřit mezi vážné kandidáty na sestup, ale těmto predikcím dávají na frak.

Stejně tak se už několik týdnů očekává, že jejich výborná forma pomine a dojde k sestupu tabulkou. Ale to se (zatím) nestalo, Leicester je první o dva body před Arsenalem a dokonce šest bodů před Manchester City.

I tak ale málokdo očekává, že by měl Leicester po Novém roce a na jaře vážněji zasáhnout do bojů o titul a na straně klubu z King Power Stadium nestojí ani statistiky. Aktuální Shots on Target Ratio Leicesteru (poměr střel na bránu pro a proti) je 54,7. To není vůbec špatné, ale pokud vezmeme SoTR (ke konci sezóny) posledních šesti mistrovských týmů, tak nejnižší poměr měl Manchester United v sezóně 2012/13 - 59,0. Chelsea měla v minulé sezóně 62,9.

SoTR Top 20 - sezóny 09/10 až 14/15 (čísla ke konci ročníku)
zeleně jsou vyznačeni mistři, žlutě týmy, které v danou sezónu skončily v TOP 4


zdroj: http://objective-football.blogspot.com.es/2014/12/the-enlightened-era-2009-2014.html

Ve prospěch Leicesteru nehovoří ani to, že třináct ze sedmnácti utkání pro něj skončilo buď těsnou výhru nebo remízou. Konkrétně v těchto třinácti utkáních Leicester osmkrát zvítězil a pětkrát remizoval. A v minulosti se často ukázalo (a dokazují to i data), že časté těsné výhry a remízy nejsou dobrým znamením pro další průběh sezóny, zvláště když jako v případě Leicesteru sbíráte body díky nadprůměrně vysoké úspěšnosti střelby.

Podle statistik na serveru Objective Football skončilo v síti soupeřů 42,5 % střel na bránu (Shots on target) vyslaných hráči Leicesteru. To je momentálně nejvíce z celé Premier League. Nedá se moc čekat, že by takovou úspěšnost udržely Lišky až do konce sezóny. Samozřejmě vyloučit se to nedá, ale za posledních šest let udržel po celou sezónu takovou úspěšnost pouze Manchester City v mistrovské sezóně 13/14 (42,86 %).

Úspěšnost střel na bránu (Scoring %) Top 20 - sezóny 09/10 až 14/15 (čísla ke konci ročníku)


zdroj: http://objective-football.blogspot.com.es/2014/12/the-enlightened-era-2009-2014.html


Ještě se vraťme k těsným a remízovým výsledkům. Martin Eastwood zveřejnil tento tvít.

Podle Eastwooda má Leicester o zhruba 9 bodů více, než by odpovídalo počtu nastřílených a inkasovaných bodů. Pro výpočet čísel v grafu využil Phytagorův teorém. Eastwoodův vzorec vypadá takhle: 



Svůj původ to má v baseballu u legendárního Billa Jamese. V případě fotbalu je logika je taková, že lepší týmy jsou schopny častěji vyhrávat zápasy větším než jen jednogólovým rozdílem. A to není případ Lišek v této sezóně.

Leicester City má nyní nejnižší rozdíl mezi vstřelenými a obdrženými brankami z týmů umístěných v top 4 (+13). Přitom má o 2 body více než Arsenal (+17), o 6 bodů než Man City (+14) a o 9 bodů více než Tottenham (+14). Goal difference bývá mnohdy přehlížený ukazatel, ale stojí za to jej sledovat.

Na závěr přidávám aktuální bodovou projekci od Euro Club Index. Leicester má podle ní aktuálně 8,5 % šanci na titul. Takže sice si osobně nemyslím, že by to Lišky dokázaly, ale vyloučit to zcela nemůžeme. A ne že bych jim to nepřál.


Zdroj: http://www.euroclubindex.com/asp/leagueodds.asp

-----

J. Krejčí (@championship365, jarek.krejci@gmail.com)

úterý 22. prosince 2015

Must read: zajímavé odkazy na články o fotbalové analytice (Vol. 1)

Přehled nejzajímavějších článků a blogů na téma fotbalová analytika, jež vyšly v poslední době. Enjoy! :)

--------------------------------------------

Poor Aston Villa, Farewell Mourinho and Leicester on Fire (21.12., StatsBomb)

http://statsbomb.com/2015/12/poor-villa-farewell-mourinho-and-leicester-on-fire/

Pravidelný týdení blog od Jamese Yorka (@jair1970), který v průběhu sezóny týden co týden komentuje dění v Premier League z pohledu čísel a zajímavých statistik. Yorke výborně zpřístupňuje základní koncepty fotbalové analytiky širší veřejnosti.

---

Why the English Premier League has been turned upside down (19.12., James Tozer)

http://www.economist.com/blogs/gametheory/2015/12/competitive-balance-football?fsrc=scn/tw_ec/why_the_english_premier_league_has_been_turned_upside_down



Fotbalová analytika na blogu Game Theory patřícím pod The Economist. V článku jsou zajímavá fakta o dosavadním průběhu sezóny PL, nechybí využití ELO ratingu, expected goals, data o rychlosti útoků a kvalitě střel atd. Do blogu přispěly svými poznatky a daty Michael Caley (@MC_of_A) a Daniel Altman (@altmandaniel).

---

The Big Interview: Arsene Wenger (19.12., arsenal.com)

http://www.arsenal.com/news/features/20151219/-statistics-can-cheat-you-

Rozhovor s manažerem Arsenalu Arsene Wengerem o tom, jak on a jeho klub využívají data např. při rozhodování o přestupech nebo stanovení zápasové taktiky, o tom které statistiky mohou být zavádějící, jak statistiky přijímají hráči a mnohem víc.

---

Bespoke data gives Arsène Wenger a tactical edge at Arsenal (11.12., The Times)

http://www.thetimes.co.uk/tto/public/football/article4638099.ece

Ještě jednou Gunners. Článek na stejné téma, který vyšel v The Times. Dozvíte se mimo jiné, kdo je to Jaeson Rosenfeld a jaká je v Arsenalu jeho role.

---

Thoughts on Machine Learning, Black Boxes, and my SVM (2.12., Chad Murphy)

http://soccer.chadmurphy.org/methods/thoughts-on-machine-learning-black-boxes-and-my-svm/

Zajímavý blog od profesora politologie Chada Murhphy (@soccermetric) o využití Machine Learning ve fotbalové analytice. I ostatní blogy na jeho stránkách stojí za přečtení.

---

Some thoughts on Machine Learning and Football Analytics (2.12., Ola Lidmark Eriksson)

http://blog.stryktipsetisistastund.se/2015/12/02/some-thoughts-on-machine-learning-and-football-analytics/

Na stejné téma blog od Ola Lidmarka Erikssona (@fantomen), jenž za pomoci Machine Learning vytvořil svůj Expected goals model. Eriksson pracuje pro nováčka nejvyšší švédské fotbalové ligy Östersunds FK a klub již na jeho popud najmul experty, kteří by pro klub měli vizualizovat a analyzovat data a statistiky.

---

Manchester United is a defensive marvel (16.12., North Yard Analytics)

http://www.northyardanalytics.com/blog/2015/12/16/manchester-united-is-a-defensive-marvel/

Výše zmíněný ekonom Daniel Altman má poradenskou firmu North Yard Analytics, která analyzuje data pro profesionální kluby. V jednom ze svých posledních blogů se zaměřil na defenzivní hru Manchesteru United. Kvůli špatným výsledkům je sice manažer United Louis van Gaal pod velkým tlakem, Altman ale vyzdvihuje schopnost Red Devils zastavovat presinkem v zárodku akce soupeřů.

---

How much has the Premier League changed? (21.12., North Yard Analytics)

http://www.northyardanalytics.com/blog/2015/12/21/how-much-has-the-premier-league-changed/

Opět Altman, na svůj blog píše poměrně často, takže doporučuju přečíst i další články. Zde rozebírá data o vlivu rychlosti útoků na kvalitu střel. Hodně zajímavá je pasáž o důležitosti N’Golo Kantého pro ofenzívu Foxes.

---

Soccermatics: How Mesut Ozil is so good and why Wenger relies on Ramsey (18.12., Soccermatics)

http://www.fourfourtwo.com/features/soccermatics-how-mesut-ozil-so-good-and-why-wenger-relies-ramsey#:G9RVstghzSrOTA

Skvělé články plné zajímavých dat a vizualizací píše pro stránky fourfourtwo.com profesor aplikované matematiky David Sumpter (@Soccermatics). Tento je na téma důležitosti Aarona Ramseyho a Mesuta Özila pro hru Arsenalu. V květnu Sumpterovi vyjde kniha s názvem Soccermatics. Nemohu se dočkat.
---

Home Field Advantage in the 2015/16 Premier League (22.12., Mark Taylor)

http://thepowerofgoals.blogspot.cz/2015/12/home-field-advantage-in-201516-premier.html

Mark Taylor (@MarkTaylor0) analyzuje, zda v této sezóně Premier League došlo ke změně, co se výhody domácího prostředí týče. Dochází k závěru, že v v dosavadním průběhu sezóny měly domácí týmy do jisté míry smůlu a že se situace může ve zbytku ročníku obrátit v jejich prospěch.

---

How long do Premier League managers stay in their jobs? (14.12., FT Data)

http://blogs.ft.com/ftdata/2015/12/14/football-manager-tenure-premier-league/

Datová analytika v podání jednoho z blogů Financial Times na téma, jaká je "životnost" manažerů v anglických ligových soutěžích plus dlouhodobé trendy.

---

Behind the scenes of Boro's scouting network (14.7., Gazette Live)

http://www.gazettelive.co.uk/sport/football/transfer-news/weve-moved-away-traditional-method-9649143

Bývalý technický ředitel Sevilly a sportovní ředitel Zenitu Petrohrad minulý týden posílil realizační tým Middlesbrough, vedoucího týmu Championship. Na starost by měl mít skauting posil na kontinentu. Zde je článek z léta o tom, jak Boro využívá data a analýzu statistik při hledání posil.

---

Stránky se statistikami z Premier League

Objective Football (@ObjectiveFooty)

http://objective-football.blogspot.com.es/2015/08/201516-shot-ratios.html

Statistiky o počtech střel, poměrové ukazatele, počty přihrávek a mnohem mnohem více na stránkách vytvořných Benjaminem Pugsleym (@benjaminpugsley), spoluzakladatelem serveru StatsBomb.com.

---


Shot on Target xG Dashboard (Paul Riley, @footballfactman)

https://public.tableau.com/profile/paul.riley#!/vizhome/PremierLeague201516xGMap/PremierLeague201516ShotonTargetxGDashboard

V Tableau vytvořený dashboard s lokacemi střel na bránu a daty o expected goals podle Rileyho modelu. Myslím, že se si s tím hodně vyhrajete. Na záložce 1 je pak dashboard s daty a vizualizací, odkud jednotlivé týmy a hráči vytvářející střelecké příležitosti.

---

Football in the Clouds (@footyinthecloud)

http://footballintheclouds.blogspot.cz/p/various-shot-metrics-premier-league.html

Počty střel, střel na bránu, poměrové ukazatele (TSR, SoTR), PDO, úspěšnost střelby a zásahů a další data z Premier League.

---

English Premier League Statistics (@MC_of_A)

http://cartilagefreecaptain.sbnation.com/2014/2/12/5404348/english-premier-league-shot-statistics

Statistiky o počtech střel, střel z danger zone, expected goals podle modelu Michaela Caleyho.


J. Krejčí (@championship365, jarek.krejci@gmail.com)

sobota 5. prosince 2015

Ekonomické přínosy profesionálního sportu? Přinejmenším sporné

Snad všechny sportovní rubriky českých zpravodajských serverů zveřejnily články ke středeční tiskovce Ligové fotbalové asociace, která se pochlubila výsledky studie vypracované českou pobočkou KPMG.

Spotřeba spojená s pořádáním 1. a 2. české fotbalové ligy údajně činí 3,6 miliardy korun a daňové výnosy státní pokladny díky tomu dosahují přes 1 miliardu ročně.  Použitím multiplikátoru pak KPMG dospěla k tomu, že tržby vyplývající z 1. a 2. ligy dosahují 7 miliard Kč. ročně.

Studie podle LFA a KPMG dokazuje, že profesionální fotbal je plnohodnotnou součástí českého hospodářství a má pozitivní dopady na ekonomickou aktivitu a už zmíněné daňové příjmy.

Ačkoli jsem to ve výrocích nezaznamenal, tak je zřejmé, že účelem studie bylo vytvořit pro LFA a fotbalový svaz materiál, který poslouží při dalším lobbingu za zvýšení dotací pro český (profesionální) fotbal. Dotace by podle představ funkcionářů mířily například na výstavbu národního stadiónu v Brně nebo v Praze v Letňanech.

Předseda svazu Miroslav Pelta zatím podle dřívějších zpráv médií ohledně dotací na výstavbu národního stadiónu narazil u ministra financí i pražské primátorky Andriany Krnáčové.

Dle Aktualne.cz šéf LFA Dušan Svoboda ze studie odvozuje, že čím vyšší návštěvy, tím větší multiplikační efekty a přínos pro stát. "Z tohoto úhlu pohledu jistě pomůže plánovaný nový stadion v Brně. A já si myslím, že zásadní pozitivní efekt by přinesla i případná stavba velkého národního stadionu v Praze. Podle mě by se zaplatil, ani by na něm nemusel žádný klub pravidelně hrávat své ligové zápasy."

Přiznám se, že jsem studii nečetl, pouze společností KPMG poskytnutý mediální výstup (LFA jim zveřejnění nepovolilo), ale zkušenosti a akademické studie ze zahraničí naznačují, že je dobré brát závěry podobných analýz poradenských firem přinejmenším s velkou rezervou.

Dotacím do profesionálního sportu, veřejné podpoře výstavby stadiónů a zkoumání ekonomickému přínosu profesionálního sportu se hojně věnují zejména ekonomové na univerzitách ve Spojených státech, jelikož tamější sportovní franšízy (v NBA, MBL, NHL, NFL) mají ve zvyku přesouvat své působiště tam, kde jim město, okres či jiná samospráva nabídne nejvyšší dotace a jiné ekonomické benefity (např. daňové úlevy).

Proces je podobný. Konzultační firma připraví studii do nebes vychvalující ekonomické přínosy (dotovaného) nového stadiónu a příchodu franšízy do města a uchváceni multiplikátory a predikovanými přínosy (vyšší daňové výběry, nová pracovní místa, zvýšení ekonomické aktivity) pak dotace často schválí. Roli samozřejmě může hrát např. prestiž města, snaha získat či udržet si voliče.

Studie akademických ekonomů však přínosy přítomnosti profesionálních franšíz (klubů) na ekonomiku měst, regionů, států vyvracejí. Na různých ekonomických otázkách se ekonomové leckdy neshodnou, ale zrovna v oblasti ekonomických přínosů profesionálního sportu a sportovních arén panuje mezi americkými ekonomy konsensus.

Na otázku, zda by měly samosprávy a stát zrušit dotace profesionálním franšízám odpověděli v roce 2006 členové American Economic Association v 58 % případů, že s tím velmi souhlasí, dalších 28 % členů odpovědělo, že souhlasí. Jen 10 % dotázaných ekonomů odpovědělo, že se k problému staví neutrálně a pouhých 5 %, že nesouhlasí či velmi nesouhlasí.

Jedním z udávaných důvodů, proč nemá profesionální sport významnější ekonomický přínos je jednak relativně malá velikost odvětví v porovnání s jinými sektory ekonomiky, a také to že fotbal či jiný sport je jen jedním z druhů zábavy a peníze, které lidé utratí za vstupenky, občerstvení na novém stadiónu, dresy, by i tak utratili (třeba za kino, divadlo, večeři v restauraci…).

Přítomností nového dotovaného stadiónu v Letňanech či Brna by akorát došlo k přerozdělení ekonomické aktivity z jiných částí lokální ekonomiky k lidem (organizacím, firmám), kteří dostali dotaci.

Abych se vrátil k tomu, co řekl Svoboda. Atmosféře, hospodaření klubů ze vstupenek, prodeje občerstvení by vyšší návštěvnost prospěla. Ale lidi nemají peníze někde ve štramoku a nečekají, až jim někdo řekne „Choďte na fotbal“, aby ty nahromaděné peníze konečně utratili. Představa, že spotřeba související se sportem má zázračný multiplikační efekt v porovnání s jinými, stávajícími možnostmi spotřeby je úsměvná.

KPMG se ve studii odvolává na svou předchozí studii vytvořenou pro Český olympijský výbor. Dokonce podle tvůrců analýzy, když se zvýší návštěvnost ligových stadiónů, tak dojde k úsporám ve zdravotnictví. "...každá koruna investovaná do sportování dětí přináší úsporu ve zdravotnictví ve výši cca 2,50 Kč. To vše při 47% využitelnosti stadionů. Je zřejmé, že pokud tyto soutěže přilákají více diváků, získá na tom i Česká republika." 

V severoamerických profesionálních soutěžích dochází čas od času ke stávkám kvůli jednáním o kolektivní smlouvě. Někdy trvají několik měsíců i celou sezónu. Ekonomové tak mají zpětně ideální možnost zkoumat a porovnat ekonomickou aktivitu v době probíhající soutěže a v době stávky.

Ekonomové Dennis Coaes a Brad R. Humphreys (v minulosti spolupracoval s pražským CERGE-EI) studovali vliv stávek v severoamerických profesionálních soutěžích a nezaznamenali, že by ekonomická aktivita v daných městech a lokalitách vzhledem k neodehraným zápasům upadla.

Ohledně dotací na stadióny zmíněný Coates zabývající se hospodářskými dopady profesionálního sportu v rozhovoru pro Reason TV řekl: „…sportovní stadióny nevytvářejí novou ekonomickou aktivitu (pracovní místa, spotřebu, příjmy) a ve skutečnosti mohou mít negativní dopad na ekonomickou aktivitu. Díky stadiónům dochází k redistribuci ekonomické aktivity z jiných částí lokální ekonomiky k lidem, kteří měli to štěstí a dostali dotaci. Čistým efektem není nová spotřeba, nová pracovní místa, růst příjmů… pouze jiné přerozdělení ekonomické aktivity.“


Významnou výjimkou mohou být stadióny, kluby, sportovní akce, které přilákají novou spotřebu. Ale to nebude případ české fotbalové ligy či případného českého národního stadiónu. Zahraničních fanoušků přijíždějících sledovat českou ligu moc není, zápasy národního týmu se hrají párkrát do roka a těch pár stovek či tisíc zahraničních fanoušků přijede a zase odjede.

Vysílací práva do zahraničí Synot liga neprodává na rozdíl řekněme od Premier League nebo Bundesligy.

Studie poradenských firem opomíjejí, že dotace použité na výstavbu stadiónu nebo podporu profesionálního sportu mohou být využité na jiné účely (zkvalitnění infrastruktury, nemocnic, škol), případně mohou být peníze ponechány občanům, aby se sami rozhodli, za co své peníze utratí.

Sportovní stadióny a hromadné sportovní akce také s sebou nesou zvýšené nároky na infrastrukturu, veřejnou dopravu či nasazení bezpečnostních složek. Policisté by přitom mohli být nasazeni jinde.

A studie ekonomů se netýkají jen dotovaných stadiónů, franšíz a akcí.

V článku už zmíněného Coatese a jeho kolegy Humphreyse z roku 2008, který shrnuje argumenty ekonomů, se mimo jiné uvádí. „Závěry studií, které prošly oponenturou a byly publikovány v ekonomických žurnálech, jsou pozoruhodně konzistentní. Ať už zkoumaly jakékoliv město či oblast, ať použily jakýkoliv model či metodu, tak nenašly téměř žádný důkaz, že by profesionální sportovní franšízy a zařízení měly měřitelný dopad na ekonomiku.“

Coates a Humphreys v jedné ze svých studií dokonce došli k závěru, že přítomnost profesionálních sportovních franšíz může mít negativní vliv na reálný příjem obyvatel v daném městě nebo městské konglomeraci. Souviselo to s tím, že hráči a majitelé klubů zejména mimo sezónu žili a své peníze utráceli mimo město (oblast), v které se klub nacházel.

Ekonomové Robert A. Baade a Allen R. Sanderson zkoumali vliv profesionálních sportů na zaměstnanost (viz předchozí odkaz) a dospěli k závěru že: „Výsledky naší studie nenalezly pozitivní korelaci mezi profesionálním sportem a tvorbou pracovních míst.“

Ekonomové ve Státech mimochodem vyvrátili i významnější měřitelný ekonomický dopad významných jednorázových akcí na místo pořádání. Jedná se například o zápasy Super Bowlu, all-stars utkání různých soutěží, maratón v Honolulu... Zde se nabízí česká paralela s grand prix motorek v Brně či vychvalováním ekonomických přínosů letošního MS ze strany hokejového svazu.

Pořadatel dotovaných závodů motorek Brna nevlastní vysílací práva, čísla o počtech návštěvníků jsou pochybná a příjmy odcházejí přes fingované smlouvy bůhví kam. V případě MS v hokeji platí o vysílacích právech to samé. Stát na akci poskytl dotaci v řádech desítek miliónů korun, významné procento diváků byli čeští fanoušci, takže dotací stát akorát narušil tržní prostředí a „navedl“ spotřebu ve prospěch pořadatelů (svaz, IIHF), z jiných regionů Čech a Moravy do Prahy a Ostravy.

KPMG a LFA zmínily v analýze i nekalkulované přínosy v oblasti zdravotní, sociální, kulturní a vzdělávací. Nepopírám, že toto může mít kladný vliv na sportování zejména dětí, bezpochyby ano. Také přítomnost profesionálního klubu či pořádání sportovní akce může být pro město (region, stát) a jeho obyvatele důležité z hlediska tradice, prestiže. Dotace směřující tímto směrem by však neměly být zdůvodňovány optimistickými projekcemi ekonomických přínosů.

Profi sport může udělat město (region) šťastnější, ale s velkou pravděpodobností ne bohatší.

Ale to už se dostávám někam jinam. Hlavním cílem článku bylo ukázat, že ekonomové jsou k hospodářským přínosům profesionálního sportu a nově postavených arén skeptičtí a bylo by fajn, kdyby se podobným směrem vydal při bádání i někdo z českých ekonomů a politici nebyly odkázáni na neveřejné studie, které neprošly oponenturou a jejichž výsledky byly předem dány zadavatelem.

J. Krejčí

---------------------------------

Zmíněný Humphreys mimochodem v roce 2002 v článku pro Prague Business Journal napsaném s českým ekonomem Danielem Münichem předpověděl pozdější lapálie okolo Sazka Arény (dnes O2 Aréna). „Pokud dojde k realizaci projektu Sazky, ponesou většinu rizika akcionáři (sportovní svazy). V případě, že bude aréna z finančního hlediska neúspěšná, pravděpodobným výsledkem bude bailout ze strany vlády.“

•• Samotné používání multiplikačního efektu v dopadových studii je hodně diskutabilní. Viz třeba strana 11 a dál v materiálu, který na téma dotací do stadiónů a na sportovní akce před lety připravil pro New Zealand Business Roundtable americký ekonom Tyler Cowen.



středa 18. listopadu 2015

Expected goals potvrzují dominanci Arsenalu a Man City

Anglická Premier League má odehráno už dvanáct kol a ligová tabulka začíná mít s přibývajícími koly větší informační hodnotu. Přesto je ale dobré nesledovat jen počty bodů či vstřelených a inkasovaných branek. Tato čísla zachycují to, co se už stalo a vzhledem k tomu, že ve fotbale padá málo gólů, může být pořadí v tabulce hodně o náhodě, štěstí.

Tím nechci snižovat výkony a kvalitu týmů jako jsou West Ham United (momentálně 6.) nebo Leicester City (dokonce 3.), ale z hlediska nástroje fotbalové analytiky, jakým jsou Expected goals (ExpG), se jim příliš velké šance na konečné umístění v TOP 4 nedávají.

Naopak Chelsea podle některých modelů a statistik vypadá lépe, než napovídá tabulka. Pro tento blog jsem využil primárně data, která zveřejňuje Michael Caley (@MC_of_A).

Modely ExpG se snaží kvantifikovat kvalitu šancí a střeleckých pokusů. Existují různé modely ExpG, ale obvyklými vstupními parametry jsou lokace střely, typ střely (noha, hlava, přímý kop), rychlost útoku, informace o typu přihrávky (např. centr, přihrávka mezi obránce). Z anglických klubů využívá svůj vlastní ExpG model například Arsenal.

Zde je graf od nizozemského novináře a analytika s přezdívkou @11tegen11. Ten znázorňuje predikční sílu jednotlivých ukazatelů po určitém počtu odehraných kol. Jak vidět, nejlépe z toho v Premier League (a dalších čtyřech předních evropských ligách) vychází Expected goals. Větší predikční sílu než dosud nasbírané body má dokonce i tak jednoduchý ukazatel, jakým je Shots on Target Ratio.

Graf 1



Zdroj: The best predictor for future performance is Expected Goals

Napřed se podívejme na ofenzivní část ExpG. Můžeme tak porovnat skutečnost (kolik tým nastřílel gólů) s čísly Cayleho modelu. Téměř vždy tam bude odchylka, jde o to, že pokud model ukáže, že tým měl nastřílet 10 gólů a ve skutečnosti jich dal např. 16, tak jsou na místě pochyby o udržitelnosti takové střelecké potence. A naopak, pokud tým nastřílel v reálu výrazně méně gólů, než podle ExpG měl, je tam podle všeho prostor pro zlepšení.

Jako nejofenzivnější tým v dosavadním průběhu ligy vychází podle Caleyho ExpG modelu Arsenal. Ve skutečnosti dal (jen) 22 gólů, takže za modelem zaostává, což může být pro další průběh sezóny pozitivní znamení, protože Gunners mají zdá se z hlediska střílení gólů na víc. Man City vychází v souladu s ExpG (v reálu dal 26 gólů).

Graf 2



Fanoušky Spurs asi potěší, že jejich tým je v pořadí vytvořených ExpG třetí. Manchester United svázaný taktikou Louise van Gaala je zhruba uprostřed. Zajímavý je Bournemouth. Tým Eddieho Howea se sice prezentuje pohledným útočným kombinačním fotbalem, ale v ExpG na tom vychází nejhůř společně s WBA. Cherries si sice v počtu střel nevedou nejhůř, problémem je kvalita střeleckých pokusů a šancí.

Jak je vidět z grafu číslo 3, Bournemouth má společně s Watfordem nejnižší průměrnou hodnotu ExpG na jednu střelu. A ke špičce v tomto ohledu naopak patří Arsenal a Manchester City. Pěkně je vidět, že United střeleckou aktivitou zrovna nehýří, ale kompenzují si to důrazem na kvalitu. Ale Gunners a Citizens ukazují, že lze střílet často a ještě k tomu kvalitně.

Graf 3



První čtyřku týmů, jež si vedou nejlépe z hlediska defenzivního komponentu ExpG (viz pravá polovina grafu 1), tvoří oba manchesterské kluby a kluby ze severního Londýna. Nejméně gólů dostal v reálu Man United (8). Tým van Gaala, jak v ExpG tak v ExpG proti překonává předpoklady, je dost možné, že model tento i jiné nedokáží vyčíslit všechny taktické aspekty hry United… a genialitu van Gaala :)

Zastavme se u Chelsea. Ta je momentálně v tabulce Premier League až 16. s 11 body a záporným skóre 16:23. Podle Caleyho ExpG čísel vychází skóre Chelsea lépe: 13.5:12.6. Tato divergence modelu a skutečnosti napovídá, že Blues nejsou tak špatným týmem a neměli by mít problém s boji o záchranu. 

Podle statistik o přihrávkách ve finální třetině hřiště nebo přímo v pokutovém území je Chelsea týmem, který kontroluje hru, dokáže se dostat do vápna, ale tam z nějakého důvodu selhává (http://objective-football.blogspot.com.es/2015/10/18-yard-box.html). Ale to by vydalo na samostatnou analýzu.

Na závěr ještě dva grafy. První znázorňuje pořadí týmů podle poměru ExpG pro a proti (ExpG Ratio). Caley zveřejňuje běžný poměr i poměr upravený o sílu dosavadních soupeřů (strength of schedule – SOS). Dávám zde upravenou (adjusted) verzi. Chelsea z toho vychází poměrně dobře oproti reálu. Ale na obhájce je to i tak bída.

Graf 4



Leicester a West Ham vidíme níže, než v reálné ligové tabulce. Ale získané body už jim nikdo nesebere, tak mají možnost zaútočit na příčky zajišťující Evropskou ligu. Tottenham Hotspur je třetí hned za dvěma největšími kandidáty na titul. Bournemouth a Sunderland vypadají jako největší adepti na sestup. 

Poslední graf z Caleyho twitterového profilu ukazuje momentální šance týmů na umístění v TOP 4. Projekce je dělaná na základě Expected Goals. Podrobnější popis modelu ExpG i projekce naleznete přímo na jeho stránkách. (http://cartilagefreecaptain.sbnation.com/2015/10/19/9295905/premier-league-projections-and-new-expected-goals)


-------------------------------------------------------

* Leicester jsem jen naťuknul, velké pochyby nad udržitelností výborných výsledků má například Mark Taylor - http://thepowerofgoals.blogspot.cz/2015/11/will-leicester-emulate-wbas-hot-start.html

** O West Ham United natočil před zhruba třemi týdny dobré video (v angličtině) Joel Salamon, performance analytik Bristol City. Hammers tehdy byli ještě v první čtyřce.



*** Bournemouth má nejenže střelecké pokusy s nejnižší průměrnou hodnotou ExpG, ale dokonce soupeřům umožňuje nejnebezpečnější střely a šance. Vražedná (sestupová) kombinace. I když na druhou stranu je možné, že měl Bournemouth dosud smůlu a tyto hodnoty se v dalším průběhu sezóny zlepší ve prospěch Cherries.

čtvrtek 12. listopadu 2015

Manchester United: nudný a nudnější

Na hlavu manažera Manchester United Louise van Gaala se už od jeho příchodu na Old Trafford valí kritika kvůli neatraktivnímu hernímu stylu. V poslední době kritické hlasy ještě zesílily poté, co United nebyl schopný skórovat ve třech soutěžních zápasech v řadě. Po domácí remíze 0:0 v derby s Manchesterem City následovaly bezgólové zápasy s Middlesbrough (D) a Crystal Palace (V).

Následně Rudí ďáblové na Old Trafford zdolali CSKA (1:0) a West Brom (2:0), ale rukopis všech zápasů byl podobný. Hra založená primárně na držení míče, velkém množství přihrávek do stran a dozadu, mnohdy absence momentu překvapení či zrychlení ve finální fázi, zřejmě z obav, že ztráta míče by mohla znamenat rychlý protiútok soupeře.

Na jednu stranu pochopitelné, na druhou stranu van Gaal investoval do posil hodně peněz a má v dispozici kvalitní kádr, s kterým by si mohl dovolit hrát odvážnější fotbal. I když vypadá to, že stále není spokojen a spekuluje se o snaze přivést v lednu Sadia Maného ze Southamptonu či Ayoze Pereze z Newcastlu.

Pojďme se podívat na pár čísel. Z hlediska počtu střel vypadá útočná aktivita United opravdu bídně. Tým je v této sezóně Premier League podle průměrného počtu střel až 16. s 10,3 střelami na zápas.  O něco lépe je na tom dokonce i Aston Villa. Z týmů první šestky aktuální tabulky nastřílel United nejméně gólů (17).























Na grafu je vývoj průměrného počtu střel United za posledních sedm sezón (včetně této po 12 odehraných kolech).

Možná vás zaujme, že střelecká aktivita začala klesat už za Alexe Fergusona, což možná souviselo s tím, jak stárly některé opory typu Paula Scholese či Ryana Giggse, nešlo už sázet na výjimečnost Cristiana Ronalda a tak Ferguson přizpůsobil hru nové realitě. Ale stále to vedlo ke dvěma titulům v tomto období (2010/11 a 2012/13).

Druhý graf ukazuje, kolik střel (pro i proti) jste mohli vidět v průměru v zápasech daného týmu v dosavadním průběhu této sezóny. Ani z tohoto hlediska to není pro diváka žádná zábava.



United nejen málo střílí, ale díky výborné organizaci hry, koncentraci, napadání ve středu hřiště dokáže tým výrazně omezit počet střel soupeřů (což ukazuje už i první graf). A tak je na tom nejlépe z celé ligy v počtu inkasovaných branek.

Problémem United není, že by se nedokázal dostat do útočné finální třetiny hřiště, ale ať už ze zmíněné opatrnosti, snahy nechybovat či ve snaze vytvořit si co nejkvalitnější střelecké pozice neproměňuje svou územní převahu ve střelecké pokusy. Pěkně to znázorňuje grafika Bena Torvaneyho z Analytics FC. Čísla jsou sice z minulé sezóny, ale hra United se zas tolik nezměnila.


United často drží míč v tzv. Zone 14, oblasti ve středu hřiště před šestnáctkou soupeře, ale namísto přihrávek dopředu, do pokutového území si hráči hodně přihrávají do stran. Údaj na vodorovné ose znázorňuje úhel přihrávky (0 = dopředu, 1 = dozadu).

Uvidíme, co přinesou další týdny a měsíce. Van Gaal vždy patřil k pragmatičtějším manažerům. Dost možná cítí, že týmu stále něco chybí k tomu, aby se vyrovnal Arsenalu a Manchesteru City v ofenzivní aktivitě.

Třeba „nástavba“ v podobě útočného fotbalu teprve přijde, ale moc bych na to nesázel. Stejně tak si nemyslím, že United v této sezóně získají titul. Spíš bude pro van Gaala cílem kvalifikovat se pro další ročník Ligy mistrů a v evropské soutěži dojít co nejdál.  A defenzivní pojetí hry funguje, takže na tom nebude hned tak něco měnit.

středa 4. listopadu 2015

Score effects - vliv skóre na střeleckou aktivitu

Po každém kole na svém profilu na Tableau zveřejňuji aktualizovaná čísla ze Synot ligy – počty střel, střely na bránu (pro i proti), poměrové ukazatele (Shots on Target Ratio, Total Shots Ratio), údaj o PDO či o úspěšnosti zakončení (% podíl gólů ku počtu střel na bránu).

Je dobré sledovat i další dostupné statistiky než jen ligovou tabulku a počty vstřelených a inkasovaných branek, a to kvůli tomu, že gólů je ve fotbale málo, důležitou roli hraje náhoda a někdy i například silný tým může mít horší výsledkové období, přestože v zápasech hraje dobře, vytváří si střelecké příležitosti a šance.

Je však mít na paměti, že i na počty střel mají vliv různé faktory. Rozlosování, hra 11 na 10 nebo naopak hra bez vyloučeného hráče…

Hodně důležité jsou pak tzv. score effects. Zjednodušeně, počty střel se odvíjí i od toho, zda váš týmy nebo tým soupeře v zápasech obvykle vede či naopak musí často dotahovat. To asi intuitivně cítíme i bez hlubších analýz.

U české ligy nemáme potřebná veřejně dostupná data a tak si vypomůžu analýzami dat z Premier League.  U score effects jde o to, že dotahující týmy ve snaze srovnat zvyšují svou útočnou a střeleckou aktivitu a naopak vedoucí týmy mají tendenci se stáhnout, hrát o něco defenzivněji a sázet na protiútoky.

Samozřejmě se to může lišit tým od týmu, ale score effects je dobré vést v patrnosti i kvůli tomu, že analýzy zjistily, že dotahující týmy (v průměru) sice střílí častěji ale kvalita střel je nižší než za rovnovážného stavu nebo když tým vede.

Vedoucí tým má tu výhodu, že se nemusí hrnout do útoku, může vyčkávat na chyby soupeře a ze zabezpečené obrany se pokoušet navýšit skóre z rychlých protiútoků. Střelecké příležitosti či šance pak vzhledem k otevřenější obraně soupeře mají větší šanci na úspěch.

Score effects nejsou po celý zápas stejné. Jak spočítal Gary Gellade (@GarryGelade), míra střelecké aktivity dotahujícího týmu roste s přibývajícími minutami. Týmy se nezačínají vrhat (bezhlavě) do útočení, pokud inkasují někdy v úvodu zápasu, ale jejich aktivita narůstá s tím, jak se blíží konec zápasu.

Pěkně to znázorňuje následující graf z dílny p. Geladeho, jehož společnost Business Analytic spolupracuje v oblasti fotbalové analytiky se špičkovými kluby (jeho linkedin profil uvádí Chelsea, PSG a Real Madrid).


Zdroj: http://business-analytic.co.uk/

Barva teček znázorňuje kolik % ze zápasu bylo odehráno. Můžeme pěkně vidět, že po 25 % odehraných minut nejsou v zápase score effects tolik vidět. V polovině zápasu už je rozdíl mezi dotahujícími (Behind) a vedoucími (In front) týmy zřetelnější a po 75 % odehraných minut už je rozdíl v intenzitě střelby enormní.


Zdroj: statsbomb.com

Druhý graf ukazuje vliv score effects na úspěšnost střelby (Scoring %), úspěšnost zásahů (Save %) a PDO (součet % úsp. střelby a % úsp. zásahů).


Jablonec a score effects

Nemám potřebná data, ale je možné, že score effects do určité míry stojí za podprůměrnou úspěšností střelby Jablonce. Tým od Nisy je po 12. kole až devátý s 16 body. Přitom z hlediska počtu střel, střel na bránu má společně se Spartou a Plzní nejlepší útok a obranu v lize.

Na rozdíl od dvou favoritů na zisk na titul však Jablonec musel v této sezóně často dotahovat. Namátkou dvakrát ve Zlíně a doma proti Bohemians, Liberci či Dukle a tím mohou být čísla do jisté míry zkreslena.

Plzeň v této ligové sezóně dotahovala jen 71 minut, Sparta cca 80. Naproti tomu Jablonec strávil dotahováním náskoku soupeřů 335 minut (nepočítal jsem nastavený čas).

Zatím co Sparta má poměr počtu vstřelených gólů ku počtu střel na bránu okolo 40 %, Plzeň zhruba 32 %, tak Jablonec jen necelých 25 %.

Samozřejmě ve hře nejsou jen score effects, Plzni se střelecky chytil Ďuriš, Sparta má Lafatu a Fataie, Jablonec ale zatím svého střelce hledá, jak ukázal poslední zápas na Slovácku. V tom se sice Jablonec ujal vedení v 38. minutě, ale klidně mohl jít do šaten s pohodlným náskokem a odvézt si tři body. Nakonec bral jen jeden.

Ale jak píšu, vzhledem k nedostatku dat nevím, jaký průběh má střelecká aktivita Jablonce a dalších týmů v Synot lize. Ale to, co víme o score effects v Premier League, myslím platí i v české nejvyšší soutěži.

Na závěr přidávám pár dokazů k tématu. V tom druhém je i video s vystoupením Garry Geladeho na OptaPro forum.

http://business-analytic.co.uk/blog/uncategorized/a-bit-more-on-game-state/

http://business-analytic.co.uk/blog/uncategorized/goals-change-games-the-effect-of-game-state-on-attack-intensity/

http://statsbomb.com/2013/12/score-effects/

http://www.optasportspro.com/about/optapro-blog/posts/2014/blog-assessing-the-use-of-game-state-in-predictive-models/mbuBlogsyPost

http://objective-football.blogspot.com.es/2015/08/201516-score-effects.html

čtvrtek 22. října 2015

Synot liga: předpokládaný vs. skutečný bodový zisk


Nejvyšší česká fotbalová soutěž má za sebou deset kol, tedy třetinu soutěže. Ideální čas bilancovat. Po grafech znázorňujících počty střel, efektivnost střelby atd. jsem se rozhodl ještě podívat, jak si vedou jednotlivé týmy v porovnání s tím, co se od nich z hlediska bodového zisku očekávalo.

Asi tušíme, že například Jablonec nebo Bohemians nasbírali v dosavadním průběhu ligy méně bodů, než by se čekalo, a naopak Zlín či Slavia jich mají na svém kontě překvapivě víc. Ale o kolik konkrétně jich má ten který tým víc nebo míň jsem nikde neviděl a tak je na čase to spočítat.

Postup je jednoduchý. Porovnáme skutečný bodový zisk s tím, co od klubů očekávali bookmakeři, případně rating Elo. Spočítal jsem obě varianty, výsledky jsou vesměs podobné plus mínus. V případě bookmakerů jsem použil předzápasové kurzy ze stránek liga.cz a u ELO ratingu jsem použil server clubelo.com.

Co je to Elo? Použiji definici z wikipedie: Elo (též koeficient Elo nebo rating Elo) je statistické ohodnocení výkonnosti hráče či týmu na základě výsledků jeho her podle systému, jehož autorem byl Arpad Elo. Systém Elo byl zaveden nejdříve v šachu (v USA od roku 1959, celosvětově od roku 1970), lze ho však použít pro jakoukoli hru, v níž se střetávají dvojice hráčů nebo družstev. Může se také použít v jiných oblastech, například pro hodnocení obtížnosti otázek a schopností žáků při učení.

Club Elo do koeficientu započítává nejen výsledky z domácí ligy a poháru, ale i z evropských soutěží (Ligy mistrů, Evropské ligy) a umožňuje porovnávat sílu klubů nejen v rámci jednotlivých lig, ale i napříč mezi soutěžemi. Nejvyšší Elo v české lize mají Viktoria Plzeň (1660) a Sparta Praha (1669) a z tohohle pohledu by se svou silou neztratily oba české velkokluby ani v Bundeslize.

Rating českých klubů podle Elo Club (k 22.10.)



Ale pojďme k výpočtu předpokládaných bodů. Použil jsem metodologii Simona Gleavese, kterou před pár lety zveřejnil na svém blogu Scoreboard Journalism. Připomenu, že Simon Gleave se zabývá analýzou sportovních statistik ve společnosti Infostrada. Na twitteru má handle @SimonGleave.

Postup výpočtu

1.    Vezmeme předzápasové kurzy k jednotlivým zápasům na výhru domácích, remízu, výhru hostí.
2.    Číslo 1 vydělíme kurzy a dostaneme pravděpodobnost (šance) každé z variant.
3.    Výsledné číslo ale ještě je obvykle třeba upravit, protože součet pravděpodobností bývá zpravidla větší než 1 kvůli ziskové marži sázkové kanceláře (bookmakera).
4.    Pokud nám např. součet pravděpodobností vyjde 1,07, tak tímto číslem podělíme čísla, která nám vyšla v bodě 2. Teď už nám součet bude vycházet 1.
5.    Vypočítáme předpokládaný bodový zisk obou týmů v daném zápase tím, že pravděpodobnost výhry vynásobíme 3 a pravděpodobnost remízy vynásobíme 1.

V případě stránek clubelo.com už jsou u zápasů k dispozici předzápasové pravděpodobnosti, takže můžeme přejít rovnou k bodu 5. Konkrétně před utkání  Jablonec – Slavia Praha byla podle eloclub.com pravděpodobnost výhry domácích 63 % (použijeme desetinná čísla, tedy 0,63), remízy 22 % (0,22) a výhry hostů 15 % (0,15).

V případě Jablonce byl předpokládaný bodový zisk 3*0,63+0,22, tedy 2,11 bodu. V případě Slavie 3*0,15+0,22, tedy 0,67 bodu. Takhle to spočítáme pro všechny dosud odehrané zápasy, sečteme předpokládané body a porovnáme je se skutečným bodovým ziskem.

Dobré je, že porovnání skutečného bodového zisku s předpokládaným bodovým ziskem nám zohlední náročnost rozlosování. Vidíme tak např., zda mají Liberec či Slavia tolik bodů na svém kontě díky tomu, že měli snadný los, nebo díky tomu, že na rozdíl od předpokladů dokázali bodovat i proti silnějším soupeřům.

Rozdíl mezi skutečným a předpokládaným bodoým ziskem se tak dá využít i při vytváření pořadí aktuální formy klubů.

Teď se dostáváme ke konkrétním číslům ze Synot ligy po deseti odehraných kolech. Podle Club Elo si nejlépe nad očekávání vedou Slavia, Liberec, Mladá Boleslav a Zlín. Naopak nejhůře si vedou Jablonec, Jihlava, Baník a Bohemians. V ligové tabulce je sice se 4 body poslední Baník Ostrava ale nejvíce za očekáváními zaostávají Klokani.

Předpokládaný bodový zisk vs. skutečnost (Club Elo)



U Jablonce vyšel rozdíl mezi skutečností a předpoklady jen zhruba mínus tři body (podle Club Elo). V případě kurzů bookmakerů to vychází víc, mínus 4,56. Každopádně Club Elo i bookmakeři ve svých předpokladech považovali a nadále považují Jablonec z hlediska síly za český klub číslo tři.

Jinak, Sparta a Plzeň jsou lehce v plusu. Vzhledem k tomu, že oba kluby jdou v každém kole do zápasů jako velcí favorité, se u nich nedá očekávat příliš vysoký kladný bodový rozdíl.

Předpokládaný bodový zisk vs. skutečnost (bookmakeři)


Pro porovnání ještě přidávám tabulku s tím, jak to vychází podle kurzů přebraných z liga.cz. Ale u těchto dat si nejsem jistý, kdy před zápasem byly zaznamenány. Kurzy se jak víme hýbou, do budoucna budu raději používat při výpočtu předpokládaných bodů stránky Club Elo.

Jarek Krejčí (@championship365)



úterý 20. října 2015

Statistický souhrn Synot ligy po 10. kole


Česká první liga má odehráno deset kol, tedy třetinu soutěže. Při té příležitosti jsem připravil pár grafů znázorňující sílu jednotlivých týmů podle základních statistik, jako jsou počty střel pro a proti, efektivita střelby, držení míče či přesnost přihrávek.

Bohužel mainstream média často končí popis statistik u vstřelených a inkasovaných branek, získaných bodů, ale to jsou věci, které nemusí zcela odrážet fundamenty nebo jinak řečeno skutečnou sílu týmů v lize.

Na grafech není myslím nic komplikované, tak alespoň si dovolím základní popis a můj názor na to, kdo si to rozdá o titul, kdo by mohl bojovat o poháry a kdo naopak bude hrát o udržení. Plus trochu teorie.

Musím upozornit, že českou ligu nesleduju tak bedlivě jako Premier League, ale řekl bych, že statistiky dokáží leccos napovědět a jen škoda že jejich není k dispozici více.

Pro inspiraci se stačí podívat na statistické servery whoscored.com, squawka.com, Objective Football a analytické blogy jako např. statsbomb.com nebo fotbollssiffror.wordpress.com.

Všechny statistiky ze Synot ligy jsem přebral ze stránek synotliga.cz, takže jsou oficiální. Počty střel proti a střely na bránu proti si počítám po každém kole, protože ve statistické sekci nejsou k dispozici.

Pro grafy mi byl inspirací Ben Mayhew (@experimental361), ale ten je má mnohem hezčí.

Počty střel pro a proti (všechny střely včetně těch co šly mimo nebo byly zblokované)



Čtveřice Plzeň, Sparta, Mladá Boleslav a Jablonec ukazují svou střeleckou dominanci. Nejenže jsou na tom nejlépe, co se střeleckých příležitostí týče, ale také umožní svým soupeřům nejméně střel. Jablonec však zaostává v gólové produkci (jak uvidíme na dalším grafu).

Na tomhle grafu chcete být co nejvíc vpravo a co nejvíc dole a naopak nechcete být hodně vlevo a hodně nahoře. Liberec zatím zaostává za hlavními kandidáty na titul Spartou a Plzní zejména v obranné fázi. Proto si nemyslím, že by i přes dosavadní bodový zisk zasáhl do boje o titul, ale na pohárových příčkách by skončit mohl.

Graf nám nic neříká o kvalitě střel, tenhle faktor může hrát určitou roli. Počet střel pro a proti mohou také částečně ovlivnit tzv. score effects. Tým, který dotahuje náskok soupeře má tendenci relativně víc střílet ve snaze srovnat nebo otočit vývoj utkání. Může to být způsobeno větší útočnou aktivitou a taky defenzivnějším pojetím hry vedoucího týmu. (Tohle by vydalo na samostatný článek.)

Efektivita útoku



Graf znázorňuje počet střel a počet střel nutných v průměru na vstřelení jednoho gólu. Hlavně Příbram dokázala vytěžit z mála maximum, otázka zda jí to vydrží. Spíš ne a na jaře bude hrát o záchranu, ale Starka si to ošetří.  Pěkně vidět je slabá efektivita Jablonce v porovnání s týmy z čela tabulky. Nejhůř je na tom Bohemka. S dalším průběhem sezóny by ale mohlo dojít k regresi k průměru, jinak řečeno góly přijdou.

Zjednodušeně se dá říct, že lepší týmy střílí více gólů, protože více střílí a inkasují méně gólů, protože na jejich bránu jde méně střel. S přibývajícím počtem kol se rozdíly v efektivitě snižují, i když ne zcela.

Opět na efektivitu mohou mít určitý vliv score effects, na datech z Premier League se ukázalo, že kvalita střel dotahujícího týmu má relativně nižší kvalitu. Ale tahle data nemáme pro Synot ligu k dispozici.

Takhle nějak fungovala regrese k průměru v Premier League v sezóně 2014/15.


Efektivita obrany


Graf ukazuje, kolik střel jde v průměru na zápas na bránu daného týmu a kolik střel potřebují soupeři ke vstřelení jedné branky. Jak vidno na branku do sítě Sparty se soupeři hodně nadřou. Může to být smůla soupeřů ale i kvalitou defenzívy Sparty. Asi kombinace obojího, zvlášť když to porovnáme Plzeň a Jablonec se v tomhle od zbytku ligy nijak neodlišují.

Gólů v síti Sparty asi mohlo být o něco víc, možná to teprve přijde. Zase ta regrese (doporučuji přečíst např. příslušnou pasáž ve Thinking, Fast and Slow od Kahnemana). Tu bych očekával u Slavie, myslím, že nízký počet obdržených branek neodpovídá kvalitě obranné hry. To samé se dá říci i o Liberci.

Držení míče, střelecká aktivita v útočné třetině



Do posledního grafu jsem vměstnal tři ukazatele. Na ose x je Total Shots Ratio (TSR – poměr střel a proti) znázorňující střeleckou dominanci týmu ve finální třetině hřiště. Na ose y je obvyklý ukazatel Držení míče (v %). Takže můžeme porovnat, jak dokáže ten který tým přeměnit držení míče ve střeleckou aktivitu.

TSR tu slouží jako náhrada za držení míče ve finální třetině hřiště. To jak je tým schopen kontrolovat hru ve finální třetině hřiště mi přijde důležitější, než to jestli má vysoké % držení míče, ale míč si přitom mohou mezi sebou sterilně ťukat obránci a defenzivní záložník na svojí půlce neb ve středu hřiště.

Barva kolečka znázorňuje % úspěšnost přihrávek. Kvalitní týmy by měly mít vysokou úspěšnost a být tedy co nejvíce napravo a nahoře. Opět mi to vychází, že Jablonec patří výš, než ukazuje ligová tabulka. Zlín i přes dobrý start je spíš kvalitou tým zralý na záchranářské práce. Slavie bude muset v dalších přestupových oknech hodně nakupovat, aby se kvalitou vyrovnala čtveřici, co je nejvíc napravo.

Toť vše. Všechna data jsou k dispozici ke shlédnutí i ke stažení zde: https://public.tableau.com/profile/jarek3913#!/vizhome/Synotliga-stats201516/Potystel1516
Jarek Krejčí (jarek.krejci@gmail.com, @championship365)

středa 7. října 2015

Na úspěšnost zásahů u fotbalových gólmanů moc nekoukejte

Na twitterovém účtu společnosti Opta, která se zabývá sběrem a analýzou sportovních statistik, se v úterý objevil údaj, že Petr Čech má po osmi kolech této sezóny Premier League nejvyšší úspěšnost zásahů ze všech gólmanů – 82 %.



Čech je špičkový gólman, to všichni víme, a ani tedy nehodlám jeho výkony v tomto blogu rozebírat. Zaměřit se chci na skutečnost, že u fotbalových brankářů není % úspěšnost zásahů příliš spolehlivou statistikou.

Problémem % úspěšnosti fotbalových brankářů je to, že číslo u jednotlivých gólmanů často hodně kolísá sezónu od sezóny. Jednak střel je ve fotbale daleko méně než v hokeji (kde nejsou mezi špičkovými gólmany v NHL velké rozdíly). A pak to jakou má brankář % úspěšnost ovlivňují i jiné faktory než jen jeho schopnost zastavovat střely reflexivními zákroky nebo robinzonádami.

Od statistik ať už základních či moderních požadujeme relativní stabilitu, opakovatelnost a schopnost předvídat budoucí výkony. To nám % úspěšnost zákroků ve fotbale narozdíl od hokeje nenabízí.

Vezměme si například Tima Howarda z Evertonu. V sezóně 2013/14 měl úspěšnost zásahů 74,5 % a v následující sezóně jen 59,3 %. Roli mohl hrát pokles formy, ale na tak výrazném propadu se podepsala výrazně horší hra celého týmu.

Petr Čech si dlouhodobě drží nadprůměrnou úspěšnost zásahů, ale v ročníku 2011/12 spadla jeho úspěšnost na pouhých 68,8 % oproti 74,2 % v předchozí sezóně.  Hned následující sezónu se jeho Save % vrátila na slušných 76,9 %.

Pokles měl hodně co dočinění s účinkováním manažera André Villas-Boase. Pod jeho vedením hrála Chelsea s vysunutější obranou a v případě jejího překonání se soupeři dostávali do kvalitnějších střeleckých příležitostí. Podobně Hugo Lloris měl za dobu působení Villas-Boase v Tottenhamu úspěšnost zásahů jen 65,1 %, přitom je považován za jednoho z nejlepších brankářů v lize.



(zahrnuti brankáři, kteří v každé ze sezón odchytali alespoň 900 minut, zdroj dat STATS LLC)

Ve výši % úspěšnosti zákroků hrají velkou roli kvalita týmu, defenzívy, styl obranné hry i náhoda. V průměru slabší týmy mají tendenci pouštět soupeře do kvalitnějších šancí a naopak silnější týmy umožňují soupeřům méně kvalitní střelecké příležitosti.

Ale nemusí to tak platit vždy. Obrana Southamptonu patří v Premier League ke špičce a přesto má Maarten Stekelenburg po osmi kolech úspěšnost jen 47,4 %. Mezi tyče Saints šlo jen 19 střel a z toho padlo 9 gólů – řekl bych, že v tom hodně hrála roli smůla Saints, třeba Man United do prostoru brány vypálil třikrát a byly z toho tři góly, stejně tak Everton ze 4 střel na bránu dal Saints tři branky.

Vrátím se ještě trochu k Čechovi. Jeho konkurent David Ospina měl v minulé sezóně také velmi slušné % zásahů – 80,7 %. To zas není tak velký rozdíl oproti 82 % Petra Čecha v této sezóně, a přesto se asi shodneme, že Čech je kvalitnější gólman a že přestup na Emirates byl ze strany Arsena Wengera výborný obchod.

Abych dal i nějaké příklady o kolísavosti této statistiky ze Synot ligy, tak Matúš Kozáčik z Plzně měl v mistrovské sezóně 2013/14 úspěšnost 81,1 %, v dalším ročníku mu klesla na pouhých 68,8 %. Aleš Hruška měl v Příbrami úspěšnost jen 63,7 %, v Mladé Boleslavi mu následující sezónu vyskočila na 78,4 %. A naopak, Milan Hečo ze Slovácka – v sezóně 13/14 úspěšnost 81,4 %, v další sezóně pouze 70,3 %.

Na rozdíl od hokejových brankářů se ti fotbaloví daleko více zapojují do hry chytáním a boxováním centrů, zapojením do rozehrávky či zachycováním pasů soupeřů za obranu. Takže zachytit schopnosti fotbalového brankáře do jednoho čísla není tak jednoduché.

I tak se ale řada analytiků snaží údaj o úspěšnosti zákroků vylepšit. Například Garry Gelade v loňském příspěvku pro OptaPro Blog upravil úspěšnost zákroků podle náročnosti zásahů. Do úvahy vzal vzdálenost střely od brány, kam střela mířila, jak vysoko šla nad zemí, zda se jednalo o prudkou nebo slabou střelu, zda jí bylo dosaženo po postupném útoku či brejku atd.

Paul Riley píšící na svůj blog Different Game na to šel trochu jinak. Při výpočtu úspěšnosti zákroků vzal do úvahy z jaké zóny (celkem rozdělil hrací plochu na 46 zón) byla střela vyslána a pak spočítal kolika gólům ten který brankář chytil na 100 střel v porovnání s průměrem.

Na závěr ještě přidávám ze pár dalších odkazů k tématu:

- Goalkeepers’ save percentage an unreliable stat (Sam Gregory)
- Goalkeepers: How repeatable are shot saving performances? (Colin Trainor)
- Predicting future performance – revisited (James Grayson)
- Never judge a goal keeper by his saves (11tegen11)

čtvrtek 1. října 2015

PDO


Statistika je to dosti jednoduchá, ale při základní analýze výkonů fotbalových týmů z pohledu čísel může být PDO často velmi užitečné. Co PDO znamená? Nic. Není to zkratka, název je odvozený od přezdívky vynálezce tohoto ukazatele Briana Kinga. Svůj původ má PDO v hokeji a vypočítá se jako součet úspěšnosti střelby a úspěšnosti zásahů. Průměr pro ligu je 100.



Proč se PDO využívá?  Úspěšnost střelby a úspěšnost zásahů mají v hokeji i ve fotbale tendenci kolísat a je v nich mnohem větší prvek nahodilosti, než v případě statistik týkajících se toho, kolik si tým vytvoří střeleckých příležitostí či naopak kolik střel proti němu vyšlou soupeři. Trochu jinak řečeno, korelace s kvalitou týmu je v případě PDO mnohem menší, než v případě počtu střel či třeba poměrových ukazatelů jako jsou Total shots ratio či Shots on target ratio.

Síla PDO spočívá v regresi (návratu) k průměru. Příliš vysoké či naopak příliš nízké PDO nám hlavně v krátkém období může pomoci vysvětlit dobré či špatné výsledky. Vezměme si konkrétní jednoduchý příklad z Premier League, kde je odehráno sedm kol a na třetí příčce je West Ham United, který dokázal vyhrát venku nad Arsenalem, Liverpoolem a Man City.

PDO West Hamu po sedmém kole je 128,4, výrazně nad stovkou. Kladiváři skórovali z každé druhé střely směřující na bránu soupeře (dlouhodobý průměr v PL je okolo 30 %) a úspěšnost zásahů mají taktéž nadprůměrných 78,4 %. Jejich skóre je kladné 15:9, ale poměr střel na bránu pro a proti (Shots on target ratio - SoTR) je pouze 43,3 %, když vyslali 29 střel na bránu (až 12. nejlepší v PL) a naopak dovolili soupeřům 38 střel (6. nejhorší v PL).

Jak vidno, vysoké postavení Kladivářů v tabulce není dáno tím, že by soupeře přehrávali, přestříleli, ale nadprůměrnou a dlouhodoběji neudržitelnou efektivitou v útoku a naopak podprůměrnou střeleckou efektivitou soupeřů.

Pravda poměr střel je částečně negativně ovlivněn tím, že West Ham ve zmíněných zápasech obvykle skóroval jako první (a hned z první či druhé střely na bránu) a soupeři ve snaze vyrovnat či zápas otočit zvýšili ofenzivní nasazení a i když defenzivní výkon Kladivářů byl hodně disciplinovaný, dlouhodobě se dá s jistotou očekávat, že PDO West Hamu klesne někam blíže ke stovce.

Takže, pokud by chtěl West Ham pomýšlet na umístění v horních patrech Premier League, musel by více střílet a naopak dovolit soupeřům méně střel, což jsou kvality týmů končících na předních pozicích.

Dobré týmy nedávají více gólů primárně proto, že by měly výrazně nadprůměrnou úspěšnost střelby či zásahů, ale proto, že si vytvářejí více střeleckých příležitostí než jejich soupeři. I když najdou se výjimky, zejména mezi kluby, které ve svých ligách vyčnívají (Barcelona, Real, Bayern a asi i Sparta).

Druhým extrémem je Southampton, tomu vstup do sezóny oproti očekáváním výsledkově příliš nevyšel. Na kontě má klub z jihu Anglie 9 bodů a oproti Kladivářům horší skóre 10:9. Přitom poměr střel na bránu má 70,2 %. PDO Svatých však je pouhých 71,4. Gólem skončila jen každá čtvrtá střela na bránu a naopak soupeři dokázali skórovat z každého druhého pokusu směřujícího na bránu.

Už jen z PDO se dá usuzovat, že s přibývajícím počtem se postavení West Hamu a Southamptonu v tabulce změní. Jinak konkrétní hodnoty PDO naleznete třeba zde. Nadprůměrně vysoké PDO mají momentálně také Man Utd či Everton, naopak podprůměrné Liverpool nebo Bournemouth.

Na závěr ještě jeden gif přebraný z blogu Objective Football. Gif pěkně znázorňuje regresi k průměru v průběhu ročníku Premier League 2014/15. Jeden obrázek toho vysvětlí víc než desítky slov. Jinak v angličtině toho hodně o PDO ve fotbale napsal James Grayson – tady je jeho úvod do PDO.



Další související odkazy
- What is a normal PDO? (11tegen11)

čtvrtek 17. září 2015

SCoRe - o co se jedná?

SCoRe je zkratka pro Seasonal Comparative Results a vymyslel ji Simon Gleave (@simongleave), analytik společnosti Infostrada zabývající se sběrem a analýzou sportovních statistik. Není to žádná novinka, Gleave o SCoRe psal na stránkách Infostrady poprvé zhruba před třemi lety a napadlo ho to už mnoho let před tím. Jedná se velmi jednoduchou metodu, jak porovnat výsledky probíhající sezóny s výsledků ze sezóny předchozí.

Obvykle, co vídáme v médiích je to, že se porovnává bodový zisk klubu např. z prvních šest kol s bodovým ziskem z úvodních šest kol sezóny předchozí. Problémem je, že tato metoda nebere do úvahy rozlosování ligy (resp. sílu soupeřů), a to se snaží právě SCoRe.

Gleavova metoda porovnává bodový zisk z dosud odehraných kol s bodovým ziskem ve stejných zápasech v předchozí sezóně. Myšlenka je taková, že síla jednotlivých klubů se mezi dvěma sezónami často až tak moc nemění, takže porovnání podle SCoRe bere víc do úvahy sílu soupeřů. Když se to graficky znázorní, tak hned jasně vidíme, zda třeba Slavia nasbírala se stejnými soupeři více či méně bodů.

Výsledky nováčků

Trochu problémem je, že ve fotbale kluby sestupují a postupují, Gleave to vyřešil tak, že nejhorší tým ligy nahradil nejhorším postupujícím, druhý nejhorší sestupující tým druhým postupujícím. V případě Synot ligy ve SCoRe Sigma Olomouc nahradila Hradec Králové a Fastav Zlín nahradil České Budějovice. Kdyby byli sestupující tři, jako je tomu v Premier League, tak 18. tým je nahrazený 1. postupujícím, 19. tým 2. postupujícím a 20. tým třetím postupujícím.

Můžeme tak porovnat i to, jak si vedou nováčci v porovnání s bodovým ziskem sestoupivších týmů. Na příkladě Synot ligy vidíme, že Zlín má po šesti odehraných zápasech o 9 bodů více než ve stejných zápasech minulé sezóně nasbíraly Budějovice, což je pro Ševce slušná vizitka. Naopak Sigma, které se věřilo více, má zatím ze stejných utkání o bod méně než Hradec.

SCoRe Synot ligy po šesti odehraných kolech



Grafika inspirovaná Simonem Gleavem (ještě v Tableau trochu tápu, takže to není úplně věrná kopie toho, co na svém twitterovém profilu obvykle zveřejňuje on) obsahuje nejen porovnání bodového zisku/ztráty se stejnými zápasy sezóny 2014/15 ale i jednoduchou predikci toho, kolik bude mít ten který klub bodů na konci sezóny.

Predikce je fakt jednoduchá, není to žádná rocket science, v případě zbývajících zápasů předpokládáme, že bodový zisk bude stejný jako v minulé sezóně.

Co nám SCoRe říká o dosavadním průběhu Synot Ligy
-    Viktoria Pzeň nasbírala o tři body méně, než ve stejných zápasech minulé sezóny, Sparta je lepší jen o bod. Kdyby byly bodový zisk obou klubů ve zbývajících zápasech stejný jako v minulé sezóně, tak to i přesto bude Plzni stačit. Opět rozhodnout vzájemné zápasy.
-    nejlepší bodový nárůst má už zmíněný Fastav Zlín a vede si zatím lépe než před sezónou více vyzdvihovaná Sigma, ta zatím jede na sestup.
-    nejvíc si bodově pohoršil Baník a je největším kandidátem na druhou ligu
-    bodově dost v porovnání s minulou sezónou ztrácí i Jihlava a Bohemians, první jmenovaný klub už přistoupil k odvolání trenéra.

Na závěr

Jak jsem uvedl, jedná se o velmi jednoduchou metodu porovnání výsledků mezi dvěma sezónami a bodová predikce je velmi jednoduchá, i tak mi SCoRe přijde užitečné, takže jej budu v dalším průběhu sezóny Synot ligy pravidelně aktualizovat a zveřejňovat na svém twitterovém účtu.
---

* Oprava 19.9. 2015: Zjistil jsem, že jsem prohodil při úpravě v Tableau čísla u projekce bodů po 6. kole u Sigmy a Baníku - u Ostravy má být 25 bodů, u Olomouce 24 (Hradec získal v minulé sezóně celkem 25 bodů, Olmík má ve stejných odehraných zápasech o bod míň, takže 24)

úterý 15. září 2015

Trápení Chelsea pokračuje

Pět okol odehraných a jeden z kandidátů na titul už ztrácí na vedoucí pozici neuvěřitelných jedenáct bodů.

Vraťme se napřed o rok zpět. V úvodních pěti kolech ročníku 2014/15 nasbírala Chelsea 13 bodů za čtyři výhry a jednu remízu. Nastřílela v nich 16 gólů a 6 inkasovala, z toho tři v přestřelce s Evertonem (6:3). Body ztratila Chelsea, o které se v průběhu podzimu začalo mluvit jako o nových Invincibles, jen na půdě obhájce titulu Manchesteru City (1:1).  Přemožitele našli Blues až v 15. kole, kdy podlehli venku Newcastlu 1:2.

A bilance po pěti kolech sezóny 2015/16 – jedna výhra, jedna remíza a tři prohry, skóre 7:12. Zatímco před rokem tým Josého Mourinha bavil diváky na poměry portugalského kouče až nezvykle ofenzivní hrou (i nadále doplňovanou kvalitní defenzivou), v této sezóně zatím hra Blues nefunguje ani dozadu ani dopředu. Je sice odehráno jen pět kol a je brzy na vyvozování velkých závěrů, ale prostě není to ono.

Před rokem zářila ofenzíva tažená tvořivým Cescem Fabregasem, rychlým Edenem Hazardem a chladnokrevným Diegem Costou, hráči v záložní řadě v čele s Nemanjou Matičem si do puntíku plnili své povinnosti, pro soupeře nebylo při přechodu do útoku snadné přihrát míč dopředu do volných prostorů a čtyřčlenná obrana vedená 34 letým Johnem Terrym se díky tomu nedostávala do většího počtu ošemetných situací.

Uplynul rok a Fabregas, jenž na podzim 2014 vytvářel střelecké příležitosti a šance, sbíral jednu asistenci za druhou, je označován za přítěž pro tým zejména kvůli své slabší hře dozadu. Diego Costa se dosud strefil jen jednou a dohromady za 438 odehraných minut vyslal na soupeře jen 9 střel (jen 3 do prostoru brány)  - 1,85 střely/90min (hodně málo). To samozřejmě není jen jeho vina, na vině jsou zejména jeho spoluhráči, kteří mu mají vytvářet střelecké pozice.

Pro srovnání – například Olivier Giroud má zatím bilanci 5,60 střely/90, Graziano Pellé 4,50 střely/90, Bafetimbi Gomis 3,25 střely/90. V minulé sezóně Costa střílel stejným tempem jako teď Gomis.

Jako jedno z možných vysvětlení problémů Chelsea včera Daily Telegraph zmínil, že tým do letní přípravy nastoupili oproti ostatní týmům později. Zdůvodnění bylo, že si hráči po náročné sezóně, v níž Mourinho hráče v sestavě příliš nerotoval, zasloužili více odpočinku. Avšak tým tak zdá se nevstoupil do začátku sezóny optimálně fyzicky připraven.

Abychom se ještě vrátili k obranné hře, zde je pár statistik. V minulé sezóně čelila Chelsea v průměru 3,23 střelám na bránu (lepší už byl jen Southampton), po dosud odehraných kolech má průměr 7,8 (nejhorší). Je to hodně, třebaže hrála dvakrát část zápasu v oslabení, ale stejně, taková číslo bychom očekávali spíš od kandidáta na sestup. 

Asi i díky větší propustnosti obrany a menšímu defenzivnímu tlaku se zatím soupeřům daří střílet z nebezpečných pozic a umisťovat střely mezi tyče. Ze všech střel vyslaných proti Chelsea jich jde do prostoru brány zhruba 51 %, což je vysoce nadprůměrné číslo, které časem klesne.

Podle expected goals modelu Paula Rileyho patří Chelsea po posledním kole k nejhorším týmů v lize, což by mohlo indikovat, že nejde o krizi výsledkovou či nedostatek štěstí, ale že problémy mohou být hlubší. Ale opět je třeba zdůraznit, že máme za sebou pět kol a s přibývajícím počtem zápasů se situace může změnit.

Střely na bránu Chelsea 2015/16. Čím větší bublina, tím větší hodnota Expg (expected goal).
Interaktivní dashboard Paula Rileyho naleznete zde: https://public.tableau.com/profile/paul.riley#!/vizhome/PremierLeague201516xGMap/PremierLeague201516ShotonTargetxGDashboard

Jako další ligový soupeř čeká Chelsea v sobotu Arsenal mající společně s Manchesterem City nejnebezpečnější útok v lize, jemuž schází jen lepší muška a trochu štěstí. V Community Shield zvítězili Gunners ve Wembley 1:0, tentokrát se hraje na Stamford Bridge a při rozdílné formě obou rivalů by byla výhra Chelsea překvapením.

pondělí 7. září 2015

Pokročilé fotbalové statistiky: Expected Goals (a Premier League)

Expected goals modely jsou hodně využívaným nástrojem v rámci fotbalové analytiky. O co jde a kde najít čísla pro jednotlivé týmy Premier League?




Expected goals (ExpG, xG)

Česky bychom to mohli nejlépe přeložit jako Očekávané (předpokládané) góly. Ukazatel měří, kolik gólů měl tým v zápase a v průběhu sezóny vstřelit a inkasovat, a to na základě počtu a kvality střel. Každému ze střeleckých pokusů je dána pravděpodobnost, s jakou mohl skončit gólem. Například pokud měla střela 20 % pravděpodobnost, že skončí gólem, její hodnota je 0,2 ExpG.

Modely ExpG se vlastně snaží kvantifikovat kvalitu šancí a střeleckých pokusů a dávají nám lepší obrázek o vývoji zápasu a výkonech jednotlivých týmů v průběhu sezóny, než jen pohled na počty střel (či často zavádějící pohled na ligovou tabulku).

Právě to, že ExpG modely neberou střelu jako střelu je pokrokem oproti starším pokročilým statistikám Total shots ratio (TSR) a Shots on target ratio (SoTR). I když i ty jsou stále užitečné a využívané. Pro připomenutí, výpočet TSR (a podobně pak SotR) je následující:

TSR = střely pro / (střely pro+střely proti)

Existují různé modely ExpG, ale obvyklými vstupními parametry jsou lokace střely, typ střely (noha, hlava, přímý kop), rychlost útoku, informace o typu přihrávky (např. centr, přihrávka mezi obránce). Ale třeba Paul Riley vytvořil model, který využívá jen střely jdoucí na bránu a kde parametrem je jen místo, odkud střela šla (+ přímé kopy).

Nakolik modely založené na expected goals využívají kluby Premier League netuším (tipnul bych si že jo, určitě Arsenal), ale na internetu jsou k dispozici informace o modelech vytvořených lidmi zabývajícími se fotbalovou analytikou. Kromě Paula Rileyho svůj model celkem podrobně popisuje Michael Caley. Stejně jako Riley i zveřejňuje konkrétní čísla pro Premier League.

- Vysvětlení a využití modelu Paula Rileyho

- Popis modelu vytvořeného Michaelem Caleym

Riley šel dokonce dál než Caley a publikuje nejen čísla, ale přes Tableau i lokace střel plus některá další data. Doporučuji si s tím pohrát – data naleznete buď zde a nebo embedovaná o něco níž v tomto příspěvku. Na screenshotu vidíte Expected goals čísla pro jednotlivé kluby v dosavadním průběhu Premier League (po 4 kolech).



Na ukázku jsem vyfiltroval Arsenal. Čím větší bublina, tím větší hodnota ExpG dané střely. Gunners zatím v koncovce zaostávají za svými ExpG čísly.

Na této stránce pak je mnoho pokročilých statistik za předchozích pět sezón, taktéž od Rileyho. Blog Football in the clouds tato čísla nedávno podrobil statistické analýze a Rileyho model z toho vyšel dobře.



ExpG Ratio (Difference)

Obvykle se u expected goals využívá jejich poměr, případně rozdíl mezi nimi, jedná se o Expected goals Ratio a Expected goals Difference. Výpočet ExpG Ratio je obdobný jako u TSR:

ExpG Ratio = ExpG pro / (ExpG pro+ExpG proti)

ExpG Difference = ExpG pro – ExpG proti

ExpG Ratio a ExpG Difference vykazují vysokou korelaci s počtem získaných bodů a gólovým rozdílem (goal difference), takže tyto ukazatele do značné míry odrážejí skutečnou sílu týmů. Nabízí se zde paralela s analýzou fundamentů při investování do akcií.

Síla těchto ukazatelů je i v jejich schopnosti předvídat – ligová tabulka často lže, týmu se nemusí zrovna dařit (výsledkově, střelecky), ale pokud vykazuje dobré hodnoty ExpG, je zde velká šance, že půjde výsledkově nahoru.

A naopak, u týmu výsledkově či střelecky výrazně překonávajícího ExpG hodnoty může dojít brzy k obratu k horšímu. Předvídatelnost je využitelná v průběhu sezóny, ale i mezi předchozí a novou sezónou.

Ukazatele ExpG se dá využít i u jednotlivých hráčů, zejména těch ofenzivních (útočníci, křídla, ofenzivní záložníci…). Pokud se hráči gólově daří ale jeho ExpG čísla jsou nízká, může to naznačovat, že jeho střelecká forma není udržitelná. A naopak, útočníkovi to tam zrovna nemusí padat, ale pokud vykazuje dobrá ExpG čísla, dá se očekávat obrat k lepšímu.

Své využití to může mít při skautingu. Je dobré porovnat počet skutečně vstřelených branek s ExpG čísly. Můžete mít vytipovaného forvarda, který v předchozí sezóně nastřílel 20 gólů, ale pokud byla hodnota jeho ExpG výrazněji nižší, může to být varovný signál, že jeho střelecká forma se nemusí opakovat.

Velmi dobré je k tomuto tématu video s přednáškou od Omara Chaudhuriho, analytika společnosti Prozone.


Prozone Performance.Lab - Science + Football 2014 Omar Chaudhuri, Data Scientist from Prozone Sports on Vimeo


Nevýhody ExpG modelů

Samozřejmě Expected goals modely nejsou dokonalé a mají své slabiny (o nichž se v analytické komunitě hodně diskutuje). Za prvé, mezi jednotlivými hráči jsou rozdíly v jejich schopnosti zakončit. Střelecký pokus dvou hráčů může mít stejnou ExpG hodnotu, ale pravděpodobněji se strefí šutér typu Sergia Aguera než Phil Jones.

Ale to zas není tak fatální slabina, protože analýzy ukázaly, že špičkoví střelci střílejí více gólů primárně kvůli tomu, že se dostávají (vytvoří si) do větších počtu kvalitních šancí, což se odrazí i v ExpG číslech.

Modely (alespoň ty veřejně prezentované) také neberou do úvahy postavení obránců a jejich počet okolo zakončovatele. Ale je dost možné, že kluby mají k dispozici více dat, a dokáží to zohlednit nebo na tom jejich týmy analytiků pracují. Našly by se i další mouchy (vliv počasí, hrací plochy), ale to už bych se zbytečně zamotával do detailů.

Expected goals modely nám neprozradí vše, nejsou žádným Svatým grálem, ale je to jeden z nástrojů, jak objektivně hodnotit výkony týmů (případně ofenzivních hráčů).


---


Některé další odkazy

- On the topic of Expected Goals and the repeatability of finishing skill (Ted Knutson, analytik Brentford FC)

- The limits of expected goals models based on shots (Dan Altman, North Yard Analytics)