Deze website maakt gebruik van cookies. Voor meer informatie over de cookies waarvan deze website gebruik maakt klik hier.
Door verder op deze website te surfen geeft u de toestemming aan Minoc Data Services om cookies te gebruiken. verder gaan
 

Machine learning voorspelt wereldkampioen voetbal

Valérie Deridder

 
Binnenkort hoeven we zelfs het WK niet meer te volgen, maar laten we algoritmen de WK-winnaar voor ons bekendmaken.

 

Het is een nakend fenomeen. Op hete zomerdagen met een bak gekoelde pintjes aan je scherm gekluisterd zitten, kijkend naar een hoop mannen die achter een bal aanhollen. “Wat doen we onszelf toch aan”, moet Andreas Groll van de Technische Universiteit van Dortmund bij zichzelf gedacht hebben. Hij ontwikkelde prompt een algoritme dat de uitslagen van de wereldbeker kon voorspellen, en volgt daarmee in de voetsporen van Paul, the psychic octopus, die in 2010 nog voorspelde dat Spanje wereldkampioen zou worden. Dat Groll zich daarmee de wereldwijde woede van bookmakers en voetbalfanaten op de hals haalt, schijnt hij er graag bij te nemen.

 

Random forest

Wie namelijk een min of meer accuraat inzicht wil krijgen in het verloop van het WK, volgt gewoon de voorspellingen van de bookmakers. Die zijn immers opgesteld door professionele statistici. Wie een zo volledig mogelijk inzicht wil, combineert de voorspellingen van meerdere bookmakers. Daarin komt Brazilië duidelijk naar voren als de gedoodverfde winnaar met een waarschijnlijkheid van 16,6 %. Het Zuid-Amerikaanse land wordt gevolgd door Duitsland (12,8 %) en Spanje (12,5%).

 

Groll gooit het echter over een andere boeg en maakt voor zijn WK-voorspelling gebruik van de ‘random forest-aanpak’, een combinatie van machine learning en conventionele statistiek. Groll en zijn teamgenoten baseren hun voorspellingen op een aantal factoren die mogelijk van tel zouden kunnen zijn voor de WK-uitslag. Zo worden bijvoorbeeld economische en demografische factoren in rekening gebracht zoals het bruto nationaal product van een land of de bevolking van een land. Ook de officiële FIFA-ranking van nationale teams wordt niet ontzien, evenals de kenmerken van die teams; hoe oud de gemiddelde speler is, het aantal Champions League spelers dat een elftal bezit en of een nationaal team met thuisvoordeel speelt.

 

Groll en kompanen simuleerden het WK een 10.000 keer. Daaruit kwam de volgende vaststelling: indien Duitsland de kwartfinales haalt, maken zij het meeste kans op de wereldbeker. Echter, als ze de kwartfinales niet halen, dan wordt Spanje net als in 2010 WK-kampioen.

 

Je bent wat je eet

Omdat voorspellingen met algoritmen ook altijd gebaseerd zijn op de data die je ze voedt, genereren ze bij sommige amateur-bookmakers wel al eens andere resultaten. Zo baseerde de blogger Gerald Muriuki van GoodAudience zich op historische data sinds 1930 voor het ontwerpen van zijn algoritmen. Aan de hand van voorgaande uitslagen wordt zo de waarschijnlijkheidsgraad voorspeld dat een bepaald elftal wint. Aan de hand van de algoritmen van Muriuki, wordt Brazilië de nieuwe wereldkampioen. Hoewel het wel eens amusant is om je blik over die waarschijnlijkheden te laten glijden (Duitsland heeft bijvoorbeeld een kans van 0,58 om een wedstrijd tegen Zweden te winnen, omgekeerd is dat maar 0,19), zijn ze onvoldoende onderbouwd.

 

 

The bank takes it all

Het begint nu bijna een vierjaarlijkse traditie te worden: internationale banken die zich ook aan een WK-voorspelling wagen en die daarbij hun kwantitatieve skills gebruiken om de meest waarschijnlijke wereldkampioen voetbal te kiezen. Vier internationale banken maakten voor hun analyse gebruik van kunstmatige intelligentie, statistische modellen, portfoliotheorie en economische analyse. Hun resultaten verschillen onderling danig.

 

Zo maakte de Zwitserse bank UBS gebruik van statistische modellereing en voorspelde ze dat Duitsland de winnaar zou worden, terwijl Goldman Sachs denkt dat de overwinning voor Brazilië zal zijn. (Dat voorspelde GS nu overigens al de laatste 3 wereldkampioenschappen.) Goldman Sachs baseerde haar algoritmen dit jaar op teamkenmerken, individuele spelers en recente prestaties. De Nederlandse bank ING zet dan weer in op Spanje en baseert zich daarbij op de marktwaarde van het team. De Japanse bank Nomura laat daarentegen het midden tussen Frankrijk en Spanje. Nomura keek voor haar voorspelling naar factoren zoals de kwaliteit van de spelers, het momentum van de teamprestaties en voorgaande overwinningen.

 

Het blijft uiteindelijk allemaal maar giswerk. Dat bewees Goldman Sachs namelijk al 3 keer door telkens verkeerdelijk Brazilië als wereldkampioen te bestempelen. Paul, the psychic octopus, deed het een heel stuk beter in 2010. Ik pleit daarom voor meer voorspellende octopussen. Veel wetenschappelijker dan al die algoritmen.

 

Reacties

comments powered by Disqus
 

RECENT NIEUWS