This presentation was used during the final of the "Tech Cup", a hackathon organized by River Plate and Microsoft. The project, about the application of Big Data to football performance, won the competition in the category "Big Data"
The Use of Big Data to improve Decision-making in Football
1. The Use of Big Data to
improve Decision-making
in Football
Andre Brener
Mathijs Steneker
Tech Cup – ‘Big Data’
Category
22 August, 2016
2. Industrial ingeneer, ITBA.
Data Science at Jampp.
Defender.
Andre Brener Mathijs Steneker
Master in Information Managem., RSM.
Data Intelligence at DataFactory.
Midfielder.
@andre_brener @Mister_Numbers
3. “Sometimes numbers highlight
what I’ve seen .., but sometimes
[they] highlight what I’ve not
seen, so I have to be humble
enough to see that maybe
there’s something there and I
have to analyse it deeper.”
Arsene Wenger, manager
4.
5. Analyse and improve the
performance of players and
the team
Recognize patterns in
opponent’s strategies and
turn them into weaknesses
Find and recognize talent to
help the scouting
department
7. Expected goals model
Home team 2
Away team 0
Minute 75
Shooter
Distance
Assisting playerAssist
Angle
Model assigns probability (0
to 1) to each shot that it will
end up being a goal. This is
based on over 20 variables.
Some of the most important
ones are here.
10. The majority of shots are low-quality chances
22nd in creation
of big chances
11. Goal
Shot on post
Shot saved
Shot off target
The location of the circle indicates the location of the shots.
The size of the circle is based on the probability of the shot converting into a goal.
A lot of shots
come from
outside of the
area
On the right side of the center
there are over 30 low-
probability shots. None of them
was converted.
12. The location of the circle indicates from where the pass was given to create a chance
The size of the circle is based on the probability of the following shot converting into a goal.
Goal
No Goal
The main
chance
creation comes
from the left
and the right
sides
13. The main striker
is left out of the
passing network
Línes: passes (min. 3). The darker the line, the more passes.
Size of circle: amount of total passes completed
Position of circle: average position during game
Intensity of color of circle: expected participation in goals
given shots and passes
Only players in initial line-up
13th matchday, Torneo Primera División 2016
vs
15. Fernando Belluschi Miguel Almirón
Pablo Barrientos
Giovani Lo CelsoFernando Luna
Gabriel SanabriaBrian Sarmiento
Nicolás Lodeiro
Claudio Aquino
Lucas Salas
Augusto Solari
Santiago Rosales
Best “chance creators”
16. The location of the circle indicates from where the pass was given to create a chance
The size of the circle is based on the probability of the following shot converting into a
goal.
Goal
No Goal
Gabriel Sanabria
24 years
Per 90 minutes
Goals
Pass
accuracy
Assists
Key passes
Shot
accuracy
Shots
D’Alessandro
Sanabria
17. The Future of Big Data in Football
More data available and more tools to analyse
More competitivity among teams and need to differentiate
Big Data will replace the human eye
Los datos dan una perspectiva que los ojos no ven.
Por dos cosas nos gusta esta cita: una de las personas más importantes en el fútbol valora el uso de datos. Y queda claro que hay una interacción entre lo que ven los ojos y lo que muestran los datos. No funcional sólos, se complementan.
El objetivo es que se repita la foto lo máximo posible
Como podemos hacer esto, encontramos 3 puntos en los que Big Data nos puede ayudar.
En la presentación, usemos los texto de la slide 25:Optimizar decisiones en el juego
Optimizar características de los jugadores
Analizar rendimiento de cada jugador y formación del equipo
Mejores estrategias
Acciones y situaciones que se repiten y que puedes aprovechar
Detalles que no son visibles al ojo humano
Optimización de tiempo de video (analisis)
Scouting
Búsquedas amplias
No hay necesidad de mandar scouts a todas las canchas ni ver todos los videos
Buscar jugadores con características necesarias y enfocar el scouting en esos
A partir de programas en excel y python desarrollamos las siguientes cosas
Para contar en la presentación:
Lo más importante en el fútbol es el resultado, y los goles que se hacen y se reciben generan esos resultados.
No podemos quedarnos sólo en el resultado, y tampoco no sólo en los goles. Los goles no son frecuentes (2,5 por partido en 2016) y tienen mucha aleatoriedad. Puedes hacer todo bien pero termina el balón en el palo, o un mal intento termina siendo gol por error del arquero. No dan una buena base para hacer tus análisis y sacar conclusiones.
Nuestro modelo, que forma una base del resto que vas a ver, se enfoca en tiros (casi 21 por partido). Pero un disparo no es el otro: un remate de 35 metros no es lo mismo que un pase al hueco y un mano-a-mano con dos jugadores. Además el “outcome” del tiro impacta mucho tu percepción del tiro. El modelo que hemos desarrollado asigna un valor entre 0 y 1 a cada disparo.Ese número indica la probabilidad que el tiro entre al arco. Esto está basado en situaciones históricas que fueron parecidas (unas 35,000). La variable más importante es el ángulo al gol (imagen), también tiene en cuenta el tipo de asistencia, el estado del partido, el minuto y mucho más que tiene que ver con la situación del juego. Lo que vas a ver después se basa mucho en este modelo.
Enfoque en ataque y torneo local
En este análisis corto solo tocamos la parte del ataque
Patea de larga distancia porque parece que les cuesta entrar por el medio como muestra esta mapa.
Importante: terminar con la frase que se juega mucho por las bandas para introducir prox slide.
Queda aislado Alario. No tiene vínculo con Pisculichi, ni con los volantes extremos. Martínez parece la última estación del ataque.
Los mejores pasadores los torneos.
Son los que crean las mejores situaciones de tiros para sus compañeros.
Hay unos que ya son reconocidos, pero hay otros que no están tan obvios, pero el Big Data nos ayudó a encontrarlos.
Seleccionamos tres de los anteriores. Parecen los más interesantes por los aspectos de edad, factibilidad de fichaje y calidad de pases desde el centro.