
Si existe un deporte que históricamente se ha jactado de su impredictibilidad, ese es el fútbol. Las historias de grandes hazañas de equipos menores prácticamente fundamentaron el concepto de batacazo, una idea que utilizamos en la vida cotidiana ante cualquier situación que, contra todos los pronósticos, se vuelve favorable para el más débil.
El fútbol ha hecho bandera de la paridad estructural que brinda un marcador bajo e incluso, ha utilizado como excusa ante resultados adversos el factor azaroso que puede influir en su desarrollo. Es en esos casos que apela a la inevitable frase “cualquiera le puede ganar a cualquiera”
En los últimos años, estudios de diferentes corrientes han puesto en jaque esta idea: se ha demostrado desde diferentes metodologías que, incluso analizando los resultados finales (donde puede haber mayor influencia del azar), el fútbol se ha vuelto más predecible. Todo esto, pese a la tendencia de algunos de sus protagonistas a explicar su dinámica desde las excepciones, como el Leicester campeón de la Premier League inglesa o Grecia ganando la Euro de 2004. Omitiendo el hecho de que en la mayoría de las competiciones, los favoritos son los que terminan llevándose el título.
Sin embargo, el avance de la ciencia de datos, ha abierto un enfoque todavía más audaz que tiene que ver con el desarrollo de modelos que pueden predecir a partir de la información estadística disponible, ya no resultados, sino tendencias de los rendimiento de los equipos y los futbolistas.
Para explicar en detalle cómo es la aplicación predictivos en el fútbol, primero hay que ir un paso atrás y entender de qué hablamos cuando hablamos de modelos predictivos en términos generales, para eso contactamos a Fredi Vivas, CEO de Rocking Data, quien en tres preguntas nos resuelve algunas ideas fundamentales sobre el tema:
¿Qué sería un modelo predictivo?
Cuanto más datos generamos y más potencia en las computadoras tenemos, nos podemos permitir crear soluciones que hasta 10 años eran imposibles. Por eso la capacidad de una organización para competir e innovar se ve en gran parte relacionada al éxito con el que puedan analizar y extraer valor de grandes volúmenes de datos.
Toda esa experiencia de las organizaciones, puede traducirse en modelos predictivos para no solo mirar el pasado y generar informes, sino tener la posibilidad de predecir lo que sucederá, en el futuro en base a la historia, descubriendo patrones que los humanos nunca antes habíamos visto. Lo hacen con precisión, rigurosidad científica, flexibilidad y escalabilidad.”
¿Para qué se construyen modelos predictivos en la industria?
Se busca responder preguntas, del tipo ¿Cómo puedo predecir las ventas en cada ubicación para optimizar el stock?, ¿Cuál es la mejor oferta que le puedo sugerir a cada cliente? ó ¿Cómo puedo detectar el fraude antes de que se realice una compra?
Los algoritmos predictivos no son perfectos, pero suelen ser muy útiles. No pueden resolver cualquier tipo de tarea y dependen del contexto que se les brinde, por eso la intervención humana del científico de datos y los expertos en el dominio del problema siguen siendo fundamentales.
¿Qué técnicas se utilizan para desarrollarlos?
Podemos crear modelos predictivos con machine learning (aprendizaje automático) para aprender de la experiencia (datos históricos) o también podemos usar inteligencia artificial, que aunque técnicamente incluya al machine learning, en general se la conecta con el concepto deep learning o aprendizaje profundo.
La diferencia entre deep learning y machine learning es que el deep learning se parece más al aprendizaje humano por su funcionamiento como neuronas, también conocida como redes neuronales artificiales.
Se llama profundo porque usa diferentes niveles de detalle de los datos, por ejemplo para reconocer imágenes extrae bordes que después combina para detectar contornos y así aprender conceptos más complejos de la información. Reconocimiento de imágenes, traducción automática de textos y reconocimiento de voz, son algunos usos que se destacan.
Le preguntamos a Fredi Vivas, como experto en el mundo de los datos en general, que aplicaciones según su opinión pueden tener los modelos predictivos en el fútbol en particular. Las respuestas del CEO de Rocking Data entusiasman, porque muchas de ellas, como veremos más adelante, ya son una realidad en la industria del fútbol:
Un uso posible es realizar modelos que permitan a los directivos de los clubes comprender y formular estrategias para ganar partidos. estos modelos se basan en numerosos factores involucrados en el juego, como resultados de partidos históricos, indicadores de rendimiento de los jugadores y toda la información disponible sobre los rivales.
Aplicando una red neuronal artificial identificamos las fuentes de datos, los medios apropiados de evaluación del modelo y los desafíos específicos para predecir los resultados deportivos. Esto puede llevar a proponer un nuevo marco de predicción deportiva a través del cual el machine learning puede utilizarse como estrategia de aprendizaje.
También podría utilizarse Machine learning para mejorar el juego de ataque: Es una práctica común entre los entrenadores y analistas buscar indicadores clave de rendimiento relacionados con el juego de ataque en el fútbol. El análisis de partidos en el fútbol profesional suele usar un resumen estadístico de eventos basado en imágenes de video, para estudiar el partido y preparar a los equipos para la competencia.
Usando aprendizaje automático podemos detectar patrones significativos basados en datos posicionales. Para mejorar el conocimiento y el rendimiento tácticos.
Estas posibilidades de que describe Vivas, son la base del foco de empresas como Olocip, que con extensos equipos de investigadores han desarrollado algoritmos propios para entender y predecir el desarrollo de los futbolistas y los equipos
Además, Vivas sugiere otras dos variantes de aplicaciones de IA en el fútbol, la primera de ellas cercana a los desarrollos de empresas como SkillCorner, Métrica Sports o Signality cuya modalidad para la captura de datos es candidata a generar una revolución en la disponibilidad de la información de la industria en el mediano plazo. La segunda, tiene muchas similitudes core de negocios de múltiples startups que han surgido en los últimos años enfocadas en el data-scouting
- Usar computer vision (inteligencia artificial visual) y deep learning para ayudar a medir el rendimiento con bajo costo y rápido: El objetivo es reemplazar el análisis de rendimiento actual utilizado en los jugadores, que es un proceso que consume mucho tiempo, con lecturas de video ilimitadas de los jugadores y evaluar su rendimiento para obtener información sobre eventos en el juego. Por ejemplo, detectar posturas corporales y en extremidades, usar deep learning para aprender patrones ocultos y extraer características distintivas de una gran cantidad de datos, como miles de grabaciones de partidos, que consisten en múltiples equipos, con movimientos como correr, caminar o patear. También se puede hacer seguimiento de esta manera a las estadísticas de rendimiento individuales, geolocalizado a cada jugador en el terreno de juego en relación con el otro, permitiendo mejorar la coordinación entre ellos como equipo. Teniendo las coordenadas exactas de cada uno de los jugadores (podría ser en en tiempo real) podrían generarse mapas de calor para analizar la inteligencia posicional de los jugadores.
- Algoritmos de machine learning para mejorar el reclutamiento de jugadores: Estudiar el seguimiento de jugadores basándose en sus métricas físicas, puede ayudar en el reclutamiento de jugadores para cualquier club en cualquier liga, no sólo limitado a confiar en las estadísticas del jugador, sino también en su adaptabilidad en la liga correspondiente.
Entregar la información segmentada para por ejemplo analizar posesión de pelota, identificar pases profundos, manejo de situaciones de alta presión, como se integra a una circuito de pases, etc.
Es una poderosa herramienta para tomar decisiones rápidas y basadas en datos.
Por ejemplo se pueden comparar las estadísticas de un jugador con los delanteros existentes del club que llega, los ex delanteros de la liga y los delanteros de la liga entrante. Esto puede dar una idea de si el jugador entrante podrá adaptarse a la liga y mantener sus estadísticas.
Inteligencia artificial aplicada al fútbol: el caso de Olocip
Liderados por el ex futbolista del Real Madrid, Esteban Granero, la empresa española es pionera en el desarrollo de modelos predictivos en el fútbol. Compuesta por un equipo de profesionales provenientes de diferentes disciplinas de la inteligencia artificial y con gran trayectoria académica, la compañía no le ha esquivado a la responsabilidad de ser una de las caras visibles al hablar de predictibilidad en el fútbol, algo que, siempre ha sido el caballito de batalla de un sector de la prensa y los fanáticos que se aferran principalmente a lo cambiante que pueden ser los resultados.
“Todo, tanto en fútbol como en cualquier ámbito, es previsible en mayor o menor medida. Los humanos medimos nuestra inteligencia en función de la capacidad de prever acontecimientos, de anticiparnos. La inteligencia artificial viene a potenciar enormemente este proceso”. Nos dice Asier Rodríguez, Lead Data Scientist en Olocip.y mientras que el propio Esteban Granero el que completa la idea: “En el fútbol lo que hay es una incertidumbre sobre lo que va a suceder, esa incertidumbre puede ser muy grande o muy pequeña. Esta claro que no existe una bola de cristal que nos diga lo que va a pasar, pero sí puedes tener, de forma probabilística, información sobre el futuro para poder tomar decisiones con menos incertidumbre. El fútbol es un problema azaroso y estocástico por naturaleza, pero esa aleatoriedad a la hora de tomar una decisión, no da igual si es del 10% que si es del 80%, y para minimizar ese efecto la inteligencia artificial es lo único que sirve y a eso se dedica Olocip.”
La idea de que cualquier ámbito es más o menos predecible, cobra mayor sentido sabiendo que la empresa, en una muestra de capacidad de adaptación al contexto durante la pandemia COVID-19, puso a parte de su equipo de investigadores a desarrollar modelos epidemiológicos, y los resultados de esta investigación la ubican como una de las compañías que mejor predijo la curva de contagios en España.
La salud de los jugadores siempre fue uno de los focos del trabajo de Olocip, cuyos modelos aportan, entre otras cosas, a la prevención de lesiones.
¿Mostrar aplicaciones en otros sectores es parte de la estrategia de Olocip?
Asier Rodríguez: Sí, porque la mayoría de problemas son análogos y la temprana implantación en otros sectores convierte la IA en algo más accesible o cotidiano. a todos nos parece natural hoy en día que el teléfono reconozca patrones en nuestra cara y decida con acierto si desbloquearse o no, por ejemplo
Como sabemos, no todas las competencias alrededor del mundo tienen el mismo nivel de cobertura en cuanto a datos, existen diferentes tiers de acuerdo al nivel de detalle del eventing. Además, los datos de tracking no suelen estar disponibles por fuera de las top 5 ligas europeas y la MLS.
En redes sociales abundan cuentas donde se extrapolan de resultados entre ligas cuya competitividad es dispar, la diferencia entre esos análisis básicos copypasteados de proveedores como wyscout o instat y lo que hacen empresas profesionales se fundamentan en la capacidad de estas últimas de procesar la información y darle consistencia a la base de datos.

El input de datos sobre el cual montan sus modelos ¿Afecta la calidad de los mismos? ¿Hay algún tipo de ajuste en sus desarrollos teniendo en cuenta si trabajan con ligas cuyo nivel de cobertura del proveedor de datos es menor?
Sí afecta la calidad. El preprocesamiento de los datos es una de las fases fundamentales dentro de nuestros proyectos. Los datos nunca son perfectos, existiendo tanto errores humanos (anotación, percepción subjetiva) como errores informáticos (formato incorrecto, errores en hardware, etc)
Si estos errores no son subsanados, se arrastrarán hasta la predicción, obteniendo conclusiones erróneas por arrastrar desde el inicio estas incoherencias.
El ajuste se realiza particularmente para cada conjunto de datos, hasta poder asegurar que la información de entrada de nuestros modelos es correcta.
Mencionaba Fredi Vivas al comienzo de esta nota, la posibilidad de aplicar redes neuronales para desarrollos en fútbol. Las redes neuronales son, entre otras cosas, una de las variantes más complejas de los diferentes algoritmos de predicción que se utilizan habitualmente. Las regresiones, en cambio, aparecen entre las más simples. En el medio hay una amplia gama de posibilidades que suelen ser utilizadas de manera particular en cada desarrollo, veamos como trabaja Olocip este punto:
Sin revelar el algoritmo, ¿Utilizan algún tipo de modelo predictivo clásico (regresiones, random forest, etc) en sus modelos o son desarrollos 100% ad hoc?
No empleamos únicamente un tipo de modelo. Empleamos tanto modelos predictivos «clásicos» como desarrollos propios. No existe ningún tipo de modelo que sea capaz de resolver todos los problemas, lo más importante a la hora de abordar proyectos de machine learning es el diseño del problema. Para cada uno planteamos cuál es la forma idónea de solucionarlo.
La predicción no se resume a los resultados
Uno de los puntos claves para entender los modelos predictivos en el fútbol, es que no se desarrollan exclusivamente para predecir resultados, por el contrario ponen el foco en la predicción del rendimiento.
Esto es importante de recalcar, porque sería prácticamente pegarse un tiro en la pie para toda la industria de los datos en el fútbol, poner el foco en una variable tan volátil como el score final del partido.
En esa línea Asier desarrolla: Los mejores resultados del trabajo con modelos predictivos se ven a nivel de rendimiento. La clave siempre está en encontrar donde la IA puede ser más efectiva solucionando problemas diarios de los clubs. En ese sentido creemos que nuestros mayores aportes están en cuanto a la contextualizacion del rendimiento, la valoración objetiva del mismo y la prevención de lesiones.

¿Más allá del uso para predecir el nivel de posibles transferencias, creen que es una herramienta que los equipos trabajaran en el corto plazo para preparar el partido, prediciendo el rendimiento de equipos rivales?
Sin duda, es algo que tenemos implementado, una pizarra interactiva donde podamos preguntar qué comportamiento tendrá el rival el domingo próximo en diferentes circunstancias y podamos reducir incertidumbre sobre el mismo
A nivel técnico y metodológico, los modelos desarrollados en el análisis predictivo de rendimiento son aplicables a la predicción de comportamientos ante rivales específicos. Los modelos transparentes de IA permiten predecir el comportamiento de jugadores y equipos dependiendo del contexto. siendo posible cuantificar, cualificar y analizar cualquier situación y evento, incluso no habiendo sucedido previamente. Es una realidad.
Actualmente, las entidades deportivas se apoyan en diferentes herramientas de análisis y preparación de partidos basadas en datos pasados y escenarios descontextualizados.
Darle la espalda a la información, conocimiento de mayor capacidad analítica y rigurosidad supondrá perder una ventaja competitiva que penalizará en el medio y largo plazo.

La calificación del jugador basada en modelos predictivos (y que hace que un modelo sea bueno)
Anteriormente en Big Data Sports, señalamos que los principales desarrollos en cuanto a indicadores nuevos para medir el rendimiento de los futbolistas, giran en torno a la idea de cuanto aporta cada una de las acciones que realizan a que su equipo genere situaciones de riesgo y/o evite que su rival las haga.
En la valoración desarrollada por Olocip, la diferencia en la probabilidad de gol de su equipo y del equipo rival antes y después de que el jugador realice la acción, es la que puntúa las mismas de manera favorable o desfavorable.
Es decir, para cada acción del partido el modelo le asigna un valor en función de cómo afecta a la probabilidad de gol de ambos equipos. Tiene en cuenta todo lo que ha sucedido a lo largo de la jugada hasta llegar a esa acción. Se puntúan entre otras cosas pases, robos, despejes, tiros, conducciones, regates t goles, todas estas agrupadas variables ofensivas, defensivas, de construcción de juego y portero.
Al igual que sucede con los modelos predictivos de estas industrias, aquí Olocip ha entrenado el modelo a partir de millones de jugadas recolectadas a lo largo de los años, pudiendo de esta manera reconocer objetivamente cuando la acción del jugador aporta y cuando resta a la concreción de los objetivos del equipo.
Esto se traduce en una valoración objetiva del jugador que difiere de la metodología tradicional donde el periodista que cubre el juego termina calificando subjetivamente el rendimiento con un puntaje de 1 a 10.
Sergio Luengo, PHD en Inteligencia Artificial y otro de los científicos de datos de Olocip, pone el foco en las definiciones metodológicas de la empresa para este tipo de desarrollos: Para que un modelo de puntuación sea realmente útil, debe de ser capaz de poder generalizarse a jugadas que no ha visto con anterioridad. En Olocip mantenemos dos conjuntos de datos distintos al que se ha utilizado para entrenar el modelo, para asegurar la capacidad de generalización del mismo en situaciones futuras.
Desarrollamos un modelo más completo, qye toma en cuenta una mayor cantidad de acciones que otros desarrollados por la industria. Además, se adapta de manera automática a jugadas de longitud variable y tiene en cuenta el contexto completo de la jugada desde su inicio, algo que no sucede en otros desarrollos cuya predictibilidad se asocia a un número menor de acciones previas.
Adicionalmente, nuestro modelo contextualiza el valor de las acciones al estilo de juego de cada liga, lo que permite una puntuación de las acciones acorde con las competencias. Incluso, es el propio modelo que aprende automáticamente el estilo de juego por lo que se va ajustando y mejorando continuamente.
Volveremos con más detalles sobre los modelos de puntuación y valoración de jugadores en las próximas semanas, ya que se trata de último gran avance dentro del mundo de los datos aplicados al fútbol.
¿Estamos preparados para asumir que el fútbol es predecible?
Desarrollos de empresas como Olocip que se han probado tanto en el ámbito académico como en el mercado, dan cuenta que las posibilidades de realizar predicciones en el fútbol ya son una realidad.
Sin embargo, todavía existen diferentes agentes inhibidores que impiden su expansión a mayor escala, básicamente porque un sector de la industria del fútbol no termina de estar convencido de las posibilidades de este tipo de desarrollo.
Para profundizar en esta problemática hablamos con Pablo Sarinelli, uno de los grandes responsables del desarrollo de la industria de los datos en el fútbol argentino en particular y latinoamericano en general. Sarinelli, que actualmente trabaja como consultor independiente, fue Director Comercial de STATS LLC para la región y previamente había tenido roles similares en PlayFE y Prozone. En consecuencia, estamos ante una de las personas que más horas ha estado interactuando con entrenadores y dirigentes de Sudamérica acerca del uso de herramientas tecnológicas en el fútbol
¿Pensás que el fútbol se volvió más predecible en estos últimos años? ¿Crecieron las diferencias entre equipos o es una cuestión relacionada con la cantidad de datos disponibles? ¿En qué aspectos (resultados, rendimientos, etc) crees que el fútbol tiene características más predecibles?
No, no creo que se haya vuelto más predecible. Definitivamente existen más herramientas para analizar e interpretar lo que sucede y lo que está por suceder. Creo que lo que cambió, al menos en el ámbito profesional y en los entornos en los que se le da lugar a la gente capacitada, es que se analiza más allá del resultado. El aspecto de previsibilidad está más conectado a analizar a un jugador o a un equipo más allá de una buena o de una mala racha. Hace muchos años si un DT sostenía a un delantero tras varios partidos sin convertir, la explicación era intuitiva. Hoy, se valora y se mide mucho más el aporte de ese mismo delantero en otras facetas del juego; su intensidad en el trabajo defensivo, su ocupación de espacios. Incluso las estadísticas de goles esperados se utilizan para intentar anticipar si su mala racha es cuestión de tiempo o es apunta a sostenerse. Eso es lo que se intenta, más que predecir, estudiar y analizar.
Estás en relación permanente con entrenadores y dirigentes de distintos lugares del mundo, desde tu percepción ¿Crees que están dadas las condiciones para que la aplicación de modelos predictivos influya en la toma de decisiones, tanto a nivel dirigencial como en el juego? De no ser así ¿Qué pensás que estaría faltando para terminar de convencer a un mayor número de tomadores de decisiones?
Definitivamente sí a nivel dirigencial y en decisiones a mediano y a largo plazo. Todavía creo que queda un largo recorrido para que los modelos predictivos inciden en aspectos más cortoplacistas como el desarrollo de un partido.
Lo que falta es tiempo. El fútbol dio un paso trascendental al admitir el valor de personas formadas en otras disciplinas y sin necesariamente un historial dentro del campo de juego. Aún así, ese proceso debe madurar por dos factores: primero para que esas personas tengan cada vez más peso en las decisiones relevantes; y segundo, para que esta tendencia se expanda a países todavía más reacios.
Las predictibilidad puede solucionar problemas recurrentes del fútbol
Procesos inestables, modificaciones sensibles en los planteles, movimientos dirigenciales e incluso reestructuración de campeonatos enteros: una industria altamente volátil como el fútbol no debería temerle a la predictibilidad sino utilizarla a su favor.
El componente azaroso del fútbol va a estar presente en cada uno de los partidos que se juegue a lo largo de la historia, pero en una industria que habla de apostar a los procesos como sinónimo de seriedad en la toma de decisiones dirigenciales, no vendría mal sumar herramientas que tengan como foco el mediano y largo plazo por sobre las vicisitudes de los partidos del fin de semana.
Del otro lado, jugadores, prensa y fanáticos debemos incorporar la idea de analizar rendimientos a partir de tendencias y no de actuaciones particulares. Ese solo (y costoso) movimiento conceptual se traducirá en fanáticos más pacientes, propiciando las condiciones necesarias para el desarrollo de políticas a más largo plazo.
Las herramientas para un fútbol mejor existen, el futuro ya llegó, ahora la cuestión es ver qué hacemos con eso.
Follow Me