De una y mil maneras se dijo que los datos venían a cambiar el modo de ver y entender el fútbol: además de procesarlos y visualizarlos, los analistas nos vimos obligados a contar la historia de los datos. A detallar y debatir sobre los métodos de captura, y a dar cuenta una y otra vez de las distintas posibilidades de su aplicación. Hasta tuvimos que aclarar que “Moneyball” es sólo una historia de origen de las múltiples posibles para contar la utilidad del big data en el deporte.
Mientras todo eso sucedía, la industria a paso lento pero firme fue incorporando el uso de datos a su ecosistema, y las preocupaciones de la comunidad de analytics pasaron del reclamo por oportunidades a la necesidad de presentar resultados a la altura de las expectativas.
Casos de éxito como el trabajo de Ian Graham, analista del Liverpool que sugirió la contratación de Jurgen Klopp, y el surgimiento de empresas de datascouting cuya intervención en el mercado generó beneficios económicos y futbolísticos a varios clubes, pueden citarse para entender cómo el análisis de datos pasó de ser un servicio potencialmente útil a una realidad concreta. Un negocio en sí mismo que a su vez influye fuertemente en otro de mayor escala.
Entendámoslo, siempre existieron los especialistas, pero estamos ante un fenómeno de otra escala. En Argentina hace años que contamos con Miguel Simón complementando sus relatos en ESPN con información cuantitativa. La novedad es que muchos de sus colegas han incorporado, casi naturalmente, la metodología. Y no es un fenómeno de la prensa, aún en Latinoamérica donde el acceso a los datos de juego es más limitado: es común que los cuerpos técnicos cuenten con reportes de proveedores o generados por las propias competencias.
El escenario cambió para todos los actores de la industria del fútbol, pero fundamentalmente para los analistas, al menos si queremos que el área crezca sostenidamente en los próximos años debe aprovecharse el momento histórico donde desde la propia FIFA asumen que el dato es el nuevo petróleo del fútbol.
Para eso, hay al menos cuatro misiones con objetivos actualizados que cumplir:
- Entender que podemos hacer para terminar de convencer al grupo marginal reticente al uso de datos, incluyendo un mea culpa acerca de los modos en que presentamos la información.
- Consolidar el feedback con entrenadores, ya que desde las inquietudes de los cuerpos técnicos provengan las ideas para generar indicadores más profundos y útiles.
- Divulgar de modo didáctico los nuevos hallazgos y las nuevas métricas, para que estas puedan incorporarse al uso cotidiano, tal como sucedió con los goles esperados (xG) que ya pueden verse en transmisiones, reportes de competencias oficiales e incluso en los videojuegos.
- Profesionalizar el oficio de los analistas evitando el accionar de quienes intentan precarizar o minimizar nuestros aportes.
El rol clave de los analistas para el cierre de la grieta
Pensémoslo de esta manera: sabiendo que puede haber adaptaciones o réplicas a menor escala, en ninguna industria se plantearían dejar completamente de lado los recursos y las metodologías de quienes lideran el rubro. Entonces si Barcelona, Bayern Munich y Liverpool hace años que establecieron y desarrollaron departamentos de análisis de datos… ¿Por qué una parte de los protagonistas de la industria del fútbol insiste con omitir su utilización?
Puertas adentro los analistas deben hacerse cargo de su parte. En ocasiones se generan análisis que pecan de pretenciosos, donde la complejización y el excesivo nivel de detalle le quitan practicidad a las ideas que los generaron. Ideas valiosas terminan muriendo en un círculo endogámico de githubs y visualizaciones que no beneficia a nadie.
En otras, en cambio, la barrera viene de protagonistas ajenos a la comunidad de análisis. En esas línea, dos visiones inexactas funcionan de base para la reticencia al uso de datos en el fútbol: por un lado, existe cierto atraso entre las posibilidades que brindan las métricas y las estadísticas disponibles en la actualidad y el conocimiento de estas por parte de los formadores de opinión, el update respecto de la foto de los datos disponibles una década atrás se impone por múltiples motivos pero fundamentalmente por el crecimiento exponencial de la industria de analytics tanto en cantidad como en profundidad de la información ofrecida en estos años.
La segunda cuestión es una consecuencia de la primera, en las transmisiones los periodistas suelen verse en la obligación de presentar los mismos indicadores una y otra vez en todos los partidos. Ese default no tiene sentido en los datos del mismo modo que no lo tendría si el comentarista repitiera los mismos conceptos en el entretiempo de cada encuentro que le toca analizar. Para peor, la selección de esos indicadores muchas veces es, al menos, particular: el siempre descontextualizado dato de la posesión, la cantidad de tarjetas amarillas, las faltas y el número de pases. Una combinación complicada para traducir emergentes interesante, incluso para los analistas de mayor experiencia con datos.
La solución no esconde fórmulas mágicas. Hay que reemplazar procesamientos predefinidos por análisis particulares, contratando o formando especialistas que puedan sacarle mayor provecho a los datos.
Un problema análogo se da al interior de los cuerpos técnicos, que reciben informes plenos de datos antes y después de los partidos. Generalmente llegan en formatos estandarizados internacionalmente por las empresas proveedoras o localmente por las ligas y competencias encargadas de procesarlos.
Esta estandarización es quizás inevitable: un servicio ad hoc ajustado a las necesidades de cada club suele estar disponible, pero tiene otro costo. La alternativa es la inclusión de analistas de datos propios dentro de los cuerpos técnicos, que sean capaces de reprocesar la información que viene por default y ajustarla a las necesidades específicas del equipo y a las ideas del entrenador. El arribo de esta figura a la composición de los CT es inminente, sea por la inclusión de un data analyst puro o por la adaptación al trabajo con información cuantitativa de los ya consolidados video-analistas. No es casualidad que hayan proliferado instancias de formación para este perfil específico, incluyendo espacios en la propia escuela de entrenadores en Argentina (ATFA) y los masters ofrecidos por la UCAM española.
El hecho de que el dato siempre vuelve al analista abre múltiples posibilidades, desde el cruce de variables con los datos provenientes de los GPS hasta la creación de series históricas propias. El límite está en la imaginación y la capacidad del que los procesa, y en sola comunidad de analytics futboleros ha dado muestras de poder desarrollar ideas complejas y renovadoras.
Resolución de problemas futboleros clásicos: la clave en las nuevas métricas
La mayoría de los proveedores de datos surgieron originalmente para brindar información a los medios de comunicación. En consecuencia, las estadísticas generadas inicialmente tienen un foco en datos más singulares que profundos y más históricos que actuales.
Poco a poco, los datos pasaron a ser tan o más importantes que en los medios en los despachos dirigenciales y en las oficinas de los entrenadores. La información que se genera actualmente ya no cumple el rol de complemento en transmisiones, sino que se trata de estadísticas centrales para la preparación de los partidos.
Haciendo gala de una imaginación y capacidad técnica inéditas, pero con el foco en resolver problemas clásicos del análisis del fútbol, analistas de todo el mundo trabajan en distintas líneas que van desde la medición precisas del aporte de cada futbolista a la generación de peligro en el área rival a la formalización de la performance defensiva respecto a la toma de marcas predefinidas por un entrenador.
El Expected Threat (xT) presentado hace un par de años por Karun Singh de la Universidad de Cornell hace justicia con los jugadores que intervienen poco, pero de manera determinante. Un auténtico acto de justicia para futbolistas como Mesut Özil o Juan Román Riquelme cuyas habilidades históricamente no se reflejaban en las planillas, que recuerda lo que sucedió años atrás cuando la NBA incluyó estadísticas avanzadas que permitieron dimensionar el aporte de jugadores de equipo como Manu Ginóbili o Chapu Nocioni.
La métrica de Singh, que puntúa cada una de las acciones ofensivas con el balón para dimensionar el aporte de cada futbolista a la generación de peligro en el arco rival, parecía que iba camino a establecerse como una referencia única. Sin embargo, enseguida le surgió una métrica alternativa conocida como VAEP y desarrollada por el equipo de SciSports, una empresa con base en Bélgica y los Países Bajos.
Muy resumidamente, el VAEP mide la posibilidad de que un equipo convierta en las siguientes diez acciones. Para ello y a diferencia del xT, considera en su modelo además de eventos de la fase ofensiva, lo que pueden aportar acciones defensivas como recuperaciones o intercepciones, evaluando en cada caso los riesgos asociados en relación con anotar o que te anoten un tanto, de cada uno de ellos.
En una línea diferente, Javier Buldú y su equipo han llevado al siguiente nivel el uso de la ciencia de las redes para analizar el fútbol. Si históricamente los vínculos generados por los pases explicaban unas cuantas características del juego de un equipo, aquí lo que se propone es aplicar la metodología para profundizar sobre otros grupos de relaciones que se dan en el campo de juego, como las zonas de traslado de la pelota o el vínculo de marcaje entre defensores propios y delanteros rivales.
El uso de modelos predictivos para scouting y la propia discusión sobre la previsibilidad del fútbol, cuya dinámica no sería tan impensada como solíamos creer, son otros temas en boga en estos días dentro del mundo de los datos y el fútbol.
Estos desarrollos que entusiasman y marcan una línea a profundizar, son posibles dado que la recepción y demanda por datos e indicadores se ha naturalizado y va en aumento. Sin embargo, a la par que los analistas incrementan su influencia en la industria del fútbol hay cuestiones claves que deben resolverse en el corto plazo.
Datos abiertos en el camino a la profesionalización de los analistas
Disponible hace más de un año, Football Reference (www.fbref.com) es una plataforma con información de las principales ligas del mundo. La particularidad es que además de datos clásicos de competencias de todo el mundo, incluye estadísticas avanzadas para las cinco ligas europeas principales provistas directamente por Statsbomb.
Liderados por Ted Knutson, StatsBomb es una empresa proveedora de datos de origen inglés, que juega un papel particular dentro de la industria: abarca menos competencias que sus competidores principales (STATS Perform, Wyscout e Instat) pero captura una mayor cantidad de eventos de juego, además de desarrollar espacios propios de formación para analistas de datos.
En ese sentido, poner a disposición datos de las ligas principales, de manera recurrente y de muy fácil acceso, ha sido una movida importante para el desarrollo de la comunidad de análisis. No sólo por los datos en sí, sino porqué esto hizo que otras empresas hicieran lo propio poniendo datasets a disposición de manera libre y gratuita. Recuerden que comprar datos no es algo precisamente accesible para un analista de a pie, o incluso para clubes y competencias de segundo y tercer orden.
En la misma línea y aprovechando la cuarentena, David Sumpter, que trabaja en el Hammarby sueco (propiedad de Zlatan Ibrahimovich) y es un gran divulgador matemático en la línea del periodista Adrián Paenza, reclutó a algunos de los analistas de los clubes más importantes del mundo y armó un espacio de formación colectivo bajo el nombre de “Amigos del Tracking”.
A costo cero se pudo asistir a charlas por Youtube de auténticos referentes de la industria, a la par que se consolidaron los intercambios de información y de trabajos en el canal de Discord de los seguidores de la iniciativa. La frutilla del postre fue un curso abierto de aplicación de modelos matemáticos en el fútbol avalado por la Universidad de Uppsala y liderado por el propio Sumpter, del cual clases y materiales se encuentran aún a disposición.
Probablemente influidos por esta última iniciativa, y advirtiendo que si bien había datos del eventing (acciones del juego) disponibles, pero no así de tracking, Métrica Sports puso a disposición sets de datos propios que funcionaron como base para la ejercitación y el desarrollo de algunas de las ideas presentadas en “Friends of Tracking”.
Los datos de tracking son particularmente importantes porque amplían exponencialmente las posibilidades de análisis en el fútbol. Registrando el posicionamiento de los jugadores y la pelota a lo largo de todo el partido, añaden contexto y especificidad a cada acción de juego.
Para completar el combo, la empresa creada en Países Bajos que cuenta con dos argentinos entre sus tres fundadores lanzó recientemente una versión gratuita de su software de video-análisis.
Acciones que democratizan el acceso a la información y que van en línea con las ideas de su CTO, Bruno Dagnino, que en una reciente entrevista nos decía: “En los próximos cinco va a quedar bien en claro, especialmente por el trabajo de los equipos de élite, la importancia del uso de datos en el fútbol. En ese tiempo tenemos que desarrollar maneras más económicas de establecer áreas de ciencia de datos en clubes y ligas, para que los equipos de otras regiones y competencias no estén limitados.”
El escenario es dispar, por un lado, los equipos de primer nivel destinan altas sumas de dinero para sostener equipos de ciencia de datos con estructuras que difícilmente puedan reproducirse fuera de la élite.
Por otro lado, los clubes que no están en condiciones o no tienen la intención de generar estos espacios, se aprovechan de la masa de analistas que trabaja gratuitamente con tal de formar parte de la industria.
Este punto es importante: en tanto no podamos construir condiciones sustentables para el desarrollo de las áreas de datos, la tendencia a los extremos (elite-gratuidad) va en contra la profesionalización del oficio.
En este escenario se imponen dos cosas:
- la necesidad de buscar fuentes secundarias de financiamiento, donde quizá tengan un rol clave las grandes marcas que sponsorizan el fútbol.
- que los analistas no entremos en la lógica del trabajo ad honorem y logremos desentramar este punto lo antes posible. evitando desde el vamos la “legitimación” de la precarización laboral que sufre el periodismo deportivo y muchos otros oficios dentro de la industria del fútbol.
Se podrá argumentar que es inevitable en el mundo de los analytics, tener que mostrar públicamente el trabajo realizado. Un porfolio de notas, informes, código y visualizaciones es una práctica habitual para conseguir trabajo en esta industria pero la única, la clave pasa por enfatizar, desde la propia formación de los analistas, en el manejo de la delgada línea entre el preview presentando lo que se puede hacer y el trabajo gratuito.
Consistente, Dagnino práctica lo que predica y en los últimos días unió fuerzas con Dan Altman, quien está detrás del desarrollo de smarterscout y ha trabajado con los principales clubes del mundo, para señalar el sinsentido que supone que FC Nordsjælland danés, clasificado a la actual Champions League y cuyo dueño dispone de una fortuna cercana al billón de dólares, reclute video-scouters dispuestos a trabajar ad honorem.
Créanme: contar con el apoyo de referentes de la industria en este apartado es un auténtico alivio tanto para los que formamos como para los que aspiren a desarrollarse profesionalmente en el mundo de los analytics en el fútbol.
Descarga la versión en PDF de este artículo en el link de abajo.
Follow Me