Big Data Sports

Bruno Dagnino : «Métrica Sports no tiene el foco en los datos para ligas y medios, sino para los clubes»

Fundada hace siete años en Amsterdam, Métrica Sports es una de las empresas que más creció en los años dentro de la industria del fútbol. Originalmente concentrados en simplificar los procesos de video análisis y con los principales clubes del mundo como clientes, sus servicios también incluyen el desarrollo de algoritmos para la captura de tracking a través del video.

Hablamos con Bruno Dagnino, CTO de la compañía y referencia dentro de la comunidad de analytics en el fútbol, para repasar el presente y reflexionar acerca del futuro del uso de datos en la industria del deporte más importante de todos.

Métrica Sports: Video análisis + datos de tracking

De los medios a los clubes: los nuevos desafíos para los analistas

En el mundo del fútbol existen dos grandes tipos de datos. Los más habituales son los eventos, que reflejan acciones de juego como remates, pases, faltas y todas aquellas que estamos habituados a ver en las transmisiones y leer en los informes. Con excepciones, estos datos son capturados con procesos mayormente manuales y a través de analistas viendo el partido.

El otro gran grupo lo conforman los datos de tracking, que miden la posición a cada instante de jugadores y pelota, permitiendo no solamente generar datos físicos, tales como distancias recorridas y la velocidad de los sprints, sino también contextualizar los eventos, permitiendo explicar la dificultad de los pases o la oposición a un remate. Históricamente la obtención de datos de tracking dependía de la instalación de una serie de tres cámaras en los estadios que capturaban la información, en el último tiempo los desarrollos en aprendizaje automático permiten hacer la captura a través del video, simplificando la toma de datos y bajando los costos.

Están entre los pioneros en desarrollos para la obtención de datos de tracking, junto a empresas como Signality y Skillcorner, pero a diferencia de estas tienen su propia herramienta para video-análisis ¿Cuál dirías que es el foco de Métrica Sports?

Métrica Sports es una empresa que tiene un poco de cada una de las fases de análisis en el fútbol. Analizado desde la industria hacia Métrica, históricamente hubo dos grandes; por un lado empresas de generación masiva de datos de eventos, como fue Opta en su momento, y por otro, compañías como Prozone, SportsVU (que ahora son todas de STATS Perform) y ChyronHego que entregaban datos de tracking clubes y ligas específicas. A ese grupo también le podrías sumar Sportlogiq y Second Spectrum.

Algo que tienen en común STATS Perform y estas empresas, por lo menos desde mi punto de vista, es que tienen más puesto el foco en las ligas y en los medios que en los clubes. Si te fijas, lo que le ofrecen estas empresas a las ligas generalmente están más enfocados en que pueden hacer los medios con los datos que en los clubes mismos. Desde Métrica Sports, en cambio, nuestro foco esta puesto más en los clubes que en las ligas y en la prensa.
Básicamente lo que hacemos es tomar tecnologías similares a las que, por ejemplo, desarrollan Second Spectrum y Sportlogiq para poder capturar el tracking desde cualquier cámara. A diferencia de esas compañías, que buscan capturar la mayor cantidad de partidos posibles y trabajar con un número amplio de competiciones nosotros nos enfocamos en los clubes.

Históricamente trabajamos para clubes de élite de las ligas más importante del mundo, en este momento lo que nos interesa es encontrar el modo de poder llevar esas soluciones a equipos de distintos niveles y en distintas regiones.

¿La clase de desarrollo que generan compañias como Métrica no terminan siendo muy costosas para clubes que no son de la ligas más importantes?

-Nosotros trabajamos con clubes de cuarta división. Obviamente que no es lo mismo el ascenso inglés que, por poner un ejemplo, el chileno. Los presupuestos cambian muchísimo de un país a otro. Pero si miras nuestra oferta la licencia más baja esta en 1500 euros por año y de hecho hemos lanzado recientemente una versión gratuita de nuestro software de videoanálisis Métrica Play. Es un programa donde podes etiquetar, editar jugadas, visualizar y exportar datos todo dentro el mismo workflow, algo que difícilmente se encuentre en otra herramienta del mercado.

El tracking de video como herramienta para la democratización de la información

Más allá de la apertura de Métrica Play, también pusieron algunos datasets de tracking a disposición de la comunidad, algo similar a lo que hace Statsbomb con datos de eventos….

-Con Statsbomb compartimos el espíritu de hacer cosas que sean útiles, principalmente, para los clubes. Ellos también trabajan con la prensa, pero originalmente empezaron como una empresa enfocada en los datos que necesitan los equipos, contrario a los inicios de Opta que se enfocaban más en los medios.

Fueron los pioneros en abrir datasets de eventos mientras que nosotros somos la primera empresa en abrir datasets de tracking. Además, presentamos el open data Project algo que para mi es fundamental para el momento actual de la industria.

«Si conoces un poco la comunidad de analytics en el fútbol, vas a ver que se compone de gente de perfiles variados pero que tienen en común dedicarle muchísimo tiempo a los análisis que generan. Horas que generalmente vienen de su tiempo libre porque el porcentaje de profesionales es menor»

-Si conoces un poco la comunidad de analytics en el fútbol, vas a ver que se compone de gente de perfiles variados pero que tienen en común dedicarle muchísimo tiempo a los análisis que generan. Horas que generalmente vienen de su tiempo libre porque el porcentaje de profesionales es menor. Sin datos de acceso libre muchas de las cosas que se desarrollan se quedarían en la teoría. Por eso, lo que hizo Statsbomb primero y nosotros después, cambió completamente el escenario. El hecho haya datos de tracking disponibles y que haya datos de eventos, es lo que permite que pueda haber innovación más allá de lo que hacen clubes y empresas.

¿Qué tipo de video necesita el algoritmo de Métrica para obtener datos de tracking?

-Hace un tiempo, SciSports anunció BallJames, el único sistema 100% automático de tracking en el mundo, pero a cambio de una tremenda instalación de cámaras en el estadio que permita que siempre se pueda ver el dorsal del jugador y se automatice la captura. Ese tipo de herramientas tiene costos muy altos, por lo tanto lo pueden instalar pocos equipos y ligas en el mundo. En cambio, nuestro idea y nuestro compromiso es el de desarrollar metodologías que puedan ser usadas por equipos de todos los niveles.

Al querer que nuestra herramienta tenga un alcance masivo nos enfocamos en el tracking de de video pueda hacerse con los videos que tenga disponible el club. Nos podemos adaptar a registros de cámara táctica pero también a filmaciones hechas a través de la cámara 1 (la habitual de la transmisión televisiva). Otra difrencia que tenemos respecto a otros proveedores, es que no estimamos datos (Aclaración: Una practica habitual cuando se toman le tracking de un broadcaster que cambia la cámara de captura durante la transmisión), sino te que trabajamos únicamente sobre lo que esta registrado en el video.

Hay un interés en generar un archivo, aprovechando la posibilidad de tomar datos de partidos de otras épocas a partir del video?

-No, ese quizás sea el approach de Sportlogiq que, como te decía al principio, funciona como un suerte de Opta del tracking, buscando obtener datos de la mayor cantidad de ligas, algo que te sirve para scouting y para vender paquetes de datos. Nosotros no estamos ese enfoque, aunque a veces compramos datos históricos lo hacemos únicamente a pedido de los clientes que trabajamos. No tenemos el negocio de capturar datos masivamente y venderlos, lo nuestro es más un servicio específico para cada club.

¿Crees que ya llegamos al techo del análisis de las acciones del juego sin el tracking? ¿Cómo pensás que influye en el desarrollo del uso de datos el hecho de que en América Latina casi ninguna competencia disponga de datos de tracking?

-Mi área de experiencia no es precisamente la analítica basada únicamente en eventos. Sin embargo no creo que estemos en el techo ni mucho menos. Es difícil que se haya llegado a un límite porque las empresas están capturando acciones o características que antes no se capturaba. Por ejemplo, tanto STATS Perform como Statsbomb están incorporando el número de veces que un futbolista toca la pelota, lo que abre un montón de líneas para nuevos indicadores.

Por otro lado, los clubes se están involucrando cada vez más, generando que los analistas tengan nuevas preguntas para responder. Por ejemplo, en el Opta Pro (Aclaración: el congreso que reúne a la primera línea de la comunidad de análisis en el fútbol) hay dos equipos que presentaron problemas concretos para que los analistas que quieran aplicar a la conferencia tengan que resolverlo si quieren formar parte, es decir ya no depende únicamente de lo que proponga la comunidad academica.

«Es difícil que se haya llegado a un límite porque las empresas están capturando acciones o características que antes no se capturaba. Tanto STATS Perform como Statsbomb están incorporando el número de veces que un futbolista toca la pelota, lo que abre un montón de líneas para nuevos indicadores»

Creo que esa dinámica se va a volver algo habitual, si hasta acá lo que primo fueron desarollos de la comunidad hacia los clubes, ahora la rueda de la interacción entre clubes-comunidad-empresas ha modificado el sistema. En este último tiempo, vemos pedidos desde los cuerpos técnicos a los departamentos de datos que llevan a nuevos y mejores análisis. Los propios departamentos de scouting todavía tienen un camino extenso para recorrer en el área de datos. En consecuencia, e insistiendo con que no es mi área de mayor expertise, creo que todavía hay mucho para desarrollar.

Respecto a América Latina, incluso aunque pudiera estancarse el desarrollo de nuevas métricas por falta de tracking, todavía falta adoptar todo lo que ya esta disponible en cuanto a eventos. Esa es la instancia a desarrollar en América Latina, poder aplicar todo lo que ya existe.

Dos argentinos y un catalán, los fundadores de Métrica Sports

Las formas de ganarse la vida

Hay mucha gente que quiere entrar en la industria del fútbol desde el área de análisis, sea a través del video o el procesamiento de datos. El escenario cambió respecto hace algunos años, donde quizás sabiendo editar videos ya se abrían posibilidades. Ahora, en cambio, se buscan perfiles muy específicos ¿Cuál crees que es el mejor camino para formar parte de esta industria y cómo ves los niveles de especialización en la formación actual?

-Es difícil entender como funciona la formación específica para mi porque puntualmente no es el camino que recorrí. Una cosa que te puedo decir es que la gente hace mucho hincapié en trabajar en los clubes y no pone el foco en trabajar en una empresa del sector y en mi opinión eso es un error.

Obviamente que entiendo que depende de los valores de cada uno, pero sabemos que trabajar en los clubes es algo sacrificado. Generalmente se trabaja los fines de semana, hay mucho stress en la diaria y los sueldos no suelen ser la gran cosa. Hay mucha competencia por esos puestos y una cultura peligrosa de trabajar gratuitamente. Por ejemplo, el hecho de tener que empezar trabajando ad honorem en el academia o en los juveniles ya deja mucha gente valiosa afuera, porque la mayoría necesita un sueldo para poder trabajar.

«Una cosa que te puedo decir es que la gente hace mucho hincapié en trabajar en los clubes y no pone el foco en trabajar en una empresa del sector y en mi opinión eso es un error»

En consecuencia, entrar a trabajar en un club es algo muy arduo, muy sacrificado y muy competitivo. No estoy seguro que mucha de la gente que tiene ganas de entrar a la industria vaya a estar muy contenta una vez que se encuentra realmente viendo de que se trata el día a día del trabajo en el club. Es cierto que tiene algunas ventajas: de alguna manera lo que haces ahí aporta a los resultados del equipo, podés ir a los partidos, incluso podés hasta salir campeón y sentirte parte de ese logro. Pero siempre en un ámbito muy volátil y no bien remunerado. En cambio, trabajar en una empresa tiene reglas más claras, jornadas más estables y probablemente mejores sueldos.

Volviendo a la formación, particularmente si estuviéramos buscando un analista de datos no me preocuparía en que venga directamente del ambiente del fútbol, privilegiaría que sea bueno técnicamente, que haya trabajado en ciencia de datos en alguna otra empresa y que muestre la capacidad de aggionarse a esta industria.

Creo que esa es también la manera en que los principales clubes están contratando a sus analistas. Por ejemplo el departamento de insights de Manchester City tiene varias posiciones abiertas y la experiencia en el sector no aparece como un requisito fundamental. En resumen, si yo quisiera entrar al mundo del fútbol desde este lado, me inclinaría más por mantenerme en un trabajo relacionado con data science, formarme en un sentido general y estar atento a las oportunidades que haya en empresas.

Dicho esto, hay casos de gente que genera un perfil online y eventualmente termina consiguiendo trabajo en clubes o en empresas, pero no es el camino que yo haría. Lo cierto es que es una industria muy grande, diversa y en crecimiento, por lo que hay mil maneras de entrar y no existe una formula única e infalible para hacerlo.

El futuro cercano

Tenés la experiencia de trabajar con los principales clubes europeos y de la MLS, pero también con equipos de otros niveles y otros países ¿Cómo ves en los próximos 10 años el futuro de la industria en América Latina?

-Nuestra visión es que todos los clubes puedan acceder a un mismo tipo de herramientas sin importar el presupuesto que tengas. De alguna manera democratizar el acceso a la tecnología de élite es parte de nuestra estrategia de crecimiento y es lo que nos ha generado clientes en Venezuela, Chile, Ecuador y Brasil. Todavía no en Argentina pero creo que es una cuestión de tiempo.

«A mi manera de ver las cosas en los próximos cinco años va a quedar absolutamente en claro que los datos juegan un papel importante en el fútbol. Esto va a estar liderado por equipos como Barcelona, Liverpool, Seattle Sounders y Toronto que ya disponen de grandes equipos de análisis de datos, al igual que algunas selecciones de primera línea mundial»

-A mi manera de ver las cosas en los próximos cinco años va a quedar absolutamente en claro que los datos juegan un papel importante en el fútbol. Esto va a estar liderado por equipos como Barcelona, Liverpool, Seattle Sounders, Toronto que ya disponen de grandes equipos de análisis de datos, al igual que algunas selecciones de primera linea mundial. Esta consolidación hará que se conozcan en mayor detalle los aportes de sus departamentos de análisis y las ventajas del uso de datos para scouting, entre otras cosas.

Sabiendo que durante los próximos cinco años, asistiremos a un un periodo de consolidación del uso de datos en las grandes ligas del mundo, el problema que hay que resolver es como hacer para que eso baje y llegue a otros lugares sabiendo de las limitaciones presupuestarias que existen. En esa búsqueda de herramientas que sean accesibles a los clubes de menor presupuesto, hay que partir sabiendo que el mayor costo hoy por hoy son los recursos humanos: un departamento de cinco personas en un club de élite tiene un presupuesto de USD600.000 por año solamente en sueldos, a lo que le tenés que sumar el costo por la compra de los datos, las computadoras, los datacenters y una larga lista de otras cuestiones necesarias para funcionar.

Es decir, que hay aprovechar estos primeros cinco años donde se va a terminar de consolidar y entender el aporte de los datos al fútbol, para pensar como hacer que las estructuras sean más baratas. La mentalidad para desarrollarlo va a estar, tenemos que ver como superamos el factor limitante que en este caso es el dinero.

Hace unos años parecía que las ligas, al igual que los derechos de televisión, estaban a punto de oficializar sus datos y establecer una especie de canon por ellos. Hoy en cambio aparecen cada vez más datos disponibles gratuitamente ¿Cómo pensás que va a darse este escenario en el futuro? ¿Las competencias van a proteger el uso de sus datos de alguna manera o van a estar disponibles para todos?

-Va a ser difícil que estén disponibles para todos porque siempre vas a precisar los videos para capturarlos, y sobre las imágenes ya hay derechos establecidos. Si creo que, de acá a diez años, cualquiera va a poder generar datos de tracking o eventos propios a partir de video, de hecho hay gente que lo hace. Es más, es tan grande la cantidad de desarrollos ya existentes que nosotros mismos invertimos más tiempo que dinero para armar nuestros productos, la experiencia nos dice que muchas veces pasa más por encontrar el modo de alinear de manera correcta cosas ya disponibles que por generarlas desde cero.

Seguramente lo que termine pasando es el establecimiento de un área medio gris como de alguna manera ya pasa con el video: cada liga tiene los derechos sobre las imágenes de los partidos, pero podes acceder a Wyscout o InStat y bajarte cualquiera sin que nadie pueda explicar muy bien como llegaron hasta ahí.

Con los datos de eventos, lo que pasó fue que en un primer momento es que empresas como Opta preferían no hacerlos públicos. De hecho cuando Statsbomb puso una parte de los eventos a disposición y cambió el panorama, o hizo de competencias donde no era el proveedor oficial, con lo cual no hubo lugar a intervenciones de la propia liga.

Lo que quiero decir es que. hace unos años, cuando capturamos datos de tracking para la MLS a través de cámaras en el estadio, teníamos que tener la autorización de la liga para comercializarlos. Y solamente se los podíamos vender a los propio clubes participantes (y a nadie más) ya que legalmente eran propiedad de la liga. Hoy por hoy podríamos hacer públicos datos que tomamos desde la tele, no habría ninguna limitación como no la hay para hacer públicos datos de eventos.

En resumen, eventualmente vamos a ver más datos abiertos de ambos tipos aunque no de forma masiva. Y seguramente continúen siendo mayormente enfocados en las competencias más grandes, con lo cual a medida que se precisen datos más particulares su acceso será más difícil

Te invitamos a revisar nuevamente el episodio de Big Data Sports cuanto tuvimos de invitado a Bruno Dagnino

.