En todas las industrias, es apasionante ver cómo la tecnología empuja sus límites y va sorteando las barreras inhibidoras de su aplicación. El fútbol no es la excepción y en la última semana pudimos asistir a la presentación de algunos de los desarrollos actuales más potentes para entender el juego.
El marco lo entregó la Big Data Conference organizada por el recomendado Training Ground Guru, un escenario virtual donde se dieron cita protagonistas relevantes de la industria y pudimos profundizar sobre cuatro ejes que aporta el Big Data en el escenario actual:
- Simplificación en la obtención de la información, que se traduce en una mayor disponibilidad y por ende, la posibilidad de desarrollar mejores análisis.
- Sistematización de la información disponible, que facilita los procesos de búsqueda y permite realizar simulaciones que antes eran propiedad exclusiva de otros deportes.
- Profundización en los detalles, los modelos pueden abarcar acciones de juego sutiles pero importantes de las que antes sólo había percepciones subjetivas
- Nadie queda afuera del ecosistema de datos, métricas e indicadores disponibles para la evaluación y el scouting (también) de los entrenadores.
Coordenadas, contexto y escala
Programadores enfocándose en desarrollos por Internet hace algunas décadas, o gerentes de bancos que pasaron a las filas de alguna fintech, son algunos ejemplos de movimientos que dan cuenta de por dónde pasa las áreas más activas del negocio: una buena práctica para entender los cambios al interior de una industria es seguir la trayectoria profesional de algunos de sus protagonistas.
Paul Neilson es un histórico del mundo de los datos en el fútbol. Fue parte importante en el desarrollo de Prozone, el software de análisis de datos y video pionero que luego pasó a manos de STATS LLC. Más tarde, Neilson se unió a Hudl como Director de Desarrollo de Mercado y fue clave en el proceso de adquisición de Wyscout por parte del gigante ruso.
Actualmente trabaja como consultor para la start-up francesa Skillcorner, una empresa que desarrolla tracking de datos a través del video de las transmisiones y que tuvo en Liverpool inglés una suerte de incubador / validador de sus avances.
El broadcast tracking que propone Skillcorner funciona de manera simple: el registro de la transmisión se procesa con algoritmos de detección de imágenes y aprendizaje automático generando datos de tracking (físicos y de posicionamiento) similares a los de otros métodos de captura.
Las pruebas con encuentros de la Premier League indican que los datos generados por SkillCorner coinciden, en promedio, en un 94.5% con la información oficial de la liga que es generada por el tracking de cámaras en el estadio.
La baja de costos de logística (ya que no requiere instalación alguna) de esta modalidad de captura es una ventaja, pero el principal punto a favor es su consecuencia: desde los registros audiovisuales es enorme cantidad de datos de diferentes ligas que Skillcorner puede recolectar en poco tiempo.
Esta ampliación de la escala de datos es la que permite contextualizar mejor los rendimientos de los jugadores y equipos. La empresa genera análisis detallados que van desde comparativas entre liga hasta la profundización en la performance física de un mismo equipo en diferentes ciclos de entrenadores o de un jugador puntual comparado con otros de su grupo etario.
“Los datos físicos son más objetivos y científicos que los datos tácticos, sin embargo, necesitas una base estadística grande para poder medir el rendimiento de un futbolista en estos aspectos y no es información que esté disponible fácilmente a través de otros métodos de captura” concluye Neilson.
En las comparativas desarrolladas por Skillcorner, puede verse, por ejemplo, algo que todos suponíamos pero no teníamos forma de evidenciar: el Leeds de Bielsa es el equipo más intenso de todo Europa, al menos en cuanto al promedio de distancia recorrida en sprints.
La compañía francesa es consciente que el método de recolección puede generar dudas, puntualmente en el proceso de estimación del posicionamiento de los jugadores cuando la cámara de la transmisión no los esta tomando.
En consecuencia, y más allá del particular detalle que ponen a la hora de explicar sus desarrollos y métodos de validación, la empresa ha abierto datos propios de distintas ligas y los pone a disposición a través de su github para que sea la propia comunidad de analistas las que pueda evaluarlos.
Orden en el caos
Paul Power es otro nombre propio fuerte dentro de la industria. Es quien encabeza el equipo de inteligencia artificial de STATS Perform, al que se le debe algunos de los desarrollos más innovadores dentro del deporte en los últimos años.
Su presentación es desafiante de entrada “El fútbol es un juego caótico, incluso visto desde los datos” dice mientras muestra un clip de un confuso ataque en un Manchester City – QPR de hace algunos años. Para que la idea quede clara, y como no vinimos a ver bloopers de los noventa, Power presenta algo que parece un dibujo de un nene de 6 años estrenando una caja de Sylvapen y en realidad son los movimientos de los jugadores en el campo de juego tomados por el tracking de cámaras.
“Podemos entender lo que pasa dentro del campo por nuestro background de conocimientos sobre el juego. Sabemos cómo se mueve un mediocampista o una línea defensiva, pero necesitábamos llevar ese conocimiento a los datos para poder entender su estructura”
Para hacerlo, el equipo de Paul Power dio vuelta el viejo axioma de que las formaciones tácticas son sólo “números telefónicos” y lo que hizo fue desarrollar algoritmos de machine learning que logren desentramar la estructura detrás de cada uno de ellos. Incluyeron un detalle no menor: la investigación se concentró en las posiciones específicas y no en los jugadores particulares, esquivando los errores eventuales que podrían acarrear las posiciones promedio de estos últimos.
“Cuando tuvo todo el problema con el Derby County, lo vimos a Bielsa explicando su método de trabajo, destinando muchas horas a cada partido y presentando resultados del análisis en papel. Esa manera, que es habitual en muchos entrenadores, consume demasiado tiempo, es muy subjetiva y termina por ser un abordaje estático de un juego dinámico” detalla Power, antes de presentar nuevas funcionalidades del nuevo STATS Edge: la aplicación ahora permite ver la estructura de un equipo a lo largo de uno o varios partidos, más allá de que futbolista está ocupando cada una de las posiciones. Todo vinculado con los videos correspondientes.
Las novedades no terminan allí, el haber podido desentramar la estructura de cada equipo a partir de los datos de tracking, permite replicar en el fútbol un desarrollo que vimos recientemente en el básquet. El concepto que se maneja es el ghosting: “Si jugaban al Mario Kart saben de lo que hablo, es cuando nos aparecía un auto fantasma que había hecho el mejor tiempo para que pudiéramos compararlos” ¿Cómo y para qué funciona el ghosting? Se trata de simular cómo reaccionaría el rival ante una jugada específica, por ejemplo, la aplicación Bhostgusters permite simular cómo defendería cada equipo de la NBA distintas situaciones del juego.
En el fútbol la lógica es similar: al conocerse la estructura del equipo rival puede analizarse en la previa como serían los movimientos y en el post partido que tan lejos o cerca se estuvo del juego promedio. Otra vez, la tecnología avanza sobre axiomas clásicos, el “equipo fantasma” es un clásico de los entrenadores en los entrenamientos previos al partido, lo que hacen este tipo de desarrollos no es otra cosa que sumar recursos para una planificación objetiva.
“En definitiva, nuestro trabajo trata de encontrar la estructura en datos no estructurados, humanizarlos para que los puedan trabajar todos los involucrados, dinamizarlos para permitir la interacción y poder generar insights personalizados”
Con la cancha en la cabeza
El elogio predeterminado para los grandes armadores de juego es que tienen conciencia de la posición de compañeros y rivales, incluso antes de recibir la pelota.
Esta rapidez mental para entender la jugada suele atribuirse a una cualidad intrínseca de determinados jugadores y ahí se terminaba la cuestión.
Por suerte, el profesor noruego Geir Jordet tenía otra idea: lejos de una percepción innata se concentró en el movimiento específico que antecede a esa claridad conceptual en el juego.
El concepto es el de scanning y refiere al movimiento de cabeza donde el futbolista saca temporalmente la vista de la pelota para recolectar información de contexto que le permita luego resolver la acción una vez que le llegue el balón.
El trabajo de investigación para entender la influencia de este movimiento es complejo y detallado. Durante los últimos años Jordet y sus alumnos han capturado y sistematizado el movimiento de futbolistas de distintas partes del mundo para entender la influencia de ese escaneo de la situación antes de recibir el balón.
Sólo en su última investigación, registraron 9574 posesiones individuales de 27 jugadores, realizadas en 21 partidos distintos. Para analizarlas debieron desarrollar un modelo que tuviera en cuenta la dificultad del contexto de la jugada y los efectos de las acciones siguientes. Adicionalmente definieron diez variables para cuantificar cada escaneo.
La conclusión es que este escaneo juega un rol pequeño pero positivo en la concreción de los pases y en el avance de la jugada. En consecuencia, sugiere Jordet, es una acción que puede y debe ser entrenada como cualquier otra ya establecida.
Lo más interesante del trabajo, no son las conclusiones a las que abordó, sino las ideas que permite explorar. El noruego, que viene de la psicología, detecta en este movimiento distintas funciones cognitivas que pueden trabajarse y permiten mejorar la capacidad del futbolista. Registrar la visión de cada jugador a través de dispositivos wearables amplia las posibilidades y puede que aporte el registro de datos que faltan para que la investigación llegue a conclusiones definitivas.
En el fondo, se trata de medir y sistematizar el proceso de toma de decisiones. Otra vez estamos ante un desarrollo que avanza sobre un viejo problema que en el fútbol se repite, pero no se resuelve: “El día que (inserte aquí el nombre de jugador talentoso, pero de malas resoluciones) elija bien el pase lo vendemos al Real Madrid”
Desarrollo de juveniles y foco en entrenadores
Ed Sulley y Austin Fuller de Hudl también fueron del partido, mostrando como la empresa acentuó el trabajo con diferentes ligas alrededor del mundo, utilizando datos de Wyscout para medir su competitividad y trabajando en mejoras hacia el futuro.
Uno de los insights que trabajó Hudl con la J-League japonesa, proviene de una investigación del CIES, donde se argumenta que existe una correlación entre la cantidad de partidos jugados profesionalmente entre los 18 y los 21 años de un futbolista y su trayectoria posterior.
En esa línea, Sulley presentó datos de los minutos jugados por futbolistas sub21 en los últimos cinco años, ranking liderado por las ligas holandesa y brasileña y con la LPF Argentina en sexto lugar.
Coincidentemente son jugadores de esas nacionalidades lo más habituales dentro de las Top 5 ligas europeas. La LPF Argentina que también aporta un buen número de futbolistas a las competencias de élite, aparece sexto en cuanto a participación de futbolistas menores de 21 años.
Otro punto que Hudl retoma de una investigación de CIES, tiene que ver con la continuidad en el cargo de los entrenadores. Como vimos previamente en Big Data Sports, la volatilidad de los entrenadores es habitual en las ligas CONMEBOL, pero también existe en las principales competencias europeas, principalmente en la Serie A italiana.
En este contexto es lógico que Wyscout empiece a incluir datos de los entrenadores de la misma manera que lo hace con los futbolistas. Una iniciativa que también vimos recientemente en la plataforma smarterscout.
Análisis de modelos de juego, sistemas tácticos, resultados obtenidos según rivales, jugadores utilizados, promoción de juveniles, compras y ventas son solo algunas de las variables posibles para cuantificar el rendimiento de los Directores Técnicos.
En este contexto es lógico que Wyscout empiece a incluir datos de los entrenadores de la misma manera que lo hace con los futbolistas. Una iniciativa que también vimos recientemente en la plataforma smarterscout.
Análisis de modelos de juego, sistemas tácticos, resultados obtenidos según rivales, jugadores utilizados, promoción de juveniles, compras y ventas son solo algunas de las variables posibles para cuantificar el rendimiento de los Directores Técnicos.
¿Veremos a los entrenadores de fútbol presentar un playbook a los dirigentes a la manera de los coaches de la NFL? Es difícil de creer en el futuro inmediato, pero lo que es innegable es que la industria ha dado los pasos fundamentales para incluir al sector que hasta aquí venía desarrollando su trayectoria profesional más lejos del universo de los datos.
Follow Me