
Confirmado Marcelo Gallardo como entrenador un año más, y con eso la continuidad del ciclo más exitoso de la historia de River Plate, la prensa puso el foco en los planes del equipo millonario para el próximo año; alianzas internacionales, posibles acuerdos o renovaciones con Adidas, Socios.com y Amazon Prime, reestructuración de las inferiores y la que más nos interesa a nosotros: una apuesta por el Big Data.
La noticia trascendió sin mayores detalles: el Diario Olé habló de “el proyecto (de River) para modernizar el fútbol utilizando la Big data” mientras que Infobae señaló “Otra interesante herramienta con la que pasará a contar el DT es el Big Data” en una nota, y en otro artículo más extenso profundizó en el tema asociándolo a un proyecto de scouting “sumar algunos scouts a la estructura para encontrar con mayor facilidad oportunidades que pueden brindar el mercado o juveniles prometedores (…) Para reforzar esta idea, se apostará por el Big Data, una herramienta que comenzó siendo mirada de reojo pero que cada vez gana más adeptos dentro del ambiente de la pelota número 5”
Lo cierto es que el proyecto oficial sobre cómo River incorporará Big Data a su gestión no ha trascendido, con lo cual es difícil pedirles precisión a los medios. Sin embargo, a nosotros, esta “filtración” nos sirve como punto de partida para desentramar algunas conjeturas y explicar algunas ideas básicas sobre el trabajo con Big Data que se puede hacer un club de primer nivel.
¿Qué es el Big Data? ¿Existe el Big Data en el fútbol?
Para que quede claro de entrada: la frase “River apostará por el Big Data” es tan poco específica como decir “River apostará por el mantenimiento” sin detallar si será la contratación de mano de obra para mejorar el trabajo actual, de un arquitecto para que remodele el estadio, o de un grupo de ingenieros para restaurar un área de entrenamiento.
Big Data es, primero que nada, un concepto que (muy simplificado) hace referencia a conjuntos de datos que, de tan grandes, veloces y/o complejos, no pueden ser almacenados y procesados en bases de datos tradicionales (relacionales) y necesitan otro tipo de plataformas y soporte.
La frase “River apostará por el Big Data” es tan poco específica como decir “River apostará por el mantenimiento” , sin detallar si será la contratación de mano de obra para mejorar el trabajo actual o de un arquitecto para que remodele el estadio
Un error recurrente asociado a esta falta de precisión cuando nos referimos al tema es hablar de “la herramienta del Big Data” como algo genérico cuando en realidad lo que existen son herramientas y plataformas basadas en Big Data. No son lo mismo.
En principio, podemos decir que en el fútbol, especialmente el latinoamericano, los casos de aplicación de Big Data en sentido estricto son pocos, porque no se genera una cantidad ni datos tan complejos como para justificar la implementación de una plataforma de esas características. Esto no quiere decir que el fútbol no generé grandes volúmenes de datos, sino que se queda corto frente a otras industrias donde el uso de herramientas basadas en Big Data es moneda corriente como las telcos o las financieras, que registran 24/7 los movimientos de sus clientes que dejan huellas difitales a traves de distintos dispositivos.
Es cierto también, que no tiene mucho sentido ponerse en purista y desconocer el sentido que coloquial que adquirió el término «Big Data» en los últimos años, asociado mayormente a cualquier tipo de trabajo recurrente y sistematizado con datos, sin importar demasiado los alcances y las características de las bases que los almacenan.

¿Qué quiere decir entonces qué River va a apostar por el Big Data?
A falta de la publicación del proyecto oficial por parte del club, no nos queda otra opción que conjeturar respecto a las intenciones de River el próximo año. A grandes rasgos existen dos opciones.
La primera y la más habitual en cuanto a implementaciones de “Big Data” en clubes, es que se incorpore uno o varios analistas de datos especializados en fútbol, que puedan maximizar la utilidad de información que entregan plataformas como Provision o los reportes que generan las propias competiciones en base a información de los proveedores. En ambos casos se trata de una gran cantidad de datos de partidos y ligas de todo el mundo ya sistematizados, pero de una manera genérica predeterminada por el desarrollador, donde la mano de un analista propio es clave para poder ajustar esos datos a las necesidades puntuales de un cuerpo técnico específico.
En principio, podemos decir que en el fútbol, especialmente el latinoamericano, los casos de aplicación de Big Data en sentido estricto son pocos, porque no se genera una cantidad ni datos tan complejos como para justificar la implementación de una plataforma de esas características
Un paso antes, quien ocupe esta posición también debería ocuparse de la selección y la interacción de los proveedores de datos, comparando la calidad de la información que suministrada por cada uno y trabajando cerca de los analistas de las propias empresas proveedoras para ajustar el eventing (la manera en que se definen los datos del partido) y el protocolo global a las búsquedas del cuerpo técnico, generando reportes de match analysis pre y post partido donde los datos presentados estén lo más relacionado posibles con la evaluación del plan de juego específico y los puntos débiles del rival en relación a las oportunidades del equipo.
Adicionalmente este analista o grupo de analistas, puede trabajar con el departamento de preparación física, analizando a la información producida por los GPS y otros dispositivos, e incluso ayudar a los médicos y nutricionistas el plantel en el seguimiento de sus casos.
Otra tarea clave en este rol, es el trabajo de datascouting, que básicamente consiste en bucear en plataformas de datos de jugadores pre-seleccionando aquellos cuya información coincida con los perfiles buscados por el club, minimizando los tiempos de visualización de videos por parte de los ojeadores. Adicionalmente, construir fichas de datos con el seguimiento de los futbolistas del propio plantel, es otra tarea clave para quien ocupa este rol. Estos reportes, que incluyen tanto información de juego como la evolución física, hoy son un requerimiento esporádico principalmente por parte de clubes europeos, pero puede volverse algo habitual de los equipos del exterior a la hora de ofertar por un futbolista.
El perfil del analista, además del conocimiento de fútbol, debe incluir de mínima skills en bases de datos SQL, lenguajes de programación utilizados para el procesamiento y visualización de datos (R, Python) y eventualmente, el manejo de alguna herramienta de BI (Tableau, Power Bi, MicroStrategy, etc) para acelerar y simplificar los procesos de reportes.
Muy probablemente no tendríamos una opción de Big Data en el sentido estricto, pero sin duda se incorporaría un aliado importante para el desarrollo del equipo.
La otra opción, más ambiciosa, es la creación de un departamento de datos que centralice la información del primer equipo (eventing, GPS, datos físicos de los jugadores, información de entrenamientos, etc) pero también la de las divisiones inferiores, la de otros deportes profesionales o amateurs de la institución e incluso datos generados a nivel institucional (información administrativa de socios, data de fan engagement en redes, etc).
Algo parecido a esta estructura, aunque mayormente sin la información institucional, es la que manejan clubes de élite europea como Barcelona, Ajax y gran parte de la Premier League inglesa.
En esta variante, el departamento de datos se aproximaría por volumen a una implementación de Big Data en el sentido estricto. Para que funcione, es necesaria una estructura de varias personas entre analistas de datos, administradores de bases, e incluso un científico de datos. A cambio, podría reportar información valiosa y sistemática para la toma de decisiones en diferentes clientes internos de la institución (cuerpos técnicos, scouters, dirigentes, marketing, áreas administrativas, etc) e incluso generar desarrollos más avanzados, como modelos predictivos para entender el rendimiento de un rival en la previa de un partido o evaluar posibles incorporaciones.
El kit básico incluye la implementación de ETL o datalake en la nube (la estructura para organizar la información), y la vinculación con alguna herramienta BI para la visualización de datos y el desarrollo de reportes. Básicamente el modo en cómo funciona un área de datos en cualquier empresa más o menos grande.

Al Fin Sucede
Esta claro que las dos variantes presentadas no agotan las posibilidades de implementación del “Big Data” en un club y que, seguramente, River tome un camino particular que tenga solo algunas de las características aquí presentadas. La intención de este texto es presentar un panorama general de la cuestión basado en la experiencia que tenemos trabajando en la industria.
La cuestión principal va más allá de como resulte la aplicación puntual y es el hecho que uno de los clubes más importantes de Argentina anuncie el trabajo con datos como uno de sus planes principales para 2022. Algo que estabamos seguros que pasaria desde hace varios años y que ojalá funcione como el empuje definitivo para la profesionalización del rol de los analistas de datos en el fútbol de América Latina.
Follow Me