Durante la Euro 2020 y la Copa América 2021 se consolidó una tendencia que se venía manifestando cada vez con mayor fuerza durante los torneos que se disputan en Sudamérica. Tanto en ligas locales como en torneos Conmebol el uso de los datos comenzó a ser una herramienta más para periodistas, comunicadores y usuarios en redes sociales.
Datos en cantidades, estadísticas que miden qué es lo que hacen los protagonistas con la pelota y así resaltar una performance, dándole al comunicador un poco más de objetividad en el análisis y creando así un soporte de una narrativa que se pretende sostener. El uso de los datos está instalado y eso es bienvenido.
Esta tendencia ya se había iniciado ya varios años atrás en Europa y en las transmisiones de sus partidos, la presencia de los datos como soporte aunque con algunos errores de cálculo.
Un poco de contexto
Si nos remontamos casi 10 años atrás, era pre XG o “goles esperados” se visualizaban gráficas con datos simples que contabilizaban los “shots on target” o “disparos al arco” y los “shots off target”. Por lo general esta información se utilizaba en el análisis post partido para sostener una hipótesis en favor del equipo que había tenido mayor cantidad de tiros al arco en detrimento de su rival con menor cantidad.
En el imaginario y en la gráfica el equipo que mayor cantidad de “disparos al arco” había creado se lo consideraba como el que mayores méritos había hecho para conseguir la victoria y así se defendia el resultado que había conseguido o por el contrario, no se justificaba la victoria del equipo que menos “shots on target” había ejecutado.
Ahora en la vorágine por responsabilizar al dato como justificación de un argumento, ¿ nadie se preguntaba por ejemplo de qué calidad habían sido esos disparos?Ante esas situaciones y como espectador siempre creí que era preferible crear 3 o 4 “shots off target” frente al arquero y con uno o sin defensores por delante de la pelota y tirarla por arriba del travesaño que tener 10 disparos al arco desde una distancia de 8 o 10 metros respecto al arquero, sin potencia y con 5 o 6 defensores por delante de la pelota. Nunca se puso en tela de juicio ese concepto hasta que llegaron los hoy cada vez más famosos XG o expected goals.
Con estos también sucedió algo similar. Inicialmente costó que fueran utilizados abiertamente como una herramienta de apoyo y de análisis aunque aún con resultados similares. Los “pundits” o analistas de TV, aquellos de los más osados y entusiastas en el uso de datos nunca se preguntaron cómo se median los XG.
Lo cierto es que los primeros XG eran una métrica que se media bajo 2 parámetros muy simples y algo ineficientes para un deporte como el fútbol. Los primeros XG medían tan solo distancia y ángulo del disparo, algo más eficiente que los “shots on” y “shots off” pero aún dejaban de lado algo crucial, el contexto del disparo.
Pasemos en limpio, para los antiguos XG un remate de grandes probabilidades sería, por ejemplo, un remate desde una ubicación cercana al punto del penal, una posición centrada para quien remata (ángulo de disparo) y una distancia relativamente cercana al arquero. Ahora el punto ciego de esta métrica era que no sabía decirnos en qué contexto se producía este remate, cuantos rivales había por delante de la pelota protegiendo al arquero y dificultando la trayectoria del remate. No es lo mismo un remate desde el punto del penal con 8 jugadores por delante de la pelota que un penal puro y duro, distancia y ángulo es el mismo, el contexto no lo es.
Por aquellos años recuerdo que varios fútbol traders (o apostadores profesionales) y estadistas del mundo de las apuestas deportivas solían reírse de los modelos XG diciéndome que ni locos tomarían una mínima posición en un partido basándose en esos modelos por el simple hecho de que no querían perder su dinero. La respuesta, tarde, pero respuesta al fin, es que hoy los XG miden también el contexto de remate.
Entonces mi pregunta ante esta situación de descontextualización del dato fue la siguiente, ¿de qué manera podemos hacer útil una información que vale la pena utilizar? En mi transición del mundo del betting al mundo del fútbol logré entender que es crucial preguntarse por qué y para qué me sirve el dato.
Situación actual de los datos en el fútbol
Hoy se miden pases de todos los colores: duelos aéreos, gambetas hacia adelante, asistencias, tiro libres, y así como se miden se publican sosteniendo una idea o una justificación. Las que siguen ausentes aún son las preguntas con las que debemos iniciar nuestro análisis: para qué nos sirven estos datos, qué es lo que nos aportan, que es lo que nos cuentan del juego, como y quien mide estos datos, de que calidad son y qué funcionalidad puedo darle a esta información.
En deportes no lineales como el fútbol la distorsión del dato es mucho más severa de lo que puede ser en deportes más lineales como el baseball o el tenis. La medición del dato futbolístico tiene la complejidad de movimientos y acciones de distinta índole y que no se repiten con la misma frecuencia que en otros deportes. Cada acción también está condicionada por la interacción de los participantes hace que el dato final tenga mucho de lo que hizo el otro y no solamente de lo que hizo uno en sí.
Un pase excelente que rompe líneas y al espacio pero que el compañero no aprovecha ya que comienza tarde la carrera, ¿a quien se le computa? ¿Pase bueno o pase errado?
Solemos ver en redes sociales, por ejemplo, un informe sobre arqueros en el que después de una gran actuación destacaban a uno como el mejor arquero en detrimento de otro, según la publicación como “polos opuestos” en la misma función.
Las métricas utilizadas eran “porcentajes de atajadas” y “goles evitados en 90’ ”. Este ejemplo sirve de disparador para algunas preguntas que me parecen importantes hacer: ¿Es el porcentaje de atajadas un indicador lo suficientemente determinante para medir la performance de mi arquero? ¿Es mi arquero el dueño exclusivo de los goles evitados? ¿Qué es lo que realmente me aporta esta información?
Si fuese ese el caso, para dar ejemplos con nombres propios, ¿cómo mediríamos la tarea de Víctor Valdés en el mejor Barcelona de Pep? El Barca de Guardiola rara vez era expuesto a una situación de gol (ya que ese Barcelona concedía muy pocas) por lo tanto Valdés tendría muy poco % de atajadas pero quizás una gran cantidad de “goles evitados en 90’ “. ¿Era Valdés el responsable? Muy probablemente no, la respuesta es que era el equipo.
Luego otra inquietud, ¿porcentaje de atajadas en relación con qué promedio y que tan amplia es la muestra? ¿3, 4, 5 o 200 partidos? Cuanto más amplia es la muestra estadística más certera será la conclusión del dato.
Volviendo al dato de los arqueros y jugando a ser dirigente del club donde están, ese mismo dato puede ser hasta muy preocupante en vez de alentador. Si nuestro arquero tiene una gran cantidad de atajadas por partido eso significa que mi equipo está concediendo muchas ocasiones de gol o de disparos; por lo cual, no estamos defendiendo lo suficientemente bien para que mi arquero tenga una tarde tranquila. Por consiguiente, mayor cantidad de atajadas de mi arquero, mayor probabilidad de perder el partido.
El arco en cero, las vallas invictas, están puramente relacionadas con los arqueros. En España, por ejemplo, se entrega el premio Zamora al arquero menos vencido, pero ¿no debería incluirse a su defensa o a todo el equipo? Entiendo el valor simbólico de dicho premio ahora prefiero creer que los goles los hacen y los evitan los 11.
Otro ejemplo que se me viene a la mente es una publicación en redes sociales donde se destacó el trabajo de un futbolista en particular que era muy criticado. Con datos de Opta se resaltaba que ese futbolista no se había desempeñado de acuerdo a las críticas que recibía. El objetivo que buscamos no es saber si ese futbolista jugó bien o mal en este caso, tratemos de concentrarnos en el análisis de los datos: qué más se puede hacer para profundizar y no quedarse en la superficie.
Señalan la cantidad de pases correctos y su efectividad, pero ¿qué funcionalidad tuvieron respecto al funcionamiento del equipo? Un pase correcto a como se recopila puede ser, el pase, por ejemplo, de un defensor a su arquero a dos metros de distancia y sin presión del rival.
Teniendo los datos del jugador disponibles, ¿no sería interesante medirlo con el promedio de pases correctos del jugador en un campeonato entero o incluso en dos para que la muestra sea aún más precisa?
Teniendo los datos del jugador disponibles, ¿no sería interesante medirlo con el promedio de pases correctos del jugador en un campeonato entero o incluso en dos para que la muestra sea aún más precisa? ¿O compararlo con quien tenga el mejor porcentaje en la liga en los últimos años o incluso ir aún más allá, prestarse a verificar esa información con el mejor de la Champions League? De esa manera si podemos saber si en esa categoría rindió por encima de su media, sobre su media o por debajo.
Está claro que en tan solo 280 caracteres de Twitter uno no puede explicar con profundidad. De todas formas vale la pena darle el contexto indicado a los datos estadísticos en un análisis para que tengan más fuerza y sustento. Antes de que empiece la Copa América tuve la tarea de colaborar en el traspaso de un jugador argentino a un equipo de la Premier League. La búsqueda de su representante se basaba en datos que resaltaran las características del jugador.
Mi propuesta se basó en algo distinto, pero aun sencillo, le comenté que seguramente casi todos los clubes con los que estaría hablando tendrían ya información similar. Y que cobraría más fuerza si creábamos un benchmark de comparación de su jugador con los mejores en su posición en toda Europa y específicamente con quienes, potencialmente, iba a competir por un puesto en los equipos compradores. En ese sentido, el dato cobra más fuerza en vez de presentarlo como un número en un cuarto oscuro
Conclusiones
Hace no mucho tiempo atrás escuchaba en palabras del periodista Miguel Simón, habido entusiasta de incluir datos en sus coberturas, que él utilizaba el número en tanto y en cuanto le agregara lucidez a lo que se estaba analizando del juego. Agregar lucidez, de eso se trata. Que el dato aporte y que no solamente haga presencia. Aportar más claridad a aspectos del juego, y para que eso suceda, primero tenemos que ser nosotros los que nos hagamos ese cuestionamiento, ¿qué nos aporta?
Traspolando esto a un ámbito mucho más significativo que el fútbol durante esta etapa de pandemia que atraviesa el mundo, los datos estadísticos han bailado de un lado al otro tratando de justificar posturas y defendiendo desencuentros, imponiendo verdades y no tantas, siendo utilizado como herramienta de batalla y nunca como prueba científica para una encontrar una solución.
Trato de proponer un ejercicio de preguntas para que la vorágine no nos lleve por delante. Un dato estadístico por más que sea un dato necesita por un lado un mínimo de interpretación para poder entender mejor a qué conclusiones nos puede estar llevando, e incluso también para su implementación en lo práctico. Mucho más si hablamos de fútbol, uno de los deportes más complejos para medir y sacar conclusiones exactas.
Antes de hacernos eco de un dato o de un número, al menos si hablamos de fútbol, preguntémonos, ¿qué significa este dato y de qué manera práctica me puede ser útil?
Follow Me