
En la vuelta de los cuartos de final de la actual Champions League, Paris Saint Germain y Bayern Munich protagonizaron uno de los partidos más entretenidos de los últimos tiempos; fue victoria alemana por la mínima (0-1) en un juego donde los franceses dispusieron de múltiples situaciones de gol pero no consiguieron marcar. PSG se quedó con el pase a semifinales por lo hecho en el partido de Ida.
Asociado con Mbappé y Di María, Neymar fue uno de los grandes protagonistas de la noche. Quienes vimos el partido nos deleitamos con una serie de acciones individuales y conjuntas encabezadas por el brasileño, poco habitual para el fútbol de nuestros días: gambetas y lujos, pero también generación de situaciones de riesgo y oportunidades claras. La sorpresa, para algunos, fue que SofaScore le asignara el rating más bajo entre todos los futbolistas que participaron del encuentro.

Lo que siguió, especialmente en redes sociales pero también en algunos medios de comunicación, fue una catarata de usuarios poniendo en duda la utilidad de los datos que se capturan en el fútbol, acompañados por algunas explicaciones que, desconociendo como funciona esta industria, confunden proveedores con medios y desconocen el habitual de reprocesamiento de la información que suele darse en portales como SofaScore para llegar a ese rating.
Creemos que mientras más clara sea la información, más fácil va a ser la interpretación de los datos que están disponibles en relación al fútbol, En este artículo trataremos de ir contestando algunas preguntas frecuentes cuyo desconocimiento suele derivar en errores.
¿Qué es SofaScore?
SofaScore se presenta como una compañia de datos deportivos. Tiene base en Zagreb (Croacia) y cuenta además con oficinas en Rio de Janeiro (Brasil). Fue fundada por latko Hrkać e Ivan Bešlić, quienes empezaron en 2010 comprando su primer feed de datos. El feed es la fuente de datos «crudos» generada por un proveedor que captura la información. Antes de la Euro de 2012 lanzaron una aplicación móvil. En 2014 a partir de volverse cliente de Opta (uno de los proveedores de datos deportivos más grandes del mundo que actualmente funciona bajo del nombre Stats Perform), SofaScore pasa de ser una app que muestra resultados a convertirse, según palabras de la propia compañía, en una herramienta analítica para los seguidores del fútbol.
Dos cosas importantes acá: 1) SofaScore no captura los datos, sino que se los compra a un proveedor; 2) Lo que hace SofaScore es desarrollar una aplicación donde esos datos esta visualizados de una manera particular ( muy atractiva por cierto) y generar indicadores secundarios,como sus populares ratings, a partir de los más de 1500 eventos que se capturan externamente en cada juego.
¿Cómo calcula sus ratings SofaScore?
Lo hemos comentando en notas anteriores: al menos hasta que los algóritmos de machine learning para captura de datos a través de video se popularicen, buena parte del proceso de toma de datos de los partidos estará hecho todavía por humanos. Se trata de grupos de entre tres y cinco analistas, que mientras ven el partido en tiempo real van capturando los eventos previamente definidos como pases, remates, quites, gambetas, entre otros. Cada compañía proveedora (Stats Perform, Wyscout, InStats, Statsbomb, Datafactory, etc) tiene su metodología y sus procesos de validación, pero la mayoría coincide en que, para llegar a ser uno de los analistas que captura los datos, hay que pasar por un proceso de formación y pruebas que dura varios meses.
Esos datos capturados son cargados en una base de datos que es enviada, generalmente a través de una API, a los distintos clientes: medios (incluyendo las transmisiones en vivo de la tele), portales, clubes, federaciones, ligas o empresas de «segundo grado» que se encargan de reprocesar y visualizar los datos según sus fines. Otra opción es que el propio proveedor genere los widgets y estos sean embebidos en la web por los clientes. En Latinoamérica, por ejemplo, es común ver los widgets de Stats Perform y DataFactory en diferentes medios.
Sofascore a partir de los datos recibidos, trabajo durante un año analizando los distintos eventos y trabajando en indicadores de performance (KPI) de cada uno de ellos: «Abordamos el fútbol como un sistema dinámico complejo en el que todos los futbolistas tienen un papel específico. El resultado final es un algoritmo sofisticado que genera calificaciones de los jugadores en una escala de 1 a 10, dependiendo de lo que hicieron los jugadores durante su tiempo en el campo.»
La media del rating de SofaScore se ubica en torno a los 6.86 puntos y la moda es de 6.6, lo cual desde el vamos implica una lectura diferente a los puntajes que ponen los periodistas en las crónicas publicadas por los diarios, donde 6 suele ser una una nota muy buena y el 7 ya es propiedad de un jugador destacado.

Los ratings van cambiando en tiempo real, en función de las acciones del futbolista en el partido: generalmente no hay ratings por debajo de 6 puntos, exceptuando cuando el futbolista se hace un gol en contra, concede un penal, es expulsado o acumula varios datos negativos como faltas, posibilidades de gol erradas y múltiples disputas por la pelota perdidas, entre otras variables.
El rating de SofaScore se propone «ir más allá de los goles», por lo que pondera, en principio, el accionar de un futbolista que interviene recurrentemente en distintos sectores del campo y suma participación positiva en distintos eventos como pases, recuperaciones, pases en profundidad y gambetas de un jugador cuyas intervenciones son escasas, aunque sean goles.
Como en muchos casos al tratarse de un algoritmo propietario, SofaScore no detalla la formula de la Coca-Cola, pero aclara que tiene en cuenta cientos de eventos a la hora de generar el rating.
Encontramos tres cosas importantes para destacar:
- 1) La medición de ratings de SofaScore no es la única del mercado: DataFactory tiene la suya propia, Stats Perform también e incluso otras aplicaciones como WhoScored las han desarrollado.
- 2) Por lo tanto, lo de SofaScore es una de los tantos reprocesos posibles sobre los datos capturados; si el puntaje de Neymar no cierra, la discusión es sobre como están reprocesados los datos en este caso particular y de ningún modo puede universalizarse para invalidar «el uso de los datos en el fútbol», ni siquiera pone en jaque los procesos de captura de la información original.
- 3) El hecho de no compartir el resultado de un puntaje generado a partir de este algoritmo, tampoco invalida a este reprocesamiento puntual, si invita a revisar el tipo de acciones que son ponderadas y el grado de penalización de cierto tipo de eventos (ej. las cuatro chances claras de gol que Neymar no pudo convertir).
Si el puntaje de Neymar no cierra, la discusión entonces es sobre como están reprocesados los datos en este caso particular y de ningún modo puede universalizarse para invalidar «el uso de los datos en el fútbol»
En cualquier caso SofaScore es bastante transparente y pone a disposición buena parte de los datos del jugador, abriendo la posibilidad de los usuarios puedan contextualizar ese número o incluso reprocesarlo a gusto. Y si bien esto último es algo imposible para los periodistas que se limitan a copiar y pegar datos de la plataforma en sus cuentas de Twitter, son posibilidades abiertas aquí, que no están al alcance en la puntuación tradicional por parte de cronistas, ya que generalmente no se dispone de información detallada del criterio con el cual se pusieron los puntajes.

La propia empresa, en un posteo en Instagram, dio detalles sobre la nota de Neymar, especificando que factores influyeron negativamente en el rating: «Su actuación de ayer estuvo marcada por el hecho de que perdió 4 grandes oportunidades de anotar, según nuestro proveedor de datos. Esto significa que tuvo 4 grandes chances de gol y no pudo convertir. Fue la primera vez en fases K.O de Champions desde 15/16 (comienzo de nuestra base de datos) que un jugador tuvo 4 grandes oportunidades perdidas en el mismo partido.
· Las notas de SofaScore se registran teniendo en cuenta cientos de estadísticas de un jugador en el partido, midiendo la eficiencia en relación a los números presentados. Hay varios factores como disparos, regates, duelos, pases decisivos, grandes ocasiones creadas, grandes ocasiones perdidas y muchos datos más. Estadísticamente, podemos decir que el partido de Neymar no fue bueno. Registró 24 pérdidas de balón, 16 duelos perdidos y 6 regates incompletos. Factores que también contribuyeron a la disminución de su evaluación.«
·
Conocer para profundizar
Una vez más, el uso los datos genera cierta polemica al interior de la industria del fútbol, una consecuencia de que su uso se haya incrementado en el último lustro y tengamos más ojos observando y tratando de utilizar las estadísticas.
La importancia de conocer los procesos que están detrás de la generación de los datos, incluyendo las definiciones de los eventos (insistimos, incluso los pases no se definen igual en un proveedor que en otro) y la metodología de captura, vuelven fundamental aclarar la fuente original de publicación. Y si se puede, el proveedor que originó el dato. De este modo se logra evitar cierto apuro que en ocasiones es consecuencia de llamativos intentos por hacer pasar las bases generadas por grandes compañías como propias y descontextualización a la hora de la publicación de los datos.
Convencidos de que esta información genera mejores condiciones y eleva el nivel de debate en torno al juego, es que insistimos desde Big Data Sports en profundizar tópicos relacionados al uso de datos.
Follow Me