
La historia de Billy Beane al frente de los Oakland Athletics quedó instalada en la memoria popular como el primer gran hito del uso de datos en los deportes de equipo. Mucho tuvo que ver con que haya sido llevada a formato novela por Michael Lewis en 2002 y, sobre todo, en 2011 al cine con la dirección Bennett Miller y Brad Pitt de protagonista.
El hecho presentar este momento histórico como el punto de partida de la relación entre datos y deportes puede parecer anecdótico; sin embargo, trae una serie de complicaciones para quienes desarrollan la tarea en otros deportes. La mayor diferencia radica en que el béisbol -y particularmente el de la liga profesional estadounidense (MLB) – es un juego con un caudal de información superior a la media, y sus acciones son, a priori, más fáciles de cuantificar.
A 20 años de la campaña de los Oakland Athletics en la cual se basa la novela y su adaptación al cine de 2011, la dificultad de trasladar metodologías y conceptos del beisbol en ser parte central de los argumentos contra el uso de datos en otros deportes de equipo, especialmente en el fútbol.
El traslado conceptual puede rebatirse a partir de la labor de uno de los pioneros en tomar referencias del béisbol: Johan Cruyff. Durante sus años de juventud, el holandés alternaba entre sus acciones como futbolista de campo del primer equipo del Ajax, arquero de la tercera división en el mismo club y cátcher en la selección de béisbol de su país. La visión global del campo y tener que decidir dónde enviar la bola antes de recibirla, son conceptos de este deporte que, según cuenta en su autobiografía, fundamentaron los ejercicios de control y pase en los rondos, que no son otra cosa que buena parte de la estructura central del tiki-taka (Cruyff, 2017).
En cuanto al traslado del uso de estadísticas y datos cuantitativos, la situación es algo más compleja y requiere de otro enfoque: sin negar la enorme capacidad de la industria cultural de Estados Unidos para desarrollar historias de origen y presentarlas en películas memorables, es necesario un relevamiento de diferentes deportes para entender que el uso de datos en el deporte no es ni de lejos propiedad exclusiva y original del béisbol. Ahora bien, ¿Quiénes serían los Oakland Athletics en otros deportes?
El largo y sinuoso camino de Charles Reep
En un artículo reciente, David Sumpter (creador de «Friends of Tracking» y analista del Hammarby sueco) se pregunta si el fútbol es el deporte más matemático de todos. La respuesta es complicada, pero lo que sí sabemos es que el vínculo con el análisis cuantitativo no es tan reciente como se supone.
Generalmente señalamos la aparición de empresas proveedoras de datos en los noventa (fundamentalmente Opta, que trackea la Premier League desde 1996) como el punto de partida inicial, pero existen múltiples ejemplos previos.
Charles Reep fue pionero registrando las acciones que se dan en el fútbol para su posterior análisis estadístico. Empezó a hacerlo en 1951, curiosamente desarrollando análisis que ayudaron a evitar el descenso en aquella temporada del Brentford, equipo que volvió a las primeras planas en los últimos años por su apuesta al Big Data . Los aportes de Reep no se circunscribieron al ámbito laboral en clubes (con particular éxito en el Wolverhampton), sino que también publicó en prestigiosas revistas académicas incluyendo la perteneciente a la Royal Statistical Society (Reep, 1968).
Los productores cinematográficos sabrán si el perfil de Reep requiere o no la contratación de una superestrella de Hollywoord para representarlo, lo que no pueden dejar pasar es que el inglés tuvo una vida de película: desde su formación como contador, su trabajo en la Royal Air Force durante los años de la Segunda Guerra Mundial, sus columnas para el diario News Chronicle, la construcción de los primeros set de datos de fútbol, e incluso su influyente (e inexacta a la luz de los años) conclusión de que la mayoría de los goles llegaban tras jugadas de tres pases o menos, son capítulos atractivos para una eventual historia de origen de los datos deportivos contada desde el fútbol.

En estos días, el trabajo de Reep fue revalorizado en el muy recomendable newsletter Get Goalside! de Mark Thompson, poniendo el foco no solo en su status como pionero de la recolección sistemática de datos en el fútbol en los años cincuenta y sesenta, sino también en su obras finales que incluyen el paper «Measuring the Effectiveness of Playing Strategies at Soccer» de 1997 en co-autoría con Richard Pollard, donde básicamente se presenta, entre otras cosas, lo que hoy conocemos como goles esperados (xG).
Charles Reep fue pionero en 1950 registrando las acciones que se dan en el fútbol para su posterior análisis estadístico. Sin embargo, Valery Lobanovsky es el nombre clave: Su Dinamo de Kiev fue al fútbol lo que los Oakland Athletics de Moneyball al beisbol.
De vuelta en la URSS
Si el desarrollo personal de Charles Reep fue importante, Valery Lobanovsky es el nombre clave para la consolidación en un proyecto particular: Su Dínamo de Kiev es lo más parecido que vamos a encontrar en el fútbol a los Oakland Athletics de Moneyball al béisbol.
Formado en ingeniería, influenciados por la cibernética, obsesionado con la carrera espacial soviética y con un cuerpo técnico de científicos a disposición, Lobanovsky arribó al Dínamo de Kiev en 1974. Ahí construyó un equipo de trabajo donde él se encargaba de diseñar los sistemas de juego y repartía colaboradores a la parte física, al entrenamiento formal y a la recopilación de estadísticas sobre los partidos y el rendimiento de los equipos. Bienvenidos a la historia de origen del cuerpo técnico del fútbol moderno.

En un excelente artículo en la revista española «La Soga», Adrían Sánchez Esbilla puntualiza en el vínculo entre el trabajo de Lobanovsky y la gesta de «Moneyball»: La Unión Soviética que había abrazado entusiasta el progreso tecnológico desde los 50 reverberaba también el fútbol, en el deporte. Anatoly Zelentsov, decano del Instituto de Ciencias Físicas y el entrenador de atletismo Valentin Petrovski son su verdadero equipo. Zelentsov, con su computerización del rendimiento de los deportistas y sus avanzados programas estadísticos que calculaban probabilidades compartimentado el campo y situando en cada lugar al jugador más indicado en el momento más preciso, se convierte en gurú del entrenador. Lobanovsky y Zelentsov se adelantaban en más de una década a los trabajos en sabermetría de Bill James en su Baseball Abstract. Una teoría aplicada al éxito, y que se basó en la implementación en los Oakland Athletics por parte de Billy Beane, manager general, y Paul De Podesta, su mano derecha, que consistía en un sistema que obviaba el valor de mercado de los jugadores y se basaba en su valor estadístico. Bill James lo publica por primera vez en 1977, Los Okland Athletics lo aplican en 2002, Zelentsov y Lobanovsky trabajan en su propio y mucho más complejo sistema en 1972.
«Sí, ganamos la liga, pero a veces jugamos mal y solo hicimos más puntos que otros que jugaron peor. No puedo aceptar tus felicitaciones porque no son justas. Me di cuenta de que los sueños dejan de serlo en cuanto los consigues» podría ser una frase de Marcelo Bielsa en una de sus conferencias eternas los años 2000s, pero son declaraciones de Lobanovski luego de una de sus primeras conquistas en la liga local en los setentas. La obsesión por coordinar el trabajo conjunto y bajar un mensaje claro a sus jugadores signa la carrera del entrenador, que llevó al Dinamo a ganar a ganar dos veces la Recopa de Europa (incluyendo un baile memorable al Atlético Madrid en una de ellas) entre otros títulos. Su trabajo en el equipo de Kiev lo catapultó a la selección soviética, donde ganó la medalla de bronce en los JJOO de Montreal 1976 y fue subcampeón de la Holanda de Gullit y Van Basten en la Euro de 1988.
Más allá de sus logros particulares, probablemente el mayor aporte de Lobanovsky sea la formalización de lo que hoy conocemos como eventing, es decir la codificación de las acciones de juego a partir del análisis de los partidos registrados en video. Cuando nadie hablaba de Big Data, el entrenador argumentaba: “Hoy en día los jugadores no pueden objetar, saben que mañana después del partido una hoja estará colgada con las cifras que describen en detalle su juego” (Wilson, 2014).
Lobanovsky ya tuvo su documental en su Ucrania natal («Lobanovsky Forever» de 2016) que incluye los testimonios de Carlo Ancelotti y Michel Platini entre otras figuras, pero su obra bien podría retratarse en un serie de varias temporadas, desde su etapa como jugador hasta sus último ciclo en el Dínamo de Kiev a finales de los 90s cuando avanzó a fases definitorias de la Champions League y dio a conocer al mundo a un tal Andriy Shevchenko, quien en 2003 (un año después del fallecimiento de Lobanovsky) llevaría a la tumba del entrenador la camiseta del Milán con la cual conquistó el máximo título europeo de clubes.
Los cowboys y el indio
Los primeros registros de utilización de datos en el fútbol americano se remontan al inicio del siglo pasado con el clásico universitario entre Yale y Harvard. Sin embargo, el punto de inflexión se dio varias décadas después.
Datascouting es un término muy de moda por estos días. Generalmente tiene que ver con la primera parte del proceso de selección de jugadores y consiste en filtrar información a partir de los resultados en ciertas variables relacionadas con los rendimientos del deportista elegido.
Este desarrollo es masivo en la actualidad pero no así su origen: los Dallas Cowboys de la NFL ya lo hacían a finales de los ´60 y fue clave en los mejores años de la franquicia.
Sin la potencia gráfica, pero con el mismo entramado conceptual y analítico de desarrollos recientes, esta iniciativa estaba liderada por Salam Qureishi, un programador criado en la India y que nada sabía de fútbol americano. Su historia está contada en “The Cowboy and the Indian”, el documental de la serie Signals coproducido por la cadena ESPN y la web especializada FiveThirtyEight.
La historia cuenta que el Gerente General de los Dallas Cowboys en ese momento, Tex Schramm, estaba fascinado con el uso de computadoras que había conocido trabajando en la cadena CBS Sports durante la transmisión de los Juegos Olímpicos de Invierno de 1960.
Intrigado por cómo la computadora podría ayudarlo a evaluar a los jugadores, apenas tomo el control de los Cowboys en 1962, Schramm se acercó a la por entonces incipiente IBM. Fue allí donde conoció a Salam Qureishi y enseguida lo sumo a la franquicia.
Básicamente lo que hizo Qureishi en los Cowboys fue rearmar el sistema de scouting del equipo. Para ello introdujo un método computarizado para buscar jugadores, una tarea que por ese entonces era propiedad de ojeadores aficionados. En consecuencia, acá tenemos la historia de origen de la construcción de equipos a partir de las computadoras.

Las cinco principales variables que utilizó Qureishi durante la exploración fueron: el carácter, la rapidez y el control del cuerpo, la competitividad, la fuerza y la explosividad y el estado de alerta mental. Además, también desarrolló un cuestionario que se distribuyó entre los entrenadores de todo el país. Las contrataciones sugeridas por el indio, fueron la base del equipo que lideró varias fases regulares entre 1964 y 1970, y que terminaría consagrándose en 1972 derrotando a unos invictos Dolphins en el Super Bowl, justamente en la temporada que Qureishi se alejaría de la franquicia texana.
El indio ensayó un regreso en 1986, pero su metodología ya no era una novedad y la mayoría de los equipos contaban con analistas y scouters profesionales replicando su trabajo. Sin embargo, la mano de Qureishi volvió a finales de la década con una serie de nuevos aciertos en el draft que sentarían las bases del equipo que ganó consecutivamente el Super Bowl entres 1993 y 1995. Un grand finale para cualquier película deportiva que se precie.
NBA: Oliver, hazte amigo de los datos
Si bien la tradición de volcar datos a planillas es de larga data en el básquet, sin embargo probablemente sea 1982 el año que marca un año de quiebre en el uso de la información. Louis Guth, un economista que había trabajado en la North American Soccer League (otra vez el fútbol como antecedente de otros deportes), desarrolló las FAMS (iniciales en inglés de “Simulador del mercado de agentes libres”) y FAME (“Simulador de agentes libres y transferencias”), las primeras bases de datos de estadísticas de la NBA que permitían analizar qué sucede si se agrega o se quita determinado jugador del roster del equipo. La historia es tan impactante e inmediata que cuesta creer que no haya sido llevada al cine aún.
Los primeros beneficiados de los análisis de Guth fueron los 76rs de Filadelfia, que aceptaron la recomendación de mejorar sus números en los tableros y sumaron a su equipo a un tal Moses Malone proveniente de los Houston Rockets. La contratación no pudo tener mejores resultados: Malone terminaría siendo elegido como MVP de las finales de 1983, ayudando a los Sixers a barrer a los Lakers y vengarse de la caída en la cita máxima un año antes.
Sin embargo, la consolidación del uso de datos en la NBA es más reciente de lo que se supone.
A mediados de los noventa Dean Oliver, un ex basquetbolista universitario con un título en ingenieria y un posgrado en estadística, comenzó a publicar columnas sobre datos de la NBA en el por entonces popular sitio About.com, a la vez que intercambia análisis estadísticos en distintas plataformas colaborativas de internet (volviéndose particularmente mítico un grupo Yahoo! APBR_analysis).
Uno años más tarde Oliver se volvió uno de los contribuidores fundamentales de la web referencia del acceso a datos deportivos Basketball Reference.
Su constancia en la actividad le valió, en 2004, un contrato con los Seattle SuperSonics como analista de datos, siendo oficialmente el primero en hacerlo en la NBA. La publicación de «Moneyball» un año antes fue clave para que las franquicias dieran este paso. Su historia, junto con la de otros nombres que cambiaron la NBA, esta contada con lujo de detalles en el muy recomendable libro «Chasing Perfection» de Andy Glockner.
A partir de allí, la carrera de Dean Oliver fue en ascenso, obteniendo mayor relevancia en su pasó por Denver Nuggets (donde estuvo detrás de la fallida contratación de Allen Iverson) y desempeñándose en los últimos años como entrenador asistente en los Washington Wizards. Además, Oliver maneja el área de ciencia de datos de TruMedia Networks, una empresa que desarrolla las plataformas estadísticas de varios de los proveedores y las federaciones más importantes del mundo.
Y eso no es todo amigos
La historia puede contarse desde distintos ángulos, siempre que tengamos presente que no son únicos: Los Chicago Cubs apostando a un modelo de data science para ganar el campeonato de la MLB después de 80 años, Kirk Goldsberry contando los cambios de la NBA a partir de visualizaciones de datos, Giuseppe Vinci introduciendo el Big Data en el voley, los desarrollos de Christophe Cauiabet en el handball, el análisis de datos en los All Blacks y la metodología basada en información cuantitativa de Los Angeles Kings en la NHL, son solamente algunas de las otras historias de origen posibles alternativas a «Moneyball» que no llegamos a contar en esta nota.
La profundización del tema es interesante y desafiante a la vez, porque el análisis de la cuestión arroja resultados contraintuitivos que abren y/o mejoran debates: ¿Los deportes más cuantificables no necesariamente son los que desarrollaron los análisis primero? ¿Deportes como el fútbol, que pensamos a prior menos cuantificables en realidad están al mismo nivel que los demás? ¿Por qué se cuestiona traspasar metodologías cuantitativas entre deportes cuando se aplaude la aplicación transversal en distintos ámbitos estratégicos, psicológicos o físicos?
Esta historia continuará.
Bibliografía
Cruyff, J. (2017). 14. La autobiografía. Buenos Aires: Planeta.
Glockner, A. (2016). Chasing Perfection. Boston: Perseus Books Group.
Lewis, M. (2003). Moneyball. New York: W.W. Norton.
Reep, C. (1968). Skill and Chance in Association Football. Journal of the Royal Statistical Society., 581-585.
Wilson, J. (2014). La Pirámide Invertida. Buenos Aires: Random House.
Follow Me