El blog es mío - Dineropelota - 2012-11-17

El éxito de Nate Silver prediciendo las últimas elecciones en USA ha sido todo un acontecimiento público. Los medios se han hartado de comentar los métodos que le han permitido acertar correctamente el resultado en **todos** los estados con un margen de error mínimo, humillando a la legión de comentaristas políticos que extienden un dedo, lo levantan y miran de dónde sopla el viento para hacer sus predicciones.

Pero para mi lo realmente interesante ha sido indagar en su biografía. A parte de haberse ganado la vida jugando al póker, Nate trabajó durante mucho tiempo en el campo de estadísticas en el béisbol.

Tradicionalmente, el béisbol ha sido siempre un deporte con estadísticas al milímetro; como descendiente del cricket (que ya por el XVIII generaba bastantes datos), desde el siglo XIX durante cada partido se lleva un registro cuidadoso de todas las jugadas. El hecho de que sea un deporte con jugadas aisladas con inicio, final y resultado concreto hace que sea relativamente sencillo anotar una ingente cantidad de anotaciones sobre cada partido.

Así pues, no es raro que ya hace mucho tiempo los equipos intentasen emplear las estadísticas para mejorar el rendimiento de su equipo mediante el análisis de datos para determinar táctica y estrategia o incluso para fichar jugadores. Las estadísticas de cada partido son públicas y los almanaques que recogen éstas son abundantes y populares, el uso avanzado de las estadísticas no se límita a los equipos y los comentaristas, sino que los mismos aficionados suelen estar muy familiarizados con los números.

En 2002, los Oakland Athletics y su manager Billy Beane, consiguieron ensamblar un equipo extremadamente competitivo pese a no contar con unos ingresos comparables a los titanes tradicionales del deporte (su presupuesto para ese año era un tercio del de los Yankees). Para ello, bebieron de una corriente de pensamiento estadístico originada en los 50 que reanalizaba las estadísticas disponibles y creaba unas nuevas métricas que servían para valorar mejor el rendimiento de un jugador. Pasaban de estadísticas simples y evidentes como el porcentaje de bolas que conseguía batear un jugador a otros indicadores más complejos que tenían en cuenta más factores.

Mediante el uso de estos indicadores, los Athletics conseguían encontrar buenos jugadores cuyas estadísticas tradicionales no eran excelentes y por tanto no estaban muy valorados, pero que sus métricas (denominadas sabermetrics) los destacaban como jugadores que podían aportar mucho a un equipo. Estos resultados también iban en direcciones opuestas, como en el caso de Silver contra los comentaristas de sillón, del olfato de los ojeadores.

De esta manera, mediante el uso de estadísticas, los Athletics pudieron fichar jugadores baratos cuyo rendimiento estaba infravalorado y conseguir un éxito deportivo.

Todo esto se plasmó en la película Moneyball con Brad Pitt, basada en el libro del mismo nombre, que explica la temporada de explosión de los Athletics.

Por supuesto, el éxito de los Athletics llevó a otros equipos a utilizar los mismos métodos y seguir estas vías de investigación. El resultado fue el obvio; los jugadores con buenos números de sabermetrics subieron de valor, impulsando todo hacia el antiguo status quo- los equipos con dinero son los que pueden fichar a mejores jugadores según las sabermetrics, y se establece una carrera armamentística para ver quién puede encontrar métricas más efectivas que permitan descubrir a más jugadores infravalorados.

Así pues, tenemos que un análisis estadístico concienzudo nos lleva a unos resultados deportivos tangibles y un cambio sustancial en la operativa de los equipos deportivos y una validación del método analítico en un terreno aparentemente tan caótico y subjetivo como el deporte.

¿Es esto aplicable a otros deportes? ¿Podemos medir y optimizar el rendimiento deportivo?

Seguramente sí. Sin embargo, está clarísimo que hay muchos y populares deportes que están en pañales estadísticamente. El fútbol, deporte rey, prácticamente no tiene estadísticas. Su naturaleza fluida y continua no parece proporcionar muchas oportunidades de generar datos; aún hoy tras los partidos no vemos más que un puñado de estadísticas muy genéricas, de las cuáles muchas no parecen tener mucho valor. Se han hecho esfuerzos analíticos y ahora vemos estadísticas como los kilómetros recorridos por cada jugador, pero al menos no se han hecho públicas ninguna métrica que parezca útil. Así pues, sigue en la época de los analistas de sillón que dictaminan sobre la cualidad de los jugadores y muy probablemente, existe una ventana de oportunidad para que un analista logre un salto cualitativo que cambie el fútbol moderno. Seguramente dentro de las casas de apuestas (que cuentan con unos sofisticados métodos de análisis que estiman probabilidades en tiempo real durante el desarrollo de los partidos), ya haya quien esté trabajando en ello.

Por otra parte, observando el campo del motor vemos un caso bien distinto. Los equipos disponen de sofisticados datos telemétricos que permiten analizar hasta el más mínimo detalle de los movimientos del coche sobre la pista. Los sistemas de medición generan una cantidad de datos que seguramente hacen palidecer en cuanto al volumen a los datos de un partido de béisbol. Los datos de telemetría se utilizan extensivamente para analizar el rendimiento del coche y afinar su configuración, y para analizar la conducción de los pilotos y hallar puntos de mejora. Sin embargo, estos datos son coto privado de cada equipo y no circulan. Desgraciadamente, estos datos quizás nos permitirían responder a preguntas como quiénes son los mejores pilotos, que dado el gran peso del rendimiento del coche sobre el del piloto, a día de hoy son muy difíciles de contestar y quedan con un análisis muy superficial.

Editar