Cuando el Bournemouth de la Premier League iba perdiendo contra Luton Town por tres goles al comienzo de la segunda mitad, un empate parecía improbable y una victoria casi imposible. Después de cuatro goles de Bournemouth en el lapso de 33 minutos, los aficionados no podían creer lo que acababan de presenciar.
Pero ¿fue, de hecho, la Remontada Más Improbable de la temporada 2023-2024 de la Premier League? Después de procesar los datos —1,2 mil millones de filas, totalizando más de 10 mil millones de puntos de datos de los 380 partidos— determinamos que definitivamente lo fue.
La Remontada Más Improbable es uno de los dos premios de fin de temporada que la Premier League anunció el 21 de mayo, cada uno basado en un riguroso análisis de datos utilizando los servicios de Oracle Cloud Infrastructure (OCI).
Bournemouth se lleva el trofeo de la Remontada Más Improbable por su victoria 4-3 en su campo el 13 de marzo. Igual de impresionante fue el Gol Más Potente de la temporada, por el que el extremo del Aston Villa, Moussa Diaby, se lleva el trofeo gracias a su fuerte disparo contra Wolverhampton el 30 de marzo.
Para llegar a los ganadores de los premios, la Premier League se asoció con Oracle, que asignó a un científico de datos para analizar la enorme cantidad de información de los partidos utilizando varios servicios avanzados de OCI. A continuación, una mirada detrás de escenas a ese análisis.
La Remontada más Improbable: cómo se calcula
El científico de datos de Oracle, Brian Macdonald, llegó a los candidatos para este premio de equipos de la Premier League utilizando la estadística de Probabilidad de triunfo (Win Probability), una estadística de terceros que calcula la probabilidad de que un equipo asegure una victoria o un empate en cada partido, simulando el resto del partido 100 000 veces.
Ese modelo estadístico, basado en varios años de datos de partidos generados por Stats Perform, considera la puntuación actual en diferentes momentos a lo largo de los partidos, el tiempo restante en cada uno, el número de jugadores en cada equipo al iniciar los partidos (para tener en cuenta a cualquier jugador expulsado por una tarjeta roja) y si un equipo es local o invitado.
Utilizando OCI Data Science Service, Oracle analizó las probabilidades de victoria de cada equipo en intervalos de 30 segundos en cada uno de los 380 partidos para calcular qué equipo remontó desde la probabilidad de victoria más baja para derrotar a su oponente.
Para el ganador de la Remontada Más Improbable, Bournemouth, OCI Data Science determinó que Luton tenía una probabilidad de ganar del 97,6 % a los 49:44 del segundo tiempo, el porcentaje más alto de cualquier equipo durante la temporada que terminó perdiendo el partido. En este punto, Bournemouth tenía solo un 0,4 % de posibilidades de ganar.


El Gol más Potente: los datos muestran un claro ganador
Este premio de la Premier League reconoce al jugador cuyo tiro de gol tuvo la velocidad promedio más alta desde el momento en que fue golpeado hasta el momento en que cruzó la línea de gol, con la aclaración de que el golpe fue desde más allá de la línea de 18 yardas y no fue desviado.
El análisis de OCI Data Science reveló que el disparo de Moussa Diaby contra Wolves el 30 de marzo tuvo una velocidad promedio de 68,25 millas por hora (109,84 kilómetros por hora). Solo otro gol durante la temporada 2023-24 de la Premier League fue más rápido que 65 mph (el disparo de 65,01 mph de Eberechi Eze del Crystal Palace contra el Aston Villa el 19 de mayo).
La diferencia entre el décimo lugar y el segundo lugar fue de solo 3,2 mph. “El resto de los 10 primeros de esta categoría estaban todos más o menos cerca”, dice Macdonald. “Cada incremento era pequeño, y luego, pum, hay un gran salto para el ganador”.
Para los aficionados que ven desde casa, puede ser difícil discernir entre patadas con tanta potencia, particularmente cuando algunas pasan rozando el suelo de la cancha y otras se disparan derecho a la esquina del arco. “Es una de las razones por las que la analítica de datos es tan importante para estos premios”, dice Will Brass, el director comercial de la Premier League. “Los cálculos son complejos, involucran el seguimiento de jugadores y balones, así como un análisis detallado del momento en que se patea la pelota. Oracle Cloud Infrastructure nos da confianza en que estos cálculos son precisos y nos permite claridad a la hora de declarar al merecido ganador”.

Configuración: el uso del entorno de OCI
Macdonald dice que pudo configurar las instancias de OCI aplicadas a las dos evaluaciones de los premios en solo 30 minutos.
El primer paso fue escribir scripts de Bash en máquinas virtuales de OCI Compute para extraer datos de las API de los dos principales proveedores de datos de la Premier League y ponerlos en OCI Object Storage. Esos scripts extrajeron datos actualizados después de cada día de partidos.
Un proveedor es Segundo Espectro, que proporciona datos de ubicación sobre el posicionamiento (las coordenadas 3D) de los 22 jugadores en el campo, así como de la pelota en cada partido de la Premier League mediante el aprendizaje automático y los algoritmos de visión informática. El otro proveedor es Stats Perform, cuyo servicio Opta mejora los datos de localización para identificar los “eventos” de los partidos, como las patadas (incluida su ubicación en el campo, la distancia a la portería y si fueron con la izquierda o con la derecha), los saques de esquina, las faltas, las penas máximas, etc.
A partir de ahí, Macdonald subió los datos a Oracle Autonomous Data Warehouse, utilizando las capacidades JSON integradas del almacén de datos basado en la nube para manejar las estructuras complejas y anidadas necesarias para representar un partido de fútbol. Luego realizó una serie de análisis a profundidad, utilizando la plataforma de aprendizaje automático OCI Data Science.
En total, el análisis tomó miles de millones de puntos de datos de los 380 partidos para calcular innumerables métricas sobre cada juego y cada gol, generando finalmente una lista breve de candidatos para cada premio, para terminar con la selección por parte de la Premier League de un único ganador en cada categoría.
“La conexión a las API de los dos proveedores de datos fue probablemente la parte más complicada, porque tuvimos que seguir los pasos normales de autenticación por primera vez”, dice Macdonald. “Tan pronto los activé, simplemente se trata de ejecutar los mismos comandos una y otra vez. El resto fue fácil”.
El entorno de OCI ha generado los resultados para los dos premios de fin de temporada de la Premier League durante las últimas tres temporadas, y ha actualizado las tablas de clasificación y los paneles de control para cada premio después de cada partido. Los resultados preliminares se utilizaron en las redes sociales para ayudar a promocionar estos eventos y goles especiales a lo largo de la temporada, pero conservando a los principales candidatos en secreto.
Macdonald explica: “Hicimos muchos análisis en profundidad y discusiones de los resultados, validando y comparando los datos, asegurándonos de que no nos perdiéramos nada”.
Productos clave de OCI utilizados
OCI Data Science Service, el eje de los análisis, es una plataforma completamente gestionada y sin servidor para que los equipos de ciencia de datos construyan, entrenen y gestionen modelos de aprendizaje automático de alta calidad. Las capacidades automatizadas de aprendizaje automático examinan rápidamente los datos y recomiendan los algoritmos óptimos, mientras ajustan el modelo y explican sus resultados.
Las herramientas de OCI Data Science de arrastrar y colocar para la preparación e integración de datos facilitan a los usuarios mover datos a un lago o almacén. Las herramientas de seguridad de la plataforma y las interfaces permiten que los usuarios con roles diferentes participen en proyectos y compartan modelos. La explicación independiente de los modelos ayuda a los científicos de datos, analistas de negocios y ejecutivos a confiar en los resultados.
Oracle Autonomous Data Warehouse es un servicio de almacén de datos basado en la nube que elimina las complejidades operativas mediante la automatización del aprovisionamiento, la configuración, la aplicación de parches, el ajuste, la ampliación y las copias de seguridad.
OCI Compute proporciona una capacidad informática rápida, flexible y asequible —desde servidores con hardware dedicado y máquinas virtuales hasta contenedores ligeros— para adaptarse a cualquier carga de trabajo. OCI Compute ofrece instancias de máquina virtual y con hardware dedicado con una flexibilidad única para ofrecer una relación de precio-rendimiento óptima.
OCI Object Storage permite a los usuarios almacenar de forma segura cualquier tipo de datos en su formato nativo. Con redundancia integrada, OCI Object Storage es ideal para crear aplicaciones modernas que requieren escalabilidad y flexibilidad, ya que se puede usar para consolidar múltiples fuentes de datos con fines de analítica, copias de seguridad o archivo.
Macdonald también utilizó Oracle Analytics Cloud para presentar una tabla completa de clasificación para cada premio, lo que le permitió reordenar los datos según diferentes criterios, por ejemplo, para incluir candidatos al Gol Más Potente por disparos que ocurrieron dentro del área de 18 yardas o para reducir el análisis a jugadores de un determinado equipo.
Oracle Analytics Cloud proporciona un conjunto completo de herramientas para obtener y compartir insights de datos. La plataforma permite a los analistas visualizar cualquier hallazgo de datos en cualquier dispositivo. También permite a los usuarios ingerir, perfilar y limpiar datos utilizando una variedad de algoritmos, así como agregar datos y luego ejecutar modelos de aprendizaje automático a gran escala.