Las probabilidades, los ganadores del mundial de fútbol y la Ecuación logística

El mundial de futbol es un evento de alcance continental que impacta a un mercado de millones de personas y unos 32 países directamente. De hecho, solo clasifican 32 y se forman 8 grupos de 4. Este se prepara cada 4 años en algún país que sirve de anfitrión. Existen además organizaciones que pronostican los ganadores, así como también las apuestas o juegos de azar, las cuales consideran como base estos pronósticos.

La Ecuación del Apostador

En el 2018 se publicó un artículo en “the Economist” que impacto de forma importante a los medios de comunicación. De acuerdo con su autor, David Sumpter (2015), su modelo seria:

P(Favorito Gana)= 1/1+αXβ

Donde X=representa el pronóstico o proporción y α,𝛽 son parámetros. Para una mejor comprensión de la ecuación revisamos su caso simple:

Caso #1

Para tener una idea de su aplicación, consideremos el siguiente escenario. X=3/2 y α=1,𝛽 = 1 .

Ecuación: P(gana el favorito)= 1/1+3/2 = 2/2+3 = 2/5 = .40 o 40%

Es decir, el favorito tiene una probabilidad de ganar del 40%. En el 60% de los casos el partido es empate o con el “no favorito” como ganador. Sin embargo, en este caso el valor monetario esperado es igual cero o no produce ningún dinero. Esto es, si el favorito cuando gana recibe $ 1.50 , entonces gana 2 de 5 y pierde en 3 oportunidades de 5 un $1. Entonces, 1.5(2/5)-1(3/5)=(3/5)-(3/5)=0

Caso #2

Cuando X=3/2 y α=116,𝛽 = 1.25

P(gana el Favorito)=1/(1 + 1.16𝑋1.25)= .6987

Los valores anteriores se estimaron usando data del mundial de futbol 2014 y la regresión logística de COX. El análisis comparativo entre los pronósticos de los medios informativos y la regresión logística indican un sesgo para algunos favoritos, que en algunos casos resultan perdedores. Por ejemplo, en el mundial 2014.

FavoritoNo favoritoRatioProbabilidad favorito gane 1/1+xRegresión logística 1/1+1.16X1.25
EspañaAustralia11/3073%75%
InglaterraUruguay19/2051%48%
SuizaHonduras13/2566%66%
ItaliaCosta Rica3/563%62%
Origen: The Betting Equation. Pag 39. Sumpter(2021).

Estos resultados demostraron que aquellos favoritos como Italia e Inglaterra no fueron ganadores y según la regresión logística su probabilidad era menor que la estimada por los medios informativos. Es decir, estos países tenían una sobreestimación para tal evento. Para Inglaterra en lugar de 51% era 48%, por lo tanto el favorito y ganador fue Uruguay.

La regresión logística no solo se aplica a pronósticos en juegos de azar. La misma se usa en métodos de clasificación en el mercado digital , por ejemplo Facebook, Spotify y otros medios Sociales. Para la determinación de fallas en procesos o sistemas y para el análisis de Preguntas Si/No.

Sin embargo es importante recordar que el principio básico derivado de la practica y uso de modelos para aquellos que los utilizan como herramientas para tomar decisiones es:

“Apostar no es predecir el futuro con certeza. Es la manera como Uds. identifican las pequeñas diferencias de ver el mundo con respecto a otros.” Así mismo, si los parámetros estimados permiten entender la data, una ventaja a su favor aparecería. además, para tener alguna ventaja competitiva se requiere mucha práctica. Ajustar las estimaciones lleva tiempo y se mejora la estimación mediante prueba y error. Las expectativas deben ser el ganar algunas veces más que perder, a medida que se juega consecutivamente.

La regresión logística ha permitido el desarrollo de modelos complejos para variables no numéricas o categóricas, lo cual es un factor que potencia el desarrollo de la AI, AR, IOT y otros algoritmos. Su versión para mejorar los pronósticos de un gran número de juegos desde futbol hasta carrera de caballos, es la ecuación del apostador. Parafraseando a Cox, muchos problemas en las áreas de la psicología, la medicina e industria podrán ser resueltos usando la misma familia de funciones matemáticas, de allí su importancia futura.

campo de futbol
Professionals Consulting VD S.A Database Management Company en Caracas