El teorema de Bayes. La Ecuacion del Juicio en la Toma de Decisiones

 Por Gredy Garrido

El mercado moderno se caracteriza por el uso intenso e intensionado de algoritmos que permiten comprender los diferentes tipos de consumidores. 

Desde la antiguedad el hombre ha buscado y descubierto “los codigos” que rigen a la sociedad y el mercado. Entre ellos el Teorema de Bayes o la ecuacion del juicio ,como es tambien conocida.

Historia del Teorema:  

En el ano 1761, Dr. Richard Price encontro un articulo escrito por su colega y amigo Thomas Bayes. En el mismo se invita al lector a considerar la ocurrencia de un evento , si ya previamente se conoce que este ha ocurrido. Bayes usa, magistralmente,  la puesta del sol como ejemplo. El razonamiento puede ser resumido como sigue; Si consideramos un parámetro, antes la primera puesta del sol, no existe información previa y por lo tanto todos los valores del parámetro son equiprobables . Por lo que, podemos concebir que el sol sale todos los días tiene un parámetro =1, si esto solo ocurre la mitad de la veces o días, entonces =0.5 , o que si esto solo acurre un día de 100 , =0.01.

Imaginemos que la persona haya visto 100 puestas de sol, entonces la probabilidad escrita como P(>.99/100) expresa la correcta probabilidad de sus estimaciones. Bayes mostro usando una versión de su ecuación que en base a la información previa podría expresar que P(>.99|100)=1-.99101= 63.8%. Es decir , existe a chance del 36.2%(1-63.8), de que la persona se haya equivocado y que el sol se ponga menos de lo que él cree.

De acuerdo a Vernon , muchos científicos fallan en reconocer que el poder real de Bayes radica en como impone la necesidad de revelar la manera como Ud. razono o pensó antes de hacer un experimento o estudio. El argumento o hipótesis debe ser desglosado en diferentes modelos y buscar su apoyo uno por uno.

Asi mismo, Sumpter, sostiene que Bayes ha transformado como hacemos Ciencia y Ciencia Social en las ultimas decadas pasadas. El teorema o regla se ajusta perfectamente a la forma cientifica de ver el mundo. Los experimentalistas colectan Data (D) y los teoricos  desarrollan hipotesis o modelos (M) en relacion a la data. El teorema de Bayes junta los 2 componentes.

 La Formula y su Aplicacion:

P(A|B)= P(A).P(B|A)/[P(B)]

El algebra de Bayes es sencilla o de operaciones muy comunes. Pero su importancia es no solo por su simplicidad aritmetica , si no por el rigor de revisar los escenarios decisionales o unidades de decision segun como sea el caso.

En un ejemplo numerico con conocimiento previo veremos:

Sea A= ocurre un incendio de alta intensidad.

Y B=Se observa Humo.

Digamos que P(B|A)= la probabilidad de Humo dado que se observo fuego o incendio. Entonces consultamos la data y se obtiene que:

P(A)=1% , ES DECIR ESTOS INCENDIOS SON RAROS DE OBSERVAR.

P(B)=10% es relativo a que se acostumbra observar humo en  parrilladas y otras actividades. Luego tratemos P(B|A)= La probabilidad de observar Humo dado que hubo fuego  . Asumimos que P(B|A)=90%, es decir siempre un fuego o incendio peligroso esta acompañado de humo.

Ahora definimos P(A|B)=La probabilidad de un incendio peligroso dado que observamos humo.  Considerando la data antes mencionada se obtiene que:

P(A|B)=P(A)*P(B|A)/P(B)=0.01(.90)/0.1=0.09=9%. En conclusion, es importante chequear o revisar cuando se observa humo debido a que existe la posibilidad real que sea un incendio peligroso. Esta conclusion suena muy academica , pero en realidad es utilizada en algoritmos muy importantes y “poderosos” , que controlan nuestra actividad en las redes sociales.

Algunas Aplicaciones del Teorema de Bayes:

  1. Los Falsos Positivos y Negativos

Entre las aplicaciones practicas del teorema podemmos mencionar a las definiciones de Falsos Positivos y Falsos Negativos.

Un Falso Positivo (F+ )= cuando un instrumento de detectar un atributo indica que un ente u objeto es “positivo” cuando  pertenece al grupo Negativo. Por otra parte, un Falso Negativo(F–  ) es cuando en lugar de  Negativo, este indica un positivo.

Expresado coloquialmente, “El término de falso positivo hace referencia a un hecho que se presume como verdad pero que al final no termina siendo tal y que suele aplicarse en diversos ámbitos, como por ejemplo la estadística, en informática, en medicina, entre otros, por nombrar los casos más comunes. Para ser más específicos en la Medicina es un error que se presenta al realizar una exploración física o una, siendo su resultado positivo para una enfermedad determinada, cuando en realidad existe la misma. Por otro lado en la estadística se denomina así al error de tipo I en un estudio de investigación experimental. Finalmente en informática se aplica a un error falso positivo, que un software de antivirus informa que un archivo está infectado, pero realmente dicho archivo u objeto está libre de virus.”

Estos resultados permiten evaluar propuestas de modelos de pronostico y/o prescriptivos mediante la “matriz de confusion” en estudios de Machine learning (ML).

El Classificador “Naive” de Bayes.

En el tratamiento de la data para lograr mas eficientes resultados en los estadisticos de prueba, los algoritmos clasifican la porcion de data (muestra) que resultada mas apropiada para un mejor resultado . Para un modelo se “entrena” con data clasificada o colectada mediante modelos probabilisticos como la “posterior” probabilidad en Bayes.

En la actualidad se conoce de aplicaciones en las áreas de salud, medio ambiente, educación, economía y otras nuevas áreas como la biotecnología de alimentos o la ingeniería espacial.

Para entender y conocer a los consumidores y por ende al mercado, la ecuación de Bayes o Ecuación del juicio, nos enseña a evaluar y organizar los resultados de nuestra investigación o modelo propuesto, con hipótesis que pueden ser probadas estadísticamente con data.

Professionals Consulting VD S.A Database Management Company en Caracas