Teorema de Bayes
En este articulo Se hablará sobre el teorema de bayes, que es este teorema, para qué sirve y como poder usarlo en situaciones reales en probabilidad, con fórmulas y ejemplos.
¿Que es el teorema de Bayes?
El teorema de Bayes es un método que se usa en probabilidad el cual es útil para encontrar una probabilidad condicionada, esto quiere decir que se calcula la probabilidad de un suceso cuando ya ha ocurrido otro suceso que afecta la probabilidad del primer suceso.
Cómo el teorema de Bayes se usa cuando hay múltiples sucesos que están relacionados, una herramienta que se usa para poder entender mejor las relaciones que hay entre sucesos son los diagramas de árbol, si en algún caso no se sabe como armar un diagrama de árbol, por favor, ir a la parte de los ejemplos de este artículo, ahí se desarrollarán varios ejemplos donde se muestra como armar estos diagramas cuando se resuelven ejemplos del teorema de Bayes.
Ejemplo básico del teorema de Bayes
Para comprender mejor en que situaciones o en que tipo de problemas se hace uso del teorema de Bayes se pondrá el siguiente ejemplo: Se hizo una encuesta a un grupo grande de personas donde se les preguntaba el genero y si ellos practicaban algún deporte o hacían ejercicio en general, los resultados de la encuesta fueron los siguientes: el 40% por ciento de los encuestados eran hombres y el 60% eran mujeres, de los cuales el 80% de los hombres y el 50% de las mujeres hacían ejercicios.
Tomando como referencia el supuesto anterior, las preguntas que se hacen normalmente en problemas son del tipo: ¿Cuál es la probabilidad de que al seleccionar a una persona al azar esta sea hombre y a la vez haga ejercicio?, que en este caso se buscaría p(HnE) siendo H la probabilidad que sea un hombre y E la probabilidad que haga ejercicio, esto se hace simplemente multiplicando las probabilidades y se obtiene el resultado: p(HnE)0.4*0.8=0.32.
Pero el teorema de Bayes se usaría si la pregunta se hace al revés, es decir:¿Cuál es la probabilidad que si se selecciona a alguien que haga ejercicios, esta sea hombre?, en este planteamiento lo que se busca es lo contrario a lo que se tiene, por que lo que se da en el enunciado es el porcentaje de los géneros y que porcentaje de cada genero hace ejercicio, pero no se tienen los porcentajes generales de las personas que hacen ejercicio o no, sino que las probabilidades están repartidas entre cada genero, y es en estos casos que se usa el teorema de Bayes.
Viéndolo desde un diagrama se puede observar que en la probabilidad normal se encuentran las ramas de derecha a izquierda (como puede ser p(D|A), es decir la probabilidad del suceso D habiendo ocurrido el suceso A ), pero con el teorema de Bayes se es capaz de encontrar las ramas de izquierda a derecha (como podría ser p(A|D), es decir la probabilidad que ocurra el suceso A habiendo antes ocurrido el suceso D ).
Fórmula del teorema de Bayes
- Fórmula del teorema del Bayes
- p(a | b) = p( b | a) * p(a)p (b)
Ejemplos del teorema de Bayes
Ejemplo 1: Se resolverá el ejemplo que se planteó anteriormente: Se hizo una encuesta a personas en las que se les preguntaba el género y si hacían ejercicios, los resultados fueron: el 40% hombres y 60% mujeres, y el 80% de los hombres y el 50% de las mujeres dijeron que practicaban algún deporte o hacían ejercicios. Conociendo estos datos, si se selecciona una persona al azar de las que respondió que hacía ejercicios ¿Cuál es la probabilidad que esta persona sea un hombre?
p(d) = persona que practica deporte p(h) = persona que es hombre
Lo primero que se hará es plantear el diagrama de árbol para tener una visión mas clara de los datos
Como se puede observar en este diagrama, p( d | h) quiere decir la probabilidad que un hombre haga deporte, y esto ya nos lo da el problema (que es el 80%), por lo que solamente se sustituirá, al igual que el porcentaje de hombres que hay p(h), que como dice en el enunciado es el 40%
Algo bien importante que se tiene que calcular es p(d), que es la probabilidad general que alguien practique un deporte sin importar su género, porque esto no se nos da en el problema explícitamente, asi que se tiene que calcular, para calcular esto lo que se hace es realizar la regla de la multiplicación en cada rama, es decir multiplicar el porcentaje de mujeres que hay con el porcentaje de mujeres practican algún deporte, y el porcentaje de hombres por el porcentaje de hombres que practican algún deporte y al final sumar estos resultados, asi como se hace a continuación.
- p(d) = (0.4 * 0.8) + (0.6 * 0.5)
- p(d) = 0.32 + 0.3
- p(d) = 0.62
Ahora que se tienen todos los elementos que se usan en la fórmula del teorema de Bayes se resuelve el problema.
- h = hombre, d = hace deporte
- p(h | d) = p( d | h) * p(h)p (d)
- p(h | d) = 0.8 * 0.40.62
- p(h | d) = 0.320.62
- p(h | d) = 0.5161 * 100%
- p(h | d) = 51.61%
Ejemplo 2: En una fábrica de latas se producen latas de dos tamaños, de 25 ml y de 40 ml, si se sabe que hacen la misma cantidad de ambas latas y que un 1% de las latas de 25ml y un 4% de las latas de 40ml salen defectuosas ¿Cuál es la probabilidad que al seleccionar una lata de las defectuosas al azar, esta sea de 40ml?
p(40ml) = lata de 40 ml p(d) = lata defectuosa
- Se encuentra la probabilidad que una lata defectuosa sea de 40ml
- p(40ml | d) = p( d | 40ml) * p(40ml)p (d)
- p(40ml | d) = 0.04 * 0.50.01*0.5 + 0.04*0.5
- p(40ml | d) = 0.020.005 + 0.02
- p(40ml | d) = 0.020.0205
- p(40ml | d) = 0.8 * 100%
- p(40ml | d) = 80%
Ejemplo 3: En las elecciones de un país hay 2 candidatos a la presidencia, el candidato A y el candidato B, y en los resultados de las selecciones de este pais se sabe que un 75% de la población es de clase media o baja y un 25% es de clase alta, si por el candidato A votó un 90% de la clase alta y un 5% de la clase media y baja, y se elige una persona al azar de los que votaron por el candidato A ¿Cuál es la probabilidad que este sea de la clase media o baja?
p(cA) = votó por el candidato A p(mb) = persona de clase media o baja
- Se encuentra la probabilidad alguien que votó por el candidato A sea de clase media o baja
- p(mb | cA) = p( cA | mb) * p(mb)p (cA)
- p(mb | cA) = 0.05 * 0.750.05*0.75 + 0.25*0.9
- p(mb | cA) = 0.0375 0.0375 + 0.225
- p(mb | cA) = 0.0375 0.2625
- p(mb | cA) = 0.1429 * 100%
- p(mb | cA) = 14.29%