Ir al contenido principal

Teoremas de probabilidades

 

1. Suma de probabilidades

Sean A y B dos eventos definidos en el espacio muestra S. La probabilidad de que ocurra el evento A o el evento B, o ambos, es:

            P(A∪B) = P(A) + P(B) - P(A∩B)

donde:

- P(A) representa la probabilidad de ocurra A,

- P(B) representa la probabilidad de ocurra B,

- P(A ∪ B) representa la probabilidad de ocurra A o B, o ambos, y

- P(A ∩ B) representa la probabilidad de ocurran A y B conjuntamente.

Cuando dos o más eventos están definidos de tal manera que la ocurrencia de uno imposibilita la ocurrencia de los demás, se dice que son mutuamente excluyentes, y la probabilidad de que ocurran conjuntamente es entonces igual a cero.

Se puede deducir que, para dos eventos mutuamente excluyentes, por ejemplo Q y R:

            Q = {e₁, e₂, e₃} ; R = {e₄, e₅} ;

Es evidente que:

- P(Q) = P(e₁) + P(e₂) + P(e₃)

- P(R) = P(e₄) + P(e₅)

Y por lo tanto:

P(Q∪R) = P(e₁) + P(e₂) + P(e₃) + P(e₄) + P(e₅) = P(Q) + P(R)

Si dos eventos A y B no son mutuamente excluyentes, como se muestra en el diagrama de Venn de la figura, se puede deducir que: P(A∪B) = P(A) + P(B) - P(A∩B)

Sea A' el evento: no A.

            P(A∪B) = P(A) + P(B∩A')

            P(B) = P(A∩B) + P(B∩A')

Sustituyendo P(B∩A') de la segunda ecuación en la primera, resulta:

            P(A∪B) = P(A) + P(B) – P(A∩B)

Con lo que queda demostrado el teorema.

Ejemplo:

Se lanzan dos dados. ¿Cuál es la probabilidad de que se obtenga una suma igual a 10 o una diferencia igual a 1?

Sean los eventos: 
            A: suma igual a 10
            B: diferencia igual a 1

Dado que A y B son mutuamente excluyentes (es fácil darse cuenta), se puede emplear la siguiente fórmula:

P(A∪B) = P(A) + P(B) = 3/36 + 10/36 = 13/36

En el gráfico de la figura se aprecia que los dos eventos compuestos: el evento A, representado por círculos, y el evento B, representado por aspas, son mutuamente excluyentes.

¿Y cuál será la probabilidad de obtener una suma igual a 8 o una diferencia igual a 2?

Sean los eventos: 

            C: suma igual a 8

            D: diferencia igual a 2

En el gráfico de la figura se aprecian estos dos eventos compuestos: el C, representado por círculos, y el D, por aspas. Se puede apreciar que hay dos eventos simples que pertenecen a ambos eventos C y D; se concluye entonces que los eventos C y D no son excluyentes.


Dado que C y D no son mutuamente excluyentes:

            P(C∪D) = P(C) + P(D) – P(C∩D) = 5/36 + 8/36 – 2/36 = 11/36

Generalización del teorema de la suma

El teorema de la suma se puede generalizar de la siguiente manera: la probabilidad de que ocurra el evento E1, o el evento E2, ..., o el evento EN, es:

Ejemplo:

Suponga que, en la ciudad de Piura, el 25 % de la población adulta lee el diario El Tiempo, el 40% lee el diario Correo, el 10% lee el diario República y el 25% restante lee otros diarios. Además, se sabe que el 10% lee El Tiempo y Correo, el 5% lee El Tiempo y República, el 5% lee El Tiempo y otros, el 8% lee Correo y otros, y el 3% lee El Tiempo, Correo y otros. Si se selecciona aleatoriamente un poblador, ¿cuál es la probabilidad de que lea Correo, El Tiempo u otros?

Aunque el diagrama de Venn de la figura es suficiente para visualizar y determinar esta probabilidad, a continuación se hace el cálculo aplicando el teorema generalizado de la suma:

            P(Correo  El T.  otros) = P(Correo) + P(El T.) + P(otros) – P(Correo  El T.)
            – P(Correo  otros) – P(El T.  otros) + P(Correo  El T.  otros)
            = 0,40 + 0,25 + 0,25 – 0,10 – 0,08 – 0,05 + 0,03 = 0,70 

Dicha probabilidad se puede corroborar elaborando un diagrama de Venn, como el de la figura, e incluso se pueden calcular otras probabilidades con suma facilidad.


2. Probabilidad condicional y regla de la multiplicación

Sean dos eventos A y B:

            P(A\B) = P(A∩B) / P(B)

Donde P(A\B) representa la probabilidad de que ocurra el evento A, dado que ha ocurrido (o está ocurriendo, o va a ocurrir) el evento B, y se le denomina probabilidad condicional, pues la ocurrencia del evento A está condicionada a la ocurrencia del evento B.

Ejemplo:

Se lanzaron dos dados y se sabe que la suma resultó igual a 8. ¿Cuál es la probabilidad de que la diferencia sea igual a 2?

Sean los eventos: 

            A: diferencia igual a 2

            B: suma igual a 8

Si la suma es 8, entonces el espacio muestra queda restringido a cinco posibles eventos:

            S = {(2,6),(3,5),(4,4),(5,3),(6,2)}

Por lo tanto, si de los cinco eventos posibles, se tendría éxito en dos de ellos, (3, 5) y (5, 3), entonces:

            P(A\B) = 2/5

Como se ve en la figura, el numerador "2" representa el número de veces en que pueden ocurrir A y B conjuntamente, y el denominador "5" representa el número de veces en que puede ocurrir B.

Entonces se puede deducir:


Aplicando esta fórmula al problema, se tiene el mismo resultado:


De la definición de probabilidad condicional se puede deducir que:

            P(A∪B) = P(B) P(A\B)

            P(A∪B) = P(A) P(B\A)

Estas expresiones resultan muy útiles para determinar una probabilidad conjunta, que usualmente es más difícil de determinar que la probabilidad condicional.

Ejemplo:

Una caja contiene 4 canicas blancas y 6 negras. Si se extraen dos aleatoriamente, ¿cuál es la probabilidad de que:

a) Las dos sean blancas?

Sean los eventos:

            1B: canica blanca en la primera extracción

            2B: canica blanca en la segunda extracción

Entonces:           

            P(1B∩2B) = P(1B) P(2B\1B) = (4/10) (3/9) = 2/15

b) La primera sea blanca y la segunda negra?

            Sea el evento 2N: canica negra en la segunda extracción

            P(1B y 2N) = P(1B) P(2N\1B) = (4/10) (6/9) = 4/15

c) Una sea blanca y la otra negra?

            Sea el evento 1N: canica negra en la primera extracción

Hay dos formas excluyentes de obtener una canica blanca y una negra:

            P = P(1B) P(2N\1B) + P(1N) P(2B\1N) = 4/15 + 4/15 = 8/15

Generalización de la regla de la multiplicación

Sean los eventos E₁, E₂,..., Eₙ ; se puede generalizar la regla de la multiplicación:

En el primer miembro se expresa la probabilidad de que ocurran conjuntamente los eventos E₁1, E₂,..., Eₙ. Si la probabilidad de que ocurran estos n eventos, en cualquier orden, es siempre la misma; entonces esa probabilidad se puede obtener multiplicando por el número de formas en que se pueden permutar los n eventos.

Ejemplo 1:

En un lote de 100 pernos hay 4 defectuosos. Si un comprador escoge 20 pernos aleatoriamente, ¿cuál es la probabilidad de que se lleve 2 pernos defectuosos? (Esta probabilidad a priori ya fue calculada en el ejemplo 4 del artículo "Cálculo de Probabilidades").

Si el comprador se lleva 2 pernos defectuosos, de un total de 4; se llevará también 18 pernos no defectuosos, de un total de 96.

Ejemplo 2:

De una baraja completa de 52 cartas, se extrae una "mano" de 5 cartas. ¿Cuál es la probabilidad de obtener: (Estas probabilidades ya fueron calculadas en el ejemplo 5 del  artículo "Cálculo de Probabilidades").

a) Dos espadas, dos corazones y un diamante?

b) un póker?

Eventos independientes

Se dice que dos eventos A y B son independientes, si la ocurrencia (o no ocurrencia) de uno de ellos no influye en la ocurrencia (o no ocurrencia) del otro. Es decir:

            P(A\B) = P(A)    y ...   P(B\A) = P(B)

Si se cumple una de estas dos ecuaciones, también se verifica la otra. Por ejemplo, si:

            P(A\B) = P(A)

Entonces:

Por lo tanto:

            P(B\A) = P(B), tal como se quería demostrar.

Finalmente se concluye que, para que dos eventos sean mutuamente independientes, es condición necesaria y suficiente que:

            P(A∩B) = P(A) P(B)

Inversamente, si dos eventos A y B son mutuamente independientes, entonces es válida la ecuación anterior.

Generalizando, la probabilidad de que ocurran conjuntamente n eventos independientes es:

            P(E∩E∩ ... ∩E) = P(E) P(E)...P(E)

Problemas resueltos:

1) Una fábrica elabora los productos A, B, C y D mediante cuatro procesos que son independientes entre sí. Usualmente son defectuosos el 3%, 5%, 5% y 4% de los productos A, B, C y D respectivamente. Si se extrae aleatoriamente un producto de cada tipo, ¿cuál es la probabilidad de que:

a) Los cuatro sean defectuosos?

            P = (0.03)(0.05)(0.05)(0.04) = 3(10)⁻⁶

b) A y B sean defectuosos, y C y D no lo sean?

            P = (0.03)(0.05)(0.95)(0.96) = 1,368 (10)⁻³

2) De una ciudad donde fuman el 30% de los ciudadanos mayores de edad, se toma una muestra de 6 de ellos. ¿Cuál es la probabilidad de que 3 de ellos fumen?

Se calcula la probabilidad de que los tres primeros fumen y los tres últimos no fumen, y se multiplica por el número de formas en que se pueden ordenar tres fumadores y tres no fumadores.

            P = (0.30)(0.30)(0.30)(0.70)(0.70)(0.70) (6!/(3!3!)) = 0,1852

3) Un sistema consta de seis relés que están conectados en serie y en paralelo, tal como se muestra en la figura.

La probabilidad de que cada relé esté cerrado es 0,90. Si los relés funcionan independientemente, ¿cuál es la probabilidad de que pase la corriente de A a B?

Sea Ci el evento: cerrado el i-ésimo relé. Para que pase la corriente de A a B debe pasar por el relé 1, luego por el relé 2 o por el relé 3, y luego por los relés 4 y 5 o por el relé 6. Por lo tanto:

            P = P[C1  (C2  C3)  [(C4  C5)  C6 ] ]

La probabilidad de que la corriente pase por 2 o 3 (o por ambos) se puede calcular fácilmente como: 1 – P(no pase por 2 ni 3). De la misma forma se puede calcular la probabilidad de que pase por 4 y 5, o por 6, como se muestra a continuación:

            P = (0,90)[1 – (0,10)(0,10)][1 – (1 – 0,90´0,90)(0,10)] = 0,874

4) Una persona lanza dos dados indefinidamente hasta obtener una suma igual a 2. ¿Cuál es la probabilidad de que sea necesario realizar un quinto lanzamiento?

Para que sea necesario realizar el quinto lanzamiento, en los 4 primeros no debe haber salido suma igual a 2. Por lo tanto:

            P = (35/36)4 = 0,893

3. Teorema de particiones: suma y multiplicación

Sean los eventos E₁, E₂,..., Eₙ una partición del espacio muestra S, es decir, todos mutuamente excluyentes, de tal forma que la unión de todos conformen el espacio muestral S. Sea además un evento E, perteneciente a S, como se muestra (sombreado) en la figura.

Entonces podemos decir:

            P(E) = P(E∩S) = P [E ∩ (E₁ ∪ E₂ ∪ ... ∪ Eₙ)]

            P(E) = P(E∩E₁) + P(E∩E₂) + ... + P(E∩Eₙ)

            P(E) = P(E₁) P(E \ E₁) + P(E₂) P(E \ E₂) + ... + P(Eₙ) P(E \ Eₙ)

            P(E) = ∑P(Eₖ) P(E\Eₖ)

Ejemplo 1:

Una empresa produce un componente mecánico. De la experiencia adquirida se ha determinado que el 10% de la producción es defectuosa. La producción es sometida a un control de calidad que acepta con una precisión del 95% los componentes que realmente son buenos, y rechaza con una precisión del 85% los componentes que realmente son defectuosos. Determine la probabilidad de que un componente sea aceptado.

Sean:

            P(D) = 0,10 = probabilidad de que un componente sea defectuoso

            P(B) = 1 – 0,10 = 0,90 = probabilidad de que un componente sea bueno

            P(A) = probabilidad de que un componente sea aceptado

            P(R) = probabilidad de que un componente sea aceptado

            P(A \ B) = 0,95 ; entonces: P(R \ B) = 0,05

            P(A \ D) = 0,15 ; entonces: P(R \ D) = 0,85

En la siguiente figura se representa un diagrama de árbol donde se ve que un componente puede ser aceptado de dos formas (mutuamente excluyentes): siendo bueno o siendo defectuoso.

En la siguiente figura se representa el mismo problema mediante un diagrama de Venn. En este caso la probabilidades son representadas como porcentajes. El área sombreada representa el porcentaje de componentes mecánicos que han sido aceptados en el control de calidad, ya sean componentes buenos o defectuosos. Si el 95% de los componentes buenos son aceptados, se deduce que el porcentaje de componentes aceptados y buenos será el 95% del 90%. Si el 15% de los componentes defectuosos son aceptados, se deduce que el porcentaje de componentes aceptados y defectuosos será el 15% del 10%. El porcentaje de componentes aceptados será entonces la suma de 95 (90/100) + 15 (10/100), es decir 87%.

Aplicando el teorema de suma y multiplicación se llega a la misma respuesta:

            P(A) = P(B)P(A \ B) + P(D)P(A \ D)

            P(A) = (0,90)(0,95) + (0,10)(0,15) = 0,87

Es decir, el 87% de los componentes mecánicos son aceptados por el control de calidad. Otra forma de visualizar este problema, expresando las probabilidades como porcentajes, se muestra en la siguiente tabla, donde se resaltan los datos del problema.

La probabilidad de que el componente sea aceptado o de que sea rechazado puede calcularse sumando las columnas correspondientes.

Ejemplo 2:

Un método muy empleado por investigadores estadísticos para obtener información es el de efectuar encuestas personales. A menudo resulta importante investigar sobre temas muy personales, que pondrían en aprietos al sujeto encuestado, ocasionando que dé respuestas falsas o que no conteste, deformando así los resultados de la encuesta. Para aminorar este problema, Warner ideó la "Técnica de la respuesta aleatoria", que permite que el encuestado escoja al azar una de dos preguntas: la pregunta personal, motivo de la encuesta, o una pregunta de control. Así, sólo él sabrá qué pregunta contestó en realidad, y se mantiene su privacidad. Por ejemplo, supóngase que se desea estimar el porcentaje de alumnos secundarios de una ciudad que no resuelven por su cuenta las tareas para la casa. Se hacen 1000 encuestas con las siguientes instrucciones: Antes de contestar lance una moneda: si sale cara conteste la pregunta A, y si sale sello conteste la pregunta B. Sólo conteste SÍ o NO.

A: ¿Resuelve usted las tareas para la casa por su cuenta?

B: ¿Nació su padre en enero, febrero, marzo, abril o mayo?

Supóngase que, una vez efectuadas las encuestas, hay 455 respuestas afirmativas y 545 negativas. ¿Qué porcentaje de alumnos no resuelve por su cuenta las tareas para la casa? Esto equivale a calcular la probabilidad de que un alumno no resuelva por su cuenta las tareas para la casa.

Sean: 

        P(NO) = probabilidad de contestar NO a cualquiera de las dos preguntas.

        P(A) = probabilidad de que al alumno conteste la pregunta A (que obtenga cara).

        P(B) = probabilidad de que al alumno conteste la pregunta B (que obtenga sello).

Considerando que se puede contestar NO de dos formas diferentes (a las dos preguntas), mutuamente excluyentes, se plantea:

            P(NO) = P(A)P(NO \ A) + P(B)P(NO \ B)

            0,545 = (0,5)P(NO \ A) + (0,5)(7/12)

            P(NO \ A) = 0,5067

En la siguiente figura se traza un diagrama de árbol que nos permite visualizar con suma facilidad el planteamiento anterior.

Se concluye que, aproximadamente, el 50,67 % de los alumnos secundarios de la ciudad no resuelve por su cuenta las tareas para la casa. De la misma forma que con el problema anterior, se puede plantear la siguiente tabla:

Como se ve, los datos de la primera fila pueden obtenerse restando los de la segunda fila del total. Se deduce entonces que la probabilidad de contestar NO, dado que se trata de la pregunta A es: 253,33/500 = 0,5067. Esto equivale a decir que 50.67 % de los alumnos secundarios de la ciudad no resuelve por su cuenta las tareas para la casa

4. Teorema de Bayes

Dada la misma partición conformada por los eventos E₁, E₂,..., Eₙ; y dado el evento E, comentados en el teorema de suma y multiplicación, se puede deducir fácilmente:

            P(Eₖ\E) = P(Eₖ∩E) / P(E)

Se trata de una probabilidad condicional, que incluye las reglas de suma y multiplicación de probabilidades. Tiene mucha importancia pues ha servido para desarrollar la inferencia o estimación bayesiana, que, mediante el empleo de datos experimentales llega a estimar probabilidades subjetivas con buena precisión.

Ejemplo 1:

Suponga que el concesionario de la cafetería de una universidad está tratando de reducir el número de clientes no pagan sus cuentas al final del año. Él está dispuesto a cancelarles el crédito a los clientes que se demoren más de una semana en los pagos que deben realizar a fin de cada mes. El concesionario ha visto en sus archivos que, de todos los clientes que finalmente no pagaron sus cuentas al final del año, el 95% se habían demorado más de una semana en sus pagos mensuales. Además, sabe que el 4% de los clientes que tienen crédito no pagan su cuenta, y que, de los que sí pagan su cuenta a fin de año, el 35% se ha demorado alguna vez más de una semana. Determine la probabilidad de que un cliente que se ha demorado alguna vez más de una semana en sus pagos mensuales, no pague su cuenta al final del año.

Los datos de este problema se pueden interpretar de la siguiente forma:

P(No pague) = 0,04; P(Sí pague) = 0,96

P(Haya demorado \ No pagó) = 0,95 ; P(No haya demorado \ No pagó) = 0,05

P(Haya demorado \ Sí pagó) = 0,35 ; P(No haya demorado \ Sí pagó) = 0,65

La probabilidad de que un cliente no pague, dado que se demoró será:



La probabilidad de que un cliente que se ha demorado alguna vez más de una semana en sus pagos mensuales no pague su cuenta al final del año es 0,1016. O sea que el 10,16% de los morosos no pagan al final su cuenta. Este porcentaje es alto, comparado con el porcentaje de clientes que no pagan su cuenta al final, que es el 4%.

Nuevamente, se puede plantear este problema mediante una tabla, como la que se completa a continuación:

Por lo tanto, la probabilidad de que un cliente que se ha demorado alguna vez más de una semana en sus pagos no pague su cuenta al final del año es: 3,8/37,4 = 0,1016.

Ejemplo 2:

Con los datos del ejemplo 1 del apartado 1.7.4, determine la probabilidad de que un componente que ha sido aceptado sea bueno.

Nótese que antes del control de calidad se tenía una certeza del 90% de producir un componente no defectuoso; pero después del control de calidad, se tiene una certeza del 98,27% de escoger un componente no defectuoso. Este mismo resultado se puede obtener a partir de la tabla que se elaboró en el ejemplo 1 del apartado anterior.

Ejemplo 3:

Una persona tiene dos dados: uno normal que marca 1,2,3,4,5,6 en sus seis caras y otro anormal que marca 2,2,4,4,6,6 en sus seis caras. Si se escoge un dado al azar, se lanza dos veces y en las dos ocasiones se obtiene un número par, ¿cuál es la probabilidad de que el dado escogido sea el anormal?

donde: P(par, par) = P(Anormal) P(par, par / Anormal) + P(Normal) P(par, par / Normal)

Como era de esperarse, en vista del resultado de los dos lanzamientos, es más probable que el dado escogido haya sido el dado anormal: 0,8 > 0,5.

Comentarios

Entradas más populares de este blog

Interpretación de histogramas

Los histogramas nos pueden brindar mucha información que en las empresas ni se imaginan. Para una persona que conozca un proceso cualquiera, la forma que tiene  un histograma construido a partir de una muestra de datos extraídos de dicho proceso, le indicará qué podría estar ocurriendo con su proceso. A continuación se muestran los distintos tipos de histogramas que se podrían encontrar, con una interpretación de lo que probablemente esté ocurriendo. Histograma general : la media del histograma está en el centro del rango de datos. La frecuencia es mayor en el centro y disminuye gradualmente hacia los extremos, ajustándose a una distribución normal. Se presenta en casi todos los casos en que se representa una medida importante en un proceso productivo. Histograma con sesgo positivo o negativo : tiene forma asimétrica. La media del histograma está a la izquierda (o a la derecha) y la frecuencia disminuye lentamente hacia la derecha (o hacia la izquierda). Se presen

Gráficos o cartas de control

El 16 de mayo de 1924, Walter A. Shewhart, un físico estadounidense, entregó un informe de una página a su jefe en Bell Technologies , destinado a cambiar la historia de la calidad. En él, un breve texto acompañaba a un gráfico, hoy conocido como gráfico o carta de control. Actualmente, pese a que sus gráficos de control siguen siendo útiles, muchos los emplean de manera incorrecta por el desconocimiento que tienen de los fundamentos estadísticos que los sustentan. Los gráficos de control nos permiten visualizar cómo va cambiando la variabilidad de una determinada medida (por ejemplo, el peso del agua embotellada que va saliendo de un proceso de producción), a lo largo del tiempo. Un gráfico de control está conformado por una línea central, que suele medir un promedio; dos límites de control, uno por encima y otro por debajo de la línea central; y una serie de valores característicos registrados en el gráfico que representan el estado de una medida de un proceso a lo largo de

La distribución normal (la campana de Gauss)

La curva normal o campana de Gauss Todas las medidas tomadas en cualquier proceso productivo tienen una distribución simétrica en forma de campana, si es que el proceso productivo está bajo control, es decir, si todo está funcionando dentro de lo establecido. Ejemplo de medidas tomadas en un proceso productivo: El peso de las bolsas que se llenan con azúcar con una máquina automática. El diámetro de los pistones que se elaboran en un taller. El volumen de las botellas que se llenan con cerveza con una máquina automática. La temperatura de un horno de cocción en un proceso de fabricación de harina de pescado. El voltaje que llegan a las viviendas en una ciudad. Estas medidas suelen tener una distribución simétrica en forma de campana debido a que, al haber un control sobre estas, la gran mayoría resultan muy cercanas al valor nominal establecido, y muy pocas resultan más lejanas a dicho valor. ¿Y cómo es esa distribución simétrica en forma de campana? Imagínense q