Documentos de Académico
Documentos de Profesional
Documentos de Cultura
2021-2854
Introducción
Históricamente la Estadística, en sus inicios, no usaba la teoría de las probabilidades, de
hecho, ambas ramas de la Matemática en sus inicios fueron independientes; esto es así
debido a que la Estadística era de naturaleza descriptiva, como se ha visto en el
tema Estadística descriptiva, análisis de datos. Con el tiempo, empezó a usarse para
predecir sucesos a partir de datos anteriores, y también para llegar a conclusiones
globales usando datos parciales, es lo que se denomina inferencia estadística. Pero estas
predicciones y conclusiones no deben nunca interpretarse como precisas, como puede
ser en Ciencias Exactas, sino que siempre están limitadas por conceptos como “margen
de confianza”, “valor estimado”, “hipótesis” y también “probabilidad “. En este post
vemos una introducción breve y simple a la teoría de la probabilidad aplicada a la
Estadística.
Probabilidad y predicción
El concepto de probabilidad es la base de la Estadística, y no es un concepto fácil de
entender. La utilidad de los datos del pasado es comprender el presente y poder hacer
predicciones sobre el futuro. También, la utilidad de tener unos datos parciales,
una muestra de datos es la de poder hacer predicciones sobre el conjunto total de los
datos, o población. A estas predicciones en Estadística las llamamos inferencias, y al
conjunto de técnicas para lograrlo, técnicas de inferencia Estadística.
Pero en Estadística estas inferencias no son nunca predicciones exactas sino
aproximadas. Para dar una valoración de cuan aproximadas son, utilizamos el concepto
de probabilidad. Así, una predicción con una probabilidad asociada del 100% tendría
certeza absoluta, y en el otro extremo, con una probabilidad asociada del 0% tendría
falsedad absoluta: nunca se cumpliría. En las aplicaciones prácticas, estos valores
extremos nunca se alcanzan.
Precisión
Torres Petronas
centímetros y milímetros de la altura, con lo metros sería suficiente, debido a que unos
milímetros más o menos no tienen importancia en este caso concreto.
La valoración del número de decimales correcto es una dificultad para muchos
estudiantes; es típico usar una calculadora y dar como resultado demasiados decimales.
¿Cuál es el número correcto de decimales? Depende del problema que estemos
resolviendo.
El número de decimales de un cálculo frecuentemente es infinito. El número de decimales significativo depende del
problema concreto que estamos resolviendo: la media de calificaciones, las medidas de un estante, la longitud de
una pieza de relojería, etc.
Cálculo de probabilidades
Regla de Laplace
Para el cálculo práctico de las probabilidades no se usa la definición anterior, sino otros
métodos, el más simple de ellos es la conocida regla de Laplace:
Esto es correcto siempre que todos los resultados (cara y cruz) sean igualmente
probables. Si realizamos dos lanzamientos de la moneda y queremos saber la
probabilidad de obtener al menos una cara, tendremos que contar los casos favorables y
los posibles; abreviando por C el resultado “sale cara” y por “X” el resultado “sale
cruz”, los casos son:
Cuando cada caso tiene una probabilidad distinta, no podemos aplicar la regla de
Laplace. Debemos estudiar la probabilidad de cada caso.
Ejemplo 3: siguiendo con las bombillas del ejemplo 2, si compramos 3 bombillas, y las
probamos ¿cuál es la probabilidad de que la primera sea defectuosa y las otras dos no?
La probabilidad de que una bombilla sea defectuosa es 0.0001, y de que no lo sea de
0.9999. Entonces como cada bombilla es independiente de las demás, la probabilidad
del caso “defectuosa, correcta, correcta” será 0.0001·0.9999·0.9999=0.000099.
Ejemplo 4: siguiendo con las bombillas del ejemplo 2, si compramos 3 bombillas, ¿cuál
es la probabilidad de que una sea defectuosa?
Llamemos C al resultado “pruebo una bombilla y es correcta”, y D al resultado “pruebo
una bombilla y es defectuosa”. Las combinaciones posibles son CCC, CCD, CDC,
DCC, DDC, DCD, CDD, DDD. No son igualmente probables, luego no podemos
aplicar Laplace. La probabilidad de cada una de ellas se obtiene multiplicando las
probabilidades de todos los resultados que intervienen en la combinación, teniendo en
cuenta que P(C)=0.9999, P(D)=0.001. Obtenemos:
Caso Probabilidad
CCC 0.99970003
CCD 0.00009998
CDC 0.00009998
DCC 0.00009998
DDC 0.00000001
DCD 0.00000001
DINANDI P CABRERA SANTANA
2021-2854
CDD 0.00000001
DDD 1E-012
La probabilidad pedida “una es defectuosa”, comprende tres casos: CCD, CDC, DCC.
Sumemos ahora sus probabilidades: 0.00009998 + 0.00009998 + 0.00009998
= 0.00029994.
Por otro lado, si sumamos las probabilidades de todos los casos posibles, el resultado es
1. Esta es una regla fundamental: la suma de probabilidades de todos los casos posibles
es siempre igual a 1.
Espacio muestral de un experimento aleatorio
Damos algunas definiciones básicas, y luego vemos sus propiedades y aplicaciones.
P5: “Ha salido un número mayor que 6”, se relaciona con el subconjunto
vacío S = ø, a este suceso se le llama suceso imposible.
P6: “Ha salido un número entre 1 y 6”, se relaciona con el conjunto total S
= Ω = {1,2,3,4,5,6}, a este suceso se le llama suceso seguro.
Álgebra de sucesos
Dentro del conjunto de proposiciones se pueden definir operaciones lógicas que le
proporcionan estructura algebraica: el álgebra de Boole. Las operaciones son: AND (y),
OR (o), NOT (no). El resultado de una operación lógica entre proposiciones es otra
proposición lógica.
Ejemplo 6:
AND: P1: “Ha salido un número par”, P2: “Ha salido un número mayor que
4”, P = P1 y P2: “Ha salido un número par y mayor que 4”.
NOT: P1: “Ha salido un número par”; negación: P = No “Ha salido un
número par”
OR: P3: “No ha salido mayor que 4”, P5: “Ha salido un número mayor que
6”, P = P4 o P5: “O bien no ha salido mayor que 4, o bien ha salido un
número mayor que 6”
También tenemos una correspondencia entre las operaciones lógicas y las operaciones
en el espacio muestral:
Teoría combinatoria
En casos simples es inmediato aplicar la regla de Laplace, pero en general no será tan
simple. Consideremos por ejemplo el siguiente problema: “Una lotería está formada
por N números, de los que m tendrán premio. Calcular la probabilidad de que nos
toque algún premio si hemos comprado k números “. Calcular el número de puntos
muestrales ahora no es trivial. La teoría combinatoria proporciona técnicas directas para
hacerlo; en nuestro caso la solución viene dada por:
Se puede demostrar que esta definición es más general que las dos anteriores: La regla
de Laplace y el límite de la frecuencia relativa verifican los axiomas, pero hay
probabilidades que no se pueden calcular con la regla de Laplace ni con frecuencias, y si
según la definición de Kolmogorov.
ambos dados sea al menos de 4. Si realizamos ese experimento 100 veces, ¿en cuantas
de ellas esperaremos que se cumpla que “las puntuaciones de ambos dados mayor que
6 o bien la puntuación de ambos dados sea al menos de 4“?
Definimos los sucesos S: “la suma de las puntuaciones de ambos dados mayor que 6”, y
T: “la puntuación de ambos dados sea al menos de 4”. Para hallar las probabilidades por
la regla de Laplace necesitamos contar los puntos muestrales (resultados posibles) de
cada suceso y también del espacio total.
Resultados posibles para S: {1+6, 2+5, 2+6, 3+4, 3+5, 3+6, 4+3, 4+4, 4+5, 4+6, 5+2,
5+3, 5+4, 5+5, 5+6, 6+1, 6+2, 6+3, 6+4, 6+5, 6+6}, total 21
Resultados posibles para T: {4+4, 4+5, 4+6, 5+4, 5+5, 5+6, 6+4, 6+5, 6+6}, total 9
Resultados posibles totales: tantos como parejas (a, b) podemos formar siendo a,b
números entre 1 y 6: son 6·6 = 36.
Valores posibles de las puntuaciones del lanzamiento de dos dados; hay 21 combinaciones con suma > 6, y 9
combinaciones con los dos valores mayores o iguales a 4
En general:
Sucesos independientes
En el ejemplo anterior hemos visto que si A = {“un número par”} y B = {“ha salido al
menos un 4”} entonces P (A) = 3/6 = 1/2, P (A | B) = 2/3, y las probabilidades no son
las mismas. ¿Siempre será así? En general no.
ejemplo: En una urna hay 4 bolas de color azul, 6 de color rojo y 3 de color amarillo.
Sacamos una bola al azar sin mirarla; suponiendo que alguien nos dice “no es de color
amarillo”, ¿cuál es la probabilidad de que sea roja? Esta es una probabilidad
condicionada, pues ya ha sucedido el suceso “no es de color amarillo” (la información
previa), y por tanto calcularemos:
P(roja | no es de color amarillo ) = P(roja ∩ no es de color amarillo ) / P(no es de color
amarillo )
Consideremos otro experimento con la misma urna: sacamos una bola que resulta ser
roja; la devolvemos a la urna, y a continuación volvemos a sacar una bola. Nos
preguntamos por la probabilidad de que vuelva a ser roja. Aquí entra un nuevo
elemento: si consideramos que las distintas extracciones (que son las repeticiones del
mismo experimento aleatorio) son independientes entre sí, entonces la probabilidad
entre extracciones no varía, dado que hemos devuelto la bola a la urna para que haya
exactamente el mismo número de bolas en la segunda extracción. Entonces:
es jugar lo menos posible con el jugador B, y por tanto la mejor opción es escoger el
orden de juego M, B, M i no el B, M, B. Vamos a hacer el cálculo de probabilidades.
Como b < m (menos probabilidad de ganar el jugador bueno que el medio), resulta que
bm(2 – b) > bm(2 – m), o sea que en el orden de juego B, M, B el jugador novicio tiene
más probabilidades de vencer en dos partidos consecutivos que en el orden M, B, M, !
incluso siendo que deberá jugar dos partidos contra el mejor jugador en vez de sólo
uno! Un resultado contra intuitivo, pero rigurosamente cierto.
¿Cuál es ahora la mejor opción? Para simplificar, damos valores concretos a las
probabilidades: m = 0.7, b = 0.5, m’=0.8, b’= 0.6, m” = 0.6, b”=0.4. Sustituimos:
Ejemplo 13: En una encuesta, al 29% le gusta la música clásica. Este 29% se desglosa
en un 17% que no les gusta la música moderna y un 12% que también les gusta la
música moderna. Por otro lado, en un 68% sólo les gusta la música moderna y a un 3%
no les gusta la música. Planteamos el experimento aleatorio: preguntar a una persona al
azar sobre sus gustos musicales. Sean los sucesos siguientes:
M: le gusta la música moderna
X: sólo le gusta un tipo de música
La pregunta que nos hacemos es: ¿Son M y X independientes? ¿Dicho de otro modo, el
conocimiento previo de que a una persona les guste la música moderna condiciona el
que le guste sólo ese tipo de música?
Representamos los datos en un diagrama:
Teorema 2 (de Bayes): En las mismas condiciones del teorema anterior tendremos que:
Equivalentemente, usando el teorema de la probabilidad total:
Ejemplo 14: El 20% de cierta población tiene estudios superiores, el 60% medios y el
20% básicos. Sabemos que leen habitualmente algún periódico local el 40% de los que
tienen estudios superiores, el 25% de lo que tienen estudios medios y el 10% de los que
tienen estudios básicos. Elegida una persona al azar resulta que lee habitualmente algún
periódico. ¿Cuál es la probabilidad de que tenga estudios superiores?
La población total está dividida en tres conjuntos disjuntos B1: estudios superiores,
B2: medios, B3: básicos. Sabemos las probabilidades condicionadas siguientes: si
escogemos al azar una persona, y resulta que tiene estudios superiores, entonces P (leer |
B1) = 0.4. Igualmente, P (leer | B2) = 0.25, P (leer | B3) = 0.1. La probabilidad pedida
tiene una información previa: “resulta que lee habitualmente algún periódico”, por
tanto, es condicionada, es: P (estudios superiores | lee). Usamos el teorema de Bayes:
La probabilidad de que una persona con estudios superiores sea lector es superior a la
media de la población, 25%, como era de esperar.
Multiplicamos la probabilidad que tiene el suceso de que caiga una cara en una moneda (1/2),
por la probabilidad del mismo suceso en la otra moneda (1/2), debido a que son sucesos
independientes
B Dos cruces.
El suceso de que caiga una cruz en una moneda y también cruz en la otra, son sucesos
independientes y cada uno tiene una probabilidad de (1/2) como lo observamos en el esquema.
Debido a esto, se multiplican ambas probabilidades
C Una cara y una cruz.
La probabilidad de sacar una cara y una cruz, se refiere a las siguientes dos posibilidades: cara
y cruz, o cruz y cara. Significa que primero debemos sacar la probabilidad de cada opción (1/2)
(1/2) y después sumarlas, para tener el resultado, observa:
DINANDI P CABRERA SANTANA
2021-2854
en este caso observamos que la ficha (6,6) pertenece a ambos conjuntos, o en otras
palabras . Esto significa que ahora debemos emplear la
fórmula para conocer la probabilidad
deseada.
Ahora, tomando en cuenta que existen 28 fichas de dominó, los valores quedan de la siguiente
forma:
3 Un dado está trucado, de forma que las probabilidades de obtener las distintas caras son
proporcionales a los números de estas. Hallar:
A La probabilidad de obtener el 6 en un lanzamiento
B La probabilidad de conseguir un número impar en un lanzamiento
Solución
Un dado está trucado, de forma que las probabilidades de obtener las distintas caras son
proporcionales a los números de estas. Hallar:
DINANDI P CABRERA SANTANA
2021-2854
A La probabilidad de obtener el 6 en un lanzamiento
Ya que el dado está trucado, la probabilidad de cada cara es proporcional al número de la cara
correspondiente.
y entonces
B La probabilidad de conseguir un número impar en un lanzamiento
En este caso sólo es necesario sumar las probabilidades de que conseguir todos los impares
posibles.
Solución
Se lanzan dos dados al aire y se anota la suma de los puntos obtenidos. Se pide:
A-La probabilidad de que salga el 7
Agrupamos a todas las posibilidades donde la suma sea siete
nos damos cuenta que son 6 formas posibles, y como hay 36 formas posibles distintas en las que
pueden caer dos dados, entonces:
B-La probabilidad de que el número obtenido sea par
Las parejas para que el número obtenido sea par son
(1,1)
(1,3), (2,2),(3,1)
(1,5),(2,4),(3,3),(4,2),(5,1)
(2,6),(3,5),(4,4),(5,3),(6,2)
(4,6),(5,5),(6,4)
(6,6)
que son 18, significa que la probabilidad de que el resultado obtenido sea par es
C-La probabilidad de que el número obtenido sea múltiplo de tres
DINANDI P CABRERA SANTANA
2021-2854
Nos damos cuenta que cada una de estas parejas suman a algún múltiplo de tres
y son 12 de ellas, entonces
aquí en representa a los múltiplos de 3.
5 Se lanzan tres dados. Encontrar la probabilidad de que:
A Salga 6 en todos
B Los puntos obtenidos sumen 7
Solución
Se lanzan tres dados. Encontrar la probabilidad de que:
A Salga 6 en todos
Solamente existe una forma de que salga seis en todos (6,6,6), y si consideramos que
hay formas distintas en que pueden caer tres dados, entonces
B Los puntos obtenidos sumen 7
Aquí se encuentran las formas en que pueden caer los dados, donde la suma de los puntos es
siete:
DINANDI P CABRERA SANTANA
2021-2854
y con esta lista, nos damos cuenta de que existen 15 distintas formas para que la suma sea 7,
entonces la probabilidad buscada queda:
B Un múltiplo de tres
En esta caso los múltiplos de tres son: 3 y 6. Por lo tanto hay 2 formas para que sea múltiplo de
3, y 6 formas en que puede caer un dado
C Mayor que cuatro
En este caso los mayores que cuatro son 5 y 6, llevándonos a que la probabilidad es
7 Se sacan dos bolas de una urna que se compone de una bola blanca, otra roja, otra verde y otra
negra. Describir el espacio muestral cuando:
A La primera bola se devuelve a la urna antes de sacar la segunda
B La primera bola no se devuelve
Solución
Se sacan dos bolas de una urna que se compone de una bola blanca, otra roja, otra verde y otra
negra. Describir el espacio muestral cuando:
A La primera bola se devuelve a la urna antes de sacar la segunda
La primer bola puede ser cualquiera de las cuatro B,R,V,N y al momento de registrar la que
salió y regresarla a la urna, puede salir nuevamente cualquiera de las cuatro, significa que por
ejemplo si al principio salió B, entonces con la segunda extracción se puede tener BB,BR,BV o
BN, y así sucesivamente con las demás opciones, quedando nuestro espacio muestral como
E = {BB, BR, BV, BN, RB, RR, RV, RN, VB, VR, VV, VN, NB, NR, NV, NN}
DINANDI P CABRERA SANTANA
2021-2854