Probabilidad: Introducción

Probabilidad
Introducción
Muchos de los problemas que tratamos de resolver usando estadísticas tienen que ver con
probabilidad. Por ejemplo, ¿cuál es el salario probable para un graduado que obtuvo un puntaje
determinado en el examen final en la escuela? O, ¿cuál es la altura probable de un niño dada la
altura de sus padres?
Por lo tanto, tiene sentido aprender algunos principios básicos de probabilidad cuando
estudiamos estadísticas.
El Real diccionario de la lengua española de la palabra probabilidad dice:
probabilidad
Del lat. probabilĭtas, ātis.
1. f. Verosimilitud o fundada apariencia de verdad.
2. f. Cualidad de probable (‖ que se verificará o sucederá).
3. f. Mat. En un proceso aleatorio, razón entre el número de casos favorables y el
número de casos posibles.
Real Academia Española © Todos los derechos reservados
de igual manera el diccionario se refiere a la palabra aleatorio de la siguiente manera:
aleatorio, ria Del lat. aleatorius, der. de alea 'juego de azar', 'azar, suerte'.
1. adj. Perteneciente o relativo al juego de azar.
2. adj. Que depende del azar (‖ casualidad). Un proceso aleatorio.
contrato aleatorio
variable aleatoria
Real Academia Española © Todos los derechos reservados
La teoría de la probabilidad es la parte de las matemáticas que se encarga del estudio de los
fenómenos o experimentos aleatorios.
Conceptos básicos de probabilidad
Comencemos con algunas definiciones y principios básicos.
Un experimento aleatorio o ensayo (trial) es una acción que termina en un resultado
incierto, esto es que no se puede precisar antes de que ocurra, como por ejemplo arrojar
una moneda.
Un espacio muestral es el conjunto de todos los resultados posibles de un experimento. En
un lanzamiento de moneda, hay un conjunto de dos posibles resultados (cara y sello).
Un punto de muestra es un único resultado posible de un experimento aleatorio, por
ejemplo, cara al lanzar una moneda.
Un evento es un resultado específico de una instancia única de un experimento aleatorio,
por ejemplo, tirar una moneda y obtener sello.
0 1
Probabilidad es un valor numérico real ubicado entre y que indica la representa una
medida de la frecuencia con la que se observa la ocurrencia de un evento en particular,
0 1
donde significa que el evento es imposible y significa que el evento es inevitable. En
términos generales, se calcula así:
Número de puntos de muestra que producen el evento

probabilidad de un evento = Número total de puntos de muestra en el espacio muestral
Por ejemplo, la probabilidad de obtener caras cuando se lanza como moneda es 1/2 solo hay
una cara de la moneda que se designa cara. y hay dos resultados posibles en el espacio de
muestra (cara y sello). Entonces, la probabilidad de obtener cara en un solo lanzamiento de
moneda es de 0.5 (o 50% cuando se expresa como un porcentaje).
Para ilustrar mejor veamos otro ejemplo con mayor detalle: Supongamos que se debe lanzar dos
dados simultáneamente, esperando obtener como resultado al sumar un valor igual a 7.
El lanzamiento de los dados es un experimento aleatorio: no se conoce el resultado hasta que
los dados hayan aterrizado y se hayan asentado.
El espacio muestral de todos los resultados posibles es cada combinación de dos dados,
36
teniendo puntos de muestra, a saber:
⚀ ⚀ ⚀ ⚀ ⚀ ⚀
+⚀ +⚁ +⚂ +⚃ +⚄ +⚅
⚁ ⚁ ⚁ ⚁ ⚁ ⚁
+⚀ +⚁ +⚂ +⚃ +⚄ +⚅
⚂ ⚂ ⚂ ⚂ ⚂ ⚂
+⚀ +⚁ +⚂ +⚃ +⚄ +⚅
⚃ ⚃ ⚃ ⚃ ⚃ ⚃
+⚀ +⚁ +⚂ +⚃ +⚄ +⚅
⚄ ⚄ ⚄ ⚄ ⚄ ⚄
+⚀ +⚁ +⚂ +⚃ +⚄ +⚅
⚅ ⚅ ⚅ ⚅ ⚅ ⚅
+⚀ +⚁ +⚂ +⚃ +⚄ +⚅
El evento que desea que suceda es lanzar los dados y obtener una suma igual a 7. Como se
verifica existen 6 puntos de muestra que podrían producir este resultado de evento:
⚀ ⚀ ⚀ ⚀ ⚀ ⚀
+⚀ +⚁ +⚂ +⚃ +⚄ +⚅
⚁ ⚁ ⚁ ⚁ ⚁ ⚁
+⚀ +⚁ +⚂ +⚃ +⚄ +⚅
⚂ ⚂ ⚂ ⚂ ⚂ ⚂
+⚀ +⚁ +⚂ +⚃ +⚄ +⚅
⚃ ⚃ ⚃ ⚃ ⚃ ⚃
+⚀ +⚁ +⚂ +⚃ +⚄ +⚅
⚄ ⚄ ⚄ ⚄ ⚄ ⚄
+⚀ +⚁ +⚂ +⚃ +⚄ +⚅
⚅ ⚅ ⚅ ⚅ ⚅ ⚅
+⚀ +⚁ +⚂ +⚃ +⚄ +⚅
La probabilidad de lanzar y obtener un resultado cuya suma sea igual a 7 es por lo tanto como
36 que se puede simplificar a 6 o approximadamente 0.167 (16.7%).
se puede determinar
6 1
Notación de probabilidad
Cuando expresamos probabilidad, utilizamos una mayúscula P para indicar probabilidad y una
letra mayúscula para representar el evento. Entonces, para expresar la probabilidad de obtener
7
un como un evento válido A, podríamos escribir:
P(A) = 0.167
El complemento de un evento
El complemento de un evento es el conjunto de puntos de muestra que hacen que no resulte en
el evento.
Por ejemplo, supongamos que tiene una baraja estándar de naipes, y saca una carta, esperando
una espada. En este caso, tomar una carta es el experimento, siendo el evento sacar una
13
espada. Hay cartas de cada palo en el mazo. Entonces, el espacio muestral contiene 52
puntos de muestra:
♥
13 x ♠
13 x ♣
13 x 13 x ♦
Hay 13 puntos de muestra que satisfarían los requisitos del evento:
♥
13 x ♠
13 x ♣
13 x 13 x ♦
13 1
Entonces la probabilidad del evento (sacar una espada) es 13/52 que es 1/4 or 0.25 (25%).
El complemento del evento es todos los posibles resultados que no resultan en un naipe de una
espada:
♥
13 x ♠
13 x ♣
13 x ♦
13 x
Hay 39 puntos de muestra en el complemento (3 x 13), por lo que la probabilidad del
complemento es 39/52 que es 3/4 or 0.75 (75%).
Tenga en cuenta que la probabilidad de un evento y la probabilidad de su complemento siempre
suman 1.
Este hecho puede ser útil en algunos casos. Por ejemplo, supongamos que arrojas dos dados y
quiere saber la probabilidad de obtener más de 4. Puede contar todos los resultados que
producirían este resultado, pero hay muchos. Puede ser más fácil identificar los resultados que
no producen este resultado (en otras palabras, el complemento):
⚀ ⚀ ⚀ ⚀ ⚀ ⚀
+⚀ +⚁ +⚂ +⚃ +⚄ +⚅
⚁ ⚁ ⚁ ⚁ ⚁ ⚁
+⚀ +⚁ +⚂ +⚃ +⚄ +⚅
⚂ ⚂ ⚂ ⚂ ⚂ ⚂
+⚀ +⚁ +⚂ +⚃ +⚄ +⚅
⚃ ⚃ ⚃ ⚃ ⚃ ⚃
+⚀ +⚁ +⚂ +⚃ +⚄ +⚅
⚄ ⚄ ⚄ ⚄ ⚄ ⚄
+⚀ +⚁ +⚂ +⚃ +⚄ +⚅
⚅ ⚅ ⚅ ⚅ ⚅ ⚅
+⚀ +⚁ +⚂ +⚃ +⚄ +⚅
De un total de 36 puntos de muestra en el espacio muestral, hay 6 puntos de muestra donde
obtiene un 4 o menos (1 + 1, 1 + 2, 1 + 3, 2 + 1, 2 + 2 y 3 + 1 ); entonces la probabilidad del
complemento es 6/36 que es 1/6 o aproximadamente 0.167 (16.7%).
Ahora, aquí está lo inteligente. Dado que la probabilidad del complemento y el evento en sí
mismo debe sumar 1, la probabilidad del evento debe ser 5/6 or 0.833 (83.3%).
Indicamos el complemento de un evento agregando un ' a la letra asignada a él, por lo que:
P(A) = 1 − P(A′ )
Sesgo (Bias)
A menudo, los puntos de muestra en el espacio muestral no tienen la misma probabilidad, por lo
que hay un sesgo que hace que un resultado sea más probable que otro. Por ejemplo,
supongamos que el meteorólogo local indica el tiempo predominante para cada día de la
semana de esta manera:
Mon Tue Wed Thu Fri Sat Sun
☁ ☂ ☀ ☀ ☀ ☁ ☀
Este pronóstico es bastante típico para su área en esta época del año. De hecho, históricamente
el clima es soleado el 60% de los días, nublado el 30% de los días y lluvioso solo el 10% de los
días. En un día cualquiera, el espacio muestral para el clima contiene 3 puntos de muestra
(soleado, nublado y lluvioso); pero las probabilidades para estos puntos de muestra no son las
mismas.
Si asignamos la letra A a un evento de día soleado, B a un evento de día nublado y C a un
evento de día lluvioso, entonces podemos escribir estas probabilidades de esta manera:
P(A = día soleado) = 0.6 P(B = día nublado) = 0.3 P(C = día lluvioso) = 0.1
El complemento de A (un día soleado) es cualquier día en el que no haga sol, ya sea nublado o
lluvioso. Podemos calcular la probabilidad de esto de dos maneras: podemos restar la
probabilidad de A de 1:
P(A′ ) = 1 − P(A) = 1 − 0.6 = 0.4

O podemos sumar las probabilidades de todos los eventos que no resultan en un día soleado:
P(A′ ) = P(B) + P(C) = 0.3 + 0.1 = 0.4

De cualquier manera, hay un 40% de probabilidad de que no esté soleado.
Probabilidad y dependencia condicional
Los eventos pueden ser:
Independientes (eventos que no se ven afectados por otros eventos)
Dependientes (eventos que están condicionados a otros eventos)
Mutuamente Excluyentes (eventos que no pueden ocurrir juntos)
Eventos Independientes
Imagina que lanza una moneda. El espacio muestral contiene dos resultados posibles: cara
(
❂) o sello (♾).
La probabilidad de que salga cara es 1/2, y la probabilidad de obtener sello también es 1/2.
Lanzemos una moneda ...
❂
OK, entonces tenemos cara. Ahora, tiremos la moneda de nuevo:
❂
Parece que tenemos cara de nuevo. Si tuviéramos que tirar la moneda por tercera vez, ¿cuál es
la probabilidad de que obtengamos cara?
Aunque es posible que sienta la tentación de pensar que un resultado de sello se ha retrasado,
el hecho es que cada lanzamiento de moneda es un evento independiente. El resultado del
primer lanzamiento de la moneda no afecta el segundo lanzamiento de la moneda (o el tercero,
o cualquier otro lanzamiento de moneda). Para cada lanzamiento de moneda independiente, la
probabilidad de obtener cara (o sello) permanece en 1/2, o lo que es lo mismo 50%.
Ejecute el siguiente código de Python para simular 100.000 lanzamientos de monedas asignando
un valor aleatorio de 0 o 1 a cara y sello. Cada vez que lanza la moneda, la probabilidad de
obtener cara o sello es del 50%, por lo que debe esperar que aproximadamente la mitad de los
resultados sean cara y la mitad sean sello (no será exactamente la mitad, debido a una pequeña
variación aleatoria, pero debe estar cerca):
In [0]: 1 %matplotlib inline
2 import random
3
4 # Create a list with 2 element (for heads and tails)
5 heads_tails = [0,0]
6
7 # loop through 100000 trials
8 trials = 100000
9 trial = 0
10 while trial < trials:
11 trial = trial + 1
12 # Get a random 0 or 1
13 toss = random.randint(0,1)
14 # Increment the list element corresponding to the toss result
15 heads_tails[toss] = heads_tails[toss] + 1
16
17 print (heads_tails)
18
19 # Show a pie chart of the results
20 from matplotlib import pyplot as plt
21 plt.figure(figsize=(5,5))
22 plt.pie(heads_tails, labels=['heads', 'tails'])
23 plt.legend()
24 plt.show()
[49890, 50110]
Combinando Eventos Independientes
Ahora, hagamos una pregunta ligeramente diferente. ¿Cuál es la probabilidad de obtener tres
caras seguidas? Dado que la probabilidad de una cara en cada lanzamiento independiente es 1/2
podríamos sentirnos tentados a pensar que la misma probabilidad se aplica para obtener tres
caras en fila; pero en realidad, debemos tratar de obtener tres caras como el evento propio, que
es la combinación de tres eventos independientes. Para combinar eventos independientes como
este, necesitamos multiplicar la probabilidad de cada evento. Asi que:
❂
❂ = 1/2
❂❂ = 1/2 x 1/2
❂❂❂ = 1/2 x 1/2 x 1/2
Entonces la probabilidad de lanzar tres caras en fila es 0.5 x 0.5 x 0.5, que es 0.125 (o 12.5%).
Ejecute el código siguiente para simular 100.000 pruebas o ensayos de lanzar una moneda tres
veces:
In [0]: 1 import random
2
3 # Contador del número de resultados 3 x Heads
4 h3 = 0
5
6 # Crear una lista de todos los resultados
7 results = []
8
9 # Lazo a través de los 100000 ensayos (trials)
10 trials = 100000
11 trial = 0
12
13 while trial < trials:
14 trial = trial + 1
15 # Lanzar tres monedas
16 result = ['H' if random.randint(0,1) == 1 else 'T',
17 'H' if random.randint(0,1) == 1 else 'T',
18 'H' if random.randint(0,1) == 1 else 'T']
19 results.append(result)
20 # Si son tres caras, agrégalo al conteo
21 h3 = h3 + int(result == ['H','H','H'])
22
23 # ¿Qué proporción de ensayos produjo 3 x heads?
24 print ("Proporción de ensayos 3 caras: "+"%.2f%%" % ((h3/trials)*100))
25 print()
26 # Muestra todos los resultados
27 print (results)
28
El resultado muestra el porcentaje de veces que una prueba resultó en tres caras (que debería
estar cerca del 12.5%). ¡Puede contar el número de entradas ['H', 'H', 'H'] en la lista completa de
resultados para verificar esto si lo desea!
Árboles de probabilidad
Se puede representar una serie de eventos y sus probabilidades como un árbol de
probabilidades:
____C(0.5) : 0.5 x 0.5 x 0.5 = 0.125
/
____C(0.5)
/ \____S(0.5) : 0.5 x 0.5 x 0.5 = 0.125
/
__C(0.5) ____C(0.5) : 0.5 x 0.5 x 0.5 = 0.125
/ \ /
/ \____S(0.5)
/ \____S(0.5) : 0.5 x 0.5 x 0.5 = 0.125
/
_____/ _____C(0.5) : 0.5 x 0.5 x 0.5 = 0.125
\ /
\ ___C(0.5)
\ / \_____S(0.5) : 0.5 x 0.5 x 0.5 = 0.125
\ /
\__S(0.5) _____C(0.5) : 0.5 x 0.5 x 0.5 = 0.125
\ /
\___S(0.5)
\_____S(0.5) : 0.5 x 0.5 x 0.5 = 0.125
_____
1.0
Comenzando por la izquierda, puede seguir las ramas en el árbol que representan cada evento
(en este caso, un resultado de lanzamiento de moneda de caras (C) o sellos (S) en cada rama).
Al multiplicar la probabilidad de cada rama de su ruta a través del árbol, obtiene la probabilidad
combinada de un evento compuesto por todos los eventos en la ruta. En este caso, puede ver
desde el árbol que es igualmente probable que obtenga una secuencia de tres caras o sellos
resultados (por lo que tres caras es tan probable como tres sellos, que es igual de probable
como carasellocara, sellocarasello, o cualquier otra combinación!)
Tenga en cuenta que la probabilidad total para todas las rutas a través del árbol suma hasta 1.
Notación de probabilidad de eventos combinados
Al calcular la probabilidad de eventos combinados, asignamos una letra como A o B a cada
evento, y usamos el símbolo de intersección (∩) para indicar que queremos la probabilidad
combinada de eventos múltiples. Así que podríamos asignar las letras A, B y C a cada
lanzamiento de moneda independiente en nuestra secuencia de tres lanzamientos y expresar la
probabilidad combinada de esta manera:
P(A ∩ B ∩ C) = P(A) × P(B) × P(C)

Combinando eventos con diferentes probabilidades
¡Imagínese que ha creado un nuevo juego que mezcla la emoción del lanzamiento de monedas
con la emoción de los dados! El objetivo del juego es tirar un dado y obtener 6, arrojar una
moneda y obtener cara:
⚅ + ❂
⚅ + ❂
En cada vuelta del juego, un jugador tira el dado y arroja la moneda.
¿Cómo podemos calcular la probabilidad de ganar?
Se necesitan dos eventos independientes para ganar: un dado de 6 (que llamaremos evento A) y
un lanzamiento de moneda de cara (que llamaremos evento B)
Nuestra fórmula para eventos independientes combinados es:
P(A ∩ B) = P(A) × P(B)

La probabilidad de tirar un 6 en un dado justo es 1/6 or 0.167; y la probabilidad de lanzar una
moneda y obtener cara es 1/2 or 0.5:
P(A ∩ B) = 0.167 × 0.5 = 0.083

Entonces, en cada turno, hay un 8.3% de probabilidad de ganar el juego.
Intersecciones y uniones
Anteriormente vio que utilizamos el símbolo de intersección (∩) para representar "y" al combinar
probabilidades de eventos. Esta notación proviene de una rama de las matemáticas llamada
teoría de conjuntos, en la que trabajamos con conjuntos de valores. Examinemos esto con un
poco más de detalle.
Aquí está nuestra baraja de cartas, con el espacio muestral completo para tomar cualquier carta:
A ♥ A ♠ A ♣ A ♦
K ♥ K ♠ K ♣ K ♦
Q ♥ Q ♠ Q ♣ Q ♦
J ♥ J ♠ J ♣ J ♦
10 ♥ 10 ♠ 10 ♣ 10 ♦
9 ♥ 9 ♠ 9 ♣ 9 ♦
8 ♥ 8 ♠ 8 ♣ 8 ♦
7 ♥ 7 ♠ 7 ♣ 7 ♦
6 ♥ 6 ♠ 6 ♣ 6 ♦
5 ♥ 5 ♠ 5 ♣ 5 ♦
4 ♥ 4 ♠ 4 ♣ 4 ♦

3 ♥ 3 ♠ 3 ♣ 3 ♦
2 ♥ 2 ♠ 2 ♣ 2 ♦
Ahora, veamos dos eventos potenciales:
Sacar un as (A)
Sacar una carta roja (B)
El conjunto de puntos de muestra para el evento A (sacar un as) es:
A ♥ A ♠ A ♣ A ♦
K ♥ K ♠ K ♣ K ♦
Q ♥ Q ♠ Q ♣ Q ♦
J ♥ J ♠ J ♣ J ♦
10 ♥ 10 ♠ 10 ♣ 10 ♦
9 ♥ 9 ♠ 9 ♣ 9 ♦
8 ♥ 8 ♠ 8 ♣ 8 ♦
7 ♥ 7 ♠ 7 ♣ 7 ♦
6 ♥ 6 ♠ 6 ♣ 6 ♦
5 ♥ 5 ♠ 5 ♣ 5 ♦
4 ♥ 4 ♠ 4 ♣ 4 ♦
3 ♥ 3 ♠ 3 ♣ 3 ♦
2 ♥ 2 ♠ 2 ♣ 2 ♦
Entonces, la probabilidad de sacar un as es:
P(A) = 524 = 131 = 0.077

Ahora veamos el conjunto de puntos de muestra para el evento B (tomar una carta roja)
A ♥ A ♠ A ♣ A ♦
K ♥ K ♠ K ♣ K ♦
Q ♥ Q ♠ Q ♣ Q ♦

J ♥ J ♠ J ♣ J ♦
10 ♥ 10 ♠ 10 ♣ 10 ♦
9 ♥ 9 ♠ 9 ♣ 9 ♦
8 ♥ 8 ♠ 8 ♣ 8 ♦
7 ♥ 7 ♠ 7 ♣ 7 ♦
6 ♥ 6 ♠ 6 ♣ 6 ♦
5 ♥ 5 ♠ 5 ♣ 5 ♦
4 ♥ 4 ♠ 4 ♣ 4 ♦
3 ♥ 3 ♠ 3 ♣ 3 ♦
2 ♥ 2 ♠ 2 ♣ 2 ♦
La probabilidad de sacar una carta roja es por lo tanto:
P(A) = 2652 = 12 = 0.5

Intersecciones
⚭
Podemos pensar en los espacios de muestra para estos eventos como dos conjuntos y podemos
mostrarlos como un diagrama de Venn:
Event A Event B
Cada círculo en el diagrama de Venn representa un conjunto de puntos de muestra. El conjunto
de la izquierda contiene los puntos de muestra para el evento A (sacar un as) y el conjunto de la
derecha contiene los puntos de muestra para el evento B (tomar una carta roja). Tenga en
cuenta que los círculos se superponen, creando una intersección que contiene solo los puntos de
muestra que se aplican al evento A y evento B.
Este espacio muestra intersectado se ve así:
A ♥ A ♠ A ♣ A ♦
K ♥ K ♠ K ♣ K ♦
Q ♥ Q ♠ Q ♣ Q ♦

J ♥ J ♠ J ♣ J ♦
10 ♥ 10 ♠ 10 ♣ 10 ♦
9 ♥ 9 ♠ 9 ♣ 9 ♦
8 ♥ 8 ♠ 8 ♣ 8 ♦
7 ♥ 7 ♠ 7 ♣ 7 ♦
6 ♥ 6 ♠ 6 ♣ 6 ♦
5 ♥ 5 ♠ 5 ♣ 5 ♦
4 ♥ 4 ♠ 4 ♣ 4 ♦
3 ♥ 3 ♠ 3 ♣ 3 ♦
2 ♥ 2 ♠ 2 ♣ 2 ♦
Como ha visto anteriormente, escribimos esto como A ∩ B y podemos calcular su probabilidad
de esta manera:
P(A ∩ B) = P(A) × P(B) = 0.077 × 0.5 = 0.0385

Entonces, cuando saca una sola carta de una baraja completa, hay un 3.85% de posibilidades de
que sea un as rojo.
Uniones
La intersección describe el espacio muestral para el evento A y evento B; pero qué pasaría si
quisiéramos ver la probabilidad de sacar un as o una tarjeta roja. En otras palabras, cualquier
punto de muestra que se encuentre en cualquiera de los círculos Digan de Venn.
Este conjunto de puntos de muestra se ve así:
A ♥ A ♠ A ♣ A ♦
K ♥ K ♠ K ♣ K ♦
Q ♥ Q ♠ Q ♣ Q ♦
J ♥ J ♠ J ♣ J ♦
10 ♥ 10 ♠ 10 ♣ 10 ♦
9 ♥ 9 ♠ 9 ♣ 9 ♦
8 ♥ 8 ♠ 8 ♣ 8 ♦

7 ♥ 7 ♠ 7 ♣ 7 ♦
6 ♥ 6 ♠ 6 ♣ 6 ♦
5 ♥ 5 ♠ 5 ♣ 5 ♦
4 ♥ 4 ♠ 4 ♣ 4 ♦
3 ♥ 3 ♠ 3 ♣ 3 ♦
2 ♥ 2 ♠ 2 ♣ 2 ♦
Llamamos a esto la unión de los conjuntos y lo escribimos como A ∪ B.
Para calcular la probabilidad de que una carta sea un as (de cualquier color) o una carta roja (de
cualquier valor), podemos calcular la probabilidad de A, sumarla a la probabilidad de B y restar la
probabilidad de A ∩ B (para evitar contar dos veces los ases rojos):
P(A ∪ B) = P(A) + P(B) − P(A ∩ B)

Así:
P(A ∪ B) = 0.077 + 0.5 − 0.0385 = 0.5385

Entonces, cuando sacas una carta de un mazo completo, hay un 53.85% de probabilidad de que
sea un as o una carta roja.
Eventos dependientes
Volvamos a nuestra baraja de 52 cartas de la cual vamos a sacar una carta. El espacio muestral
se puede resumir así:
♥
13 x ♠
13 x ♣
13 x ♦
13 x
Hay dos símbolos negros (espadas y tréboles) y dos símbolos rojos (corazones y diamantes);
con 13 cartas en cada palo. Entonces la probabilidad de sacar una tarjeta negra (evento A) y la
probabilidad de sacar una tarjeta roja (evento B) se puede calcular así:
P(A) = 13 52+ 13 = 2652 = 0.5 P(B) = 13 52+ 13 = 2652 = 0.5

Ahora saquemos una carta del mazo:
♥
Sacamos un corazón, que es rojo. Entonces, suponiendo que no volvamos a colocar la carta en
la mesa, esto cambia el espacio muestral de la siguiente manera:
♥
12 x ♠
13 x ♣
13 x ♦
13 x
Las probabilidades para A y B son ahora:
P(A) = 13 51+ 13 = 2651 = 0.51 P(B) = 12 51+ 13 = 2551 = 0.49

Ahora tomemos una segunda carta:
♦
Tomamos un diamante, así que de nuevo esto cambia el espacio muestral para el próximo
sorteo:
♥
12 x ♠
13 x ♣
13 x ♦
12 x
Las probabilidades para A y B ahora son:
P(A) = 13 50+ 13 = 2650 = 0.52 P(B) = 12 50+ 12 = 2450 = 0.48

Entonces, está claro que un evento puede afectar a otro; en este caso, la probabilidad de sacar
una carta de un color particular en el segundo sorteo depende del color de la carta sacada en el
sorteo anterior. Llamamos a estos eventos dependientes.
Los árboles de probabilidad son particularmente útiles cuando se observan eventos
dependientes. Aquí hay un árbol de probabilidades para tomar cartas rojas o negras como los
primeros tres sorteos de un mazo de cartas:
_______R(0.48)
/
____R(0.49)
/ \_______B(0.52)
/
__R(0.50) _______R(0.50)
/ \ /
/ \____N(0.51)
/ \_______N(0.50)
/
_____/ ________R(0.50)
\ /
\ ___R(0.51)
\ / \________N(0.50)
\ /
\__N(0.50) ________R(0.52)
\ /
\___N(0.49)
\________N(0.48)
Cálculo de probabilidades para eventos dependientes
Imagine un juego en el que debe predecir el color de la siguiente carta que se sacará.
Supongamos que la primera carta sacada es una espada que es negra. ¿Cuál es la probabilidad
de que la próxima carta sea roja?
La notación para esto es:
P(B|A)
Puede interpretar esto como la probabilidad de B, dado A. En otras palabras, dado que el evento
A (tomar una carta negra) ya ha sucedido, ¿cuál es la probabilidad de B (tomar una carta roja).
Esto se conoce comúnmente como la probabilidad condicional de B dado A; y su fórmula es:
P(B|A) = P(AP(A)∩ B)
Entonces, para volver a nuestro ejemplo, la probabilidad de que la segunda carta sea roja dado
que la primera carta era negra es:
× 26
26
P(B|A) = 26 51
52
52
Lo que se simplifica a:
P(B|A) = 0.5 ×0.50.51

Así:
P(B|A) = 0.255
0.5 = 0.51
Que es lo que calculamos previamente, ¡así que la fórmula funciona!
Como esta es una expresión algebraica, podemos reorganizarla de esta manera:
P(A ∩ B) = P(A) × P(B|A)

Podemos usar esta forma de la fórmula para calcular la probabilidad de que las dos primeras
cartas extraídas de una baraja completa sean jacks. En este caso, el evento A toma una J (jack)
para la primera carta, y el evento B toma una J (jack) para la segunda carta.
La probabilidad de que la primera carta sacada sea una jota (jack) es:
P(A) = 524 = 131

Sacamos la primera carta:

J ♣
¡Éxito! es el jack de palos Nuestras posibilidades de que las dos primeras cartas sean jacks se
ven bien hasta aquí.
Ahora. sabemos que solo quedan 3 jacks, en una baraja de 51 cartas restantes; entonces, la
probabilidad de sacar un jack como segunda carta, dado que sacamos un jack como la primera
carta es:
P(B|A) = 513
Entonces podemos calcular la probabilidad de sacar dos jotas de un mazo como este:
P(A ∩ B) = 131 × 513 = 6633 = 2211

Entonces, hay una probabilidad de 1 en 221 (0.45%) de que las primeras dos cartas extraídas de
un mazo completo sean jacks.
Eventos mutuamente excluyentes
Hemos hablado sobre eventos dependientes e independientes, pero hay una tercera categoría
que se debe considerar: eventos mutuamente excluyentes.
Por ejemplo, cuando se lanza una moneda, ¿cuál es la probabilidad de que con una única
moneda el resultado sea cara y sello? La respuesta es, por supuesto, 0; un solo lanzamiento de
moneda solo puede dar como resultado o cara o sello; ¡no ambos!
Para eventos mutuamente excluyentes, la probabilidad de una intersección es:
P(A ∩ B) = 0
La probabilidad de una unión es:
P(A ∪ B) = P(A) + P(B)

Tenga en cuenta que no es necesario restar la probabilidad de intersección (y) para calcular la
probabilidad de unión (o) como lo hicimos anteriormente, porque no hay riesgo de contar dos
veces los puntos de muestra que se encuentran en ambos eventos: allí estos son ninguno (La
probabilidad de intersección para eventos mutuamente excluyentes siempre es 0, por lo que
puede restarla si lo desea, ¡igual obtendrá el mismo resultado!)
Veamos otros dos eventos mutuamente excluyentes basados en tirar un dado:
Ronda de 6 (evento A)
Ronda de un número impar (evento B)
Las probabilidades para estos eventos son:
P(A) = 16 P(B) = 36
¿Cuál es la probabilidad de sacar un 6 y un número impar en una sola tirada? Estos son
mutuamente exclusivos, entonces:
P(A ∩ B) = 0
¿Cuál es la probabilidad de sacar un 6 o un número impar:
1 3 4 2
P(A ∪ B) = 16 + 36 = 46 = 23
Variables binomiales y distribuciones
Ahora que sabemos algo acerca de probabilidades, apliquemos eso a las estadísticas. Las
estadísticas tratan de inferir medidas para una población completa basada en muestras,
permitiendo una variación aleatoria; entonces vamos a tener que considerar la idea de una
variable aleatoria.
Una variable aleatoria nos permite un número que puede variar en valor. Por ejemplo, la
temperatura en un día determinado o la cantidad de estudiantes que toman una clase.
Variables Binomiales
Un tipo particular de variable aleatoria que usamos en estadística es una variable binomial. Una
variable binomial se usa para contar con qué frecuencia ocurre un evento en un número fijo de
experimentos independientes repetidos. El evento en cuestión debe tener la misma probabilidad
de ocurrir en cada experimento, e indica el éxito o el fracaso del experimento; con una
probabilidad p de éxito, que tiene un complemento de 1 p como la probabilidad de fracaso
(falla) (a menudo llamamos a este tipo de experimento a Prueba de Bernoulli por el matemático
suizo Jacob Bernoulli)
Por ejemplo, supongamos que lanzamos una moneda tres veces, contando el resultado de 3
caras como éxito. Podemos definir una variable binomial para representar el número de
lanzamientos exitosos de la moneda (es decir, el número de veces que tenemos caras).
Examinemos esto con más detalle.
Llamaremos a nuestra variable X que como se indicó anteriormente, representa la cantidad de
veces que sacamoscaras en una serie de tres lanzamientos de moneda. Comencemos
examinando todos los valores posibles para X.
Estamos lanzando la moneda tres veces, con una probabilidad de 1/2 de éxito en cada
lanzamiento. Los resultados posibles incluyen ninguno de los lanzamientos que resultan en
caras, todos los lanzamientos que resultan en caras, o cualquier combinación entre estos. Hay
dos resultados posibles de cada lanzamiento y hay tres lanzamientos, por lo que el número total
de resultados posibles del conjunto espacio muestral es 23, que es 8. Aqui detallamos los
resultados:
♾♾♾

♾❂♾

♾♾❂

♾❂❂
❂♾♾

❂♾♾

❂❂♾

❂♾❂

❂❂❂

En estos resultados, nuestra variable X, que representa el número de eventos exitosos
(obteniendo caras), puede variar de 0 a 3. Podemos escribir eso de esta manera:
X = {0,1,2,3}
Cuando queremos indicar un resultado específico para una variable aleatoria, usamos la
escritura de la variable en minúsculas, por ejemplo x Entonces, ¿cuál es la probabilidad de que x
= 0 (lo que significa que en nuestros tres lanzamientos no obtenemos caras)?
Podemos ver fácilmente, que hay una fila en nuestro conjunto de resultados posibles que no
contiene caras, entonces:
P(x = 0) = 18
Bien, veamos si podemos encontrar la probabilidad para 1 éxito. Hay tres puntos de muestra que
contienen un único resultado de caras, por lo que:
P(x = 1) = 38
Nuevamente, podemos verlo fácilmente a partir de nuestros resultados; pero vale la pena pensar
en esto de una manera ligeramente diferente que hará que sea más fácil calcular esta
probabilidad de manera más genérica cuando haya más puntos de muestra (por ejemplo, si
hubiéramos basado nuestra variable binomial en 100 lanzamientos de moneda, habría muchas
más combinaciones!).
Lo que en realidad estamos diciendo aquí es que para 3 experimentos (en este caso,
lanzamientos de moneda), queremos elegir 1 resultado exitoso. Esto está escrito como 3C1. Más
genéricamente, esto se conoce como "n eligiendo k" y está escrito así:
n Ck
o a veces así:
n
(k)
La fórmula para calcular esto es:
n = n!
( k ) k!(n − k)!
Los signos de exclamación indican factoriales: el producto de todos los enteros positivos
menores o iguales que el entero especificado (con 0! Que tiene un valor de 1).
En el caso de nuestro 3C1 cálcular, esto significa:
3 = 3! = 3! = 3 × 2 × 1 = 6 = 3
( 1 ) 1!(3 − 1)! 1! × 2! 1 × (2 × 1) 2
Parece mucho trabajo encontrar la cantidad de experimentos exitosos, pero ahora que conoce
esta fórmula general, puede usarla para calcular el número de puntos de muestra para cualquier
valor de k a partir de cualquier conjunto de casos n . Vamos a usarlo para encontrar la posibilidad
de dos caras exitosas de tres lanzamientos de monedas:
P(x = 2) = 3 C82
Vamos a calcular la cantidad de combinaciones para 3C2
3 C2 =
3! = 6 = 6 = 3
2!(3 − 2)! 2 × 1 2
Así:
P(x = 2) = 38
Finalmente, ¿cuál es la probabilidad de que los tres lanzamientos sean caras?
P(x = 3) = 3 C83
3! 6
3 C3 = 3!(3 − 3)! = 6 = 1
Así:
P(x = 3) = 18
En Python, hay una serie de módulos que puede usar para encontrar las combinaciones de "n
elegir k", incluida la función scipy.special. comb.
En nuestro experimento de lanzamiento de monedas, hay una probabilidad igual de éxito y
fracaso; por lo que los cálculos de probabilidad son relativamente simples, y puede observar que
hay una simetría en la probabilidad de cada valor posible de la variable binomial, como puede
ver al ejecutar el siguiente código de Python. Puede aumentar el valor de la variable trials para
verificar que no importa cuántas veces arrojemos la moneda, las probabilidades de obtener
caras (o sellos para ese caso) forman una distribución simétrica, porque hay una igual
probabilidad de éxito y fracaso en cada prueba.
2 from scipy import special as sps
4 import numpy as np
5
6 trials = 3
7
8 possibilities = 2**trials
9 x = np.array(range(0, trials+1))
10
11 p = np.array([sps.comb(trials, i, exact=True)/possibilities for i in x])
12
13 # Set up the graph
14 plt.xlabel('Successes')
15 plt.ylabel('Probability')
16 plt.bar(x, p)
17 plt.show()
Permitiendo sesgo
Previamente, calculamos la probabilidad para cada valor posible de una variable aleatoria
simplemente dividiendo el número de combinaciones para ese valor entre la cantidad total de
resultados posibles. Esto funciona si la probabilidad de que el evento sea probado es igual para
éxito y fracaso; pero, por supuesto, no todos los experimentos tienen las mismas posibilidades
de éxito o fracaso. Algunos incluyen un sesgo que hace que el éxito sea más o menos probable,
por lo que debemos ser un poco más cuidadosos en nuestros cálculos para manejar esto.
Supongamos que está volando a algún destino exótico y sabe que hay una posibilidad entre
cuatro de que el escáner de seguridad del aeropuerto active una búsqueda aleatoria para cada
pasajero que pase. Si ve pasar a cinco pasajeros por el escáner, ¿cuántos se detendrán para
una búsqueda aleatoria?
Es tentador pensar que hay una probabilidad de uno en cuatro, por lo que una cuarta parte de
los pasajeros serán detenidos; pero recuerde que las búsquedas se activan al azar para miles de
pasajeros que pasan por el aeropuerto cada día. Es posible que ninguno de los próximos cinco
pasajeros sea registrado; se buscarán los cinco o se buscará algún otro valor intermedio.
Aunque las probabilidades de ser buscado o no buscado no son las mismas, esta sigue siendo
una variable binomial. Hay un número fijo de experimentos independientes (cinco pasajeros
pasan por el escáner de seguridad), el resultado de cada experimento es éxito (se inicia una
búsqueda) o fracaso (no se inicia ninguna búsqueda) y la probabilidad de búsqueda no cambia
para cada pasajero
Hay cinco experimentos en los que un pasajero pasa por el escáner de seguridad, llamémoslo n.
Para cada pasajero, la probabilidad de ser buscado es 1/4 or 0.25. Llamaremos esto p.
El complemento de p (En otras palabras, la probabilidad de no ser buscado) es 1 p, en este
caso 3/4 or 0.75.
Así, ¿cuál es la probabilidad de que de nuestros experimentos, tres resulten en una búsqueda,
llamémoslo k, mientras que a los dos restantes que habrá, esto es n k, no resulten en
búsqueda.
La probabilidad de que se busquen tres pasajeros es de 0.25 x 0.25 x 0.25 que es lo mismo
que 0.253. Usando nuestras variables genéricas, esto es p k.
La probabilidad de que no se busque el resto es 0.75 x 0.75, or 0.752. En términos de
nuestras variables, esto es 1 p (nk).
La probabilidad combinada de tres búsquedas y dos no búsquedas es por lo tanto 0.253 x
0.752 (aproximadamente 0.088). Usando nuestras variables, esto es:
pk (1 − p)(n−k)
Esta fórmula nos permite calcular la probabilidad de una combinación única de n pasajeros
en la que los experimentos k tuvieron un resultado exitoso. En este caso, nos permite calcular
que la probabilidad de que se realicen búsquedas en tres de cada cinco pasajeros es de
aproximadamente 0.088. Sin embargo, debemos considerar que hay varias formas en que
esto puede suceder. Los primeros tres pasajeros podrían ser buscados; o los últimos tres; o la
primera, tercera y quinta, o cualquier otra combinación posible de 3 de 5.
Hay dos resultados posibles para cada experimento; por lo que el número total de
combinaciones posibles de cinco pasajeros que se buscan o no se buscan es 25 o 32.
Entonces, dentro de esos 32 conjuntos de posibles combinaciones de resultados, ¿cuántos
tienen tres búsquedas? Podemos usar la fórmula nCk para calcular esto:
5 C3 =
5! = 120 = 120 = 5
3!(5 − 3)! 6 × 4 24
Así que 5 de nuestras 32 combinaciones tenían 3 búsquedas y 2 no búsquedas.
Para encontrar la probabilidad de cualquier combinación de 3 búsquedas de 5 pasajeros,
necesitamos multiplicar el número de combinaciones posibles por la probabilidad de una
combinación única en este caso 5/32 x 0.088, que es 0.01375, o 13.75%.
Entonces nuestra fórmula completa para calcular la probabilidad de k eventos de n experimentos
con probabilidad p es:
P(x = k) = k!(nn!− k)! pk (1 − p)(n−k)

Esto se conoce como Fórmula de probabilidad binomial general y se usa para calcular la
función de masa de probabilidad (o PMF) para una variable binomial. En otras palabras,
podemos usarlo para calcular la probabilidad de cada valor posible para la variable y usar esa
información para determinar la frecuencia relativa de los valores variables como una distribución.
En Python, la función scipy.stats. binom.pmf encapsula la fórmula de probabilidad binomial
general, y puede usarla para calcular la probabilidad de que una variable aleatoria tenga un valor
específico (k ) para un número dado de experimentos (n) donde el evento que se prueba tiene
una probabilidad dada (p), como se demuestra en el siguiente código:
2 from scipy.stats import binom
5
6 n = 5
7 p = 0.25
8 x = np.array(range(0, n+1))
9
10 prob = np.array([binom.pmf(k, n, p) for k in x])
11
13 plt.xlabel('x')
15 plt.bar(x, prob)
16 plt.show()
Puede ver en el gráfico de barras que con este pequeño valor para n, la distribución está
sesgada a la derecha.
Recordemos que en nuestro experimento de lanzamiento de monedas, cuando la probabilidad
de fracaso vs. éxito era igual, la distribución resultante era simétrica. Con una probabilidad
desigual de éxito en cada experimento, el sesgo tiene el efecto de modificar (sesgar) la masa de
probabilidad general.
Sin embargo, intente aumentar el valor de n en el código anterior a 10, 20 y 50; vuelva a ejecutar
la celda cada vez. Con más observaciones, el teorema del límite central comienza a tener
efecto y la distribución comienza a parecer más simétrica: con suficientes observaciones,
comienza a verse como una distribución normal.
Aquí hay una distinción importante: la distribución normal se aplica a las variables continuas,
mientras que la distribución binomial se aplica a las variables discretas. Sin embargo, las
similitudes ayudan en una serie de contextos estadísticos donde el número de observaciones
(experimentos) es lo suficientemente grande para que el teorema del límite central haga que la
distribución de los valores de las variables binomiales se comporte como una distribución normal.
Trabajando con la distribución binomial
Ahora que sabes cómo elaborar una distribución binomial para un experimento repetido, es hora
de echar un vistazo a algunas estadísticas que nos ayudarán a cuantificar algunos aspectos de
la probabilidad en esta distribución.
Aumentemos nuestro valor de n a 100 para que veamos el número de búsquedas por cada 100
pasajeros. Esto nos da la distribución binomial graficada por el siguiente código:
2 from scipy.stats import binom
5
6 n = 100
7 p = 0.25
8 x = np.array(range(0, n+1))
9
10 prob = np.array([binom.pmf(k, n, p) for k in x])
11
13 plt.xlabel('x')
15 plt.bar(x, prob)
16 plt.show()
La media (valor esperado)
La media (valor esperado)
Podemos calcular la media de la distribución de esta manera:
μ = np
Entonces, para nuestros pasajeros del aeropuerto, esto es:
μ = 100 × 0.25 = 25
Cuando hablamos de una distribución de probabilidad, la media generalmente se conoce como
el valor esperado. En este caso, por cada 100 pasajeros podemos razonablemente esperar que
se busquen 25 de ellos.
Varianza y desviación estándar
Obviamente, no podemos buscar una cuarta parte de un pasajero: el valor esperado refleja el
hecho de que hay variación e indica un valor promedio para nuestra variable aleatoria binomial.
Para obtener una indicación de cuánta variabilidad hay realmente en este escenario, podemos
calcular la varianza y la desviación estándar.
Para la varianza de una distribución de probabilidad binomial, podemos usar esta fórmula:
σ 2 = np(1 − p)
Entonces para nuestros pasajeros del aeropuerto:
σ 2 = 100 × 0.25 × 0.75 = 18.75

Para convertir esto en desviación estándar, tomamos la raíz cuadrada:
⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯
σ = √np(1 − p)⎯
Así:
⎯⎯⎯⎯⎯⎯⎯⎯⎯ ≈ 4.33
σ = √18.75
Entonces, por cada 100 pasajeros, podemos esperar 25 búsquedas con una desviación estándar
de 4.33
En Python, puede usar las funciones mean, var y std del paquete scipy.stats.binom para
devolver la distribución binomial estadísticas para valores dados de n y p:
In [0]: 1 from scipy.stats import binom
2
3 n = 100
4 p = 0.25
5
6 print(binom.mean(n,p))
7 print(binom.var(n,p))
8 print(binom.std(n,p))
25.0
18.75
4.330127018922194

Probabilidad: Introducción

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Probabilidad: Introducción

Cargado por

Copyright:

Formatos disponibles

Probabilidad

Número de puntos de muestra que producen el evento

Mon Tue Wed Thu Fri Sat Sun

P(A′ ) = 1 − P(A) = 1 − 0.6 = 0.4

P(A′ ) = P(B) + P(C) = 0.3 + 0.1 = 0.4

P(A ∩ B ∩ C) = P(A) × P(B) × P(C)

P(A ∩ B) = P(A) × P(B)

P(A ∩ B) = 0.167 × 0.5 = 0.083

A ♥ A ♠ A ♣ A ♦

K ♥ K ♠ K ♣ K ♦

Q ♥ Q ♠ Q ♣ Q ♦

J ♥ J ♠ J ♣ J ♦

10 ♥ 10 ♠ 10 ♣ 10 ♦

9 ♥ 9 ♠ 9 ♣ 9 ♦

8 ♥ 8 ♠ 8 ♣ 8 ♦

7 ♥ 7 ♠ 7 ♣ 7 ♦

6 ♥ 6 ♠ 6 ♣ 6 ♦

5 ♥ 5 ♠ 5 ♣ 5 ♦

4 ♥ 4 ♠ 4 ♣ 4 ♦

2 ♥ 2 ♠ 2 ♣ 2 ♦

A ♥ A ♠ A ♣ A ♦

K ♥ K ♠ K ♣ K ♦

Q ♥ Q ♠ Q ♣ Q ♦

J ♥ J ♠ J ♣ J ♦

10 ♥ 10 ♠ 10 ♣ 10 ♦

9 ♥ 9 ♠ 9 ♣ 9 ♦

8 ♥ 8 ♠ 8 ♣ 8 ♦

7 ♥ 7 ♠ 7 ♣ 7 ♦

6 ♥ 6 ♠ 6 ♣ 6 ♦

5 ♥ 5 ♠ 5 ♣ 5 ♦

4 ♥ 4 ♠ 4 ♣ 4 ♦

3 ♥ 3 ♠ 3 ♣ 3 ♦

2 ♥ 2 ♠ 2 ♣ 2 ♦

P(A) = 524 = 131 = 0.077

A ♥ A ♠ A ♣ A ♦

K ♥ K ♠ K ♣ K ♦

Q ♥ Q ♠ Q ♣ Q ♦

10 ♥ 10 ♠ 10 ♣ 10 ♦

9 ♥ 9 ♠ 9 ♣ 9 ♦

8 ♥ 8 ♠ 8 ♣ 8 ♦

7 ♥ 7 ♠ 7 ♣ 7 ♦

6 ♥ 6 ♠ 6 ♣ 6 ♦

5 ♥ 5 ♠ 5 ♣ 5 ♦

4 ♥ 4 ♠ 4 ♣ 4 ♦

3 ♥ 3 ♠ 3 ♣ 3 ♦

2 ♥ 2 ♠ 2 ♣ 2 ♦

P(A) = 2652 = 12 = 0.5

A ♥ A ♠ A ♣ A ♦

K ♥ K ♠ K ♣ K ♦

Q ♥ Q ♠ Q ♣ Q ♦

10 ♥ 10 ♠ 10 ♣ 10 ♦

9 ♥ 9 ♠ 9 ♣ 9 ♦

8 ♥ 8 ♠ 8 ♣ 8 ♦

7 ♥ 7 ♠ 7 ♣ 7 ♦

6 ♥ 6 ♠ 6 ♣ 6 ♦

5 ♥ 5 ♠ 5 ♣ 5 ♦

4 ♥ 4 ♠ 4 ♣ 4 ♦

3 ♥ 3 ♠ 3 ♣ 3 ♦

2 ♥ 2 ♠ 2 ♣ 2 ♦

P(A ∩ B) = P(A) × P(B) = 0.077 × 0.5 = 0.0385

A ♥ A ♠ A ♣ A ♦

K ♥ K ♠ K ♣ K ♦

Q ♥ Q ♠ Q ♣ Q ♦