Unidad 4.
Distribuciones de Probabilidad
Introducción
En la mayoría de los problemas de estadística, sólo nos interesamos en un aspecto o a lo
sumo en unos cuantos aspectos de los resultados de los experimentos. Por ejemplo, un
estudiante que hace una prueba de “si” o “no” puede interesarse sólo en el número de
preguntas que se responden correctamente y no en cuales; a un sociólogo tal vez sólo le
interese el nivel socioeconómico de una persona entrevistada en una encuesta y no su
edad ni su peso. Así mismo, a un agrónomo le puede interesar sólo el rendimiento por
hectárea de un nuevo maíz pero también la temperatura a la que germina; y a un
ingeniero automotriz le puede interesar el brillo y la durabilidad de los faros propuestos
para un nuevo automóvil pero también su costo proyectado. En los ejemplos anteriores, el
interés está en los números que se asocian con los resultados de situaciones que
implican un elemento de probabilidad, es decir, en los valores de las llamadas variables
aleatorias.
La Estadística Descriptiva nos ofrece una serie de herramientas muy útiles para resumir
gráfica y numéricamente los datos que hemos obtenido sobre una característica o variable
de interés, X, de una población. Estos resúmenes son muy interesantes, pero el objetivo
de la Estadística habitualmente va más allá: pretende obtener conclusiones sobre la
población a partir de los datos obtenidos en la muestra. La obtención de conclusiones
será el objetivo de la Inferencia Estadística y para su desarrollo necesitaremos los
modelos de probabilidad. Por su parte, la probabilidad es la parte de las matemáticas que
se encarga del estudio de los fenómenos o experimentos aleatorios. Recordemos que un
experimento aleatorio es todo aquel experimento tal que cuando se le repite bajo las
mismas condiciones iniciales, el resultado que se obtiene no siempre es el mismo. A
menudo, y por muy diversas razones, es necesario aceptar que no es posible predecir el
resultado de un experimento particular aún cuando se le haya efectuado con anterioridad
varias veces bajo las mismas condiciones iniciales, y en consecuencia se considera
aleatorio. Bajo estas circunstancias, la probabilidad tiene el objetivo de modelar
matemáticamente cualquier experimento aleatorio de interés. Para poder trabajar con esto
modelos de probabilidad necesitamos variables aleatorias.
Es muy importante señalar que un modelo de distribución de probabilidad de una variable
aleatoria nos permitirá estudiar una enorme cantidad de procesos naturales y sociales de
carácter aleatorio. En esta unidad trabajaremos con los modelos de probabilidad,
llamados también modelos de distribución de probabilidades o simplemente distribución
de probabilidad, Binomial, Poisson y Normal no sin antes saber y conocer lo que es una
variable aleatoria.
Propósito
Al término de la unidad el estudiante serás competente para determinar la forma en que la
probabilidad de un evento se distribuye; mediante la utilización de variables aleatorias, así
como el análisis de la distribución de probabilidad normal, binomial y de Poisson. Esto te
permitirá realizar un mejor análisis de un fenómeno físico o social.
1
4.1 Variables Aleatorias
En gran cantidad de experimentos aleatorios es necesario cuantificar los resultados, es
decir, asignar a cada resultado del experimento un número, con el fin de poder realizar un
estudio matemático. La importancia de las variables aleatorias radica en que nos permitirá
introducir modelos matemáticos en el cálculo de probabilidades. Podemos decir que una
variable aleatoria es aquella que toma valores numéricos determinados por los resultados
de un experimento aleatorio y generalmente se representan por las últimas letras del
alfabeto X, Y o Z.
Ejemplos
1.- En el experimento de lanzar 3 monedas al aire, el espacio muestral está dado por
Ω={(A,A,A), (A,A,S), (A,S,A), (S,A,A), (A,S,S), (S,A,S), (S,S,A), (S,S,S)}. Podemos definir
la variable aleatoria X=número de águilas en las 3 monedas. Los valores que toma la
variable X=0, 1, 2 y 3. Es decir
Ω Valores de X
(Número de águilas en las 3 monedas)
(S,S,S) 0
(S,S,A) 1
(S,A,S) 1
(A,S,S) 1
(S,A,A) 2
(A,S,A) 2
(A,A,S) 2
(A,A,A) 3
2.- Para el experimento de observar 2 niños recién nacidos en un Hospital. El espacio
muestral está dado por Ω={HH, HM, MH, MM}. Podemos definir la variable aleatoria
X=número de varones, entonces los valores que toma X=0, 1, 2.
Ω Valores de X
(Número par)
HH 2
HM 1
MH 1
MM 0
3.- De una caja que contiene 5 tarjetas numeradas del 1 al 5 se extraen 3 tarjetas una por
una y sin reemplazo. El espacio muestral está dado por Ω={(1,2,3),
((1,2,4),(1,2,5),(1,3,4),(1,3,5),(1,4,5),(2,3,4),(2,3,5),(2,4,5), (3,4,5)}. Podemos definir a
X=El mayor de los tres números sacados, así X=3, 4, 5.
4.- Se lanzan dos dados a una mesa. El espacio muestral está dado por Ω = {(1,1),
(1,2),…(1,6), (2,1), (2,2), (2,3),…, (3,1), (3,2), (3,3),…, (4,1), (4,2), (4,3), …, (5,1), (5,2),
2
(5,3),…, (6,1), (6,2), (6,3),…, (6,6)}. Podemos definir X=La suma de los números,
entonces X=2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12.
5.- Un profesor califica sus pruebas en una escala de 4 puntos (1, 2, 3 y 4). Para un curso
que tiene con 15 alumnos los resultados ordenados fueron 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 3, 3,
4, 4, 4. Podemos definir la variable aleatoria Y= Resultado de la prueba de un alumno,
entonces Y=1, 2, 3, 4.
6.- En un hospital, de los nacimientos en el último mes, podemos definir la variable
aleatoria X=Peso del recién nacido. Si te fijas, los valores que puede tomar esta variable
son cualquiera por arriba de cero; es decir, cualquier real positivo.
7.- En una encuesta en una colonia que consta de 100 casas, se escoge una al azar y se
le pregunta ¿cuántos hijos tienen? Podemos definir la variable aleatoria Z=El número de
hijos del sexo masculino. La variable toma los valores Z=0, 1, 2, 3, 4, etc.
8.-Supongamos que vamos a realizar un experimento aleatorio que consiste en
seleccionar una persona y apuntar su altura. Podemos crear una variable aleatoria cuyos
valores sean el número de centímetros que tiene de alto la persona observada.
En conclusión, una variable aleatoria X es aquella en la que se establece una
correspondencia entre el espacio muestral Ω y el conjunto de los números reales,
correspondencia en la cual a cada elemento de Ω le corresponde uno y solamente
un número real. Es decir, una variable aleatoria es una función de Ω en el conjunto
de los números reales.
Las variables aleatorias se clasifican en Discretas y Continuas.
Las variables aleatorias Discretas son aquellas que en las cuales el conjunto de
posibles valores es numerable finita o infinitamente, es decir, sólo toma valores
enteros. Generalmente están asociadas a experimentos en que se mide el
número de veces que sucede algo. Por ejemplo: El número de hijos, número de
páginas de un libro, los puntos obtenidos al lanzar un dado, el número de
preguntas en una clase de una hora, etc.
Las variables aleatorias Continuas son aquellas en las que el conjunto de posibles
valores es no numerable, es decir, puede tomar todos los valores de un intervalo y
generalmente son el resultado de medir en un experimento. Por ejemplo, el peso
de los recién nacidos en un hospital, la altura de loa alumnos de una clase, el
tiempo de duración de un foco, la longitud de una planta dentro de 2 meses, etc.
Pero, ¿cómo se distribuye una variable aleatoria?
(Se realiza en plataforma)
3
4.2 Distribución de Probabilidad
Empecemos a trabajar con la distribución de probabilidad de una variable discreta la cual
se puede definir de la siguiente manera:
La distribución de probabilidad de una variable aleatoria discreta es una tabla,
gráfica, fórmula, función o cualquier otro medio que se use para especificar todos
los valores posibles de una variable aleatoria discreta junto con sus probabilidades
respectivas.
Ejemplo
Una enfermera tiene a su cargo 50 familias. Vamos a construimos la distribución de
probabilidad de la variable aleatoria X=el número de niños por familia para esta población.
La siguiente tabla muestra la frecuencia de niños en las familias así como la probabilidad
de que la variable aleatoria tome el valor de 0, 1, 2, …, 10.
X (Número de niños) Frecuencia de ocurrencia P(X=x)
de x.
0 1 P(X=0)=1/50=0.02
1 4 P(X=1)=4/50=0.08
2 6 P(X=2)=6/50=0.12
3 4 P(X=3)=4/50=0.08
4 9 P(X=4)=9/50=0.18
5 10 P(X=5)=10/50=0.2
6 7 P(X=6)=7/50=0.14
7 4 P(X=7)=4/50=0.08
8 2 P(X=8)=2/50=0.04
9 2 P(X=9)=2/50=0.04
10 1 P(X=10)=1/50=0.02
TOTAL 50 1
La cual se puede representar gráficamente
Imagen 22. Distribución de probabilidad del número de niños
4
Si te fijas bien, te darás cuenta que los valores de P(X=x) son todos positivos, que todos
son menores que 1 y su suma es igual a 1. Lo anterior son las propiedades esenciales
que tienen todas las distribuciones de probabilidad de variables aleatorias discretas; es
decir
1.
2.
Con la distribución de probabilidades pueden hacerse proposiciones de probabilidad
referentes a la variable aleatoria X. Vamos a suponer que la enfermera, con las 50
familias a su cargo, elige aleatoriamente una de ellas para visitarla.
¿Cuál es la probabilidad de que la familia tenga 3 niños? En la tabla anterior y en
la gráfica se ve claramente que es 4/50=0.08; es decir P(X=3)=0.08.
¿Cuál es la probabilidad de que la familia elegida al azar tenga 3 o 4 niños? Para
responder a esta pregunta se aplica la regla de adición de probabilidades, es decir,
P(X=3) + P(X=4) =0.08 + 0.18 = 0.26.
A veces resultará conveniente y útil trabajar con la distribución de probabilidad acumulada
de una variable aleatoria. La distribución de probabilidad acumulada se obtiene sumando
sucesivamente las probabilidades P(X=x), por ejemplo, en la tabla anterior tendríamos
que
X (Número de Frecuencia de P(X=x) P(X x)
niños) ocurrencia de x.
0 1 0.02 0.02
1 4 0.08 0.1
2 6 0.12 0.22
3 4 0.08 0.3
4 9 0.18 0.48
5 10 0.2 0.68
6 7 0.14 0.82
7 4 0.08 0.9
8 2 0.04 0.94
9 2 0.04 0.98
10 1 0.02 1
TOTAL 50 1
Con lo anterior podemos responder a preguntas como:
¿Cuál es la probabilidad de que una familia al azar de entre las 50 tenga menos de
5 niños? Lo que necesitamos para responder es calcular P(X<5), ésta se obtiene
determinando el valor de la probabilidad acumulada para los valores de X=0 hasta
X=4; es decir, P(X<5) = P(X=0) + P(X=1) + P(X=2) + P(X=3) + P(X=4) lo cual se
puede calcular sumando cada una de las probabilidades que sería lo mismo que
ubicar la distribución de probabilidad acumulada hasta X=4. Entonces
P(X<5)=0.48.
¿Cuál es la probabilidad de que una familia elegida aleatoriamente tenga 5 o más
niños? Usando el concepto del complemento de una probabilidad, visto
5
anteriormente, el conjunto de familias con 5 o más niños es el complemento del
conjunto de familias con menos de 5. Su suma es igual al conjunto universal de 50
familias. Como la probabilidad total es 1 y se ha encontrado que P(X<5)=0.48; la
probabilidad P(X 5)=1-P(X<5) = 1 – 0.48 = 0.52.
¿Cuál es la probabilidad de que una familia seleccionada al azar tenga entre 3 y 6
niños, incluyendo 3 y 6? Lo que debemos calcular es P (3 6). Para calcular lo
anterior tenemos que P (3 X 6)=P(X 6) – P(X<3) = 0.82 – 0.22=0.6 Para
comprobar lo anterior podemos también calcular
P(3 X 6)=P(X=3)+P(X=4)+P(X=5)+P(X=6) = 0.08+0.18+0.2+0.14=0.6.
Si consideramos que la distribución de probabilidad anterior se desarrollo a partir de una
experiencia real, encontrar otra variable aleatoria siguiendo esta distribución sería una
coincidencia; sin embargo, las distribuciones de probabilidad de muchas variables de
interés pueden determinarse o suponerse sobre la base de consideraciones teóricas. Más
adelante se estudiarán dos de éstas distribuciones teóricas de probabilidad: La Binomial y
la de Poisson.
Con respecto a las variables aleatorias continuas, como pueden tomar muchos valores
dentro de un intervalo lo que hicimos para las variables aleatorias discretas no nos
funcionaria, es decir, tomar cada valor con su probabilidad asociada porque representa un
punto y no un intervalo. Para poder conocer la distribución de probabilidad de una variable
aleatoria continua nos valdremos de lo que se conoce como una función de densidad.
Dicha función nos proporciona una gráfica parecida a un histograma, y no será difícil creer
que, en general, a medida que el número de observaciones tiende al infinito y el ancho de
los intervalos de clase tiende a cero el histograma se aproxima a una curva suave
Curvas suaves como ésta son la que se usan para representar gráficamente a las
variables aleatorias continuas. Esto tiene algunas consecuencias importantes, cuando se
trabaja con las distribuciones de probabilidad de variables continuas, como que el área
total bajo la curva es igual a 1. Así mismo, la probabilidad entre dos puntos cualesquiera,
sobre el eje X, es igual al área limitada por las rectas perpendiculares levantadas en esos
dos puntos, la curva y el eje X.
6
Es muy importante destacar que la probabilidad de cualquier valor específico de la
variable aleatoria continua es cero, esto parece lógico puesto que un valor específico se
representa por un punto sobre el eje X y el área por encima de un punto es cero.
Una función f(x) recibe el nombre de distribución de probabilidad (llamada también
función de densidad de probabilidad) de la variable aleatoria X, si el área total
limitada por su curva y el eje X es igual a 1, y si el área debajo de la curva limitada
por la curva, el eje X y las perpendiculares levantadas en dos puntos cualesquiera a
y b, da la probabilidad de que X esté entre los puntos a y b. Es decir P(a<X<b).
Más adelante trabajaremos con una función de distribución de probabilidades para
variables aleatorias continuas llamada la Distribución Normal.
7
4.3 Distribución de Probabilidad Binomial
La distribución Binomial es una de las distribuciones de probabilidad que se encuentran
con más frecuencia en la estadística aplicada. La distribución se obtiene de un proceso
conocido como ensayo de Bernoulli, en honor al matemático suizo James Bernoulli (1654
– 1705), quien realizó importantes contribuciones en el campo de la probabilidad,
incluyendo en particular, a la distribución binomial.
Cuando un solo ensayo de algún proceso o experimento puede conducir sólo a uno de
dos resultados mutuamente exclusivos, tales como águila o sol, muerto o vivo, enfermo o
saludable, masculino o femenino, el ensayo se conoce como ensayo de Bernoulli. Una
sucesión de ensayos de Bernoulli forman un proceso de Bernoulli bajo las condiciones
siguientes:
1.- Cada ensayo conduce a uno de dos resultados posibles, mutuamente exclusivos. Uno
de los resultados posibles se denota (arbitrariamente) como éxito y el otro se denota
como fracaso.
2.- La probabilidad de éxito, denotada por p, permanece constante de ensayo a ensayo.
La probabilidad de fracaso, 1-p, se denota por q.
3.- Los ensayos son independientes, es decir, el resultado de cualquier ensayo particular
no es afectado por el resultado de cualquier otro ensayo.
Un proceso o experimento aleatorio tiene una distribución Binomial si se compone
de n ensayos de Bernoulli, estadísticamente independientes y con la misma
probabilidad de éxito p en cada uno de ellos. En este caso la variable aleatoria X es
X=”Número de éxitos obtenidos en los n ensayos de Bernoulli”, donde los posibles
valores de X=0, 1, 2, 3, …, n. Una distribución Binomial está determinada por dos
parámetros: uno es el número n de ensayos y el otro es la probabilidad de éxito p y
se representa X b(n,p). La función de distribución de probabilidad
es para x=0, 1, 2, 3, …, n.
8
Ejemplos
1. Se lanza una moneda 5 veces y se cuenta el número de águilas que salen.
Podemos tomar la variable aleatoria X=Número de águilas, tomando que el éxito
es obtener águila. Como se trata de lanzar una moneda, la probabilidad de que
salga águila es 0.5, por lo tanto p=0.5 y como consecuencia q=1-p=1-0.5=0.5.
Además n=5.
a. ¿Cuál es la probabilidad de que salgan 3 águilas?
P(X=3) = (5C3)(0.5)3(0.5)5-3 = , es decir 31.25%.
b. ¿Cuál es la probabilidad de que salgan 2 soles?
Como n=5 y x=3 águilas (éxitos), los fracasos son n-x=5-3=2 que son los
soles. Como tenemos que P(X=3)=0.3125 entonces usando el
complemento 1-P(X=3) obtenemos la probabilidad buscada, así que al
calcular 1-0.3125=0.6875.
c. ¿Cuál es la probabilidad de que salgan menos de 3 águilas, incluyendo 3
águilas?
La probabilidad buscada es P(X )=P(X=0) + P(X=1) + P(X=2) + P(X=3),
entonces
P(X=0)= (5 C0)(0.5)0(0.5) 5-0=
P(X=1)= (5 C1)(0.5)1(0.5) 5-1=
P(X=2)= (5 C2)(0.5)2(0.5) 5-2=
P(X=3)= (5 C3)(0.5)3(0.5) 5-3=
Entonces P(X )=0.03125+0.15625+0.3125+0.3125 = 0.8125.
d. ¿Cuál es la probabilidad de que salgan entre 2 y 4 águilas, incluyendo 2 y 4
águilas?
La probabilidad buscada es P(2 X 4), la cual la calculamos haciendo
P(2 X 4)=P(X 4) - P(X 2) o podemos calcularlo haciendo
P(2 X 4)=P(X=2)+P(X=3)+P(X=3). Realiza los cálculos en tu cuaderno.
e. ¿Cuál es la probabilidad de que salgan más de 2 águilas, incluyendo 2
águilas?
Lo resolvemos con P(X 2)=1-P(X 2)=1-[0.03125+0.15625+0.3125]=0.5.
2. Supóngase que se sabe que el 30% de cierta población son inmunes a alguna
enfermedad. Si , se selecciona una muestra aleatoria de tamaño 8 de ésta
población
a. ¿Cuál es la probabilidad de que contenga exactamente cuatro personas
inmunes?
b. ¿Cuál es la probabilidad de que contenga al menos 5 personas inmunes?
c. ¿Cuál es la probabilidad de que tenga máximo 7 personas inmunes,
incluyendo 7 personas?
9
Para resolver el problema podemos proceder como en el ejemplo anterior y usar
directamente la función de distribución Binomial como lo hicimos en el ejemplo anterior sin
embargo también podemos resolverlo usando la tabla de distribución d e probabilidades
acumulada. Tomaremos que el éxito es que sea inmune la persona con los que p=0.3, por
lo tanto q=0.7. Calculemos dicha tabla
Número de personas P(X=x) P(X x)
seleccionadas (X)
0 0.05764801 0.05764801
1 0.19765032 0.25529833
2 0.29647548 0.55177381
3 0.25412184 0.80589565
4 0.1361367 0.94203235
5 0.04667544 0.98870779
6 0.01000188 0.99870967
7 0.00122472 0.99993439
8 0.00006561 1
Ahora si podemos responder las preguntas
a. ¿Cuál es la probabilidad de que contenga exactamente cuatro personas
inmunes?
P(X=4) = 0.1361367
b. ¿Cuál es la probabilidad de que contenga al menos 5 personas inmunes?
P(X>5) = 1-P(X 5) = 1- 0.98870779 = 0.01129221
c. ¿Cuál es la probabilidad de que tenga máximo 7 personas inmunes,
incluyendo 7 personas?
P(X 7)=0.99993439
Los cálculos de las probabilidades pueden resultar un poco laboriosa y tediosa cuando n
tome un valor muy grande, por esa razón existen tablas donde se ha calculado ya la
probabilidad, de una variable aleatoria que se distribuye en forma Binomial, para
diferentes valores de n, p y x.
10
Imagen 27. Tabla de la distribución binomial
11
También existen tablas con la distribución de probabilidad acumulada
Imagen 28. Tabla de distribución binomial acumulada
En cualquiera de los casos, se pueden utilizar para calcular la probabilidad que necesites.
4.4 Distribución de Probabilidad Poisson
La siguiente distribución discreta que estudiaremos es la distribución Poisson, llamada así
en honor al matemático francés Simeon Denis Poisson (1781-1840). Esta distribución se
ha utilizado mucho en biología y medicina.
12
La distribución de Poisson se caracteriza por dos cosas:
1.- Porque en el proceso estudiado está identificado una UNIDAD cualquiera (que puede
ser de tiempo, de espacio, de volumen o peso material, etc.). Como unidades podemos
entender:
Un litro
Una hectárea
Uno o diez minutos
Una página de un libro
Una semana, un lapso de 25 minutos, una hora
Una comunidad con un tamaño específico
Un siglo
2.- Porque se contabiliza un cierto NÚMERO DE OCURRENCIAS EVENTUALES para
cada unidad. Como ocurrencias eventuales podemos entender
La aparición de cierta bacteria
La maduración de granos cultivados
La llegada de una persona a una caja de una tienda
La llegada de un paciente a un hospital determinado
El desperdicio del agua en una comunidad
Podemos afirmar entonces que los siguientes son procesos con distribución Poisson:
a. El número de bacterias por litro que hay en cierto tipo de recipientes.
b. La cantidad de granos por hectárea recogidos en una cosecha.
c. El tiempo (cada minuto o cada diez minutos) de espera de una persona en la
cola de una caja registradora.
d. El tiempo de estadía de un paciente en el servicio de emergencias de un
hospital (por día, por mes, por semana, etc.).
e. La cantidad en metros cúbicos de agua desperdiciada por comunidad de
tamaño específico.
Si X es una variable aleatoria discreta que satisface las condiciones de la
distribución de Poisson y λ es el número promedio de ocurrencias por unidad,
entonces la función de distribución de probabilidad para los posibles valores de
X=0, 1, 2, … es f(x)=P(X=x)= donde e es una constante cuyo valor es 2.718….
En este caso escribimos X Poisson( ).
Ejemplos
1.- El administrador de un hospital, que ha estado estudiando las admisiones diarias de
emergencia durante un periodo de varios años, ha llegado a la conclusión de que están
distribuidas de acuerdo con la ley de Poisson. Los registros del hospital revelan que,
durante este periodo, las admisiones de emergencia han sido, en promedio, de 3 por día.
Si el administrador está en lo cierto al suponer una distribución de Poisson, encontrar la s
siguientes probabilidades:
13
Antes de calcular las probabilidades es importante dejar claro que la variable aleatoria
X=Número de admisiones diarias de emergencia y =3.
La probabilidad de que en un día dado, ocurran exactamente dos admisiones de
emergencia.
P(X=2)= 0.225
La probabilidad de que en un día particular no ocurra admisión de emergencia
alguna.
P(X=0)= 0.050.
La probabilidad de que en un día particular sean admitidos tres o cuatro casos de
emergencia
Usando la suma de probabilidades tendríamos que la probabilidad buscada está
dada por P(X=3) + P(X=4). Entonces si
o P(X=3)= 0.225 y
o P(X=4)= 0.16875
o P(X=3) + P(X=4)= 0.225 + 0.16875 = 0.39375
La probabilidad de que en un día particular sean admitidos a los más tres casos de
emergencia incluyendo el tercer caso.
Esta probabilidad la calculamos con
P(X 4)=P(X=0)+P(X=1)+P(X=2)+P(X=3)=0.050+0.15+0.225+0.225=0.65.
2.- En una call center entran en promedio 4 llamadas telefónicas cada 10 minutos en
horas hábiles. Si X=Número de llamadas telefónicas, calcular
La probabilidad de que en un intervalo de 10 minutos entren exactamente 3
llamadas.
Tenemos que =4 entonces P(X=3)= 0.192
La probabilidad de que sucedan a lo más dos llamadas en un intervalo de 10
minutos.
P(X 2)=P(X=0)+P(X=1)+P(X=2)= =0.2381
La probabilidad de que se presenten más de dos llamadas en un intervalo de 10
minutos.
P(X>2)=1-P(X 2)=1-0.2381=0.7619.
14
Al igual que la distribución Binomial, existen tablas donde ya están calculadas las
probabilidades para diferentes valores de y de X.
Imagen 30. Tabla de distribución Poisson
15
4.5 Distribución de Probabilidad Normal
La distribución Normal es la más importante de toda la estadística. La fórmula para esta
distribución fue publicada por primera vez por Abraham De Moivre (1667 – 1754). Muchos
otros matemáticos figuran de manera prominente en la historia de la distribución normal,
incluyendo a Carl Friedrich Gauss (1777-1855). Con frecuencia se le nombra como
distribución gaussiana en reconocimiento a sus contribuciones.
La distribución Normal es aquella en la que la función de densidad f(x) crece y
decrece suave y simétricamente a derecha e izquierda de la media. Su
representación gráfica se aproxima o es semejante a una campana como lo muestra
la siguiente figura
Imagen 31. Distribución normal
Su función de densidad está dada por f(x)= donde y (los
parámetros característicos de la distribución normal) son respectivamente la media
y la desviación estándar de la variable aleatoria X. La distribución normal de una
variable aleatoria X se representa X ( , ).
Por su gran importancia es necesario conocer sus propiedades:
1.- Como toda distribución de una variable aleatoria continua, el área de la superficie
delimitada por la curva y el eje x es igual a uno.
16
2.- Es simétrica con respecto a su media
3.- La media, la mediana y la moda son iguales.
4.- Si se levantan perpendiculares a una distancia de una desviación estándar de la
media, en ambas direcciones, el área encerrada por estas per pendiculares, el eje x y la
curva será aproximadamente el 68% del área total.
Si se extienden estas fronteras laterales hasta una distancia de dos desviaciones
estándar, hacia cada uno de los dos lados de la media, se encerrará aproximadamente el
95% del área.
Imagen 34. Gráfica del área a 2 desviaciones estándar
Si se extiende hasta una distancia de 3 desviaciones estándar, se provocará que
aproximadamente el 99.7% del área total queda encerrada.
Imagen 35. Gráfica del área a 3 desviaciones estándar
5.- La distribución normal queda completamente determinada por los parámetros µ y σ. En
otras palabras, se especifica una distribución normal diferente para cada valor deferente
17
de µ y σ. Los valores diferentes de µ trasladan a la gráfica de la distribución a lo largo del
eje x.
Imagen 36. Variación de la distribución normal en función de μ
Los valores diferentes de σ determinan el grado de aplastamiento o de lo puntiagudo de la
gráfica de la distribución.
Imagen 37. Variación de la distribución Normal en función de σ
Esta última propiedad de la distribución normal implica que en realidad ésta es una familia
de distribuciones, en la cual se distingue un miembro de otro con base en los valores de
µ y σ. El miembro más importante de ésta familia es la distribución normal unitaria o
estándar, llamada así porque tiene una media de cero y una desviación estándar de uno.
La función de densidad de ésta distribución puede obtenerse a partir de sustituir µ=0 y
σ=1 en la función de densidad de la distribución normal. Pero, ¿por qué es la más
importante? Porque todos los casos particulares de distribuciones normales pueden ser
trasladados a una distribución normal unitaria en la cual la variable aleatoria X cambia a Z,
con lo cual tenemos que Z N(0,1), es decir, cualquier evento de una variable aleatoria X
se traslada a un evento de la normal unitaria, Z, que mantenga la misma probabilidad (las
probabilidades de ambos eventos deben corresponder a áreas iguales).
18
Y, ¿Cómo logramos transformar X ( , ) en Z N(0,1)? Usando la fórmula Z= . Así
la P(a<X<b) será lo mismo que calcular P(0<Z<z). Si te das cuenta, para poder calcular la
probabilidad, en cualquiera de los casos, tendríamos que encontrar el área bajo la curva.
Imagen 38. Gráfica del área bajo la curva
Esta tarea se tendría que hacer usando Cálculo Integral. No lo haremos a través del
Cálculo sino usando la tabla de la distribución normal unitaria con la cual se nos facilitará
más el cálculo de las probabilidades. Las tabla nos dan el valor del área bajo la curva
entre cero y el valor de z (ver figura). ¿Cuál es la tabla?
Imagen 39. Gráfica del área bajo la curva entre 0 y el valor de z
19
Imagen 40. Tabla de distribución normal
20
Y ¿Cómo se usan?
Ejemplos
1.- ¿Cuál es la probabilidad de que z esté entre 0 y 2.27?
Lo que nos piden queda representado en la gráfica siguiente
Imagen 41. Gráfica de probabilidad de que z esté entre 0 y 2.27
Para localizar el valor de 2.27 en las tablas, primero buscamos en la primer columna el
valor 2.20, después de manera vertical sobre el reglón que corresponde a 2.2 buscamos
la columna de 0.07 y la intersección de columna y renglón finalmente nos da el valor
buscado. En este caso P(0<z<2.27)=0.4884.
2.- ¿Cuál es la probabilidad de que una z elegida al azar de entre la población de z tenga
un valor entre -2.55 y 2.55?
La región buscada está dada por la siguiente imagen:
Imagen 42. Gráfica de la probabilidad de que una z elegida al azar de entre la población de z tenga
un valor entre -2.55 y 2.55
La probabilidad buscada es en realidad P(-2.55<z<2.55). El valor de la probabilidad entre
0 y 2.55 es de 0.4946 (buscándolo en tablas como en el ejemplo anterior) sin embargo
estamos buscando sobre el área entre -2.55 y 2.55, así que aprovechando el hecho de la
distribución es simétrica, nos damos cuenta que se ha encontrado la mitad del área
deseada. Para obtener el área total, duplicamos el valor de 0.4946 con lo que el área total
es de 0.9892, es decir, la probabilidad de que z esté entre -2.55 y 2.55 es de 0.9892.
21
Como te habrás dado cuenta calcular el área entre 0 y un valor positivo es el mismo que
calcularlo entre 0 y un valor negativo.
3.- Calcular la probabilidad de que z esté entre -3.01 y 0.
Si nos fijamos bien, es la misma probabilidad que calcular entre 0 y 3.01, por lo tanto la
P(-3.01<z<0)=P(0<z <3.01)=0.4987.
4.- ¿Cuál es la probabilidad de que z esté entre -2.74 y 1.53?
P(-2.74<z<1.53)=P(0<z<2.74) + P(0<z<1.53)=0.4969 + 0.4370 = 0.9339.
5.- Calcular P(z 2.71). Debido a que se trata de una distribución de probabilidad para
variables aleatorias continuas, calcular P(
La probabilidad que nos piden es a partir de 2.71 hacia la derecha al infinito. Como
sabemos que la mitad del área de la distribución normal vale 0.5 y con las tablas
obtenemos P(0<z<2.71) entonces P(z 2.71)=0.5 - P(0<z<2.71) = 0.5 – 0.4996 = 0.0034.
6.- Calcular P(0.84 z 2.45).
P(0.84 z 2.45)= P(0 z 2.45) - P(0 z 0.84) = 0.4929 – 0.2996.
Ahora que ya sabemos usar las tablas de la distribución normal unitaria o estándar, estás
listo para resolver problemas de aplicación de la distribución normal.
Ejemplos
1.- Un psicólogo nota que las calificaciones que se obtienen en una cierta prueba de
habilidad mental están distribuidas aproximadamente en forma normal, con una media de
10 puntos y una desviación estándar de 2.5. Si un individuo elegido al azar realiza la
prueba, ¿cuál es la probabilidad de que obtenga una calificación de 15 puntos o más?
La variable aleatoria es X=Número de puntos obtenidos en la prueba. Además, tenemos
que se trata de una distribución normal con media de 10 puntos y desviación estándar de
2.5. Anteriormente vimos que cualquier distribución normal se puede transformar en una
distribución normal unitaria con media cero y desviación estándar de 1 haciendo la
transformación de X en Z. Tenemos entonces que Z= = = 2. Con lo anterior,
tenemos que P(X>15) = P(z>2) y ésta última probabilidad la podemos calcular como lo
hicimos anteriormente usando la tabla de la distribución normal unitaria. Es importante
que te des cuenta que el hecho de hacer la transformación de X en Z nos da la ventaja de
usar la tabla de la distribución normal unitaria para calcular cualquier probabilidad.
Entonces P(z>2) = 0.5 – P(0<z<2) = 0.5 – 0.4772 = 0.0228. Con esto se dice que la
probabilidad de que un individuo elegido al azar y que lleve a cabo la prueba obtenga una
calificación de 15 o más puntos es de 0.0228, es decir, el 2.28%.
22
2.- Se sabe que los pesos de cierto grupo de individuos están distribuidos
aproximadamente en forma normal con una media de 70 kg y una desviación estándar de
12.5 kg. ¿Cuál es la probabilidad de que una persona elegida al azar de éste grupo pese
entre 50 kg y 80 kg?
Primero hacemos la transformación de x=50 y x=80:
Si x=50 entonces Z= = = -1.6
Si x=80 entonces Z= = = 1.2
Así la probabilidad pedida P(50 x 85)=P(-1.6 z 1.2) y al calcular la segunda
probabilidad tenemos que:
P(-1.6 z 1.2)=P(-1.6 z 0)+P(0 z 1.2)=P(0 z 1.6)+P(0 z 1.2)=0.4452+0.3849
Finalmente P(50 x 85)=0.8301.
(Se realizan en plataforma)
Evaluación de Unidad (Se desarrollan en plataforma)
23
Conclusión
Haz finalizado tu cuarta unidad del curso de Estadística y Probabilidad, en el cual
aprendiste los siguientes conceptos:
24
Referencias
De contenido
Libros
Castillo, J. (1998). Estadística Básica. México: Grupo Editorial Iberoamérica.
Freund, J. (1994). Estadística Elemental. México: Pearson Prentice Hall.
Ross, S. (2007). Introducción a la Estadística. México: Reverté.
Triola, M. (2009). Estadística. México: Pearson Prentice Hall.
Zavala Aguilar, R. (2011). Estadística Básica. México: Trillas.
De consulta
Sitios de internet
Las siguientes ligas electrónicas te servirán de apoyo para las variables aleatorias
discretas, continuas así como para las distribuciones binomial, Poisson y normal.
BUÑUELOS, L. (s.f.). Probabilidad y Estadística. Tema III: Varia bles aleatorias,
UNAM. http://dcb.fi-
c.unam.mx/users/angellbs/htm/GRUPO1/ARCHIVOS_VARIOS_G1/PyE_T3.pdf
UNAM. (2012). Estadística y Probabilidad.
http://www.recursoseducativos.unam.mx/eduCommons/search?Subject%3Alist=E
stad%C3%ADstica%20y%20Probabilidad
UNAM. (s.f.). Capítulo 9: Las variables aleatorias y sus distribuciones de
probabilidad. http://dcb.fi-
c.unam.mx/profesores/irene/BEPI/capsbfc/cap09_bfc2011.pdf
UNAM. (S.F). Unidad 5: Distribuciones de probabilldiad.
http://ecampus.fca.unam.mx/ebook/imprimibles/informatica/matematicas_III/Unida
d_5.pdf
De imágenes
22. Distribución de probabilidad del número de niños
Elaborada por: Víctor Manuel Terreros Muñoz
Editado por: Alma Martínez Campech
23. Distribución de probabilidad de una variable aleatoria continua
Elaborada por: Víctor Manuel Terreros Muñoz
Editado por: Alma Martínez Campech
24. Distribución de probabilidad de una variable continua
Elaborada por: Víctor Manuel Terreros Muñoz
Editado por: Alma Martínez Campech
25. Distribución de probabilidad
Elaborada por: Víctor Manuel Terreros Muñoz
Editado por: Alma Martínez Campech
26. James Bernoulli
Recuperado de:
http://www.mhhe.com/math/calc/smithminton2e/cd/tools/timeline/bernoulli.html
27. Tabla de distribución binomial
Recuperado de:
25
http://www.matematicayfisica.com/descargas/binomial.jpg
28. Tabla de distribución binomial acumulada
Recuperado de:
http://matematica.laguia2000.com/wp-
content/uploads/2012/11/tablabidiacumulada.png
29. Simeon Denis Poisson
Recuperado de:
http://www.umass.edu/wsp/images/poisson.jpg
30. Tabla de distribución Poisson
Recuperado de:
http://destio.us.es/calvo/graficos/tablas07.gif
31. Distribución normal
Elaborada por: Víctor Manuel Terreros Muñoz
Editado por: Alma Martínez Campech
32. Gráfica de una distribución normal donde el eje x es igual a 1
Elaborada por: Víctor Manuel Terreros Muñoz
Editado por: Alma Martínez Campech
33. Gráfica del área total encerrada por perpendiculares
Elaborada por: Víctor Manuel Terreros Muñoz
Editado por: Alma Martínez Campech
34. Gráfica del área a 2 desviaciones estándar
Elaborada por: Víctor Manuel Terreros Muñoz
Editado por: Alma Martínez Campech
35. Gráfica del área a 3 desviaciones estándar
Elaborada por: Víctor Manuel Terreros Muñoz
Editado por: Alma Martínez Campech
36. Variación de la distribución normal en función de μ
Elaborada por: Víctor Manuel Terreros Muñoz
Editado por: Alma Martínez Campech
37. Variación de la distribución Normal en función de σ
Elaborada por: Víctor Manuel Terreros Muñoz
Editado por: Alma Martínez Campech
38. Gráfica del área bajo la curva
Elaborada por: Víctor Manuel Terreros Muñoz
Editado por: Alma Martínez Campech
39. Gráfica del área bajo la curva entre 0 y el valor de z
Elaborada por: Víctor Manuel Terreros Muñoz
Editado por: Alma Martínez Campech
40. Tabla de distribución
Elaborada por: Víctor Manuel Terreros Muñoz
Editado por: Alma Martínez Campech
41. Gráfica de probabilidad de que z esté entre 0 y 2.27
Elaborada por: Víctor Manuel Terreros Muñoz
Editado por: Alma Martínez Campech
42. Gráfica de la probabilidad de que una z elegida al azar de entre la población de z
tenga un valor entre -2-25 y 2.55
Elaborada por: Víctor Manuel Terreros Muñoz
Editado por: Alma Martínez Campech
26