Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1 La Distribución Normal1
1 La Distribución Normal1
Introducción
Como sabes una distribución es la relación entre los valores que pueden tomar una variable y la probabilidad que le corresponde.
En este caso estudiaremos la distribución de una variable aleatoria continua la cual proviene de una medición, por ejemplo la estatura
de un grupo de chicos entre 15 y 18 años; el peso en kilogramos de estos chicos; la medición de las placas de acero para una estructura,
etc.
La mejor forma de trabajar con una variable aleatoria continua es por medio del área bajo la curva, cuyo tema lo viste y trabajaste en la
unidad de aprendizaje de Cálculo Integral.
La forma de representar las probabilidades de una variable aleatoria continua es por medio de una gráfica de una función simétrica,
cuyos límites están entre menos infinito y más infinito. El área bajo esta curva es igual a 1 o 100%; esto debido a los axiomas de
probabilidad que ya viste con anterioridad.
Veamos ahora cómo esa curva simétrica se estudia mediante una distribución de probabilidad normal.
La distribución de probabilidad normal es aquella en la cual, a partir de un punto central de máxima frecuencia (la media de la
distribución), los valores mayores y menores que la media se distribuyen simétricamente a derecha e izquierda, disminuyendo
gradualmente hasta desaparecer.
Esta distribución permite resolver, en forma aproximada, los problemas propios de las distribuciones binomial o de Poisson, por lo que
su importancia en probabilidad y estadística es fundamental.
Aunque los conceptos básicos fueron planteados inicialmente por el matemático francés Abraham
de Moivre (1667- 1754) y por el astrónomo francés Marques Pedro Simon de Laplace (1749-1827),
fue el matemático alemán Karl Fiedrich Gauss (1777-1855) quien presentó las leyes fundamentales
de la distribución normal de probabilidad, de manera que ésta se conoce también como distribución
gausiana y su curva (curva normal), se denomina igualmente campana de Gauss.
Las variables aleatorias continuas serán transformadas en puntajes estándar o tipificaciones, esto para poder localizar las variables sobre
la gráfica de la curva normal.
1 2
𝑁(0,1) = 𝑒 −1/2 𝑥
√2𝜋
La transformación la realizaremos mediante la siguiente equivalencia o tipificación, bajo el cambio de variable:
Tipificación
Ahora seguiremos trabajando en resolver cuestionan tés de probabilidad del tipo P (a ≤ x ≤ b) pero usando la estandarización y tablas
de áreas bajo la curva normal estándar, las cuales ya fueron determinadas por matemáticos para evitar perder tiempo en el manejo y
cálculo de áreas bajo la curva por medio de integrales.
Comienza a tipificar analizando los siguientes ejemplos en los cuales, como primer paso, encontrarás el valor de z probabilísticamente.
Ejemplo 1
Obtener la probabilidad de que el puntaje estándar sea menor o igual que -2.38
Entenderás que esto significa z ≤ - 2.38
Como z tiene un signo negativo indica que el valor está a la izquierda del centro, pero el signo debe eliminarse antes de utilizar la tabla
de área bajo la curva.
Ejemplo 2
Obtener la probabilidad cuando la variable aleatoria continua tome valores de 20 o menos, si la media es 10 y la desviación es 8.
De los datos dados en el enunciado, podemos determinar los siguientes valores:
𝑥 ≤ 20, 𝜇 = 10, 𝜎 = 8
Para poder encontrar la probabilidad harás uso de la fórmula de tipificación, puesto que no te dan el puntaje estándar, sino la variable,
por lo tanto hay que transformarla en puntaje estándar.
Toma en cuenta que la tabla da valores del centro a la izquierda o del centro a la derecha, por tal motivo el área sombreada es el resultado
de:
Finalmente la probabilidad de es de 89.44%
Ejemplo 3
Obtener la probabilidad de que el puntaje estandarizado sea mayor o igual que 1.5
Como tiene un signo positivo indica que el valor está a la derecha del centro.
Lo que nos indica, que la probabilidad buscada es la que corresponde al área sombreada, la cual va de
Ejemplo 4
Determinar la probabilidad de que el puntaje estándar sea mayor o igual que -0.69
Como tiene un signo negativo, indica que el valor está a la izquierda del centro.
Dado que debe ser mayor o igual que 0.69 indica que la probabilidad buscada es la que está en el área sombreada que va
de la gráfica siguiente:
Por tal motivo, el área sombreada es el resultado de:
Ejemplo 5
Determinar la probabilidad de los puntajes estándar que están entre
esto es:
Por la posición del área sombreada para obtener la probabilidad será de la manera siguiente: "área mayor menos área menor".
Como habrás observado estos ejemplos te permitieron poder localizar en la gráfica de la campana de Gauss los puntajes estándar, que
más adelante te servirán para poder resolver ejercicios del ámbito general. Recuerda que es indispensable graficar la posición del puntaje
estándar para poder determinar el área bajo la curva, que finalmente es la probabilidad buscada.
Como ya aprendiste a ubicar correctamente los puntajes estándar y además a encontrar el área bajo la curva que en sí es la probabilidad,
vamos emplear estos procedimientos para resolver los ejemplos que se presentan a continuación.
Ejemplo 6
La estatura promedio de los empleados de una empresa es de 1.65m con una desviación estándar de 0.062m. Supón una distribución
normal y determina qué porcentaje de los empleados mide:
a) más de 1.57m
b) menos de 1.70m
c) entre 1.57m y 1.70m
Finalmente la probabilidad o porcentaje de los empleados que miden más de 1.57m es de 90.15% .
Tenemos la media y la desviación estándar, datos para sustituir directamente en la fórmula de tipificación.
Como la pregunta dice que debe ser menor o igual que 0.81, la probabilidad buscada es la que está representada por el área sombreada
que va de de la gráfica siguiente:
Sustituimos los valores de la media y la desviación estándar en la fórmula de tipificación, obteniendo dos valores de , uno para cada
límite:
Como la pregunta dice que debe estar entre -1.29 a 0.81, la probabilidad buscada es el área bajo la curva normal que se encuentra en
dicho intervalo, como se muestra en la siguiente gráfica:
El área sombreada es el resultado de:
Por lo cual podemos decir que la probabilidad o porcentaje de empleados que miden entre 1.57m y 1.70m es de 69.25%
Ejemplo 7
En una ciudad se estima que la temperatura máxima en el mes de junio sigue una distribución normal, con media 23° y desviación
estándar 5°. Calcula el número de días del mes en los que se espera alcanzar máximas entre 21° y 27°
Sustituimos los valores conocidos en la fórmula de tipificación y se obtiene:
21 − 23
𝑧= = −0.4
5
27 − 23
𝑧= = 0.8
5
Graficando las posiciones obtenidas para los valores de z tenemos:
Por lo que a probabilidad buscada es la que está definida por el área sombreada que va de -0.4 a 0.8
Por lo cual podemos decir que la cantidad de días que se esperan con una máxima de temperatura entre 21° y 27° es:
𝜇 = 7.2 𝑎ñ𝑜𝑠
𝜎 = 1.9 𝑎ñ𝑜𝑠
Por tablas para un área de 0.35, z (1.04)= 0.35. Como se encuentra a la izquierda de la media z = - 1.04
𝑥 = (𝑧)(𝜎) + 𝜇
El teorema de Tchebyshef puede utilizarse para obtener un límite inferior de la probabilidad de que la variable aleatoria de interés “Y”
caiga en un intervalo de la forma 𝜇 ± 𝑘𝜎. Donde sea Y una variable aleatoria con una media finita μ y varianza 𝜎 2 .
1º. Se puede aplicar el resultado para cualquier distribución de probabilidad, ya sea que tenga forma de campana o no.
2º. Los resultados del teorema son muy conservadores en el sentido de que la probabilidad real de que Y esté en el intervalo 𝜇 ± 𝑘𝜎
generalmente excede por mucho el límite inferior de la probabilidad.
1. La variable aleatoria X representa la vida promedio de cierto aparato electrónico; tiene una distribución aproximadamente
normal, con media de 3.5 años y desviación estándar de 1.5 años. Si el fabricante de dichos aparatos desea reparar
solamente 10% de estos, en el periodo de garantía, calcula cuál tendrá que ser el periodo de garantía.
2. Se supone que X representa la resistencia a la ruptura de una cuerda, con un promedio de 100 y una desviación estándar
de 4. Cada alambre para cuerda produce una utilidad de $25, si x>95. En caso contrario, la cuerda se tiene que utilizar con
otro propósito y se obtiene una utilidad de $10 por alambre. Calcular la utilidad esperada por alambre.
3. Una distribución normal tiene una media (µ) de 50 y una desviación estándar de 5. ¿Qué porcentaje de la población de
valores se encuentra entre los siguientes intervalos? Realiza una gráfica representativa de cada uno de ellos.
a) De 40 a 50
b) De 40 a 45
c) De 56 a 60
d) De 40 a 65
e) Mayor a 50
f) Menor a 50
5. El peso que se necesita para poder ingresar al equipo de ballet del país de Rumania está basado en una distribución normal
con una media de 49.3 kg y una desviación estándar de 4.5 kg. Si hay 345 chicas ansiosas de pertenecer a este equipo en
el siguiente año.
6. Unos expertos agrícolas descubren que el rendimiento por acre de un determinado grano tiene una distribución
aproximadamente a la normal, con una media de 40 toneladas y varianza de 100. Si se elige un acre en la hacienda donde
se siembra este grano:
7. El tiempo necesario para que un alumno responda completamente un examen parcial de Matemáticas se distribuye
normalmente con una media de 100 minutos y una desviación estándar de 9 minutos. El tiempo límite para la solución del
examen es de 120 minutos. Se sabe que en el turno matutino de la ESIME Azcapotzalco hay 923 alumnos inscritos. Con
esta información responde a las siguientes preguntas:
8. En un proceso industrial, el diámetro de un balero es parte importante de un componente. El comprador establece en sus
especificaciones que el diámetro debe ser 3.0 cm ±0.01 cm. Esto implica que no se acepta ningún balero que se salga de
esta especificación. Se sabe que el proceso, el diámetro de un balero es una variable aleatoria X que tiene una distribución
normal con una media de 3.0 y una desviación estándar de 0.005 ¿en promedio, que porcentaje de baleros fabricados se
descartará?
9. Se utilizan medidores para verificar y poder rechazar, todos los componentes de un lote de piezas mecánicas cuyas
dimensiones no se encuentran dentro de la especificación 1.5 ±d. Se sabe que esta dimensión es una variable aleatoria X
que tiene distribución normal con una media de 1.5 y una desviación estándar de 0.2. Determinar el valor de d para que la
especificación cubra el 95% de las mediciones.
10. Las mediciones de corriente eléctrica en una tira de alambre es una variable aleatoria X que tiene distribución normal con
una media de 10 mA y una varianza de 4 mA ¿cuál es la probabilidad de que una medición exceda a 13 mA?
Ahora ya puedes calcular probabilidades de variables aleatorias continuas, por medio de la distribución normal, sin embargo también
existe una aproximación, la cual estudiaremos a continuación.
La aproximación es un procedimiento matemático donde las variables aleatorias discretas las transformamos en continuas por medio de
la aproximación de la normal a la binomial. Esto con el propósito de simplificar procedimientos laboriosos y tardados que se presentan
algunas veces en la distribución binomial.
Para esta aproximación hacemos una corrección en nuestras variables aleatoria discretas, que es restar o sumar un valor de 0.5, llamado
parámetro de corrección.
Para saber cuándo restar o sumar se verifica la pregunta del ejercicio y por medio de esta tabla, donde te damos la simbología que
pudieras utilizar, te darás cuenta de la operación a utilizar.
Para determinar los valores de x debemos analizar la frase que indica los valores, por ejemplo:
1. al menos 120, por lo tanto x=119.5
2. más de 120, por lo tanto x = 120.5
3. a lo sumo 120, por lo tanto x = 120.5
4. menos de 120, por lo tanto x = 119.5
5. exactamente 120, por lo tanto x = 119.5 entre x = 120.5
Como habrás notado en la frase "exactamente 120", con una distribución normal la probabilidad sería cero, pero como en este caso es
una aproximación la corrección nos permite poder calcular la probabilidad, ya que nos generará dos valores llamados límites.
Ejemplo 9
Un dado equilibrado es lanzado 180 veces. Determina la probabilidad de que aparezca la cara con el número 6:
a) entre 29 y 32 veces inclusive
b) entre 31 y 35 veces inclusive
c) menos de 22 veces
Un diagrama de árbol sería muy difícil de hacer para 180 lanzamientos, lo correcto es utilizar una distribución binomial, pero también
podemos utilizar una aproximación de una distribución discreta a una continua. A continuación te mostraremos ambos procedimientos
para que observes la diferencia entre una binomial y una aproximación.
En este caso empleamos la notación sigma ∑ que nos indica que tenemos que desarrollar la fórmula de la binomial desde el valor de la
x, la variable discreta, de 29 hasta 32; lo cual nos permite simplificar la escritura, si bien el procedimiento es el mismo que viste en el
tema de la distribución binomial.
Realizando este mismo inciso pero como aproximación, primeramente hacemos el ajuste de continuidad en nuestras variables.
𝑃(29 ≤ 𝑥 ≤ 32) utilizando la tabla de ajuste por continuidad, x =28.5, x = 32.5
Ahora calcularemos la media y la desviación con las fórmulas de la distribución binomial.
1
𝜇 = 𝑛𝑝 = 180 × = 30
6
1 5
𝜎 = √𝑛 × 𝑝 × 𝑞 = √180 × × =5
6 6
Y como np≥5 es decir, como se cumple que 30≥5 podemos realizar la aproximación.
28.5 − 30
𝑧= = −0.30
5
32.5 − 30
𝑧= = 0.50
5
Graficando y obteniendo valores de la tabla tenemos:
Como observas la aproximación se sugiere aplicar cuando los procedimientos para calcular una distribución binomial son muy largos,
como en el inciso c, y además siempre y cuando np≥5, si esto no se cumple, la aproximación no se puede realizar.
Pero la aproximación sí es aceptada como válida, porque la diferencia de la distribución binomial con la aproximación es muy pequeña,
casi nula.
Ejercicios:
1. Al realizar un experimento para 200 familias (cada familia simulada se considera un ensayo) la probabilidad de que nazca un niño o
una niña es del 50%.
2. Una fábrica de tapones para botella de licor tiene 20% de producción defectuosa (rebabas, manchas, etc.). Los productores de licor
deciden seguir comprando tapones a la fábrica, si al inspeccionar aleatoriamente un lote de 200 tapones no se encuentran más de 25
defectuosos. Se calcula la probabilidad de que los productores no tengan que cambiar de proveedor.
Conclusión
Como pudimos constatar a lo largo de este curso las características básicas de las distribuciones de frecuencia y probabilidad son
semejantes, pero con la diferencia importante de que, por lo general, las distribuciones de probabilidad representan distribuciones
teóricas y las distribuciones de frecuencia representan observaciones obtenidas de experimentos reales. De esta forma podemos asegurar
que una distribución de probabilidad (teórica) dice lo que se puede esperar al observar en una distribución de frecuencias que se ha
obtenido de un experimento, encuesta o estudio de muestras. En el estudio de la estadística existen diversas distribuciones teóricas, cada
una de ellas sirve como modelo de estudio de los experimentos que se realizan en las diversas actividades científicas y sociales de interés
a la humanidad.