Está en la página 1de 26

UNIVERSIDAD NACIONAL DE INGENIERIA

DISTRIBUCION NORMAL

gpomachagua@hotmail.com

Material de Clases © G.P.P 7-oct-17


IMPORTANCIA DE LA DISTRIBUCIÓN NORMAL
EN EL ANALISIS ESTADISTICO DE DATOS

La mayoría de las técnicas de análisis de datos que se utilizan con


frecuencia se basan en la suposición de normalidad de la variable
aleatoria. Por ejemplo los test de hipótesis :
 Prueba t para una media.
 Prueba t para comparación de dos grupos.
 Análisis de varianza.
 Análisis de regresión lineal.

En los casos en que la variable en estudio no tiene distribución


normal se trata de garantizar que el tamaño de muestra sea
“suficientemente grande” de modo que se pueda utilizar el
teorema central del límite que nos lleva a una “distribución
aproximadamente normal
Material de Clases © G.P.P 7-oct-17
DISTRIBUCIÓN NORMAL

La distribución normal es la distribución


probabilidades, más conocida y utilizada en la
estadística. Es simétrica de forma acampanada y
definida para valores de -∞ hasta +∞.
La distribución normal se define a través de sus
parámetros media y varianza.

X ~ N ( μ, σ² )

Se lee la variable X sigue una distribución normal


con media m y varianza s2
Material de Clases © G.P.P 7-oct-17
DISTRIBUCION NORMAL
1  xm 
2

1   
2 s 
f ( x)  e
2s

s2

-∞ m +∞
X~ N ( m, s2 )
Material de Clases © G.P.P 7-oct-17
Tests paramétricos: La
distribución normal

Normal:
Normal estandarizada:
 xm  2

 1   valores estandariz ados :


f ( x)   e 2s 2

 s 2  (x  m)
zi  i
s
z2
 1  
f ( z)   e 2

 2 

Material de Clases © G.P.P 7-oct-17


La probabilidad equivale al área encerrada bajo la curva.
P(μ - σ < X ≤ μ + σ) = 0.6826 = 68.26 %
P(μ - 2σ < X ≤ μ + 2σ) = 0.954 = 95.4 %
P(μ - 3σ < X ≤ μ + 3σ) = 0.997 = 99.7 %
Material de Clases © G.P.P 7-oct-17
DISTRIBUCION NORMAL ESTANDAR O TIPIFICADA
Es una distribución normal con μ = 0 y σ2 = 1

Z ~ N (0, 1 )

s2 = 1 xm
z
s
m=0
1
1  z2
f ( z)  e 2
-  z  
2
Material de Clases © G.P.P 7-oct-17
FUNCIÓN DE DISTRIBUCIÓN ACUMULADA

Material de Clases © G.P.P 7-oct-17


USO DE TABLAS
Z 0.00 0 ….0.05…. 0.08 0.09
0
0.1
0.2
0.3
.
1.9 0.9744

3.8
P(Z ≤ 1.95)
3.9
Material de Clases © G.P.P 7-oct-17
CASOS MÁS FRECUENTES

CASO I

Material de Clases © G.P.P 7-oct-17


CASOS MÁS FRECUENTES

CASO II

Material de Clases © G.P.P 7-oct-17


CASOS MÁS FRECUENTES

CASO III

Material de Clases © G.P.P 7-oct-17


CASOS MÁS FRECUENTES

CASO IV
P( Z  a )  1  P( Z  a )
 1  1  P( Z  a)
 P( Z  a )

Material de Clases © G.P.P 7-oct-17


CASOS MÁS FRECUENTES

CASO IV

Material de Clases © G.P.P 7-oct-17


Ejemplo 1: Sea X las notas del curso de Estadística y esta se distribuye en forma
normal X ~N(10,4). Si se selecciona un alumno al azar.
a)Cuál es la probabilidad de que tenga una nota entre 11 y 13.6

Solución: Sea X: Notas Hallar P(11  X  13.6)


 11  10 X  10 13 .6  10 
P   
 2 2 2 
P (0.5  Z  1.8)  P ( Z  1.8)  P ( Z  0.5)
P (0.5  Z  1.8)  0.9641  0.6915  0.2726
b) Cuál es la probabilidad de que tenga una nota mayor de 18
c) Cuál es la probabilidad de que tenga una nota menor que 18

Material de Clases © G.P.P 7-oct-17


Ejemplo3: Los sueldos de 10,000 empleados del Sector Salud tiene una distribución
normal con promedio de S/ 3000 soles y una desviación estándar de S/. 500 soles.
a) ¿Cuál es la probabilidad de hallar empleados con sueldo menor a S/. 2,500 soles y
cuantos son? Rpta 0.1587 hay 1,587 empleados
b) El gobierno dará una bonificación al 35% de los empleados que menos ganan.
¿Cuánto deberá ganar para obtener la bonificación y cuantos son? Rpta
S/2807.34 y son 3,500 empleados
c) ¿Entre que intervalos esta el 50% de los sueldos centrales? Rpta: 2663 y 3337
d) ¿Cuántos empleados ganan menos de S/. 1,850 soles o mas de S/. 2500 soles?
e) ¿Cuál es el sueldo mínimo que permite seleccionar a los 1000 empleados con
mejores sueldos?
f) Suponga que el sueldo se clasificada en tres categorías, de acuerdo a los
siguientes criterios, cuantos trabajadores hay en cada categoría
 Bajo (montos menores de 2000 soles)
 Medio (montos entre 2000 y menos de 2600 soles)
 Alto (montos de 2600 soles a más)
g) Si se eligen 10 empleados en forma independiente, ¿Cuál es la probabilidad de
que mas de 2 tengan un sueldo menor que S/. 2,500 soles ? Rpta 0.2029
Material de Clases © G.P.P 7-oct-17
Ejemplo4: La longitud de los clavos fabricados por una máquina, en milímetros,
es una variable aleatoria X que sigue una distribución normal. Se sabe que el 80%
de los clavos fabricados miden menos de 11mm, y que el 90% de los clavos
fabricados miden menos de 12mm. ¿Cuál es la media y la varianza de los clavos
producidospor la máquina?
Solución:
Sabemos que P(X <11) = 0,8 y P (X < 12) = 0,9. Estandarizamos y nos queda que

 11  m   12  m 
P Z    0.80 P Z    0.90
 s   s 
De la tabla obtenemos que F(0,8416) = 0,8 y F(1,2816) = 0,9. Planteamos:

11  m
 s  0.84
 µ= 9.09
 σ= 2,27
12  m
  1.28
 s
Material de Clases © G.P.P 7-oct-17
Ejemplo 4: Las horas productivas por mes de un departamento de administración
se distribuyen mediante una Normal. Se sabe que en el 2.56% de los meses las
horas productivas son menos de 1305 y que el 15.87% de los meses las horas
productivas son más de 1600.
a) ¿Cuál es el número de horas productivas por término medio?
b) ¿Cuál es la probabilidad de que en un mes se trabajen entre 1450 y 1550
horas?
c) Si se seleccionan 5 meses al azar, ¿cuál es la probabilidad de que en 3 de
ellos se hayan trabajado entre 1450 y 1550 horas?

Ejemplo 5: Los gastos de viajes semanales que el personal de ventas de una


empresa, justifica cada semana, tienen una media de 950.25 soles y una
desviación estándar de 30.35 soles
a) Determine cuántos de los 50 vendedores que tiene la empresa reportaran
gastos superiores a 1000 soles
b) El gerente ha ofrecido vacaciones de dos semanas a quien justifique
gastos que se encuentren en el 15% inferior. Si Ud. ha gastado $ 712, conseguirá
las vacaciones?. Justifique su respuesta

Material de Clases © G.P.P 7-oct-17


PROPIEDAD REPRODUCTIVA DE LA DISTRIBUCION NORMAL

Sean X1, X2, ……….Xn ,n variables aleatorias independientes


con distribución normal N(µi , σ2i ) i = 1,…….n
Si W = α1X1+…………….+ αnXn , luego W~N(Σ αiµi , Σ α2i σ2i )

Ejemplo 1: Sea 𝑋1 ~𝑁 2,9 y 𝑋2 ~𝑁 7,5 . Calcular la media y la


varianza de las las distribuciones

a) W= 𝑋1 + 𝑋2
b) 𝑊 = 𝑋1 − 𝑋2
c) 𝑊 = 2𝑋1 + 3𝑋2
d) 𝑊 = 4𝑋1 − 6𝑋2

Material de Clases © G.P.P 7-oct-17


Ejemplo1: El precio de venta que se fija para cierto tipo de bien tiene distribución
normal con una media $50 y una desviación estándar de $5. Los compradores
desean pagar una cantidad que también tiene distribución normal con media de
$45 y una desviación estándar de $2.50. ¿Cuál es la probabilidad de que tenga
lugar una transacción?.
Solución
X es el precio de venta X ~ N(m1= 50; s12 = 52)
Y es el precio de compra Y ~ N(m2= 45; s22 =2,52).
La transacción se da, siempre y cuando: X  Y, lo que significa
calcular P(X  Y) = P(X - Y 0)
Es decir, se tiene que obtener la distribución:
W = X - Y ~ N( 5; 5,592)
De modo que: 𝑃 𝑊 ≤ 0 = 0.185541
Ejemplo2 : Carl Lewis puede correr los 100 metros llanos en un tiempo distribuido
normalmente N(7;9) en segundos. Su rival Ben Johnson puede hacer esa misma
distancia en un tiempo distribuido normalmente según N(9;4) en segundos.
a) ¿Cuál es la probabilidad de que Carl Lewis le gane a Ben Johnson? Rpta: 0.7088
b) ¿Cuál es la probabilidad de que le gane Carl Lewis aunque le de 1 segundo de
ventaja? Rpta: 0.6103
Material de Clases © G.P.P 7-oct-17
Ejemplo3:La presencia de un cierto circuito en una placa integrada esta viene
determinada por una variable X. Este placa integrada se compone por la unión de
otros tres componentes que también contienen circuitos y que se distribuyen
independientemente la velocidad en GHz de la siguiente manera: X1~ N(80, 12),
X2~ N(120, 15) y X3~ N(96, 9). La construcción de la placa integrada es la unión de
los tres circuitos es la siguiente:

¿Calcular la probabilidad de que la construcción de la placa integrada este entre


70 GHz y 90 GHz ? Rpta : 0.1705
Ejemplo 1: Una consultora de Opinión Publica tiene tres tipos de ingresos
mensuales independientes A, B y C que siguen distribuciones normales N(14, 2),
N(12, 4) y N(3, 5), respectivamente, medidos en millones de soles. Se pide
a) Calcular la probabilidad de que los ingresos mensuales sean mayores de 30
millones. Rpta: 0.3816
b) Calcular la probabilidad de no cubrir los gastos si estos se estiman en 20
millones mensuales Rpta: 0.003356
c) Si consideramos 12 meses. ¿Cuál es la probabilidad de que al menos un mes
no se cubran los gastos? Rpta:0.03954
Material de Clases © G.P.P 7-oct-17
SIMULACION DE DATOS DE UNA DISTRIBUCIÓN NORMAL

Ejemplo: Supongamos que deseamos simular 30 notas de una población normal


que tiene media 14 y desviación estándar 2.
Muchas veces se hace difícil conseguir datos reales para corroborar un método
estadístico, una manera de resolver dicho problema es hacer que la
computadora produzca mediante simulación dichos datos.
MINITAB SPSS

 Calc/Datos aleatorios/Normal  Transformar / Calcular variable


 En variable destino: Notas
 En Expresión Numérica:
RV.NORMAL(14,2)

Material de Clases © G.P.P 7-oct-17


TEST PARA VERIFICAR LA NORMALIDAD

H0: Los datos siguen una distribución normal.


H1: Los datos NO siguen una distribución normal
Del archivo notas creadas anteriormente probar que siguen un distribución normal

Gráfica de probabilidad de notas


Normal
99
Media 14.48
Desv.Est. 3.756
95 N 30
KS 0.102
90
Valor P >0.150
80
70
Porcentaje

60
50
40
30
20

10

1
5 10 15 20 25
notas

Como p> 𝛼 entonces rechazamos H0 luego los datos provienen de una


distribución normal
Material de Clases © G.P.P 7-oct-17
EJERCICIOS Y PROBLEMAS
1) La media del diámetro interior de una muestra de 200 lavadoras producidas por
una máquina es 1,275 cm. y la desviación típica de 0,0125 cm. El propósito para
el cual se han diseñado las lavadoras permite una tolerancia máxima en el
diámetro de 1,26cm. a 1,29 cm., de otra forma las lavadoras se consideran
defectuosas. Determinar el porcentaje de lavadoras defectuosas producidas por
la máquina, suponiendo que los diámetros están distribuidos normalmente.

2) Se tiene un programador de entrenamiento diseñado para mejorar la calidad de


las habilidades de los supervisores de la línea de producción. Debido a que el
programa es auto administrativo, los supervisores requieren un número
diferente de horas para terminarlo. Un estudio de los participantes anteriores
indica que el tiempo medio que se lleva completar el programa es de 500 h. y
que esta variable aleatoria normalmente distribuida tiene una desviación
estándar de 100 h.
a) ¿Cuál es la probabilidad de que un participante elegido al azar requiera más
de 500 h. para completar el programa?.
b) ¿Cuál es la probabilidad de que un candidato elegido al azar se tome entre 500
h. y 650 h. para completar el programa de entrenamiento?.
Material de Clases © G.P.P 7-oct-17
3) Suponga que el ingreso familiar mensual, X, en una comunidad tiene una
distribución normal con media $ 400 y una desviación estándar de $ 50.
a) Si el 10% de las familias con mayores ingresos debe pagar un impuesto, a partir
de qué ingreso familiar se debe pagar dicho impuesto? Rpta: 464
b) Si el ahorro familiar está dada por la relación Y = (1/4) X – 50. ¿Cuál es la
probabilidad de que el ahorro sea superior a $75? Rpta 0.0228
4) El tiempo de duración de los chips producidos por un fabricante de
semiconductores es una variable aleatoria cuya distribución es
aproximadamente normal con µ = 5106 horas y s = 250 horas.
a) En términos del enunciado, ¿cómo interpreta el valor del cuartil 1?
b) Un ensamblador de computadoras está dispuesto a comprar una gran
cantidad de chips siempre que el 90% del lote tenga un tiempo de vida
superior a 4800 horas. ¿Qué decisión debería tomar en vista de la
información disponible?.

Material de Clases © G.P.P 7-oct-17


5) Las horas productivas por mes de un departamento de administración se
distribuyen mediante una Normal. Se sabe que en el 2.56% de los meses las horas
productivas son menos de 1305 y que el 15.87% de los meses las horas
productivas son más de 1600.
a) ¿Cuál es el número de horas productivas por término medio?
b) ¿Cuál es la probabilidad de que en un mes se trabajen entre 1450 y 1550
horas?
c) Si se seleccionan 5 meses al azar, ¿cuál es la probabilidad de que en 3 de ellos
se hayan trabajado entre 1450 y 1550 horas?
6) Una empresa puede comprar materia prima a dos proveedores y le preocupa la
cantidad de impurezas que posee. El examen de los datos de cada proveedor
indica que los niveles porcentuales de impurezas de los envios de la materia
prima recibidos siguen distribuciones normales que tienen las medias y las
desviación estandar en las tabla. La empresa tiene especial interes en que
interes en que el nivel de impurezas no supere el 5% y quiere comprar al
proveedor que tenga mas probabilidades de cumplir esa condicion. ¿Què
proveedor debe elegir
Proveedor Media Desviación estandar
A 4.4 0.4
B 4.2 0.6
Material de Clases © G.P.P 7-oct-17

También podría gustarte