Está en la página 1de 26

 ¿Será que la variable que estoy midiendo

de la población tiene distribución normal?

De estudios anteriores o comprobarlo a


través de los datos que hemos obtenido de
la población mediante una prueba de
significación Algunos test para verificar
normalidad son:
Test de Shapiro-Wilk
Test de Kolmogorov-Smirnov
Distribución Normal
 La variable aleatoria que toma todos los
valores reales entre -<x<, tiene una
distribución normal si su función de densidad
de probabilidad (f.d.p) es de la forma:


 1  x    
2

f ( x) 
1
exp        x  ,   0
2  2    

Notación: X~N(, 2).


 Está caracterizada por la media () y desviación
estándar ().
 Es simétrica respecto de la  , alcanza su máximo
en este punto, esto implica que la media, la moda
y la mediana son iguales. Tiene forma de
campana.
Si  es relativamente grande el gráfico de f
tiene a ser achatado, mientras que si  es
pequeño el gráfico de f tiene a ser aguzado,
es decir tiene poca variabilidad.

 Se puede probar que los parámetros que


caracterizan la distribución normal (,2)
corresponden a la E(X) y la Var[X].
Ejemplos
 Si Z es una variable aleatoria normal con
=0 y 2=1, entonces Z se llama variable
aleatoria Normal Estándar, que denotaremos
por Z~N(0,1), su función de densidad es:

1
1  z2
f ( z)  e 2
  z  
2
 Su función de distribución acumulada está
dada por:
zo 1
1  Z2
F( z o )  P(Z  z o )  
 2
e 2
dz
Función de densidad Función de distribución acumulada.
Uso de la Tabla de la Normal.
 La tabla entrega el área de la curva hasta el valor z0.

z0 z0 z2
1 
F ( z0 )  

f ( z )dz  
 2
e 2
dz
El área bajo la curva hasta el punto z=-1,96 es 0,025.
1,96

f ( z)dz  0,025

Dentro de la tabla se encuentra el área, fuera el punto z.


 La función de distribución se encuentra tabulada, por
ejemplo para obtener P(a  Z  b) , veamos el gráfico:

luego es inmediato que: P(a  Z  b)  F(b)  F(a) .


 z1  z2

 f ( z)dz  1  
z1 
f ( z )dz 2  f ( z )dz


 Ejercicios. Obtener el área bajo la curva o el valor de z cuando corresponda:


 Teorema. Si X es una variable aleatoria normalmente
distribuida con media  y varianza 2, entonces Z  X   es

una variable aleatoria con distribución normal estándar.

 La importancia de este teorema es que podemos calcular


probabilidades asociadas con cualquier variable aleatoria
X~N(, 2).
a b b a
P(a  X  b)  P Z   F   F 
         
 Ejemplo. Asumamos que la edad de los trabajadores
de una gran tienda tiene distribución normal con
media de 50 años y una desviación estándar de 5
años.
 a) ¿Cuál es el porcentaje de trabajadores cuyas
edades son mayores de 51 años?.
 b) ¿Cuál es la probabilidad de que un trabajador
cualquiera tenga a lo más 45 años?
 c) ¿Cuál es la probabilidad que el trabajador a lo
menos 41 años?
 d) ¿Cuál es el porcentaje de trabajadores cuyas
edades están entre 50 y 52.5 años?.
 e) El 20% de los trabajadores están bajo cierta
edad, ¿cuál es esta edad?
 f) El 10% de los trabajadores están sobre cierta
edad, ¿cuál es esta edad?
 Suponga que X~N(, 2), P(X<80)=0,975 y
P(X<70)=0,95. ¿Cuáles son los parámetros de
esta distribución?
Distribución t de Student
Uso de la Tabla de la t de Student.
 Aquí debemos observar los grados de libertad,
g.l., antes de observar el valor. La diferencia
con la tabla normal es que aquí aparece
afuera el área y los grados de libertad, a
dentro aparecen los valores del eje, en este
caso le llamaremos t.
 El área bajo la curva hasta el
punto t0= -2,02 con 5 g.l. es de
0,050.

 El punto que deja un área de


0,975 considerando 5 g.l. es 2,57.
Chi-cuadrado (r)
 E(X) = r Var(X) = 2r
Uso de la Tabla chi-cuadrado.

 Considere 6 g.l. y determine w1


tal que el área en color sea 0,75.
 Considere 6 g.l. y determine w2 tal que el
área en color sea 0,05.

 Considere 6 g.l. y determine w3 y w4 tal


que cada área en color sea 0,025.

 Considere 6 g.l. y determine w5 y w6 tal


área en color sea 0,90 y las áreas sin
color sean iguales.
F
Uso de la Tabla F.
 En esta tabla tenemos dos grados de libertad, n1 g.l.
asociados al numerador y n2 g.l. asociados al denominador.
Observar que aquí se presentan dos tablas, una para el área
de 0,95 y el otro para el área de 0,975. Es posible
determinar los valores para áreas 0,05 y 0,025 a partir de la
siguiente propiedad.
1 1
f m;n;0,05  f m;n;0,025 
f n;m;0,95 f n;m;0,975
 Veremos más adelante que esta tabla será usada para
realizar pruebas de homogeneidad de varianzas
(homocedasticidad o heterogeneidad).
F7;3;0,95= F7;3;0,05=
Área en color de 0,95, 9 g.l. Área en color de 0,025, 7 g.l.
numerador y 6 g.l. denominador. numerador y 5 g.l. denominador.

Área de las colas iguales, 4 g.l. Áreas en color de 0,05, 5 g.l.


numerador y 3 g.l. denominador, numerador y 8 g.l. denominador.
área en color 0,95.

También podría gustarte