Documentos de Académico
Documentos de Profesional
Documentos de Cultura
La desviación estándar de la muestra S, se usa con mucha frecuencia con una estimación de ,
la desviación estándar de la población de donde se eligió la muestra en forma aleatoria.
S: su desviación estándar.
Estimamos en base a S:
(n - 1)S2
2 =
1
ESTADÍSTICA INFERENCIAL
INFERENCIAS SOBRE DESVIACIONES ESTÁNDAR - ANOVA
Mg. Maria V. Hermenegildo Chávez
que tiene como distribución muestral la distribución continua ji-cuadrada, con media = n - 1,
esta cantidad es el número de grados de libertad.
X X 2
2
X2 12 es tal que el área situada a su derecha bajo la curva es /2, mientras que X1212 es tal que
1-
/2
X21- /2
2
X /2X
2
2
ESTADÍSTICA INFERENCIAL
INFERENCIAS SOBRE DESVIACIONES ESTÁNDAR - ANOVA
Mg. Maria V. Hermenegildo Chávez
Podemos afirmar que una variable aleatoria que tiene la distribución ji-cuadrada toma un valor
X1212 y X2 12 , con probabilidad 1- afirmamos que:
(n 1)S 2
X1212 < < X2 12
2
despejando 2:
(n 1)S 2 (n 1)S 2
< 2
<
X 2 / 2 X 12 / 2
del (1 - ) 100% de 2 .
EJEMPLO 7
Los resultados de un estudio realizado en una universidad mostraron que una muestra tomada al
azar de 25 alumnos utiliza las instalaciones del centro de estudiantes en promedio 6.8 veces por
semana, con desviación estándar de 2.4. Construya un intervalo de confianza del 99% para ,
que es la desviación estándar real del número de veces que los alumnos de la universidad
utilizan las instalaciones del centro de estudiantes a la semana.
Solución
n = 25 alumnos
X = 6.8 veces por semana
S = 2.4
n < 30
= 0.01
3
ESTADÍSTICA INFERENCIAL
INFERENCIAS SOBRE DESVIACIONES ESTÁNDAR - ANOVA
Mg. Maria V. Hermenegildo Chávez
reemplazando en:
(n 1) S 2 (n 1) S 2
< 2 <
X 2 / 2 X 12 / 2
Con el 99% de confianza afirmamos que el intervalo de 1.742 a 3.7394 contiene a , que es la
desviación estándar real del número de veces que los alumnos de la universidad utilizan las
instalaciones del centro de estudiantes a la semana.
La distribución muestral de S se puede aproximar con una distribución normal, cuya media es
, y desviación estándar .
2n
Así, podemos afirmar con probabilidad 1 - que:
S
Z / 2 Z / 2
2n
Despejando , tenemos:
4
ESTADÍSTICA INFERENCIAL
INFERENCIAS SOBRE DESVIACIONES ESTÁNDAR - ANOVA
Mg. Maria V. Hermenegildo Chávez
S S
< <
Z / 2 Z / 2
1 1
2n 2n
del (1 - ) 100% de .
1-
/2 /2
Escala Z
-Z/2 0 Z/2
EJEMPLO 8
El gerente de una tienda de abarrotes observó, sobre la base de una muestra aleatoria de tamaño
n = 60 tomada cuando la tienda estaba repleta de gente, que los clientes tardaban en promedio
de X = 13.5 minutos en pasar por la caja para pagar y que se les empacaran 10 artículos o
menos; la desviación estándar de la muestra es S = 3.4 minutos. ¿Qué se puede afirmar, con el
98% de confianza, acerca del error máximo de la estimación X = 13.5 minutos del tiempo
promedio real que tarda un cliente en que le cobren 10 o menos artículos y que se le empaquen
sus productos cuando la tienda esta repleta de gente?
Solución:
n = 60
X =13.5 minutos
S = 3.4 minutos
= 0.02
Z /2 = Z 0.01 = 2.05
-Z /2 = - Z 0.01 = -2.05
5
ESTADÍSTICA INFERENCIAL
INFERENCIAS SOBRE DESVIACIONES ESTÁNDAR - ANOVA
Mg. Maria V. Hermenegildo Chávez
Reemplazando valores en:
S S
< <
Z / 2 Z / 2
1 1
2n 2n
3.4 3 .4
< <
2.05 2.05
1 1
2 60 2 (60)
0.98
0.01 0.01
-Z0.01 = -2.05 0 Z0.01 = 2.05
Con una confianza del 98% podemos afirmar que se encuentra en el intervalo de 2.0995 a
8.933; donde es el error máximo del tiempo promedio real que tarda un cliente en que le
cobren 10 o menos artículos y que se le empaquen sus productos cuando la tienda está repleta de
gente.
PRUEBAS DE HIPÓTESIS DE Y 2
Probaremos:
6
ESTADÍSTICA INFERENCIAL
INFERENCIAS SOBRE DESVIACIONES ESTÁNDAR - ANOVA
Mg. Maria V. Hermenegildo Chávez
(n 1) S 2
2 =
02
Donde: n : es el tamaño de la muestra
S2 : es su varianza
H1: < 0
Región de
rechazo de
H0 1-
H1: > 0
0 X 12 X2
Región de
rechazo de
H0
1-
7
0 X 12 X2
ESTADÍSTICA INFERENCIAL
INFERENCIAS SOBRE DESVIACIONES ESTÁNDAR - ANOVA
Mg. Maria V. Hermenegildo Chávez
H1: 0
Región de
rechazo de
H0
1-
/2 /2
0 X 12 X 2 / 2 X2
EJEMPLO 9
Quince personas que estudian una unidad de aprendizaje programado de un curso de
capacitación requirieron 58.23 minutos para finalizar la unidad, con una desviación estándar de
8.5 minutos. Utilice un nivel de significación de 0.05 para probar la afirmación de que = 7
minutos de la población que se muestra.
Solución
n = 15
X = 58.23 minutos
S = 8.5 minutos
= 0.05
H0: = 7
H1: 7
2
X1212 = X 0.975 = 5.629
8
ESTADÍSTICA INFERENCIAL
INFERENCIAS SOBRE DESVIACIONES ESTÁNDAR - ANOVA
Mg. Maria V. Hermenegildo Chávez
(n 1) S 2
2
=
02
(15 1) (8.5) 2
2 =
72
2 = 20.643
Región de rechazo de
H0
0.95
0.025 0.025
0 X 02.975 X 02.025 X2
5.629 26.119
Como 2 = 20.643 está entre 5.629 y 26.119 si la hipótesis nula H0, esto significa que el valor
de la desviación estándar de la población es en verdad = 7 minutos, con nivel de significación
de = 0.05 para n-1 = 14 grados de libertad de la distribución 2 .
S - 0
Z =
0
2n
9
ESTADÍSTICA INFERENCIAL
INFERENCIAS SOBRE DESVIACIONES ESTÁNDAR - ANOVA
Mg. Maria V. Hermenegildo Chávez
Cuya distribución de este estadístico es la distribución normal estándar.
EJEMPLO 10
Un fabricante de almohadas especifica que la desviación estándar del peso del relleno de las
almohadas no debe ser mayor que 0.5 onza. Utilice el nivel de significación de = 0.01 para
probar la hipótesis nula = 0.5 gramos contra la hipótesis alternativa > 0.5 con base en una
muestra tomada al azar de tamaño n = 40 para la cual S = 0.68.
Solución:
n = 40
S = 0.68 gramos
0 = 0.5 gramos
= 0.01
H0: = 0.5
H1: > 0.5
Es una prueba de significación de una cola
z = z 0.01 = 2.33
Calculando el valor del estadístico:
S - 0
z =
0
2n
0.68 - 0.5
z =
0.5
2(40)
z = 3.2199
0.01
0 Z0.01 = 2.33
10
ESTADÍSTICA INFERENCIAL
INFERENCIAS SOBRE DESVIACIONES ESTÁNDAR - ANOVA
Mg. Maria V. Hermenegildo Chávez
Z = 3.2199 > 2.33 = Z 0.01 por tanto se rechaza H0, lo que significa que la diferencia entre y
0 = 7 es grande que no puede atribuirse a la casualidad, con una confianza del 99% se realiza
esta afirmación.
El objetivo es determinar si la varianza de una población normal tiene más variación que otra.
Esta prueba se relaciona con la prueba de hipótesis de la diferencia entre dos medias, para
muestra pequeña, que requiere que: 1 = 2.
Suponiendo que las muestras tienen más o menos la forma de distribuciones normales,
demostrar que:
H0: 1 = 2,
H1: 1 > 2
con un nivel de significación
11
ESTADÍSTICA INFERENCIAL
INFERENCIAS SOBRE DESVIACIONES ESTÁNDAR - ANOVA
Mg. Maria V. Hermenegildo Chávez
Las tablas sólo dan información para trabajar con el extremo de la derecha de la distribución.
Región de rechazo
de H0
2
F2 F
El valor de F no puede ser negativo.
La distribución tiene sesgo positiva.
EJEMPLO 11
Dos técnicas diferentes de iluminación de los aparadores de una tienda se comparan midiendo la
intensidad de la luz en sitios seleccionados de áreas iluminadas por medio de los dos métodos.
Si una muestra aleatoria de 12 mediciones de la intensidad de luz que proporciona la primera
técnica tiene una desviación estándar de 2.6 bujías-pie y una muestra aleatoria de 16 mediciones
de la intensidad de la luz que proporciona la segunda técnica tiene una desviación estándar de
4.4 bujías-pie, pruebe la hipótesis nula 1 = 2 contra la hipótesis alternativa 1 2 en el
nivel de significación de 0.10.
Solución:
n1 = 12
S1 = 2.6 bujías-pie
n2 = 16
S2 = 4.4 bujías-pie
H0: 1 = 2,
H1: 1 2
= 0.10
12
ESTADÍSTICA INFERENCIAL
INFERENCIAS SOBRE DESVIACIONES ESTÁNDAR - ANOVA
Mg. Maria V. Hermenegildo Chávez
calculando el valor de F:
S12 ( 2.6 ) 2
F = = = 0.3492, ó
S22 ( 4.4 ) 2
S22 ( 4.4 ) 2
F = = = 2.8639
S12 ( 2.6 ) 2
Elegimos:
F = 2.8639, con
n2 - 1 = 16 – 1 = 15 grados de libertad del numerador, y
n1 - 1 = 12 – 1 = 11 grados de libertad del denominador.
0.05
F
F
F = 2.8639 > 2.72; por lo tanto se rechaza la hipótesis nula, la diferencia entre 1 y 2 es
grande que no puede atribuirse a la casualidad, con una confianza del 90%.
13
ESTADÍSTICA INFERENCIAL
INFERENCIAS SOBRE DESVIACIONES ESTÁNDAR - ANOVA
Mg. Maria V. Hermenegildo Chávez
ANÁLISIS DE VARIANZA
(ANOVA)
En este análisis se emplea información muestral para determinar si tres o más tratamientos
producen o no resultados diferentes.
O podemos considerar:
1 = + α1
2 = + α2
.
.
.
k = + αk
1 + 2 +... + k
Con = , media general
k
Donde: α1 + α2 +... + αk = 0
14
ESTADÍSTICA INFERENCIAL
INFERENCIAS SOBRE DESVIACIONES ESTÁNDAR - ANOVA
Mg. Maria V. Hermenegildo Chávez
H1: no todas las α son iguales a cero.
1. Que las poblaciones de las cuales se toman las muestras tienen aproximadamente
distribuciones normales (si las muestras son grandes no es necesaria la suposición).
2. Todas las poblaciones tienen la misma varianza 2.
3. Las muestras que se seleccionan de cada una de las poblaciones son aleatorias e
independientes.
Bajo el supuesto de que las k muestras pueden considerarse como muestras tomadas de una
misma población normal.
Sea Sx la desviación estándar de las medias, la cual es una estimación de x (error estándar de
la media de la población)
x = , así: Sx =
n n
no conocida
Sean S12 , S22 , ..., Sk2 las varianzas de k muestras; cada una de ellas es una estimación de 2 ,
así también lo es:
15
ESTADÍSTICA INFERENCIAL
INFERENCIAS SOBRE DESVIACIONES ESTÁNDAR - ANOVA
Mg. Maria V. Hermenegildo Chávez
n. Sx 2
F= RAZON DE VARIANZAS
S12 + S22 +... +Sk2
k
Que tiene como distribución de muestreo a la distribución F, con k-1 grados de libertad para el
numerador y, k(n -1) grados de libertad para el denominador.
Región de
rechazo de
H0
1-
F
Ejemplo 1:
Para determinar el número de periódicos matutinos que se entregan a hogares suburbanos
durante un período de 60 minutos, se observó a 5 vendedores de periódicos que atienden
diversas rutas en un período de 4 días. Los números de periódicos entregados son:
Juan: 25 20 29 26
Jimena: 27 21 30 26
Antonio: 26 26 24 20
María: 22 24 26 20
Guillermo: 21 20 20 23
Realice un análisis de varianza para probar con un nivel de significación de 0.01 la hipótesis
nula de que los 5 repartidores entregan el mismo número promedio de diarios durante períodos
de 60 minutos.
16
ESTADÍSTICA INFERENCIAL
INFERENCIAS SOBRE DESVIACIONES ESTÁNDAR - ANOVA
Mg. Maria V. Hermenegildo Chávez
Solución
k = 4 (nro. de tratamientos)
n=5
Datos de tratamientos:
1. x 1 = 24.2, S1 = 2.588 → S12 = 6.6977
2. x 2 = 22.2, S2 = 2.683 → S22 = 7.1985
3. x 3 = 25.8, S3 = 4.025 → S32 = 16.2006
2. x 4 = 23, S4 = 3 → S42 = 9
k
xi 95.2
i 1
x ..= = =
4
= 23.8
k
2 (X k X..)2
Sx =
k 1
7.36
= = 2.4533
3
luego:
n. Sx 2
= 5 (2.4533) = 12.2665.
12.2665
F= = 1.255
9.7742
17
ESTADÍSTICA INFERENCIAL
INFERENCIAS SOBRE DESVIACIONES ESTÁNDAR - ANOVA
Mg. Maria V. Hermenegildo Chávez
Área de
rechazo de H0
0.99
0.01
F0.01 = 5.29
F = 1.255 < 5.29 = F0.01 , por lo tanto se acepta H0, esto significa que los 5 repartidores
entregan el mismo número promedio de diarios durante períodos de 60 minutos, con una
confianza del 99%.
Para realizar un análisis de varianza, consideremos ahora un método más riguroso que el
anterior, ANOVA en un sentido.
k n
SST = (x x . .)2
ij
i 1j1
Donde:
xij : es la j-ésima observación de la i-ésima muestra.
x .. : es la gran media (media de las kn observaciones)
SST
Luego: es la varianza de los datos.
k.n - 1
18
ESTADÍSTICA INFERENCIAL
INFERENCIAS SOBRE DESVIACIONES ESTÁNDAR - ANOVA
Mg. Maria V. Hermenegildo Chávez
k k n
SST = n. ( x i x ..) 2 ( x ij x i .) 2
i1 i 1 j1
SS( Tr ) SSE
Donde:
SS(tr) se denomina la Suma De Cuadrados De Tratamientos, y mide la variación entre las
medias de las muestras, y.
SSE se denomina SUMA DE ERROR DE CUADRADOS, y mide la variación en cada
una de las muestras.
La palabra “error” se relaciona con el error experimental que también se conoce como
casualidad
En el ejemplo anterior:
x .. = 23.8 (media de k × n = 4 × 5 = 20 observaciones)
k
SS(Tr) = n. ( x i x ..)
i 1
= 5 [(24.2 – 23.8)2 + (22.2 – 23.8)2 + (25.8 – 23.8)2 + (23 – 23.8)2 ]
= 5 × 7.369 = 36.8
= 193.20
Si no se conoce SST:
19
ESTADÍSTICA INFERENCIAL
INFERENCIAS SOBRE DESVIACIONES ESTÁNDAR - ANOVA
Mg. Maria V. Hermenegildo Chávez
k n
SSE = ( x ij x i .) 2
i 1 j1
= 156.4
Para probar:
H0: 1 = 2 = ... = k , contra la hipótesis alternativas de que las medias de los tratamientos no
son iguales, comparamos SS(Tr) con SSE, basados en el estadístico F.
SS(Tr) MS(Tr)
Tratamientos k-1 SS(Tr) MS(Tr) =
k-1 MSE
SSE
Error k (n- 1) SSE MSE =
k(n - 1)
20
ESTADÍSTICA INFERENCIAL
INFERENCIAS SOBRE DESVIACIONES ESTÁNDAR - ANOVA
Mg. Maria V. Hermenegildo Chávez
Región de rechazo
de H0
0.99
0.01
F0.01= 5.29
k n 1
SST = x 2 T 2 ..
i j
i 1 j1 kn
1 k 2 1 2
SS(Tr) = . Ti. .T ..
n i 1 kn
MUESTRAS DESIGUALES
21
ESTADÍSTICA INFERENCIAL
INFERENCIAS SOBRE DESVIACIONES ESTÁNDAR - ANOVA
Mg. Maria V. Hermenegildo Chávez
k ni 1
SST = x 2 T 2 ..
ij
i 1 j1 N
k Ti2. 1 2
SS(Tr) = .T . .
i 1 ni N
Donde:
ni : es el tamaño de las muestras
N = n1 + ...+ nk
N – 1: son los grados de libertad para SST
k – 1: son los de grados de libertad para SS(Tr)
N – k, para el error.
Región de aceptación
de H0
Región de rechazo
de H0
1-
F
Ejemplo 2:
Los siguientes son los números de hornos de microondas que vende cada uno de los vendedores
de las tres sucursales de una compañía distribuidora de artículos domésticos:
Sucursal alfa: 21 11 17 28
Sucursal beta: 27 15 18 26 17 21
Sucursal gamma: 24 17 31 12 15
Realice un análisis de varianza para probar con un nivel de significación de 0.05 si las
diferencias observadas entre las ventas promedio en las tres sucursales se pueden atribuir a la
casualidad.
Solución:
22
ESTADÍSTICA INFERENCIAL
INFERENCIAS SOBRE DESVIACIONES ESTÁNDAR - ANOVA
Mg. Maria V. Hermenegildo Chávez
Datos para la primera muestra:
n1 = 4, x 1 = 19.25, S 1 = 7.136
n2 = 6, x 2 = 20.667, S 2 = 4.926
n3 = 5, x 3 = 19.8, S3 = 7.662
α = 0.05
k
xi 59.717
i 1
x = =
3
= 19.9057
3
2
n. S x =
3 (x 1 x) 2 (x 2 x) (x 3 x)
3 1
2 3
n. S x = [(19.25 – 19.9057)2 + (20.667 – 19.9057)2 + (19.8 – 19.9057)2 ]
2
3
= (1.0207) =1.5311
2
Región de aceptación
de H0
Región de
rechazo de H0
0.05
F0.05 = 4.07
23
ESTADÍSTICA INFERENCIAL
INFERENCIAS SOBRE DESVIACIONES ESTÁNDAR - ANOVA
Mg. Maria V. Hermenegildo Chávez
Como F = 0.0343 < 4.07 = F0.05, se acepta la hipótesis nula, con un nivel de significación α =
0.05, de tal modo que las diferencias entre medias no es significativa y puede atribuirse a la
casualidad.
24