Está en la página 1de 12

Estadistica Industrial 21/04/2014

1
21/04/2014 ESTADISTICA INDUSTRIAL 1
FSTA0lSTlCA
lt0uSTRlAl
AtAllSlS 0F vARlAtZA
H6.. R0SHFRY HAYTA H
2014
21/04/2014 ESTADISTICA INDUSTRIAL 2
0JFTlv0S 0Fl CAPlTul0
- Enumerar las caractersticas de la distribucin F.
- Realizar una prueba de hiptesis para determinar si 2
varianzas mustrales provienen de poblaciones
iguales.
- Cuando se desea comparar simultneamente 2 o
mas medias poblacionales.
- Establecer y organizar datos en una tabla ANOVA en
1 y 2 direcciones.
- Efectuar una prueba de Hiptesis entre 3 o mas
medias de Tratamiento.
21/04/2014 ESTADISTICA INDUSTRIAL 3
0lSTRluCl0t F
Esta distribucin de probabilidad se utiliza como
estadstico de prueba :
Para demostrar si dos variancias
mustrales proviene de la misma poblacin
o de poblaciones iguales .
Cuando se desean comparar
simultneamente varias medias
poblacionales. La comparacin simultnea de
varias medias poblacionales se denomina
Anlisis de Varianza (ANOVA de analisys of
variance).
21/04/2014 ESTADISTICA INDUSTRIAL 4
Caractersticas de la distribucin F
1.- Existe una familia de distribucin F. Un miembro
especifico de la familia queda determinado por dos
parmetros: los grados de libertad en el numerador y los
grados de libertad en el denominador.
Se puede observar que la forma de las curvas cambia
conforme se modifican los grados de libertad.
21/04/2014 ESTADISTICA INDUSTRIAL 5
Grado de libertad.- Por grados de libertad entendemos
el nmero efectivo de observaciones que contribuyen a
la suma de cuadrados en un ANOVA, es decir, el
nmero total de observaciones menos el nmero de
datos que sean combinacin lineal de otros.
2.- La distribucin F es continua.- Esto significa que
puede tomar una cantidad infinita de valores entre 0 y
mas infinito.
3.- La distribucin F no puede ser negativa.-El menor
valor que puede asumir F es cero.
4.- La distribucin F tiene un sesgo positivo.- -La
cola larga de la distribucin se encuentra a la derecha.
Conforme el nmero de grados de libertad aumenta,
tanto en el numerador como en el denominador, la
distribucin se aproxima a una distribucin normal.
21/04/2014 ESTADISTICA INDUSTRIAL 6
5.- La distribucin F es asinttica.- Conforme los
valores de X aumentan, la curva de la distribucin F se
aproxima al eje X, pero nunca la toca. Esto es parecido
al comportamiento de la distribucin normal.
Estadistica Industrial 21/04/2014
2
21/04/2014 ESTADISTICA INDUSTRIAL 7
COMPARACION DE DOS VARIANZAS POBLACIONALES
21/04/2014 ESTADISTICA INDUSTRIAL 8
21/04/2014 ESTADISTICA INDUSTRIAL 9
Los valores crticos de F estn dado por:
Prueba de dos colas
F (/2,n1-1,n2-1) : (tabla) .El otro valor esta
dado por la inversa:
1/ (F (/2,n2-1,n1-1) =
Prueba de una cola:
F ( ,n1-1,n2-1) :( tabla)
n1-1: Grados de libertad en el numerador
n2-1: Grados de libertad del denominador
21/04/2014 ESTADISTICA INDUSTRIAL 10
PROBLEMA
Un corredor de valores de la bolsa de lima
estudia los porcentajes de rendimiento de
las empresas del sector minero y el sector
financiero. Se sabe que tasas de
rendimiento independientes tienen
distribucin normal. Dos muestras
aleatorias de las tasas de 8 empresas del
sector minero (M) y de 6 empresas del
sector financiero han dado los siguientes
valores de rendimientos de porcentajes.
21/04/2014 ESTADISTICA INDUSTRIAL 11
Sector M:17,23,25,18,24,20,21,16
Sector F: 13,16,14,12,15,14.
Con un nivel de significancia del 0.05. Se
puede concluir que hay mas variacin en
los valores del sector minero?.
Se X
1
Y X
2
las variables que representa los
valores de rendimiento de los sectores
M y F respectivamente
21/04/2014 ESTADISTICA INDUSTRIAL 12
Procedimiento
Estas variables tienen distribuciones
normales con varianzas desconocida
respectivas
1.-
Estadistica Industrial 21/04/2014
3
21/04/2014 ESTADISTICA INDUSTRIAL 13
2.- Nivel de significancia:0.05
3.-
21/04/2014 ESTADISTICA INDUSTRIAL 14
4.- Con n1-1 y n2-1 grados de libertad
.n1=8
.n2=6, Fc
(0.05, 7,5)
= 4.88
5.-
Fk= 11.1429/2= 5.5714
S= (x - ) 2/ (n-1)
Como el Fk pertenece a la regin critica se
rechaza la hiptesis nula y se acepta la
hiptesis alternativa,
21/04/2014 ESTADISTICA INDUSTRIAL 15
Esto quiere decir que la varianza de la
muestra 1(sector minero) son mayores
que las varianzas de la muestra 2 (sector
financiero).
21/04/2014 ESTADISTICA INDUSTRIAL 16
PROBLEMA
Una muestra de 16 observaciones
tomada de la poblacin 1 con una
varianza de 3.75, y una muestra de 10
observaciones tomada de la poblacin
2 con una varianza de 5.38.
Realizar una prueba de hiptesis para
probar si las varianzas son diferentes.
21/04/2014 ESTADISTICA INDUSTRIAL 17
1 Hiptesis: Ho:
1
2
=
2
2
Ha:
1
2

2
2
2 Nivel de significacin: = 0.10
3 Se utiliza la distribucin de prueba
Grados de libertad: numerador: 16-1=15 y
denominador: 10-1=9 y /2 por ser de dos colas
F(0.025,9,15)= 3.12 y F(0.025,15,9) = 3.77
F2 = 1/F(0.05,15,9) =01/3.77= 0.265
Analizando varianzas: s
2
2
=3.75 y
s
1
2=
5.38
Luego: Fk= 5.38/3.75 = 1.43
21/04/2014 ESTADISTICA INDUSTRIAL 18
4 Regin Crtica: Tenemos la regin
critica con [F<0.27 o F> 3.12]
5 Decisin: Se observa que Fk = 1.43
pertenece a la regin de aceptacin por lo
tanto se acepta la hiptesis nula. Es decir,
no se puede afirmar que existe diferencia
en las varianzas de las dos poblaciones.
Estadistica Industrial 21/04/2014
4
21/04/2014 ESTADISTICA INDUSTRIAL 19
ANOVA
Otro uso de la distribucin F es la tcnica del anlisis de
varianza (ANOVA), con la que se comparan tres o mas
medias poblacionales para determinar si son iguales.
Para usar el ANOVA se considera lo siguiente:
1.- Las poblaciones estn distribuidas normalmente.
2.- Las poblaciones tienen desviaciones estndar
iguales (S).
3.- Las muestras se seleccionan independientemente.
21/04/2014 ESTADISTICA INDUSTRIAL 20
USO DEL ANALISIS DE VARIANZA
El anlisis de varianza (ANOVA) es una prueba, un
clculo que nos permite medir la variacin de las
respuestas numricas como valores de evaluacin
de diferentes variables nominales.
La prueba a realizar en el Anlisis de Varianza es s
existe diferencia en los promedios para los
diferentes valores de las variables nominales; esta
prueba se realiza para variables donde una tiene
valores nominales y la otra tiene valores numricos.
21/04/2014 ESTADISTICA INDUSTRIAL 21
Otra aplicacin: Se tiene la medicin de las
seales de recepcin en el medio ambiente
de celulares lo que se intenta es probar si
existe o no diferencias en las diferentes
lecturas tomados en diferentes distritos.
(Variable nominal).
Para analizar si existe diferencia en los
promedios se procede a realizar una prueba
F, cuando se toma tres o mas muestras
21/04/2014 ESTADISTICA INDUSTRIAL 22
ANOVA EN UNA DIRECCION
Definicin. Tcnica fundamental que, en su diseo ms
sencillo, desarrolla un contraste de hiptesis
estadsticas, que afecta simultneamente a las medias
de k poblaciones (variables aleatorias) con distribucin
normal y homoscedsticas, es decir, con idnticas
varianzas.
21/04/2014 ESTADISTICA INDUSTRIAL 23 21/04/2014 ESTADISTICA INDUSTRIAL 24
Paso 5. Seleccionar la muestra, realizar los clculos
y tomar una decisin. Se resume los clculos del
estadstico F en una tabla ANOVA. El formato de tabla
ANOVA es el siguiente:
Donde:
SStotal: Es la variacin total.
SST: Suma de cuadrados debido a los tratamientos
SSE: Suma de cuadrados debido al error.
MST: Cuadrado medio de los tratamientos.
MSE: Cuadrado medio del error.
Estadistica Industrial 21/04/2014
5
21/04/2014 ESTADISTICA INDUSTRIAL 25
Normalmente se comienza determinado SStotal. La
formula para determinar SStotal es:
Donde:
X2 es la suma de los valores X elevados al cuadrado.
(X)2 es el cuadrado de la suma de los valores X.
N es el nmero total de observaciones.
21/04/2014 ESTADISTICA INDUSTRIAL 26
Despus se determina SST, la suma de cuadrados
debidos al tratamiento. La formula parea encontrar SST
es:
Donde:
Tc es el total de la columna de cada tratamiento.
nc es el nmero de observ. (Tamao de la muestra)
de cada tratamiento.
Finalmente se determina SSE, la suma de los cuadrados del error,
por substraccin. La formula es:
21/04/2014 ESTADISTICA INDUSTRIAL 27
ANOVA EN DOS DIRECCIONES
En un ANOVA de dos direcciones se considera una
segunda variable de tratamiento.
a) La segunda variable de tratamiento se denomina la
variable de bloqueo.
. b) Se determina usando la siguiente ecuacin:
21/04/2014 ESTADISTICA INDUSTRIAL 28
c) El termino SSE, o error de suma de cuadrados, se evala
mediante la siguiente ecuacin.
d) El valor estadistico F para la variable de tratamiento y la variable de bloqueo,
se determina en la siguiente tabla:
21/04/2014 ESTADISTICA INDUSTRIAL 29
PROBLEMAS DE ANOVA EN UNA DIRECCIN
Problema
Un analista financiero desea determinar si hay
diferencia en la tasa media de rendimiento de
tres tipos de acciones: de servicios pblicos, de
comercio al menudeo y bancarios. Se obtuvo la
siguiente informacin muestral (Tabla 1).
Utilizando el nivel de significancia de 0.05.
Existe alguna diferencia entre los tres tipos de
acciones, en la tasa media de rendimiento?
21/04/2014 ESTADISTICA INDUSTRIAL 30
Estadistica Industrial 21/04/2014
6
21/04/2014 ESTADISTICA INDUSTRIAL 31 21/04/2014 ESTADISTICA INDUSTRIAL 32
21/04/2014 ESTADISTICA INDUSTRIAL 33 21/04/2014 ESTADISTICA INDUSTRIAL 34
21/04/2014 ESTADISTICA INDUSTRIAL 35 21/04/2014 ESTADISTICA INDUSTRIAL 36
Paso 4.- Ahora tenemos que Fk =18.09 y el
valor critico con (2,15) grados de libertad , 2 en
el numerador (fila) y 15 en el denominador
(columna) Fc=3.68, como Fk es mayor que el
valor critico entonces se rechaza la hiptesis
nula.
Paso 5.- El analista financiero puede concluir
que existe diferencia en los tres tipos de
acciones, en la tasa de rendimiento.
Estadistica Industrial 21/04/2014
7
21/04/2014 ESTADISTICA INDUSTRIAL 37
INFERENCIA ACERCA DE DOS MEDIAS
La distribucin T se utiliza como base de
esta prueba.
Un intervalo de confianza para la
diferencia entre dos medias poblacionales
se logra mediante.
(X1-X2) +/ - t MSE ( 1/n1+ 1/n2)
X1: Es la media del primer tratamiento
X2: Es la media del segundo tratamiento
21/04/2014 ESTADISTICA INDUSTRIAL 38
INFERENCIA ACERCA DE DOS MEDIAS
T student se obtiene de tabla t con lo grados
de libertad N-K. y alfa/2
MSE : Es el cuadrado medio de error que se
obtiene de la tabla de anova
SSE/(n-k)
.n1: Es el nmero de observaciones en el
primer tratamiento
.n2: Es el nmero de observaciones del
segundo tratamiento
21/04/2014 ESTADISTICA INDUSTRIAL 39
ltFFRFtClA ACFRCA 0F 00S HF0lAS
CONCLUSION:
Si ambos extremos del intervalo de confianza tienen el
MISMO SIGNO, esto indica que las medias de
tratamiento son DIFERENTES significativamente.
Para el ejemplo:
N-k = 18-3 = 15 g.l y = 0.05
Tc= 2.131
21/04/2014 ESTADISTICA INDUSTRIAL 40
(X1-X2) +/- 2.131 2.88 ( 1/6 + 1/6)
Ahora remplazamos los valores de.
21/04/2014 ESTADISTICA INDUSTRIAL 41 21/04/2014 ESTADISTICA INDUSTRIAL 42
PROBLEMA
Se sabe que un egresado (con licenciatura)
de una escuela de administracin gana ms
que un egresado de la enseanza
preparatoria sin instruccin adicional; y que
una persona con maestra o doctorado, gana
an ms. Para probar esto, se tom una
muestra aleatoria de 25 ejecutivos de
compaas cuyos activos eran superiores a
un milln de dlares. A continuacin se
muestran sus ingresos, clasificados segn el
nivel ms alto de educacin.
Estadistica Industrial 21/04/2014
8
21/04/2014 ESTADISTICA INDUSTRIAL 43 21/04/2014 ESTADISTICA INDUSTRIAL 44
Pruebe al nivel de significancia 0.05 que no hay
diferencia en los salarios medios de los tres grupos.
Realizamos nuestra prueba de Hiptesis
1. Hiptesis: H0: 1 = 2 = 3
Ha: No todas las medias son iguales
2. Nivel de significacin: = 0.05
3. Estadstico de prueba: F
4. F de tabla se halla con k 1 grados de libertad en el
numerador y n k grados de libertad para el
denominador. Para el numerador se tiene 2 grados de
libertad y para el denominador 22.
F(0.05,2,22) = 3.44
21/04/2014 ESTADISTICA INDUSTRIAL 45 21/04/2014 ESTADISTICA INDUSTRIAL 46
21/04/2014 ESTADISTICA INDUSTRIAL 47
5.- TOMA DE DECISION
El FK=10.184 es mayor a 3.44. Por lo
tanto, rechazamos la hiptesis nula y
aceptamos la hiptesis alternativa.
Entonces no todas las medias de los
ingresos de los ejecutivos son iguales ya
que depende del grado que tengan.
21/04/2014 ESTADISTICA INDUSTRIAL 48
=
=
Estadistica Industrial 21/04/2014
9
21/04/2014 ESTADISTICA INDUSTRIAL 49 21/04/2014 ESTADISTICA INDUSTRIAL 50
21/04/2014 ESTADISTICA INDUSTRIAL 51
ANOVA EN DOS DIRECCIONES
En anova de una direccin se considera solo
dos fuentes de variacin , una la causada por el
tratamiento y otro debido al azar. Seria mejor
considerar otros factores inmersos en el
problema .
La ventaja de considerar otros factores reside
en que se puede reducir la varianza del error .
Es decir , si se reduce el la suma de cuadrado
del error o el SSE el valor de F ser mayor
,haciendo que se rechace la hiptesis nula que
las medias son iguales.
21/04/2014 ESTADISTICA INDUSTRIAL 52
ANOVA EN DOS DIRECCIONES
Para ANOVA de dos factores se prueba si
existe una diferencia significativa entre el
efecto de tratamiento y si existe una
diferencia en la variable de bloqueo.
Sea Br el total de bloque (r segn las filas)
SSB representa la suma de los cuadrados
de los bloques, donde:
21/04/2014 ESTADISTICA INDUSTRIAL 53
n
X
k
B
SSB
r
2 2
) (L

L =
21/04/2014 ESTADISTICA INDUSTRIAL 54
Problema
Un organismo de investigacin quiere
comparar los rendimientos en milla por
galn, de gasolinas regular sin plomo, semi-
grado y sper Premium. Debido a la
diferencia en el funcionamiento en los
diferentes automviles, se seleccionaron 7
de ellos y se les trato como bloques. Por lo
tanto cada clase de gasolina se prob con
cada tipo de vehculo, los resultados de las
pruebas, en millas por galn, se muestra en
la siguiente tabla. A nivel de significancia de
0.05. Existe alguna diferencia entre las
gasolinas y los automviles?
Estadistica Industrial 21/04/2014
10
21/04/2014 ESTADISTICA INDUSTRIAL 55
Datos
21/04/2014 ESTADISTICA INDUSTRIAL 56
21/04/2014 ESTADISTICA INDUSTRIAL 57
Procedemos a determinar cada una de nuestras variables de la
Tabla Anova.
Para los Tratamientos
Para los Bloques
Suma de cuadrados totales
21/04/2014 ESTADISTICA INDUSTRIAL 58
Error
La tabla ANOVA:
21/04/2014 ESTADISTICA INDUSTRIAL 59
Para cada tipo de gasolina
1.- Hiptesis: H0: 1 = 2 = 3
Ha: No todas las medias son
iguales
2.- Nivel de significancia: = 0.05
3.-Estadstico: El estadstico de prueba es F
4.-Regin Crtica:
Para = 0.05 y sabiendo:
Grados de libertad del numerador = k 1 = 2
Grados de libertad de denominador = (k 1)*(b 1) = 12
En tablas encontramos que:
F(0.05 ; 2, 12) = 3.89
La regin crtica est dada por:
Regin Critica = {F > 3.89}
21/04/2014 ESTADISTICA INDUSTRIAL 60
5.-Decisin:
Como se puede apreciar en el grafico anterior, el valor de F
calculado (26.71), es mayor que el F tabla (3.89), y se
encuentra en la regin critica, por lo tanto se rechaza la
hiptesis nula y se acepta la alternativa.
Se puede concluir que los rendimientos medios que ofrece
cada tipo de gasolina en miles por galn no son iguales.
Para los automviles
1.- Hiptesis: H0: 1 = 2 = 3 = 4 = 5 = 6= 7
Ha: No todas las medias son iguales
2.-Nivel de significancia: = 0.05
3.- Estadstico: Con el estadstico de prueba F
Estadistica Industrial 21/04/2014
11
21/04/2014 ESTADISTICA INDUSTRIAL 61 21/04/2014 ESTADISTICA INDUSTRIAL 62
4.- Regin Crtica:
Para = 0.05 y sabiendo que:
Grados de libertad del numerador = k 1 = 6
Grados de libertad de denominador = (k 1)(b 1) = 12
En tablas se ubica:
F(0.05 ; 6, 12) = 3.00
La regin crtica est dada por:
Regin Critica = {F > 3.00}
5.- Decisin:
Como el valor de F calculado (15.60), es mayor que el F=3
( tabla) , entonces se encuentra en la regin de rechazo, por lo
tanto, rechazamos la hiptesis nula y se acepta la hiptesis
alternativa
Puede concluirse, entonces, que efectivamente existe alguna
diferencia entre los rendimientos medios en cada tipo de
automvil.
21/04/2014 ESTADISTICA INDUSTRIAL 63 21/04/2014 ESTADISTICA INDUSTRIAL 64
PROBLEMAS DE ANOVA EN DOS DIRECCIONES
Problema Cada una de las tres cadenas de
supermercados en la regin de Denver indica
que ofrece los precios mas bajos .Como parte
de su estudio de investigacin sobre publicidad
de supermercados, el diario Denver Daily News
realiz un estudio. Primero selecciono una
muestra aleatoria de nueve artculos
comestibles. Despus reviso el precio da cada
uno de estos productos en cada una de las tres
cadenas, el mismo da. Al nivel de significancia
de 0.05 Hay alguna diferencia en los precios
medios de los supermercados y de los
artculos?
21/04/2014 ESTADISTICA INDUSTRIAL 65 21/04/2014 ESTADISTICA INDUSTRIAL 66
Estadistica Industrial 21/04/2014
12
21/04/2014 ESTADISTICA INDUSTRIAL 67 21/04/2014 ESTADISTICA INDUSTRIAL 68
21/04/2014 ESTADISTICA INDUSTRIAL 69 21/04/2014 ESTADISTICA INDUSTRIAL 70
21/04/2014 ESTADISTICA INDUSTRIAL 71