Sesión 3

También podría gustarte

Está en la página 1de 26

Universidad Nacional Intercultural Fabiola Salazar Leguía de

Bagua-UNIFSLB
Carrera Profesional de Negocios Globales

Curso:
Diseños experimentales
Mg.Ing.Estad.Villena Zapata, Luigi
Sesión 3
Carrera profesional de Negocios Globales – V Ciclo
Verificación de las suposiciones del modelo

El ANOVA se base en tres suposiciones que dan validez y confiabilidad a


sus resultados, las cuales son: normalidad, varianza constante e
independencia de los errores  ij  .

Recordando: Los errores son variables aleatorias que se supone siguen


una distribución normal con media cero y varianza constante, además
de ser independientes entre sí.  ij  NID0,  2 
Verificación de las suposiciones del modelo

Los residuos eij  son cantidades conocidas que representan



a los errores
y que están definidos de manera general como eij  yij  y ij  yij  y i , es
decir, la diferencia entre cada dato y la media de su grupo.
Caso Aplicativo: Producción de clavos

Se desea comparar tres procesos desde el punto de vista de la longitud


de clavos de 2 pulgadas. Se decide tomar una muestra aleatoria de 3
clavos por proceso, cuyas longitudes se muestran en la siguiente tabla
(ver archivo base_clavos.sav):

Replicas
Proceso
1 2 3
A 2,05 2,03 2,02
B 1,98 1,99 2,00
C 2,07 2,05 2,05
Primer supuesto: Prueba de normalidad
Normalidad de los Errores

En el gráfico Normal-QQ, los residuos deben estar aproximadamente a lo largo


de la línea de referencia. La gráfica no revela ninguna desviación severa
respecto a la normalidad para este modelo.
Primer supuesto: Prueba de normalidad
Normalidad de los Errores

En el gráfico Normal-QQ, los residuos se encuentran próximos a lo largo de la


línea de referencia. La gráfica revela cumplimiento de la normalidad para este
modelo.
Primer supuesto: Prueba de normalidad

Hipótesis a contrastar:
H0: Los datos analizados siguen una distribución Normal.
H1: Los datos analizados no siguen una distribución Normal.
KOLMOGOROV- SMIRNOV (Corrección de SHAPIRO - WILK
significación de lilliefors)

Para muestras grandes (n≥50) Cuando la muestra es pequeña (n<50)

*Garza (2013)

Importante:
Cuando p >0.05 Aceptamos la Hipótesis Nula
Cuando p <0.05 Rechazamos la Hipótesis Nula de manera significativa
* Análisis Estadístico Multivariante Un enfoque teórico y práctivo. Jorge de la Garza García
Primer supuesto: Prueba de normalidad

Pruebas de normalidad
Kolmogorov-Smirnova Shapiro-Wilk
Estadístico gl Sig. Estadístico gl Sig.
*
Errores 0,177 9 ,200 0,911 9 0,324
*. Esto es un límite inferior de la significación verdadera.
a. Corrección de significación de Lilliefors

El p-valor de significancia de la prueba de normalidad para muestras


pequeñas Shapiro-Wilk (n<50), es mayor que 0.05 (p=0.324>0.05),
por tanto, no se tiene suficiente evidencia para rechazar la hipótesis
nula, concluyendo no se rechaza la normalidad de los residuos.
Segundo supuesto: Prueba de varianza constante

La prueba de gráfica de varianza constante consiste en graficar los


residuos (en el eje vertical) contra y i  y i o sea, los valores estimados
en el eje horizontal (fitted o fit). El hecho que los residuos se acomoden
en una banda horizontal sin ningún patrón aparente, se considera que
la varianza de ellos dentro de cada grupo es la misma o constante.
Segundo supuesto: Prueba de varianza constante

Sin embargo, si el acomodo de los residuos presenta forma de embudo


que abre o que cierra, se rechaza que su varianza es constante.
Segundo supuesto: Prueba de varianza constante

Aunque no se observa una dispersión uniforme entre todos los


tratamiento, no se rechaza que la varianza sea constante.
Segundo supuesto: Prueba de varianza constante

Se visualiza en la prueba de Levene de igualdad de varianzas un p-


valor mayor que 0.05 (p=0.651>0.05), aceptando la hipótesis de
igualdad de varianzas de los errores H 0 :  12   22   32  .
Tercer supuesto: Independencia de los errores

Al efectuar experimentos, se deberá registrar el orden en que fueron


realizados. La prueba de independencia consiste en graficar los
residuos contra el orden de cada experimento. Si observan
fluctuaciones aleatorias en una banda horizontal, la independencia
no se rechaza. En caso contrario, se debería repetir el experimento
teniendo cuidado con la aleatorización de las pruebas.
Tercer supuesto: Independencia de los errores

En la presenta figura, se
muestra que la gráfica de
los residuos contra el
orden de las pruebas. No
presenta anormalidad
alguna y la independencia
de los residuos no es
rechazada.
Caso Aplicativo: Instituciones Bancarias
Caso Aplicativo: Instituciones Bancarias

Por la actividad que realiza en las ventas de un servicio, un agente de


seguros tiene interés en evaluar cuatro instituciones bancarias sobre el
tiempo que les toma a las personas en efectuar un trámite. Para ello
toma como referencia a los que no son clientes de la institución.
Selecciona las cuatro instituciones de un centro comercial, luego de
manera aleatoria selecciona a cinco clientes de cada institución. Toma
el tiempo en que son atendidos. Los resultados se muestran en el
archivo base_banco.sav. ¿Existe diferencia entre las instituciones en el
tiempo de atención? Para contestar la pregunta utiliza un nivel de
significancia de 5%.
Caso Aplicativo: Instituciones Bancarias

Banco 1 Banco 2 Banco 3 Banco 4


12 13 24 29
16 10 17 31
17 14 23 26
14 18 20 28
15 12 18 22

Existe diferencia entre las instituciones en el tiempo de atención?


Para contestar la pregunta utiliza un nivel de significancia de 5%.
Análisis de Varianza (ANVA) – Un solo factor
Análisis de Varianza (ANVA) – Un solo factor
Análisis de Varianza (ANVA) – Un solo factor

Realiza la comparación de la
ganancia de peso vivo ajustado,
entre los grupos de corderos que
recibieron el T0: Sin suplemento
con pastoreo en pastos naturales,
TH: Suplementación de 0.220 kg
de mezclas alimenticias y
pastoreadas y los corderos que
recibieron TL: Suplementación de
0.110 kg de mezclas alimenticias y
pastoreadas e identifica el mejor
tratamiento.
Análisis de Varianza (ANVA) – Un solo factor
Análisis de Varianza (ANVA) – Un solo factor
Dieta
T0 TH TL
10.40 17.50 11.51
8.89 17.02 14.51
8.76 16.50 17.00
9.76 21.51 12.03
2.29 12.49 11.97
6.51 11.48 11.22
7.21 12.93 14.15
6.76 13.52 19.52
6.81 11.93 12.50
12.09 3.73 19.04
8.66 11.97 12.16
6.77 18.01 18.00
7.75 12.00 14.06
6.38 16.96 15.52
6.41 14.99 12.02
7.00 13.60 15.00
4.91 19.13 17.99
6.08 15.94 13.50
8.00 12.01 13.96
8.90

¿Existen diferencias entre la ganancia en peso promedio de los diferentes tipos de dietas?
Caso Aplicativo: Tipo de cuero
H 0 : TO  TH  TL  
H1 : i   j para a lg ún i  j TO, TH , TL 

H 0 :  TO   TH   TL  0
H1 :  i  0 para a lg ún i  TO, TH , TL

¿Existen diferencias entre la ganancia en peso promedio de los


diferentes tipos de dietas?
Caso Aplicativo: Tipo de cuero

3
SCT   Yij  2
nj
Y..2
 9537.6994 
699.22 
2
 1108.2406
i 1 j 1 N 58

Yi.2 Y..2 150.34  273.22  275.66  699.22 


3 2 2 2 2
SCTRAT      
i 1 n i N 20 19 19 58
3
Yi.2 Y..2
SCTRAT    628.942
i 1 ni N

SC E  SCT  SCTRAT  1108.2406  628.942  479.2986


Caso Aplicativo: Tipo de cuero

Fuente de Suma de Grados de Cuadrado


Fo Valor-p
variabilidad cuadrados libertad medio
Dietas 628.942 2 314.471 36.086 0.000
Error 479.299 55 8.715
Total 1108.241 57

El p-valor de significancia del Análisis de Varianza es menor que 0.05


(p=0.000<0.05), rechazando la hipótesis nula, concluyendo que al
menos dos tipos de dietas son diferentes en la variable ganancia en
peso promedio.

También podría gustarte