P. 1
Análisis Componentes de la Varianza

Análisis Componentes de la Varianza

|Views: 4.269|Likes:
Publicado porjustorfc

More info:

Published by: justorfc on Mar 22, 2009
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

05/30/2013

pdf

text

original

STATGRAPHICS – Rev.

4/25/2007

Análisis de Componentes de la Varianza
Resumen
El procedimiento de Análisis de Componentes de Varianza está diseñado para estimar la contribución de múltiples factores a la variabilidad de una variable dependiente Y. Está diseñado para analizar un experimento anidado en el cual los factores están estructurados en una manera jerárquica. En tal estudio, las muestras de cada factor son tomadas del interior de las muestras del factor inmediatamente arriba de él. Por ejemplo, b conjuntos podrían haber sido tomados de un proceso. Entonces s muestras podrían ser tomadas de cada conjunto. Finalmente, t pruebas podrían ser realizadas en cada muestra. El conjunto final de datos tendría un total de n = bst medidas. Este procedimiento está diseñado para un experimento en el cual los factores están estructurados en un estricto orden jerárquico y en el cual todos los efectos se asumen como aleatorios. El procedimiento Modelos Lineales Generales debería ser usado para situaciones más complicadas.

StatFolio de Muestra: varcomp.sgp Datos de la Muestra:
El archivo pigment.sf6 contiene datos de un experimento descrito por Box, Hunter y Hunter (1978). En ese experimento, b = 15 conjuntos de pegamento de pigmento fueron seleccionados. De cada conjunto, s = 2 muestras fueron tomadas y t = 2 pruebas fueron ejecutadas en cada muestra para medir la humedad contenida. Un total de n = 60 mediciones se encuentran en el archivo y una parte de éstas se muestra abajo: Batch 1 1 1 1 2 2 2 2 3 3 3 3 Simple 1 1 2 2 3 3 4 4 5 5 6 6 Test 1 2 1 2 1 2 1 2 1 2 1 2 Moisture 40 39 30 30 26 28 25 26 29 28 14 15

Los conjuntos están numerados del 1 a b = 15. Las muestras están numeradas del 1 al bs = 30, sin embargo ellas podrían haber sido etiquetadas del 1 a s = 2 dentro de cada conjunto. Las pruebas están numeradas del 1 a t = 2 dentro de cada muestra, sin embargo éstas podrían haber sido numeradas del 1 al bst = 60. Cada esquema de numeración proporcionará idénticos resultados.

© 2006 por StatPoint, Inc.

Análisis de Componentes de la Varianza - 1

STATGRAPHICS – Rev. 4/25/2007

Captura de Datos
Los datos consisten de una sencilla columna que contiene las mediciones así como múltiples columnas que indican los niveles de los factores experimentales.

• •

Variable Dependiente: columna numérica que contiene las observaciones. Factores en Orden de Anidamiento: columnas numéricas o no numéricas que contienen los niveles que identifican cada factor. Los factores deben ser capturados de arriba hacia abajo, por ejemplo cada factor se asume para ser anidado en el factor que se encuentra inmediatamente arriba de él en la lista. Este es uno de los pocos procedimientos de STATGRAPHICS en los que el orden de los factores afecta el análisis. Selección: selecciona el subconjunto.

Nota: la prueba del factor final puede omitirse de la lista de factores en el cuadro de diálogo. Si es así, sus efectos serán incluidos como un término de “Residuo” en la tabla de ANOVA.

Modelo Estadístico
El modelo estadístico relevante para la muestra de datos es Ybst = μ + ε b + ε s + ε t donde μ = media del proceso εb = desviación de la media de conjunto b de la media del proceso μ © 2006 por StatPoint, Inc. Análisis de Componentes de la Varianza - 2 (1)

STATGRAPHICS – Rev. 4/25/2007 εs = desviación de la media de la muestra s de la media del conjunto b εt = desviación del cálculo de la prueba t de la media de la muestra s Las desviaciones se asumen usualmente como muestras aleatorias de distribuciones normales con desviaciones estándar: σb = desviación estándar entre los conjuntoss σs = desviación estándar entre las muestras dentro de los conjuntos σt = desviación estándar entre los resultados de pruebas dentro de cada muestra Suponiendo que los diversos componentes del error son independientes, la variabilidad del proceso general es la suma de la variabilidad explicada por los diversos componentes, por ejemplo:

σ 2 = σ b2 + σ s2 + σ t2

(2)

Resumen del Análisis
El Resumen del Análisis muestra el número de observaciones n y un análisis de la tabla de varianza.
Análisis Componentes de la Varianza - moisture
Variable dependiente: moisture Factores: batch sample test Número de casos completos: 60 Análisis de Varianza para moisture Fuente Suma de Cuadrados TOTAL (CORREGIDO) 2108.18 Batch 1210.93 Sample 869.75 Test 27.5

Gl 59 14 15 30

Cuadrado Medio 86.4952 57.9833 0.916667

Comp. Var. 7.12798 28.5333 0.916667

Porciento 19.49 78.01 2.51

La tabla muestra: • • • • Sumas de Cuadrados: una descomposición de la suma de las desviaciones cuadradas alrededor de la gran media. GL: los grados de libertad asociados con cada suma de cuadrados. Cuadrado Medio: las sumas de cuadrados divididos entre sus grados de libertad. Componentes de la Varianza: los componentes de la varianza estimada los cuales son las varianzas estimadas de cada factor dentro del factor donde está anidado. Los componentes de Análisis de Componentes de la Varianza - 3

© 2006 por StatPoint, Inc.

STATGRAPHICS – Rev. 4/25/2007 la varianza son estimados al especificar los cuadrados de medias en la tabla de la ANOVA igual a sus valores esperados y resolviendo las ecuaciones resultantes. • Porciento: el porcentaje de la varianza total del proceso representada por cada componente.

En los datos de la muestra las estimaciones de los componentes de la varianza son: $ $ $ σ b2 = 7.128 σ s2 =28.53 σ t2 = 0.9167. La estimación de la variabilidad total del proceso es
ˆ ˆ ˆ ˆ σ 2 = σ b2 + σ s2 + σ t2 = 36.63

Note que la variabilidad entre muestras dentro del mismo conjunto representa sobre el 78% de la variabilidad total indicando un problema con la homogeneidad dentro de los conjuntos.

Diagrama de Puntos
El cuadro Diagrama de Puntos grafica los datos por niveles de un factor seleccionado.
Gráfica de Componentes de Varianza 43 38 moisture 33 28 23 18 13 1 2 3 4 5 6 7 8 batch 9 10 11 12 13 14 15

La gráfica de arriba muestra líneas horizontales en cada una de las 15 medias de conjuntos. Cada punto representa la media de una muestra dentro de un conjunto. Opciones de Cuadro

© 2006 por StatPoint, Inc.

Análisis de Componentes de la Varianza - 4

STATGRAPHICS – Rev. 4/25/2007

Factor: el factor a ser graficado en el eje horizontal.

Gráfica de Desviación de Componentes
La Gráfica de Desviación de Componentes muestra la desviación de cada observación de la media de todas las observaciones al mismo nivel de un factor seleccionado:
Gráfica de Desviación de Componentes para moisture

batch

19.49%

sample

78.01%

test -14 -9 -4 1 6 desviación de la media 11 16

2.51%

Cada sección de la gráfica contiene un punto que corresponde a cada observación. En cada sección, una media diferente ha sido substraída del valor de los datos. Sección Superior (conjunto): muestra la desviación de cada observación de la media general de todas las observaciones. Sección del Centro (muestra): muestra la desviación de cada observación de la media del conjunto del cual fue tomado. Sección Inferior (prueba): muestra la desviación de cada observación de la media de la muestra de la cual fue tomada. El efecto es para mostrar de abajo hacia arriba la contribución adicional de cada componente. La variabilidad en la sección inferior se explica solamente al proceso de prueba. La variabilidad en la sección del centro incluye la variabilidad de las pruebas y la variabilidad entre muestras dentro del mismo conjunto. La variabilidad en la sección superior proviene de los tres componentes. © 2006 por StatPoint, Inc. Análisis de Componentes de la Varianza - 5

STATGRAPHICS – Rev. 4/25/2007 En la gráfica de arriba es claro que una cantidad substancial de variabilidad es introducida en el nivel de las muestras dentro de los conjuntos.

Resumen Estadístico
La tabla del Resumen Estadístico muestra los tamaños muestrales, medias y desviaciones estándar en cada nivel de los factores. Una parte de la tabla se muestra abajo:
Resumen estadístico para moisture Nivel MEDIA GLOBAL Batch 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Muestra 1 2 3 4 5 6 7 8 Recuento 60 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 2 2 2 2 2 2 2 2 Media 26.7833 34.75 26.25 21.5 27.25 18.25 28.75 28.0 31.5 29.0 20.0 25.0 30.25 24.5 24.25 32.5 39.5 30.0 27.0 25.5 28.5 14.5 30.5 24.0 Desviación Estándar 5.97762 5.5 1.25831 8.1035 3.77492 1.5 4.42531 5.22813 2.88675 2.3094 6.58281 1.63299 1.5 5.8023 0.957427 6.45497 0.707107 0.0 1.41421 0.707107 0.707107 0.707107 0.707107 0.0

Gráficas de Residuos
Como con todos los modelos estadísticos es una buena práctica examinar los residuos. Los residuos son iguales a los valores de los datos observados menos los valores predichos por el modelo estadístico subyacente. El procedimiento Componentes de Varianza crea 3 gráficas de residuos: 1. versus nivel de factor. 2. versus valor predicho. 3. versus número de fila. Nota: En los datos muestrales, los factores han sido especificados para cada nivel de error experimental así que los residuos son todos igual a 0. Si la prueba es removida como un factor, entonces su efecto será reflejado en un término del residuo. Las gráficas de abajo reflejan eso como análisis: © 2006 por StatPoint, Inc. Análisis de Componentes de la Varianza - 6

STATGRAPHICS – Rev. 4/25/2007 Residuos versus Nivel de Factor Esta gráfica es útil para visualizar cualquier diferencia en la variabilidad en varios niveles de un factor.
Gráfico de Residuos para moisture 1.5 1 0.5 residuo 0 -0.5 -1 -1.5 1 2 3 4 5 6 7 8 batch 9 10 11 12 13 14 15

El residuo promedio en cada nivel es igual a 0. Paneles de Opciones

Factor: factor a ser mostrado en el eje horizontal

Residuos versus Predicho Esta gráfica es útil para detectar cualquier heteroscedasticidad en los datos.

© 2006 por StatPoint, Inc.

Análisis de Componentes de la Varianza - 7

STATGRAPHICS – Rev. 4/25/2007
Gráfico de Residuos para moisture 1.5 1 0.5 residuo 0 -0.5 -1 -1.5 13 18 23 28 33 moisture predicho 38 43

La heteroscedasticidad ocurre cuando la variabilidad de los datos cambia conforme la media cambia y podría necesitar la transformación de los datos antes de realizar la ANOVA. La heteroscedasticidad se evidencia usualmente por un patrón en forma de embudo en la gráfica de los residuos. Residuos versus Observación Esta gráfica muestra los residuos versus el número de fila en la hoja de base de datos:
Gráfico de Residuos para moisture 1.5 1 0.5 residuo 0 -0.5 -1 -1.5 0 10 20 30 40 número de fila 50 60

Si los datos se ordenan en orden cronológico cualquier patrón en los datos podría indicar una influencia externa. No se encuentra evidencia de tal patrón en la gráfica de arriba.

Guardar Resultados
Los siguientes resultados pueden ser guardados en la hoja de base de datos: 1. Componentes de Varianza – los componentes de varianza estimada. 2. Residuos – los n residuos. © 2006 por StatPoint, Inc. Análisis de Componentes de la Varianza - 8

STATGRAPHICS – Rev. 4/25/2007 Cálculos La estimación de los componentes de la varianza sigue el procedimiento descrito en la documentación Modelos Lineales Generales.

© 2006 por StatPoint, Inc.

Análisis de Componentes de la Varianza - 9

You're Reading a Free Preview

Descarga
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->