Está en la página 1de 8

Qu son los residuos?

El residuo de una observacin dada es igual al valor de la observacin, menos


el valor ajustado grficas de residuos

eij = yij yij


= yij yi.
Minitab provee tres tipos de residuos:
Residuo regular: valor observado - valor pronosticado.

Residuo estandarizado: residuo regular / desv. est. del residuo regular.

La estandarizacin elimina el efecto del punto de ubicacin de los datos con


respecto a los predictores o factores.
Residuo eliminado studentizado: para el punto de datos isimo, la
frmula sigue la misma expresin que el residuo estandarizado. Sin embargo,
el isimo valor ajustado y la desviacin estndar se calculan para el residuo
eliminado studentizado eliminando el caso isimo en el anlisis. En
comparacin con el residuo estandarizado, el residuo eliminado studentizado
es ms grande en presencia de un punto de datos poco comn.
Supuestos del modelo
Los procedimientos de regresin y ANOVA aplican los siguientes supuestos en
relacin con los errores:

Los errores estn distribuidos normalmente con una media de cero.

La varianza de error no cambia para diferentes niveles de un factor o de


acuerdo con los valores de la respuesta pronosticada.
Cada error es independiente de todos los dems errores. En un
experimento diseado, la mejor manera de obtener errores independientes es
aleatorizando el orden de la corrida de los ensayos experimentales.
Verifique la validez de estos supuestos en su anlisis. Los residuos son los
mejores estimados de error. Por lo tanto, puede verificar cada uno de estos
supuestos de forma grfica utilizando las grficas de residuos.
Si su modelo no cumple con estos supuestos, los resultados del anlisis
pueden ser engaosos. Por ejemplo, si los errores estn correlacionados, los
errores estndares de los coeficientes se pueden estimar incorrectamente, lo
cual producira valores t y p incorrectos.

Grficas de residuos
Minitab ofrece las siguientes grficas de residuos: histograma de residuos,
grfica de probabilidad normal de los residuos, residuos versus valores
ajustados, residuos versus orden de los datos y residuos versus variables.
Utilice las grficas de residuos para evaluar sus datos en relacin con los
siguientes problemas: no normalidad, variacin no aleatoria, varianza no
constante, relaciones de orden ms alto y valores atpicos.
Histograma de residuos
Un histograma de residuos muestra la distribucin de los residuos para todas
las observaciones. Utilice el histograma como una herramienta de exploracin
para obtener informacin sobre las siguientes caractersticas de los datos:

Valores tpicos, dispersin o variacin y forma

Valores poco comunes en los datos

El histograma de residuos debera tener forma de campana. Utilice esta grfica


para buscar lo siguiente:
Este patrn...
Colas largas
Una barra muy alejada
de las otras barras

Indica...
Sesgo
Un valor atpico

Debido a que el aspecto del histograma puede cambiar segn el nmero de


intervalos utilizados para agrupar los datos, utilice la grfica de probabilidad
normal y las pruebas de bondad de ajuste para evaluar si los residuos son
normales.

En lo que respecta a los datos sobre los equipos, no existe evidencia de sesgo
o valores atpicos.

Grfica normal de los residuos


Esta grfica representa los residuos versus sus valores esperados cuando la
distribucin es normal. Los residuos del anlisis deben estar distribuidos
normalmente. En la prctica, para diseos con un nmero grande de
observaciones, las desviaciones moderadas con respecto a la normalidad no
afectan seriamente los resultados.
La grfica de probabilidad normal de residuos debe seguir aproximadamente
una lnea recta. Utilice esta grfica para buscar lo siguiente:
Este patrn...
No una lnea recta
Curva en las colas
Un punto alejado de la
lnea
Cambio de pendiente

Indica...
No normalidad
Sesgo
Un valor atpico
Una variable no
identificada

Si sus datos tienen menos de 50 observaciones, la grfica podra mostrar una


curvatura en las colas, aun si los residuos estn normalmente distribuidos. A
medida que disminuye el nmero de observaciones, la grfica de probabilidad
pudiera mostrar una variacin y no linealidad aun mayores. Utilice la grfica de
probabilidad normal y las pruebas de bondad de ajuste para evaluar la
normalidad de los residuos en conjuntos de datos pequeos.

En lo que respecta a los datos sobre los equipos, los residuos no parecen
seguir una lnea recta. Una evidencia de no normalidad existe en las colas,
aunque no es extrema. Usted pudiera desear realizar una prueba de
normalidad para determinar si los residuos son normales

Sesgo
El sesgo se refiere a una falta de simetra. Una distribucin es sesgada si una
cola se extiende ms que la otra.
Valor atpico
Un valor atpico es una observacin inusualmente grande o pequea. Los
valores atpicos pueden ser resultado de errores en la recoleccin de los datos
o en el ingreso de los datos, y se deben verificar.
Los valores atpicos pueden tener una marcada influencia en los resultados de
los procedimientos, como por ejemplo el ANOVA de un factor. Muchos
investigadores consideran que una observacin es un valor atpico si es
diferente de la media de la muestra en ms del doble de la desviacin estndar
agrupada

Residuos versus ajustes


Esta grfica representa los residuos versus los valores ajustados. Los residuos
deberan estar dispersos aleatoriamente alrededor de cero. Utilice esta grfica
para buscar lo siguiente:
Este patrn...
Indica...
Dispersin en abanico o Varianza no constante
irregular de los residuos
en los valores ajustados
Curvilneo
Un trmino de orden
ms alto faltante
Un punto alejado de cero Un valor atpico

De acuerdo con esta grfica, los residuos parecen estar dispersos


aleatoriamente alrededor de cero. No existe evidencia de varianza no
constante, trminos faltantes o valores atpicos

Residuos versus Orden


Esta grfica representa los residuos en el orden de las observaciones
correspondientes. La grfica es til cuando el orden de las observaciones
puede influir en los resultados, lo cual puede ocurrir cuando los datos se
recolectan en una secuencia de tiempo o en alguna otra secuencia, como por
ejemplo rea geogrfica. Esta grfica puede ser particularmente til en un
experimento diseado en el cual las corridas no estn aleatorizadas.
Los residuos de la grfica deben fluctuar en un patrn aleatorio alrededor de la
lnea central. Examine la grfica para determinar si existe alguna correlacin
entre los trminos de error cercanos entre s. La correlacin entre los residuos
puede ser representada por:

Una tendencia ascendente o descendente en los residuos

Cambios rpidos en los signos de residuos adyacentes

En lo que respecta a los datos sobre los equipos, los residuos parecen estar
dispersos aleatoriamente alrededor de cero. No existe evidencia de que los
trminos de error estn correlacionados entre s.
Residuos versus las Variables
Esta grfica representa los residuos versus otra variable. Los residuos deben
fluctuar en un patrn aleatorio alrededor de la lnea central. Si la variable ya
est incluida en el modelo, utilice la grfica para determinar si debe agregar un
trmino de orden ms alto de la variable. Si la variable an no est incluida en
el modelo, utilice la grfica para determinar si la variable est influyendo en la
respuesta de forma sistemtica.
Utilice esta grfica para buscar lo siguiente:
Este patrn...

Indica...

Patrn en los
residuos
Curvatura en los
puntos

La variable est
influyendo en la respuesta
de forma sistemtica
Un trmino de orden ms
alto de la variable se
debera incluir en el
modelo

En lo que respecta a los datos sobre los equipos, los residuos parecen estar
dispersos aleatoriamente alrededor de cero. No existe evidencia de un patrn
en los residuos o curvatura en los datos. La grfica indica que las variables no
parecen tener un efecto sistemtico en la respuesta.
Grfica de residuos cuatro en uno
La grfica de residuos cuatro en uno muestra cuatro grficas de residuos
diferentes en una ventana de grfica. Este diseo puede ser til para comparar
las grficas a fin de determinar si su modelo cumple con los supuestos del
anlisis. Las grficas de residuos incluidas en el diseo cuatro en uno son:
Histograma indica si los datos estn sesgados o si existen valores
atpicos en los datos
Grfica de probabilidad normal indica si los datos estn distribuidos
normalmente, si otras variables estn influyendo en la respuesta o si existen
valores atpicos en los datos
Residuos versus valores ajustados indica si la varianza es constante, si
existe una relacin no lineal o si existen valores atpicos en los datos
Residuos versus orden de los datos indica si hay efectos sistemticos en
los datos debido al tiempo o al orden de recoleccin de los datos

Transformacin de una variable de respuesta


Una transformacin puede ser necesaria cuando los residuos exhiban varianza
no constante o no normalidad.
Las transformaciones tambin pueden ser tiles cuando el modelo exhiba una
falta de ajuste significativa, lo cual es particularmente importante en los
experimentos de anlisis de superficie de respuesta. Supongamos que usted
incluye todas las interacciones significativas y los trminos cuadrticos en el
modelo, pero la prueba de falta de ajuste sugiere la necesidad de trminos de
orden ms alto. Una transformacin puede eliminar la falta de ajuste.
Si la transformacin corrige el problema, usted puede utilizar el anlisis de
regresin en lugar de otros mtodos de anlisis, posiblemente ms
complicados. Un texto apropiado sobre regresin o anlisis de experimentos
diseados puede ofrecer una orientacin adecuada con respecto a cules
transformaciones resuelven diferentes problemas.
La transformacin de Box-Cox es la transformacin de estabilizacin de la
varianza utilizada con ms frecuencia.
Varianza no constante
Uno de los supuestos de regresin y del anlisis ANOVA es que la varianza del
trmino de error es constante. En la grfica de residuos versus valores
ajustados, los errores tienen varianza constante cuando los residuos estn
dispersos de forma aleatoria alrededor de cero. Si los residuos aumentan o
disminuyen con los valores ajustados en un patrn que parece un embudo, los
errores pudieran no tener varianza constante.

Trmino de orden ms alto


El orden de un trmino en un modelo de regresin corresponde al grado
exponencial de ese trmino: un trmino lineal (x) es un trmino de primer
orden; un trmino cuadrtico (x2) es un trmino de segundo orden; y una
interaccin de dos factores (x1x2) tambin es un trmino de segundo orden.
Los trminos de orden ms alto se pueden utilizar para modelar curvatura en
los datos. Un patrn curvilneo en la grfica de residuos versus valores
ajustados puede indicar que usted necesita agregar un trmino de orden ms
alto a su modelo. Graficar variables individuales en su modelo versus los
residuos puede ayudarle a determinar cules variables tienen una relacin
curvilnea con la respuesta.

También podría gustarte