Está en la página 1de 8

STATGRAPHICS Rev.

9/14/2006

Ajustando Curva SnapStat


Resumen
El procedimiento Ajustando Curva SnapStat crea un resumen de una pagina que describe la relacin entre un solo factor cuantitativo X y una variable dependiente Y. Cualquiera de los 27 modelos lineales y no lineales pueden ser ajustados, usando mnimos cuadrados o un procedimiento de estimacin resistente. Pruebas son corridas para determinar la significancia estadstica del modelo. El modelo ajustado es graficado con lmites de confianza y/o limites de prediccin, y los residuos son graficados tambin. Los clculos realizados son un subconjunto de aqullos realizados en el procedimiento de Regresin Simple. Aunque, la salida es ajustada a una sola pagina.

Ejemplo StatFolio: curvefitsnapstat.sgp Datos del Ejemplo:


El archivo nonlin.sf3 contiene datos de clorina disponible en muestras de un producto como una funcin del numero de semanas desde que fue producido. Los datos, de Draper y Smith (1998), consisten de n = 44 muestras, una porcin de las cuales es mostrada enseguida: Semanas 8 8 10 10 10 10 12 12 12 12 14 14 14 Clorina 0.49 0.49 0.48 0.47 0.48 0.47 0.46 0.46 0.45 0.43 0.45 0.43 0.43

2005 por StatPoint, Inc.

Ajustando Curva SnapStat - 1

STATGRAPHICS Rev. 9/14/2006

Entrada de Datos
La caja de dialogo de entrada requiere los nombres de las columnas que contienen la variable dependiente Y y la variable independiente X:

Y: columna numrica que contiene las n observaciones para la variable dependiente Y. X: columna numrica que contiene los n valores para la variable independiente X. Seleccin: Seleccin de un subconjunto de los datos.

2005 por StatPoint, Inc.

Ajustando Curva SnapStat - 2

STATGRAPHICS Rev. 9/14/2006

Salida
La salida del SnapStat consiste de una sola pagina de estadsticas graficas y numricas.
SnapStat: Ajuste de Curva chlorine = 0.48551 - 0.00271679*weeks Intercepto Pendiente Estimado 0.48551 -0.00271679 Valor-P 0.0000 0.0000 chlorine

Grfico del Modelo Ajustado Con intervalos de previsin del 99.0% Lmites de Prediccin 0.5 0.48 0.46 0.44 0.42 0.4 0.38 0 10 20 30 weeks 40 50

Coeficiente de Correlacin = -0.8651 R-cuadrada = 74.83 porciento R-cuadrado (ajustado para g.l.) = 74.23 porciento Error Estndar Est. = 0.015385 Error Absoluto medio = 0.012834 Estadstico Durbin-Watson = 0.992081 (P=0.0001) Autocorrelacin de residuos en Retraso 1 = 0.451981

Grfico de Residuos chlorine = 0.48551 - 0.00271679*weeks 2.1 Rediduo Estudentizado 1.1 0.1 -0.9 -1.9 0 10 20 30 weeks 40 50

X 0.0 10 20 30 40 50 X 0.0 10 20 30 40 50

Predicho Y 0.48551 0.458342 0.431175 0.404007 0.376839 0.349671 Predicho Y 0.48551 0.458342 0.431175 0.404007 0.376839 0.349671

Lmite de Pred. Inferior 99.0% 0.441062 0.415599 0.389169 0.361723 0.333279 0.303921 Lmite de Conf. Inferior 99.0% 0.469617 0.448146 0.424742 0.395954 0.363634 0.330437

Lmite de Pred. Superior 99.0% 0.529959 0.501086 0.47318 0.44629 0.420398 0.39542 Lmite de Conf. Superior 99.0% 0.501404 0.468539 0.437607 0.41206 0.390044 0.368905

Grfico de chlorine 0.5 0.48 observado 0.46 0.44 0.42 0.4 0.38 0.38 0.4 0.42 0.44 0.46 0.48 0.5 predicho Rediduo Estudentizado 2.1 1.1 0.1 -0.9 -1.9

Grfico de Residuos chlorine = 0.48551 - 0.00271679*weeks

10

20 30 nmero de fila

40

50

2005 por StatPoint, Inc.

Ajustando Curva SnapStat - 3

STATGRAPHICS Rev. 9/14/2006

Modelo Estadstico (Izquierda superior)


La parte superior izquierda de la salida muestra el modelo estadstico ajustado y estadsticas del resumen. Incluidos estn: Modelo Ajustado: Identificacin del modelo que fue ajustado. Por defecto, un modelo lineal de la forma Y=a+bX (1)

Es ajustado, aunque un modelo diferente puede ser seleccionado usando Opciones del Anlisis. Coeficientes: Los coeficientes estimados y P-valores que resultan de la pruebas t de las hiptesis nulas que corresponden a que el parmetro del modelo sea igual a 0. P-Valores pequeos (menores que 0.05 si se opera a un nivel de confianza del 95%) indican que un coeficiente del modelo es significativamente distinto de 0. En los datos del ejemplo, ambos intercepto y pendiente son estadsticamente significantes. Estadsticas: Resumen de las estadsticas para el modelo ajustado, incluyendo: Coeficiente de correlacin- Mide la fuerza de la relacin lineal entre Y y X en una escala de1 (correlacin lineal negativa perfecta) a +1 (correlacin lineal positiva perfecta). En los datos del ejemplo, la correlacin entre chlorine y weeks es relativamente fuerte, con el signo negativo indicando que la chlorine cae como las weeks crecen. R-cuadrada Representa el porcentaje de variabilidad en Y el cual ha sido explicado por el modelo ajustado, en una escala de 0% a 100%. Para los datos del ejemplo, la regresin ha acumulado alrededor del 75% de variabilidad en las medidas de chlorine. El restante 25% es atribuido a las desviaciones alrededor de la lnea, lo cual puede ser debido a otros factores, para mediar el error, o una falla del modelo lineal para ajustar los datos. R-cuadrada Ajustada El estadstico R-cuadrada, ajustado por el nmero de coeficientes en el modelo. Este valor es frecuentemente usado para comparar modelos con diferente nmero de coeficientes. Error Estndar de Est. la desviacin estndar estimada de los residuos (la desviacin estndar alrededor del modelo). Este valor es usado para crear lmites de prediccin para observaciones nuevas. Media del Error Absoluto El valor absoluto promedio de los residuos. Estadstico Durbin-Watson Una medida de la correlacin serial en los residuos. Si los residuos varan aleatoriamente, este valor debera ser cercano a 2. Un P-valor pequeo indica que un patrn no aleatorio existe en los residuos. Para datos registrados en el tiempo, un Pvalor pequeo indicara que alguna tendencia en el tiempo no ha sido tomada en cuenta. En el ejemplo actual, un P-valor pequeo es indicador de que el modelo lineal no ha ajustado bien a todos los datos, esto tan bien puede ser visto en los residuos graficados.

2005 por StatPoint, Inc.

Ajustando Curva SnapStat - 4

STATGRAPHICS Rev. 9/14/2006 Lag 1 Autocorrelacin Residual la correlacin estimada entre residuos consecutivos, en una escala de 1 a 1. Valores lejanos de 0 indican que una estructura significante permanece no tomada en cuenta por el modelo.

Opciones del Anlisis

Tipo de Modelo: El modelo que ser estimado. Todos los modelos mostrados pueden ser linealizados transformando X, Y, o ambos. Cuando ajustamos un modelo no lineal, STATGRAPHICS primero transforma los datos, despus se ajusta el modelo, y entonces invierte la transformacin para desplegar los resultados. Ajuste Alternativo: Un procedimiento de estimacin alternativo. Si se selecciona, un conjunto adicional de estimadores sern adheridos a la salida. Dos mtodos de estimacin son disponibles, ambos de los cuales son resistentes a datos atpicos: Minimizar desviaciones absolutas Minimiza la suma de los valores absolutos de las desviaciones alrededor del modelo ajustado. Uso de medianas de 3 grupos Usa el mtodo de Tukey de ajustar una lnea recta, en la cual los datos son divididos en 3 grupos de acuerdo al valor de X, las medianas son calculadas dentro de cada grupo, y una lnea es determinada de las 3 medianas.

Los modelos disponibles son mostrados en la siguiente tabla:

2005 por StatPoint, Inc.

Ajustando Curva SnapStat - 5

STATGRAPHICS Rev. 9/14/2006


Modelo Lineal Raz cuadrada-Y Exponencial Reciproco-Y Cuadrada-Y Raz cuadrada-X Doble raz cuadrada Log-Y raz cuadrada-X Reciproco-Y raz cuadrada-X Cuadrada-Y raz cuadrada-X Logartmica-X Raz cuadrada-Y log-X Multiplicativa Reciproco-Y log-X Ecuacin

y = 0 + 1 x

Transformacin en Y ninguna
2

Transformacin en X ninguna ninguna ninguna ninguna ninguna raz cuadrada raz cuadrada raz cuadrada raz cuadrada raz cuadrada Logaritmo Logaritmo Logaritmo Logaritmo

y = ( 0 + 1 x )

Raz cuadrada Logaritmo


1

y = e( 0 +1x ) y = ( 0 + 1 x )
y = 0 + 1 x
y = 0 + 1 x

reciproco cuadrada ninguna

y = 0 + 1 x y = e ( 0 + 1 x ) y = 0 + 1 x

) )

raz cuadrada Logaritmo

reciproco cuadrada ninguna


2

y = 0 + 1 x

y = ( 0 + 1 ln( x) )
y = 0 x 1
y= 1

y = 0 + 1 ln( x )

raz cuadrada Logaritmo reciproco

0 + 1 ln( x)
cuadrada ninguna
2

Cuadrada-Y log-X Reciproco-X Raz cuadrada-Y reciprocoX S-curve Doble reciproco Cuadrada-Y reciproco-X Cuadrada-X Raz cuadrada-Y cuadrada-X Log-Y cuadrada-X Reciproco-Y cuadrada-X Doble cuadrada Logstico

y = 0 + 1 ln( x) y = 0 + 1 / x

Logaritmo reciproco reciproco reciproco reciproco reciproco cuadrada cuadrada cuadrada cuadrada cuadrada ninguna

y = ( 0 + 1 / x ) y = e( 0 + 1 / x ) y = [ 0 + / x ]
y = 0 + 1 x 2
2 y = e ( 0 + 1 x )

raz cuadrada Logaritmo

reciproco cuadrada ninguna

y = 0 + 1 / x
y = ( 0 + 1 x 2 ) y = ( 0 + 1 x 2 )
2

raz cuadrada Logaritmo

reciproco cuadrada y/(1-y)

y = 0 + 1 x 2
y=

Log probit

y = ( 0 + 1 ln( x ))

[1 + e(

e( 0 + 1x )
0 + 1x )

1 ( y )

(inv. normal)

Logaritmo

2005 por StatPoint, Inc.

Ajustando Curva SnapStat - 6

STATGRAPHICS Rev. 9/14/2006

Grafica del Modelo Ajustado (derecha superior)


Este panel muestra el o los modelos ajustados, junto con lmites de confianza y prediccin. La grafica incluye: La lnea del mejor ajuste o la ecuacin de prediccin:

x =a +b y

(2)

Esta es la ecuacin que seria usada para predecir valores de la variable dependiente Y dados los valores de la variable independiente X. Note que hace un trabajo relativamente bueno de escoger mucha de la correlacin negativa entre chlorine y weeks. Intervalos de Confianza para la respuesta media en X. Estos son limites internos en la grafica anterior y describen que tan buena es la localizacin de la lnea que ha sido estimada dada la muestra de datos disponible. As como el tamao de la muestra n aumente, estos limites se harn mas delgados. Deberas notar que el ancho de los lmites vara como una funcin de X, con la lnea estimada ms precisamente cerca del valor promedio x . Limites de Prediccin para nuevas observaciones. Estos son limites externos en la grafica anterior y describen que tan bien se podra predecir donde una nueva observacin debera yacer. Sin importar el tamao de la muestra, nuevas observaciones variaran alrededor de la lnea verdadera con una desviacin estndar igual a .

La inclusin de limites de confianza y prediccin y su defecto nivel de confianza es determinado por lo fijado en la pestaa ANOVA/Regresin de la caja de dialogo Preferencias, accesible en el men Editar.

Grafica de Residuos (izquierda central)


La grafica en el centro izquierdo grafica los residuos de el modelo ajustado contra X. En una regresin los residuos son definidos por i ei = y i y (3)

i.e., los residuos son la diferencia entre los valores observados y el modelo ajustado. Dependiendo de lo fijado en la pestaa ANOVA/Regresin de la caja de dialogo Preferencias, accesible en el men Editar, t puedes graficar cualquiera de los siguientes: 1. Residuos Ordinarios Los residuos del ajuste de mnimos cuadrados. 2. Residuos Estandarizados La diferencia entre los valores observados yi y los valores i cuando el modelo es ajustado usando todas las observaciones excepto la ipredichos y esima, dividida por el error estndar estimado. Los residuos son algunas veces llamados residuos borrados externamente, ya que ellos miden que tan lejos este cada valor del modelo ajustado, cuando este modelo es ajustado usando todos los datos excepto los puntos que son considerados. Esto es importante, ya que un dato atpico grande puede afectar el modelo de tal forma que no parecera un valor inusual. 2005 por StatPoint, Inc. Ajustando Curva SnapStat - 7

STATGRAPHICS Rev. 9/14/2006

Pronsticos (derecha central)


La tabla en el centro derecho muestra predicciones del modelo ajustado en los valores seleccionados de X. Incluidos en la salida estn: X El valor de la variable independiente en el cual la prediccin ser hecha. Y Predicha- El valor predicho de la variable dependiente usando el modelo ajustado. Limites de Prediccin- Limites de prediccin para nuevas observaciones en el nivel de confianza seleccionado (corresponde a los limites exteriores de la grafica del modelo ajustado). Limites de Confianza- Limites de confianza para el valor medio de Y en el nivel de confianza seleccionado (corresponde a los limites interiores de la grafica del modelo ajustado).

Por ejemplo, en X = 30 weeks, la mejor prediccin de la cantidad media chlorine disponible es 0.404, aunque esto podra ser fcilmente cualquiera entre 0.396 y 0.412. Adicionalmente, uno podra predecir con un 95% de confianza que cualquier muestra despus de 30 de producida caera entre 0.362 y 0.446.

Observado contra Predicho (izquierda inferior)


La parte inferior izquierda muestra una grafica de los valores observados de Y contra los valores predichos por el modelo ajustado. Si el modelo ajusta bien, los puntos deberan estar aleatoriamente esparcidos alrededor de la lnea diagonal. Algunas veces es posible ver curvatura en esta grfica, lo cual indicara la necesidad de un modelo curvilneo en lugar de uno lineal. Cualquier cambio en la variabilidad de valores pequeos de X a valores grandes de X puede tambin indicar la necesidad de transformar la variable dependiente antes de ajustar el modelo. En la grafica anterior, la variabilidad parece ser bastante constante. Aunque, alguna evidencia de curvatura es presente.

Residuos Contra Nmero de Rengln (derecha inferior)


La parte derecha inferior muestra una grafica de observaciones contra numero de rengln el la hoja de datos. Cualquier patrn no aleatorio indicara un factor inexplicable en los datos. Esto podra ser debido a tendencias en el tiempo (si los datos estn en orden secuencial) o la necesidad de un modelo curvilneo (si la hoja de datos esta ordenada por X.

Clculos Para detalles en los clculos realizados, ver la documentacin de Regresin Simple.

2005 por StatPoint, Inc.

Ajustando Curva SnapStat - 8

También podría gustarte