Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Ajuste de Curva SnapStat
Ajuste de Curva SnapStat
9/14/2006
Entrada de Datos
La caja de dialogo de entrada requiere los nombres de las columnas que contienen la variable dependiente Y y la variable independiente X:
Y: columna numrica que contiene las n observaciones para la variable dependiente Y. X: columna numrica que contiene los n valores para la variable independiente X. Seleccin: Seleccin de un subconjunto de los datos.
Salida
La salida del SnapStat consiste de una sola pagina de estadsticas graficas y numricas.
SnapStat: Ajuste de Curva chlorine = 0.48551 - 0.00271679*weeks Intercepto Pendiente Estimado 0.48551 -0.00271679 Valor-P 0.0000 0.0000 chlorine
Grfico del Modelo Ajustado Con intervalos de previsin del 99.0% Lmites de Prediccin 0.5 0.48 0.46 0.44 0.42 0.4 0.38 0 10 20 30 weeks 40 50
Coeficiente de Correlacin = -0.8651 R-cuadrada = 74.83 porciento R-cuadrado (ajustado para g.l.) = 74.23 porciento Error Estndar Est. = 0.015385 Error Absoluto medio = 0.012834 Estadstico Durbin-Watson = 0.992081 (P=0.0001) Autocorrelacin de residuos en Retraso 1 = 0.451981
Grfico de Residuos chlorine = 0.48551 - 0.00271679*weeks 2.1 Rediduo Estudentizado 1.1 0.1 -0.9 -1.9 0 10 20 30 weeks 40 50
X 0.0 10 20 30 40 50 X 0.0 10 20 30 40 50
Predicho Y 0.48551 0.458342 0.431175 0.404007 0.376839 0.349671 Predicho Y 0.48551 0.458342 0.431175 0.404007 0.376839 0.349671
Lmite de Pred. Inferior 99.0% 0.441062 0.415599 0.389169 0.361723 0.333279 0.303921 Lmite de Conf. Inferior 99.0% 0.469617 0.448146 0.424742 0.395954 0.363634 0.330437
Lmite de Pred. Superior 99.0% 0.529959 0.501086 0.47318 0.44629 0.420398 0.39542 Lmite de Conf. Superior 99.0% 0.501404 0.468539 0.437607 0.41206 0.390044 0.368905
Grfico de chlorine 0.5 0.48 observado 0.46 0.44 0.42 0.4 0.38 0.38 0.4 0.42 0.44 0.46 0.48 0.5 predicho Rediduo Estudentizado 2.1 1.1 0.1 -0.9 -1.9
10
20 30 nmero de fila
40
50
Es ajustado, aunque un modelo diferente puede ser seleccionado usando Opciones del Anlisis. Coeficientes: Los coeficientes estimados y P-valores que resultan de la pruebas t de las hiptesis nulas que corresponden a que el parmetro del modelo sea igual a 0. P-Valores pequeos (menores que 0.05 si se opera a un nivel de confianza del 95%) indican que un coeficiente del modelo es significativamente distinto de 0. En los datos del ejemplo, ambos intercepto y pendiente son estadsticamente significantes. Estadsticas: Resumen de las estadsticas para el modelo ajustado, incluyendo: Coeficiente de correlacin- Mide la fuerza de la relacin lineal entre Y y X en una escala de1 (correlacin lineal negativa perfecta) a +1 (correlacin lineal positiva perfecta). En los datos del ejemplo, la correlacin entre chlorine y weeks es relativamente fuerte, con el signo negativo indicando que la chlorine cae como las weeks crecen. R-cuadrada Representa el porcentaje de variabilidad en Y el cual ha sido explicado por el modelo ajustado, en una escala de 0% a 100%. Para los datos del ejemplo, la regresin ha acumulado alrededor del 75% de variabilidad en las medidas de chlorine. El restante 25% es atribuido a las desviaciones alrededor de la lnea, lo cual puede ser debido a otros factores, para mediar el error, o una falla del modelo lineal para ajustar los datos. R-cuadrada Ajustada El estadstico R-cuadrada, ajustado por el nmero de coeficientes en el modelo. Este valor es frecuentemente usado para comparar modelos con diferente nmero de coeficientes. Error Estndar de Est. la desviacin estndar estimada de los residuos (la desviacin estndar alrededor del modelo). Este valor es usado para crear lmites de prediccin para observaciones nuevas. Media del Error Absoluto El valor absoluto promedio de los residuos. Estadstico Durbin-Watson Una medida de la correlacin serial en los residuos. Si los residuos varan aleatoriamente, este valor debera ser cercano a 2. Un P-valor pequeo indica que un patrn no aleatorio existe en los residuos. Para datos registrados en el tiempo, un Pvalor pequeo indicara que alguna tendencia en el tiempo no ha sido tomada en cuenta. En el ejemplo actual, un P-valor pequeo es indicador de que el modelo lineal no ha ajustado bien a todos los datos, esto tan bien puede ser visto en los residuos graficados.
STATGRAPHICS Rev. 9/14/2006 Lag 1 Autocorrelacin Residual la correlacin estimada entre residuos consecutivos, en una escala de 1 a 1. Valores lejanos de 0 indican que una estructura significante permanece no tomada en cuenta por el modelo.
Tipo de Modelo: El modelo que ser estimado. Todos los modelos mostrados pueden ser linealizados transformando X, Y, o ambos. Cuando ajustamos un modelo no lineal, STATGRAPHICS primero transforma los datos, despus se ajusta el modelo, y entonces invierte la transformacin para desplegar los resultados. Ajuste Alternativo: Un procedimiento de estimacin alternativo. Si se selecciona, un conjunto adicional de estimadores sern adheridos a la salida. Dos mtodos de estimacin son disponibles, ambos de los cuales son resistentes a datos atpicos: Minimizar desviaciones absolutas Minimiza la suma de los valores absolutos de las desviaciones alrededor del modelo ajustado. Uso de medianas de 3 grupos Usa el mtodo de Tukey de ajustar una lnea recta, en la cual los datos son divididos en 3 grupos de acuerdo al valor de X, las medianas son calculadas dentro de cada grupo, y una lnea es determinada de las 3 medianas.
y = 0 + 1 x
Transformacin en Y ninguna
2
Transformacin en X ninguna ninguna ninguna ninguna ninguna raz cuadrada raz cuadrada raz cuadrada raz cuadrada raz cuadrada Logaritmo Logaritmo Logaritmo Logaritmo
y = ( 0 + 1 x )
y = e( 0 +1x ) y = ( 0 + 1 x )
y = 0 + 1 x
y = 0 + 1 x
y = 0 + 1 x y = e ( 0 + 1 x ) y = 0 + 1 x
) )
y = 0 + 1 x
y = ( 0 + 1 ln( x) )
y = 0 x 1
y= 1
y = 0 + 1 ln( x )
0 + 1 ln( x)
cuadrada ninguna
2
Cuadrada-Y log-X Reciproco-X Raz cuadrada-Y reciprocoX S-curve Doble reciproco Cuadrada-Y reciproco-X Cuadrada-X Raz cuadrada-Y cuadrada-X Log-Y cuadrada-X Reciproco-Y cuadrada-X Doble cuadrada Logstico
y = 0 + 1 ln( x) y = 0 + 1 / x
Logaritmo reciproco reciproco reciproco reciproco reciproco cuadrada cuadrada cuadrada cuadrada cuadrada ninguna
y = ( 0 + 1 / x ) y = e( 0 + 1 / x ) y = [ 0 + / x ]
y = 0 + 1 x 2
2 y = e ( 0 + 1 x )
y = 0 + 1 / x
y = ( 0 + 1 x 2 ) y = ( 0 + 1 x 2 )
2
y = 0 + 1 x 2
y=
Log probit
y = ( 0 + 1 ln( x ))
[1 + e(
e( 0 + 1x )
0 + 1x )
1 ( y )
(inv. normal)
Logaritmo
x =a +b y
(2)
Esta es la ecuacin que seria usada para predecir valores de la variable dependiente Y dados los valores de la variable independiente X. Note que hace un trabajo relativamente bueno de escoger mucha de la correlacin negativa entre chlorine y weeks. Intervalos de Confianza para la respuesta media en X. Estos son limites internos en la grafica anterior y describen que tan buena es la localizacin de la lnea que ha sido estimada dada la muestra de datos disponible. As como el tamao de la muestra n aumente, estos limites se harn mas delgados. Deberas notar que el ancho de los lmites vara como una funcin de X, con la lnea estimada ms precisamente cerca del valor promedio x . Limites de Prediccin para nuevas observaciones. Estos son limites externos en la grafica anterior y describen que tan bien se podra predecir donde una nueva observacin debera yacer. Sin importar el tamao de la muestra, nuevas observaciones variaran alrededor de la lnea verdadera con una desviacin estndar igual a .
La inclusin de limites de confianza y prediccin y su defecto nivel de confianza es determinado por lo fijado en la pestaa ANOVA/Regresin de la caja de dialogo Preferencias, accesible en el men Editar.
i.e., los residuos son la diferencia entre los valores observados y el modelo ajustado. Dependiendo de lo fijado en la pestaa ANOVA/Regresin de la caja de dialogo Preferencias, accesible en el men Editar, t puedes graficar cualquiera de los siguientes: 1. Residuos Ordinarios Los residuos del ajuste de mnimos cuadrados. 2. Residuos Estandarizados La diferencia entre los valores observados yi y los valores i cuando el modelo es ajustado usando todas las observaciones excepto la ipredichos y esima, dividida por el error estndar estimado. Los residuos son algunas veces llamados residuos borrados externamente, ya que ellos miden que tan lejos este cada valor del modelo ajustado, cuando este modelo es ajustado usando todos los datos excepto los puntos que son considerados. Esto es importante, ya que un dato atpico grande puede afectar el modelo de tal forma que no parecera un valor inusual. 2005 por StatPoint, Inc. Ajustando Curva SnapStat - 7
Por ejemplo, en X = 30 weeks, la mejor prediccin de la cantidad media chlorine disponible es 0.404, aunque esto podra ser fcilmente cualquiera entre 0.396 y 0.412. Adicionalmente, uno podra predecir con un 95% de confianza que cualquier muestra despus de 30 de producida caera entre 0.362 y 0.446.
Clculos Para detalles en los clculos realizados, ver la documentacin de Regresin Simple.