Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Clase 4
Clase 4
Y = f (X)
REGRESION
Expresin cuantitativa de la naturaleza bsica de la relacin entre las variables dependiente e independiente. Determina si X e Y presentan una relacin positiva, es decir, si crecen o decrecen a la vez, o si la relacin es negativa porque se desplazan en sentidos opuestos.
CORRELACION
Mide la solidez de la relacin entre X e Y.
REGRESION
REGRESION SIMPLE: establece que la variable dependiente Y es funcin de una sola variable independiente. Y = f (X) REGRESION MULTIPLE: abarca dos o ms variables independientes. Y = f (X, W, Z)
REGRESION
REGRESION LINEAL: intenta reflejar la relacin entre X e Y por medio de una recta. REGRESION CURVILINEAL: cuando la relacin se puede describir mejor por medio de una curva.
ANALISIS DE REGRESION
Las relaciones entre variables son deterministas o estocsticas (aleatorias).
Y 0 1 X
(Componente Determinista) (Componente Aleatorio)
REGRESION y CORRELACION
DATOS DE PRODUCCION DE HARDWARE PARA COMPUTADORAS
DIA N UNIDADES DE DISCO COSTO
1 2 3 4 5
50 40 65 55 45
ANALISIS DE REGRESION
Y 0 1 X
Dado un valor cualquiera de X, el valor de Y se puede determinar con precisin.
ANALISIS DE REGRESION MODELO ESTOCASTICO: Contiene dos o ms componentes aleatorios que conducen al error de prediccin. Se expresa as:
Y 0 1 X
ANALISIS DE REGRESION
Estimacin de la recta verdadera de regresin de la poblacin: Y b0 b1 X e b0 y b1 son estimaciones de los parmetros 0 y 1 poblacionales Se denominan constante de regresin y coeficiente de regresin respectivamente. El ltimo trmino, e, es el componente de error, el cual es necesario porque no todas las observaciones de X e Y estn en lnea recta.
ANALISIS DE REGRESION
Estimacin de la relacin entre X e Y, mediante la recta de regresin:
b0 b1 X Y
: valor estimado de la variable Y dependiente, representado por un punto sobre la recta de regresin.
Yi
550 500 450 400 350 40 45 50 55 Unidades de disco 65 Error Error Error Error Error
60
70
(Yi
) Y
min
Se puede demostrar mediante el clculo diferencial que esta suma de errores al cuadrado ser mnima si se calculan las sumas de los cuadrados cruzados y de los productos cruzados.
( Y ) SSy (Yi Y ) Y n
2 2
SSxy ( X i X )(Yi Y )
( X )( Y ) SSxy XY n
SSxy b1 SSx
y b0 Y b1 X
Publicidad(X)
En miles de N So les
Pasajeros(Y)
En miles de personas
XY
150 204 104 391 160 315 140 280 456 170 176 234 368 150 192 3490
X2
100 144 64 289 100 225 100 196 361 100 121 169 256 100 144 2469
Y2
225 289 169 529 256 441 196 400 576 289 256 324 529 225 256 4960
10 12 8 17 10 15 10 14 19 10 11 13 16 10 12 187
15 17 13 23 16 21 14 20 24 17 16 18 23 15 16 268
SSx = 137.7333333 SSy = 171.733333 SSxy = 148.933333 b1= 1.0813166 o 1.08; b0= 4.3865 o 4.4
b0 b1 X Y
4.40 1.08 X Y
ANALISIS DE CORRELACION
Mide la fuerza de la relacin, que viene dada por el coeficiente de determinacin. El coeficiente de determinacin es una de las medidas de bondad de ajuste. Para ello debemos considerar la desviacin total de Y. La desviacin total es la cantidad en que un valor real de Y, Yi difiere de , media de todos los valores de la variable dependiente.
ANALISIS DE CORRELACION
Desviacin explicada es la diferencia entre el valor predicho por el modelo ( Y y el valor medio de ) Y : Y (Y ) Y
La desviacin no explicada es la diferencia entre el valor real de (Yi ) y el valor predicho por el modelo : ) Yi Y (Y
ANALISIS DE CORRELACION
Y ) (Yi Y ) (Yi Y ) (Y
ANALISIS DE CORRELACION
Y
Yi 23
Desviacin total
Desviacin no explicada
4.4 1.08x Y
(Yi Y ) 5.13
Y 17.87
) 1.32 (Yi Y
21.68 Y
Desviacin explicada
Y ) 3.81 (Y
4.4 X
ANALISIS DE CORRELACION
Suma total de cuadrados (o suma cuadrtica de la desviacin total, SST) es: 2 SST (Yi Y ) Suma de cuadrados de la regresin (o suma cuadrtica de la regresin, SSR) es: Suma de cuadrados de error (o suma de errores cuadrticos, SSE) es: 2 SSE (Yi Y )
2 SSR (Y Y )
ANALISIS DE CORRELACION
Coeficiente de determinacin, r2, mide la parte de la desviacin total de Y que es explicada por nuestro modelo. Es una medida del poder explicativo del modelo de regresin.
Desviacin exp licada SSR r Variacin total SST
2
ANALISIS DE CORRELACION
Coeficiente de determinacin, mide el poder explicativo del modelo de regresin, es decir, la parte de la variacin de Y explicada por la variacin de X.
El valor de r2 se encuentra entre 0 y 1, puesto que es imposible explicar ms del 100% de variacin de Y.
ANALISIS DE CORRELACION
Si r2 =70%, significa que el 70% de la variacin de Y est explicada por las variaciones de X. Cuanto mayor sea r2, mayor poder explicativo tiene el modelo. De esta forma r2 mide la fuerza de la relacin lineal entre X e Y. r2 slo tiene significado para relaciones lineales.
ANALISIS DE CORRELACION
Conocer la solidez de la relacin entre publicidad y pasajeros de LAN, es decir hasta que punto puede confiar en ella para tomar decisiones.
2 2 ( SSxy ) ( 148 . 9333 ) r2 ( SSx)(SSy) (137.73333)(171.73333)
r 2 0.93776 0.94
Interpretacin: El coeficiente de determinacin revela que el 94% de la variacin del N de pasajeros es explicado (no causado) por las variaciones de gasto en publicidad.
ANALISIS DE CORRELACION
La correlacin no implica causalidad. Una variacin de X no es la causa de una variacin de Y. Como r2 = 94%, nuestro modelo explica el 94% de la variacin de Y. El otro 6% puede ser explicado por alguna otra variable o variables distintas de la publicidad. Este 6% se denomina a veces coeficiente de no determinacin, k2
ANALISIS DE CORRELACION
Coeficiente de correlacin (r) denominado coeficiente de correlacin producto-momento de Pearson, es igual a la raz cuadrada del coeficiente de determinacin: 2 r r 0.93776 0.96838
El valor de r se sita en el intervalo de +1 y 1. Si r > 0, b1 ser positivo y la recta tendr pendiente ascendente. Si r < 0, b1 ser negativo y la recta tendr pendiente negativa.