Está en la página 1de 7

Curso: Estadstica II Recopilado: Ing.

Perci Huaringa


UNIDAD V




















Relaciones entre variables. Tipos de relaciones.
Anlisis de regresin simple.
El diagrama de dispersin.
Regresin lineal simple. Ecuacin de la lnea recta.
Anlisis de correlacin.
Coeficiente de determinacin.
Curso: Estadstica II Recopilado: Ing. Perci Huaringa

ANLISIS DE REGRESIN

Terminologa usada por Fracis Galton en su libro Familia Likeness in Statura, 1986:
Existe una tendencia de los padres alta estatura a tener hijos altos y de padres bajos
a tener hijos de bajo estatura y la distribucin de estaturas no cambiar
sustancialmente de generacin en generacin. En la Ley de regresin Universal de
Galton fue confirmada por Kart Pearson en Biomtrica, 1903, que los hijos de
padres altos el promedio era menor que la de los padres y la estatura promedio de
los hijos de un grupo de padres bajos, era mayor que el de sus padres, o sea,
Regresando o Regresando a la mediocridad.
El anlisis de regresin trata de la dependencia de una variable Y, la variable
dependiente, en una o ms variables independientes (explicatorias) X , con el objeto
de estimar o predecir, la media o valor promedio poblacional.
Ejemplos de regresin:
- La Ley de la Regresin Universal de Galton
- Dependencia de los Gastos (G) de consumo personal en relacin con el
ingreso (X)
- Relacin de dependencia entre la produccin de cosecha de trigo y la
temperatura ambiente, etc.
- Otros

Dependencia Estadstica versus dependencia Funcional
El anlisis de regresin se ocupa de lo que se conoce como dependencia estadstica
entre variable (manejamos variables aleatorias o estocsticas permiten errores
es decir tienen distribuciones de probabilidad) y no dependencia funcional o
determinstica propia de la Fsica (variables no aleatorias ni estocsticas).

Regresin y Causalidad
El anlisis de regresin se ocupa de la dependencia de una variable con otras y no
implica necesariamente causalidad. Una relacin estadstica por ms fuerte y
sugerente que sea, no puede nunca establecer una conexin causal, nuestras ideas
de causalidad deben venir de fuera de la estadstica, en ltima instancia de una u
otra teora.
Para aducir causalidad se debe apelar a consideraciones tericas o apriorsticas

Curso: Estadstica II Recopilado: Ing. Perci Huaringa



Regresin y Correlacin
El anlisis de correlacin es conceptualmente muy distinto del anlisis de regresin.
El anlisis de correlacin su objetivo es medir la fuerza o el grado de asociacin
lineal entre dos variables, se tratan a las dos variables simtricamente, no hay
distincin alguna entre variables dependientes y explicatorios (independientes).
El anlisis de regresin existe asimetra en la forma como se tratan las variables
dependientes y explicatorios. Se supone que la variable dependiente es estadstica,
aleatoria o estocstica, es decir, tiene una distribucin de probabilidades. Las
variables explicatorios X tienen valores fijos (en repetidas muestras). Es decir la
variable dependiente Y es estocstica mientras las variables explicatorios son fijas
o no estocsticas.

Terminologa y notacin
El anlisis formal de la teora de la regresin es:

Y X
Variable dependiente Variable explicatoria
Variable explicada Variable independiente
Predecida Variable de control o estmulo
Regresada Predictor
Respuesta Regresor
y = f(x)


Estimacin de la Lnea de Regresin

Y =
1
+
2
X +
i

Variable dependiente
Variable independiente
Pendiente de la lnea
Interseccin con Y
Perturbacin estocstica
Curso: Estadstica II Recopilado: Ing. Perci Huaringa

Y: variable dependiente
X: variable independiente
Nro. Y
i
X
i
X
2
i
X
i
Y
i
Y
2
i

i
y
( )
2
y y
i
( )
2
y y
i
=e
2
i

1 Y
1
X
1
X
2
1
X
1
Y
1
Y
2
1


2 Y
2
X
2
X
2
2
X
2
Y
2
Y
2
2


3 Y
3
X
3
X
2
3
X
3
Y
3
Y
2
3


. . . . . .

. . . . . .

n Y
n
X
n
X
2
n
X
n
Y
n
Y
2
n


Suma EY
i
EX
i
EX
2
i
EX
i
Y
i
EY
2
i


Promedio




Estimadores de la lnea de regresin encontrados por el mtodo de los mnimos
cuadrados ordinarios.
( )( )
( )

=
2
2
2

i
i
i i i i
x x n
y x y x n
|


x y
2 1

| | =


i i i
e x y + + =
2 1

| |

Error estndar del valor estimado o error estndar de la regresin ( o
)
2

=

N
e i
o
Curso: Estadstica II Recopilado: Ing. Perci Huaringa

Coeficiente de Determinacin o una medida de la Bondad de ajuste ( R
2
)
El coeficiente de determinacin ( R
2
) es una medida de resumen que nos dice que
tan bien la lnea de regresin muestral se ajuste los datos.
R
2
mide la proporcin o el porcentaje de la variacin total en Y explicada por el
modelo de regresin. Propiedades:
- Es una cantidad no negativa.
- Sus lmites son 0 R
2
1. Un r
2
de 1 significa un ajuste perfecto, es
decir,
i i
y y =
, para cada i. por otra parte r
2
es cero significa que no hay
relacin alguna entre la variable dependiente y la variable explicativa ( es
decir
2
= 0).

Coeficiente de correlacin ( r )
Mide la fuerza o el grado de asociacin lineal entre dos variables.

2
R r =
( )( )
( ) | | ( ) | |


=
2
2
2
2
i
i
i
i
i i i i
y y n x x n
y x y x n
r


Propiedades de r:
- Puede ser positivo y negativo, su signo depender del signo del numerador,
que mide la covarianza de las dos variables.
- Tiene como lmites -1 r

1
- Es de naturaleza simtrica, la correlacin r
xy
es igual a la correlacin de r
yx

- Es independiente del origen y de la escala
- Si x e y son estadsticamente independientes ( r = 0)
- Es una medida de asociacin lineal o dependencia lineal nicamente. No
tiene sentido utilizarlo para describir relaciones no lineales.
- Mide la relacin lineal entre dos variables, no necesariamente implica causa
efecto.



Curso: Estadstica II Recopilado: Ing. Perci Huaringa

1. En una compaa de seguros se desea determinar la relacin entre la
experiencia en ventas y el volumen de las mismas. Se selecciona una
muestra aleatoria de nueve vendedores; se encuentra que sus aos de
experiencia (X) y ventas normales (Y) son los siguientes:
Aos 1 2 3 4 5 6 7 8 9
Ventas anuales 2 1 3 3 4 5 6 5 7

2. Se realiza un experimento para determinar la relacin entre la precipitacin
pluvial (X) y el rendimiento de trigo (Y). Supngase que se obtienen los
siguientes datos.
Precipitacin pluvial en pulgadas 1 2 3 4 5 5 6 7 8 9
Rendimiento de trigo en bushel 1 3 2 5 5 4 7 6 9 8

3. Se tiene un registro de los costos de mantenimiento para seis mquinas
idnticas de distintas edades. Por parte de la gerencia de desea determinar
si existe una relacin funcional entre la edad de la mquinas (X) y el costo de
mantenimiento (Y). se obtienen los siguientes datos
Mquina
Edad de las
mquinas
(aos)
Costo de
mantenimiento
($)
1 2 70
2 1 40
3 3 100
4 2 80
5 1 30
6 3 100

4. El registro de un distrito escolar muestra los siguientes datos
correspondientes a los profesores que renuncian voluntariamente.
Nro. de aos de servicio (X) 15 9 13 11 12
Nro. de los han renunciado voluntariamente (Y) 10 16 14 15 15

En todos los casos a) Dibujar el diagrama de dispersin, b) Estimar la lnea de
regresin c) Calcular el coeficiente de determinacin ( R
2
) y coeficiente de
Curso: Estadstica II Recopilado: Ing. Perci Huaringa

correlacin (r), d) En cada caso interprete y analice de acuerdo a cada caso
presentado.