Está en la página 1de 35

CORRELACIN

REGRESIN LINEAL SIMPLE

DIRECCIN DE INVESTIGACIN UNIVERSIDAD CSAR VALLEJO


CAPACIDADES:

Analiza el coeficiente de correlacin de Pearson para dos variables


cuantitativas y los coeficientes para el modelo de regresin lineal simple.

TEMTICA:

Aplicaciones con el diagrama de dispersin.


Coeficiente de correlacin lineal de Pearson.
Modelo de regresin lineal simple (Uso de software estadstico o EXCEL).
Informe Estadstico: Anlisis (discusin).

DIRECCIN DE INVESTIGACIN UNIVERSIDAD CSAR VALLEJO


CORRELACIN

DIRECCIN DE INVESTIGACIN UNIVERSIDAD CSAR VALLEJO


CORRELACIN LINEAL
MIDE LA RELACIN ENTRE DOS VARIABLES.

Ejemplos:

Horas de estudio (X) Calificacin obtenida (Y)


N Libros ledos (X) N Errores ortogrficos (Y)
Inversin en Medidas preventivas (X) N de Lesiones (Y)
Edad (X) Gasto Mensual (Y)
ndice de Contaminacin(X) Tasa de Enfermedades(Y)

DIRECCIN DE INVESTIGACIN UNIVERSIDAD CSAR VALLEJO


Correlacin Lineal - Tendencias

DIRECCIN DE INVESTIGACIN UNIVERSIDAD CSAR VALLEJO


Correlacin Positiva
Significa que individuos que tienen puntuaciones
ALTAS en una variable, tienden a obtener
puntuaciones ALTAS en la otra variable y viceversa.

G
A
N
A
N
C
I
A
S

VENTAS

DIRECCIN DE INVESTIGACIN UNIVERSIDAD CSAR VALLEJO


Correlacin Negativa
Significa que individuos que tienen puntuaciones
ALTAS en una variable, tienden a obtener
puntuaciones BAJAS en la otra variable y viceversa.

E
M
B
A
R
A
Z
O
S

INVERSIN EN ANTICONCEPTIVOS

DIRECCIN DE INVESTIGACIN UNIVERSIDAD CSAR VALLEJO


Correlacin Nula
Significa que no existe dependencia entre las variables.

P G
a a
r n
t a
i d
d o
o s
s

Calificaciones

DIRECCIN DE INVESTIGACIN UNIVERSIDAD CSAR VALLEJO


DIAGRAMA DE
DISPERSIN

Representacin en un
sistema de
coordenadas
rectangulares, donde
(X, Y) son los valores
de las variables
correlacionadas.

DIRECCIN DE INVESTIGACIN UNIVERSIDAD CSAR VALLEJO


Grado de relacin entre las variables
Coeficiente de Correlacin de Pearson R
El coeficiente de correlacin de Pearson, indica la fuerza y la
direccin de una relacin lineal entre dos variables aleatorias. Se
considera que dos variables cuantitativas estn correlacionadas
cuando los valores de una de ellas varan sistemticamente con
respecto a los valores de la otra.

=

n: Nmero de datos

DIRECCIN DE INVESTIGACIN UNIVERSIDAD CSAR VALLEJO


Grado de relacin entre las variables
Coeficiente de Correlacin de Pearson R
Indica si los puntos tienen una tendencia a disponerse
alineadamente (excluyendo rectas horizontales y
verticales).
El valor R est acotado en [-1; 1].
Si est cercana a -1, indica que las variables estn
relacionadas en forma inversa, si est cercana a +1, la
relacin es directa y si est cercana a 0, las variables no
estn relacionadas.
Cuanto ms cerca est R de -1 o +1 mejor ser el grado
de relacin lineal. Siempre que no existan observaciones
atpicas.
DIRECCIN DE INVESTIGACIN UNIVERSIDAD CSAR VALLEJO
Grado de relacin entre las variables
Coeficiente de Correlacin de Pearson R
Mide el grado de asociacin lineal entre 2 variables.
Oscila entre -1 y 1.

Valor de R Interpretacin
0 Ausencia de Correlacin Lineal
0 < R 0,20 Correlacin Lineal Insignificante
0,20 < R 0,40 Correlacin Lineal Leve
0,40 < R 0,60 Correlacin Lineal Regular
0,60 < R 0,80 Correlacin Lineal Alta
0,80 < R < 1 Correlacin Lineal Muy Alta
1 Correlacin Lineal Perfecta

DIRECCIN DE INVESTIGACIN UNIVERSIDAD CSAR VALLEJO


Coeficiente de Correlacin de Pearson R
Ejemplo:
El jefe de personal de una empresa cree que existe una relacin
entre la ausencia al trabajo y la edad del empleado. Tom en
cuenta la edad de 10 trabajadores y contabiliz los das de
ausencia en un ao:
Edad 25 50 35 20 45 50 30 40 62 40

N das de
20 5 10 20 8 2 15 12 1 8
ausencia

- Trace el diagrama de dispersin.


- Determine el grado de relacin lineal
entre estas 2 variables.

DIRECCIN DE INVESTIGACIN UNIVERSIDAD CSAR VALLEJO


Coeficiente de Correlacin de Pearson R
Ejemplo:
- Diagrama de dispersin, en el plano cartesiano:

- En el eje X a la variable que influye sobre la otra: X Edad


- En el eje Y a la variable que depende de la variable X: Y N das de ausencia

N
a
u
d
s

e
a
n
s
c
i
d
a
e

Edad

DIRECCIN DE INVESTIGACIN UNIVERSIDAD CSAR VALLEJO


Coeficiente de Correlacin de Pearson R
Ejemplo:
- Para calcular el valor de R:
N das de
Edad XY X2 Y2
- 1 Realizamos los clculos de ausencia
25 20 500 625 400
XY (cada valor de X 50 5 250 2500 25
multiplicado por su respectivo 35 10 350 1225 100
20 20 400 400 400
valor Y), X (cada valor de X al
45 8 360 2025 64
cuadrado) y Y (cada valor de Y 50 2 100 2500 4
30 15 450 900 225
al cuadrado); tal como se
40 12 480 1600 144
observa en la tabla adjunta. 62 1 62 3844 1
- 2 Se procede a sumar los 40 8 320 1600 64
397 101 3272 17219 1427
totales de cada columna.

DIRECCIN DE INVESTIGACIN UNIVERSIDAD CSAR VALLEJO


Coeficiente de Correlacin de Pearson R
Ejemplo:
- Para calcular el valor de R:

Las sumatorias: = 397 = 101 = 3272

2 = 17219 2 = 1427 = 10

10 3272 397 (101)


=
10 17219 397 2 [10 1427 101 2 ]

= ,
La relacin entre las variables es Inversa (R<0). Es decir; a
mayor Edad (X), el n de das de ausencia (Y) es menor.

DIRECCIN DE INVESTIGACIN UNIVERSIDAD CSAR VALLEJO


Ejemplo: (en Excel)

Considere un estudio donde se mide el DAP: Dimetro a la Altura del


Pecho (X) en centmetros y la Altura (Y) en metros. Se considera una
muestra de 10 rboles, los datos son:
DAP Altura
15.6 17.4
14.8 18.4
15.5 16.5
Calcule e interprete
12.5 15.2
la correlacin.
14.2 19.9
15.7 22.1
12.3 14.8
14.2 17.3
8.8 10.3
11.9 14.6
DIRECCIN DE INVESTIGACIN UNIVERSIDAD CSAR VALLEJO
Ejemplo: (en Excel)
El grfico de dispersin en plano cartesiano:

DIRECCIN DE INVESTIGACIN UNIVERSIDAD CSAR VALLEJO


Ejemplo: (en Excel)
Para calcular el coeficiente de Correlacin de Pearson. En excel:
=COEF.DE.CORREL(matriz1,matriz2)

0.86450137 La correlacin lineal


existente entre el DAP
(X) y la Altura (Y), es
MUY ALTA.

La relacin entre las variables es Positiva (R>0). Es decir; a


mayor DAP (X), la Altura (Y) del rbol es mayor.

DIRECCIN DE INVESTIGACIN UNIVERSIDAD CSAR VALLEJO


REGRESIN LINEAL SIMPLE

DIRECCIN DE INVESTIGACIN UNIVERSIDAD CSAR VALLEJO


Regresin Lineal Simple:

Una de las aplicaciones ms importantes de la


estadstica implica la estimacin del valor medio de
una variable de respuesta Y o la prediccin de
algn valor futuro de Y con base el conocimiento
de un conjunto de variables independientes
relacionadas: X1, X2, . . . XK.

DIRECCIN DE INVESTIGACIN UNIVERSIDAD CSAR VALLEJO


Regresin Lineal Simple:
Los modelos que se emplean para relacionar una
variable dependiente Y con las variables
independientes X1, X2, . . . XK se denominan modelos
de regresin o modelos estadsticos lineales porque
expresan el valor medio de Y para valores dados de
X1, X2, . . . XK como una funcin lineal de un conjunto
de parmetros desconocidos.

DIRECCIN DE INVESTIGACIN UNIVERSIDAD CSAR VALLEJO


Regresin Lineal Simple:

Los conceptos de anlisis de regresin se


presentan empleando un modelo de regresin muy
sencillo, uno que relaciona Y con una sola variable
X. Aprenderemos a ajustar este modelo a un
conjunto de datos mediante el mtodo de los
mnimos cuadrados.

DIRECCIN DE INVESTIGACIN UNIVERSIDAD CSAR VALLEJO


GRFICOS DE DISPERSIN / RECTA DE REGRESIN

La relacin entre dos variables mtricas puede ser


representada mediante la lnea de mejor ajuste a los datos.
Esta recta se le denomina recta de regresin, que puede ser
negativa o positiva, la primera con tendencia decreciente y la
segunda creciente.

DIRECCIN DE INVESTIGACIN UNIVERSIDAD CSAR VALLEJO


GRFICOS DE DISPERSIN / RECTA DE REGRESIN
Para el clculo de la recta de regresin se aplica el mtodo de
mnimos cuadrados entre dos variables. Esta lnea es la que
hace mnima la suma de los cuadrados de los residuos, es
decir, es aquella recta en la que las diferencias elevadas al
cuadrado entre los valores calculados por la ecuacin de la
recta y los valores reales de la serie, son las menores posibles.

= +

DIRECCIN DE INVESTIGACIN UNIVERSIDAD CSAR VALLEJO


Recta de Regresin
Pendiente

yn
yn 1 y i
y3
u3 ui
yi
y1
yi
y2

x1 x2 x3 xi xn 1 xn

Intercepto

= + +
Error
ui yi yi

DIRECCIN DE INVESTIGACIN UNIVERSIDAD CSAR VALLEJO


Estimacin de Coeficientes de Regresin:
Pendiente:

Intercepto u Ordenada en el origen:

DIRECCIN DE INVESTIGACIN UNIVERSIDAD CSAR VALLEJO


Otro objetivo de la regresin es la prediccin de una variable
para un valor determinado de la otra.
La prediccin de Y para X=x0 ser simplemente el valor
obtenido en la recta de regresin de Y sobre X al sustituir el
valor de X por x0. La fiabilidad de esta prediccin ser tanto
mayor cuando mayor sea la correlacin entre las variables.

Dado un valor de la variable X que no ha sido observado,


estimar el correspondiente valor de Y

DIRECCIN DE INVESTIGACIN UNIVERSIDAD CSAR VALLEJO


Regresin Lineal Simple
Ejemplo:
- Tomando los datos del ejemplo de la ausencia al trabajo y la edad del
empleado :
N das de
Edad XY X2 Y2
ausencia
- Obtenga la ecuacin de 25 20 500 625 400
regresin. 50 5 250 2500 25
- Interprete el valor de la
35 10 350 1225 100
pendiente.
20 20 400 400 400
- Si un trabajador tiene 38 aos,
45 8 360 2025 64
cuntos das se espera que
50 2 100 2500 4
falte al ao?
30 15 450 900 225
40 12 480 1600 144
62 1 62 3844 1
40 8 320 1600 64
397 101 3272 17219 1427

DIRECCIN DE INVESTIGACIN UNIVERSIDAD CSAR VALLEJO


Regresin Lineal Simple
Ejemplo:
- Para calcular el valor de los Coeficientes de la Ecuacin:

Las sumatorias: = 397 = 101 = 3272

2 = 17219 2 = 1427 = 10

Pendiente:

=

()
=

= ,

DIRECCIN DE INVESTIGACIN UNIVERSIDAD CSAR VALLEJO


Regresin Lineal Simple
Ejemplo:
- Para calcular el valor de los Coeficientes de la Ecuacin:

Las sumatorias: = 397 = 101 = 3272

2 = 17219 2 = 1427 = 10

Intercepto u Ordenada en el origen:



=


= ,

= ,

DIRECCIN DE INVESTIGACIN UNIVERSIDAD CSAR VALLEJO


Regresin Lineal Simple
Ejemplo:
- La Ecuacin:
= , ,

- Interpretacin de la Pendiente: = ,

Por cada ao adicional en la Edad del empleado (X), el n de das de


ausencia (Y) disminuye en 0,5059.

- Si un trabajador tiene 38 aos, cuntos das se espera que


falte al ao?
= , , = ,
Si un trabajador tiene 38 aos (X=38), se espera que durante el ao
registre, aproximadamente, 11 faltas.

DIRECCIN DE INVESTIGACIN UNIVERSIDAD CSAR VALLEJO


Ejemplo: (en Excel)
Considerando los datos del problema anterior, encuentre la ecuacin de
regresin entre el DAP y la altura.
DatosAnlisis de DatosRegresin (activar Nivel de Confianza) Aceptar

DIRECCIN DE INVESTIGACIN UNIVERSIDAD CSAR VALLEJO


Ejemplo: (en Excel)

Interpretacin de = ,
Por cada centmetro adicional en el DAP
= , + , (X), la Altura del rbol (Y) aumentar en
1,281028 metros.
DIRECCIN DE INVESTIGACIN UNIVERSIDAD CSAR VALLEJO
Gracias
DIRECCIN DE INVESTIGACIN UNIVERSIDAD CSAR VALLEJO

También podría gustarte