Está en la página 1de 10

Estadística aplicada

Correlación y
Regresión lineal
simple

Dra. Blanca Flor Robles Pastor.


Máster en Estadística Aplicada
Universidad de Alcalá-Madrid.

1
Relación de variables

Costo de proyecto

Superficie m2

2
Estadística aplicada

- Dependiente Datos
Variables de Relación - Independiente Cuantitativos

Dependiente (Y) Es aquella variable que recibe influencia de otra variable.

Independiente (X): es aquella variable que determina el comportamiento de la


variable dependiente.
x y
Ejemplo:
x(1) y( 1 )
x( 2 ) y( 2 ) Superficie (X)
  y
x(n ) y( n )
Costo del proyecto (Y)

Y = f (X )
3
Estadística aplicada

- Covarianza Datos
MEDIDAS DE ASOCIACIÓN LINEAL
- Correlación Cuantitativos

x
x1 Recordemos que: Hasta ahora hemos estudiado las medidas tendencia
central (Media, Mediana, Moda) y dispersión
x2 (Varianza y Desviación Estándar) para una Variable
 Cuantitativa (x).
xn

Covarianza: Es una medida de Variabilidad Conjunta entre dos variables (x1 , x2) o bien (x , y)
1 n
x y cov( x , y )   ( xi  x )( yi  y )
n  1 i 1
x(1) y( 1 )
Si Cov(x,y) es positiva: la asociación entre x e y es directamente proporcional,
x( 2 ) y( 2 )
es decir que cuando x aumenta y también aumenta; y viceversa.
 
Si Cov(x,y) es negativa: la asociación entre x e y es inversamente proporcional,
x(n ) y( n ) es decir que cuando x aumenta y disminuye; y viceversa.
Si Cov(x,y) es cero: no existe asociación entre x e y.
4
Estadística aplicada

- Covarianza Datos
MEDIDAS DE ASOCIACIÓN LINEAL
- Correlación Cuantitativos

Correlación: Se refiere al grado de asociación entre dos variables (x1 , x2) o bien (x , y)
Coeficiente de Correlación de Pearson (r): Mide el grado de Asociación Lineal
entre dos variables Cuantitativas
n
 xi yi  nxy
x y
cov( x , y )
x(1) y( 1 ) r 1  r  1
sx s y r  i 1
x( 2 ) y( 2 ) ( n  1 )s x s y
  Si r es positivo: la asociación entre x e y es directamente proporcional, es decir que
x(n ) y( n ) cuando x aumenta y también aumenta; y viceversa. Si r=1: la asociación lineal es
perfecta.
Si r es negativo: la asociación entre x e y es inversamente proporcional, es decir
que cuando x aumenta y disminuye; y viceversa. Si r=-1: la asociación lineal es
perfecta.
Si r es cero: no existe asociación entre x e y.

5
Estadística aplicada

EJEMPLO : Representación gráfica de las variables x e y

r=1 r=-1

6
Estadística aplicada

Datos Cuantitativos

REGRESION LINEAL SIMPLE


Objetivo 1 Objetivo 2
Determinar si dos variables están x y Estudiar si los valores de una
asociadas y en qué sentido se da x(1) y( 1 ) variable pueden ser utilizados para
la asociación. predecir el valor de la otra
x( 2 ) y( 2 )
 
Determinar si existe relación x(n ) y( n )
Estudiar la dependencia de una
entre las variables x e y: variable respecto de la otra:
Coeficiente de Correlación Modelo de Regresión
Términos
Variable Respuesta (=variable dependiente)
Variable Explicativa (=variable Independiente)
Relación Lineal (modelo lineal)
Parámetros (intercepto y pendiente)
Intercepto (respuesta media)
Pendiente (efecto de la variable explicativa sobre la respuesta)
Error (residuo)
7
Estadística aplicada

Datos Cuantitativos
REGRESION LINEAL SIMPLE
x y
x(1) y( 1 ) Notación
x( 2 ) y( 2 ) Variable Respuesta: y
Variable Explicativa: x
 
y( n ) Modelo de Regresión Lineal Simple: yi=+xi+ei
x(n )
Intercepto: 
Pendiente: 
Error: e
Modelo Estimado
(recta de regresión) Método de Estimación: Mínimos Cuadrados
a  y  bx
n n n
yˆ  a  bx
Residuos o Errores
n xy   xi  y i ei  yi  yˆ i
b i 1 i 1 i 1
2
n
 n 
n  x    xi 
2

i 1  i 1 
8
Estadística aplicada

REGRESION LINEAL SIMPLE

MODELO DE REGRESIÓN LINEAL SIMPLE


yi=+xi+ei

DATOS MODELO ESTIMADO


x y
y( 1 )
yˆ  a  bx
x(1)
x( 2 ) y( 2 )
  ESTIMADORES ERRORES
x(n ) y( n ) a  y  bx ei  yi  yˆ i
n n n
n xy   xi  y i
b i 1 i 1 i 1
n
  n 2
b= cov(x;y)/var(x)
n  x    xi 
2

i 1  i 1 
9
Estadística aplicada

REGRESION LINEAL SIMPLE

EJEMPLO: Aplicación del Modelo de Regresión Lineal Simple


Problema 1: Se cuenta con las mediciones sobre el estudio de proyectos de edificios
habitacionales en altura; para lo cual, se ha evaluado el tamaño (Sup. m2) y costo de los
edificios recabados. Fuente: Proyectos habitacionales G&INMB.
Costo del
Superficie m2 proyecto md a) Calcular e interpretar la covarianza
(Xi) (Yi)
10500 123000 b) Calcular e interpretar el coeficiente
8950
5200
80700
58565
de correlación de Pearson
19764 224306
c) Calcular e interpretar el coeficiente
8901 94891
20470 186809 de determinación lineal.
6050 63706
d) Construir el diagrama de dispersión.
e) Estimar el modelo de regresión lineal
simple
f) Realizar pronósticos. 10

También podría gustarte