Está en la página 1de 35

UNIVERSIDAD NACIONAL DEL CALLAO

FACULTAD DE INGENIEIRA ELECTRICA Y ELETRICA


UNIDAD DE POSGRADO

Dr. Lic. ADAN ALMIRCAR TEJADA


CABANILLAS
Qué es el análisis de
correlación lineal ?

Es una herramienta estadística que podemos


usar para describir el grado de relación
lineal entre las variables.
Variable Variable
Independiente Tipos de Variables Dependiente
(X) (Y)
(determinística, es aleatoria
decir no aleatoria.)

Ejemplos

X: Número de llamadas telefónicas realizadas por un vendedor


promocionando un producto.
Y: Unidades vendidas por el vendedor.

X: Tiempo que dedica un estudiante a una materia.


Y : Evaluación que obtiene el estudiante en la materia.
Ejercicio Modelo
En una ciudad de Canadá, las personas al comprar casas se interesan
por el precio del costo de la calefacción. Se ha determinado que un grupo
de factores pueden estar relacionados con el costo ( en dólares):
•Temperatura exterior. (Grados Fahrenheit)
•Aislante térmico en el desván. (en pulgadas)
•Antigüedad del calefactor.
•Área de la sala principal del apartamento. (en metros cuadrados).

Un cliente le ha preguntado a un vendedor:


Si usted me brinda la información de las variables anteriores de un
apartamento, ¿cómo puedo saber yo aproximadamente cuanto pagaré en
calefacción?. ¿Cuan confiable será la información que usted me brinde?
Pasos en el Análisis de Correlación

1. Determinar cuál es la variable dependiente. Y: Costo.


2. Seleccionar una muestra de tamaño n de ambas variables X e Y, con lo
que se obtienen n pares de observaciones
(x1 , y1) , (x2 , y2)… (xn , yn).

En nuestro ejemplo se tomo una muestra de 20 apartamentos. Se


midieron todas las variables independientes para cada uno de ellos.
3. Mostrar la relación en un diagrama de dispersión: Gráfico de X vs. Y.
Se aprecia de manera descriptiva el sentido y la intensidad de relación
entre las variables.

Se realizaran los 4 gráficos que corresponden a cada una de las variables


independientes consideradas.
EXISTENCIA DE RELACION
MODELO LINEAL

n XY   X  Y
1 
n  X  ( X )
2 2
 X ,Y 
Y *   0  1 X
e1  Y1  Y1*
MINIMOS _ CUADRADOS
2
e   Y  Y *    Y  (  0  1 X ) 
2

M in(e)
e
 0  2 Y  (  0  1 X ) (1)  0
 0
e
 0  2 Y  (  0  1 X ) ( X )  0
1
ECUACIONES _ PARAMETRICAS
n 0  1  X   Y
 0  X  1  X   XY
2

Y  X
 XY  X 
2

0 
n X
X X
2

n Y
1 
 X  XY 
n X
X X
2

COV ( X , Y )
rR
 XY
n XY   X  Y
r
n  X 2  ( X ) 2 n  Y 2  ( Y )2
Coeficientesa

Modelo Coeficientes no
estandarizados Coeficientes
estandarizados t Sig.
B Desv. Error
Beta
1 (Constante) 75,720 2,460
30,779 ,000
X_DEFORMACION -1,320
,108 -,977 -12,212 ,000
a Variable dependiente: Y_DUREZA

*
Y   0  1 X  75.72  1.32 X
GRAFICA
Te mpe ratura Exte rior v s. Costo

450
400 Relación Inversa
r = -0.812
350 fuerte
300
250
Costo

200
150
100
50
0
0 10 20 30 40 50 60 70
Tem p
Aislante térmico v s. Costo.

450 r = -0.257 Relación Inversa


400 débil
350
300
250
Costo

200
150
100
50
0
0 2 4 6 8 10 12 14
Aislante
Antigue dad de l cale factor v s. Costo

450
r =0,512 Relación Directa
400 moderada
350
300
250
Costo

200
150
100
50
0
0 5 10 15 20
Antiguedad
Tamaño sala v s. Costo Relación directa
r = 0.991
fuerte
450
400
aunque se
350
aprecia una
300 tendencia no
250 lineal
Costo

200
150
100
50
0
0 5 10 15 20 25
Tam año
4. Calcular un coeficiente de correlación lineal r a partir de la muestra,
como aproximación de la verdadera relación lineal ρ (rho) entre las
variables.
n  xy   x  y 
r
n x 2
  x  2
 n y 2
  y 2

1  r  1
Interpretación:
1. El valor absoluto de r indica la fuerza de la relación entre Y y X.
2. El signo la dirección de la relación (directa o inversamente proporcional)
(tener cuidado con relaciones espúreas)
r=1 correlación positiva perfecta.
r = -1 correlación negativa perfecta.
r=0 no hay relación lineal entre Y y X.
Costo Temp Aislante Antigüedad
Costo 1.00

Temp -.812 1.00

Aislante -.257 -.103 1.00


Antigüedad .537 -.486 .064 1.00

Tamaño .991 -.831 -.253 .482 1.000

Interpretación de las Correlaciones lineales e Identificación de las


Variables independientes con mayor correlación lineal.
Temperatura.
Una correlación de -0,812 indica alta correlación, inversamente proporcional:
A mayor Temperatura exterior, menor el costo en calefacción y viceversa.

Aislante.
La correlación de 0,257 es baja, así que no existe relación lineal entre las
variables.
Antigüedad.
Una correlación de 0,512; es moderada, directamente proporcional, a mayor
antigüedad del calefactor, mayor costo y viceversa.
Tamaño de la sala principal.
Una correlación de 0,991; es alta y directamente proporcional: A mayor tamaño
de la sala, mayor costo de la calefacción
PAGO=f(CONSUMO EE)
PRONOSTICOS
CONSUMO = f (PAGO)
PAGO = f ( CONSUMO )
INTERSECCION ENTRE LAS
RECTAS
MEJOR MODELO
PRECISAR EL MEJOR
MODELO
Los coeficientes a1 y a0 se obtienen mediante las expresiones
n  xy    x  y 
a1 
  x 
2
n x 2

a 0  y  a1x
Aplicamos MegaStat para realizar el Análisis de Regresión
Y marcamos en la nueva ventana las
MegaStat
opciones que aparecen en la pantalla
Correlation/Regresión siguiente que nos mostrarán todas las
salidas que son de nuestro interés para el
Regresión Análisis análisis de regresión
c. Cálculo del Coeficiente de Determinación
Mide el poder explicativo del modelo de regresión, es decir, la
parte de la variación de Y explicada por la variación de X
El valor de r2 ha de estar entre 0 y 1, si r2 = 0,70 significa que el 70%
de la variación de Y está explicada por las variaciones de X. Es
evidente que cuanto mayor sea r2, mayor poder explicativo tendrá
nuestro modelo.
En nuestro ejemplo
Si analizamos el valor del coeficiente de determinación r ² = 0.659,
apreciamos que aproximadamente el 66% de la variabilidad del
costo esta determinado por la variabilidad en la Temperatura
exterior.
Y = f (X )
X=f(Y)
• PUNTO DE INTERSECCION ENTRE LAS
RECTAS

• ÁNGULO ENTRE LAS RECTAS


MODELOS NO LINEALES

También podría gustarte