Está en la página 1de 22

ANÁLISIS REGRESIÓN LINEAL Y

CORRELACIÓN
Diseño y análisis de experimentos
Análisis de correlación
• Es el grupo de técnicas estadísticas empleado para medir la
intensidad de la relación (correlación) entre dos variables.
• El principal objetivo del análisis de correlación es determinar que tan
intensa es la relación entre dos variables. Una medida de esta
relación es el coeficiente de correlación ( r ) el cual puede tomar
valores en una escala desde –1 hasta +1 inclusive como se indica
enseguida.
Análisis de correlación
Coeficiente de Correlación de Pearson (r): Mide el grado de Asociación
Lineal entre dos variables Cuantitativas
n

r=
cov( x , y ) å xi yi - nxy -1 £ r £ 1
sx s y r= i =1
( n - 1 )s x s y

Si r es positivo: la asociación entre x e y es directamente proporcional, es decir que


cuando x aumenta y también aumenta; y viceversa. Si r=1: la asociación lineal es
perfecta.
Si r es negativo: la asociación entre x e y es inversamente proporcional, es decir que
cuando x aumenta y disminuye; y viceversa. Si r=-1: la asociación lineal es perfecta.
Si r es cero: no existe asociación entre x e y.
Análisis de correlación

Si r = 0 indica que no existe ninguna correlación entre las dos variables.


Análisis de correlación
El coeficiente de correlación se calcula mediante la siguiente fórmula:

Donde:
n = es el número de pares de observaciones (x, y)
x = valores de la variable independiente x.
y = valores de la variable dependiente y.
Ejercicio
El director de personal de una empresa debe entrevistar y seleccionar
nuevo personal para el área de ventas. Ha diseñado una prueba que
ayude a seleccionar los mejores aspirantes. Con la finalidad de verificar
la validez de su prueba, como instrumento de predicción de las ventas
semanales, eligió al azar cinco vendedores experimentados y aplicó la
prueba a cada uno (esta muestra es pequeña para fines didácticos, en
la práctica debe tomarse una muestra mucho mayor).
Ejercicio
Los resultados obtenidos se muestran en la tabla siguiente:

Se piensan entonces que las ventas semanales dependen de la


puntuación de prueba por lo cual se toman las ventas como variable
dependiente (y) y la puntuación de prueba como variable
independiente (x).
Ejercicio

Existe alto grado de correlación


Ejercicio En SPSS se llama R cuadrado
Análisis de regresión lineal simple
• Se define a la regresión lineal como una relación fundamental entre
dos o más variables correlacionadas y se usa para pronosticar una
variable con base en la otra. Por lo general la relación se obtiene de
dos datos observados. En la regresión lineal la relación entre variables
forma una línea directa.
• La línea de regresión lineal es de la forma y’ = a + bx, donde y’ es la
variable dependiente que queremos resolver; a es la intersección de
y’; b es la dependiente y x es la variable independiente (en el análisis
de series de tiempo, x representa unidades de tiempo).
Concepto (2)
El tema básico en regresión (con 2 variables) es
ajustar los puntos del diagrama de dispersión de
las variables X e Y. Para simplificar, el análisis se
centra (por simplicidad) en el caso de que la
relación entre X e Y sea lineal.
Rendimiento

En este caso el análisis se centra en ¿cuál es la


“mejor” línea que parece unir los puntos?. Para
esto, se necesita un criterio. Si bien hay otros
criterios, el más empleado comúnmente, y el que
Inteligencia veremos aquí, es el criterio de mínimos cuadrados.

Criterio de mínimos cuadrados: Es aquel que minimiza las distancias


cuadráticas de los puntos con la línea.
Repaso de la ecuación de una recta
Y=a+ b x
a es la ordenada en el origen (es
donde la recta corta el eje Y)
b es la pendiente (observada que en
Rendimiento

el caso de las relaciones positivas, B


será positivo; en el caso de las
relación negativas, B será negativo; si
no hay relación, B será
Inteligencia aproximadamente 0)

Si queremos predecir Y a partir de X, necesitamos calcular (en el


caso de relación lineal) la recta de regresión de Y sobre (a partir de)
X. IMPORTANTE: B=b y A=a
Cálculo de la ecuación de regresión lineal (de Y sobre X)

El criterio de mínimos cuadrados


Y’ nos proporciona un valor de a y
Rendimiento (Y)

uno
n de b, tal que,
2

å (Y - Y )
i =1
i i
'
sea mínimo

Inteligencia (X)
Cálculo de la ecuación de regresión lineal (de Y sobre X)

Las fórmulas.... En puntuaciones directas

Ordenada
origen
A = Y - BX

B=
å XY - nXY
Pendiente
å X - nX 2 2
Cálculo de la ecuación de regresión lineal (de Y sobre X)

X Y XY X2
suj1 120 10 1200 14400
suj2 100 9 900 10000
suj3 90 4 360 8100
suj4 110 6 660 12100

4 SUMA SUMA
3120 44600
PROMEDIO PROMEDIO
105 7.25

N
4

3120 - 4 ×105 × 7 '25


B= = 0'15
44600 - 4 ×105 2
Luego
Y’=-8’5+0’15X
A = 7 ' 25 - 0 '15 ×105 = -8'5
Seleccionar 2 x 4
F2
Ctl + Mayúscula + Enter

Ordenada en el
Pendiente y error origen y error

R – entre más cerca de uno mejor ajuste


En SPSS
• Gráfico de dispersión: Gráficos / Cuadros de diálogo antiguos /
Dispersión Puntos / Dispersión simple à Dependiente Y,
Independiente X
• Analizar / Estadísticos Descriptivos / Gráficos / Prueba de normalidad
• Analizar / Regresión / Lineal à Independiente X, Dependiente Y /
Estadísticos (Seleccionar: Ajustes del modelo, Cambio en R cuadraro,
Estimaciones) Continuar / Aceptar
• Los valores de interés con R (correlación de Pearson) R cuadrado (coeficiente
de determinación)
• Error típico de la estimación: representa una medida de la parte de
variabilidad de la variable dependiente que no es explicada por la recta de
regresión. Cuánto mejor es el ajuste más pequeño es el error típico.
Análisis
En estos ejercicios la hipótesis se establece de la siguiente manera:
• Ho: Las variables no están linealmente relacionadas à r=0
• H1: Las variables están linealmente relacionadas à r > 0

Si el nivel de p<0,05 se rechaza la hipótesis nula y se acepta la hipótesis


alternativa por lo que se concluye que las variables están linealmente
relacionadas.
Análisis
• Coeficientes:
• Constante es el origen de la recta de regresión = a
• El valor en X correcponde a la pendiente de la recta de regresión = b (positivo
relación directa, negativo relación inversa)
Ejercicio

También podría gustarte