Está en la página 1de 14

VARIABLES BIDIMENSIONALES, CORRELACIÓN Y REGRESIÓN

(FORMULARIO BÁSICO)
Diagrama de dispersión es la representación en ejes cartesianos del par de variables estadísticas (X,Y).

Tabla de doble entrada de una Variable Bidimensional (X, Y):

Frecuencia
x1 xn ... xn absoluta de
la variable Y

y1 f11 f21 ... fn1 Σ fi1

y2 f12 f22 ... fn2 Σ fi2

... ... ... ... ... ...

yn f1m f2m ... fnm Σ fin

Frecuencia absoluta de la
Σ f1i Σ f2i ... Σ fni N
variable X

Parámetros de una variable bidimensional (X,Y)

Medias marginales:

1) Varianzas y desviaciones típicas marginales:


Varianza de X Varianza de Y

2) Covarianza:

Resumen de fórmulas y Ejercicios de Variables Bidimensionales, Correlación y Regresión /Fac-Tecnológica / S- 1 2023 /1


mms/usach
Correlación y relación de dependencia entre X e Y

Estudio de la dependencia o relación( asociación) entre dos variables de una distribución bidimensional (X,Y)

Coeficiente de correlación lineal r (dependencia lineal):

Interpretación del coeficiente de correlación lineal r:

1) Si r = -1 ⇒ Dependencia lineal inversa

2) Si -1 < r < 0 ⇒ Dependencia débil inversa

3) Si r = 0 ⇒ Independencia

4) Si 0 < r < 1 ⇒ Dependencia débil directa

5) Si r = 1 ⇒ Dependencia lineal directa

Ecuación de regresión lineal:

Ecuación de Y en función de X: Ecuación de X en función de Y:

Resumen de fórmulas y Ejercicios de Variables Bidimensionales, Correlación y Regresión /Fac-Tecnológica / S- 1 2023 /2


mms/usach
Coeficiente de determinación

El coeficiente de correlación lineal indica el grado de linealidad (o asociación lineal) que existe
entre las dos variables.

¿Cómo se evalúa la bondad del ajuste de la recta de regresión que se hace?

Es decir ¿qué tan apropiado es ajustar la recta de regresión lineal para explicar la relación
entre las variables X e Y?

La respuesta a dicha pregunta se obtiene utilizando un parámetro llamado coeficiente


de determinación.

Se llama coeficiente de determinación al cuadrado del coeficiente de correlación


lineal, es decir:

Resumen de fórmulas y Ejercicios de Variables Bidimensionales, Correlación y Regresión /Fac-Tecnológica / S- 1 2023 /3


mms/usach
EJERCICIOS DE CORRELACIÓN Y REGRESIÓN
1) En las gráficas siguientes se muestran las rectas de regresión en tres estudios de
regresión lineal.

a) ¿En cuál de las dos gráficas, (A ó B ), el coeficiente de correlación lineal sería más grande?

b) Indicar en qué gráficas el coeficiente de correlación lineal sería negativo. Justificar la


respuesta.

Respuesta:

a) En la gráfica A, los puntos de la nube de puntos se encuentran más dispersos y alejados de


la recta de regresión. Sin embargo, en la gráfica B dichos puntos están más próximos y
concentrados alrededor de la recta de regresión. Por tanto, el gráfico B tiene un mayor
coeficiente de correlación lineal.

b) En la gráfica C la correlación es negativa, ya que a mayores valores de X disminuye el valor


de Y. Es en esta gráfica donde el coeficiente de correlación lineal es negativo.

Resumen de fórmulas y Ejercicios de Variables Bidimensionales, Correlación y Regresión /Fac-Tecnológica / S- 1 2023 /4


mms/usach
2) En una empresa de transporte trabajan 4 conductores. Los años de antigüedad de
sus permisos de conducir y el número de infracciones cometidas en el último año por
cada uno de ellos son los siguientes:

X: años de antigüedad 3 4 5 6

Y: infracciones 4 3 2 1

a) Representar gráficamente los datos anteriores. Razonar si los datos muestran una
correlación positiva o negativa.
b) Calcular el coeficiente de correlación e interpretarlo en términos de la situación
real.
Respuesta: a)

Al aumentar los valores de X los valores de Y disminuye, por lo que la correlación de


ambas variables es negativa.

Respuesta: b)

Resumen de fórmulas y Ejercicios de Variables Bidimensionales, Correlación y Regresión /Fac-Tecnológica / S- 1 2023 /5


mms/usach
3) Una persona rellena semanalmente una quiniela y un boleto de lotería primitiva,
anotando el número de aciertos que tiene. Durante las 4 semanas del mes de febrero,
los aciertos fueron :

Semana 1ª 2ª 3ª 4ª

Aciertos en la quiniela 6 8 6 8

Aciertos en la primitiva 1 2 2 1

Obtener el coeficiente de correlación lineal e interpretarlo. ¿Ofrecerían confianza las


predicciones hechas con las rectas de regresión?

Respuesta:

xi yi x i2 yi 2 x i · yi

6 1 36 1 6

8 2 64 4 16

6 2 36 4 12

8 1 64 1 8

28 6 200 10 42

Resumen de fórmulas y Ejercicios de Variables Bidimensionales, Correlación y Regresión /Fac-Tecnológica / S- 1 2023 /6


mms/usach
4) Representa gráficamente la distribución bidimensional correspondiente a la
siguiente tabla :

Variable X 2 4 6 8

Variable Y 2 5 7 10

a) A la vista de la gráfica, ¿qué valor aproximado tendrá el coeficiente de correlación


lineal?
b) Calcula dicho coeficiente indicando todos los paso seguidos para ello.
Respuesta:

a)Los puntos de la nube se encuentran muy próximos a una recta, y al aumentar los
valores de la variable X aumentan los valores de la variable Y. Basándonos en esto,
podemos afirmar que la correlación lineal entre ambas variables es positiva y grande.
El coeficiente de correlación lineal r tiene un valor cercano a 1.

b)
xi yi xi2 yi2 xi · yi

2 2 4 4 4
4 5 16 25 20
6 7 36 49 42
8 10 64 100 80
20 24 120 178 146

Resumen de fórmulas y Ejercicios de Variables Bidimensionales, Correlación y Regresión /Fac-Tecnológica / S- 1 2023 /7


mms/usach
5) En cinco estudios estadísticos se han obtenido los siguientes coeficientes de
correlación lineal :
r = -0,98 ; r = 0,93 ; r = 0,05 ; r = 0,71 ; r = -0,62
Identificar ( justificando la respuesta ) la nube de puntos correspondiente a cada uno
de ellos.

Respuesta:

En la gráfica " a " la nube de puntos se encuentra completamente dispersa, por lo


que podemos afirmar que la correlación es practicamente nula : r = 0,05 .

En " b " la correlación lineal es positiva, y dado que la nube de puntos no está del
todo concentrada, la correlación es más bien moderada : r = 0,71 .

En la gráfica " c " la correlación lineal es fuerte y además negativa : r = -0,98 .

En " d " es positiva y además la correlación es fuerte : r = 0,93 .

Por último, en la gráfica " e ", la correlación es moderada y negativa : r = -0,62 .

Resumen de fórmulas y Ejercicios de Variables Bidimensionales, Correlación y Regresión /Fac-Tecnológica / S- 1 2023 /8


mms/usach
6) En una empresa se seleccionan 5 trabajadores, se anotaron sus años de servicio y
el tiempo de permiso en horas, solicitado el último mes. Los resultados obtenidos
fueron:

X 1 3 2 4 5 4
Y 1 1 3 4 6 5
a) Representar gráficamente los datos anteriores. Razonar si los datos muestran
correlación positiva o negativa.

b) Calcular el coeficiente de correlación e interpretarlo en términos de la situación


real.
Respuesta: a) Los datos muestran una correlación directa o positiva, pues cuando
crece x también crece y.

b)

1 1 1 1 1

3 1 9 1 3

2 3 4 9 6

4 4 16 16 16

5 6 25 36 30

4 5 16 25 20

Total 19 20 71 88 76

Resumen de fórmulas y Ejercicios de Variables Bidimensionales, Correlación y Regresión /Fac-Tecnológica / S- 1 2023 /9


mms/usach
Interpretación: como el coeficiente de correlación es 0,83 ( r varía entre -1 y 1)
podemos deducir que existe relación relativamente fuerte entre una variable y
otra. Y además se trata de una relación directa, en el sentido de que al aumentar
los valores de la X (número de horas de servicio) aumentan los valores de la Y
(las horas de permiso).

Resumen de fórmulas y Ejercicios de Variables Bidimensionales, Correlación y Regresión /Fac-Tecnológica / S- 1 2023 / 10


mms/usach
7) La siguiente tabla ofrece los resultados de seis pares de observaciones, realizadas para
analizar el grado de relación existente entre dos variables X e Y:

X 2 2 3 3 3 4

Y 0 1 1 2 4 3

Obtener:
a) Recta de regresión de Y sobre X.
b) Representación gráfica de la misma, así como de los pares de observaciones
anteriores.
c) ¿Qué grado de relación lineal existe entre ambas variables

Respuesta: a)

2 0 4 0 0

2 1 4 1 2

3 1 9 1 3

3 2 9 4 6

3 4 9 16 12

4 3 16 9 12

Total 17 11 51 31 35

Resumen de fórmulas y Ejercicios de Variables Bidimensionales, Correlación y Regresión /Fac-Tecnológica / S- 1 2023 / 11


mms/usach
Respuesta b)

Respuesta c)

Resumen de fórmulas y Ejercicios de Variables Bidimensionales, Correlación y Regresión /Fac-Tecnológica / S- 1 2023 / 12


mms/usach
8) El coeficiente de determinación de una distribución cuya nube de puntos se ajusta
a una recta es igual a 0,85. Interpreta este resultado:

Respuesta:

Si r2= 0,85 significa que el 85% de la variación de Y puede ser debido a la varación de X si se
usa la regresión lineal. El 15% restante de la variación de Y puede deberse al azar o a la
influencia sobre Y de otras variables distintas de X.

9) El coeficiente de determinación de una distribución cuya nube de puntos se ajusta a


una recta es igual a 0,33.
a) Interpreta este resultado.
b) ¿Tiene sentido encontrar un modelo lineal para esta distribución que permita realizar
estimaciones?

Respuesta:

a) Si r 2 = 0,33 signifa que el 33% de las variación de Y se debe a la variación de X si usamos


regresión lineal. Mientras que el 67% restante de la variación de Y se debe al azar o a la influencia
sobre Y de otras variables distintas de X.

b) Que el coeficiente de relación sea r 2 = 0,33 implica que el coeficiente de correlación es r = ±


0,57 , lo que nos indica que se trata de una dependencia aleatoria media-baja. Por tanto le modelo

lineal tan sólo tendrá sentido cuando realicemos estimaciones en puntos muy cercanos a

10) Si el coeficiente de correlación vale r = 0,7.


a) ¿Qué tanto por ciento de la variación de Y es debido a la variación de X usando el
modelo de regresión lineal?
b) ¿Tiene sentido realizar estimaciones en la recta de regresión obtenida?

Respuesta:

a) El coeficiente de determinación será r 2 = 0,72 = 0,49 , lo que nos indica que un 49% de la
variación de Y es debida a la variación de X

b) En este ejemplo, el coeficiente de correlación vale 0,7 lo que nos indica que esta distribución
presenta una dependencia intermedia-fuerte, y las estimaciones que realicemos con la recta de
regresión sólo tendrán sentido si se hacen para puntos cercanos al centro de gravedad de X e
Y, es decir del punto:

Resumen de fórmulas y Ejercicios de Variables Bidimensionales, Correlación y Regresión /Fac-Tecnológica / S- 1 2023 / 13


mms/usach
11) Se tiene los valores de X e Y en una muestra de seis casos evaluados del
comportamiento conjunto de ambas variables

(X) 8 4 12 2 7 9

(Y) 6 4 8 1 4 5

a) Calcular el coeficiente de correlación lineal.


b) Hallar la recta que permita estimar los valores de Y a partir de X.
c) Hallar el coeficiente de determinación e interprétalo para estudiar la bondad del
ajuste.
Respuestas:
a)

c) El coeficiente de determinación es r 2 = 0,865. Es decir que el 86,5% de la variación de Y se


puede explicar mediante la variación de X si utilizamos la recta de regresión. Mientras que el 13,5%
restante de la variación de Y no se explica con la recta de regresión, luego el ajuste lineal es bueno.

Resumen de fórmulas y Ejercicios de Variables Bidimensionales, Correlación y Regresión /Fac-Tecnológica / S- 1 2023 / 14


mms/usach

También podría gustarte