Documentos de Académico
Documentos de Profesional
Documentos de Cultura
(FORMULARIO BÁSICO)
Diagrama de dispersión es la representación en ejes cartesianos del par de variables estadísticas (X,Y).
Frecuencia
x1 xn ... xn absoluta de
la variable Y
Frecuencia absoluta de la
Σ f1i Σ f2i ... Σ fni N
variable X
Medias marginales:
2) Covarianza:
Estudio de la dependencia o relación( asociación) entre dos variables de una distribución bidimensional (X,Y)
3) Si r = 0 ⇒ Independencia
El coeficiente de correlación lineal indica el grado de linealidad (o asociación lineal) que existe
entre las dos variables.
Es decir ¿qué tan apropiado es ajustar la recta de regresión lineal para explicar la relación
entre las variables X e Y?
a) ¿En cuál de las dos gráficas, (A ó B ), el coeficiente de correlación lineal sería más grande?
Respuesta:
X: años de antigüedad 3 4 5 6
Y: infracciones 4 3 2 1
a) Representar gráficamente los datos anteriores. Razonar si los datos muestran una
correlación positiva o negativa.
b) Calcular el coeficiente de correlación e interpretarlo en términos de la situación
real.
Respuesta: a)
Respuesta: b)
Semana 1ª 2ª 3ª 4ª
Aciertos en la quiniela 6 8 6 8
Aciertos en la primitiva 1 2 2 1
Respuesta:
xi yi x i2 yi 2 x i · yi
6 1 36 1 6
8 2 64 4 16
6 2 36 4 12
8 1 64 1 8
28 6 200 10 42
Variable X 2 4 6 8
Variable Y 2 5 7 10
a)Los puntos de la nube se encuentran muy próximos a una recta, y al aumentar los
valores de la variable X aumentan los valores de la variable Y. Basándonos en esto,
podemos afirmar que la correlación lineal entre ambas variables es positiva y grande.
El coeficiente de correlación lineal r tiene un valor cercano a 1.
b)
xi yi xi2 yi2 xi · yi
2 2 4 4 4
4 5 16 25 20
6 7 36 49 42
8 10 64 100 80
20 24 120 178 146
Respuesta:
En " b " la correlación lineal es positiva, y dado que la nube de puntos no está del
todo concentrada, la correlación es más bien moderada : r = 0,71 .
X 1 3 2 4 5 4
Y 1 1 3 4 6 5
a) Representar gráficamente los datos anteriores. Razonar si los datos muestran
correlación positiva o negativa.
b)
1 1 1 1 1
3 1 9 1 3
2 3 4 9 6
4 4 16 16 16
5 6 25 36 30
4 5 16 25 20
Total 19 20 71 88 76
X 2 2 3 3 3 4
Y 0 1 1 2 4 3
Obtener:
a) Recta de regresión de Y sobre X.
b) Representación gráfica de la misma, así como de los pares de observaciones
anteriores.
c) ¿Qué grado de relación lineal existe entre ambas variables
Respuesta: a)
2 0 4 0 0
2 1 4 1 2
3 1 9 1 3
3 2 9 4 6
3 4 9 16 12
4 3 16 9 12
Total 17 11 51 31 35
Respuesta c)
Respuesta:
Si r2= 0,85 significa que el 85% de la variación de Y puede ser debido a la varación de X si se
usa la regresión lineal. El 15% restante de la variación de Y puede deberse al azar o a la
influencia sobre Y de otras variables distintas de X.
Respuesta:
lineal tan sólo tendrá sentido cuando realicemos estimaciones en puntos muy cercanos a
Respuesta:
a) El coeficiente de determinación será r 2 = 0,72 = 0,49 , lo que nos indica que un 49% de la
variación de Y es debida a la variación de X
b) En este ejemplo, el coeficiente de correlación vale 0,7 lo que nos indica que esta distribución
presenta una dependencia intermedia-fuerte, y las estimaciones que realicemos con la recta de
regresión sólo tendrán sentido si se hacen para puntos cercanos al centro de gravedad de X e
Y, es decir del punto:
(X) 8 4 12 2 7 9
(Y) 6 4 8 1 4 5