Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Ejemplo 1
No hay Relación
relación no lineal
25
20
Resistecia del Hormigón
15
10
0
0 0,5 1 1,5 2 2,5 3 3,5 4
Velocidad de Ultrasonido
Cov( X , Y ) S xy =
( x − x )( y − y ) 1
i i
= x y −xy
i i
n n
▪ Significado de la covariancia:
Cov(X,Y) > 0 → relación lineal positiva
Cov(X,Y) < 0 → relación lineal negativa
Cov(X,Y) = 0 → no hay relación lineal (puede haber de otro tipo)
▪ Problema: la covariancia está en función de las unidades de medida de
las variables (no está estandarizada).
▪ Solución: a partir de la covariancia, definimos otro indicador
(estandarizado), el coeficiente de correlación lineal
yˆ i
residu
yi
xi
(Continua)
Probabilidad y Estadística Profesora: Dra. Alejandra Pérez Bonilla
T2 – 2.5: Recta de regressió
▪ Aplicando mínimos cuadrados, la recta de regresión de Y (variable
dependiente) sobre X (variable independiente) es:
Cov( X , Y ) S xy
b= = 2
ŷ = a + b x Var ( X ) Sx
a = y −b x
▪ Alternativamente: y − y = b ( x − x )
▪ La pendiente, b, se denomina coeficiente de regresión de Y sobre X (no
confundir con el coeficiente de correlación lineal)
▪ Observaciones:
▪ recta X sobre Y ≠ recta Y sobre X
▪ (x, y) es siempre un punto de la recta
▪ recta Y sobre X permite predecir y conociendo el valor de x (i viceversa)
▪ Propiedades de r :
▪
−1 r +1
signe(r ) = signe( S xy )
▪
▪ Si r = +1 ó r = -1 → puntos sobre la recta (correlación lineal total)
▪ Si r > 0 → correlación lineal positiva (recta creciente)
▪ Si r < 0 → correlación lineal negativa (recta decreciente)
▪ Si r = 0 → no hay correlación lineal
(Continua)
Probabilidad y Estadística Profesora: Dra. Alejandra Pérez Bonilla
T2 – 2.6: Correlació
▪ Varianza residual, Sr2 (varianza de los residuos):
S = ( yi − yˆi ) = S y2 (1 − r 2 )
2 1 2
r
n
yi
▪ Variación total de la variable Y, VT: VR
(x, y)
VT
yˆ i
VE
VT = ( yi − y ) = ( yˆi − y ) + ( yi − yˆi )
2 2 2
y
1. Una compañía de seguros considera que el número de vehículos (Y) que circulan por
una autopista, puede ponerse en función del número de accidentes (X) que ocurren
en ella. Durante cinco días se obtuvo los siguientes resultados:
Xi 5 7 2 1 9
Yi 15 18 10 8 20
1. En un mercado de una ciudad se han observado durante 6 días consecutivos las cantidades de sardinas
vendidas en cientos de Kilogramos (C) y el precio correspondiente en $/kg (P). A partir de dichos datos
se han elaborado los siguientes resultados:
Se pide:
a) Calcular a y b en la recta de regresión C*= a + bP. (0.5 puntos)
b) Calcular la varianza de C y su descomposición en la varianza explicada por la regresión y varianza
residual. (0.5 puntos)
c) Calcular el coeficiente de determinación. (0.5 puntos)
d) Para un precio de 100 $/kg, ¿qué valor estimarías para la cantidad de sardinas vendidas? (0.5
puntos)