Está en la página 1de 12

Modelos Lineales

Probabilidad y Estadística Profesora: Dra. Alejandra Pérez Bonilla


T2 – 2.2: Distribuciones Bidimensionales
▪ Distribución bidimensional: cada
observación de un elemento de la
muestra está representada por un
pare de valores (x,y)

Ejemplo 1

Probabilidad y Estadística Profesora: Dra. Alejandra Pérez Bonilla


T2 – 2.3: Diagramas Bivariantes
▪ La representación gráfica de los pares (x,y) se denomina
nube de puntos (scatterplot)

Relación lineal Relación lineal


positiva negativa

No hay Relación
relación no lineal

Probabilidad y Estadística Profesora: Dra. Alejandra Pérez Bonilla


T2 – 2.3: Diagramas Bivariantes
30

25

20
Resistecia del Hormigón

15

10

0
0 0,5 1 1,5 2 2,5 3 3,5 4
Velocidad de Ultrasonido

Probabilidad y Estadística Profesora: Dra. Alejandra Pérez Bonilla


T2 – 2.4: Covarianza
▪ La covarianza es un indicador del grado de interdependencia lineal
entre dos variables X e Y:

Cov( X , Y )  S xy =
 ( x − x )( y − y ) 1
i i
= x y −xy
i i
n n
▪ Significado de la covariancia:
Cov(X,Y) > 0 → relación lineal positiva
Cov(X,Y) < 0 → relación lineal negativa
Cov(X,Y) = 0 → no hay relación lineal (puede haber de otro tipo)
▪ Problema: la covariancia está en función de las unidades de medida de
las variables (no está estandarizada).
▪ Solución: a partir de la covariancia, definimos otro indicador
(estandarizado), el coeficiente de correlación lineal

Probabilidad y Estadística Profesora: Dra. Alejandra Pérez Bonilla


T2 – 2.5: Recta de regresión
▪ La recta de regresión de Y sobre X es aquella recta (modelo) de la
forma ŷ = a + b  x que “mejor se ajusta” a la nube de puntos
▪ Para determinar los valores óptimos de los coeficientes a y b, se
emplea el método de los mínimos cuadrados, el cual minimiza la
suma de los cuadrados de los residuos (diferencies entre los
valores observados, yi , y los teóricos predichos por el modelo, yˆ i
):
(x, y)

yˆ i
residu
yi

xi
(Continua)
Probabilidad y Estadística Profesora: Dra. Alejandra Pérez Bonilla
T2 – 2.5: Recta de regressió
▪ Aplicando mínimos cuadrados, la recta de regresión de Y (variable
dependiente) sobre X (variable independiente) es:
Cov( X , Y ) S xy
b= = 2
ŷ = a + b  x Var ( X ) Sx
a = y −b x

▪ Alternativamente: y − y = b  ( x − x )
▪ La pendiente, b, se denomina coeficiente de regresión de Y sobre X (no
confundir con el coeficiente de correlación lineal)
▪ Observaciones:
▪ recta X sobre Y ≠ recta Y sobre X
▪ (x, y) es siempre un punto de la recta
▪ recta Y sobre X permite predecir y conociendo el valor de x (i viceversa)

Probabilidad y Estadística Profesora: Dra. Alejandra Pérez Bonilla


T2 – 2.6: Correlació
▪ Coeficiente de correlación lineal, r, (indicador estandarizado
del grado de interdependencia lineal):
S xy
r=
Sx  S y

▪ Propiedades de r :

−1  r  +1
signe(r ) = signe( S xy )

▪ Si r = +1 ó r = -1 → puntos sobre la recta (correlación lineal total)
▪ Si r > 0 → correlación lineal positiva (recta creciente)
▪ Si r < 0 → correlación lineal negativa (recta decreciente)
▪ Si r = 0 → no hay correlación lineal
(Continua)
Probabilidad y Estadística Profesora: Dra. Alejandra Pérez Bonilla
T2 – 2.6: Correlació
▪ Varianza residual, Sr2 (varianza de los residuos):

S =  ( yi − yˆi ) = S y2 (1 − r 2 )
2 1 2
r
n
yi
▪ Variación total de la variable Y, VT: VR
(x, y)
VT
yˆ i
VE
VT =  ( yi − y ) = ( yˆi − y ) +  ( yi − yˆi )
2 2 2
y

Variación Total (VT) Variación Explicada (VE) Variación Residual (VR)


xi
▪ El coeficiente de determinación, R2, nos dice que porcentaje de la
variación en Y es explicada per la variación en X i el modelo:
VE
R2 = r 2 =
VT
▪ El modelo seria válido per a hacer predicciones si aprox R 2  80%

Probabilidad y Estadística Profesora: Dra. Alejandra Pérez Bonilla


T2 – 2.7: Ejercicio 1

1. Una compañía de seguros considera que el número de vehículos (Y) que circulan por
una autopista, puede ponerse en función del número de accidentes (X) que ocurren
en ella. Durante cinco días se obtuvo los siguientes resultados:

Xi 5 7 2 1 9
Yi 15 18 10 8 20

Explique justificadamente si será posible obtener un modelo lineal bueno.

Probabilidad y Estadística Profesora: Dra. Alejandra Pérez Bonilla


T2 – 2.7: Ejercicio 2

1. En un mercado de una ciudad se han observado durante 6 días consecutivos las cantidades de sardinas
vendidas en cientos de Kilogramos (C) y el precio correspondiente en $/kg (P). A partir de dichos datos
se han elaborado los siguientes resultados:

Se pide:
a) Calcular a y b en la recta de regresión C*= a + bP. (0.5 puntos)
b) Calcular la varianza de C y su descomposición en la varianza explicada por la regresión y varianza
residual. (0.5 puntos)
c) Calcular el coeficiente de determinación. (0.5 puntos)
d) Para un precio de 100 $/kg, ¿qué valor estimarías para la cantidad de sardinas vendidas? (0.5
puntos)

Probabilidad y Estadística Profesora: Dra. Alejandra Pérez Bonilla


Probabilidad y Estadística Profesora: Dra. Alejandra Pérez Bonilla

También podría gustarte