Está en la página 1de 5

06 de mayo de 2021

Tema: Estadística Inferencial – Regresión Lineal

Objetivo: “Sacar, extraer” información y poder concluir acerca de una población, por medio de
una muestra. Por tanto, resulta necesario poder encontrar una muestra que mejor me “hable” de
la población, para ello se utiliza un método que se conoce como muestreo.

Métodos:

1. Estimación puntual
2. Intervalos de confianza
3. Pruebas de Hipótesis
4. Regresión Lineal Simple
4.1. Conceptos básicos
a. Muestras Bivariadas
Se habla de una muestra bivariada, en el momento particular en el que nos interesa la
revisión de dos variables X,Y. En este caso a la variable X, la llamaremos como, variable
independiente, mientras que la variable Y, será conocida como dependiente. Es por lo
anterior, que referenciamos esta situación de la forma
𝑦(𝑥) ≔ y es función de x
Ej.:
a. Muestra 1: Se considera una muestra de n elementos, en donde interesa consultar
la cantidad de contagiados por COVID19 y que no hacen teletrabajo
𝑦 ≔ Contagiados de COVID 19
𝑥 ≔ No hacen teletrabajo
𝑦(𝑥) = 𝐶𝑜𝑛𝑡𝑎𝑔𝑖𝑜𝑠(𝑁𝑜 ℎ𝑎𝑐𝑒𝑟 𝑡𝑒𝑙𝑒𝑡𝑟𝑎𝑏𝑎𝑗𝑜)

b. Muestra 2: Una muestra de n pruebas de laboratorio de sangre, en donde se quiere


revisar si la persona sufre de problemas de azúcar
𝑦 ≔ Personas que tienen problemas con el azúcar
𝑥 ≔ Pruebas de laboratorio

c. Muestra 3: Un profesor toma una muestra de n estudiantes y revisa la nota del


examen final, y su intención es estudiar dichos resultados contrastando con la
prueba parcial ¿influyen los resultados de la nota parcial con la nota final?

𝑦 ≔ Resultados Prueba Final


𝑥 ≔ Resultados Prueba Parcial
A partir de este tipo de graficas nosotros podemos concluir de las muestras que, existen diferentes
tipos de relaciones entre las variables, lo que se conoce en estadística como la correlación, que,
además, puede ser:
b. Coeficiente de correlación lineal (r) – Coeficiente de Pearson

Para nuestro ejemplo


𝑥̅ = 58.4
𝑦̅ = 69.5
1
𝑠𝑥2 = [(60 − 58.4)2 + (74 − 58.4)2 + ⋯ +] = 166.4889
9
𝑆𝑥 = √166.4889 = 12.903
1
𝑠𝑦2 = [(72 − 69.5)2 + (82 − 69.5)2 + ⋯ +] = 121.8333
9
𝑆𝑦 = √121.8333 = 11.0378

1
𝑆𝑥𝑦 = [(60 − 58.4)(72 − 69.5) + (74 − 58.4)(82 − 69.5) + (66 − 58.4)(75 − 69.5)
9
+ (34 − 58.4)(46 − 69.5) + (60 − 58.4)(73 − 69.5) + (66 − 58.4)(74 − 69.5)
+ (57 − 58.4)(70 − 69.5) + (71 − 58.4)(82 − 69.5) + (39 − 58.4)(60 − 69.5)
+ (57 − 58.4)(61 − 69.5)] = 134.1111 …
Con esta información, es posible calcular el coeficiente de correlación
𝑆𝑥𝑦 134.11
𝒓= = = 0.9416
𝑆𝑥 𝑆𝑦 12.903 × 11.0378
𝐶𝑒𝑟𝑐𝑎𝑛𝑜 𝑎 − 1; 𝑅𝑒𝑐𝑡𝑎 𝐷𝑒𝑐𝑟𝑒𝑐𝑖𝑒𝑛𝑡𝑒 → correlación lienal negativa fuerte
𝑟 = { 𝐶𝑒𝑟𝑐𝑎𝑛𝑜 𝑎 1; 𝑅𝑒𝑐𝑡𝑎 𝐶𝑟𝑒𝑐𝑖𝑒𝑛𝑡𝑒 → correlación lineal positiva fuerte
𝐶𝑒𝑟𝑐𝑎𝑛𝑜 𝑎 0; 𝑅𝑒𝑐𝑡𝑎 𝐶𝑟𝑒𝑐𝑖𝑒𝑛𝑡𝑒 → No existe correlación lineal
𝑈𝑛 𝑣𝑎𝑙𝑜𝑟 𝑖𝑛𝑡𝑒𝑟𝑚𝑒𝑑𝑖𝑜 𝑎 − 1; 𝑅𝑒𝑐𝑡𝑎 𝐷𝑒𝑐𝑟𝑒𝑐𝑖𝑒𝑛𝑡𝑒 → correlación lienal negativa debil
𝑟 = { 𝑈𝑛 𝑣𝑎𝑙𝑜𝑟 𝑖𝑛𝑡𝑒𝑟𝑚𝑒𝑑𝑖𝑜 𝑎 1; 𝑅𝑒𝑐𝑡𝑎 𝐶𝑟𝑒𝑐𝑖𝑒𝑛𝑡𝑒 → correlación lineal positiva debil
𝑈𝑛 𝑣𝑎𝑙𝑜𝑟 𝑖𝑛𝑡𝑒𝑟𝑚𝑒𝑑𝑖𝑜 𝑎 0; 𝑅𝑒𝑐𝑡𝑎 𝐶𝑟𝑒𝑐𝑖𝑒𝑛𝑡𝑒 → No existe correlación lineal
Por tanto, para nuestro ejemplo, tenemos una muestra con correlación lineal positiva fuerte.

𝒚 = 𝒎𝒙 + 𝒃
𝒎 ≔ 𝒑𝒆𝒏𝒅𝒊𝒆𝒏𝒕𝒆
𝒃 ≔ 𝒑𝒖𝒏𝒕𝒐 𝒅𝒆 𝒄𝒐𝒓𝒕𝒆 𝒄𝒐𝒏 𝒆𝒍 𝒆𝒋𝒆 𝒅𝒆𝒑𝒆𝒏𝒅𝒊𝒆𝒏𝒕𝒆
En este caso, la ecuación de mi modelo de regresión lineal estará dada por
𝑦̂ = 𝛽̂1 𝑥 + 𝛽̂0

10𝛽̂0 + 584𝛽
̂1 = 695
̂0 + 35604𝛽
584𝛽 ̂1 = 41795

𝛽̂1 ≔ 𝑃𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒 10𝑥 + 584𝑦 = 695


584𝑥 + 35604𝑦 = 41795
𝛽̂0 ≔ 𝑃𝑢𝑛𝑡𝑜 𝑑𝑒 𝐶𝑜𝑟𝑡𝑒

̂0 = 22.457;
𝛽 ̂1 = 0.8055
𝛽

𝑦̂ = 𝛽̂1 𝑥 + 𝛽̂0 → 𝑦̂ = 0.8055𝑥 + 22.457

Gráfica de Dispersión
90
80
70
60
Nota Final

50
40
30
20
10
0
0 20 40 60 80
y = 0,8055x + 22,457 Nota Parcial
R² = 0,8867

También podría gustarte