Está en la página 1de 31

Bienvenidos al curso de

ESTADÍSTICA INFERENCIAL
Profesor: Mg. JIMMY RONNY ACOSTA MIELES
2022 UTP CAMPUS ATE
Cuéntanos en el aula:
¿Qué se entiende por variables y como se
pueden relacionar estadísticamente?
Unidad de Aprendizaje 4:
REGRESIÓN LINEAL Y MÚLTIPLE
REGRESIÓN LINEAL SIMPLE. INTERVALOS DE PREDICCIÓN.
COEFICIENTE DE CORRELACIÓN

SESIÓN 14
¿Qué observamos?
REGRESIÓN LINEAL SIMPLE
El análisis de REGRESIÓN LINEAL SIMPLE es la relación de dependencia
que existe entre las variables en estudio X e Y con un margen aleatorio de error entre los
datos, donde X es la variable independiente (VARIABLE PREDICTORA), Y es la
variable dependiente (VARIABLE ESTIMADORA) y e es el error que se tiene que
minimizar para las predicciones.
Así tenemos

𝑌෠ = 𝐹 𝑋, 𝑒 = 𝐹 𝑋 + 𝑒
𝑋, 𝑌 = 𝑥𝑖, 𝑦𝑖 : 𝑖 = 1, 𝑛 ⊏ 𝑛
Datos/Observaciones
MODELO DE REGRESION LINEAL SIMPLE
El modelo de regresión lineal simple que relaciona las variables X e Y, se
puede expresar mediante la recta 𝒀 ෡ = 𝜷𝒐 + 𝜷𝟏𝑿. Así tenemos los coeficientes que
resultan mediante la aplicación del método de los mínimos cuadrados, esto es
𝑛 𝑛 𝑛
𝑛 σ𝑖=1 𝑋𝑖 𝑌𝑖− σ𝑖=1 𝑋𝑖
σ𝑖=1 𝑌𝑖
𝛽1 = 2
𝑛 2 𝑛
𝑛 σ𝑖=1 𝑋𝑖 − σ𝑖=1 𝑋𝑖
𝑛 𝑛
σ𝑖=1 𝑌𝑖 − 𝛽1 σ𝑖=1 𝑋𝑖
𝛽0 =
𝑛
Datos/Observaciones
RELACION ENTRE LOS COEFICIENTES 𝜷𝒐 𝒚 𝜷𝟏
Los coeficientes de regresión lineal simple 𝜷𝒐 𝒚 𝜷𝟏 nos da
información sobre el comportamiento de la variable Y en relación de la variable X. Así
tenemos las siguientes condiciones:
C1: Si 𝜷𝟏 = 𝟎 entonces nos indica que para cualquier valor de X la
variable Y es constante.
C2: Si 𝜷𝟏 < 𝟎 entonces nos indica que al aumentar valor de X la
variable Y es decreciente.
C3: Si 𝜷𝟏 > 𝟎 entonces nos indica que al aumentar valor de X la
variable Y es creciente.
Datos/Observaciones
REGRESION LINEAL SIMPLE DECRECIENTE
El modelo de regresión lineal simple que relaciona las variables X e Y es

DECRECIENTE, cuando la recta 𝒀 = 𝜷𝒐 + 𝜷𝟏𝑿 tiene pendiente negativa 𝜷𝟏 < 𝟎.

𝜷𝒐
𝒙𝟐, 𝒚𝟐
𝒙𝟒, 𝒚𝟒
𝒙𝟔, 𝒚𝟔
𝒙𝟏, 𝒚𝟏 𝒙𝟑, 𝒚𝟑
𝒙𝒏, 𝒚𝒏

𝒙𝟓, 𝒚𝟓
𝒙𝟕, 𝒚𝟕 ෡ = 𝜷𝒐 + 𝜷𝟏𝑿
𝒀
Datos/Observaciones
Ejemplo 1:
La empresa CARTEX S.A. que exporta cajas metálicas para uso industrial, ha realizado un
estudio en que relaciona el tiempo de uso en años y el porcentaje de eficiencia de unas
máquinas. Para ello, se ha registrado los siguientes datos :
Tiempo de Uso 2 4 11 9 4 6 7 8
Eficiencia 90 65 25 40 80 60 35 50
a. Identificar las variables de interés y clasificarla.
b. Estimar el modelo de regresión lineal simple.
c. Pronosticar: ¿Cuánto será la eficiencia de una máquina que tiene un tiempo de uso de
5 años?
d. Graficar el diagrama de dispersion.

Datos/Observaciones
Solución:
a. X(VARIABLE INDEPENDIENTE)= Tiempo de uso en años de las máquinas
Y(VARIABLE DEPENDIENTE)= Porcentaje de eficiencia de las máquinas
b. X Y XY X2 Calculando los coeficientes
8 2400 − (51)(445)
2 90 180 4 =
8 387 − 51 2
4 65 260 16
11 25 275 121 𝛽1 = −7.0606
n=8 9 40 360 81
445 − (−7.0606)(51)
4 80 320 16 =
8
6 60 360 36
7 35 245 49 𝛽0 = 100.6363
8 50 400 64 Por lo tanto, la recta de regresión lineal es
51 445 2400
Datos/Observaciones
387 ෡ = 𝜷𝟎 + 𝜷𝟏𝑿 = 𝟏𝟎𝟎. 𝟔𝟑𝟔𝟑 − 𝟕. 𝟎𝟔𝟎𝟔𝑿
𝒀
c. Pronosticar: ¿Cuánto será la eficiencia de una máquina
que tiene un tiempo de uso de 5 años?
𝑋 = 5 𝑎ñ𝑜𝑠, 𝑌෠5 = 100.6363 − 7.0606 5 = 65.3333%
d. Diagrama de Dispersión

Datos/Observaciones
REGRESION LINEAL SIMPLE CRECIENTE
El modelo de regresión lineal simple que relaciona las variables X e Y es

CRECIENTE, cuando la recta 𝒀 = 𝜷𝒐 + 𝜷𝟏𝑿 tiene pendiente positiva 𝜷𝟏 > 𝟎.

𝒙𝒏, 𝒚𝒏 ෡ = 𝜷𝒐 + 𝜷𝟏𝑿
𝒀
𝒙𝟔, 𝒚𝟔

𝒙𝟑, 𝒚𝟑 𝒙𝟕, 𝒚𝟕

𝒙𝟏, 𝒚𝟏 𝒙𝟓, 𝒚𝟓
𝒙𝟒, 𝒚𝟒
𝒙𝟐, 𝒚𝟐
𝜷𝒐
Datos/Observaciones
Ejemplo 2:
La empresa ProduTEC S.A. ha realizado un estudio en que relaciona los puntajes de la
calidad del producto con la productividad entre los operadores del área de productividad y
despacho. Para ello, después de constantes capacitaciones, se ha registrado los siguientes
puntajes:
Puntajes de Calidad 8 15 5 20 12 10 6
Productividad 20 30 25 50 22 35 18

a. Identificar las variables de interés y clasificarla.


b. Estimar el modelo de regresión lineal simple.
c. Pronosticar: ¿Cuánto será la productividad que tiene un trabajador si ha obtenido como
puntaje 25 puntos?
d. Graficar el diagrama de dispersion.

Datos/Observaciones
Solución:
a. X(VARIABLE INDEPENDIENTE)= Los puntajes de la calidad del producto
Y(VARIABLE DEPENDIENTE)= Productividad de los operarios
b. Calculando los coeficientes
X Y XY X2
7 2457 − (76)(200)
8 20 160 64 =
7 994 − 76 2
15 30 450 225
5 25 125 25 𝛽1 = 1.6912
n=7 20 50 1000 400 200 − (1.6912)(76)
12 22 264 144 =
7
10 35 350 100
𝛽0 = 10.2098
6 18 108 36
76 200 2457 994 Por lo tanto, la recta de regresión lineal es
Datos/Observaciones
෡ = 𝜷𝟎 + 𝜷𝟏𝑿 = 𝟏𝟎. 𝟐𝟎𝟗𝟖 + 𝟏. 𝟔𝟗𝟏𝟐𝑿
𝒀
c. Pronosticar: ¿Cuánto será la productividad que tiene
un trabajador si ha obtenido como puntaje 25 puntos?
𝑋 = 25 𝑝𝑢𝑛𝑡𝑜𝑠, 𝑌෠25 = 10.2098 + 1.6912 25 = 52.4898 ~52 𝑝𝑟𝑜𝑑𝑢𝑐𝑡𝑜𝑠
d. Diagrama de Dispersión

Datos/Observaciones
I.C. DE REGRESION LINEAL SIMPLE
El intervalo de confianza de regresión lineal simple es un conjunto
que puede acotar una predicción para un valor de Y dado x=xo en X con un nivel de
confianza 1 − 𝛼 % . Así tenemos que, el intervalo de confianza esta dado por

෡ 𝑿𝒐
𝒀
𝑰𝑪 𝒀/𝑿 = 𝑿𝒐 1 𝑋𝑜 − 𝑋ത 2
𝐼𝐶 𝑌/𝑋 = 𝑋𝑜 = 𝑌෠ ± 𝑇𝛼 𝐶𝑀𝐸 +
𝑛 𝑆𝐶 𝑋
𝑛

𝑌෠ = 𝛽𝑜 + 𝛽1(𝑋𝑜) 𝑆𝐶(𝑋) = ෍ 𝑋𝑖2 − 𝑛𝑋ത 2


𝑖=1

σ𝑛𝑖=1 𝑌𝑖 2 − 𝑛𝑌ത 2 − 𝛽1 σ𝑛𝑖=1 𝑋𝑖𝑌𝑖 − 𝑛𝑋ത 𝑌ത


𝐶𝑀𝐸 =
Datos/Observaciones 𝑿𝒐 𝑛−1
Ejemplo 3:
La empresa MercADO7 S.A. que promueve plataformas de ciencias e ingenierías, ha
realizado un estudio en que relaciona el tiempo en meses desde que se abrió una
plataforma IngePRO77 y el número de suscriptores en miles en la plataforma. Para ello, se
ha registrado los siguientes datos:
Tiempo en meses 1 4 6 2 5 7
Número de Suscriptores 2.1 3.3 4.4 3.0 4.0 5.2

a. Identificar las variables de interés y clasificarla.


b. Estimar el modelo de regresión lineal simple.
c. Pronosticar: ¿Cuánto será el numero de suscriptores durante 11 meses?
d. Hallar el intervalo de confianza para xo=11 meses con un nivel de confianza del 95%.
e. Graficar el diagrama de dispersion.

Datos/Observaciones
Solución:
a. X(VARIABLE INDEPENDIENTE)=
Y(VARIABLE DEPENDIENTE)=
b. n=6 Calculando los coeficientes
X Y XY X2 Y2
=

𝛽1 =

𝛽0 =

Por lo tanto, la recta de regresión lineal es


Datos/Observaciones
c. Pronosticar: ¿Cuánto será el numero de suscriptores en la
Plataforma IngePRO77 durante 11 meses?

d. Hallar el intervalo de confianza para xo=11 meses con un nivel de confianza del 95%.

Datos/Observaciones
e. Diagrama de Dispersión

Datos/Observaciones
CORRELACIÓN Y DETERMINACIÓN
El coeficiente de correlación de PEARSON (rXY) es un índice que
mide el grado de covariación y dependencia entre las variables X e Y de forma lineal. Así
tenemos que, el coeficiente de correlación de forma DIRECTA o INVERSA es
−𝟏 ≤ 𝒓𝑿𝒀 ≤ 𝟏 𝑛 σ𝑛𝑖=1 𝑋𝑖𝑌𝑖 − σ𝑛𝑖=1 𝑋𝑖. σ𝑛𝑖=1 𝑌𝑖
𝑟𝑋,𝑌 =
2 2
𝑛 σ𝑛𝑖=1 𝑋𝑖 2 − 𝑛
σ𝑖=1 𝑋𝑖 𝑛 σ𝑛𝑖=1 𝑌𝑖 2 − 𝑛
σ𝑖=1 𝑌𝑖
N Rango de Valores de rXY Interpretación
0.00 ≤ 𝑟𝑋𝑌 < 0.10 𝐶𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑁𝑢𝑙𝑎
0.10 ≤ 𝑟𝑋𝑌 < 0.30 𝐶𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝐷é𝑏𝑖𝑙
0.30 ≤ 𝑟𝑋𝑌 < 0.50 𝐶𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑀𝑜𝑑𝑒𝑟𝑎𝑑𝑎
0.50 ≤ 𝑟𝑋𝑌 < 1.00 𝐶𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝐹𝑢𝑒𝑟𝑡𝑒
Datos/Observaciones
Diagrama de Dispersión 01 Diagrama de Dispersión 02

෡ = 𝜷𝒐 + 𝜷𝟏𝑿
𝒀
Diagrama de Dispersión 03 Diagrama de Dispersión 04

Datos/Observaciones
Diagrama de Dispersión 01 Diagrama de Dispersión 02

෡ = 𝜷𝒐 + 𝜷𝟏𝑿
𝒀

Diagrama de Dispersión 03 Diagrama de Dispersión 04

Datos/Observaciones
CORRELACIÓN Y DETERMINACIÓN
El coeficiente de DETERMINACIÓN (r2) es la proporción o porcentaje de
la variación total entre las variables X e Y, y nos ayuda a determinar la ajustabilidad del
modelo de regresión lineal. Así tenemos que,
−𝟏 ≤ 𝒓𝑿𝒀 ≤ 𝟏
2
0≤𝑟 𝑋,𝑌 ≤1
N 2
Si 𝑟𝑋,𝑌 está muy cerca de 1 entonces el ajuste del
modelo lineal será MAYOR Y CONFIABLE
2
Si 𝑟𝑋,𝑌 está muy cerca de 0 entonces el ajuste del
modelo lineal será MENOR Y NO CONFIABLE

Datos/Observaciones
Ejemplo 4:
La empresa FooDChef que atiende con calidad y buena presentación a sus clientes en
especialidad de comida marina, ha realizado un estudio en que relaciona el tiempo de
atención por cliente y la propina otorgada por los clientes. Para ello, se ha registrado los
siguientes datos:
Tiempo en minutos 3 2 2 4 1 4 3 2 2
Propina en soles 1 3 3 2 6 1 2 3 4

a. Identificar las variables de interés y clasificarla.


b. Calcular el coeficiente de correlación de PEARSON e interpretar
c. Calcular el coeficiente de determinación e interpretar.

Datos/Observaciones
Solución:
a. X(VARIABLE INDEPENDIENTE)=
Y(VARIABLE DEPENDIENTE)=
b. X Y XY X2 Y2

n=9

Datos/Observaciones
Ejemplo 5:
La empresa ProduTEC S.A. ha realizado un estudio en que relaciona los puntajes de la
calidad del producto con la productividad entre los operadores del área de productividad y
despacho. Para ello, después de constantes capacitaciones, se ha registrado los siguientes
puntajes:
Puntajes de Calidad 10 12 5 20 12 10 8 6 15
Productividad 22 35 20 60 22 35 20 18 50

a. Identificar las variables de interés y clasificarla.


b. Calcular el coeficiente de correlación de PEARSON e interpretar
c. Calcular el coeficiente de determinación e interpretar.

Datos/Observaciones
Solución:
a. X(VARIABLE INDEPENDIENTE)=
Y(VARIABLE DEPENDIENTE)=
b. X Y XY X2 Y2

n=9

Datos/Observaciones
CONCLUSIONES:
1) Los modelos de ajuste de regresión lineal
simple nos ayuda a relacionar la
dependencia de las variables
independientes (X) y las variables
dependientes (Y), y nos ayuda a
pronosticar.
2) Los coeficientes de determinación (r2xy) y
correlación (rxy) nos ayuda a medir el grado
de dependencia y la relación que tiene las
variables X e Y.
Datos/Observaciones
Muchas Gracias!!!

Datos/Observaciones

También podría gustarte