Está en la página 1de 27

UNIVERSIDAD DE EL SALVADOR

EDUCACIÓN A DISTANCIA

ESTADÍSTICA II
EST218
UNIDAD IV: REGRESIÓN Y CORRELACIÓN

4.4 Modelo de regresión lineal simple


4.5 Error estándar de regresión
4.6 Coeficiente de determinación y correlación simple
4.7 Modelo de regresión lineal múltiple
AGENDA

Saludo

Definiciones básicas

Desarrollo
4.4 Modelo de regresión lineal simple
4.5 Error estándar de regresión
4.6 Coeficiente de determinación y
correlación simple
4.7 Modelo de regresión lineal
múltiple
Dudas
Despedida
4.4 Modelo de regresión Lineal Simple

La Regresión mide en forma funcional; es decir, a través de


una ecuación, la posible relación entre las variables, con el
objetivo de predecir o pronosticar una de ellas (variable
dependiente) en función de la otra variable
(independiente).

Para ello utiliza la denominada “Ecuación de Regresión”. Si


el análisis de regresión está referido a dos variables, se trata
de un análisis de regresión simple.

Y = Variable Dependiente o Explicada


X = Variable Independiente o Explicativa
4.4 Modelo de regresión Lineal Simple

¿Cómo determinar si existe relación lineal?

1. Identificar el tipo de relación que existe entre una variable


independiente con una dependiente; a partir de un gráfico,
denominado “diagrama de dispersión”.
2. Cada observación está compuesta por dos valores,
formando un par ordenado (X,Y), los cuales deberán
graficarse en el primer cuadrante del plano cartesiano, de
lo cual resultará el Diagrama de Dispersión.
4.4 Modelo de regresión Lineal Simple

MODELO DE REGRESIÓN LINEAL SIMPLE


𝑦𝐼 = 𝛽0 + 𝛽1 𝑋𝑖 +𝜀𝑖
Donde:
𝑌𝑖: Valor de Y, para la observación i
𝛽0 : Estimador, cuyo valor representa la intercepción con el eje Y
𝛽1 : Estimador, cuyo valor representa la pendiente de la línea recta
𝛽𝑖 : Es la diferencia de Y, que no puede ser explicada por la función de regresión.
𝜀 : Letra griega “épsilon”

ECUACIÓN DE REGRESIÓN LINEAL SIMPLE


𝑦ො𝑖 = 𝛽0 + 𝛽1 𝑋𝑖
Donde:
𝑌𝑖: Valor de Y, para la observación i
𝛽0 : Estimador, cuyo valor representa la intercepción con el eje Y
𝛽1 : Estimador, cuyo valor representa la pendiente de la línea recta
𝜀𝑖 : Es la diferencia de Y, que no puede ser explicada por la función de regresión.
4.4 Modelo de regresión Lineal Simple

Ecuación de regresión estimada


Si se conocieran los valores de los parámetros poblacionales
𝛽0 , 𝛽1 , se podría emplear la ecuación de regresión lineal simple
para calcular el valor medio de 𝑦 para un valor dado de 𝑥. Sin
embargo, en la práctica no se conocen los valores de estos
parámetros y es necesario estimarlos usando datos muestrales.
En la figura siguiente se presentan ejemplos de posibles rectas
de regresión.
4.5 Error estándar de regresión

El error estándar de la regresión es el valor que muestra la


diferencia entre los valores reales y los estimados de una
regresión. Es utilizado para valorar si existe una correlación
entre la regresión y los valores medidos.

ERROR ESTÁNDAR DE ESTIMACIÓN PARA DE REGRESIÓN LINEAL SIMPLE


2
𝑆𝐶𝐸 σ 𝑌𝑖 − 𝑌෠𝑖
𝑠𝑥𝑦 = =
𝑛−2 𝑛−2
Donde
𝑌𝑖 : Valor de Y, para la observación i
𝑌෠𝑖 : Valor estimado de 𝑌𝑖 , a partir de la sustitución de un 𝑥𝑖 , en la observación i.
n: Número de observaciones (tamaño de muestra)
n-2: Número de grados de libertad
2
σ 𝑌𝑖 − 𝑌෠𝑖 : Suma de cuadrados debido al error (SCE)
Regresión y correlación

Ejemplo 1: Salario ($/hora) Escolaridad


4.4567 6
A partir de estos datos, 5.77 7
5.9787 8
correspondientes a una
7.3317 9
muestra de tamaño 13, se 7.1382 10
busca explicar el salario 6.5844 11
7.8182 12
($/hora) a partir del número
7.8351 13
de grados de estudio 11.0223 14
aprobados. Analice los datos 10.6738 15
10.8361 16
de la siguiente tabla. 13.615 17
13.531 18
Regresión y correlación
Primero se inicia
construyendo el ¿Cómo es la
diagrama de tendencia de los
dispersión. datos?

Diagrama de Dispersión
16
14 Luego se
12 calculan los
Salario ($/hora)

10
valores para la
8
6
ecuación de
4 regresión
2 estimada.
0
0 5 10 15 20
Escolaridad
Regresión y correlación
Salario ($/hora) Escolaridad ത
(𝑋𝑖 − 𝑋) ത
(𝑌𝑖 − 𝑌) 𝑋𝑖 − 𝑋ത ∗ (𝑌𝑖 − 𝑌)
ത ത 2
(𝑋𝑖 − 𝑋) 𝑦ො𝑖 𝜀𝑖 = (𝑌𝑖 − 𝑦ො𝑖 ) 𝜀𝑖 2 ത 2
(𝑌𝑖 − 𝑌) (𝑌෠𝑖 − 𝑌)
ത 2

4.4567 6 -6.00 -4.20 25.22 36 4.304 0.1527 0.02331729 17.64 18.974736


5.77 7 -5.00 -2.89 14.45 25 5.03 0.74 0.5476 8.3521 13.1769
5.9787 8 -4.00 -2.68 10.73 16 5.756 0.2227 0.04959529 7.1824 8.433216
7.3317 9 -3.00 -1.33 3.99 9 6.482 0.8497 0.72199009 1.7689 4.743684
7.1382 10 -2.00 -1.52 3.05 4 7.208 -0.0698 0.00487204 2.3104 2.108304
6.5844 11 -1.00 -2.08 2.08 1 7.934 -1.3496 1.82142016 4.3264 0.527076
7.8182 12 0.00 -0.84 0.00 0 8.66 -0.8418 0.70862724 0.7056 0
7.8351 13 1.00 -0.83 -0.83 1 9.386 -1.5509 2.40529081 0.6889 0.527076
11.0223 14 2.00 2.36 4.72 4 10.112 0.9103 0.82864609 5.5696 2.108304
10.6738 15 3.00 2.01 6.04 9 10.838 -0.1642 0.02696164 4.0401 4.743684
10.8361 16 4.00 2.18 8.70 16 11.564 -0.7279 0.52983841 4.7524 8.433216
13.615 17 5.00 4.95 24.77 25 12.29 1.325 1.755625 24.5025 13.1769
13.531 18 6.00 4.87 29.22 36 13.016 0.515 0.265225 23.7169 18.974736
8.66 12.00 132.15 182.00 0.000861538 9.68900906 105.5562 95.927832
Regresión y correlación
Por tanto, la ecuación de regresión estimada es:

σ 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത 132.15

𝛽1 = = = 0.726
σ 𝑋𝑖 − 𝑋ത 2 182

𝛽መ0 = 𝑌ത − 𝛽መ1 𝑋ത = 8.66 − 0.72 12 = −0.052

𝑦ො𝑖 = 𝛽መ0 + 𝛽መ1 𝑥𝑖 ⟹ 𝒚


ෝ𝒊 = −𝟎. 𝟎𝟓𝟐 + 𝟎. 𝟕𝟐𝟔𝑿𝒊

Para𝛽መ1 = 0.726, se espera que por cada grado de escolaridad el


salario aumente $0.726.

Como 𝛽መ0 = −0.052 , por el tipo de variable, el significado


económico de este estimador es irrelevante; ya que, aunque no
tenga escolaridad es ilógico pensar que tendría un salario
negativo.
Regresión y correlación

Error estándar.

2
σ 𝑌𝑖 − 𝑌෠𝑖 𝑆𝐶𝐸 9.689
𝑆𝑥,𝑦 = = = = 0.938
𝑛−2 𝑛−2 11
La dispersión alrededor de la línea de regresión es de $0.938

Coeficiente de determinación.
2
2
𝑆𝐶𝑅 𝑌෠𝑖 − 𝑌ത 95.93
𝑟 = = = = 𝟎. 𝟗𝟎𝟖
𝑆𝑇𝐶 𝑌𝑖 − 𝑌ത 2 105.64
El modelo estimado explica en un 90.8% la variación de los
salarios esperados, a partir de los grados de escolaridad
aprobados.
Regresión y correlación

Coeficiente de determinación.

𝑟 = (𝑠𝑖𝑔𝑛𝑜 𝑑𝑒 𝛽መ1 ) 𝑟 2

𝑟 = 𝑠𝑖𝑔𝑛𝑜 𝑑𝑒 𝛽መ1 0.908 = 𝟎. 𝟗𝟓𝟑

Existe un fuerte grado de asociación lineal positiva entre


escolaridad y salarios.
Regresión lineal múltiple

Es un análisis que busca establecer relación entre variables, de


tipo estadístico; es decir, relación de dependencia.

La diferencia de este análisis respecto al anterior sobre


regresión lineal simple consiste en que ahora no es sólo una
variable explicativa (independiente); sino, dos o más.

𝑌 = 𝑉𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝐷𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒 (𝐿𝑎 𝑞𝑢𝑒 𝑠𝑒 𝑏𝑢𝑠𝑐𝑎 𝑒𝑥𝑝𝑙𝑖𝑐𝑎𝑟)


𝑋1 , 𝑋2 , … 𝑋𝑛 = 𝑉𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠 𝐼𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒𝑠
(𝐸𝑥𝑝𝑙𝑖𝑐𝑎𝑡𝑖𝑣𝑎𝑠) … 𝑑𝑜𝑠 𝑜 𝑚á𝑠.
Diferencia de Interpretación de Parámetros Estimados

෡𝟎 + 𝜷
ෝ𝒊 = 𝜷
𝒚 ෡ 𝟏 𝑿𝟏 + 𝜷
෡ 𝟐 𝑿𝟐 + ⋯ + 𝜷
෡ 𝒏 𝑿𝒏

𝛽መ1 = 𝑀𝑖𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑎 𝑒𝑛 𝑦, 𝑝𝑜𝑟 𝑐𝑎𝑑𝑎 𝑢𝑛𝑖𝑑𝑎𝑑 𝑞𝑢𝑒 𝑖𝑛𝑐𝑟𝑒𝑚𝑒𝑛𝑡𝑎 𝑋1 ,


𝑚𝑎𝑛𝑡𝑒𝑛𝑖𝑒𝑛𝑑𝑜 𝑐𝑜𝑛𝑠𝑡𝑎𝑛𝑡𝑒 𝑒𝑙 𝑟𝑒𝑠𝑡𝑜 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠

𝛽መ2 = 𝑀𝑖𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑎 𝑒𝑛 𝑦, 𝑝𝑜𝑟 𝑐𝑎𝑑𝑎 𝑢𝑛𝑖𝑑𝑎𝑑 𝑞𝑢𝑒 𝑖𝑛𝑐𝑟𝑒𝑚𝑒𝑛𝑡𝑎 𝑋2 ,


𝑚𝑎𝑛𝑡𝑒𝑛𝑖𝑒𝑛𝑑𝑜 𝑐𝑜𝑛𝑠𝑡𝑎𝑛𝑡𝑒 𝑒𝑙 𝑟𝑒𝑠𝑡𝑜 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠

Y así sucesivamente, dependiendo del número de variables


explicativas incluidas en el modelo.
Ejemplo: Caso de dos variables independientes
Según la teoría Inflación Tasa de Inflación
macroeconómica, la Curva Observada Desempleo Esperada
de Phillips Ampliada con Año
(%) (%) (%)
Expectativas plantea que la (Y) (X1) (X2)
tasa de inflación de un país 1970 5.92 4.9 4.78
depende de la tasa de 1971 4.3 5.9 3.84
1972 3.3 5.6 3.13
desempleo y de la tasa de 1973 6.23 4.9 3.44
inflación esperada. A 1974 10.97 5.6 6.84
continuación, se tienen 1975 9.14 8.5 9.47
datos de una serie de tiempo 1976 5.77 7.7 6.51
correspondiente a la tasa de 1977 6.45 7.1 5.92
inflación observada, la tasa 1978 7.6 6.1 6.08
de desempleo y la tasa de 1979 11.47 5.8 8.09
1980 13.46 7.1 10.01
inflación esperada de 1981 10.24 7.6 10.81
Estados Unidos. Calcular la 1982 5.99 9.7 8
ecuación de regresión
múltiple e interpretar los
coeficientes estimados.
Los tres parámetros
estimados son
estadísticamente
significativos.
Coeficientesa
Coefic
ientes
estan
Coeficientes no dariza
estandarizados dos Correlaciones
Error Orden Parci Part
Modelo B estándar Beta t Sig. cero al e
1 (Constante) 7.193 1.595 4.51 .001
1
Desempleo
- -
1.392 .305 -.661 4.56 .001 .116 -.822 -.507
5
Inflación Esperada
1.470 .176 1.212 8.36 3 .000 .787 .935 .929
a.Modelo
Variable dependiente:
estimado utilizandoInflacion_Observada
programa estadístico
SPSS
𝑌෠𝑖 = 𝛽መ0 − 𝛽መ1 𝑋1 + 𝛽መ2 𝑋2
Ecuación de regresión ෡ 𝒊 = 𝟕. 𝟏𝟗𝟑 − 𝟏. 𝟑𝟗𝟐𝑿𝟏 + 𝟏. 𝟒𝟕𝑿𝟐
𝒀
estimada
Interpretación

෡ 𝟎 = 𝟕. 𝟏𝟗
𝜷
Se espera que la tasa de inflación observada sea de 7.19%,
cuando la tasa de desempleo y la tasa de inflación esperada son
0%.
෡ 𝟏 = −𝟏. 𝟑𝟗
𝜷
Se espera que la tasa de inflación observada disminuya 1.39%
por cada 1% de aumento en la tasa de desempleo,
manteniendo constante la tasa de inflación esperada.
෡ 𝟐 = 𝟏. 𝟒𝟕
𝜷
Se espera que la tasa de inflación observada aumente 1.47%
por cada 1% en que aumenta la tasa de inflación esperada,
manteniendo constante la tasa de desempleo.
Interpretación.
De manera global no tiene
significado, en regresión
múltiple. Se debe analizar
las correlaciones parciales.

Resumen del modelo

R cuadrado Error estándar de


Modelo R R cuadrado ajustado la estimación
1
.936a 0.877 .852 1.17060
a. Predictores: (Constante), Inflación_Esperada, Desempleo

La dispersión de la
inflación observada
respecto a la
El modelo en conjunto
estimada es de 1.17%
explica 87.7% la variación
esperada de la tasa de
inflación observada.
Error estándar

Error estándar de estimación en


regresión múltiple
EJEMPLO
El dueño de Showtime Movie Theater, Inc., desea estimar el ingreso
bruto semanal en función de los gastos en publicidad. A
continuación, se presentan los datos históricos de 8 semanas.

a) Obtenga una ecuación de regresión estimada en la que los


montos gastados en publicidad de televisión y en periódicos
sean las variables independientes.
b) ¿Cuál es el ingreso semanal bruto en una semana en la que se
gastan $3500 en publicidad de televisión y $1800 en publicidad de
periódicos?
Solución con Excel

Paso 1: Ubicar los datos en una tabla


Paso 2: Click en Datos
Paso 3: Click en Análisis de datos
Solución con Excel

Se abre ventana de “Análisis de datos”, seleccionar


regresión y dar click en Aceptar
Solución con Excel

Paso 4: dar click en la celda correspondiente a Rango Y de


entrada, seleccionar los valores de Y, luego dar click en la celda
Rango X de entrada y seleccionar las dos columnas de las
variable independientes, luego Aceptar
Resultados

Podemos identificar que : 𝛽𝑂 = 83.23 𝛽1 = 2.29 y 𝛽2 = 1.30


Por lo tanto : 𝑌෡𝑖 = 83.23 + 2.29𝑋1 + 1.30𝑋2
Regresión lineal múltiple

Si 𝑋1 = 35 y 𝑋2 = 18 tenemos que:

𝑌෡𝑖 = 83.23 + 2.29𝑋1 + 1.30𝑋2

𝑌෡𝑖 = 83.23 + 2.29 3.5 + 1.3 1.8

𝑌෡𝑖 = 93.58

Se estima un ingreso semanal de $9,358


Las consultas pueden
hacerlas en el espacio
respectivo de la
plataforma con su
docente tutor

También podría gustarte