Está en la página 1de 30

Jessica Oliva Gastulo

joliva@usat.edu.pe

www.usat.edu.pe
www.usat.edu.pe
Logro de la sesión:

• Aplicar, desarrollar y analizar las técnicas de


regresión lineal para hacer predicciones de
sucesos futuros.
• Interpreta los resultados de los problemas
resueltos.

www.usat.edu.pe
Simple
Lineal
Múltiple

Parabólico
Regresión
Exponencial

No Lineal Potencia

Logarítmico

Etc.

www.usat.edu.pe
ESCENARIO

• ¿Existe o no relación entre dos variables


cuantitativas?
• ¿Existe o no una tendencia en la relación
entre las dos variables?
• ¿Cómo es la tendencia?
• ¿Cómo cambian los valores de una en
función de los valores de otra variable?

www.usat.edu.pe
Análisis de
regresión lineal

www.usat.edu.pe
Análisis de regresión lineal simple
- Identificando las variables -

Gastos e Ingresos Gastos(Y) e Ingresos(X) ↑𝑿 ↑𝒀

N° de trabajadores y tiempo (X) N° de trabajadores y tiempo (Y) ↑𝑿 ↓𝒀

N° de clientes y ventas (X) N° de clientes y ventas (Y) ↑𝑿 ↑𝒀

Costo del agua y la cantidad (X) Costo del agua y la cantidad


consumida de agua consumida de agua (Y) ↑𝑿 ↓𝒀

www.usat.edu.pe
Diagrama de dispersión (nube de puntos)

Algo de relación positiva Mucha relación positiva Poca relación negativa

Mucha relación negativa Ninguna relación entre X e Y

www.usat.edu.pe
Análisis de Regresión Lineal Simple

• Se usa para determinar la relación entre dos variables.

• Supone una relación entre la variable de respuesta, Y,


la variable X, que es una función lineal:

yˆ = b0 + b1 x

www.usat.edu.pe
Modelo de Regresión Lineal Simple

ˆ = b0 + b1 x
y
Y

• b0 es la intersección con el eje Y.


• b1 es la pendiente de la línea

www.usat.edu.pe
Análisis de Regresión Simple - pasos

Existen muchas maneras de encarar un análisis de correlación.


Nosotros recomendamos la siguiente:
1. Elaborar e interpretar el diagrama de dispersión
2. Calcular e interpretar el coeficiente de correlación. (Prueba de
hipótesis)
3. Calcular e interpretar el coeficiente de determinación.
4. Hacer la prueba de significancia del modelo. (Prueba de
hipótesis)
5. Encontrar el modelo e interpretar los coeficientes de la variable
independiente.
6. Realizar estimaciones si el modelo es significativo.
7. Indudablemente, que el uso tanto del Excel o del SPSS, facilita
los cálculos.

www.usat.edu.pe
Ecuaciones de Mínimos Cuadrados

Ecuación: ˆ = b0 + b1 x
y
( x y )
 xi yi −
n
i i

b1 =
Pendiente:
(
−  i
x )2

 xi 2

Corte con el eje Y: b0 = y − b1 x

www.usat.edu.pe
Análisis Estadístico: Del Modelo
• H0: 0=1=0: El modelo no es significativo,
• Ha: al menos uno de ellos es diferente de cero: El modelo es significativo.
– Se utiliza la prueba F, cuya fórmula es la siguiente:
R2
Fc = k − 12 Fa (k-1;n-k)
1− R
n−k
Donde: n = número de observaciones
– k = número de parámetros en el modelo.
– k - 1 = grados de libertad del numerador
– n - k = grados de libertad del denominador
Comparar con el valor de la distribución F de la tabla:

Si Fc ≥ Fa se rechaza H0

www.usat.edu.pe
Coeficiente de Correlación Lineal (R)

• El coeficiente de correlación lineal “R” mide el grado


de afinidad o asociación entre dos variables cuando
ellas están relacionadas mediante una línea recta.
• Se calcula de la siguiente forma:

n  xi yi − ( xi )( yi )
R=
n  x − ( xi ) n  y − ( yi )
2 2 2 2
i i

www.usat.edu.pe
Coeficiente de Correlación

Correlación negativa Correlación


perfecta Sin correlación positiva perfecta

-1,0 -0,5 0 +0,5 +1,0

Aumento de la correlación negativa Aumento de la correlación


positiva

www.usat.edu.pe
Coeficiente de correlación y modelo de regresión

Y r=1 Y r = -1
Y^i = a + b X i
^
Yi = a + b X i

X X

Y r = 0,89 Y r=0

^Y = a + b X Y^i = a + b X
i i i

X X

www.usat.edu.pe
La Correlación y su interpretación

El valor de “r” siempre está entre –1 y 1 → (–1  r  1)

En la interpretación clásica del coeficiente de correlación, se


sostiene que si:

a) 0.00  r < 0.20, existe una correlación no significativa

b) 0.20  r < 0.40, existe una correlación baja

c) 0.40  r < 0.70, existe una significativa correlación

d) 0.70  r < 1.00, existe un alto grado de asociación

www.usat.edu.pe
Prueba de hipótesis de Coeficiente de correlación ( ρ )

• Ho: ρ = 0 : No existe correlación entre X-Y


H1: ρ ≠ 0 : Existe correlación entre X-Y
• Elegir el nivel de significancia
• Definir la región crítica: ± t, con n-2 g.l.
• Calcular el estadístico de prueba:
• Tomar la decisión y concluir.

n−2
tc = r
1− r 2

www.usat.edu.pe
Intervalos de los coeficientes

• Para βo:
ˆ0 − t na− 2ˆ    0  ˆ0 + t na− 2ˆ 
0 0

• Para β1:
ˆ1 − t na−2ˆ   1  ˆ1 + t na−2ˆ 
1 1

www.usat.edu.pe
Hipótesis del coeficiente β1:

• H0:  1=0, Ha:  1  0.


• Para probar la significancia de 1 se utiliza la prueba t, cuya
fórmula es la siguiente:

ˆ1
tc =
S ˆ1

Donde la Desviación estándar estimada del parámetro se


calcula con la siguiente fórmula:
𝐸𝐸𝐸
𝑆𝛽1 =
σ 𝑥𝑖 − 𝑥ҧ 2

www.usat.edu.pe
Error estándar de estimación (Se):
Es una medida de las diferencias (o distancias) entre los valores y
de muestras observadas y los valores y* predichos que se obtienen
usando la ecuación de regresión; está dada por:

Se =
 i − bo  yi − b1  xi yi
y 2

n−2

20
www.usat.edu.pe
Ejemplo
Consumidor Consumo Ingreso
Un economista del Departamento de 1 16.2 24.3
2 8.5 12.5
Recursos Humanos está preparando un
3 15.0 31.2
estudio sobre el comportamiento del 4 17.0 28.0
consumidor. Él recolectó los datos que 5 24.2 35.1
aparecen en miles de dólares para 6 11.2 10.5
determinar si existe una relación entre el 7 15.0 23.2
ingreso del consumidor y los niveles de 8 7.1 10.0
consumo. 9 3.5 8.5
10 11.5 15.9

a. Identifique la variable dependiente e independiente y trace un diagrama de dispersión


indicando qué tipo de relación existe entre el ingreso y el consumo.
b. ¿Qué grado de asociación existe entre el ingreso y el consumo?
c. ¿En qué porcentaje está siendo explicada la variable dependiente?
d. Realice la prueba de hipótesis para determinar si el modelo lineal sirve para
propósitos de predicción con un α = 0.05)
e. ¿Qué consumo pronosticaría para alguien que gana $27.5 miles y cuál es su error de
estimación?

www.usat.edu.pe
Resultados de Excel: Análisis de datos

Resumen
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.9173
Coeficiente de determinación R^2 0.8414
R^2 ajustado 0.8216
Error típico 2.4806
Observaciones 10

ANÁLISIS DE VARIANZA
Grados de Suma de Promedio de los Valor crítico de F
F
libertad cuadrados cuadrados (probabilidad )
Regresión 1 261.1876 261.1876 42.4450 0.0002
Residuos 8 49.2284 6.1536
Total 9 310.4160

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95.0% Superior 95.0%
Intercepción (Bo) 1.8233 1.8752 0.9723 0.3594 -2.5009 6.1476 -2.5009 6.1476
Ingreso (B1) 0.5571 0.0855 6.5150 0.0002 0.3599 0.7542 0.3599 0.7542

22
www.usat.edu.pe
a. Identifique la variable dependiente e independiente y trace un
diagrama de dispersión indicando qué tipo de relación existe entre el
ingreso y el consumo.
X (Independiente) --> Ingreso
Y (Dependiente) --> Consumo

Según el diagrama de dispersión, se observa una relación positiva entre el


ingreso y el consumo. A más ingreso mayor consumo.

www.usat.edu.pe
b. ¿Qué grado de asociación existe entre el ingreso y el consumo?

Coeficiente de correlación múltiple ( r ) 0.9173


Existe una alta asociación o relación entre el
ingreso y el consumo

c. ¿En qué porcentaje está siendo explicada la variable dependiente?

Coeficiente de determinación R^2 0.8414 84.14%


El ingreso explica en un 84.14% al consumo.

24
www.usat.edu.pe
d. Realice la prueba de hipótesis para determinar si el modelo lineal
sirve para propósitos de predicción con un α = 0.05)

Ho:  0= 1=0: El modelo no es significativo,


H1: Al menos uno de ellos es diferente de cero: El modelo es significativo.

Valor crítico de F
a = 0.05 F (probabilidad )
42.4450 0.0002

Regla de decisión: Si probabilidad de F <= 0.05, SE RECHAZARÁ Ho

Decisión: Como p = 0.0002 < 0.05, SE RECHAZA Ho

Conclusión: Al 95% de confianza, existe evidencia estadística para concluir


que el modelo lineal es significativo

El modelo lineal es: Y = 1.8233 + 0.5571 X

Coeficientes
Intercepción (Bo) 1.8233 yˆ = b0 + b1 x
Ingreso (B1) 0.5571

25
www.usat.edu.pe
e. ¿Qué consumo pronosticaría para alguien que gana $27.5 miles y
cuál es su error de estimación?

Coeficientes
yˆ = b0 + b1 x Intercepción (Bo) 1.8233
Ingreso (B1) 0.5571

El modelo lineal es: Y = 1.8233 + 0.5571 X

x= 27.5 Reemplazar el valor de x en el modelo de regresión para realizar la


estimación

y= 17.14
Se estima un consumo de $17.14 miles para un ingreso de $ 27.5
miles con un error de estimación de +/- $2.8 miles
Error típico 2.48

26
www.usat.edu.pe
ACTIVIDAD EN CLASE
Desarrollo de ejercicios
(Aula virtual)

www.usat.edu.pe
Referencias
• AFONSO P. (2002) Probabilidad y Estadística: conceptos, modelos, aplicaciones en
Excel. Bogotá D.F. Pearson Educación.
• DEVORE, J. (1998). Probabilidad y estadística para ingeniería y ciencias. México.
International Thomson Editores.
• DOUGLAS MONTGOMERY: “Probabilidad y Estadística y Probabilidades a la
Ingeniería" Ed. McGraw-Hill Interamericana Editores S.A. Impreso en México 1996.
• MENDENHALL W., TERRY S. (1997). Probabilidad y estadística para ingeniería y
ciencias. México. Prentice Hall Hispanoamericana.
• ROSS, SHELDON. (2001) Probabilidad y Estadística para Ingeniería. México, D.F.:
McGraw-Hill.
• WALPOLE R., MYERS R., MYERS. S. (1999). Probabilidad y estadística para
ingenieros. México. Prentice Hall Hispanoamericana.

28 www.usat.edu.pe
ESTADÍSTICA
D ESDE
CERO

www.usat.edu.pe
Jessica Oliva Gastulo
joliva@usat.edu.pe

http://www.facebook.com/usat.peru

https://twitter.com/usatenlinea

https://www.youtube.com/user/tvusat

https://plus.google.com/+usateduperu

www.usat.edu.pe

También podría gustarte