Está en la página 1de 61

Introducción a la Estadística

Sesión 2 Semana 6:

Contraste de hipótesis de regresión. Análisis de regresión lineal


simple y múltiple

Profesores:
Juan Kaneko, Jhonatan Navarro, Carlos Portocarrero y Ambrosio
Tomás
2024-0
Facultad de Psicología

Introducción a la estadística

Sesión 2 - Semana 6

2024-0
El estudiante comprende los aspectos
LOGRO conceptuales para realizar el análisis de
regresión lineal.
Reflexionemos…

¿Qué se nos viene a la mente cuando nos hablan de


“predicción”?
¿Será posible hacer predicciones?
¿Cómo se podría hacer?
Estrés Depresión

Este gráfico representa la varianza compartida (covarianza)


entre dos variables relacionadas

Recuerda que esto no implica causalidad


Un profesor quiere saber qué variables predicen la
satisfacción académica en sus alumnos.

Luego de observar por un periodo de tiempo, conversar con


estudiantes y revisar información científica sobre el
problema, llega a la conclusión de que la autoeficacia
académica, el compromiso del profesor, la motivación
académica y responsabilidad del estudiante, están
relacionadas con la satisfacción académica.

Para corroborar dicha hipótesis, el docente tiene que realizar


un procedimiento que le permita identificar cuál de esas
variables puede predecir la satisfacción académica.
Autoeficacia académica Motivación académica

Compromiso docente

Estas variables son


predictores de la Satisfacción académica
satisfacción
académica
Responsabilidad
Eso significa que hay la evidencia suficiente para
indicar que existe un patrón entre las respuestas
de las variables y que eso no ocurre debido al azar.
Análisis de regresión
Técnica estadística que permite estudiar la relación entre una o más variables (variables
predictoras) para predecir una variable llamada criterio. Estas variables tienen que ser
continuas.

PREDICTORES CRITERIO

ASERTIVIDAD

DEPRESIÓN

RESILIENCIA
Análisis de regresión

Regresión lineal simple

Predictor Criterio
Análisis de regresión
Regresión lineal
múltiple

sueño

motivación Rendimiento académico

Falta de sueño
Supuestos del análisis de regresión lineal
Supuestos del análisis de regresión lineal

1. Linealidad y multicolinealidad

2. Independencia de errores

3. Aproximación a la distribución normal de los ERRORES


Supuestos del análisis de regresión lineal

1. Linealidad y multicolinealidad

Lo esperado es…

Linealidad: Debe existir relación lineal entre el predictor y el criterio.

Multicolinealidad: No debe existir multicolinealidad.


Supuestos del análisis de regresión
lineal
1. Linealidad y multicolinealidad: La relación entre las variables criterio y
predictora es lineal, o que los predictores no estén correlacionados
(multicolinealidad).

PREDICTORES CRITERIO

ASERTIVIDAD r≠0
r=0 DEPRESIÓN

RESILIENCIA r≠0
Supuestos del análisis de regresión lineal

Linealidad

Realizar la correlación entre los predictores y el criterio.

Interpretar el valor p, la fuerza de la correlación y la dirección de la correlación.

Fuerza de la correlación (Cohen,


1992)
-0.5 a 1 -0.3 a -0.49 -0.1 a -0.29 0 0.1 a 0.29 0.3 a 0.49 0.5 a 1
Grande Mediana Pequeña No hay Pequeña Mediana Grande
relación
Supuestos del análisis de regresión
lineal
Multicolinealidad de los predictores

Esto se evalúa con el Factor de Inflación de la varianza (VFI por sus siglas en
inglés) y es un indicador de cuánto influye la relación entre las variables
predictoras en la varianza total explicada.

Donde:

Valores entre .01 y 10 indican que no hay multicolinealidad


Supuestos del análisis de regresión lineal

2. Independencia de errores

Lo esperado es…

Que los errores sean independientes; es decir, que los errores no estén
correlacionados.
2. Independencia de errores. Recuerde que error es cualquier factor
que afecta la medición.

Se evalúa el estrés laboral en dos grupo de trabajadores

E E E E E E1 E2 E3 E4 E5

r≠0 r=0
Este grupo de personas trabaja solo 2 horas al Este grupo de personas trabaja diferente cantidad de
día. Esto puede ser una fuente de error común o horas, algunos 8 horas, otros 10 horas, otros 6 horas,
relacionado. etc. Esto puede ser una fuente de error aleatoria e
independiente.
2. Independencia de errores

Este supuesto se va a evaluar en Jamovi con el test Durbin Watson

Ho = Los residuos (errores) de la regresión no están relacionados.


H1 = Los residuos (errores) de la regresión están correlacionados.

p > 0.05 = Se acepta la Ho


P < 0.05 = Se rechaza la Ho

Valores del test Durbin


Watson en este intervalo
indican que los residuos
no están relacionados

0 4

1.5 2.5
Supuestos del análisis de regresión lineal

3. Aproximación a la distribución normal de los ERRORES

Lo esperado es…

Que exista distribución normal


(valor p > .05)
Supuestos del análisis de regresión lineal

3. Aproximación a la distribución normal de los ERRORES.

Esto se va a evaluar con la prueba Shapiro Wilk

Ho = No hay diferencias entre la distribución de los residuos (errores) y la distribución normal.


H1 = Hay diferencias entre la distribución de los residuos (errores) y la distribución normal.
Análisis de regresión lineal

Después de cumplir los supuestos


¿Qué se evalúa en un análisis de regresión lineal?

Coeficiente de determinación (R²)


Influencia general
Prueba F <0.05 si hay influencia

Coeficientes de regresión estandarizados (β) Influencia individual


¿Qué se evalúa en un análisis de regresión lineal?
Coeficiente de determinación (R²)

Interpretamos el R² corregido

Indica en qué porcentaje los predictores en conjunto influyen sobre el criterio.

Informa de la proporción de varianza del(los) criterio(s) que es explicada por los predictores
(influencia general).
¿Qué se evalúa en un análisis de regresión lineal?

Coeficiente de determinación (R²)

Interpretación

.04 a .24 = Varianza mínima necesaria (baja)


.25 a .63 = moderada
.64 a más = fuerte
¿Qué se evalúa en un análisis de regresión lineal?

Prueba F

Interpretamos su valor p

Indica el ajuste general del modelo. Es decir; si el modelo es aceptable para que las
variables puedan predecir el criterio.

Si valor p < .05 entonces el modelo es aceptable


¿Qué se evalúa en un análisis de regresión lineal?

Coeficientes de regresión estandarizados (β)

Interpretamos el valor de β con su tipo de influencia (positiva o negativa) y su valor


p.

Informe del grado de influencia de cada uno de los predictores sobre el criterio
(influencia individual).
¿Qué se evalúa en un análisis de regresión lineal?

Coeficientes de regresión estandarizados (β)

Interpretación

.20 a .49 = influencia mínima necesaria (baja)


.50 a .79 = moderada
.80 a más = fuerte
Ejemplo práctico

Abrir
BASE DE DATOS SEMANA 12
Caso 1
¿La Seguridad en el trabajo es un predictor estadísticamente significativo del
engagement?

El modelo es el siguiente:

Seguridad en el trabajo Engagement

Revisemos los supuestos paso a paso…


1. El primer supuesto es evaluar la relación lineal entre las variables y multicolinealidad

Existe relación lineal


Cumple el supuesto

No existe multicolinealidad
Cumple el supuesto

2. Independencia de errores

Existe independencia de errores


Cumple el supuesto

3. Aproximación a la distribución normal de los ERRORES

Se aproxima a la DN
Cumple el supuesto
1. El primer supuesto es evaluar la relación lineal entre las variables

Existe relación estadísticamente significativa de magnitud grande


Click 1

Click 2
Acá tienes que agregar la
variable que se va a predecir
(criterio)

Acá tienes que agregar la(s)


variable(s) predictoras
Click 1

Asegúrate que
estén marcadas
estas casillas
Valor p > 0.05 que indica que se acepta la Ho que es
igual a decir que los errores no están correlacionados.
Además, el estadístico DW se encuentra en 1.5 y 2.5.

El valor del factor de inflación de la varianza (VIF) se


encuentra entre .01 y 10; esto significa que no hay
multicolinealidad.

Valor p > 0.05 que indica que los residuos se


aproximan a la distribución normal.
Luego de cumplir
con los supuestos,
marca las siguientes
casillas
Se puede inferir que la Seguridad en el trabajo explica el
31.8% de la varianza de engagement. Ese valor de
varianza explicada es considerado moderado.

El valor p de la prueba F indica el


ajuste general del modelo. En
este caso al ser p < 0.05 significa
que el modelo es aceptable y
que las variables predicen el
criterio.

La seguridad en el trabajo es un predictor


estadísticamente significativo positivo de
magnitud moderada.
Caso 1

Interpretación:

El ajuste del modelo indica que es adecuado F(1, 123) = 58.89; p


< .05. La seguridad laboral predice de forma estadísticamente
significativa positiva y moderada (β = .57; p < 0.05) y explica de
forma moderada el 31.8% de la variabilidad del engagement (R²
= 0.318).
Caso 2
- ¿La autoeficacia es predictora estadísticamente significativa del engagement?

- El modelo es el siguiente:

Autoeficacia Engagement

Revisemos los supuestos paso a paso…


El primer supuesto es evaluar la relación lineal entre las variables

Existe relación estadísticamente significativa de magnitud mediana


Click 1

Click 2
Acá tienes que agregar la
variable que se va a predecir
(criterio)

Acá tienes que agregar la(s)


variable(s) predictoras
Click 1

Asegúrate que
estén marcadas
estas casillas
Valor p > 0.05 que indica que se acepta la Ho que es
igual a decir que los errores no están correlacionados.
Además, el estadístico DW se encuentra en 1.5 y 2.5.

El valor del factor de inflación de la varianza (VIF) se


encuentra entre .01 y 10; esto significa que no hay
multicolinealidad.

Valor p > 0.05 que indica que los residuos se


aproximan a la distribución normal.
Luego de cumplir
con los supuestos,
marca las siguientes
casillas
Se puede inferir que la autoeficacia explica el 11.7% de
la varianza de engagement. Ese valor de varianza
explicada es considerado bajo.

El valor p de la prueba F indica el


ajuste general del modelo. En
este caso al ser p < 0.05 significa
que el modelo es aceptable y
que las variables predicen el
criterio.

La autoeficacia es un predictor estadísticamente


significativo positivo de magnitud baja.
Caso 2

Interpretación:

El ajuste del modelo indica que es adecuado F(1, 123) = 17.39; p


< 0.05. La autoeficacia predice de forma estadísticamente
significativa positiva y baja (β = .35; p < 0.05) y explica de forma
baja el 11.7% de la variabilidad del engagement (R² = 0.117).
- Caso 3
- ¿El engagement y el estrés son predictores estadísticamente significativos de la satisfacción laboral?

- El modelo es el siguiente:

engagement

Satisfacción laboral

Estrés

Revisemos los supuestos paso a paso…


El primer supuesto es evaluar la relación lineal entre las variables

Existe relación estadísticamente significativa positiva de magnitud


pequeña entre satisfacción laboral y engagement y negativa mediana
con estrés.
Click 1

Click 2
Acá tienes que agregar la
variable que se va a predecir
(criterio)

Acá tienes que agregar la(s)


variable(s) predictoras
Click 1

Asegúrate que
estén marcadas
estas casillas
Valor p > 0.05 que indica que se acepta la Ho que es
igual a decir que los errores no están correlacionados.
Además, el estadístico DW se encuentra en 1.5 y 2.5.

El valor del factor de inflación de la varianza (VIF) se


encuentra entre .01 y 10; esto significa que no hay
multicolinealidad.

Valor p > 0.05 que indica que los residuos se


aproximan a la distribución normal.
Luego de cumplir
con los supuestos,
marca las siguientes
casillas
Se puede inferir que el estrés y el engagement explican el
21.1% de la varianza de satisfacción laboral. Ese valor de
varianza explicada es considerada baja.

El valor p de la prueba F indica el


ajuste general del modelo. En
este caso al ser p < 0.05 significa
que el modelo es aceptable y
que las variables predicen el
criterio.

El estrés es un predictor estadísticamente significativo negativo de


magnitud baja y el engagement es un predictor estadísticamente
significativo positivo de magnitud baja
Caso 3

Interpretación:

El ajuste del modelo indica que es adecuado F(2, 122) = 16.29; p


< 0.05. El estrés predice de forma estadísticamente significativa
negativa y baja (β = -.41; p < 0.05) y el engagement lo hace de
forma positiva y baja (β = .18; p < 0.05). Ambas variables
explican el 21.1% de la varianza de satisfacción laboral que es
considerado un valor bajo (R² = 0.211).
Ejercicio

En grupos desarrollar el siguiente caso. Subir al aula virtual.

Seguridad

Satisfacción laboral

Solución de problemas
Para finalizar

¿alguna pregunta?
Referencias
Blanco, C. (2016). Encuesta y Estadística. Métodos de investigación cuantitativa en ciencias sociales y comunicación. Editorial
Brujas.
Cohen, J. (1992). A power primer. Psychological Bulletin, 112(1), 155-159. https://doi.org/10.1037/0033-2909.112.1.155
Cohen, J., Cohen, P., West, S.G., & Aiken, L.S. (2003). Applied multiple regression/correlation analysis for the behavioral
sciences (Third Edition). New York: Routledge.
Coolican, H. (2009). Research Methods and Statistics in Psychology. Hooder Education.
Cooper, H. (2020). Reporting quantitative research in psychology: how to meet APA style journal article reporting standards.
American Psychological Association.
Ernst, A.F., & Albers, C.J. (2017). Regression assumptions in clinical psychology research practice—a systematic review of
common misconceptions. PeerJ 5, e3323 https://doi.org/10.7717/peerj.3323
Ferguson, C. J. (2009). An effect size primer: A guide for clinicians and researchers. Professional Psychology: Research and
Practice, 40(5), 532–538. https://doi.org/10.1037/a0015808
Rendón-Macías, M. E., Villasis-Keever, M. Á., & Miranda-Novales, M. G. (2016). Estadística descriptiva. Revista Alergia México,
63(4), 397- 407. https://revistaalergia.mx/ojs/index.php/ram/article/download/230/363
Triola, M. F. (2018). Estadística. Pearson.
Torres, J. (2019). Estadística aplicada a ciencias de la salud. Dextra Editorial.

También podría gustarte