Está en la página 1de 9

TEMA 6: REGRESIÓN LINEAL

La regresión estadística pretende establecer relaciones entre una variable dependiente cuantitativa y una
variable predictora (Análisis de regresión simple) o varias variables predictoras (Análisis de regresión múltiple)
que podrá ser continua o categórica. Asimismo, se introduce el “análisis de vías” donde se estudian los
conceptos de mediación y moderación.

El análisis de la regresión está estrechamente relacionado con el análisis de la correlación si bien, en la


regresión, se pretende establecer algún tipo de predicción mientras que en la correlación, se pretende medir
el grado de relación entre dos variables.

COEFICIENTE DE CORRELACIÓN DE PEARSON

La correlación es una manera de cuantificar la covariación entre dos variables, que puede ser directa (si la V1
aumenta, la V2 también) o indirecta (inversa; si la V1 aumenta, la V2 disminuye). Así, cuanto mayor sea la
pendiente, mayor es la relación. En el caso de que el valor del coeficiente de correlación sea 0, no hay relación.

EN JAMOVI

1) Módulo de regresión → correlation matrix.


2) Introducimos las dos variables que han de ser CUANTITATIVAS.

El signo indica el tipo de correlación:

- Si < 0 es inversa.
- Si > 0 es directa.

ANÁLISIS DE REGRESIÓN

Regresión lineal simple


Relaciones directas

Tipos de regresión lineal Regresión lineal múltiple


moderación

Mediación

Fórmula estándar: Yi = 0 + 1 (pendiente de la recta) * x1 + ei


1. REGRESIÓN LINEAL SIMPLE

Este modelo pretende relacionar dos variables de manera lineal

A B

• En el caso de que la VI o predictora sea cuantitativa:


o VD (variable criterio) = 0 + 1 * V1 + ei
o H0: 1 = 0
• En el caso de que sea cualitativa, aparecerán presentes el número de categorías menos 1. Así,
considerando que dicha variable tiene 3 valores o categorías (3-1=2):
o VD = 0 + 1 * VI1 + 2 * VI2 +ei
o H0: 1 = 2 = 0

JAMOVI

1) General linear model


• La VD en dependent variable
• VI en el caso de ser:
i. Cualitativa: en Factors.
ii. Cuantitativa: en covariates.
2) Me fijo en la p del modelo estadístico de la tabla de ANOVA ómnibus test para ver si existe relación.

3) Compruebo si existe relación en fixed effects parameter estimates.


• Estimate de 0 (intercept) es el punto de corte con el eje de ordenadas.
• Estimate de 1 (de VI) nos indica la pendiente de la recta.
i. Si el signo es positivo, relación directa.
ii. Si el signo es negativo, relación inversa.
iii. Si el parámetro vale 0, no relación.

• Asimismo, tenemos que mirar que la p de la VI sea significativa


i. Si es continua, basta con mirar la p.
ii. Si es categórica, tendré que mirar cada una de las comparaciones e incluso,
modificar la categoría de referencia en DATA para poder ver todas las
comparaciones. En la redacción pondremos las comparaciones que sean
significativas.

El estimate de las categorías son los valores de las diferencias de medias entre ellas.

4) Redacción:
• VI cuantitativa: se encontró una relación directa entre la nota obtenida en fundamentos
metodológicos (VI) y en DAD i (VD) (F (1,53) = 22.9, p < .001, R2adj = .29, indicando un TE
grande). por cada incremento de un punto en la nota de fundamentos, se produce un
incremento de .49 (valor estimate de la VI) puntos en la nota de DADI (t (53) = 4.78, p <
.001).
i. El estadístico principal del contraste es el que encontramos en la tabla de ANOVA
ómnibus en lo referido al modelo.
ii. La R2adj es el valor que encontramos en la tabla de model info solo que para
interpretarlo, hemos de hacer la raíz cuadrada de ese valor.

TE pequeño TE medio TE grande


0.1 0.3 0.5
• VI Categórica: se encontró una relación inversa entre la sociabilidad y los pensamientos fóbicos
iniciales (F(2,156) = 52, p < .001, R2adj = .392, indicando un TE grande). se encontró que aquellos que
presentaban un nivel de sociabilidad bajo, tuvieron mayor número de pensamientos fóbicos iniciales
que los que presentaban un nivel de sociabilidad medio ( = 1.46→ estimate de la comparación, t
(156) = -2.28, p = .024) que los que presentaban un nivel alto ( = -5.99, t (156) = -9.20, p < .001).
Asimismo, se encontró que aquellos que tuvieron un nivel de sociabilidad medio presentaron más
pensamientos fóbicos inicialmente que aquellos que tuvieron un nivel alto ( = -4.54, t (56) = -8.08,
p < .001).
o Para determinar qué categoría es mayor/menor respecto a la otra en la comparación he de
fijarme en el valor del estimate puesto que al ser la diferencia de medias sabré que si es
negativo, es porque la segunda categoría, es mayor respecto a la primera y, si el valor es
positivo, a la inversa; la primera categoría es mayor respecto a la segunda.
5) Predicciones: módulo R → Rj Editor
• Valor esperado de una persona con x puntuación
Variable continua Variable categórica
modelo = lm (VD ~VI, data = data) modelo = lm (VD ~VI, data = data)
nuevos= data.frame (VI = puntuación que te nuevos= data.frame (VI = categoría que piden)
dan) predict (modelo, nuevos)
predict (modelo, nuevos)

• Valor más probable, pidiendo un rango añadimos: predict (modelo, nuevos, Interval =
“confidence”
• Es importante reproducir tal cual el modo en que están escritas las variables.

2. REGRESIÓN LINEAL MÚLTIPLE

Moderación

En este modelo de relaciones directas tenemos 2 variables predictoras y una dependiente

B
Normalmente se introduce con
expresiones como: “tal variable
A VD influye o depende o, modera”
tal relación.
- Fórmulas (dependen de si la VI o predictora es cuantitativa o cualitativa):
o Las dos son cuantitativas → VD = 0 + 1*A+2*B + 3*A*B
o En el caso de que A sea cualitativa (nº de categorías -1) y B cuantitativa:
▪ VD = 0+ 1*A1+ 2*A2+ 3*B+ 4*A1*B+ 5*A2*B

JAMOVI

1) General linear model → VD en dependet variable y Vi depende de si son categóricas (factors) o


cuantitativas (covariates).
2) Model → selecciono una de ellas y con el comando cmd del mac selecciono la otra para clicar sobre
la flecha y pedir interacción.
3) Una vez obtenida la tabla, observo la significación de la interacción que viene con asterisco en la tabla
de ANOVA ómnibus. Aunque es cierto que, para la redacción, usaremos los valores y el estadístico
del contraste principal, model, de esta misma tabla!!!

4) Pido efectos simples en simpke effects → meto la vi en simple effects variable y la moderadora en
moderator. Los efectos simples miden relaciones directas.
a. En el caso de que la variable sea categórica, lo que me interesa es conocer si las pendientes
son iguales o distintas para lo cual, me fijo como siempre en el valor de estimate.
i. Recordar modificar el valor de la categoría de referencia en DATA para obtener
todas las comparaciones aunque luego redacte solo las significativas.
b. Si es cuantitativa, aparecerán “categorías” como:
i. Mean-1-SD → que interpretamos como valor bajo.
ii. Mean → como valor medio.
iii. Mean +1-SD → como valor más alto.

Solo interpretamos aquellos que son significativos.

5) Pido un gráfico en plots para la interpretación → predictora en el eje horizontal y la moderadora en


separate lines.
6) Redacción:
a. Una variable cuantitativa y otra categórica a través de los efectos simples: existió una
moderación entre las variables ace (Actividades cognitivas estimulantes) y la ocupación
laboral sobre la memoria semántica (F(5, 194) = 243.3, p <.001, R2adj = .859, indicando un
TE grande). existió una relación directa entre las ACE y la memoria semántica para los que
no tenían cualificación ( = 12.34, t (194) = 6.96p<.001), para los que tenían cuenta ajena (
= .934, t (194) = 14.08, p <.001) y para los directivos ( = .735, t (194) = 11.19, p < .001).
b. Cuando las dos son variables cuantitativas: se encontró interacción entre la edad y la
educación sobre el TMTB (F (3,196) = 6959.3, p < .001, R2adj = .991, indicando un TE grande).
por cada incremento de una unidad en (VI) la edad, se produce un incremento de 4.8
(estimate de la “categoría”) unidades en el TMTB (VD) cuando el nivel de educación fue bajo
(valor de la variable moderadora) (t(196) = 54.4, p <.001), un incremento de 4.4 unidades
en el TMTB cuando el nivel de educación fue medio (t(196) = 77.8, p <.001) y un incremento
de 4 unidades en el TMTB cuando el nivel de educación fue alto (t(196) = 49.3, p<.001).
7) Predicciones:
2 cuantitativas Una cuantitativa y otra cualitativa
modelo = lm (VD ~V1*V2, data = data) modelo = lm (VD ~V1*V2, data = data)
nuevos= data.frame (V1 = puntuación que te nuevos= data.frame (V1 =puntuación, V2=
dan, V2 = puntuación) “categoría”)
predict (modelo, nuevos) predict (modelo, nuevos)

Si nos piden intervalo de confianza añadimos: predict (modelo, nuevos, Interval = “confidence”

RELACIONES DIRECTAS

Tenemos dos variables


A predictoras y una dependiente.
VD Queremos ver cómo influye V1
sobre VD en presencia de V2
B

• Fórmulas (dependen de si la VI o predictora son cualitativas y cuantitativas):


o Las dos son cualitativas (nº de categorías -1):
▪ VD = 0 + 1 * A1 + 2 *A2 + 3 *B1 + 4 *B2 + x * x+ e
▪ H0: 1 = 2 = 3 = 4 = 0
o En el caso de que las dos variables sean cuantitativas:
▪ VD = 0 + 1 *A + 2 * B
▪ H0: 1 = 2 = 0
o En el caso de que A sea cualitativa y B cuantitativa:
▪ VD = 0 + 1 * A1 + 2 * A2 + 3 * B
▪ H0: 1 = 2 = 3 = 0

JAMOVI

1) General linear model → VD en dependent variable y las vi en covariates (si son cuantitativas) o factors
(si son categóricas).
2) Me fijo en la p del modelo de la tabla de ANOVA ómnibus. Esta p del modelo, mide la relación
teniendo en cuenta la influencia de las dos vis con la VD.

3) Tabla de fixed effects parameter


a. Miro la significación de ambas variables. Con que una de ellas sea significativa, hay relación
puesto que ambas variables son independientes entre sí. Esta tabla me dice cómo se
relacionan cada una de las variables de forma independiente con la VD.
b. Si una es categórica, voy cambiando la categoría de referencia para ver todas las
comparaciones y cuáles de ellas son significativas (sólo hablaré de estas en la redacción).

Si nos piden si la relación entre las dos categorías es igual, mayor o menor, primero hemos de
fijarnos en la significación porque si la p > .05 significa que no hay diferencias. En cambio, si es
menor que .05, tendremos que fijarnos en el valor de estimate.

c. El valor de estimate nos dice como es la relación si directa, si es positivo el signo o, inversa,
si es negativo.
4) Pedimos gráfico para hacer mejor la interpretación → continua en horizontal y categórica en
separate lines.

5) Redacción: se encontró una relación entre la edad y la ocupación sobre la atención en el

momento 3 (F(3,56) = 4.09, p =.011, R2 adj=.136 indicando un TE medio). Se encontró que el


nivel de atención en el momento 3 fue mayor en los autónomos que en los otros otros (=
-1.85, t(56) = -2.54, p = .014) manteniendo constante el valor de la edad. Se encontró una
relación inversa entre la edad y la atención en el momento 3 ( = -.304, t (56) = -2.043, p
=.046). De tal forma que, por cada incremento que se produce en la edad (VI), se da un
decremento de .304 en la medida de atención en el momento 3 (VD) manteniendo
constante el valor de la ocupación (otra VI).
6) Predicción
2 cuantitativas Una cuantitativa y otra cualitativa
modelo = lm (VD ~V1+V2, data = data) modelo = lm (VD ~V1+V2, data = data)
nuevos= data.frame (V1 = puntuación que te nuevos= data.frame (V1 = puntuación, V2=
dan, V2 = puntuación) “categoría”)
predict (modelo, nuevos) predict (modelo, nuevos)

Si nos piden intervalo de confianza añadimos: predict (modelo, nuevos, Interval = “confidence”

3. MEDIACIÓN

Para contrastar este modelo son necesarias varias ecuaciones de regresión:


B

• Regresión lineal simple de A sobre VD


o VD = 0 + 1 * A +ei
A VD
• A sobre la variable mediadora:

o B = 0 + 1 * A + ei
• Finalmente, una regresión múltiple de relaciones directas de A y B sobre la VD:
o VD = 0 + 1 * A + 2 * B + ei
• La relación entre A y VD es nuestro parámetro C.
• La relación entre A y B, el parámetro a.
• La relación entre B y VD, el parámetro b.
• El parámetro c´ será la relación entre A y VD tenido en cuenta la presencia de B.
• Efecto indirecto es tenido en cuenta las tres variables por igual.

JAMOVI

1) Medmod → General linar model → vd en dependent variable, Vi en convariates o factors y


mediadora en mediators.

2) En la tabla indirect and total effects:


a. Para ver si la mediación es significativa, nos fijamos en el efecto indirecto.
b. Parámetro C: es la fila del efecto total.
c. Parámetro c´ es la fila del efecto directo.
d. Parámetro a: en component (1).
e. Parámetro b: en component (2)
3) Redacción: se encontró que la educación medió la relación entre la edad y la memoria episódica (EI
= -0.0162, z = -3.23, p = .001).
a. * EI es el valor de estimate indirect.

También podría gustarte