Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Psicosocial
Análisis de la regresión
Modelos de análisis
estadístico
I. Conceptos básicos.
II. Regresión múltiple
Parte I. Conceptos básicos
Análisis estadístico
a) Tablas
b) Gráficos
Tablas
Ordinal
1 2 3
De intervalo
15 16 17 18 19 20 21 22 23
De razón
0 1 2 3 4 5 6 7 8
Ejemplos de escalas
Nominal los valores sólo representan
categorías o nombres (género, raza, religión, etc.)
Nominal Prueba
Ordinal no paramétrica
Problema Estadístico
Hipótesis Estimación
Variables Inferencia
Modelo de escala
A modo de resumen
Diseños observacionales
Diseños correlaciones o predictivos
(estudios de encuesta)
Diseños cuasi-experimentales
Diseños experimentales
Naturaleza de los datos (variable
dependiente)
Grupos Medidas
AR paralelos repetidas Modelo log-lineal
Factorial Cross-over
MANOVA Regresión
Medidas Antes-después logística
repetidas
Cohortes
Factorial
mixto Split-plot
Diseños no experimentales
Y = f(X) + g(E)
Asociativa
Hipótesis
Causal
Hipótesis asociativa
X Y
X Y
Hipótesis Contexto
científico
asociativas correlacional
causales de manipulación
Universo de las hipótesis
Hipótesis de investigación
Hipótesis estadística
Hipótesis de investigación
H0: parámetro = 0
H0: β = 0
O bien, sobre los parámetros del
modelo
En el modelo de la regresión múltiple, se
asume que los distintos coeficientes
(pendientes) son cero:
H0: b1 = b2 = … = bp = 0
en consecuencia,
Si se demuestra, como resultado de la
prueba, que
H0
α = 0.05
Si p < 0.05 NA(H0)
0
Sobre la discusión de los
resultados
Concepto
Las actividades propias de la discusión de
los resultados son las siguientes:
a) Inferir a partir de la prueba estadística
las consecuencias de carácter teórico.
b) Interpretar estas consecuencias a la luz
de las hipótesis formuladas
c) Establecer el alcance de los resultados
mediante la generalización de los mismos
Inferencia teórica de la hipótesis
Lineal No Lineal
Y = b0 + b1X1 + e
Observación
y = Xβ +ε (forma matricial
compacta)
Modelo de la regresión múltiple
Forma simplificada:
Y = b0 + ΣpbpXp + e
Modelo de la regresión múltiple
y = Xb +ε
Modelos de la regresión de p
variables
Yi b1 b 2 X 2i b 3 X 3i b p X pi i
b1 - Intercepto
b2bp - Coeficientes de pendiente parciales
de la regresión
Normalidad
Linealidad
Homoscedasticidad
Multicolinealidad y singularidad
Normalidad
En principio, cabe pensar que los datos
tienen una distribución normal. Es posible
verificar este supuesto, construyendo
histogramas y comprobando la
distribución de los datos. A veces, en los
histogramas se incluye una línea que
representa la forma de la distribución con
la que es posible comprobar si la
distribución de los datos de desvía de
esta línea.
En otras palabras…
Height vs Weight
80
75
Weight (lbs)
70
65
60
55
115 125 135 145 155 165 175
Height (ins)
Líneas de Regresión (línea de
mejor ajuste)
Regression line for r =1.00 Regression line for r = - 1.00
12 12
Dependent variable
Dependent variable
10 10
8 8
6 6
4 4
2 2
0 0
0 2 4 6 8 10 12 0 2 4 6 8 10 12
Independent variable Independent variable
Cambio en la línea de mejor
ajuste
12 12
Dependent variable
Dependent variable
10 10
8 8
6 6
4 4
2 2
0 0
0 2 4 6 8 10 12 0 2 4 6 8 10 12
Independent variable Independent variable
Los supuestos de normalidad, linealidad y
homoscedasticidad pueden ser
examinados al inspeccionar el gráfico de
dispersión con los valores predichos de Y
(Ŷ ) en el eje X y los residuales (Y-Ŷ) en el
eje Y.
Homoscedasticidad
Forma simplificada:
Estimación de parámetros
Inferencia estadística
Pasos para el ajuste
Selección (1)
Selección del modelo
Yi = bo + b1X1 + b2X2+ e
Pendiente ‘bj’:
Cambios estimados de Y por cada 1
unidad de cambio en Xj. Siendo
todas las otras variables constantes.
¡Cuestión!
Medidas de variación
Pruebas de significación
Medidas de variación
Coeficiente de determinación
múltiple (R2)
Proporción de variación en Y ‘explicada’
por todas las variables X tomadas en su
conjunto.
Jamás decrece cuando una nueva
variable X es introducida en el modelo.
La prueba de R2 = 0 expresa que todas las
variables X, de forma conjunta, no
explican la variación de Y.
Prueba de significación global
del modelo
Ejemplo práctico (datos
simulados)
Supongamos que se pretende estudiar el
impacto que sobre un Cuestionario de
Satisfacción Vital tienen las siguientes
variables:
• Edad
• Ingresos
• Cantidad hijos
• Salud
Pruebas de significación
• n -1
• R2 ajustado= 1 - (--------------)(1-R2)
• n–p–1
Area =
F,v ,v
1 2
reject H0
Prueba de significación total
Ejemplo hipotético
•H0: b1 = b2 = … = bp = 0 Prueba estadística:
•H1: Al menos una bI 0
F 23.751
= .05
•gl= 4 y 14 Decisión:
•Valor crítico: Rechazo con = 0.05
Conclusión:
= 0.05 Hay evidencia de que al
menos una variable
independiente afecta a Y
0 3.11 F
Prueba de los coeficientes de la
regresión individuales (b)
H0: bj = 0 H0: bj = 0
H1: bj > 0, o bj < 0 H1: bj ≠ 0
.
b1
t= s rechazar Ho if |t| > t ./2,n-k-1
b1
b ± t(/2, g.l.)sb
Se examina la contribución de un
conjunto de variables en relación a Y.
La forma como se analiza la específica
contribución de las variables define el
procedimiento o método a seguir.
Hay varios procedimientos que permiten
evaluar la contribución particular de cada
variable o predictor.
Sigue…
Hipótesis nula:
La variables del conjunto no mejoran
significativamente el modelo, cuando
todas las otras son incluidas.
Los modelos deben estimarse por
separado
Prueba estadística de partes
del modelo
Test H0: b1 = 0 en un modelo de 2 variables
Pruebas de independencia
Prueba de homoscedasticidad
Prueba de normalidad
Scatter- plot (gráfico de
dispersión)
El scatter plot nos permite obtener respuesta a
la siguientes cuestiones:
1. ¿Las variables X e Y están relacionadas?
2. ¿Las variables X e Y están linealmente
relacionales?
3. ¿Las variables X e Y están relacionadas no-
linealmente?
4. ¿La variación en el cambio de Y depende de
X?
5. ¿Hay outliers (valores extremos o atípicos)?
Variables listadas en el SPSS
ei = Yi - Ŷi
3) Homoscedasticidad