Documentos de Académico
Documentos de Profesional
Documentos de Cultura
REGRESIÓN Y
CORRELACION
CONTENIDOS:
ANÁLISIS DE
CORRELACIÓN Y
REGRESIÓN
LINEAL
ANÁLISIS DE REGRESIÓN El coeficiente de
(Describe la ecuación Ecuación lineal y = a + determinación (r2) es la
matemática o línea recta de la bx proporción de la variación
relación entre 2 o más variables total en la variable
aleatorias) dependiente (y) que se
explica por la variación en la
Diagrama de variable independiente (x).
dispersión
Es una gráfica que representa la relación entre dos Es el cuadrado del
variables. coeficiente de correlación.
La variable dependiente es la variable que se predice o Su rango es de 0 a 1.
calcula.
La variable independiente proporciona las bases para el
cálculo.
330 25,00
280
20,00
230
15,00
180
10,00
130
5,00
80 r=0,1
0,00
30 0,00 20,00 40,00 60,00 80,00
140 150 160 170 180 190 200
- +
Grado de asociación entre dos variables
Estudio conjunto de dos variables
• A la derecha tenemos los datos obtenido
observando dos variables estadísticas en varios Altur Peso
individuos de una muestra. a en en
cm. Kg.
– En cada fila tenemos los datos de un individuo 162 61
100
90
Pesa 76 kg.
80
70
l tu ra
la a
100
con
90 enta
au m
80
e s o
70 el p
que
e60
arec 50
P
40
30
140 150 160 170 180 190 200
Relación entre variables
Altura y peso
de 30 individuos.
l tu ra
la a
100
con
90 enta
au m
80
e s o
70 el p
que
e60
arec 50
P
40
30
140 150 160 170 180 190 200
Relación entre variables
Altura y peso • ¿Qué recta explica mejor la relación peso-altura?
de 30 individuos. • mejor...¿en qué sentido?
l tu ra
la a
100
con
90 enta
au m
80
e s o
70 el p
que
e
60
arec 50
P
40
30
140 150 160 170 180 190 200
Covarianza de dos variables X e Y
La pendiente de la recta de regresión es Sxy/
S2X
El signo de la covarianza indica si la posible
relación entre dos variables es directa o
inversa.
Directa: Sxy >0
Inversa: Sxy <0
Incorreladas: Sxy =0
Coef. de correlación lineal de
Pearson
La coeficiente de correlación lineal de
Pearson de dos variables, r, nos indica
si los puntos tienen una tendencia ar SS S xy
disponerse alineadamente x y
Relació
n Relació
inversa n
perfect Variables
directa
a incorreladas
casi
perfect
a
-1 0 +1
Cómo calcular el coeficiente de
correlación de Pearson
Covarianza
y
Problema
Se recabaron datos de una muestra de la
inteligencia y del desempeño académico de 10
estudiantes.
Se desea averiguar si hay relación entre la
inteligencia y el desempeño académico.
A continuación se muestran los datos
recabados:
Inteligencia Desemp.Acad.
X Y
105 4
116 8
103 2
124 7
137 9
126 9
112 3
129 10
118 7
105 6
Ejemplo 1
Se pudo observar en la
gráfica que entre los
trabajadores no afecta el que
esté lejos su casa de la
empresa en donde trabajan
ya que el llegar tarde no
afecta para que haya una
buena producción.
Ejemplo 2.
yn
yn 1 yˆi
y3
u3 ui
yi
y1 yi
y2
Ordenada
x1 x2 x3 xi xn 1 xn
en el origen
yi a bxi ui ui yi yˆi
Error: residuo
RECTA DE REGRESIÓN
n n
u ( yi yˆi ) 2
2
i i
u 2
i 1
i i
( y
i 1
ˆ
y ) 2
n 2 n n
2
min ui ( yi yˆi ) yi a bxi
2
a ,b i 1 i 1 i 1
EQUIVALE a buscar los coeficientes de la recta que hacen MÍNIMA la suma de
los CUADRADOS de los residuos.
La recta de regresión de y sobre x es:
S xy S xy
yˆ y 2
x 2
x
S x S x
1 n 1 n
Covarianz S xy ( xk x )( yk y ) xk yk x y
n k 1 n k 1
a
Medida de variables en el SPSS
¿Qué tipo de correlación usar?
Ordinal + Ordinal: Spearman
Ordinal + cuantitativa discreta: Spearman
Ordinal + Cuantitativa continua: Spearman
Cuantitativa discreta + Cuantitativa discreta:
Spearman
Cuantitativa continua+cuantitativa continua:
H1: μ < μ0
2. H0: μ <= μ0
H1: μ > μ0
3. H0: μ = μ0
H1: μ <> μ0
Ejercicios Pruebas de hipótesis
1. El gerente del Hotel Windham afirma que la media de los
cuentas de los huéspedes que pasan un fin de semana en
el hotel es de 4,000 o menos. El contador afirma que
gastan más que eso. Se basa en una muestra de los
clientes de los últimos tres fines de semana.
3.El gerente de grupo Premiere quiere implantar un bono para aumentar el volumen
de ventas. En la actualidad, la media es de 14 carros vendidos a la semana. El
gerente quiere hacer una investigación para ver si con el bono aumentan las ventas.
Tiene un plan alterno que compartirá con los vendedores y tomará datos durante un
mes.
d) Formula las Ho y H1 adecuadas para este caso.
e) A que conclusión se llagaría cuando no se pueda rechazar Ho.
f) A qué conclusión se llegaría cuando sí se puede rechazar Ho.
Esta prueba T prueba los dos métodos con los mismos obreros. Este diseño
conlleva um error muestral menor que el diseño con muestras independientes
ya que elimina la variación entre obreiros como fuente de error muestral.
Resultados: como p>0.05, no se tienen
elementos para rechazar la Ho. No hay diferencia
significativa entre medias.
Dif. de medias relacionadas
Para investigar el monto de los ahorros por compra de marcas propias
en comparación con marcas de fábrica, la revista del Consumidor
elaboró una lista de artículos en un supermercado (Ley). Un carrito se
llenó con productos de marcas de fábrica y el otro con productos de
marca propia.
¿Hay diferencia en los ahorros si se compran artículos de marca de
fábrica vs marca propia?
Ho: μd= 0
H1: μd <> 0
Ejercicio: diferencia de medias
muestra relacionadas
Se hizo una investigación de mercados para evaluar el potencial de la
publicidad para la compra de un nuevo producto. Los clientes evaluaron el
potencial de compra en una escala del 1 al 10. La Ho establecía que la
media de la calificación “después” de ver el comercial, sería igual que la de
“antes” El rechazo de la Ho mostraría que el comercial mejoraba el potencial
de compra. Prueba la Ho y comenta el valor del comercial.
Ho: μd= 0
H1: μd <> 0
Ejercicios
ANOVA de un factor
Se hizo una prueba de esfuerzo cardiaco
después de usar cuatro aparatos diferentes.
¿Hay diferencias significativa entre ellas?
Resultados
¡Estudien para su examen!