Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Correlación Lineal
Correlación Lineal
SIMPLE Y REGRESIÓN
LINEAL SIMPLE
Correlación
Es la relación entre dos variables cuantitativas
sin ser capaz de inferir relaciones causales.
Una correlación es una medida del grado en que dos variables se encuentran relacionadas.
Un estudio correlacional puede intentar determinar si individuos con una puntuación alta en
una variable también tiene puntuación alta en una segunda variable y si individuos con una baja
puntuación en una variable también tienen baja puntuación en la segunda.
Relación entre variables
.
Tipos de correlación
Correlación positiva Correlación Negativa o inversa
Cuando hay valores altos o bajos, Es cuando los valores altos en una variable
simultáneamente en dos variables. coinciden con valores bajos en otra variable.
Ejemplo: Ejemplo:
Peso y altura en una muestra de niños de 5 a 12 años: La edad y fuerza física en una muestra de adultos de
los mayores son también los más altos y pesan más, y 30 a 80 años de edad: los mayores son los menores en
los más jóvenes pesan menos y son más bajos; fuerza física; hay una relación, que puede ser muy
decimos que peso y altura son dos variables grande: según los sujetos aumentan en una variable
relacionadas porque los más altos pesan más y los más (edad) disminuyen en la otra (fuerza física).
bajos pesan menos.
Casos en que se utiliza la correlación
1) En cada caso tenemos cuatro sujetos (ejemplo reducido para poder ver todos los
datos con facilidad) con puntuaciones en dos variables, X (un test de inteligencia) e Y
(una prueba objetiva de rendimiento).
2) Junto a la puntuación de cada sujeto en las dos variables, X e Y, ponemos su número
de orden: 1º al que tenga la puntuación más alta, 2º al que tenga la siguiente más alta,
etc.:
Caso 1° Caso 2° Caso 3°
X # de Y # de X # de Y # de X # de Y # de
orden orden orden orden orden orden
40 1° 13 1° 40 1° 10 4° 40 1° 12 2°
39 2° 12 2° 39 2° 11 3° 39 2° 10 4°
38 3° 11 3° 38 3° 12 2° 38 3° 13 1°
37 4° 10 4° 37 4° 13 1° 37 4° 11 3°
Caso 1
38 3° 11 3°
37 4° 10 4°
En el caso 1° los sujetos tienen
el mismo orden en las dos
variables: el tener más de X
coincide con tener más de Y.
Entre X e Y existe una relación
positiva.
Caso 2
Las relaciones lineales entre variables pueden ser expresadas por estadísticos
conocidos como coeficientes de correlación.
d) Dos ítems (o sujetos, variables, etc.) que tengan entre sí una relación muy
alta, pueden ser valorados de manera muy distinta en términos absolutos.
… continuación
e) Un coeficiente de correlación no equivale a una proporción. Una correlación de r
=.50 no quiere decir que haya un 50% de variabilidad común o de varianza común
entre las dos variables.
xy x y
r n
x
2
( x) 2
. y
2
( y)2
n n
Ejemplo:
Una muestra de 6 niños fue seleccionada, datos de su edad en
años y peso en kilogramos fue registrada como se muestra en la
siguiente tabla. Se requiere encontrar la correlación entre edad y
peso.
xy x y
r n
( x) 2 ( y)2
x
2 . y
2
n n
Edad Peso
Nº
(años) (Kg) xy X2 Y2
Serial
(x) (y)
1 7 12 84 49 144
2 6 8 48 36 64
3 8 12 96 64 144
4 5 10 50 25 100
5 6 11 66 36 121
6 9 13 117 81 169
Total ∑x= ∑y= ∑xy= ∑x2= ∑y2=
41 66 461 291 742
41 66
461
r 6
(41)
2
(66)
2
291 .742
6 6
r = 0.759
Ejemplo: Relación entre ansiedad y puntaje de pruebas
Ansiedad Puntaje X2 Y2 XY
(X) de
prueba
(Y)
10 2 100 4 20
8 3 64 9 24
2 9 4 81 18
1 7 1 49 7
5 6 25 36 30
6 5 36 25 30
∑X = 32 ∑Y = 32 ∑X2 = 230 ∑Y2 = 204 ∑XY=129
Calculando el coeficiente de correlación
r = - 0.94
Ejercicio
Análisis de regresión
Permite estudiar la relación funcional entre una
variable respuesta Y (variable dependiente) y una o
más variables regresoras X (variables independientes o
predictoras). El primer caso se conoce como
Regresión Lineal Simple y el segundo como Regresión
Lineal Múltiple (Draper y Smith, 1998).
Regresión
Un análisis de regresión nos puede servir para predecir o
describir el comportamiento de una variable respecto al
comportamiento de otra, que por su naturaleza es difícil
la observación directa, por lo que con la ayuda de un
modelo se puede entender lo anterior relacionando una o
más de una variable.
Correlación y regresión
200
180
160
140
120
100
80
Wt (kg)
60 70 80 90 100 110 120
Peso
Kg
Usando el método de los cuadrados mínimos (un
procedimiento que minimiza las desviaciones
verticales de puntos trazados alrededor de la línea
recta) somos capaces de construir el mejor trazado
de la línea recta en la gráfica de puntos dispersos y
luego formular la ecuación de regresión en la forma
de:
ŷ a bX
x y
xy
ŷ y b(x x) bb1 n
( x) 2
x 2
n
Ecuación de regresión
SBP(mmH g) (mmHg)
TAS
220
200
La ecuación de 180
160
120
100
la línea de 80
60 70 80 90 100 110 120
Wt (kg)
regresión Peso
(Kg)
matemáticamente
Intersección
Pendiente
Ecuación lineal
Y
ŷ =bX
Y a +bX
a
Change
Cambio
b=
bpendiente
= Slope en
in Y
Change in
Cambio enXX
a == Y-intercept
intersección
X
Horas estudiando y calificaciones
Regresión de calificaciones sobre horas de estudio
Regresión lineal
Linear Regression
Calificación final en el curso= 59.95 + 3.17 * horas de estudio
90.00 Final grade in course = 59.95 + 3.17 * study
el curso
R2=0.88
R-Square = 0.88
e inencour se
final
80.00
Fina l grad
Calificación
70.00
Number
Número deof hours
horas spent en
empleadas studying
estudio
41 66
461
b 6 0.92
2
(41)
291
6
Ecuación de regresión
Kg)
(in Kg)
12.4
12.2
Peso (en
12
Weight
11.8
11.6
11.4
7 7.5 8 8.5 9
Age (in(en
Edad years)
años)
Los resultados no indican si existe una relación causa - efecto entre las
variables consideradas. Existen dos razones para no poder validar lo
anterior.