Está en la página 1de 40

REGRESIÓN Y CORRELACIÓN

LINEAL SIMPLE
INTRODUCCIÓN
Entre las nociones estadísticas fundamentales, cuya
enseñanza debe optimizarse, se encuentran las de
regresión y correlación lineal. Desde la prehistoria
hasta nuestros días, el discernimiento sobre la posible
relación que puede existir entre dos sucesos ha sido
un aspecto importante del conocimiento humano.
“Conocer si los sucesos se relacionan y, con qué
intensidad lo hacen, facilita a las personas explicar el
pasado, controlar el presente y predecir el futuro”
(Crocker, 1981, p.272). De estas palabras se desprende
el valor que tiene el dominio de las nociones de
regresión y correlación.
En proyectos de investigación, con frecuencia se
desea obtener algún conocimiento acerca de la
relación entre dos variables; por ejemplo es posible
que se tenga interés en analizar la relación entre:
• La presión arterial y la edad.
• El consuno de algún alimento y la ganancia de
peso.
• La intensidad de un estímulo y el tiempo de
reacción.
• La concentración de un medicamento y la
frecuencia respiratoria.
Generalidades:
• El término lineal se refiere al hecho de que
regresión y correlación lineal, miden sólo una
relación en línea recta o lineal, entre dos
variables.

• Cuando se utiliza el término simple, se refiere a


que vamos a considerar una variable
explicatoria (independiente) para predecir a la
otra variable (dependiente).
Lo anterior se puede representar
gráficamente de la siguiente manera:
Regresión Mide la relación
entre las
Los Modelos de Lineal variables
Regresión y
Correlación lineal
se utilizan
únicamente para
variables Correlación Mide la
intensidad entre
cuantitativas Lineal las variables
PARA RESOLVER
PROBLEMASDE REGRESIÓN Y
CORRELACIÓN LINEAL
SE SUGIERE SEGUIR
LOS SIGUIENTES PASOS :
PRIMER PASO: identificar las variables
y la lógica del problema

VARIABLES

X Y
- Variable independiente - Variable dependiente
- Variable explicatoria - Variable de respuesta
• Por lo general la variable “X” se conoce como
variable independiente, ya que frecuentemente
se encuentra bajo el control del investigador, es
decir, los valores de X pueden ser seleccionados
por el investigador para obtener uno o más
valores de Y, en correspondencia con los valores
de X.

• En consecuencia, la otra variable “Y” se conoce


como variable dependiente, y se habla de
regresión de Y sobre X.
SEGUNDO PASO: Elaborar el diagrama de dispersión.

DIAGRAMA DE DISPERSIÓN
• Es un tipo de
diagrama matemático
que utiliza las
coordenadas
cartesianas para
mostrar los valores de
dos variables, que
representan un
conjunto de datos.
Importancia del diagrama de
dispersión:
• El diagrama de Dispersión ayuda a
visualizar la forma de la relación entre las
variables, también permite observar si hay
alguna correlación o no.
TERCER PASO: observar que tipo de
correlación presentan los datos

Correlación positiva perfecta


Si se evidencia gráficamente que no hay
correlación, o por lo menos que no existe
correlación lineal, entonces
automáticamente no se continúa con más
análisis o cálculos.
CUARTO PASO: Si en el diagrama de dispersión
se observa que sí hay correlación lineal entre las
variables, entonces se aplican los Modelos de
Regresión y Correlación Lineal .
MODELO DE REGRESIÓN LINEAL
• El análisis de regresión es útil para averiguar la
forma probable de relación entre las variables; su
objetivo final es predecir o estimar el valor de una
variable, que corresponde al valor de la otra variable
con la cual se está relacionando.
Para el análisis de regresión lineal es
necesario realizar:
• Diagrama de dispersión
• Calculo de los valores a y b
• Trazo de la recta de mínimos cuadrados
• Estimación o predicción
Supuestos que fundamentan la regresión lineal
simple:
• Se dice que los valores de la variable independiente X son
fijos y son previamente seleccionados por el investigador.
Algunos autores la denominan variable no aleatoria.

• La variable X se mide sin error. Dado que ningún


procedimiento de medición es perfecto, esto significa que la
magnitud del error de medición en X se considera
insignificante.
• Para cada valor de X existe una subpoblación de
valores Y.

• Todas las variancias de las subpoblaciones de Y


son iguales

• Todas las medidas de las subpoblaciones de Y se


encuentran sobre la misma línea recta.

• Los valores de Y son estadísticamente


independientes.
Recta de Mínimos Cuadrados
• Al analizar los diagramas de dispersión se puede observar
si se presenta una relación lineal entre las variables. Para
hacer más evidente o visible la relación, puede trazarse una
línea recta a través de la nube de puntos, que representan
los valores de las variables, para indicar la dirección de la
relación.
• Para trazar dicha línea recta, existe un método matemático
que calcula la recta resultante, la cual se conoce como
Recta de Mínimos Cuadrados, que es un medio para
determinar la ecuación de la línea que se “ajusta con
precisión” al conjunto o nube de puntos.
Recta de Mínimos Cuadrados
Predecir o Estimar
• El objetivo final del análisis de regresión es, predecir o
estimar el valor de una variable que corresponde al valor
dado de otra variable, en otras palabras, el valor de la
variable dependiente (Y), que corresponde a un valor dado
de la variable independiente (X).
• Para calcular una estimación o predicción se hace uso de la
ecuación utilizada para trazar la recta de mínimos
cuadrados:
ෝ = 𝒂 + 𝒃𝒙
𝒚

En donde la variante del símbolo indica que 𝒚


ෝ es “y”
calculada.
EJEMPLO 1
• Cinco estudiantes luego del examen de estadística tienen la
inquietud de saber si existe relación entre el número de horas
que dedicaron al estudio de la asignatura y la calificación que
obtuvieron en dicho examen ¿Qué deben realizar? Si la
información es la siguiente:
Horas de 20 15 12 25 32
estudio
(X)
Calificación 80 65 70 76 90
Obtenida
(Y)
Deben:
a. Elaborar el diagrama de dispersión
b. Decidir si aplica el análisis de la regresión lineal o no.
c. Y si aplica: calcular la recta de regresión de Y sobre X, y
responder la siguiente pregunta:
¿Qué calificación se estima que obtuvo otro estudiante que
estudió nada más 8 horas?.
Solución:
Diagrama de Dispersión
GRÁFICA No. 1
Recta de Mínimos Cuadrados
GRÁFICA No. 2

𝑌 = 𝑎 + 𝑏𝑥
b. Como se observa que si existe relación entre
las variables.
c. Se calcula la recta de regresión de Y sobre X
: X Y
No. (Horas de (Calificación XY X² Y²
Estudiante estudio) obtenida)
1 20 80 1600 400 6400
2 15 65 975 225 4225
3 12 70 840 144 4900
4 25 76 1900 625 5776
5 32 90 2880 1024 8100
∑ 104 381 8195 2418 29401
Fórmula: Sustituyendo datos:
Interpretación:
nΣxy − Σ𝑥Σ𝑦 (5 ∗ 8195) − (104 ∗ 381)
𝑏= 𝑏= El valor de la
nΣ𝑥 2 − (Σx)² (5 ∗ 2418) − (104)²
pendiente de la
1351 recta es de 1.06
𝑏 = 1274 = 1.06

Σ𝑦 − 𝑏Σ𝑥 381 − (1.0604 ∗ 104) Interpretación:


𝑎= 𝑎= El valor de la
𝑛 5
ordenada en el
270.72 origen es de: 54.14
𝑎= = 54.14
5
Sustituyendo los valores de a y b en la ecuación de la Recta de Mínimos Cuadrados:

𝑌 = 𝑎 + 𝑏𝑥
𝑌 = 54.14 + 1.06𝑥
c. ¿Qué calificación se estima que obtuvo otro
estudiante que estudió nada más 8 horas.
Ecuación de la recta de mínimos cuadrados:

Y = 54.14 + 1.06x
Para X= 8 horas:
෡ = Ycal = a + bx
Y
Sustituimos datos:
෡ = Ycal = 54.14 + (1.06 ∗ 8)
Y
෡ = Ycal = 62.62
Y
Interpretación:
La calificación estimada para un estudiante que estudió 8
horas es de 62.62 puntos.
Resolviendo con la calculadora:
1. Resetear o borrar los datos anteriores de la calculadora
2. Para encontrar los valores de a, b, y r , necesarios para
resolver problemas de Regresión y Correlación Lineal se
debe realizar lo siguiente:
• Algunos tipos de calculadoras necesitan primero
seleccionar el modo estadístico stat o sd, pero la gran
mayoría no lo necesita.
• En el menú de modo seleccionar “REG” (Regresión)
• Despues seleccionar “Lin” (Lineal)
• Ingresar los datos en las respectivas columnas o bien por
parejas ordenadas (X , Y).

• Dar clic en AC.

• Para observar los resultados de regresión lineal pueden


utilizar: shift 1 o shift 2 dependerá de la calculadora que
se utilice: por ejemplo para la fx-570MS debe presionar
shift 2 y con la flecha de la tecla REPLAY deberá moverse
hasta encontrar los resultados de la regresión y
correlación lineal: a, b, r a (estos son los últimos)
EJERCICIO
Una persona se somete a un tratamiento contra el
estrés durante 8 semanas. Al finalizar cada semana
se le evalúa por medio de una prueba psicológica
para ver si hubo algún cambio. A continuación se
detalla el punteo obtenido al finalizar cada una de
esas semanas
X 1 2 3 4 5 6 7 8
(SEMANA)
Y 95 93 87 86 82 80 79 77
(PUNTEO)

a. Elaborar el diagrama de dispersión


Si aplica el análisis de regresión lineal:
Haciendo uso de las funciones de regresión lineal
que tiene su calculadora responda las siguientes
preguntas:
b. ¿Cuál es el valor de la ordenada al origen?
c. ¿Cuál es el valor de la pendiente?
d. ¿Cuál es la ecuación de mínimos cuadrados?
e. Por cada semana que la persona cumple con el
tratamiento en ¿Cuántos puntos disminuye o
aumenta su calificación?
f. ¿Qué punteo se puede esperar que tenga la
persona si sigue con el tratamiento tres semanas
más?
Diagrama de Dispersión
Recta de Mínimos Cuadrados
Solución:
b)¿Cuál es el valor de la ordenada al origen? a = 96.71

c) ¿Cuál es el valor de la pendiente? b = - 2.63

d) Recta de Mínimos Cuadrados:


a = 96.71 , b = -2.63 entonces Y = 96.71 – 2.63 X
e) Por cada semana que la persona cumple con el
tratamiento ¿cuántos puntos disminuye o aumenta su
calificación?
R// Como el valor de la pendiente b = - 2.63, quiere decir
que por cada semana de tratamiento su punteo
disminuye 2.63 puntos.

f) ¿Qué punteo se puede esperar que tenga la persona si


sigue el tratamiento 3 semanas más?
Y = 96.71 – 2.63 X
Y = 96.71 – 2.63 (11) = 96.71 – 28.93 = 67.78 = 68

R// Se debe esperar que obtenga 68 puntos.

También podría gustarte