Está en la página 1de 39

REGRESIÓN LINEAL SIMPLE

Se utiliza para la predicció n y para explicar la


relació n entre dos variables.

Se desarrolla un modelo matemá tico que usa la


variable independiente “x” para obtener una
predicció n de la variable dependiente “y”
Diagrama de dispersión

Para comenzar a estudiar la relación entre dos variables


cuantitativas se utiliza el diagrama de dispersión, el cual es una
gráfica de parejas de valores de las variables involucradas.
Relación lineal entre dos variables

Una relación lineal entre dos variables es aquella que puede


representarse con mejores exactitud mediante un línea recta.

No toda relación entre dos variables es lineal.


Algunas se representan con mejor exactitud usando una curva.
En este caso, se dice que la relación entre las variables es
curvilínea.
Relación lineal positiva

Una relación positiva entre las variables X y Y indica


que existe una relación directa entre ellas, es decir, los
valores menores de X están asociados con los valores
menores de Y y los valores mayores de X están
asociados con los valores mayores de Y.

Existe una relación positiva entre las variables X y Y si


al aumentar los valores de X los valores de Y tienden a
aumentar.
Relación lineal negativa

Una relación negativa entre las variables X y Y indica


que existe una relación inversa entre ellas, es decir, los
valores menores de X están asociados con los valores
mayores de Y y los valores mayores de X están
asociados con los valores menores de Y.

Existe una relación negativa entre las variables X y Y si


al aumentar los valores de X los valores de Y tienden a
disminuir.
Una relación lineal perfecta
es aquella en la que existe
una relación positiva o
negativa para la cual todos
los puntos caen sobre la
recta.

Una relación lineal imperfecta es aquella en


la que existe una relación positiva o negativa
para la cual NO todos los puntos caen sobre la
recta.
Recta de Regresió n o de Ajuste.

ECUACIÓN DE LA RECTA DE REGRESIÓN


𝑦 = 𝛽0 + 𝛽1 𝑥 + 𝜀 error aleatorio. Diferencia entre
el punto azul (verdadero valor de
Y) y la recta.
En regresión se denota con

En regresión se denota con


MÉTODO DE MÍNIMOS CUADRADOS

Es uno de los procedimientos que permite estimar


los coeficientes de la ecuació n de la recta.

Este método minimiza la suma de las desviaciones


elevadas al cuadrado (error mínimo cuadrado)
Ejemplo de tabla n=pares de puntos

x y X=(x-) Y=(y-) X*Y X*X Y*Y

∑x/n ∑y/n ∑x=0 ∑y=0 ∑X*Y ∑X*X ∑Y*Y

promedio

∑ ∑
Cálculo:

^
𝜷 𝟏

=
Correlación bivariada

La correlación bivariada es una técnica estadística


destinada a averiguar:
• a) si dos variables tienen relación entre sí
• b) si la relación es fuerte-moderada-o débil
• c) qué dirección tiene la relación
• La correlación de Pearson está basada en
la asociación lineal, es decir, que cuando
los valores de una variable aumentan los
valores de la otra variable pueden
aumentar o disminuir proporcionalmente
Posibles relaciones entre variables

• El peso de un adolescente con su estatura.


• Los gastos con el ingreso disponible en un mes.
• Estatura de los niños con su edad.
• Demanda de algún artículo con los gastos de
publicidad.
• Cantidad de cigarrillos al día y la frecuencia
cardíaca.
Coeficiente de correlación de Pearson
Este coeficiente fue construido bajo el supuesto de que los
datos siguen una distribución normal bivariada y la escala de
medición es al menos de intervalo.

El Coeficiente de Correlación de Pearson mide la relación


lineal entre dos variables y se define como el cociente entre la
covarianza y el producto de las desviaciones típicas de ambas
variables.
Características del coeficiente de correlación
El signos del coeficiente indica si la relación entre las variables es positiva o
negativa: si el coeficiente es positivo, entonces la relación es positiva. En
caso contrario la relación es negativa.

El valor numérico del coeficiente de correlación varía entre -1 y +1 y éste


describe la magnitud de la relación entre las variables.

• Si r=-1 entonces existe una relación lineal perfecta negativa entre las
variables.
• Si r=0 entonces no existe relación entre las variables.
• Si r=+1 entonces existe una relación lineal perfecta positiva entre las
variables.
Dispersión por Regresión

Es de gran utilidad cuando debemos realizar un pronóstico o respuesta de la


variable dependiente teniendo en cuenta la variabilidad de los puntos en
relación a la recta de tendencia.
80
70
nube de puntos
60
50
recta superior
40
30 recta x
20 recta inferior
10
0
0 1 2 3 4 5 6 7 8 9 10 11 12
Variancia de Regresión para Método de
Mínimos Cuadrados (simplificado)
S2 y :  Y2 - m .  XY
n

Desvío de Regresión (simplificado)


______
S y : √ S2 y
Yt +/- Sy

( * x + ) +/- k * Sy
función lineal

K= 1 68 % % que me indica
K= 2 95 % o limita la franja
K= 3 99.5 % de concentración de
datos alrededor de la recta de tendencia

También podría gustarte