Está en la página 1de 48

www.senati.edu.

pe
www.senati.edu.pe
RUTA DE TRABAJO DEL CURSO

Sesión 1 Sesión 4 Sesión 7 y 8

Estadística y Organización Gráficos Medidas de Variabilidad


de Datos

Sesión 2 y 3 Sesión 5 y 6 Sesión 9 y 10


Tabla de Distribución Medidas de Tendencia Teoría de Probabilidad
de Frecuencia Central
www.senati.edu.pe
RUTA DE TRABAJO DEL CURSO

Sesión 11 y 12 Sesión 15, 16 y 17

Distribución con Variables Regresión Correlación


Discretas Lineal

Sesión 13 y 14
Distribución Normal

www.senati.edu.pe
Estadística para administración
Regresión Correlación Lineal
Arturo Benites Encalada www.senati.edu.pe
Sesión 15 : Regresión Correlación Lineal

OBJETIVO
ESPECÍFICO 15 y 16

Al finalizar la tarea de
aprendizaje el
estudiante estará en
capacidad de Utilizar
métodos estadísticos
de regresión y
correlación lineal.
Recordemos
• Medidas de Tendencia Central y Variabilidad
• Teoría de Probabilidad
• Distribución con Variables Discretas
• Distribución Normal
• Propiedades, estandarización de variables
• Uso de la tabla
• Nivel de Confianza
• Coeficiente de confianza
• Error muestral - Tamaño de muestra
• Interpretación de resultados
• Gráficos

www.senati.edu.pe
¿Qué es la Regresión
Lineal?

www.senati.edu.pe
www.senati.edu.pe
www.senati.edu.pe
Regresión Lineal

www.senati.edu.pe
Regresión Lineal
• La regresión lineal es una técnica estadística que se
utiliza para modelar la relación entre dos variables. Es
un método simple pero poderoso que se utiliza
ampliamente en la investigación científica y en los
negocios.
• El objetivo de la regresión lineal es encontrar la línea
recta que mejor se ajuste a los datos. Esta línea recta
se llama línea de regresión y se utiliza para predecir
los valores de la variable dependiente en función de
los valores de la variable independiente.

www.senati.edu.pe
Variables Dependientes e Independientes
• En la regresión lineal, la variable dependiente es la
variable que se está estudiando y la variable
independiente es la variable que se cree que afecta a
la variable dependiente. Por ejemplo, si estamos
estudiando el efecto de la edad en la presión arterial,
la edad sería la variable independiente y la presión
arterial sería la variable dependiente.
• Es importante tener en cuenta que la regresión lineal
solo puede utilizarse cuando hay una relación lineal
entre las dos variables. Si la relación no es lineal, se
necesitan técnicas estadísticas más avanzadas para
analizar los datos.

www.senati.edu.pe
Métodos de Regresión Lineal
• Existen dos métodos principales de regresión lineal: la
regresión lineal simple y la regresión lineal múltiple. En
la regresión lineal simple, solo hay una variable
independiente, mientras que en la regresión lineal
múltiple, hay dos o más variables independientes.
• La regresión lineal simple es útil cuando se está
estudiando el efecto de una sola variable sobre la
variable dependiente. La regresión lineal múltiple es
útil cuando se están estudiando las interacciones entre
varias variables independientes y la variable
dependiente.

www.senati.edu.pe
Coeficiente de Correlación
• El coeficiente de correlación es una medida estadística que
indica la fuerza y la dirección de la relación entre dos
variables. El coeficiente de correlación varía entre -1 y 1. Si
el coeficiente de correlación es cercano a 1, indica una
relación positiva fuerte entre las dos variables. Si el
coeficiente de correlación es cercano a -1, indica una
relación negativa fuerte entre las dos variables.
• Es importante tener en cuenta que el coeficiente de
correlación no indica causalidad. Solo indica la fuerza y la
dirección de la relación entre las dos variables. Para
determinar si hay causalidad, se necesitan más pruebas y
análisis.

www.senati.edu.pe
Errores de Regresión
• Los errores de regresión son las diferencias entre
los valores reales y los valores predichos por la
línea de regresión. Son una medida de la precisión
del modelo de regresión. Cuanto menores sean los
errores de regresión, más preciso será el modelo.
• Existen varios métodos para calcular los errores de
regresión, como el error cuadrático medio y el
coeficiente de determinación. Estos métodos se
utilizan para evaluar la calidad del modelo de
regresión y para comparar diferentes modelos.

www.senati.edu.pe
Usos de la Regresión Lineal
• La regresión lineal se utiliza en una amplia variedad
de campos, como la economía, la psicología, la
medicina y las ciencias sociales. Se utiliza para
predecir valores futuros de la variable dependiente,
identificar relaciones entre variables y hacer
inferencias sobre poblaciones a partir de muestras.
• También se utiliza en el análisis de datos de negocios
para predecir ventas, analizar tendencias y tomar
decisiones informadas. En resumen, la regresión
lineal es una técnica estadística poderosa y versátil
que se utiliza en muchos campos diferentes.

www.senati.edu.pe
Regresión y Correlación Lineal Simple.

Modelo de Regresión Lineal Simple.


1) Método para Pronosticar una Variable.
2) Método para Determinar relación entre dos variables.
Herramienta cuantitativa para obtener estimación de los valores de una “Variable
Dependiente” a partir de una “Variable Independiente” midiendo la fuerza de una
relación “Causal”
Usualmente:
Variable Dependiente : y
Variable independiente: x

www.senati.edu.pe
Modelo de Regresión Lineal Simple (Ejemplos).
• Relación entre las ventas de frascos de aerosol y la cantidad
de fluoro carbonos liberados a la atmosfera.
• Los economistas estimarán el valor del PNB basándose en
• el consumo final dentro de la economía.
• El volumen de ventas de un producto depende de del precio
• unitario del producto.
• El nivel de gasto dentro de la economía depende del nivel
de impuestos al consumo.

www.senati.edu.pe
Modelo de Regresión Lineal Simple.
Relación Lineal Positiva Relación Lineal Negativa

Precaución con las relaciones de Asociación y las Causales.

www.senati.edu.pe
Diagrama de Dispersión:
El primer paso para determinar la existencia de una relación entre dos variables es la
revisión de una grafica de los datos observados.
El diagrama de dispersión es un gráfico que muestra puntos con dos coordenadas.

Lineal Directa Lineal Inversa Sin Relación

www.senati.edu.pe
Ejemplo Diagrama de Dispersión:
Se tienen los siguientes datos asociados a los Ingresos por
familia y gasto en renta.
Punto Ingresos (x) Gasto (y)

A 20 5
B 4 1.5
C 8 3
D 12 3.5
E 16 5
F 14 4.8
G 8 2.2
H 12 3
I 14 4.2
J 16 3.8

www.senati.edu.pe
Estimación Mediante Línea de Regresión:
En este procedimiento buscaremos ajustar una línea recta a los valores observados , buscando la mejor
aproximación.

La ecuación de una recta, donde Y es la variable dependiente y X es la variable


independiente:

Variable Dependiente Variable Independiente

Y = a + bX

Intersección en Y Pendiente de la línea

www.senati.edu.pe
www.senati.edu.pe
Ejemplo Ecuación de Una Recta:
Supongamos que Y = 3 + 2X Entonces Y = 5 si X = 1; Y = 7 si X = 2; y Y = 3 si X = 0

8
X Y
7
0 3
1 5 6

2 7 5

4
b = _ Y2 – Y1
X2 – X1 3

0
0 0.5 1 1.5 2 2.5

www.senati.edu.pe
Teorema de Mínimos Cuadrados:
• La diferencia entre los puntos observados y la línea recta encontrada va a
ser mínima.

Criterios:
• i) S ( Y – Ỹc ) = 0
• S ( Y – Y^c )² es mínima.
• Yc esta en función de (X , Y)

www.senati.edu.pe
Teorema de Mínimos Cuadrados:
Ecuaciones normales de regresión:

1)  ( y = a + b x) * 1
donde y es el coeficiente 1ª incógnita.
Y = an + b X

2)  ( y = a + b x) * X donde X es el coeficiente 2ª incógnita.

XY = a X + b X²

www.senati.edu.pe
Teorema de Mínimos Cuadrados:
Tomando los datos del ejemplo de Ingresos y Gasto.

Punto Ingresos (x) Gasto (y)


A 20 5
B 4 1.5 X = 124

C 8 3 Y = 36
XY = 492.4
D 12 3.5
X2 = 1736
E 16 5
F 14 4.8
G 8 2.2
H 12 3
I 14 4.2
J 16 3.8

www.senati.edu.pe
Teorema de Mínimos Cuadrados:

m = 0.23185
a = 0.72500

Ŷc = 0.72500 + 0.23185 X

www.senati.edu.pe
Teorema de Mínimos Cuadrados: Error de estimación.
Tomando los datos del ejemplo de Ingresos y Gasto
Punto Ingresos Gasto (y) Ŷ Error
(x) (Y-Ŷ)
A 20 5 5.3621 -0.3621 Suma Error  = 0.000

B 4 1.5 1.6524 -0.1524


C 8 3 2.5798 0.4202
D 12 3.5 3.5073 -0.0073
E 16 5 4.4347 0.5653
F 14 4.8 3.9710 0.8290
G 8 2.2 2.5798 -0.3798
H 12 3 3.5073 -0.5073
I 14 4.2 3.9710 0.2290
J 16 3.8 4.4347 -0.6347

www.senati.edu.pe
Teorema de Mínimos Cuadrados: Error Absoluto
Tomando los datos del ejemplo de Ingresos y Gasto
Punto Ingresos Gasto (y) Ŷ Err. Abs.
(x) |Y-Ŷ|
A 20 5 5.3621 0.3621
B 4 1.5 1.6524 0.1524
C 8 3 2.5798 0.4202 Suma Error Absoluto  = 4.0871
D 12 3.5 3.5073 0.0073
E 16 5 4.4347 0.5653
F 14 4.8 3.9710 0.8290
G 8 2.2 2.5798 0.3798
H 12 3 3.5073 0.5073
I 14 4.2 3.9710 0.2290
J 16 3.8 4.4347 0.6347

www.senati.edu.pe
Teorema de Mínimos Cuadrados: Error Cuadrático
Tomando los datos del ejemplo de Ingresos y Gasto
Punto Ingresos Gasto (y) E. Cuad.
Ŷ
(x) (Y-Ŷ)²

A 20 5 5.3621 0.1311
B 4 1.5 1.6524 0.0232
C 8 3 2.5798 0.1765 Suma Error Cuadrado  = 2.1947
D 12 3.5 3.5073 0.0001
E 16 5 4.4347 0.3196
F 14 4.8 3.9710 0.6873
G 8 2.2 2.5798 0.1443
H 12 3 3.5073 0.2573
I 14 4.2 3.9710 0.0525
J 16 3.8 4.4347 0.4028

www.senati.edu.pe
Teorema de Mínimos Cuadrados: Error Cuadrático
Suponiendo Ŷ= 0.75 + 0.23185 X
Punto Ingresos Gasto (y) E. Cuad.
Ŷ
(x) (Y-Ŷ)²

A 20 5 5.3870 0.1498
B 4 1.5 1.6774 0.0315
C 8 3 2.6048 0.1562 Suma Error Cuadrado  = 2.2009
D 12 3.5 3.5322 0.0010
E 16 5 4.4596 0.2919
F 14 4.8 3.9959 0.6465
G 8 2.2 2.6048 0.1639
H 12 3 3.5322 0.2833
I 14 4.2 3.9959 0.0416
J 16 3.8 4.4596 0.4352

www.senati.edu.pe
Teorema de Mínimos Cuadrados: Error Cuadrático
Suponiendo Ŷ= 0.79 + 0.23185 X
Punto Ingresos Gasto (y) E. Cuad.
Ŷ
(x) (Y-Ŷ)²

A 20 5 5.4271 0.1824
B 4 1.5 1.7174 0.0473
C 8 3 2.6448 0.1261
Suma Error Cuadrado  = 2.2369
D 12 3.5 3.5723 0.0052
E 16 5 4.4997 0.2503
F 14 4.8 4.0360 0.5837
G 8 2.2 2.6448 0.1979
H 12 3 3.5723 0.3275
I 14 4.2 4.0360 0.0269
J 16 3.8 4.4997 0.4895

www.senati.edu.pe
Coeficiente de Determinación:
La diferencia entre los puntos observados y el valor del promedio de las observaciones, va a tener
una parte de diferencia explicada, mas una diferencia no explicada por el modelo.
Desviación Total = (Desv. Explicada) + (Des. no Explicada)
( Y - Ỹ ) = ( Ŷc - Ỹ ) + ( Y - Ŷc )

Def. Coeficiente de Determinación: ( r² )

( r² ) = (Variación Explicada) / (Variación Total)

www.senati.edu.pe
Coeficiente de Determinación:

Def. Coeficiente de Determinación: ( r² )

( r² ) = (Variación Explicada) / (Variación Total)

( r² ) = _ ( Yc - Ỹ ) ²_
( Y

- Ỹ)²
( r² ): ( 0 << >> 1 )

( r² ) = 1 - _ ( Y - Yc) ²_
( Y

- Ỹ)²

www.senati.edu.pe
Coeficiente de Determinación:

Def. Coeficiente de Determinación ( r² ) : Cantidad de la variación de la variable dependiente que es


explicada por la ecuación de regresión.
( r² ) = 1 - _ ( Y - Yc) ²_
( Y - Ỹ)²

Coeficiente de correlación: Indica la medida del grado de asociación que existe entre las dos variables.

r = [ 1 - _ ( Y - Yc) ²_ ]½
( Y - Ỹ)²

Si (+) significa que las dos variables aumentan en la relación r” Si (-) significa que una crece mientras la otra
decrece.

www.senati.edu.pe
Ejercicio:
Obtener ecuación de regresión y coeficiente de determinación

X Y
1 3
2 6
3 9
4 12
5 15
6 18
7 21
8 24

www.senati.edu.pe
Ejercicio:
Obtener ecuación de regresión y coeficiente de determinación

X Y
1 5
1 7
2 5
2 7
3 5
3 7
4 5
4 7

www.senati.edu.pe
www.senati.edu.pe
www.senati.edu.pe
www.senati.edu.pe
www.senati.edu.pe
www.senati.edu.pe
Demostremos lo que hemos aprendido

https://create.kahoot.it/share/regresion-correlacion-lineal-parte-i/3a50c486-1a5a-47f0-
87df-02b92da95d83

www.senati.edu.pe
www.senati.edu.pe
Resumen
• Regresión Correlación Lineal
• Definición
• Gráfico de dispersión
• Método de mínimos cuadrados
• Coeficiente de correlación lineal.

www.senati.edu.pe
www.senati.edu.pe

También podría gustarte