Está en la página 1de 16

Regresión lineal

PROBABILIDAD Y ESTADÍSTICA
Análisis de regresión
Técnica estadística para estudiar la relación entre una variable dependiente y una
o más independientes.

Genera una ecuación para describir la relación estadística entre uno o más
predictores y la variable de respuesta.
Usualmente, es útil para predecir nuevas observaciones.
Generalmente, utiliza el método de estimación de mínimos cuadrados
ordinarios, del cual se obtiene la ecuación al minimizar la suma de los residuos
cuadrados.
¿Cuál es la variable respuesta?
• Grosor de una torta, tiempo de horneado, temperatura del horno.

• Género, hábito de consumo de bebidas alcohólicas.

• Humedad del suelo, Toneladas de café para exportar.

• Género, horas de estudio a la semana, nota del parcial.


Diagrama de dispersión

Fuente: http://support.minitab.com
Relación lineal

Relación lineal positiva Relación lineal negativa

Fuente: http://support.minitab.com
Análisis de regresión lineal
SIMPLE MÚLTIPLE
Examina la relación lineal entre dos variables La regresión lineal múltiple examina las
continuas: una respuesta (Y) y un predictor (X). relaciones lineales entre una respuesta
continua y dos o más predictores.
Cuando las dos variables están relacionadas,
es posible predecir un valor de respuesta a
partir de un valor predictor con mayor
exactitud.
Simple = Una variable independiente.
Ejemplo 1
A continuación se muestran las estaturas en Estatura Peso
centímetros de 10 estudiantes de Probabilidad 162 50
y Estadística y su peso en kilogramos. 160 50
158 48
1. ¿Cuál es la variable respuesta? 168 55
170 56
2. Hallar la ecuación de la recta de regresión
165 52
de la estatura sobre el peso.
160 51
3. ¿Cuál sería el peso aproximado de una 162 51
estudiante que mida 172 cm?
168 56
164 52
Ejemplo 2
En la tabla se muestra el número de horas No. Horas No. Piezas
trabajadas de seguido por un empleado y el 2 12
número de piezas producidas en determinado 3 20
taller de confecciones.
2 10
4 25
1. ¿Cuál es la variable respuesta? 2 12
2 11
2. Hallar la ecuación de la recta de regresión.
3 18
3. ¿Cuántas piezas produciría aproximadamente 3 20
un empleado que trabaje 5 horas seguidas?
4 24
4 25
Ejercicio (1)
Identifique la variable independiente y la variable dependiente en los
siguientes casos:
El tiempo que tarda un equipo de trabajo en la elaboración del proyecto final y
la nota obtenida.
La estatura del hijo y la estatura del padre.
La edad de una mujer y el costo de la medicina prepagada.
El precio de un producto de catálogo y el número de unidades vendidas.
La demanda de un producto y el número de consumidores en el mercado.
Ejercicio (2)
Una aerolínea muestra a continuación el dinero invertido en publicidad en 15 meses
observados y el número de pasajeros. Los datos se muestran en miles de dólares y en
miles de personas respectivamente.
Publicidad Pasajeros Publicidad Pasajeros
10 15 14 20 1. Identifique la variable dependiente
y la variable independiente.
12 17 19 24
2. Hallar la ecuación de la recta de
8 13 10 17
regresión.
17 23 11 16
3. ¿Cuántos pasajeros espera tener la
10 16 13 18 compañía si realiza una inversión
15 21 16 23 de US$9500 en el próximo mes?
10 14 10 15
12 16 - -
Coeficiente de Correlación
La función de este coeficiente es obtener una medida de fuerza de la relación que existe entre
las variables, desarrollado por Carl Pearson.
Representado por r, el coeficiente de correlación puede asumir cualquier valor entre -1 y +1; es
decir :
−𝟏 ≤ 𝒓 ≤ +𝟏

Un valor de r=-1 indica una relación negativa perfecta entre X y Y


r=+1 indica una relación positiva perfecta entre X y Y
|r| ≈ 1 indica una relación fuerte pero menos perfecta entre X y Y
|r|≈ 0 indica muy poco o ninguna relación entre X y Y
Posibles valores para el coeficiente de correlación r…
Coeficiente de determinación
Proporciona una medida de bondad de ajuste porque revela qué porcentaje del cambio en Y se
explica por un cambio en X.
Se representa por 𝑟 2 y se obtiene elevando al cuadrado el coeficiente de correlación de
Pearson.
Ejemplo
En el caso de las variables pasajeros y cantidad de dinero invertido en fines
publicitarios nos arroja los siguientes datos:

𝑟 = 0.9683
𝑟 2 = 0.9683 2 = 0.94

Estos nos indica una relación fuerte entre los pasajeros y la cantidad de dinero
invertido en fines publicitarios; y que el 94% del cambio en el número de
pasajeros se explica mediante un cambio en la publicidad.
Ejercicio (1)
En el caso de las variables estatura y peso de los estudiantes de Probabilidad y
estadística.
Calcule e interprete los coeficientes de correlación y determinación.
Ejercicio (2)
En el caso de las variables horas trabajadas y número de piezas producidas por
un empleado.
Calcule e interprete los coeficientes de correlación y determinación.