Documentos de Académico
Documentos de Profesional
Documentos de Cultura
La regresión lineal es una técnica de modelado estadístico que se emplea para describir
una variable de respuesta continua como una función de una o varias variables
predictivas.
En este curso estudiaremos la regresión lineal simple, es decir con 1 sola variable
predictora.
La regresión lineal permite predecir el comportamiento de una variable (dependiente) a
partir de otra (independiente).
HISTORIA
Fue Sir Francis Galton, médico y primo de Charles Darwin, quien introdujo el término
regresión, en su artículo “Regression towards mediocrity in hereditary stature”,
publicado en 1886 en el Journal of the Anthropological Institute y que menciona de
nuevo en su libro Natural Inheritance, de 1889.
Prof. Gustavo Rueda ESTADÍSTICA II
REGRESIÓN LINEAL
Para el análisis de regresión es crucial determinar cuál es la variable dependiente y cuál
la independiente, esta determinación depende de la lógica común y de lo que el
estadístico trate de investigar; por ejemplo, supongamos que las ventas de una empresa
dependen (al menos en parte) de la cantidad de publicidad que ésta hace, las ventas se
consideran la variable dependiente y es función de la variable independiente, que es la
publicidad.
La variable dependiente se identifica con la letra Y, también se puede llamar variable
explicada.
La variable independiente se identifica con la letra X, también se llama regresor o
variable explicativa.
La regresión y la correlación son conceptos diferentes, pero que guardan una íntima
relación
Prof. Gustavo Rueda ESTADÍSTICA II
ANÁLISIS DE REGRESIÓN
CLASIFICACIÓN
1) Para hallar una ecuación que relacione las variables, el primer paso es recoger datos
que muestren los valores correspondientes de las variables bajo consideración.
2) Realizar un diagrama de dispersión, que es la representación gráfica de las
observaciones pareadas de X e Y (lo habitual es colocar la variable dependiente en el eje
vertical y la independiente en el horizontal), pudiéndose presentar cualquiera de las
situaciones de la lámina siguiente.
3) Realizar el ajuste según la orientación que proporcione el diagrama.
Prof. Gustavo Rueda ESTADÍSTICA II
POSIBLES SITUACIONES:
Prof. Gustavo Rueda ESTADÍSTICA II
Covarianza
Correlación Lineal
LA COVARIANZA
La covarianza explica que tan relacionadas se encuentran dos variables entre sí.
Si se tiene muestras
pequeñas (n ≤ 10), se
debe dividir por (n-1)
en vez de por n.
Prof. Gustavo Rueda ESTADÍSTICA II
LA COVARIANZA, INTERPRETACIÓN:
Si el valor de Sxy es positivo indica una relación lineal positiva entre x e y (al aumentar el
valor de x aumenta el de y).
Si el valor de Sxy es negativo indica una relación lineal negativa entre x e y (al aumentar
el valor de x disminuye el de y).
Si el valor de Sxy es cercano o igual a cero se dice que no existe relación lineal entre x e y.
Prof. Gustavo Rueda ESTADÍSTICA II
La Covarianza indica que hay una relación lineal positiva entre las notas de
música y matemáticas.
Prof. Gustavo Rueda ESTADÍSTICA II
IMPORTANTE:
La Covarianza se ve afectada por las unidades de medida, por ejemplo, si interesa la relación
entre el peso y la altura de varios alumnos. El resultado será distinto, si se usa kg y metros o
libras y pies, en magnitud, pero no en el sentido.
Por ello se utiliza el Coeficiente de Correlación que no está afectado por ninguna unidad de
medida.
Un investigador realiza un estudio para averiguar la relación entre el peso (Kg) y la altura
(metros) de 10 sujetos. Los datos se presentan en la siguiente tabla y se pide:
CORRELACIÓN:
Las variables que son correlacionadas pueden ser dos variables cuantitativas.
Describe la intensidad de la relación entre dos variables. Se denota con la letra, r y puede
tomar cualquier valor entre -1,00 (correlación negativa perfecta) y 1,00 (correlación
positiva perfecta). El coeficiente de correlación más común es el Coeficiente de
Correlación de Pearson (r).
Prof. Gustavo Rueda ESTADÍSTICA II
CORRELACIÓN:
¿Cuál será la correlación entre el ingreso anual de una familia y el número de hijos
menores de 15 años?
¿Entre la cantidad vendida y su precio?
¿Entre el promedio de notas de bachillerato y el promedio de notas en la universidad?
Prof. Gustavo Rueda ESTADÍSTICA II
EJEMPLO 3:
CORRELACIÓN:
EJEMPLO 4:
Los directivos de un centro comercial saben que en función de la distancia, en Km, a la que
se sitúe de un núcleo de población, cuantos cientos de clientes acudirán al mismo.
Calcular el coeficiente de correlación lineal.
Prof. Gustavo Rueda ESTADÍSTICA II