Documentos de Académico
Documentos de Profesional
Documentos de Cultura
REGRESIÓN Y CORRELACIÓN
En la investigación estadística es muy frecuente encontrar variables que están relacionadas entre
si, algunas con mayor grado y otras casi nula. Por ello es posible que una variable dependiente de
una o más variables independientes se puedan expresar matemáticamente en función de dichas
variables. Por ejemplo, el peso de las personas se relaciona con sus alturas; la venta de refrescos
se relaciona con la temperatura, el precio, la marca y otros factores o variables.
Estadísticamente interesa analizar la relación entre dos o más variables, siempre que exista un
indicio de asociación o dependencia entre ellas. Lo importante es medir y expresar funcionalmente
esa relación mediante una función o modelo matemático.
El análisis de regresión consiste en emplear métodos que permitan determinar la mejor relación o
ajuste funcional entre dos o más variables relacionadas. El análisis de correlación estudia el
grado de asociación de dos o más variables.
La regresión y correlación se llama simple cuando se trata de relacionar o asociar dos variables
(una dependiente y otra independiente) y se llama múltiple cuando se trata de modelar más de
dos variables.
Una vez decidido el tipo de función matemática que mejor se ajusta (o representa nuestro
concepto de la relación exacta que existe entre las variables) se presenta el problema de elegir
una expresión particular de esta familia de funciones; es decir, se ha postulado una cierta función
como termino del verdadero estado en la población y ahora es necesario estimar los parámetros
de esta función (ajuste de curvas).
Como los valores de los parámetros no se pueden determinar sin errores por que los valores
observados de la variable dependiente no concuerdan con los valores esperados, entonces la
Covarianza
Mide la forma en que varía conjuntamente dos variables X e Y. En el estudio conjunto de dos
variables, lo que nos interesa principalmente es saber si existe algún tipo de relación entre ellas.
Veremos ahora una medida descriptiva que sirve para medir o cuantificar esta relación:
x x y j y
S xy
i
Si Sxy >0 hay dependencia directa (positiva), es decir las variaciones de las variables tienen el
mismo sentido.
Si Sxy = 0 las variables están incorreladas, es decir no hay relación lineal, pero podría existir otro
tipo de relación.
Si Sxy < 0 hay dependencia inversa o negativa, es decir las variaciones de las variables tienen
sentido opuesto.
Regresión Lineal Simple
Cuando la relación funcional entre las variables dependiente (Y) e independiente (X) es una línea
recta, se tiene una regresión lineal simple, dada por la ecuación: Y = A + BX + ε
Estimación de parámetros
Consiste en determinar los parámetros A y B a partir de los datos muestrales observados; es decir,
deben hallarse valores como a y b de la muestra, que represente a A y B, respectivamente.
La función de regresión lineal simple es expresado como: Y = a + bX + ε
e y i a bxi
2 2
i
Donde:
S xy
b Coeficiente de regresión (pendiente de la recta, mide el cambio de la variable Y por
S x2
unidad de cambio de X)
n xy x y
De manera práctica: b
n x 2 x
2
i X Y XY X2 Y2
n xy x y 7(36010) 39(4490)
b 125,342
n x x 7(305) 39 2
2 2
4490 39
a y bx 125,342 56,905
7 7
d) Para estimar los años de operación de un autobús que tiene un costo de mantenimiento de
$930.
Es decir: Y = 930
930 125,34 x 56,91
930 56.91
x 125.34
7,87
Problema 1
En un proceso de extracción se estudió la relación entre el tiempo de extracción (min) y los años
de experiencias en la empresa. A continuación se presentan los datos recopilados de 8
trabajadores de la empresa.
Tiempo extracción
6 8 12 11 6 11 14 7
(min)
Años de
5 4 1 3 4 2 1 4
experiencias
b) Construir el diagrama de dispersión y determinar el tipo de correlación.
c) Determinar la ecuación de la recta de regresión y que confiabilidad tiene el modelo.
d) Estimar el tiempo de extracción para un trabajador con 6 años de experiencia.
Problema 2
La demanda de un tipo de impresora ha cambiado debido a una rápida variación en el precio. Se
ha observado la demanda Y (en unidades) y el precio unitario (S/.). Los resultados se presentan
en la tabla adjunta:
Precio (S/.) 300 450 500 700 400 600 800 550
Demanda (unid) 5000 4000 3000 2000 3800 2500 1500 2800
b) Determinar la ecuación de la recta de regresión y su coeficiente de determinación.
c) Estimar el precio de la impresora cuando la demanda es de 4500 unidades
Problema 3
En un estudio experimental sobre el crecimiento de una planta, se ha registrado la altura (cm) y el
número de días transcurridos desde su germinación.
a) Construir el
Tiempo (días) 1 3 4 7 10 diagrama de
Altura (cm) 1 2 3 12 16
dispersión y
determinar el tipo de correlación.
b) Determinar la ecuación de la recta de regresión y su coeficiente de determinación.
c) Investigar y determinar un mejor ajuste no lineal.
Problema 4
La empresa ABC tiene un grupo de 8 vendedores, cuyas ventas (Y)
cuadro siguiente:
años de
Vendedor ventas $
experiencia
1 6 800
2 5 600
3 1 200
4 5 500
5 2 300
6 1 250
7 3 450
8 1 150