Está en la página 1de 19

DIPLOMADO:

EXCEL EMPRESARIAL

Materia:

ESTADISTICA Y ANÁLISIS DE DATOS

Docente: M.Sc. Ing. Jhimmy R. Rios Saravia


Tema 6:

Regresión Lineal y Correlación


6.1 Correlación.
6.1.1 Análisis de Correlación

Las correlaciones tienen muchas aplicaciones en el mundo de la empresa y en


la economía. En muchos problemas económicos aplicados, afirmamos que hay
una variable independiente o exógena X, cuyos valores son determinados por
actividades realizadas fuera del sistema económico examinado y que hay una
variable dependiente o endógena Y, cuyo valor depende del valor de X. Si
preguntamos si las ventas aumentan cuando bajan los precios, estamos
analizando una situación en la que un vendedor ajusta de una forma
deliberada e independiente los precios en sentido ascendente o descendente
y observa cómo varían las ventas. Supongamos ahora que los precios y las
cantidades vendidas son el resultado de equilibrios de la oferta y la demanda
como propone el modelo económico básico. En ese caso, podríamos analizar
los precios y las cantidades como variables aleatorias y preguntarnos si estas
dos variables aleatorias están relacionadas entre sí.
6.1.1 Coeficiente de Correlación
El coeficiente de correlación describe la fuerza de la relación entre dos
conjuntos de variables en escala de intervalo o de razón.
6.1.1 Coeficiente de Correlación

1. El coeficiente de correlación de la muestra se identifica con la letra minúscula


r.
2. Muestra la dirección y fuerza de la relación lineal (recta) entre dos variables
en escala de intervalo o de razón
3. Varía desde -1 hasta +1, inclusive.
4. Un valor cercano a 0 indica que hay poca asociación entre las variables.
5. Un valor cercano a 1 indica una asociación directa o positiva entre las
variables
6. Un valor cercano a 21 indica una asociación inversa o negativa entre las
variables
6.1.1 Coeficiente de Correlación
Se calcula de la siguiente manera:

𝑛 numero de pares de datos


σ 𝑥 denota la suma de todos los valores de x.
෌ 𝑥 2 indica que cada valor de x debe elevarse al cuadrado y que después dichos cuadrados se suman.
σ𝑥 2
indica que cada valor de x debe elevarse al cuadrado y que después dichos cuadrados se suman.
σ 𝑥𝑦 indica que cada valor de x debe multiplicarse primero por su valor y correspondiente. Después de
obtener todos estos productos, se calcula su suma.
𝑟 representa el coeficiente de correlación lineal de una muestra
𝜌 representa el coeficiente de correlación lineal de una población
6.2 Modelo de Regresión Lineal
6.2.1 Recta de Regresión
Aprenderemos a calcular la línea de regresión de manera más precisa, usando una ecuación que
relaciona dos variables matemáticamente.

Definición Dado un conjunto de datos muestrales apareados, la ecuación de regresión describe


algebraicamente la relación entre dos variables. La gráfica de la ecuación de regresión se
denomina recta de regresión (recta del mejor ajuste o recta de mínimos cuadrados).
6.2.1 Recta de Regresión
Ejemplo

Supongamos que sabemos que a es 3 y b es 2. Determinemos cuál sería Y para X igual a 5

𝑌 = 𝑎 + 𝑏𝑋

𝑌 = 3 + 2(5)

𝑌 = 3 + 10

𝑌 = 13 Valor de Y dado un X=5


6.2.1 Recta de Regresión
Ejemplo

¿Cómo podemos encontrar los valores de las constantes numéricas, a y b?

𝑌2 − 𝑌1
𝑏=
𝑋2 − 𝑋1
Segundo punto (X2, Y2) o (2, 7)

7−5
𝑏= =2 Pendiente de la recta
2−1 Primer punto (X1, Y1) o (1, 5)

Usando esta ecuación, podemos determinar el valor correspondiente


de la variable dependiente para cualquier valor de X. Proceda a
encontrar el valor de Y cuando X = 7. 𝑎=3
6.2.3 Mínimos Cuadrados
Antes de analizar el método de estimación de los mínimos cuadrados es importante
presentar el concepto de residual. En esencia, un residual es un error en el ajuste del
modelo 𝑦ො = 𝑎 + 𝑏𝑥.

Es evidente que si un conjunto de n residuales es grande, entonces el ajuste del


modelo no es bueno. Los residuales pequeños son indicadores de un ajuste
adecuado. Otra relación interesante, y que a veces es útil, es la siguiente:

𝑦 = 𝑎 + 𝑏𝑥 + 𝑒𝑖
6.2.3 Mínimos Cuadrados
¿Cómo podemos “ajustar” una recta matemáticamente si ninguno de los puntos está
sobre ella? Para un especialista en estadística, la línea tendrá un “buen ajuste” si minimiza
el error entre los puntos estimados en la recta y los puntos observados reales que se
utilizaron para trazarla.

7
6
5
4
Y

3
2
1
0
0 5 10 15 20
X
6.2.3 Mínimos Cuadrados
Una forma en que podemos “medir el error” de nuestra línea de estimación es sumando
todas las diferencias, o errores, individuales entre los puntos estimados mostrados.

7
6 Y 𝑌෠ Y - 𝑌෠ 𝑌 − 𝑌෠
5 0.8
4 4.8 -0.8
4 6 4.2 1.8 1.8
1.6
Y

2 3.6 -1.6
3
4 3 1 1
2 2 2.4 -0.4 0.4
1 0 5.6

0
0 5 10 15 20
X
6.2.3 Mínimos Cuadrados
Deseamos encontrar una forma de “penalizar” errores absolutos grandes, para poder
evitarlos. Podemos lograr esto si elevamos al cuadrado los errores individuales antes de
sumarlos.

Fig (a) Fig (a)


Y 𝑌෠ 𝑌 − 𝑌෠ Y 𝑌෠ 𝑌 − 𝑌෠
4 4 0 4 5 1
7 3 4 7 4 3
2 2 0 2 3 1
4 5
6.2.3 Mínimos Cuadrados
Apliquemos el criterio de mínimos cuadrados al problema de la figura diapositiva arriba.
Una vez que organizamos los datos y sumamos los cuadrados, vemos que, tal como lo
pensamos, la línea de estimación en la gráfica (b) es el mejor ajuste.

Fig (a) Fig (a)


Y 𝑌෠ ෠ 2
(𝑌 − 𝑌) Y 𝑌෠ ෠ 2
(𝑌 − 𝑌)
4 4 0 4 5 1
7 3 16 7 4 9
2 2 0 2 3 1
16 11
6.2.4 Pendiente de la recta de regresión de mejor ajuste
Usando el criterio de los mínimos cuadrados, podemos determinar si una línea de estimación es
mejor ajuste que otro. Pero para un conjunto de puntos a través de los cuales podríamos trazar un
número infinito de líneas de estimación, ¿cómo podemos saber cuándo hemos encontrado la
recta del mejor ajuste?
Los estadísticos han desarrollado dos ecuaciones que podemos utilizar para encontrar la
pendiente y la ordenada Y de la recta de regresión de mejor ajuste. La primera fórmula calcula la
pendiente:

σ 𝑋𝑌 − 𝑛𝑋ത 𝑌ത
𝑏=
σ 𝑋 2 − 𝑛𝑋ത 2

𝑎 = 𝑌ത − 𝑏𝑋ത
6.2.5 Lineamientos para el uso de la ecuación de regresión

1. Si no existe una correlación lineal, no utilice la ecuación de regresión para hacer


predicciones.
2. Cuando utilice la ecuación de regresión para hacer predicciones, permanezca en el
ámbito de los datos muestrales disponibles. Si usted calcula una ecuación de
regresión que relaciona la estatura y el número de calzado de mujeres, es absurdo
predecir el número de calzado de una mujer que mide 10 pies de estatura.
3. Una ecuación de regresión que está basada en datos antiguos no necesariamente es
válida ahora. La ecuación de regresión que relaciona precios de automóviles usados
con la antigüedad de los automóviles ya no es útil si está basada en datos de los años
1970.
4. No haga predicciones acerca de una población distinta de la población de donde
se obtuvieron los datos muestrales. Si reunimos datos muestrales de hombres y
desarrollamos una ecuación de regresión que relaciona edad y uso del control
remoto del televisor, los resultados no necesariamente se aplican a las mujeres.

También podría gustarte