Está en la página 1de 48

Regresión y Correlación

Ciclo 01-2019
MGC ING Raúl Cabezas
• Cuando el coeficiente de correlación rectilíneo se encuentra mas
cercano a -1 ó a 1 que a cero entonces se asume que existe
correlación rectilínea.

-1 -0.5 0 0.5 1

Hay correlación No Hay correlación Hay correlación


Cálculo del coeficiente de corelación
Producto Nuevo Producto Estrella x² y² xy
(x) (y)

6.0 1.5

6.5 1.2

6.7 4.8

7.0 6.2

9.5 9.4
Ejemplo 2.
• Para los siguientes datos, calcular el coeficiente de correlación.
Edad Peso
15 60
30 75
18 67
42 80
28 60
19 65
31 92

R/0.695
Coeficiente de correlación lineal de Pearson
• El coeficiente de correlación de Pearson, pensado para variables
cuantitativas (escala mínima de intervalo), es un índice que mide el grado
de covariación entre distintas variables relacionadas linealmente.
Adviértase que decimos "variables relacionadas linealmente".
• Esto significa que puede haber variables fuertemente relacionadas, pero no
de forma lineal, en cuyo caso no proceder a aplicarse la correlación de
Pearson.
• Por ejemplo, la relación entre la ansiedad y el rendimiento tiene forma de
U invertida; igualmente, si relacionamos población y tiempo la relación
será de forma exponencial.
• En estos casos (y en otros muchos) no es conveniente utilizar la correlación
de Pearson. Insistimos en este punto, que parece olvidarse con cierta
frecuencia.
• El coeficiente de correlación de Pearson es un índice de fácil ejecución e,
igualmente, de fácil interpretación.
• Digamos, en primera instancia, que sus valores absolutos oscilan entre 0 y
1.
• Esto es, si tenemos dos variables X e Y, y definimos el coeficiente de
correlación de Pearson entre estas dos variables como xy r entonces:
Hemos especificado los términos "valores absolutos" ya que en realidad
si se contempla el signo el coeficiente de correlación de Pearson oscila
entre –1 y +1.
• No obstante ha de indicarse que la magnitud de la relación vienen
especificada por el valor numérico del coeficiente, reflejando el signo la
dirección de tal valor. En este sentido, tan fuerte es una relación de +1
como de -1.
• En el primer caso la relación es perfecta positiva y en el segundo
perfecta negativa. Pasamos a continuación a desarrollar algo más
estos conceptos.
• Se dice que la correlación entre dos variables X e Y es perfecta
positiva cuando exactamente en la medida que aumenta una de ellas
aumenta la otra.
• Esto sucede cuando la relación entre ambas variables es
funcionalmente exacta. Difícilmente ocurrirá en psicología, pero es
frecuente en los ciencias físicas donde los fenómenos se ajustan a
leyes conocidas, por ejemplo, la relación entre espacio y tiempo para
un móvil que se desplaza a velocidad constante. Gráficamente la
relación ser del tipo: 0 ≤ rxy ≤ 1
Ecuación a utilizar

σ 𝑍𝑥𝑍𝑦
rxy =
𝑁
El coeficiente de correlación de Pearson hace referencia a la media de
los productos cruzados de las puntuaciones estandarizadas de X y de Y.
Esta formula reúne algunas propiedades que la hacen preferible a otras
Regresión
• Cuando entre dos variables (x,y) existe correlación rectilínea, esto
quiere decir que dichas variables se relacionan siguiendo la tendencia
de una línea recta; pero como la correlación en la mayoría de los
casos no es perfecta, se presenta el problema de averiguar cuál es la
línea recta que describe de mejor manera dicha relación; porque para
un mismo diagrama de dispersión pueden trazarse muchas rectas
Ejemplo 3.
• Los pesos en libras y la estatura en centiemtros de siete personas se muestran a
continuación:
Peso (Lb)
105 113 118 125 140 145 160

Estatura (cm) 155 160 164 169 160 168 167

• Encontrar:
a) El coeficiente de correlacion rectilinear.
b) Obtener la recta de regression de los pesos sobre las estaturas, es decir. Considere al
peso como la variable dependiente Y y la estatura como la variable independiente X
c) Estimar elpeso correspondiente a una estatura de 168 cm, así como el peso que cabe
esperar tendrpa una persona cuya estatura se a de 165 cm
Ecuaciones regresión
• Y = a + bx

σ 𝑦 · σ 𝑥² − σ 𝑥 σ 𝑥 𝑦
𝑎=
𝑛 σ 𝑥² − σ 𝑥 ²

𝑛 σ 𝑥𝑦 − σ 𝑥 · σ 𝑦
𝑏=
𝑛 σ 𝑥² − σ 𝑥 ²
Series cronológicas
a) Numero de años impar.
Se muestran los resultados de las exporaciones de añil hacia Europa.
Años Millones de toneladas
2013 0.69
2014 0.8
2015 0.8
2016 0.6
2017 0.5
Solución
Años X Millones de toneladas

2013 0.69

2014 0.8

2015 0.8

2016 0.6

2017 0.5
b) Numero de años: Par.
Se muestran los resultados de inversions en maqiuinas industrials en el sector
agripecuario

Años Millones de toneladas


2012 52.6
2013 67.3
2014 101.9
2015 147.7
2016 196.3
2017 250.6

Estimar las ventas para el año 2018.


a) Solución

Años X Millones de dólares

2012 52.6

2013 67.3

2014 101.9

2015 147.7

2016 196.3

2017 250.6
Pronósticos.
MÉTODO DE LOS MÍNIMOS CUADRADOS.
• es un método que sirve para • Como cualquier otro, el método
proyectar las ventas de futuros de mínimos cuadrados debe ser
períodos con base a ventas de ajustado en caso de que existan
gestiones pasadas. factores que cambien las
condiciones y situaciones, tanto
económicas, políticas, de
mercado, capacidad, tanto
externas como internas.
• Por ejemplo, si la cantidad de ventas en los anteriores
cinco años fueron:

Año Cantidad de
Ventas
1 220
2 245
3 250
4 258
5 273.5
• Si se desea estimar las ventas para los siguientes cinco años con la
misma tendencia, se puede acudir al método de mínimos
cuadrados.
• Aplicando el método se ajusta a la recta:
• Y = a + bx
• Donde:

𝑁 σ 𝑥𝑦 − σ 𝑥 σ 𝑦
b=
𝑁 σ 𝑥² − σ 𝑥 ²

σ 𝑦 −𝑏 σ 𝑥
a=
𝑁
• Por lo que para reemplazar en éstas fórmulas, previamente es
necesario determinar: “xy” y también “x²”:

Años Cantidad de
(x) ventas (y) x² y² xy

1 220
2 245
3 250
4 258
5 273.5
Σ = 15 Σ = 1246.5 Σ = 55 Σ = 312,291.25 Σ = 3859.5
• Reemplazando en las ecuaciones:

𝑁 σ 𝑥𝑦 − σ 𝑥 σ 𝑦 σ 𝑦 −𝑏 σ 𝑥
b= ; a=
𝑁 σ 𝑥² − σ 𝑥 ² 𝑁

5 ·(3859.5) −( 15)(1246.5)
b= = 12
5 ·(55) − 15

1246.5 −( 12 · 15 )
a= = 213.3
5
• Y = a + bx
• Y = 213.3 + 12x
• Ahora el crecimiento de las ventas se determina mediante una constante
“c” la cuál se calcula mediante:

𝑏(𝑛)
•c= σ𝑦
;

12 ·(5)
•c= = 0.048
1246.5

• Por lo que las ventas crecerán en un promedio de 4.8% anual.


• Las ventas estimadas para los siguientes 5 periodos son:

• Y(6) = 213.3 + 12 (6) = 285.3

• Y(7) = 213.3 + 12 (7) = 297.3

• Y(8) = 213.3 + 12 (8) = 309.3

• Y(9) = 213.3 + 12 (9) = 321.3

• Y(10) = 213.3 + 12 (10) = 333.33


MÉTODO DEL INCREMENTO PORCENTUAL.
1. Este método consiste en determinar el porcentaje de
variaciones de los distintos períodos con respecto al anterior.
2. Determinar el promedio de las variaciones.
Por ejemplo, si la cantidad de ventas en los anteriores cinco años
fueron:

El porcentaje de variación es:


Entonces el porcentaje de variación con base a las ventas de los
anteriores cinco períodos serán:

Cantidad de (Y1 − Yn−1 )


Año Y1 - Yn-1
ventas (Yn−1 )
1 220 -
2 245 25 0.1136363636
3 250 5 0.0204816326
4 258 8 0.032
5 273.5 15.5 0.06007751937
0.22612204626
El incremento porcentual del período dos respecto al periodo uno es:
El incremento porcentual del período 3 respecto al periodo 2 es:
El incremento porcentual del período 4 respecto al periodo 3 es:
El incremento porcentual del período 5 respecto al periodo 4 es:
La sumatoria de las variaciones es:
Como el promedio de variación es la sumatoria de los porcentajes de
variación dividido entre el número de períodos menos uno.
• Con éste coeficiente ya se puede pronosticar la-cantidad de ventas para
los siguientes cinco períodos.
• Considerando que las ventas en el período 5 son de 273.5 unidades, las
ventas esperadas para el período 6 serán:
Considerando que las ventas en el período 6 serán 288,96, las ventas
esperadas para el período 7 serán:

Considerando que las ventas en el período 7 serán 305.29, las ventas esperadas para el período 8
serán
Considerando que las ventas en el período 9 serán 340.78, las ventas
esperadas para el período 10 serán:
En resumen, con base a estadísticas de períodos anteriores y aplicando el
método de incremento porcentual, las ventas proyectadas para los
siguientes cinco períodos (sexto al décimo) son:
Ejercicio, para la siguiente tabla re registro de ventas, pronosticar las
ventas para los próximos seis períodos por medio de:
a) Calcular el EOQ para la semana 10 si el costo de cada pedido es de $4.00
b) ¿Cuál es el costo del inventario si se toma la demanda anual como la demanda del mes 12
si la política del inventario es de que cuando la posición del inventario baje a la cantidad el
EOQ del periodo 12 se deben hacer un pedido de 159 docenas cuando el precio de
mantenimiento del inventario es de $1.50/año y el costo por docena es de $12.50

Periodo Pedidos (Docenas)


1 8
2 10
3 15
4 9
5 12
6 13
7 12
8 16
Ejercicio
Dada la siguiente tabla calcular el pronóstico para la presión
sanguínea en las siguientes 5 personas utilizando los mínimos
cuadrados y evidenciar si existe o no correlación entre las variables.
No. Edad Presión (y) XY
1 54 7992
2 40 123
3 70 155
4 115 1225
5 62 150
6 15876 5670
7 55 152
8 50 144
9 1444 4332

Σ 449 1227 23479 16945 62649


Promedios móviles
• Se usa para estimar el promedio de una serie de tiempo de demanda y, por lo
tanto, para suprimir los efectos de las fluctuaciones aleatorias.
• Este método resulta más útil cuando la demanda no tiene tendencias
pronunciadas ni influencias estacionales.

• La aplicación de un modelo de promedio móvil requiere simplemente calcular la


demanda promedio para los n periodos más recientes, con el fin de usarla como
pronóstico para el siguiente periodo. Para el periodo siguiente, una vez que se
conoce la demanda, la demanda más antigua incluida en el promedio anterior
se sustituye por la demanda más reciente y luego se vuelve a calcular el
promedio. De esta manera, se usan las n demandas más recientes y el promedio
se “mueve” de un periodo a otro.
• En términos específicos, el pronóstico correspondiente al periodo t + 1 se
calcula como sigue:
Ejemplo
• Calcule un pronóstico de promedio móvil de tres semanas para
estimar el pedido durante la semana 4.
• Las cifras correspondientes en las últimas tres semanas son las
• siguientes:
Semana Pedidos (Docenas)

1 400

2 380

3 411
Promedios móviles ponderados
• En el método de promedio móvil simple, todas las demandas tienen
la misma ponderación en el promedio, es decir, 1/n.
• En el método de promedio móvil ponderado, cada una de las
demandas históricas que intervienen en el promedio puede tener su
propia ponderación.

• La suma de las ponderaciones es igual a 1.0. Por ejemplo, en un


modelo con promedio móvil ponderado de tres periodos, al periodo
más reciente se le puede asignar una ponderación de 0.50, al
segundo más reciente se le asigna una ponderación de 0.30, y al
tercero más reciente, una de 0.20
• Con el método de promedio móvil, el pronóstico de la demanda en el periodo
siguiente será igual al promedio calculado al final de este periodo.
• En cualquier método de pronóstico, es importante medir la precisión de los
pronósticos. El error de pronóstico es simplemente la diferencia que se obtiene
al restar el pronóstico de la demanda real en cualquier periodo determinado, o

Et = Dt Ft
Donde:
Et = error de pronóstico en el periodo t
Dt = demanda real en el periodo t
Ft = pronóstico para el periodo t
Promedios móviles ponderados.
• En el método de promedio móvil simple, todas las demandas tienen la
misma ponderación en el promedio, es decir, 1/n.
• En el método de promedio móvil ponderado, cada una de las demandas
históricas que intervienen en el promedio puede tener su propia
ponderación.
• La suma de las ponderaciones es igual a 1.0. Por ejemplo, en un modelo
con promedio móvil ponderado de tres periodos, al periodo más reciente
se le puede asignar una ponderación de 0.50, al segundo más reciente se le
asigna una ponderación de 0.30, y al tercero más reciente, una de 0.20.
• El promedio se obtiene multiplicando la ponderación de cada periodo por
el valor correspondiente a dicho periodo y sumando finalmente los
productos:
Ft+1 = 0.50Dt + 0.30Dt-1 + 0.20Dt-2
Suavización exponencial.
• Suavizamiento exponencial El método de suavizamiento exponencial es un método de promedio
móvil ponderado muy refinado que permite calcular el promedio de una serie de tiempo,
asignando a las demandas recientes mayor ponderación que a las demandas anteriores.
• Es el método de pronóstico formal que se usa más a menudo por su sencillez y por la reducida
cantidad de datos que requiere.
• A diferencia del método de promedio móvil ponderado, que requiere n periodos de demanda
pasada y n ponderaciones, el método de suavizamiento exponencial necesita solamente tres
datos: el pronóstico del último periodo, la demanda de ese periodo y un parámetro de
suavizamiento, alfa (), cuyo valor fluctúa entre 0 y 1.0.
• Para elaborar un pronóstico con suavizamiento exponencial, simplemente se calcula un promedio
ponderado de la demanda más reciente y el pronóstico calculado para el último periodo.
• La ecuación correspondiente a este pronóstico es:
Ft+1 = (Demanda para este periodo) + (1-  )(Pronóstico calculado para el último periodo)
= Dt + (1 )Ft

• La siguiente es una ecuación equivalente:


Ft+1 = Ft +  (Dt Ft)
INCLUSIÓN DE UNA TENDENCIA
• En una serie de tiempo, una • Cuando existe una tendencia
tendencia es un incremento o significativa, los métodos de
decremento sistemático en el suavizamiento exponencial
promedio de la serie a través del deben modificarse; de lo
tiempo contrario, los pronósticos
siempre estarán por arriba o por
debajo de la demanda real.
• Para mejorar el pronóstico, es necesario calcular una estimación de la
tendencia
• El método para estimar una tendencia es similar al que se emplea
para estimar el promedio de la demanda con el suavizamiento
exponencial.

• El método para incorporar una tendencia en un pronóstico suavizado


exponencialmente se conoce como método de suavizamiento
exponencial ajustado a la tendencia

También podría gustarte