Está en la página 1de 17

UNIVERSIDAD NACIONAL DE SAN CRISTÓBAL DE

HUAMANGA ESCUELA DE POST GRADO


MAESTRÍA EN CIENCIAS ECONÓMICAS: MENCIÓN
EN GESTIÓN EMPRESARIAL

CURSO: ESTADISTICA Y METODOS CUANTITATIVOS

DOCENTE : Dr. ENRIQUE, J. GONZALES PAUCARHUANCA

INTERGRANTES:
✓ CUADROS GUTIERREZ, Henrry Mario
✓ ESCUDERO COTAQUISPE, Jairo Luis
✓ LIFONCIO TORRES, Griselma

1
PRESENTACIÓN
Ecotrash Crear es una empresa que crea oportunidades para mujeres y jóvenes
recolectores y generar el impulso hacia el desarrollo de ciudades sostenibles a
través de la tecnología, además se dedican a vender bolsas ecológicas y
distribuye a nivel nacional, sus clientes directos son farmacias, minimarkets,
mercados, etc. A través de este proyecto sólido con impacto social y económico
contribuye claramente a la sociedad en dos vertientes muy importantes: dignifica
el trabajo de las personas dedicadas a la recolección de residuos urbanos y tiene
un claro impacto medioambiental. Y frente a esta incorporación en el mercado
nacional, también crece las demandas cada vez más grandes a comparación de
los años de lanzamiento, por ello es necesario tener un modelo matemático o
una herramienta que ayude a tomar decisiones para responder frente a dicha
demanda.

2
INDICE
I. PRESENTACIÓN DEL CASO .......................................................................................................... 4
OBJETIVOS:................................................................................................... 4
II. METODOLOGIA Y MUESTRA ...................................................................................................... 4
Población ........................................................................................................ 4
Presentación de la data .................................................................................. 4
Análisis descriptivo de la variable Y: ............................................................... 5
Diagrama de dispersión. ................................................................................. 6
III. CALCULOS ................................................................................................................................. 7
Coeficiente de correlación .............................................................................. 7
Prueba de la significancia del coeficiente de correlación de Pearson. ........... 8
Estimación de parámetros .............................................................................. 9
Método mínimos cuadrados............................................................................ 9
Inferencia global del modelo ......................................................................... 11
Prueba de significancia de los parametros ................................................... 12
Para el coeficiente pendiente. ................................................................... 12
Para el coeficiente intercepto. ................................................................... 12
Supuestos para el modelo de regresión lineal simple ................................... 13
Interpretación del coeficiente de regresión ................................................... 15
Interpretación del coeficiente de determinación ............................................ 15
IV. CONCLUSIONES ...................................................................................................................... 16
V. REFERENCIAS BIBLIOGRÁFICAS. .............................................................................................. 17

3
INFORME DE ESTADÍSTICA

I. PRESENTACIÓN DEL CASO


En el presente trabajo de investigación tiene por objetivo principal a determinar
un modelo de regresión lineal de la variable cantidad de bolsas ecológicas
vendidas en función de tiempo y luego pronosticar para los próximos 2 meses.
La recolección de datos fue recopilada de las ventas de los últimos 40 meses de
la empresa ECO TRASH. El tamaño de muestra es superior al recomendado
(n=40>30) para realizar inferencias estadísticas. El gerente de la empresa desea
averiguar el modelo lineal para tomar decisiones en cuanto a inversiones en un
nuevo programa si no cumple con las metas. (Forbes, 2020)

OBJETIVOS:
1. Describir la variable dependiente cantidad de bolsas ecológicas vendidas
(en miles)
2. Formular modelo para el pronóstico de la cantidad de bolsas ecológicas a
producir empleando regresión lineal simple mediante método de mínimos
cuadrados.
3. Pronosticar la cantidad de bolsas ecológicas a vender para el próximo
mes.

II. METODOLOGIA Y MUESTRA


Población
La población está conformada por los registros de ventas de bolsas ecológicas
(en miles de unidades) de la empresa Eco Trash durante los últimos 40 meses.

Presentación de la data
Dado que es un caso de regresión lineal, no se trabaja con muestras. Se trabaja
con toda la data registrada para que el modelo de regresión sea confiable y
consistente
La variable independiente es X: tiempo (en meses)

La variable dependiente es Y: cantidad de bolsas ecológicas vendidas al mes


(en miles)

Y X Y X

4
35 1 343 21
44 2 344 22
46 3 347 23
64 4 361 24
80 5 368 25
91 6 379 26
96 7 381 27
104 8 391 28
125 9 412 29
136 10 434 30
137 11 453 31
181 12 454 32
197 13 462 33
204 14 569 34
207 15 625 35
213 16 641 36
266 17 692 37
275 18 699 38
291 19 721 39
337 20 775 40

Análisis descriptivo de la variable Y:


Media Desv.Est. Varianza Mínimo Q1 Mediana Q3 Máximo Asimetría Curtosis
324.5 208.2 43356.2 35 136.3 340 448.3 775 0.51 -0.58

Las ventas mensuales de las bolsas ecológicas realizadas por la empresa Eco
Trash durante los 40 meses, en promedio son 324.5 miles de bolsas ecológicas.

La desviación estándar de la variable cantidad de bolsas ecológicas vendidas


durante es los 40 mes es 208.2 bolsas y su varianza es 43356.2 bolsas 2, la
cantidad mínima vendida en un determinado mes es 35mil unidades, mientras el
máximo es 775 miles de bolsas, además el 25% de los meses se vendieron
menos de 136.3 miles de unidades de bolsas ecológicas, el 50% de los meses
vendieron por lo menos 340 bolsas y el 75% de los meses se vendieron más de
448.3 unidades.

Por otro lado, se observa que la distribución de la cantidad de bolsas ecológicas


vendidas es asimétrica a la derecha, es decir en mayoría de los meses se ha

5
vendido menos cantidad de bolsas ecológica (como se observa en el gráfica 1).
Por otro lado, el coeficiente de curtosis es -0.58 y se aproxima a -0.50, entonces
se determina que la distribución es platicúrtica.

Gráfica 1. Histograma de la variable Y:

Fuente: Elaboración propia.

Gráfica 2. Diagrama de cajas y bigotes

En la gráfica 2, podemos observar que no hay presencia de datos atípicos,


además el 50% central de los meses de producción se concentran en la parte
más debajo de la línea de la mediana.

Diagrama de dispersión.
El conjunto de pares de puntos se presenta en el siguiente gráfico el eje de las
abscisas corresponde a la variable X mientras que el de las ordenadas
corresponde a la variable Y.

6
Gráfica 3. Gráfica de dispersión entre X (tiempo en meses) e Y (cantidad de bolsas ecológicas vendidas al
mes)

900
800
700
600
500
400
Y

300
200
100
0
-100 0 10 20 30 40 50
X

En el gráfico N° 3, se observa que el conjunto de puntos se ajusta a una recta


línea con pendiente positiva, es decir gráficamente observamos una relación
lineal directa entre el tiempo y la cantidad de bolsas ecológicas vendidas, a
mayor tiempo mayor son las bolsas ecológicas vendidas, esta teoría podemos
comprobar si dicha relación lineal es directa para ello empleare test para la
significancia del coeficiente de correlación.

III. CÁLCULOS
Coeficiente de correlación
El coeficiente de correlación mide el grado de asociación entre dos variables
cuantitativas (Camacho-Sandoval, 2008), para el presente tenemos dos
variables cuantitativas. Además, se adjunta el cuadro para la interpretación de
los valores del coeficiente de correlación de Pearson.

Gráfica 4. Interpretación de valores de R.

Fórmula para calcular el coeficiente de correlación de Pearson.

7
𝑛∑𝑋 ⋅ 𝑌 − ∑𝑋 ⋅ ∑𝑌
𝑟=
√𝑛 ⋅ ∑𝑋 2 − (∑𝑋)2 ⋅ √𝑛 ⋅ ∑𝑌 2 − (∑𝑌)2

Donde −1 ≤ 𝑟 ≤ 1

De la base de datos se obtiene:

𝑛 = 40 ; ∑𝑋 = 820 ; ∑𝑌 = 12980 ; ∑𝑋𝑌 = 358874 ; ∑𝑋 2 = 22140 ;

∑𝑌 2 = 5902900

Reemplazando:

40(358874 ) − 820(12980 )
𝑟=
√40 ⋅ (22140 ) − (820 )2 ⋅ √40 ⋅ (5902900) − (12980 )2

𝑟 = 0.9773

Este valor obtenido está en el intervalo 0.8<r<1. Luego podemos indicar que
entre el tiempo (variable x) y la cantidad de bolsas ecológicas vendidas en miles
de unidades al mes presentan una correlación lineal directa y muy alta.

Prueba de la significancia del coeficiente de correlación de


Pearson.
𝐻0 : 𝜌 = 0

𝐻𝑎 : 𝜌 ≠ 0

g.l= n-2= 40-2=30 → 𝑡1−𝛼;𝑛−2 = 𝑡0.975;30 = 2.024


2

Rechazar Ho cuando 𝑡𝑐𝑎𝑙 < −2.024 o 𝑡𝑐𝑎𝑙 > 2.024.

𝑟 0.9773
𝑡𝑐𝑎𝑙 = = = 28.436
2 2
√1 − 𝑟 √1 − 0.9773
𝑛−2 40 − 2

Se rechaza Ho porque 𝑡𝑐𝑎𝑙 = 28.436 > 2024.

Existe correlación lineal significativa entre el tiempo y la cantidad de bolsas


ecológicas vendidas al mes.

8
Estimación de parámetros
Modelo general de la regresión lineal simple es:

𝑌= 𝛼+𝛽⋅𝑋
⏟ + 𝜇

𝑃𝑎𝑟𝑡𝑒 𝑑𝑒𝑡𝑒𝑟𝑚𝑖𝑛í𝑠𝑡𝑖𝑐𝑎 𝑃𝑎𝑟𝑡𝑒 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎

Estimación de los parámetros:

𝑦 = 𝛼̂ + 𝛽̂ ⋅ 𝑋

Donde el error es cero, y donde la pendiente es 𝛽̂ y el intercepto es 𝛼̂, estos


parámetros se van a estimar por dos métodos que a continuación se desarrollan.

Métodos mínimos cuadrados


La fórmula para calcular la pendiente es:

Realizando los cálculos previos.

X Y 𝑿𝒊 − 𝒙 𝒀𝒊 − 𝒚 (𝑿𝒊 − 𝒙 )(𝑿𝒊 − 𝒙 ) (𝑿𝒊 − 𝒙 )𝟐


1 35 -19.5 -289.5 5645.25 380.25
2 44 -18.5 -280.5 5189.25 342.25
3 46 -17.5 -278.5 4873.75 306.25
4 64 -16.5 -260.5 4298.25 272.25
5 80 -15.5 -244.5 3789.75 240.25
6 91 -14.5 -233.5 3385.75 210.25
7 96 -13.5 -228.5 3084.75 182.25
8 104 -12.5 -220.5 2756.25 156.25
9 125 -11.5 -199.5 2294.25 132.25
10 136 -10.5 -188.5 1979.25 110.25
11 137 -9.5 -187.5 1781.25 90.25
12 181 -8.5 -143.5 1219.75 72.25
13 197 -7.5 -127.5 956.25 56.25
14 204 -6.5 -120.5 783.25 42.25

9
X Y 𝑿𝒊 − 𝒙 𝒀𝒊 − 𝒚 (𝑿𝒊 − 𝒙 )(𝑿𝒊 − 𝒙 ) (𝑿𝒊 − 𝒙 )𝟐
15 207 -5.5 -117.5 646.25 30.25
16 213 -4.5 -111.5 501.75 20.25
17 266 -3.5 -58.5 204.75 12.25
18 275 -2.5 -49.5 123.75 6.25
19 291 -1.5 -33.5 50.25 2.25
20 337 -0.5 12.5 -6.25 0.25
21 343 0.5 18.5 9.25 0.25
22 344 1.5 19.5 29.25 2.25
23 347 2.5 22.5 56.25 6.25
24 361 3.5 36.5 127.75 12.25
25 368 4.5 43.5 195.75 20.25
26 379 5.5 54.5 299.75 30.25
27 381 6.5 56.5 367.25 42.25
28 391 7.5 66.5 498.75 56.25
29 412 8.5 87.5 743.75 72.25
30 434 9.5 109.5 1040.25 90.25
31 453 10.5 128.5 1349.25 110.25
32 454 11.5 129.5 1489.25 132.25
33 462 12.5 137.5 1718.75 156.25
34 569 13.5 244.5 3300.75 182.25
35 625 14.5 300.5 4357.25 210.25
36 641 15.5 316.5 4905.75 240.25
37 692 16.5 367.5 6063.75 272.25
38 699 17.5 374.5 6553.75 306.25
39 721 18.5 396.5 7335.25 342.25
40 775 19.5 450.5 8784.75 380.25
820 12980 0 0 92784 5330

92784
𝛽̂ = = 17.40788
5330

Fórmula para calcular el coeficiente intercepto 𝛼̂:

10
12980 820
𝛼̂ = − 17.40788 ×
40 40

𝛼̂ = −32.36154

Luego el modelo de regresión lineal queda así:

𝑦 = −32.36154 + 17.40788𝑥

A continuación se procederá a realizar las inferencias globales del modelo y


inferencias de los coeficiente de las regresión.

Inferencia global del modelo


𝐻0 : 𝛼 = 𝛽 = 0

𝐻0 : al menos un coeficiente es diferente de cero.

Nivel de significancia=5%

Estadística de prueba: F

Criterio de rechaza Ho.

g.l1=2-1=1 y g.l2=40-2=38

𝐹0.975;1;38 = 5.44625

Si 𝐹𝑐𝑎𝑙 > 5.44625 entonces rechazar Ho, caso contrario aceptar Ho.

Cálculos:

Tabla 1. Tabla ANOVA para validar el modelo

Promedio de
Grados de Suma de los
libertad cuadrados cuadrados F Fcrit
Regresión 1 1615172.731 1615172.731 810.601921 5.44625
Residuos 38 75717.26904 1992.559712
Total 39 1690890
Fuente: Obtenido desde complemento de Excel.

Según la tabla anterior se observa que 𝐹𝑐𝑎𝑙 = 810.6>5.44625 entonces se


rechaza Ho.

11
A nivel 95% de confianza se determina que el modelo es bueno, es decir al
menos un coeficiente de la regresión es diferente de cero, luego procederemos
a realizar inferencias para cada coeficiente de la regresión.

Prueba de significancia de los parámetros


Para el coeficiente pendiente.
𝐻0 : 𝛽 = 0
𝐻0 : 𝛽 ≠ 0
Nivel de significancia=5%
Estadística de prueba: T de student
Criterio de rechaza Ho.
g.l=n-2=40-2=38
𝑇0.975;38 = 2.024

Si 𝑇𝑐𝑎𝑙 > 2.024 o 𝑇𝑐𝑎𝑙 < −2.024 entonces rechazar Ho, caso contrario aceptar Ho.
Cálculos:
Tabla 2. Tabla de inferencia para el coeficiente de regresión (pendiente)

Coeficientes Error típico Estadístico t Probabilidad


Intercepción -32.36153846 14.38470237 -2.249719016 0.03033942
X 17.40787992 0.611423417 28.47107166 0.000
Fuente: Obtenido desde complemento de Excel.
Según la tabla anterior se observa que 𝑇𝑐𝑎𝑙 = 28.4712> 2.024 entonces se
rechaza Ho.
A nivel 95% de confianza se determina que el coeficiente de la regresión es
diferente de cero, es decir es significativo el 𝛽̂
Para el coeficiente intercepto.
𝐻0 : 𝛼 = 0
𝐻0 : 𝛼 ≠ 0
Nivel de significancia=5%
Estadística de prueba: T de student
Criterio de rechaza Ho.
g.l=n-2=40-2=38
𝑇0.975;38 = 2.024

Si 𝑇𝑐𝑎𝑙 > 2.024 o 𝑇𝑐𝑎𝑙 < −2.024 entonces rechazar Ho, caso contrario aceptar Ho.
12
Cálculos:
Tabla 3. Tabla de inferencia para el coeficiente de regresión (pendiente)

Coeficientes Error típico Estadístico t Probabilidad


Intercepción -32.36153846 14.38470237 -2.249719016 0.03033942
X 17.40787992 0.611423417 28.47107166 0.000
Fuente: Obtenido desde complemento de Excel.
Según la tabla anterior se observa que 𝑇𝑐𝑎𝑙 = −2.2497<- 2.024 entonces se
rechaza Ho.
A nivel 95% de confianza se determina que el coeficiente de la regresión es
diferente de cero, es decir es significativo el 𝛼̂

Supuestos para el modelo de regresión lineal simple


SUPUESTO 1) Las mediciones de las variables X e Y se midieron sin error.
SUPUESTO 2) La relación entre X e Y es lineal dado que se comprobó con la
inferencia del coeficiente de correlación de Pearson.
SUPUESTO 3) homocedasticidad: la varianza del error es constante.
Gráfica 5. Observación vs residuales

Residuals
133.9
Residual (gridlines = std. error)

89.3

44.6

0.0

-44.6

-89.3

-133.9
0 10 20 30 40 50
Observation

En el grafico anterior se observa que el conjunto de puntos entre observación y


los residuales no forman algún patrón.
SUPUESTO 3) Normalidad de los errores

13
Tabla 4. Valores pronosticado y residuos del modelo

Observación Pronóstico Y Residuos


1 -14.95365854 49.95365854
2 2.454221388 41.54577861
3 19.86210131 26.13789869
4 37.26998124 26.73001876
5 54.67786116 25.32213884
6 72.08574109 18.91425891
7 89.49362101 6.506378987
8 106.9015009 -2.901500938
9 124.3093809 0.690619137
10 141.7172608 -5.717260788
11 159.1251407 -22.12514071
12 176.5330206 4.466979362
13 193.9409006 3.059099437
14 211.3487805 -7.348780488
15 228.7566604 -21.75666041
16 246.1645403 -33.16454034
17 263.5724203 2.427579737
18 280.9803002 -5.980300188
19 298.3881801 -7.388180113
20 315.79606 21.20393996
21 333.20394 9.796060038
22 350.6118199 -6.611819887
23 368.0196998 -21.01969981
24 385.4275797 -24.42757974
25 402.8354597 -34.83545966
26 420.2433396 -41.24333959
27 437.6512195 -56.65121951
28 455.0590994 -64.05909944
29 472.4669794 -60.46697936
30 489.8748593 -55.87485929
31 507.2827392 -54.28273921
32 524.6906191 -70.69061914
33 542.0984991 -80.09849906
34 559.506379 9.493621013
35 576.9142589 48.08574109
36 594.3221388 46.67786116
37 611.7300188 80.26998124
38 629.1378987 69.86210131
39 646.5457786 74.45422139
40 663.9536585 111.0463415
Fuente: Obtenido desde complemento de Excel.

14
Gráfica 6. Probabilidad normal de los residuales vs residuales.

Normal Probability Plot of Residuals


150.0

100.0

50.0
Residual

0.0

-50.0

-100.0
-3.0 -2.0 -1.0 0.0 1.0 2.0 3.0
Normal Score

Los residuos tienen comportamiento normal según las grafica N° 6.

Interpretación del coeficiente de regresión


De la pendiente: 𝛽̂ = 17.40787992

Cuando transcurre un mes entonces la cantidad de bolsas ecológicas vendidas


aumenta en 17.40 miles de unidades.

𝑦 = −32.36153846 + 17.40787992𝑥

Interpretación del coeficiente de determinación


𝐸𝑆𝑆 75,717.2690
𝑅2 = 1 − =1− = 0.95522 × 100% = 95.522%
𝑇𝑆𝑆 1,690,890.0000

Interpretación: el 95.522% de la variabilidad de la cantidad de bolsas ecológicas


vendidas por la empresa Eco Trash es explicada por la variable tiempo.

Predicción para el mes 41:

𝑦 = −32.36153846 + 17.40787992(41) = 681.36 𝑚𝑖𝑙𝑒𝑠 𝑑𝑒 𝑢𝑛𝑖𝑑𝑎𝑑𝑒𝑠

La empresa debe producir aproximadamente 681.36 miles de unidades de


bolsas ecológicas para el próximo mes.

15
IV. CONCLUSIONES
1. La cantidad de bolsas ecológicas vendidas por la empresa Eco Trash
durante los 40 meses, en promedio son 324.5 miles de bolsas, con una
desviación estándar 208.2214 unidades y presenta un sesgo a la derecha.
2. El método de mínimos cuadrados y el método matricial determinan el
mismo valor para los coeficientes de la regresión, la ecuación lineal de la
cantidad de bolsas ecológicas vendidas en función de tiempo como 𝑦 =
−32.361 + 17.407𝑥.
3. El coeficiente de correlación entre las variables X e Y es r=0.9773 siendo
ésta significativo, además el coeficiente de determinación es
R2=95.522%.
4. Para el siguiente mes debe producir aproximadamente 681 miles de
bolsas ecológicas.

16
V. REFERENCIAS BIBLIOGRÁFICAS.
Camacho-Sandoval, J. (2008). Asociación entre variables cuantitativas: análisis
de correlación. Obtenido de
https://www.scielo.sa.cr/scielo.php?script=sci_arttext&pid=S0001-
60022008000200005#:~:text=El%20m%C3%A9todo%20m%C3%A1s%2
0com%C3%BAn%20de,representado%20por%20la%20letra%20R.
Forbes. (13 de enero de 2020). ¿Cómo cambió el nuevo mercado de bolsas
ecológicas? Obtenido de https://www.forbes.com.mx/como-cambio-el-
nuevo-mercado-de-bolsas-ecologicas/
FORERO GÓMEZ, G., & MARTÍNEZ LOZANO, J. A. (2020). MODELO DE
REGRESIÓN LINEAL MÚLTIPLE PARA EL PRONÓSTICO DE VENTAS
DE BOLSAS ECOLÓGICAS PARA LA EMPRESA BOLECO SA, EN LA
CIUDAD DE BOGOTÁ DC. BOGOTÁ DC. Recuperado el 01 de Setiembre
de 2022, de https://repository.ucc.edu.co/handle/20.500.12494/16439

17

También podría gustarte