Documentos de Académico
Documentos de Profesional
Documentos de Cultura
DIRECTOR
GUSTAVO SILVA RODRÍGUEZ
2
NOTA DE ACEPTACIÓN
____________________________________
____________________________________
____________________________________
____________________________________
____________________________________
_______________________
PRIMER JURADO
_______________________
SEGUNDO JURADO
3
Tabla de contenido
RESUMEN ............................................................................................................. 10
INTRODUCCIÓN ................................................................................................... 11
2. OBJETIVOS................................................................................................. 18
2.1. Objetivo General................................................................................................................... 18
2.2. Objetivos Específicos .......................................................................................................... 18
5. METODOLOGÍA .......................................................................................... 53
5.1. TIPO DE ESTUDIO ...................................................................................................................... 53
4
5.3. TÉCNICAS PARA LA RECOLECCIÓN Y ANÁLISIS DE LA INFORMACIÓN .................. 53
5.4. FUENTES....................................................................................................................................... 53
CONCLUSIONES .................................................................................................. 69
RECOMENDACIÓN .............................................................................................. 70
ANEXOS ................................................................................................................ 71
BIBLIOGRAFÍA ..................................................................................................... 72
5
LISTA DE TABLAS
6
LISTA DE GRAFICAS
7
LISTA DE ILUSTRACIONES
8
LISTA DE ANEXOS
9
RESUMEN
10
INTRODUCCIÓN
11
Finalmente, la última parte del trabajo consta en la descripción de la metodología,
la caracterización de las diferentes variables que intervienen en el proceso
productivo, el planteamiento del modelo de regresión lineal múltiple en el programa
SPSS y la validación de este.
12
1. DESCRIPCIÓN DEL PROBLEMA
Número Porcentaje
Ingresos
Tipo de Bolsa de de
Venta Anual
unidades Participación
Bolsas reutilizables Tela cambrel, politex,
quirúrgica 30.050 $ 63.59.5400 56%
Tipo 1 (0-12,5 kg)
Bolsa plana tela cambrel, politex, quirúrgica
28.150 $ 49.425.500 44%
Tipo 2 (0-15kg)
TOTAL 58.200 $113.020.900 100%
Fuente/ Área Contable empresa BOLECO SA AÑO 2018
13
realiza dividiendo el total de las ventas acumuladas sobre las ventas individuales de
cada una de las bolsas.
Sin embargo, a pesar de los esfuerzos anteriores la empresa presenta una baja
capacidad para planificar de forma confiable las ventas de las líneas de productos
mencionadas en la tabla 1 del presente estudio. Lo anterior se evidencia en los
siguientes datos estadísticos suministrados por Boleco SA.
Como se puede evidenciar en la gráfica 1, tan solo en los meses de febrero, mayo
y septiembre del año 2018, se logró entregar la cantidad de bolsas solicitadas por
los clientes en el resto de los meses hubo deficiencia en la entrega total del pedido
solicitado debido a que actualmente el pronóstico que se tiene para satisfacer la
demanda de las bolsas es deficiente según el comportamiento de venta durante los
diferentes meses.
14
Gráfica 1: Cantidad de pedidos VS entregados, suministrado por Boleco SA, año
2018
De acuerdo con el análisis realizado a la Base de datos suministrada por Boleco SA
(ver anexo 1) donde se evidencia el comportamiento de las ventas de las bolsas
ecológicas durante el año 2018 y teniendo en cuenta que el pronóstico que realizan
actualmente no está asociado a ningún modelo estadístico sino es una proyección
de las ventas podría traer consigo los siguientes efectos no deseables en el
desarrollo de la empresa:
15
en los pronósticos de ventas se deben clasificar estas necesidades a corto y a largo
plazo
Las ventas se deben pronosticar teniendo en cuenta los términos adecuados los
cuales son:
16
1.2.2. Justificación teórica
17
2. OBJETIVOS
Pronosticar las ventas de bolsas ecológicas para la empresa BOLECO SA, basado
en la aplicación del modelo de regresión lineal múltiple, que garantice una mejora
en el proceso productivo de la empresa ubicada en la ciudad de Bogotá DC
18
3. ESTADO DEL ARTE
(Vilá Baños, Torrado Fonseca, & Reguant Álvarez, 2019), Análisis de regresión
lineal múltiple con SPSS: un ejemplo práctico. Barcelona, Barcelona.
19
Variables: Dependiente: Concentración de material particulado e independientes:
Incendios forestales, Ocurrencia de Lluvia
(Perez Obregón & Romero Díaz, 2018), Análisis del rendimiento académico
mediante regresión logística y múltiple
(Castro Valderrama, Wilches Chiriví, & Gómez Delgado, 2018), Diseño de Bolsa
Reutilizable para Empaque y Transporte de Frutas y Verduras
20
Conclusiones: Como conclusiones del trabajo citado se obtiene que el 90% de los
compradores de frutas y verduras de estrados 4 y 5 estarían dispuestos a comprar
la bolsa reutilizable mediana de nylon, también se recomienda diseñar diferentes
soluciones para los segmentos de personas que tengan otros hábitos de compra
diferentes a los expuestos en dicho trabajo.
(Brenes González, 2017), Aplicación del análisis de regresión lineal simple para la
estimación de los precios de las acciones de Facebook, Inc.
(Rodríguez Mañay, Saltos Chacán, & Muñoz Moreta, 2016), Cálculo de un Cost
driver para determinar el costo de una actividad empleado un modelo de Regresión
Lineal o un modelo de Regresión Múltiple.
Método: Para descubrir el generado de costo que permitía conocer el costo de una
actividad, fue la regresión lineal simple. Método de mínimos cuadrados.
21
compras. Cuando se realiza la prueba F también indicó que existe relación entre las
dos variables órdenes de compra y el costo del departamento de compras. Al aplicar
la prueba de la pendiente se concluye que las órdenes de compra sirvieron para
pronosticar el costo del departamento de compras y al realizar la prueba de los
residuos estandarizados, el 100% de estos estuvieron dentro de +-2. Las otras dos
variables (valor de la compra de mercadería y número de proveedores no pasaron
estas evaluaciones).
22
Variables: Escala de ansiedad social para adolescentes, Escala de miedo a la
evaluación negativa, Intervalo de ansiedad y sensibilidad a la ansiedad
(Barahona Urbina, Veres Ferrer, & Aliaga Prieto, 2016), Deserción académica de la
Universidad de Atacama, chile
23
Variables: Rendimiento académico, tipo de establecimiento, conformidad de la
carrera y asistencia.
Conclusión: Los resultados del primer análisis econométrico mostraron que las
variables asociadas al rendimiento académico tienen que ver con el promedio
ponderado, la asistencia a clases y el tipo de Establecimiento. Es decir, una mejor
formación en las asignaturas básicas de ingreso a la universidad (Promedio
Ponderado), mejora el rendimiento académico. Una asistencia sistemática a clases
de parte del alumno es clave para mejorar el desempeño. Por otra parte, los
resultados mostraron que el establecimiento de procedencia es una variable que a
la larga que segrega, en el sentido de que los alumnos provenientes de colegios
privados obtienen un mejor rendimiento respecto de aquellos alumnos cuyos
colegios están más cerca de la gratuidad. Luego, los peores rendimientos son de
aquellos alumnos de colegios municipales.
(Sabogal Cardona, Hincapié Zea, Santa Chávez, & Willmer Escobar, 2015),
Modelos de Regresión Lineal para Estimación de Tiempos de Viaje en Sistemas de
Transporte Masivo
24
Método: Se formularon dos modelos de regresión lineal. El primer modelo usa
solamente las mediciones de tiempo de viaje para cada vehículo cuando pasa por
cada sensor y toma la ubicación de cada sensor desde el punto de inicio. El segundo
modelo considera los tiempos de viaje y las medidas de velocidad para tratar de
explicar el tiempo de llegada a un sensor.
Los datos para los modelos de regresión lineal propuestos tienen muchos puntos
influenciables que llevan al rechazo de los supuestos. Modelos de regresión robusta
y múltiple deben ser analizados como trabajos futuros
Variables: Ingreso Nacional Neto Ajustado per cápita, Población entre 15 y 64 años,
Población activa, Población rural, Tasa de población activa, Relación entre empleo
y población, Desempleo mujeres jóvenes, Fuerza laboral, Índice de Gini, Tasa de
incidencia de la pobreza, Tasa de alfabetización mujeres adultas, Tasa de
alfabetización mujeres jóvenes, Densidad de población y Control de Corrupción
25
cuantitativa. Se identifican los determinantes de la trata en México, a través de un
análisis de regresión multivariable. Como resultado, se obtuvo un modelo que nos
permite identificar las variables críticas del fenómeno.
(Ortiz, Arias, Da Silva, & Cardozo, 2015), Análisis Espacial del Precio del Suelo con
Modelos de Regresión Lineal Múltiple (MRLM)y Sistemas de Información
Geográfica (SIG)
26
Variables: Distorsión armónica de tensión de orden 7 (Vh7) y Distorsión armónica
de corriente de orden 7 (lh7)
27
4. MARCOS DE REFERENCIA
Según (Damodar N. & Dawn C., 2010), el origen del término regresión se dio de la
siguiente manera:
Francis Galton fue la primera persona que acuño el termino de regresión mediante
un ensayo en el que se planteaba que, sin importar la altura de los padres, es decir
altos o bajos la tendencia de los hijos tenida a desplazarse o regresar a la altura
promedio de la población total
La ley de regresión universal de Galton fue confirmada por su amigo Karl Pearson,
quien reunió más de mil registros de estaturas de miembros de grupos familiares
Pearson descubrió que la estatura promedio de los hijos de un grupo de padres de
estatura alta era menor que la estatura de sus padres, y que la estatura promedio
de los hijos de un grupo de padres de estatura baja era mayor que la estatura de
sus padres; es decir, se trata de un fenómeno mediante el cual los hijos altos e hijos
bajos “regresan” por igual a la estatura promedio de todos los demás En palabras
de Galton, se trata de una “regresión a la mediocridad”
Según (Pat Fernandez, Martínez Menchaca, Pat Fernández, & Martínez Luis, 2013
) el termino de regresión es uno de los pilares estadísticos más modernos el cual
hace referencia al análisis simultaneo de dos o más variables relacionadas entre sí.
28
Una de las variables se le conoce como variable dependiente (y) y la otra como
variable independiente (x).
𝑌 = 𝛽0 + 𝛽1 𝑋1 + 𝛽2 𝑋2 + ⋯ 𝛽𝑘 𝑋𝑘
Donde:
Basado en el libro de (Garcia, Morales Serrano, & González Cavazos, 2013) las
etapas son las siguientes:
29
11. Interpretar coeficientes de determinación, correlación, determinación
ajustado y error estándar
12. Analizar los coeficientes de la ecuación de regresión
13. Elaborar pronósticos puntuales y por intervalo
Formular Problema
Selección de Variables
30
Realizar análisis descriptivo del tipo de relación entre variables
Seleccionar método
31
En el caso de que la colinealidad fuese parcial, aumenta el tamaño de los
residuos tipificados y esto produce coeficientes de regresión muy inestables.
𝑅𝑖𝑗 = 𝑅𝑖𝑗
Donde 𝑅𝑖𝑗 muestra la correlación que existe entre las dos variables, es decir,
entre la variable 𝑋𝑖 y la variable 𝑋𝑗 Entonces 𝑅𝑖𝑗 mide la dependencia lineal
entre variables, en este caso se usa exclusivamente para las independientes
En los modelos de regresión múltiple se desea que no exista este tipo de
problemas, por lo que el coeficiente de correlación puede ser usado para
medir la multicolinealidad
−1 ≤ 𝑅𝑖𝑗 ≤ 1
0 ≤ |𝑅𝑖𝑗 | ≤ 1
32
problemas de multicolinealidad, si la correlación entre dos o más variables es
mayor o igual a 70% es decir:
|𝑅𝑖𝑗 | ≥ 0.7
Ecuaciones:
𝒏 𝒏 𝒏
𝟐
∑(𝒀𝒊 − 𝒀 ̅ )𝟐 = ∑(𝒀̂𝒊 − 𝒀 ̅ )𝟐
̅ ) + ∑(𝒀̂𝒊 − 𝒀
𝒊=𝟏 𝒊=𝟏 𝒊=𝟏
𝒏 𝒏 𝒏 𝒏
̅̅̅𝟐̅ = ∑ 𝒀𝟐 − (∑𝒊=𝟏 𝒀𝒊 )^𝟐
̅ )𝟐 = ∑( 𝒀𝒊 )^𝟐 − 𝒏𝒀
𝑺𝑺𝑻 = ∑(𝒀𝒊 − 𝒀 𝒊
𝒏
𝒊=𝟏 𝒊=𝟏 𝒊=𝟏
𝒏
̅ )𝟐
𝑺𝑺𝑹 = ∑(𝒀𝒊 − 𝒀
𝒊=𝟏
33
𝒏
̂ )𝟐
𝑺𝑺𝑬 = ∑(𝒀𝒊 − 𝒀
𝒊=𝟏
𝐻0 : 𝐵𝑖 = 0 𝑑𝑜𝑛𝑑𝑒 𝑖 = 1,2,3, … 𝑘, 0
𝐻0 : 𝐵𝑖 ≠ 0 𝑑𝑜𝑛𝑑𝑒 𝑖 = 1,2,3, … 𝑘, 0
34
La prueba de Durbin-Watson permite conocer el grado de independencia
entre los residuos:
𝑛 𝑛
✓ Normalidad
Histograma
Regla empirica
Prueba de bondad de ajuste por la ji
cuadrada
Distribución Prueba de Shapiro-Wilk
normal Prueba de Kolmogorov-Smirnof-
Lilliefors
Gráfica P-P y gráfica Q-Q
Prueba Bowman-Shelton
35
Continuando con lo basado en el libro de (Garcia, Morales Serrano, & González
Cavazos, 2013), a continuación, se explica cada supuesto de normalidad:
Histograma
Regla empírica
𝜖𝑖 − 𝜖̅
𝑍𝜖𝑖 =
𝑆𝜖
36
Donde:
𝑍𝜖𝑖 : es el puntaje estándar del error i
𝜖𝑖 : es el error i
𝜖̅: es el promedio de los errores
𝑆𝜖 : es el error estándar de lo estimado
Es una prueba de hipótesis para corroborar que los errores siguen una distribución
normal, los pasos a seguir son:
37
La prueba de hipótesis data de los años 60, es utilizada para muestras pequeñas,
es decir, entre 3 y 50 datos u observaciones
El proceso para la obtención del estadístico de prueba requiere un coeficiente, el
cual varía según el número de datos y son valores fijos
Ecuación:
2
[∑𝑆𝑖=1(𝑎𝑖 [𝑋𝑛−𝑖+1 − 𝑋𝑖 )]]
𝑆𝑊𝑐 =
∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅)2
Donde:
𝑆𝑊𝑐 : es el estadístico de prueba de Shapiro-Wilk
a: es el coeficiente Shapiro Wilk
n: es el número de datos
𝑋𝑖 : es la variable para probar en la observación i
𝑋̅: es el promedio de la variable
𝑗
S: es el número de diferencias que deberán realizarse y sale de 𝑆 = 2
La hipótesis para saber si los datos siguen una distribución normal son:
38
𝑗
3. Encontrar 𝑆 = que sería el número de comparaciones que se realizaran
2
Prueba de Kolmogorov-Lilliefors
Permite medir que tanto se parecen o coinciden una distribución teórica específica
y una variable Esta prueba fue realizada por Andrey Nikolaevich Kolmogorov y por
Nikolay Vasilyevich Smirnov, finalmente Hubert Lilliefors realizo una adaptación al
usar valores estandarizados para la prueba; esta variante fue dada porque la prueba
Kolmogorov-Smirnov requiere de la formación de clases a través de la probabilidad
de la normal
La ecuación es:
𝐾𝑆𝐿𝑐 = |𝐷𝑚á𝑥 | = |𝐹𝑡𝑒𝑜 − 𝐹𝑜𝑏𝑠 |
Donde:
𝐾𝑆𝐿𝑐 : es el estadístico de prueba Kolmogorov-Smirnov-Lilliefors
|𝐷𝑚á𝑥 |: es el valor absoluto de la diferencia entre la probabilidad acumulada teórica
y la observada
𝐹𝑡𝑒𝑜 : es la probabilidad acumulada teórica
39
𝐹𝑜𝑏𝑠 : es la probabilidad acumulada real u observada
Las hipótesis para saber si los datos siguen una distribución normal son:
Denominadas P-P plot por los percentiles que se necesitan encontrar y Q-Q plot
porque se necesitan los cuantiles; estas gráficas sirven para verificar que los errores
siguen o no una distribución normal
Pasos para seguir para encontrar la P-P o Q-Q plot:
40
1. Encontrar errores
2. Ordenar los errores de menor a mayor
3. Poner en la columna j el lugar que ocupa el error, esto equivale a una
numeración
𝑗−05
4. Hallar la posibilidad de la normal con , el 05 equivale a la mitad de la
𝑛
Prueba de Bowman-Shelton
41
El sesgo es el grado de simetría, si es negativo, la distribución será sesgada a la
izquierda, si es positivo será sesgada a la derecha y si es cero entonces la
distribución es simétrica
Donde:
Coeficiente de determinación
𝑆𝑆𝐸 𝑆𝑆𝑅
𝑅2 = 1 − =
𝑆𝑆𝑇 𝑆𝑆𝑇
Donde:
42
SSR: es la varianza explicada
SST: es la variación total
SSE: es la variación no explicada
Un valor cercano a cero indica que no se captó casi nada de la variación total o del
comportamiento de Y; por el contrario, un valor cercano a 1 indica que casi el 100%
de la variabilidad fue captada o explicada por el modelo, es decir, por las variables
independientes
𝑆𝑆𝐸
𝑛 − 1 𝑛−𝑝 𝑘 𝑛−1
2
𝑅𝐴𝑑𝑗 = ̅𝑅̅̅̅2 = 1 − [(1 − 𝑅 2 ) ]= 1− = [𝑅 2 − ][ ]
𝑛−𝑝 𝑆𝑆𝑇 𝑛−1 𝑛−𝑝
𝑛−1
Donde:
𝑅 2 : es el coeficiente de determinación
n: es el número de datos
p: es el número de parámetros en el análisis p=k+1, donde k es el número de
variables independientes más 1 = p72
k: es el número de variables independientes
43
dos variables, llamada de Pearson, La correlación múltiple en términos porcentuales
indica el poder de asociación o relación que tienen las variables independientes (las
X) con la dependiente (Y) La ecuación es:
𝑅𝑦𝑙𝑋1,𝑋2,…,𝑋𝑘 = √𝑅 2
Donde:
0 ≤ 𝑅𝑦𝑙𝑋1,𝑋2,…,𝑋𝑘 ≤ 1
Este valor proporciona un indicio de que tan bien se ajusta la línea a los datos; es
decir, que tanta dispersión tienen los valores observados alrededor del modelo de
regresión en todos los datos La ecuación asociada es:
𝑆𝑆𝐸
𝑆𝜀 = 𝜎̂ = √𝑉𝑎𝑟(𝜖̂) = √𝜎̂ 2 = √ = √𝑀𝑆𝐸
𝑛−𝑝
44
Donde:
𝜎 2 : es la varianza de los errores
SSE: es la variación no explicada
n: es el número de datos
p: es el número de parámetros en el análisis y que p=k+1, donde k es el número de
variables independientes más 1=p
MSE: es la suma de cuadrados promediada; es decir, dividida entre sus grados de
libertad
𝑆𝜖 ≥ 0
El cercano a cero indica que existe casi nada de dispersión a través de la línea de
regresión y que el ajuste es casi perfecto, lo que significa que la mayoría de los
datos reales se encuentran sobre la línea de regresión Si el dato fuera mayor
indicaría que los valores están muy dispersos o alejados de la línea de regresión
Para poder calcular u obtener la varianza de los errores es necesario que el estudio
se realice con la población y como esto es imposible, Por ende, se calculará la
varianza de los residuales, es decir, de la muestra y así se estimará la población
𝑆𝑆𝐸
𝜎𝜖2 = = 𝑀𝑆𝐸 = (𝑆𝜖 )^2
𝑛−𝑝
Donde:
𝑆𝜖 : es el error estándar del estimado
SSE: es la variación no explicada
n: es el número de datos
45
p: es el número de parámetros en el análisis y p=k+1, donde k es el número de
variables independientes más 1=p
MSE: es la suma de cuadrados promediada; es decir; dividida entre sus grados de
libertad
4.1.4. Pronósticos
4.1.5. Paquete Estadístico para las Ciencias Sociales SPSS por sus siglas
en ingles (Statistical Package for the Social Sciences)
46
• Nominal: Cuando sus valores representan categorías que no obedecen
a una clasificación intrínseca, Por ejemplo, el departamento de la
compañía en el que trabaja un empleado Algunos ejemplos de variables
nominales es: región, código postal o confesión religiosa
47
4.1.5.2. Tipos de Variable
El tipo de variable especifica los tipos de datos de cada una de las variables de
forma predeterminada el sistema asume que todas las variables nuevas son
numéricas
Los tipos de variables son:
✓ Numérico Una variable cuyos valores son números Los valores se muestran
en formato numérico estándar El editor de datos acepta valores numéricos
de forma estándar o en notación científica
✓ Coma Una variable numérica cuyos valores se muestran como comas que
delimitan cada tres posiciones y con el punto como delimitador decimal
✓ Punto Una variable numérica cuyos valores se muestran como puntos que
delimitan cada tres posiciones y con la coma como delimitador decimal
✓ Notación Científica Una variable numérica cuyos valores se muestran
como una E intercalada y un exponente con signo que representa una
potencia de base 10
✓ Fecha Una variable numérica cuyos valores se muestran en uno de los
diferentes formatos fecha-calendario u hora-reloj-
48
Como organización se ve beneficiada de la política establecida por el estado, la cual
implanta el cobro de cada unidad de bolsa plástica, a fin de disminuir el uso de estas
Al igual se lucra notoriamente debido a que es un medio de publicidad utilizado con
más concurrencia por los centros de comercialización de productos y/o servicios
Boleco, es escogida como la empresa enfoque del presente proyecto, ya que cuenta
con gran acogida entre sus clientes y se ha visto un incremento significativo en sus
ventas (bolsas ecológicas), por tal motivo se va a implementar un modelo de
regresión lineal múltiple para el pronóstico de ventas de bolsas ecológicas para la
empresa Boleco SA, en la ciudad de Bogotá DC y ofertar un producto con altos
estándares de calidad A su vez, se da importancia a la labor organizativa de Boleco,
que se enfoca en contribuir a mejorar las condiciones medioambientales en las
cuales se habita actualmente
49
4.2.3. Misión
4.2.4. Visión
Para el año 2020, buscamos convertirnos en una empresa líder en venta de bolsas
ecológicas e innovación ambiental a nivel nacional, ubicando un nuevo taller de
confección en la localidad de Kennedy
4.2.5. Organigrama
GERENTE
Supervisor
Recursos
Contabilidad Compras Ventas de Operarios
Humanos
Operación
50
4.2.6. Mapa de Procesos
Mejoramiento Continuo
P P
A Procesos Direccionamiento A
R Gestión del R
T Planeación T
SGI Talento
Gerencial
E Humano E
S S
IN Procesos Misionales IN
T T
E Producción Empaque Distribución E
R R
E E
S Procesos de Apoyo S
A A
Servicios
D Compras Contabilidad D
Generales
A A
S S
Mejoramiento Continuo
51
• Resolución No 1481 del 03 de agosto de 2018: “Por la cual se establece la
forma y requisitos para presentar ante la Autoridad Nacional de Licencias
Ambientales – ANLA, las solicitudes de certificación para efectos de los
dispuesto en el parágrafo 1 del artículo 512-15 y los numerales 3 y 4 del
artículo 512-16 del Estatuto Tributario, relacionados con el Impuesto
Nacional al Consumo de Bolsas Plásticas”
52
5. METODOLOGÍA
El tipo de estudio que se realizó para el desarrollo del presente trabajo es de tipo
cuantitativo y cualitativo pues se requiere tener claridad sobre los tipos de clientes
que maneja actualmente la empresa y así mismo realizar un análisis cuantitativo de
las ventas
5.2. MUESTRA
Se tomo como muestra la base de datos de Boleco SA del año 2018 donde se
indican las ventas realizadas de las bolsas ecológicas (ver anexo 1), cabe resaltar
que la muestra corresponde a la bolsa tipo cambrel en dos tamaños de 12.5 kg y de
15 Kg para tres tipos de clientes diferentes
5.4. FUENTES
5.4.1. Primarias
53
6. CARACTERIZACIÓN DE LAS VARIABLES
1. Ventas: Corresponde a las ventas del año 2018 suministradas por Boleco
S.A.
5. Costo de Ventas: Esta variable corresponde al costo por producir las bolsas
reutilizables.
54
X4 Costo de ventas Numérica - punto
Tabla 4 Resumen Variables Modelo
Para realizar la formulación del modelo de regresión lineal múltiple primero se debe
seleccionar la variable dependiente (Y) y las variables independientes (X), a
continuación, se muestra la selección de las variables y la ecuación.
La variable dependiente corresponde a las ventas de las bolsas ecológicas del año
2018 y las variables independientes son: Capacidad de la Bolsa, Clientes, Cantidad
y Costo de Ventas.
𝑌 = 𝛽0 + 𝛽1 𝑋1 + 𝛽2 𝑋2 + 𝛽3 𝑋3 + 𝛽4 𝑋4
Donde:
Y: Ventas
𝑋1: Capacidad de la Bolsa
𝑋2: Clientes
𝑋3: Cantidad
𝑋4: Costo de Ventas
55
Ilustración 4: Correlación variables
Por otro lado, algunas variables presentan una relación positiva, es decir, que existe
relación entre las variables como lo es entre Ventas y Cantidad, Ventas y Costo de
Ventas.
56
7.2. SELECCIÓN DEL MÉTODO
Se realizo el análisis del modelo de regresión lineal múltiple con los siguientes
métodos:
Tabla 5 ANOVA
ANOVAa
Modelo Suma de cuadrados gl Media cuadrática F Sig
1 Regresión 21076924443017,230 3 7025641481005,743 784,399 ,000b
Residuo 2624318214272,339 293 8956717454,854
El valor del estadístico de prueba F= 784.339 tiene un P_ valor igual a 0 < 0.05, por
lo que se rechaza la hipótesis nula y se concluye que la dependencia lineal es
estadísticamente significativa por lo que el modelo es adecuado.
Tabla 6 Coeficientes
Coeficientes
Coeficientes
Coeficientes no 95,0% intervalo de Estadísticas de
estandariza Correlaciones
estandarizados confianza para B colinealidad
dos
Modelo t Sig
Orde
Desv Límite Límite Parci Part Toleran
B Beta n VIF
Error inferior superior al e cia
cero
1 (Constan - - - -
74933,9 ,00
te) 342239,0 4,56 489716,1 194761,9
94 0
24 7 28 21
Cantidad 12,5 ,00 ,24 12,1
1524,719 121,246 ,851 1286,095 1763,343 ,932 ,592 ,083
75 0 4 15
57
Costo 1,00 ,31 ,01 13,2
,106 ,105 ,071 -,102 ,313 ,910 ,058 ,076
Ventas 2 7 9 15
Capacida
29286,48 5512,31 5,31 ,00 18437,73 40135,23 ,10 1,56
d ,129 ,246 ,296 ,637
2 5 3 0 1 2 3 9
Bolsa
a Variable dependiente: Ventas
Donde:
Y: Ventas
𝑋1: Cantidad
𝑋2: Costo Ventas
𝑋3: Capacidad_Bolsa
Con esta ecuación se puede determinar que la variable cantidad tiene un peso
significativo sobre las variables restantes. Si se tiene en cuenta el valor de t el cual
nos indica la significancia estadística de los distintos coeficientes se puede observar
un valor máximo para la Cantidad (t = 12.575), seguido de Capacidad_Bolsa (t =
5.313) y por último el Costo_Ventas (t = 1.002).
58
Tabla 7 Diagnostico de Colinealidad
Diagnósticos de colinealidada
Índice de Proporciones de varianza
Modelo Dimensión Autovalor
condición (Constante) Cantidad Costo_Ventas Capacidad_Bolsa
1 1 3,534 1,000 ,00 ,00 ,00 ,00
2 ,437 2,843 ,00 ,02 ,02 ,00
3 ,026 11,581 ,01 ,60 ,55 ,01
4 ,003 37,498 ,99 ,38 ,43 ,99
• Hacia delante
Correlaciones
Ventas Cantidad Costo_Ventas Capacidad_Bolsa
59
Variables entradas/eliminadasa
Variables Variables
Modelo entradas eliminadas Método
1 Cantidad Avanzar (Criterio: Probabilidad-de-F-para-entrar <= ,050)
2 Capacidad_Bolsa Avanzar (Criterio: Probabilidad-de-F-para-entrar <= ,050)
a Variable dependiente: Ventas
Tabla 9 variables de entrada metodo hacia adelante
La tabla número 9 muestra tanto las variables de entrada como las variables
eliminadas, sin embargo, para el Método hacia adelante ninguna de las variables es
eliminada.
ANOVAa
Modelo Suma de cuadrados gl Media cuadrática F Sig
1 Regresión 20583220467148,770 1 20583220467148,770 1947,404 ,000b
Residuo 3118022190140,799 295 10569566746,240
Variables excluidasa
Estadísticas de colinealidad
Correlación
Modelo En beta t Sig Tolerancia
parcial Tolerancia VIF
mínima
1 Costo_Ventas ,294b 4,961 ,000 ,278 ,117 8,529 ,117
b
Capacidad_Bolsa ,144 7,356 ,000 ,394 ,987 1,013 ,987
2 Costo_Ventas ,071c 1,002 ,317 ,058 ,076 13,215 ,076
a Variable dependiente: Ventas
b Predictores en el modelo: (Constante), Cantidad
c Predictores en el modelo: (Constante), Cantidad, Capacidad_Bolsa
60
Diagnósticos de colinealidada
Índice de Proporciones de varianza
Modelo Dimensión Autovalor
condición (Constante) Cantidad Capacidad_Bolsa
1 1 1,779 1,000 ,11 ,11
• Hacia atrás
Correlaciones
Ventas Cantidad Costo_Ventas Capacidad_Bolsa
Variables entradas/eliminadasa
Modelo Variables entradas Variables eliminadas Método
Capacidad_Bolsa, Cantidad,
1 Introducir
Costo_ventasb
Retroceder (criterio:
2 Costo_Ventas Probabilidad de F-para-
eliminar >= ,100)
61
a Variable dependiente: Ventas
b Todas las variables solicitadas introducidas
Como se observa en la tabla anterior el modelo que sirve en el método hacia atrás
es el modelo número uno que comprende las variables Capacidad Bolsa y Cantidad,
con este modelo se explica un 88.9% y una vez corregido por el efecto de la muestra
y la variable independiente resulta ser un 88.8%.
Diagnósticos de colinealidada
Índice de Proporciones de varianza
Modelo Dimensión Autovalor
condición (Constante) Cantidad Costo_Ventas Capacidad_Bolsa
1 1 3,534 1,000 ,00 ,00 ,00 ,00
2 ,437 2,843 ,00 ,02 ,02 ,00
3 ,026 11,581 ,01 ,60 ,55 ,01
4 ,003 37,498 ,99 ,38 ,43 ,99
2 1 2,709 1,000 ,00 ,04 ,00
62
Para el primer modelo la variable número cuatro correspondiente a la
Capacidad_Bolsa tiene un índice de condición superior a 30 lo que indica que
existen problemas colinealidad y por ende se debe eliminar o excluir dicha variable.
Variables excluidas
Estadísticas de colinealidad
Correlación
Modelo En beta t Sig Tolerancia
parcial Tolerancia VIF
mínima
2 Costo_Ventas ,071b 1,002 ,317 ,058 ,076 13,215 ,076
a Variable dependiente: Ventas
b Predictores en el modelo: (Constante), Capacidad_Bolsa, Cantidad
Correlaciones
Ventas Cantidad Costo_Ventas Capacidad_Bolsa
Variables entradas/eliminadasa
Variables Variables
Modelo Método
entradas eliminadas
Por pasos (Criterios: Probabilidad-de-F-para-entrar <= ,050,
1 Cantidad
Probabilidad-de-F-para-eliminar >= ,100)
63
Capacidad Por pasos (Criterios: Probabilidad-de-F-para-entrar <= ,050,
2
Bolsa Probabilidad-de-F-para-eliminar >= ,100)
a Variable dependiente: Ventas
El modelo uno explica en un 86.8%, una vez corregido por el efecto de la muestra
y de la variable independiente resulta ser en un 86.8% es decir el modelo no
presenta ninguna variación.
El modelo dos explica en un 88.9%, una vez corregido por el efecto de la muestra
y de la variable independiente (ventas) resulta ser de un 88.8%.
ANOVAa
Modelo Suma de cuadrados gl Media cuadrática F Sig
1 Regresión 20583220467148,770 1 20583220467148,770 1947,404 ,000b
64
b Predictores: (Constante), Cantidad
c Predictores: (Constante), Cantidad, Capacidad_Bolsa
Para el modelo uno el valor del estadístico de prueba F= 1947.404 y para el modelo
2 el valor estadístico de prueba F = 1176.079 los cuales tienen una P_ valor igual a
0 < 0.05, por lo que se rechaza la hipótesis nula y se concluye que la dependencia
lineal es estadísticamente significativa por lo que el modelo es adecuado.
Variables excluidasa
Estadísticas de colinealidad
Correlación
Modelo En beta t Sig Tolerancia
parcial Tolerancia VIF
mínima
1 Costo_Ventas ,294b 4,961 ,000 ,278 ,117 8,529 ,117
Capacidad_Bolsa ,144b 7,356 ,000 ,394 ,987 1,013 ,987
2 Costo_Ventas ,071c 1,002 ,317 ,058 ,076 13,215 ,076
a Variable dependiente: Ventas
b Predictores en el modelo: (Constante), Cantidad
c Predictores en el modelo: (Constante), Cantidad, Capacidad_Bolsa
Diagnósticos de colinealidada
Índice de Proporciones de varianza
Modelo Dimensión Autovalor
condición (Constante) Cantidad Capacidad_Bolsa
1 1 1,779 1,000 ,11 ,11
65
a Variable dependiente: Ventas
La validación del modelo se realiza por medio del análisis e interpretación de los
coeficientes de correlación.
66
Teniendo en cuenta que el estadístico da 0 se rechaza H0 esto quiere decir que
existe una autocorrelación positiva.
HOMOCEDASTICIDAD
Gráfica 2 Dispersión
De acuerdo con la gráfica 6 se puede observar que la mayoría de los residuos son
aleatorios por lo que se podría inferir que se cumple en supuesto de
homocedasticidad u homogeneidad de varianzas.
NORMALIDAD
67
Gráfica 3 P-P
Gráfica 4: Q-Q
Las gráficas P-P plot que hace referencia a los percentiles y Q-Q plot que hace
referencias a los cuantiles se puede observar que los errores, aunque no todos se
encuentran sobre la línea de tendencia estos tienen a seguir una distribución
normal.
68
CONCLUSIONES
Se concluye por medio de la validación del moldeo que para Boleco S.A. las
variables que más se relacionan entre sí son ventas, cantidad y capacidad de la
bolsa, estas variables permiten predecir un modelo con una relación significativa de
un 88.9%.
El modelo de regresión lineal múltiple por medio del Software SPSS permite
identificar la relación que existe entre las diferentes variables objeto de estudio y
como estas afectan el resultado de otra variable, es decir, permite identificar cual es
la variable que más causa – efecto tiene respecto a la variable independiente.
69
RECOMENDACIÓN
70
ANEXOS
71
BIBLIOGRAFÍA
Astorga Gómez, J. M. (2014). Aplicación de modelos de regresión lineal para determinar las
armónicas de tensión y corriente. Redalyc.
Barahona Urbina, P., Veres Ferrer, E., & Aliaga Prieto, V. (2016). Deserción académica de la
Universidad de Atacama, chile. SciELO.
Bowerman, B., O'Connell, R., & Koehler, A. (2007). Pronósticos, Series de Tiempo y Regresión.
México,D.F.: Cengage Learning.
Brenes González, H. A. (2017). Aplicación del análisis de regresión lineal simple para la estimación
de los precios de las acciones de Facebook, Inc. Revista Electrónica de Investigación en
Ciencias Económicas, 1-23.
Campos Aranda, D. F. (2016). Una aplicación hidrológica de la regresión lineal múltiple ponderada.
Tecnología y Ciencias del Agua, 161-173.
Carrasquilla Batista, A., Chacón Rodríguez, A., Núñez Montero, K., Gomez Espinoza, O., Valverde,
J., & Guerrero Barrantes, M. (2016). Regresión lineal simple y múltiple: aplicación en la
predicción de variables naturales relacionadas con el crecimiento microalgal. Dialnet, 35-
45.
Castro Valderrama, M. P., Wilches Chiriví, K., & Gómez Delgado, G. L. (2018). Pontificia Universidad
Javeriana Bogotá. Obtenido de Diseño de Bolsa Reutilizable para Empaque y Transporte
de Frutas y Verduras:
https://repository.javeriana.edu.co/bitstream/handle/10554/36531/CastroValderramaMa
riaPaula2018.pdf?sequence=1&isAllowed=y
Damodar N., G., & Dawn C., P. (2010). Econometría (Quinta ed.). México, D.F.: Mc Graw Hi.
García, G., Brogioni, M., Venturini, V., Rodríguez, L., Fontanelli, G., Walker, E., . . . Macelloni, G.
(2016). Determinación de la humedad de suelo mediante regresión lineal múltiple con
datos TerraSAR-X. Revista de Teledetección, 73-81.
Garcia, J., Morales Serrano, B., & González Cavazos, B. (2013). Analisis Estadistico Multivariante.
Mc Graw Hill.
72
Morantes Quintana, G. R., Rincón Polo, G., & Pérez Santodomingo, N. A. (2019). Modelo de
regresión lineal multiple para estimar concentración de PM1. Revista Internacional de
Contaminación Ambiental.
Ortiz, R., Arias, F., Da Silva, C., & Cardozo, O. (2015). Análisis Espacial del Precio del Suelo con
Modelos de Regresión Lineal Múltiple (MRLM)y Sistemas de Información Geográfica (SIG).
Revista Geográfica del Valparaíso, 1-18.
Pardo, A., & Ruiz, M. Á. (2005). Análisis de datos con SPSS 13 Base. España: ProQuest Ebook
Central.
Pat Fernandez, L. A., Martínez Menchaca, A. H., Pat Fernández, J. M., & Martínez Luis, D. (2013 ).
Introducción a los Modelos de Regresión. Ciudad del Carmen: Plaza y Valdes. Obtenido de
https://ebookcentral.proquest.com
Pérez López, C. (2005). Métodos Avanzados con SPSS. España: Thomson Editores Spain.
Perez Obregón, J. M., & Romero Díaz, T. (2018). Análisis del rendimiento académico mediante
regresión logistica y múltiple. Revista Electrónica de Conocimientos, Saberes y prácticas,
33-42.
Plascencia Villaliz, A. C. (11 de 2015). Análisis de Regresión Múltiple del Fenómeno de la Trata de
Personas en México. Obtenido de
http://148.204.210.201/tesis/1457542786408TesisAdrianaP.pdf
Rodríguez Mañay, L. O., Saltos Chacán, M. Y., & Muñoz Moreta, E. R. (2016). Cálculo de un cost
driver para determinar el costo de una actividad empleando un modelo de Regresión
Lineal o un modelo de Regresión Multiple. Dialnet, 239-255.
Sabogal Cardona, O. A., Hincapié Zea, J. D., Santa Chávez, J. J., & Willmer Escobar, J. (2015).
Modelos de Regresión Lineal para Estimación de Tiempos de Viaje en Sistemas de
Transporte Masivo. Ciencia e Ingeniería Neogranadina, 77-89.
Samaniego Pinho, A., & Buenahora Bernal, M. (2016). Variables relacionadas con ansiedad social
en adolescentes: un modelo de regresión Lineal múltiple. Interacciones, 109-122.
Spyros, M., & Steven C., W. (1997). Manual de Técnicas de Pronósticos. México, D.F.: Limusa, S.A
de C.V.
73
Thea, J., & Torrillas, N. J. (2019). RIA Repositorio Institucional Abierto. Obtenido de Producción de
bolsas Plásticas Biodegradables :
http://ria.utn.edu.ar/bitstream/handle/20.500.12272/3505/Producci%c3%b3n%20de%20
bolsas%20pl%c3%a1sticas%20biodegradables.pdf?sequence=1&isAllowed=y
Vilá Baños, R., Torrado Fonseca, M., & Reguant Álvarez, M. (2019). Análisis de regresión lineal
múltiple con SPSS: un ejemplo práctico. Barcelona, Barcelona.
Ximénez, M. C., & San Martín, R. (2013). Fundamentos de las Técnicas Multivariantes. ProQuest
Ebook.
74