Está en la página 1de 12

UNIVERSIDAD NACIONAL DE TRUJILLO

ESCUELA ACADÉMICO PROFESIONAL DE INFORMÁTICA

PLAN DE TESIS

I. GENERALIDADES

1. Título
“DISEÑO DE UN MODELO DE MINERIA DE DATOS CON LA TÉCNICA DE
REGRESIÓN LINEAL MÚLTIPLE PARA EL PRONÓSTICO DE VENTAS ”.

2. Autores
 Linares Mestanza, Eliana Mabel.
 Sedano Méndez, Ekaterina Celeste.

3. Asesor
Ing. Christian Araujo González.

4. Tipo de Investigación
4.1. De acuerdo al diseño de la investigación
Descriptiva

5. Localidad e Institución de Desarrollo


5.1. Localidad
Departamento de La Libertad, Provincia de Trujillo, distrito de Trujillo.
5.2. Institución
Universidad Nacional de Trujillo.

6. Duración del Proyecto de Graduación


4 meses (105 días)
 Inicio: 08 de Setiembre de 2008.
 Término: 21 de Diciembre de 2008.

1
7. Cronograma del trabajo de graduación

Fecha
Nº Actividad Duración
Inicio Término

1 Investigación Bibliográfica 08/09/08 05/10/08 4 semanas


Análisis de las características de
2 06/10/08 02/11/08 4 semanas
los Pronósticos de Ventas.
Análisis del modelo estadístico de
3 regresión lineal múltiple como 03/11/08 21/12/08 7 semanas
técnica de minería de datos.

8. Duración de la Tesis
10 meses (280 días)
 Inicio: 08 de septiembre del 2008
 Término: 14 de junio del 2009

9. Cronograma de Tesis

Fecha
Nº Actividad Duración
Inicio Término

1 Investigación Bibliográfica 08/09/08 05/10/08 4 semanas


Análisis de las características de
2 06/10/08 02/11/08 4 semanas
los Pronósticos de Ventas.
Análisis del modelo estadístico de
3 regresión lineal múltiple como 03/11/08 21/12/08 7 semanas
técnica de minería de datos.
Diseño del Modelo para
16
4 Pronósticos de Ventas con Minería 22/12/08 12/04/09
semanas
de Datos.
Evaluación e Interpretación del
5 13/04/09 24/05/09 6 semanas
modelo

2
6 Discusión de los resultados 25/05/09 14/06/09 3 semanas
Elaboración de Informe Final de la 36
7 06/10/08 14/06/09
Tesis semanas

10.Recursos
10.1. Personal
 Autores.
 Asesor.
10.2. Bienes
 Útiles de oficina.
 Computadoras personales.
 Impresora de inyección de tinta.
 Copias de documentos.
 Dispositivos de almacenamiento (Memoria USB, CD’s).
 Software (Windows XP, Microsoft office 2007).
 Material bibliográfico.
10.3. Servicios
 Servicio telefónico.
 Servicio de Transporte público.
 Servicio de Fluido Eléctrico.
 Servicio de Internet.
 Servicio de fotocopiadoras.
 Servicio de anillado.
 Servicio de empastado.

11.Locales
 Universidad Nacional de Trujillo (Av. Juan Pablo II s/n-Ciudad
Universitaria).
 Domicilio de Autores.
 Oficina del docente asesor.

3
12.Presupuesto
12.1. Bienes
 Útiles de oficina.
Cantidad Descripción Costo
02 millares Papel bond A4 80 gr. S/. 48.00
02 unidades Portaminas S/. 7.00
02 unidades Bolígrafos S/. 5.00
02 unidades Correctores S/. 5.00
02 unidades Borradores S/. 2.00
01 unidad Libreta de notas S/. 2.00
01 unidad Engrapador S/. 10.00
01 unidad Perforador S/. 10.00
06 unidades Fólderes Manila A4 S/. 3.00
12 unidades CD-R Sony S/. 18.00
SUBTOTAL S/. 110.00

 Material de Impresión
Cantidad Descripción Costo
01uniddad cartucho de tinta Negra para S/. 27.00
impresora HP Deskjet D1360
01 unidad cartucho de tinta de Color para S/. 30.00
impresora HP Deskjet D1360
SUBTOTAL S/. 57.00

 Hardware
Cantidad Descripción Costo
01 unidad Computador Pentium IV 2.42
S/. 600.00
GHz, RAM 1GB, HD 60 GB
01 unidad Impresora HP Deskjet D1360 S/. 300.00
01 unidad Memoria USB Kingston 2GB S/. 40.00
SUBTOTAL S/. 940.00

4
 Software
Descripción Costo
Windows XP SP2 S/. 610.00
Microsoft Office 2007 S/. 1056.00
SUBTOTAL S/. 1666.00

 Material Bibliográfico
Descripción Costo
Libros S/. 400.00
Copias de Documentos S/. 100.00
SUBTOTAL S/. 500.00

12.2. Servicios
Descripción Costo
Servicio telefónico. S/. 240.00
Transporte público. S/. 520.00
Fluido Eléctrico (por 13 meses, S/.20.00 por mes). S/. 260.00
Internet (por 13 meses, S/. 40.00 por mes). S/. 520.00
Fotocopias S/. 300.00
Anillado S/. 50.00
Empastado S/. 50.00
SUBTOTAL S/.1940.00

12.3. Resumen
Útiles de oficina S/. 110.00
Material de impresión S/. 57.00
Hardware S/. 940.00
Software S/.1666.00
Material Bibliográfico S/.500.00
Servicios S/.1940.00
TOTAL S/. 5213.00

5
13.Financiamiento
Recursos Propios.

II. PLAN DE INVESTIGACIÓN


1. ANTECEDENTES Y JUSTIFICACIÓN
1.1. ANTECEDENTES
El pronóstico de las ventas futuras en una empresa tiene gran
importancia en la evaluación de nuevos proyectos de inversión, en la
planificación de estrategias de marketing, en el control eficiente de los
canales de distribución y en el manejo de inventarios [Marshall, 1998].
Es por ello que en el proceso de pronóstico se intenta que los errores
sean tan pequeños como sea posible, y es así que se van proponiendo y
desarrollando nuevas técnicas de pronóstico desde las Estadísticas
hasta una de las tecnologías emergentes de hoy en día como es la
Minería de Datos.

Respecto a pronósticos en ventas hasta la actualidad se utilizan


técnicas como: análisis de series de tiempo, el método Delfi, modelos
econométricos y análisis de regresión lineal simple y múltiple. Tal como
se menciona en el libro titulado “Análisis Estadísticos para la toma de
decisiones” [Salinas, 1993].

La Estadística con su Análisis de Datos se mezcla con la minería de


datos. Actualmente técnicas modernas propias de la inteligencia
Artificial y modelos estadísticos pueden ser comparados, se tiene
referencia en el artículo titulado “Predicción de Series de ventas: Un
Análisis de Cointegración con el PBI”, de la revista ABANTE de la
Universidad Católica de Chile, donde se realiza un estudio que tiene
por objetivo fundamental comparar distintas metodologías para la
predicción de series trimestrales de ventas en empresas del sector
productivo, dichas series de ventas están cointegradas con la serie del

6
PBI, de manera que el PBI explica completamente las tendencias en las
ventas. [Marshall, 1998]

Con respecto al tema propuesto para la tesis se encontró referencias


más cercanas en:
El proyecto de fin de carrera titulado “Determinación en tendencias en
usuarios de una campaña de marketing utilizando técnicas de
agrupamiento clásicas”, donde se menciona que el marketing es uno de
los campos donde los éxitos de la minería de datos son más conocidos.
Cuanto más amplia y precisa sea la información que tengamos sobre los
clientes, la empresa tiene mayores posibilidades de aumentar sus
ingresos y rentabilizar al máximo sus acciones comerciales. Es así que
utilizando técnicas de agrupamiento clásicas se extraerá información
útil de bases de datos comerciales de una empresa. [Villalón, 2006]

En el paper titulado “Pronóstico de Ventas: Comparación de Predicción


basada en Redes Neuronales versus Método Estadístico” [Nojek] escrito
por Nojek, S., Britos, P., Rossi, B. y García Martínez, R. Se inicia dando
una introducción al Pronóstico de ventas y su importancia para dar un
panorama del tema, luego plantea la metodología que seguirán en su
trabajo siendo que con la base de datos de una empresa en concreto
someterán a evaluar bajo doce métodos estadísticos contenidos en un
software de otra empresa y contra el resultado de la misma base de
datos bajo el software de una tercera empresa para el caso de las redes
neuronales. Hallando al final un mayor grado de confianza en el caso de
las redes neuronales pero planteando la limitación para el usuario de
que topología y método de entrenamiento aplicar para cada caso. Cabe
mencionar que entre los métodos estadísticos planteados no se
encuentra específicamente el de regresión lineal múltiple.

En el artículo “La minería de datos, entre la estadística y la inteligencia


artificial”, publicado por la Universidad Politécnica de Cataluña, se

7
realiza un estudio sobre las raíces estadísticas de las minería de datos,
donde se comenta que la minería de datos tuvo su origen en la
estadística y la Inteligencia Artificial, y al final se realiza un estudio
comparativo entre cuatro técnicas de minería de datos: Análisis
discriminante, Regresión Logística, Redes Neuronales y Árboles de
Clasificación concluyendo en que las probabilidades de acierto en la
muestra de validación son bastante parecidas para los cuatro tipos de
técnicas utilizadas. [Aluja, 2001]

Finalmente nosotros pretendemos brindar un modelo de minería de


datos que permita realizar un buen pronóstico de ventas. Dado la
minería de datos provee etapas bien definidas, necesarias para
minimizar los errores de precisión que se tienen por la falta de
tratamiento de datos o el uso de métodos no formales. Para ello
utilizaremos la técnica de minería de datos de regresión lineal múltiple
dado que tiene relación con métodos estadísticos actuales de predicción
como es la Regresión.

1.2. JUSTIFICACIÓN DEL TRABAJO


Desde un punto de vista empresarial:
 Ayudará en el pronóstico de ventas, identificando nuevas
tendencias y comportamientos útiles.
 Apoyará a las empresas en cuanto a su necesidad de competir en
el mercado con el uso de nuevas tecnologías, como lo es la
minería de datos.

Desde un punto de vista de la ciencia y la tecnología computacional:


 Presentará un análisis orientado a descubrir conocimiento en
bases de datos, basándose en una técnica de minería de datos.
 El modelo planteado servirá como guía para futuros estudios de
aplicaciones similares de minería de datos.

8
2. DESCRIPCIÓN DEL PROBLEMA
El tomar decisiones implica no sólo el resultado de un análisis lógico, si
no uno cuantitativo [Salinas, 1993]. Siendo allí donde los pronósticos de
ventas cobran gran importancia en una empresa debido a que son
usados para la toma de decisiones en: la evaluación de nuevos proyectos
de inversión, en la planificación de estrategias de marketing, en el
control eficiente de los canales de distribución y en el manejo de
inventarios. Si estos pronósticos son incorrectos no será posible
responder a la demanda anticipadamente o bien se cae en una
sobreestimación de la misma [3].

En la actualidad se tienen métodos como los objetivos y subjetivos que


sirven para pronosticar ventas [Salinas, 1993]; pero a pesar que los
primeros tienen mayor precisión, ambos no consideran criterios claros de
limpieza o transformación de datos, necesarios para un menor “error de
predicción” [3]. Además se sabe la mayoría de empresas utilizan los
métodos subjetivos como opiniones de expertos o encuestas a los
vendedores, clientes; lo cual demanda tiempo y mayores recursos
humanos [3] como financieros; y son pocas las que se basan en métodos
estadísticos, por ejemplo la regresión, u otro formal para hacer
pronósticos, es decir que sigan modelos claros.

Si por ejemplo, para predecir las ventas de automóviles el próximo año


se generan números aleatorios en la computadora y sobre la base de
pronósticos se realizan inversiones, se contrata mano de obra, etc. se
estaría tomando una decisión en forma incorrecta. Si en cambio, se
analizan las variables que determinan las ventas de automóviles la
decisión sería correcta aunque las ventas sean distintas a las
proyectadas [Cachanosky, 2000].

A diario en las empresas se obtiene y almacena información en forma de


bases de datos, data warehouses, etc. Un estudio del META GROUP

9
sobre los proyectos de Data Warehouse encontró que el 19% de los que
contestaron están por encima del nivel de los 50 Gigabytes, mientras
que el 59% espera alcanzarlo en el segundo trimestre de 1997 [2]. Esta
información se vuelve por tanto abúndate en muchos casos e inútil,
puesto queda solo como información histórica sin mayor provecho.
Por ende se hace necesario tener mayor precisión en los pronósticos de
ventas, así como sacarle provecho a la información almacenada por las
empresas generando conocimiento útil como lo propone la minería de
datos.

2.1. CARACTERÍSTICAS DE LA REALIDAD PROBLEMÁTICA:


 Información almacenada sin sacarle provecho.
 La falta de un modelo claro que soporte limpieza o transformación
de datos.
 Demanda de mas recursos humanos y financieros al realizar
pronósticos de ventas y claro, tiempo.

2.2. ENUNCIADO:
¿Cuáles son las características de los elementos del modelo de Minería
de Datos usando la técnica de regresión lineal múltiple?

3. OBJETIVOS
3.1. OBJETIVO GENERAL
Diseñar un modelo con Minería de datos aplicando la técnica de
regresión lineal múltiple para pronósticos de ventas.

3.2. OBJETIVOS ESPECÍFICOS


 Analizar la técnica de minería de datos: regresión lineal múltiple,
aplicada al pronóstico de ventas.
 Determinar un modelo basado en minería de datos.
 Determinar las herramientas de minería de datos adecuadas para
desarrollar el modelo.

10
4. METODOLOGÍA DE ESTUDIO
4.1. TIPO DE INVESTIGACIÓN
4.1.1. De acuerdo al diseño de la investigación
 Descriptiva, porque con esta investigación se busca describir la
relación entre las variables usadas en el pronóstico de ventas.

4.1.2. De acuerdo al lugar y los recursos


 Documental, porque esta investigación será realizada en base a la
consulta de libros, revistas, artículos.

4.2. DISEÑO DE INVESTIGACIÓN


4.2.1. Métodos y Técnicas
 Método: Inductivo
 Técnicas: Análisis de contenido, encuestas, entrevistas.

4.3. FUENTE DE DATOS


 Internet
 Empresa, área de ventas.
 Base de Datos de ventas.

5. REFERENCIAS BIBLIOGRÁFICAS

[Aluja, 2001] Aluja, Tomás. Minería de Datos entre la estadística y la


inteligencia Artificial, Universidad Politécnica de Cataluña, Cataluña, 2001, 1
– 498 págs.

[Cachanosky, 2000] Cachanosky, José C. Las Decisiones Empresariales y las


Predicciones en Economía. Revista Libertas 32, Instituto Universitarios
ESEADE, Argentina, 2000, 1 – 22 págs.

11
[Marshall, 1998] Marshall, Pablo. Predicción de Series de ventas: Un Análisis
de Cointegración con el PBI, Revista ABANTE Vol. 1, Universidad Católica de
Chile, Chile, 1998, 90 – 196 págs.

[Nojek] Nojek, S., Britos, P., Rossi, B., García Martínez, R. Pronóstico de
Ventas: Comparación de Predicción basada en Redes Neuronales versus Método
Estadístico, Instituto Tecnológico de Buenos Aires, Argentina.

[Orallo, 2004] Hernández Orallo, J. Introducción a la Minería de Datos.


Pearson-Prentice Hall, Madrid, 2004, 3-236.

[Salinas, 1993] Salinas Ortiz, José. Análisis Estadísticos para la toma de


decisiones en Administración y Economía, Universidad del Pacífico, Perú,
1993, 275 – 310 págs.

[Villalón, 2006] Villalón Coca, Javier. Determinación en tendencias en usuarios


de una campaña de marketing utilizando técnicas de agrupamiento clásicas,
Universidad de Valencia, Valencia, 2006, 1- 166 págs.

6. REFERENCIAS ELECTRÓNICAS

[1] Mendoza Rivera, R., Data Minig, Escrito: 29/04/08. Fecha acceso: 20/09/08.
Disponible en: http://rimenri.blogspot.com/

[2] Historia De Data Mining. Escrito: 19/09/07. Fecha acceso: 20/09/08.


Disponible en: http://oicp.blogspot.es/

[3] La Guía de Gestión de la cadena de suministro. Fecha acceso: 21/09/08.


Disponible en: http://www.managementsupport.com/cadena-de-suministro.htm

12