Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Integrantes:
Cumbal Jessica
Custode Vito
Minchalo Juan Pablo
Vega Dayana
Joe Wilson.
MINERA DE DATOS
GRUPO #3
2
Contenido
RESUMEN............................................................................................. 3
INTRODUCCIN.................................................................................... 3
CAPTULO I........................................................................................... 4
1.1 OBJETIVOS...................................................................................4
1.1.1. OBJETIVO GENERAL..............................................................5
1.1.2. OBJETIVOS ESPECFICOS......................................................5
1.2 JUSTIFICACIN............................................................................. 5
1.3 ALCANCE..................................................................................... 5
1.4 DESCRIPCIN DEL EJERCICIO......................................................5
1.5 FORMULACIN DEL PROBLEMA...................................................6
CAPTULO II.......................................................................................... 6
2.1 MARCO TERICO.........................................................................6
2.1.1 MINERA DE DATOS...............................................................6
2.1.1. HISTORIA.............................................................................. 7
2.2 SOFTWARE UTILIZADO................................................................7
2.2.1. MICROSOFT ACCESS............................................................7
2.2.2. EXCEL...................................................................................8
CAPTULO III......................................................................................... 8
METODOLOGA.................................................................................. 8
CAPTULO IV....................................................................................... 12
RESULTADOS OBTENIDOS...............................................................12
CAPTULO V........................................................................................ 13
CONCLUSIONES Y RECOMENDACIONES...........................................13
5.1 CONCLUSIONES......................................................................13
5.2 RECOMENDACIONES...............................................................13
REFERENCIAS BIBLIOGRFICAS..........................................................14
Ilustracin 1 Damos clic en nuestra Base de Datos. (Elaborado por: Grupo 3.-
Minera de datos)..................................................................................................... 11
Ilustracin 2 Base de datos de la Papelera CRAYON`S. (Elaborado por: Grupo 3.-
Minera de datos)..................................................................................................... 11
Ilustracin 3 Escoger la tabla Factura de la base de datos. (Elaborado por: Grupo 3.-
Minera de datos)..................................................................................................... 12
Ilustracin 4 Consulta de la tabla de Factura. (Elaborado por: Grupo 3.- Minera de
datos)...................................................................................................................... 12
Ilustracin 5 Formato para realizar la consulta de la Tabla de Facturas. (Elaborado
por: Grupo 3.- Minera de datos)..............................................................................13
Ilustracin 6 Consulta del nmero de Facturas por mes en el ao 2016. (Elaborado
por: Grupo 3- Minera de datos)...............................................................................13
ABSTRACT
3
This document explains the application of data mining in the academic sector,
developing Microsoft programs such as, Access and Excel, being basic tools for creating
a database and within it have the ability to perform Queries, filter results, if you easily
master the data within them. In this case we will work with data that we handle within a
stationery such as products, brands, categories and more that will be detailed in this
project. The aforementioned information has been projected by means of graphics to be
presented to the user more comprehensively, by means of bar graphs or pie charts, thus
allowing a better use and interpretation of the data. The use of data mining in a solid and
well-structured database allows reliable conclusions to be drawn and with these
decisions more productive for any type of organization or company.
RESUMEN
En el presente documento, se explica la aplicacin de la minera de datos en el sector
acadmico, desarrollando los programas de Microsoft como, Access y Excel, siendo
instrumentos elementales para la creacin de una base de datos y dentro de ella tener la
capacidad de realizar consultas, filtrar resultados, en si fcilmente dominar los datos
dentro de ellas. En esto caso trabajaremos con datos que manejamos dentro de una
papelera como productos, marcas, categoras y de ms que se detallara en este
proyecto. La mencionada informacin ha sido proyectada mediante grficos para ser
presentada al usuario ms compresiblemente, mediante grficas de barras o grficas de
pastel permitiendo as un mejor aprovechamiento e interpretacin de los datos. El uso de
la minera de datos en una base de datos slida y bien estructurada, permite obtener
conclusiones confiables y con estas tomar decisiones ms productivas para cualquier
tipo de organizacin o empresa.
INTRODUCCIN
4
El objetivo principal de las bases de datos es el de unificar los datos que se manejan y
los programas o aplicaciones que los manejan. Anteriormente los programas se
codificaban junto con los datos, es decir, se diseaban para la aplicacin concreta que
los iba a manejar, lo que desembocaba en una dependencia de los programas respecto a
los datos, ya que la estructura de los ficheros va incluida dentro del programa, y
cualquier cambio en la estructura del fichero provocaba modificar y recompilar
programas. Adems, cada aplicacin utiliza ficheros que pueden ser comunes a otras de
la misma organizacin, por lo que se produce una redundancia de la informacin, que
provoca mayor ocupacin de memoria, laboriosos programas, e inconsistencia de datos
si los datos no fueron bien actualizados en todos los programas. Con las bases de datos,
se busca independizar los datos y las aplicaciones, es decir, mantenerlos en espacios
diferentes. Los datos residen en memoria y los programas mediante un sistema gestor de
bases de datos, manipulan la informacin. El sistema gestor de bases de datos recibe la
peticin por parte del programa para manipular los datos y es el encargado de recuperar
la informacin de la base de datos y devolvrsela al programa que la solicit. Cada
programa requerir de una cierta informacin de la base de datos, y podr haber otros
que utilicen los mismos datos, pero realmente residirn en el mismo espacio de
almacenamiento y los programas no duplicarn esos datos, si no que trabajarn
directamente sobre ellos concurrentemente. Aunque la estructura de la base de datos
cambiara, si los datos modificados no afectan a un programa especfico, ste no tendr
por qu ser alterado. Mediante estas tcnicas de base de datos se pretende conseguir a
travs del Sistema Gestor de Bases de Datos.
CAPTULO I
5
1.1 OBJETIVOS
1.2 JUSTIFICACIN
La finalidad del presente documento es demostrar el manejo de datos mediante realizar
una recopilacin previa y luego realizar una captura de requisitos con el profesor
(haciendo de gerente) para conocer qu objetivos debemos alcanzar y qu medios
necesitamos para ello, pasando a manejar la base de datos para obtener informacin
relevante para el gerente y dndole de manera ms comprensible la informacin
mediante grficos con etiquetas para que pueda tomar decisiones de manera ms
fundamentada con datos histricos.
1.3 ALCANCE
Elaborar una base de datos, mediante la recopilacin de ms de 3000 datos en tablas ya
previamente estructuradas usando herramientas de Microsoft como Access, para el
almacenamiento y manejo de la informacin de una papelera clasificando, productos
marcas, categoras, clientes y facturas, apoyndose en las herramientas que ofrece este
programa para realizar consultas confiables sobre la informacin de manera ordenada y para
luego filtrarlas y obtener datos ms especficos sobre la consulta que se tiene. Y ya que las
versiones de Access no contienen grficos dinmicos dentro de su herramienta nos
apoyaremos en otro programa de Microsoft, Excel para poder importar las consultas
realizadas y mediante la herramienta de Excel llamada grficos dinmicos poder graficar los
resultados y hacerlos ms comprensibles para el usuario de las consultas.
herramientas de Excel para el manejo de tablas y grficos dinmicos que ayudar a tener
la informacin obtenida de manera ms comprensible para sus usuarios.
CAPTULO II
2.1 MARCO TERICO
2.1.1. HISTORIA
La idea de minera de datos no es nueva. Ya desde los aos sesenta los estadsticos
manejaban trminos como data fishing, data mining o data archaeology con la idea de
7
encontrar correlaciones sin una hiptesis previa en bases de datos con ruido. A
principios de los aos ochenta, Rakesh Agrawal, Gio Wiederhold, Robert Blum y
Gregory Piatetsky-Shapiro, entre otros, empezaron a consolidar los trminos de data
mining y KDD. A finales de los aos ochenta slo existan un par de empresas
dedicadas a esta tecnologa; y en 2002 existan ms de 100 empresas en el mundo que
ofrecan alrededor de 300 soluciones. Las listas de discusin sobre este tema las forman
investigadores de ms de ochenta pases. Esta tecnologa ha sido un buen punto de
encuentro entre personas pertenecientes al mbito acadmico y al de los negocios. El
data mining es una tecnologa compuesta por etapas que integra varias reas y que no se
debe confundir con un gran software. Durante el desarrollo de un proyecto de este tipo
se usan diferentes aplicaciones software en cada etapa que pueden ser estadsticas, de
visualizacin de datos o de inteligencia artificial, principalmente. Actualmente existen
aplicaciones o herramientas comerciales de data mining muy poderosas que facilitan el
desarrollo de un proyecto. Sin embargo, casi siempre acaban complementndose con
otra herramienta.
El avance en los instrumentos utilizados para la minera de datos le ha ido dando varios
nombres a esta accin de bsqueda de datos:
2.2.1.1 DEFINICIN
2.2.2. EXCEL
2.2.2.1 DEFINICIN
Excel 2010 es una aplicacin que permite realizar hojas de clculo, que se encuentra
integrada en el conjunto ofimtico de programas Microsoft Office. Microsoft Excel es
una aplicacin bastante amplia, que nos permitir hacer desde las funciones ms
sencillas como sumar o guardar datos, hasta hacer complejas funciones, grficos,
estadsticas, podremos incluso hacer pequeas aplicaciones para la vida cotidiana. Los
archivos de Microsoft Excel se definen como libros, dentro de los cuales hay hojas de
clculo, estas hojas se componen de celdas. Las filas y columnas de cada hoja tienen
una nomenclatura para que cada celda se pueda identificar con coordenadas, las filas se
identifican con nmeros del 1 hasta la 65536 y las columnas se identifican con letras
desde la A hasta la IV. Entonces la identificacin de una celda sera (columna, fila), por
ejemplo, la celda B5 corresponde a la columna B y a la fila 5. Cada celda tiene sus
propiedades, que se pueden cambiar individualmente de acuerdo a nuestras necesidades.
CAPTULO III
METODOLOGA
Para el desarrollo de este trabajo se busca obtener los mejores resultados tanto en
eficiencia como en eficacia acadmicamente, ya que el ejercicio va desde la eleccin de
la base de datos a usarse, hasta las preguntas de cmo siendo usuarios nos
formularamos para la aplicacin de minera de datos. Conforme se realizaba el trabajo
fuimos descubriendo informacin desconocida, adems de conocimiento nuevo a partir
de la prueba y error, nos permiti aprender sobre el uso de Access y Excel, as como
tambin las mltiples aplicaciones que pueden tener los distintos softwares. Lo primero
que realizamos fue obtener nuestra base de datos con ms de 3000 datos planteando la
informacin necesaria dentro de una papelera y la clasificacin que se le deba dar a
cada tipo de informacin. A continuacin, el planteamiento y posterior revisin de las
preguntas a realizarse para conocer la productividad de la papelera, conociendo como
encontrar sus respuestas mediante consultas en Access mediante el diseo de consultas.
A continuacin, los resultados obtenidos los vamos a tratar de hacer ms comprensibles
ara los usuarios transformndolos de valores numricos a grficos usando Excel,
importando de la base de datos las consultas. Despus de esto utilizamos la herramienta
9
de Excel Power Pivot para crear grficos dinmicos utilizando grficos en barra y de
esta manera hacer ms comprensible y fcil las preguntas realizadas para los usuarios.
MINERA DE DATOS
Para la realizacin del proyecto Minera de Datos, es fundamental seguir los pasos que
describiremos a continuacin, nuestro proyecto hace referencia al nmero de Facturas
por mes en el ao 2016.
Ilustracin 1 Damos clic en nuestra Base de Datos. (Elaborado por: Grupo 3.-
Minera de datos)
Ilustracin 7 Exportar una consulta de access a excel. (Elaborado por: Grupo 3.-
Minera de DATOS)
Ilustracin 9 Insertar grfico y tabla dinmica. (Elaborado por: Grupo 3.- Minera
de DATOS)
Ilustracin 14 Como escoger la base de datos. (Elaborado por: Grupo 3.- Minera de
DATOS)
4. Click en seleccionar en una lista y escoger la pregunta que deseamos graficar.
Ilustracin 16 Paso previo a concluir el grfico dinmico. (Elaborado por: Grupo 3.-
Minera de DATOS)
CAPTULO IV
RESULTADOS OBTENIDOS
El mes en el que se ha emitido ms facturas es en octubre con 532 facturas
totales del ao 2016.
La marca estilo es la marca que ms se ha vendido por mese en el ao 2016.
De la categora libros se han vendidos productos en el ao 2016.
En la mayora de los meses el producto que ms se ha vendido ha sido la tinta de
impresora, excepto en marzo pues se han vendido ms teclados.
En el ao 2016 en el mes de octubre se ha recaudado ms dinero que en los
dems meses teniendo ingresos de $2.820.430,70
CAPTULO V
CONCLUSIONES Y RECOMENDACIONES
5.1 CONCLUSIONES
5.2 RECOMENDACIONES
Siempre relacionar las tablas como sistema de base de datos relacional es muy
importante que tengamos muy claro desde el principio las relaciones que existen
entre tablas y realizarlas, siempre que podamos, nada ms crearlas. No lo dejes
para despus ya que terminamos olvidndolo y con el tiempo nos encontramos
desagradables sorpresas. Al momento de llenar la informacin no tener que
hacer cambios en los modelos fsicos ni lgicos.
REFERENCIAS BIBLIOGRFICAS