Está en la página 1de 17

1

UNIVERSIDAD CENTRAL DEL


ECUADOR
ECONOMA
SISTEMAS DE INFORMACIN
ESTRATGICOS

Prof.: Ing. Francisco Valverde

Integrantes:
Cumbal Jessica
Custode Vito
Minchalo Juan Pablo
Vega Dayana
Joe Wilson.

MINERA DE DATOS
GRUPO #3
2

Contenido
RESUMEN............................................................................................. 3
INTRODUCCIN.................................................................................... 3
CAPTULO I........................................................................................... 4
1.1 OBJETIVOS...................................................................................4
1.1.1. OBJETIVO GENERAL..............................................................5
1.1.2. OBJETIVOS ESPECFICOS......................................................5
1.2 JUSTIFICACIN............................................................................. 5
1.3 ALCANCE..................................................................................... 5
1.4 DESCRIPCIN DEL EJERCICIO......................................................5
1.5 FORMULACIN DEL PROBLEMA...................................................6
CAPTULO II.......................................................................................... 6
2.1 MARCO TERICO.........................................................................6
2.1.1 MINERA DE DATOS...............................................................6
2.1.1. HISTORIA.............................................................................. 7
2.2 SOFTWARE UTILIZADO................................................................7
2.2.1. MICROSOFT ACCESS............................................................7
2.2.2. EXCEL...................................................................................8
CAPTULO III......................................................................................... 8
METODOLOGA.................................................................................. 8
CAPTULO IV....................................................................................... 12
RESULTADOS OBTENIDOS...............................................................12
CAPTULO V........................................................................................ 13
CONCLUSIONES Y RECOMENDACIONES...........................................13
5.1 CONCLUSIONES......................................................................13
5.2 RECOMENDACIONES...............................................................13
REFERENCIAS BIBLIOGRFICAS..........................................................14

Ilustracin 1 Damos clic en nuestra Base de Datos. (Elaborado por: Grupo 3.-
Minera de datos)..................................................................................................... 11
Ilustracin 2 Base de datos de la Papelera CRAYON`S. (Elaborado por: Grupo 3.-
Minera de datos)..................................................................................................... 11
Ilustracin 3 Escoger la tabla Factura de la base de datos. (Elaborado por: Grupo 3.-
Minera de datos)..................................................................................................... 12
Ilustracin 4 Consulta de la tabla de Factura. (Elaborado por: Grupo 3.- Minera de
datos)...................................................................................................................... 12
Ilustracin 5 Formato para realizar la consulta de la Tabla de Facturas. (Elaborado
por: Grupo 3.- Minera de datos)..............................................................................13
Ilustracin 6 Consulta del nmero de Facturas por mes en el ao 2016. (Elaborado
por: Grupo 3- Minera de datos)...............................................................................13

ABSTRACT
3

This document explains the application of data mining in the academic sector,
developing Microsoft programs such as, Access and Excel, being basic tools for creating
a database and within it have the ability to perform Queries, filter results, if you easily
master the data within them. In this case we will work with data that we handle within a
stationery such as products, brands, categories and more that will be detailed in this
project. The aforementioned information has been projected by means of graphics to be
presented to the user more comprehensively, by means of bar graphs or pie charts, thus
allowing a better use and interpretation of the data. The use of data mining in a solid and
well-structured database allows reliable conclusions to be drawn and with these
decisions more productive for any type of organization or company.

Key words: Data mining, database, ACCESS, EXCEL, PIVOT,

RESUMEN
En el presente documento, se explica la aplicacin de la minera de datos en el sector
acadmico, desarrollando los programas de Microsoft como, Access y Excel, siendo
instrumentos elementales para la creacin de una base de datos y dentro de ella tener la
capacidad de realizar consultas, filtrar resultados, en si fcilmente dominar los datos
dentro de ellas. En esto caso trabajaremos con datos que manejamos dentro de una
papelera como productos, marcas, categoras y de ms que se detallara en este
proyecto. La mencionada informacin ha sido proyectada mediante grficos para ser
presentada al usuario ms compresiblemente, mediante grficas de barras o grficas de
pastel permitiendo as un mejor aprovechamiento e interpretacin de los datos. El uso de
la minera de datos en una base de datos slida y bien estructurada, permite obtener
conclusiones confiables y con estas tomar decisiones ms productivas para cualquier
tipo de organizacin o empresa.

Palabras clave: Minera de datos, base de datos, ACCESS, EXCEL, PIVOT,

INTRODUCCIN
4

El objetivo principal de las bases de datos es el de unificar los datos que se manejan y
los programas o aplicaciones que los manejan. Anteriormente los programas se
codificaban junto con los datos, es decir, se diseaban para la aplicacin concreta que
los iba a manejar, lo que desembocaba en una dependencia de los programas respecto a
los datos, ya que la estructura de los ficheros va incluida dentro del programa, y
cualquier cambio en la estructura del fichero provocaba modificar y recompilar
programas. Adems, cada aplicacin utiliza ficheros que pueden ser comunes a otras de
la misma organizacin, por lo que se produce una redundancia de la informacin, que
provoca mayor ocupacin de memoria, laboriosos programas, e inconsistencia de datos
si los datos no fueron bien actualizados en todos los programas. Con las bases de datos,
se busca independizar los datos y las aplicaciones, es decir, mantenerlos en espacios
diferentes. Los datos residen en memoria y los programas mediante un sistema gestor de
bases de datos, manipulan la informacin. El sistema gestor de bases de datos recibe la
peticin por parte del programa para manipular los datos y es el encargado de recuperar
la informacin de la base de datos y devolvrsela al programa que la solicit. Cada
programa requerir de una cierta informacin de la base de datos, y podr haber otros
que utilicen los mismos datos, pero realmente residirn en el mismo espacio de
almacenamiento y los programas no duplicarn esos datos, si no que trabajarn
directamente sobre ellos concurrentemente. Aunque la estructura de la base de datos
cambiara, si los datos modificados no afectan a un programa especfico, ste no tendr
por qu ser alterado. Mediante estas tcnicas de base de datos se pretende conseguir a
travs del Sistema Gestor de Bases de Datos.

CAPTULO I
5

1.1 OBJETIVOS

1.1.1. OBJETIVO GENERAL

Manejar diferentes tipos de tecnologas para recopilar informacin, para despus de


manera ordenada clasificarlas. Y as mediante consultas y filtros obtener cualquier tipo
de informacin que se requiera sobre la base de datos.

1.1.2. OBJETIVOS ESPECFICOS


- Reconocer la manera en la que se utiliza las TICS para el trabajo de minera de
datos
- Dar a conocer los beneficios que otorga la minera de datos mediante el manejo
de tecnologas.

1.2 JUSTIFICACIN
La finalidad del presente documento es demostrar el manejo de datos mediante realizar
una recopilacin previa y luego realizar una captura de requisitos con el profesor
(haciendo de gerente) para conocer qu objetivos debemos alcanzar y qu medios
necesitamos para ello, pasando a manejar la base de datos para obtener informacin
relevante para el gerente y dndole de manera ms comprensible la informacin
mediante grficos con etiquetas para que pueda tomar decisiones de manera ms
fundamentada con datos histricos.

1.3 ALCANCE
Elaborar una base de datos, mediante la recopilacin de ms de 3000 datos en tablas ya
previamente estructuradas usando herramientas de Microsoft como Access, para el
almacenamiento y manejo de la informacin de una papelera clasificando, productos
marcas, categoras, clientes y facturas, apoyndose en las herramientas que ofrece este
programa para realizar consultas confiables sobre la informacin de manera ordenada y para
luego filtrarlas y obtener datos ms especficos sobre la consulta que se tiene. Y ya que las
versiones de Access no contienen grficos dinmicos dentro de su herramienta nos
apoyaremos en otro programa de Microsoft, Excel para poder importar las consultas
realizadas y mediante la herramienta de Excel llamada grficos dinmicos poder graficar los
resultados y hacerlos ms comprensibles para el usuario de las consultas.

1.4 DESCRIPCIN DEL EJERCICIO

El trabajo consiste en recopilar informacin en una base de datos, y en este caso


usaremos la plataforma de Access para la recoleccin de datos. Luego de tener completa
la base con ms de 3000 datos, se plantear 5 consultas que se mostrar de manera
ordenada de acuerdo a la pregunta realizada, para posteriormente apoyarnos en las
6

herramientas de Excel para el manejo de tablas y grficos dinmicos que ayudar a tener
la informacin obtenida de manera ms comprensible para sus usuarios.

1.5 FORMULACIN DEL PROBLEMA


Las tecnologas de la informacin utilizadas para la creacin del modelo de minera
de datos constituyen un conjunto de herramientas tiles para la optimizacin de forma
de presentacin de informacin especfica acorde a las necesidades del usuario.

CAPTULO II
2.1 MARCO TERICO

2.1.1 MINERA DE DATOS

Es un mecanismo de explotacin que consiste en la bsqueda de informacin valiosa en


grandes volmenes de datos ligada a las bodegas de datos (informacin histrica) con la
cual los algoritmos de minera de datos obtienen informacin necesaria para la toma de
decisiones.
Concepto segn escritores:
Anlisis de grandes volmenes de datos para encontrar relaciones no triviales, y
para resumirlos de manera que sean entendibles y tiles. Hand, Mannila y Smyth
Extraccin de patrones y modelos interesantes, potencialmente tiles y datos en
base de datos de gran tamao. Hand
Data Mining (Minera de datos) Proceso de extraer conocimiento util y
comprensible, previamente desconocido, desde grandes cantidades de datos
almacenados en distintos formatos (Witten and Frank, 2000)
Knowledge Discovery in Databases KDD (Descubrimiento de Conocimiento
en Bases de Datos) Proceso no trivial de identificar patrones vlidos,
novedosos, potencialmente tiles y, en ltima instancia, comprensibles, a partir
de los datos (Fayyad y col. 1996)
En conclusin, no existe un solo enfoque para minera de datos sino un conjunto de
tcnicas que se pueden utilizar de manera independiente o en combinacin.

2.1.1. HISTORIA

La idea de minera de datos no es nueva. Ya desde los aos sesenta los estadsticos
manejaban trminos como data fishing, data mining o data archaeology con la idea de
7

encontrar correlaciones sin una hiptesis previa en bases de datos con ruido. A
principios de los aos ochenta, Rakesh Agrawal, Gio Wiederhold, Robert Blum y
Gregory Piatetsky-Shapiro, entre otros, empezaron a consolidar los trminos de data
mining y KDD. A finales de los aos ochenta slo existan un par de empresas
dedicadas a esta tecnologa; y en 2002 existan ms de 100 empresas en el mundo que
ofrecan alrededor de 300 soluciones. Las listas de discusin sobre este tema las forman
investigadores de ms de ochenta pases. Esta tecnologa ha sido un buen punto de
encuentro entre personas pertenecientes al mbito acadmico y al de los negocios. El
data mining es una tecnologa compuesta por etapas que integra varias reas y que no se
debe confundir con un gran software. Durante el desarrollo de un proyecto de este tipo
se usan diferentes aplicaciones software en cada etapa que pueden ser estadsticas, de
visualizacin de datos o de inteligencia artificial, principalmente. Actualmente existen
aplicaciones o herramientas comerciales de data mining muy poderosas que facilitan el
desarrollo de un proyecto. Sin embargo, casi siempre acaban complementndose con
otra herramienta.
El avance en los instrumentos utilizados para la minera de datos le ha ido dando varios
nombres a esta accin de bsqueda de datos:

Recoleccin de datos alrededor de 1960


Acceso de Datos a inicios de 1980
Almacenamiento de datos y apoyo a las decisiones empresariales a inicios de
los aos 90
Minera de Datos Inteligente a finales de la dcada de los 90.

2.2 SOFTWARE UTILIZADO

2.2.1. MICROSOFT ACCESS

2.2.1.1 DEFINICIN

Access es un programa informtico desarrollado por Microsoft, no forma parte de Office se


lo puede comprar en paquetes espaciales de Microsoft, es una suite ofimtica la cual.
Access es una base de datos relacional, que proporciona una serie de ventajas, entre las que
cabe destacar:

Creacin de tablas para el almacenamiento y la manipulacin de la informacin.


Definicin de relaciones entre tablas.
8

Consultas a mltiples tablas.


Verificacin de la integridad de la informacin

2.2.2. EXCEL

2.2.2.1 DEFINICIN

Excel 2010 es una aplicacin que permite realizar hojas de clculo, que se encuentra
integrada en el conjunto ofimtico de programas Microsoft Office. Microsoft Excel es
una aplicacin bastante amplia, que nos permitir hacer desde las funciones ms
sencillas como sumar o guardar datos, hasta hacer complejas funciones, grficos,
estadsticas, podremos incluso hacer pequeas aplicaciones para la vida cotidiana. Los
archivos de Microsoft Excel se definen como libros, dentro de los cuales hay hojas de
clculo, estas hojas se componen de celdas. Las filas y columnas de cada hoja tienen
una nomenclatura para que cada celda se pueda identificar con coordenadas, las filas se
identifican con nmeros del 1 hasta la 65536 y las columnas se identifican con letras
desde la A hasta la IV. Entonces la identificacin de una celda sera (columna, fila), por
ejemplo, la celda B5 corresponde a la columna B y a la fila 5. Cada celda tiene sus
propiedades, que se pueden cambiar individualmente de acuerdo a nuestras necesidades.

CAPTULO III
METODOLOGA

Para el desarrollo de este trabajo se busca obtener los mejores resultados tanto en
eficiencia como en eficacia acadmicamente, ya que el ejercicio va desde la eleccin de
la base de datos a usarse, hasta las preguntas de cmo siendo usuarios nos
formularamos para la aplicacin de minera de datos. Conforme se realizaba el trabajo
fuimos descubriendo informacin desconocida, adems de conocimiento nuevo a partir
de la prueba y error, nos permiti aprender sobre el uso de Access y Excel, as como
tambin las mltiples aplicaciones que pueden tener los distintos softwares. Lo primero
que realizamos fue obtener nuestra base de datos con ms de 3000 datos planteando la
informacin necesaria dentro de una papelera y la clasificacin que se le deba dar a
cada tipo de informacin. A continuacin, el planteamiento y posterior revisin de las
preguntas a realizarse para conocer la productividad de la papelera, conociendo como
encontrar sus respuestas mediante consultas en Access mediante el diseo de consultas.
A continuacin, los resultados obtenidos los vamos a tratar de hacer ms comprensibles
ara los usuarios transformndolos de valores numricos a grficos usando Excel,
importando de la base de datos las consultas. Despus de esto utilizamos la herramienta
9

de Excel Power Pivot para crear grficos dinmicos utilizando grficos en barra y de
esta manera hacer ms comprensible y fcil las preguntas realizadas para los usuarios.

MINERA DE DATOS

Para la realizacin del proyecto Minera de Datos, es fundamental seguir los pasos que
describiremos a continuacin, nuestro proyecto hace referencia al nmero de Facturas
por mes en el ao 2016.

Pasos para la Base de Datos:

1. Escoger las Base de Datos en Access desde donde la tenemos guardada.

Ilustracin 1 Damos clic en nuestra Base de Datos. (Elaborado por: Grupo 3.-
Minera de datos)

2. Abrimos nuestra base de datos y vamos a crear en la barra de herramientas y


luego escogemos Diseo de Consulta.

Ilustracin 2 Base de datos de la Papelera CRAYON`S. (Elaborado por: Grupo 3.-


Minera de datos)
10

3. Click en Diseo de consultas, se elige la tabla Facturas que se necesita para


realizar la consulta que deseamos y hacemos click en agregar y cerramos.

Ilustracin 3 Escoger la tabla Factura de la base de datos. (Elaborado por: Grupo


3.- Minera de datos)

4. Escogemos de la Tabla Facturas tres veces el campo factura_fecha.

Ilustracin 4 Consulta de la tabla de Factura. (Elaborado por: Grupo 3.- Minera de


datos)

5. Formato para la consulta de la tabla Facturas: por ao, mes y cuenta.


11

Ilustracin 5 Formato para realizar la consulta de la Tabla de Facturas. (Elaborado


por: Grupo 3.- Minera de datos)
6. Damos click en ejecutar y aparecer la consulta sobre el nmero de facturas por
mes en el ao 2016.

Ilustracin 6 Consulta del nmero de Facturas por mes en el ao 2016. (Elaborado


por: Grupo 3- Minera de datos)

Pasos para exportar consultas de ACCESS a EXCEL:

1. Damos click en la consulta que queremos exportar y luego Excel.

Ilustracin 7 Exportar una consulta de access a excel. (Elaborado por: Grupo 3.-
Minera de DATOS)

2. Click en exportar y en abrir archivo, aceptar.


12

Ilustracin 8 Exportar y abrir el archivo de una consulta de access a excel.


(Elaborado por: Grupo 3.- Minera de DATOS)

3. Insertamos grfico y tabla dinmica.

Ilustracin 9 Insertar grfico y tabla dinmica. (Elaborado por: Grupo 3.- Minera
de DATOS)

4. Seleccionar campos que se desea observar en el grfico.

Ilustracin 10 Como se seleccionan campos para el grfico estadstico. (Elaborado


por: Grupo 3.- Minera de DATOS)

5. Aadir etiquetas y guardar el grfico.

Ilustracin 11 Grfico de la consulta exportada de access. (Elaborado por: Grupo


3.- Minera de DATOS)
13

Pasos para exportar consultas de ACCESS a POWER PIVOT:

1. Click en power pivot de Excel, click en administrar.

Ilustracin 12 Comenzar a administrar power pivot. (Elaborado por: Grupo 3.-


Minera de DATOS)

2. Click en De base de datos, DE ACCESS.

Ilustracin 13 Exportar consulta de ACCES a PIVOT. (Elaborado por: Grupo 3.-


Minera de DATOS)

3. Examinar en donde se encuentra el archivo y seleccionarlo.


14

Ilustracin 14 Como escoger la base de datos. (Elaborado por: Grupo 3.- Minera de
DATOS)
4. Click en seleccionar en una lista y escoger la pregunta que deseamos graficar.

Ilustracin 15 Escoger la pregunta de Access a importar. (Elaborado por: Grupo 3.-


Minera de DATOS)

5. Insertar grfico dinmico y seleccionar los campos a graficar.

Ilustracin 16 Paso previo a concluir el grfico dinmico. (Elaborado por: Grupo 3.-
Minera de DATOS)

6. Aadir etiquetas y guardar grfico.


15

Ilustracin 17 Grfico final de exportacin de ACCESS a POWER PIVOT. (Elaborado


por: Grupo 3.- Minera de DATOS)

CAPTULO IV
RESULTADOS OBTENIDOS
El mes en el que se ha emitido ms facturas es en octubre con 532 facturas
totales del ao 2016.
La marca estilo es la marca que ms se ha vendido por mese en el ao 2016.
De la categora libros se han vendidos productos en el ao 2016.
En la mayora de los meses el producto que ms se ha vendido ha sido la tinta de
impresora, excepto en marzo pues se han vendido ms teclados.
En el ao 2016 en el mes de octubre se ha recaudado ms dinero que en los
dems meses teniendo ingresos de $2.820.430,70

CAPTULO V
CONCLUSIONES Y RECOMENDACIONES
5.1 CONCLUSIONES

El programa Access nos ofrece grandes ventajas al momento de recopilar informacin


de una empresa. Para luego de un lapso de tiempo analizar los datos y responder
preguntas que se podra cuestionar el personal administrativo de una empresa, y con
saber cmo mejorar su rendimiento. Y para su mejor comprensin se puede apoyar en el
programa Excel mediante su herramienta Power pivot y con el manejo de tablas y
grficos dinmicos hacer ms comprensible la informacin obtenida para todos los
usuarios de las consultas hechas a la base de datos y as poder tomar decisiones.

Mediante la minera de datos realizada, se pudo dar a conocer informacin especfica y


de manera detallada de las consultas hechas a las bases de datos que en una empresa real
hubieran resuelto bastantes preguntas sobre:
16

En que se me obtuvo ms produccin en el ao 2016: Usndola como base para


encontrar un patrn que tiene ese mes y usarlo en los dems para buscar la
misma rentabilidad.
Cual fue el producto, marca o categora ms vendida en el ao 2016: Lo que nos
da indicadores de cules son los productos ms vendidos por el tipo de
proveedor y categora haciendo que tomemos mejores decisiones el momento de
comprar inventario teniendo ms stock de los productos ms vendidos para no
tener productos sin rotacin.
Cual fue el ingreso total de la papelera en el ao 2016: Con esta informacin ya
restando costos y gastos en todo el ao saber mi Utilidad y poder tener
proyecciones para el prximo ao para obtener ms utilidades mejorando costos
conversando con proveedores o reducir gastos haciendo que el personal sea mas
eficiente.

5.2 RECOMENDACIONES

La creacin de una base de datos es un asunto de vital importancia y basado en


los errores tenidos en el proyecto tratado, encontramos razones que causaron
atrasos hemos llegado a las diversas recomendaciones

Siempre relacionar las tablas como sistema de base de datos relacional es muy
importante que tengamos muy claro desde el principio las relaciones que existen
entre tablas y realizarlas, siempre que podamos, nada ms crearlas. No lo dejes
para despus ya que terminamos olvidndolo y con el tiempo nos encontramos
desagradables sorpresas. Al momento de llenar la informacin no tener que
hacer cambios en los modelos fsicos ni lgicos.

Utilizar versiones compatibles, entre Access y Power Pivot las versiones


utilizadas no reconocan los datos por lo que sus consultas no se realizaban de
forma similar.
Utilizar las consultas nos puede servir para recuperar el pequeo volumen de
datos y las necesidades que se suelen manejar en este tipo de aplicaciones, mi
experiencia es que la claridad y la facilidad de mantenimiento compensa un
posible peor rendimiento. Y para mejorar el rendimiento (casi) siempre se est a
tiempo.
Crear copias de seguridad a manera frecuente, aunque como todos los paquetes
de Microsoft tiene una copia de seguridad, pero en caso de llegar a necesitar esta
usualmente no suele ser tan avanzado como en sus plataformas iguales, se debe
el peso que tienen los datos en la misma.

REFERENCIAS BIBLIOGRFICAS

Minera de datos. (2006). Mgter. David Luis la Red Martnez


17

Minera de Datos (2011). Jess Antonio Gonzales Bernal

Microsoft Office Excel (2010). Ebriik.com

Curso Ofimtica Bsica: Microsoft Excel (2010) Cibercentro LA LILA

Base de Datos 1 (2008) Eva Gmez Ballester

Software Libre: Bases de Datos (2005). Rafael Camps Pare

También podría gustarte