Está en la página 1de 6

Aplicación de DataWarehouse

Hugo Alexander Pérez Enríquez

Administración de Base de Datos, Instituto De Educación Superior Tecnológico

Puno, Perú

70373512@unitekpuno.edu.pe

RESUMEN

La técnica de almacenamiento de datos como el DataWarehouse junto con DataMining son


metodologías con Algoritmos, que ayudan a las empresas a mejorar sus tomas de decisiones, este
Algoritmo ayuda mucho y ayuda a Inferir, muchos datos de los que necesitamos información, ya sean,
rendimiento, situación demográfica, socioeconómica, etc.

Al mismo tiempo el Aprendizaje automático, que necesita cada trabajador también juega un papel muy
importante para poder adquirir y manejar, hacer uso de esta información de manera correcta, sin
embargo, el Algoritmo, ayuda a Inferir cada dato de manera correcta para lo cual, para las empresas es
de mucha ayuda debido a que el Aprendizaje automatico es una cualidad que en estos tiempos es
requisito indispensable.

Sin embargo, el Algoritmo tiene la dificultad en implementar con esta herramienta viene dada por su
misma naturaleza libre (open source) y su poco tiempo en producción. Por esta razón, el presente
proyecto dará pautas para la utilización e instalación de esta suite, para lo cual el Aprendizaje
automática es muy necesario, lo cual servirá de base para proyectos similares que deseen implementar
proyectos con ella.

Se espera que, con este trabajo se apoyará a los directivos para una mejor Inferir, una mejor Toma de
Decisiones, por medio de un Algoritmo de un Sistema de Información orientado para este fin y
entonces se pueda tener una visión más sistémica e integral sobre los Recursos de inversión en los
proyectos que se desarrollan.

PALABRAS CLAVE: Aprendizaje automático, Algoritmo, Inferencia.

ABSTRACT

The data storage technique such as DataWarehouse together with DataMining are methodologies with
Algorithms, which help companies to improve their decision-making, Algorithm helps a lot and helps
to Inference, a lot of data from which we need information, whether, performance, situation
demographic, socioeconomic, etc.
At the same time, Machine Learning, which each worker needs, also plays a very important role to be
able to acquire and manage, make use of this information correctly, however, the Algorithm, helps to
infer each data correctly for which, for companies it is very helpful because Machine Learning is a
quality that is an essential requirement in these times.
However, the algorithm has the difficulty to implement with this tool due to its free nature (open
source) and its short time in production. For this reason, this project provides guidelines for the use and
installation of this suite, which is why Machine Learning is very necessary, which serves as the basis
for similar projects that wish to implement projects with it.
It is hoped that, with this work, managers will be supported for a better Infer, a better Decision Making,
by means of an Algorithm of an Information System oriented for this purpose, and then a more
systematic and comprehensive vision of the Investment resources in the projects that are developed.
KEYWORDS: Machine learning, Algorithm, Inference.

INTRODUCCIÓN

Actualmente, las empresas deben innovar sus procesos internos en el menor tiempo posible y esto lo
pueden lograr por medio de respuestas inmediatas y precisas en la obtención de información para poder
efectuar una toma de decisiones acertada.

Por lo que es deseable, algo que reduzca el tiempo y esfuerzo para realizar este proceso. Por esto se
propone un Sistema de Información basado en un Almacén de datos que muestre los diferentes
proyectos, con su respectiva información requerida para proporcionarla en forma más rápida y
actualizada para toma de decisiones.

Los sistemas de información creados pensando en las necesidades y características particulares del
usuario contribuyen a que este proceso de toma de decisiones, muchas veces ligado a salvar vidas
humanas, utilice la mejor y mayor información disponible. Es, por esto, importante resaltar la
necesidad de contar con sistemas de información creados especialmente para diferentes sistemas
administrativos, considerando todos los detalles que servirán de apoyo durante el proceso de toma de
decisiones a distintos niveles de la administración hospitalaria. En contraste, parece imposible crear un
único sistema de información que resuelva la problemática entera, es decir, que integre cada sub-
proceso, por lo que debe considerarse que existen diversas fuentes de información distintas, de cada
uno de los diferentes sistemas, con diferentes estándares o formas de representar los datos.

En conclusión, el directorio será capaz de: planificar sus metas, tomar decisiones para prevenir eventos
adversos, responder a situaciones imprevistas, cambios en la demanda de servicios; mejorar la calidad
teniendo en cuenta comparaciones con cifras anteriores, siendo posible medir los cambios en los
indicadores de calidad y eficiencia de gestión y analizando el impacto de sus decisiones de forma
directa

También se mejorará la productividad y de todo el personal ya que se evitarán largos periodos de


espera hasta la toma de decisiones que beneficien el trabajo l directorio podrá analizar la manera en que
sus decisiones benefician a sus trabajadores. Finalmente, la organización no sólo acumulará datos
constantemente, sino que también acumulará y analizará consistentemente la información.

MATERIAL Y MÉTODOS

Se indica que los procesos de ingeniería son iterativos, ya que una vez puestos en producción, los
proyectos son continuamente mejorados dadas las sugerencias de la comunidad que usa el producto.
Cada iteración produce una nueva versión del producto, y el producto final va madurando y mejorando.

Metodología LGS, la cual fue propuesta por Leopoldo Galindo [Galindo, 2002] y que fue la que se
aprendió en las asignaturas de la maestría. Se explican las actividades de: Análisis, Diseño,
Construcción, Implantación, así como la de Operación y Mantenimiento. También, se sugieren algunas
posibles técnicas y herramientas que hacen posible su desarrollo.

Fase I.- Análisis, esta etapa constituye, la primera fase del Ciclo de Vida del Sistema de Información y
se enfoca totalmente al intento de seccionar un posible problema en las partes que lo conforman para
intentar comprenderlo, así como desarrollar soluciones de carácter general que fuesen aplicables.

Fase II Diseño. - Es la segunda etapa del Ciclo de Vida de un Sistema de Información, se reciben los
productos finales del análisis (es decir, la Propuesta General de Solución) y fundado en ellos,
"Traduce", los lineamentos que de ahí emanan en postulados de carácter técnico, que sirvan de guía a
las etapas posteriores, sin perder nunca de vista el contexto determinado, por el concepto de sistema
aprobado en la propuesta del análisis.
Fase III: Construcción. - Es la etapa donde se escriben o desarrollan los programas o procesos en la
computadora es normalmente la actividad individual más operativa (e incluso tediosa), en el desarrollo
de un sistema de información basado en computadoras. Fase IV: Implantación. La implantación o
instalación del sistema tiene que ver, en primera instancia, con las consideraciones de hardware y
software del mismo y usualmente, se lleva a cabo con posterioridad a la prueba del sistema.

Fase V: Operación y Mantenimiento. La etapa de operación del sistema, es aquélla en la cual el sistema
instalado, se transfiere del área de desarrollo a la de operación y queda totalmente bajo control de la
instancia encargada de la producción.
RESULTADOS Y DISCUSIÓN

Se obtuvieron diferentes clasificaciones mediante la utilización (preferentemente) de técnicas de


clustering, según diferentes criterios de agrupación de los datos.

Se ha podido comprobar las grandes ventajas de la utilización de tecnologías y software de última


generación que soportan sistemas multiplataforma. Se hace notar que los resultados logrados son sólo
la etapa preliminar de los diversos estudios que se tiene previsto realizar, incorporando las demás
variables del DW. Se tiene previsto desarrollar las siguientes líneas futuras de acción

Avanzar en la investigación con la utilización de minería de datos como ser redes neuronales, redes
bayesianas, arboles de decisión, etc., aplicadas al almacén de datos utilizado hasta ahora generalmente
con las técnicas de clustering.

Aplicar las técnicas de minería de datos utilizadas, pero sobre otras bases de datos de alumnos de otras
asignaturas y carreras para comparar los resultados obtenidos.

CONCLUSIONES

La creación de un Data Warehouse previa a el desarrollo de los Data Marts, según la arquitectura
planteada por Inmon, ayuda a que tenga toda su información consolidada y ordenada en un solo lugar,
lo cual es muy importante en este tipo de organizaciones debido a la sensibilidad e importancia de la
información, y brinda coherencia entre todos los Data Marts, pues estos partirían desde una misma
fuente de información.

Es importante ubicar en cada momento las diferentes fuentes de información y seleccionar de manera
adecuada que información puede ser interesante y que junto con otras informaciones permita tenerse un
enfoque sistémico de toda la información procesada y de esta manera se pueda tener una toma de
decisiones lo mas asertiva posible.

Tener todos los datos consistentes y ordenados en el Data Warehouse brinda una fuente confiable y
estandarizada para el desarrollo de futuros Data Marts o para la ampliación del alcance de los
existentes, facilitando el desarrollo de estos.
REFERENCIAS

[1] G. P. Díaz, Citas y referencias bibliográficas, Pontificia Universidad Javeriana, 2005.


[2] F. Moreno, N. Marthe y L. A. Rebolledo, Cómo escribir textos académicos según normas
internacionales, Universidad del Norte, 2010.

También podría gustarte