Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tesis Datamarts
Tesis Datamarts
Introduccin
Actualmente, en cualquier entidad que procese informacin y que cuente
con una base de datos, sabemos que es necesario que esta se actualice
constantemente, y el propsito de ella es proveer informacin a la empresa
con un adecuado manejo como transformaciones, bsqueda de patrones y
consolidaciones.
Es as como nace el trmino repositorio de datos, que en el mbito de
ingeniera de sistemas es conocido como Datamart, que apoyado en
tcnicas, metodologas y herramientas buscan ofrecer informacin adecuada
para la toma de decisiones.
El presente proyecto de tesis permite ilustrar paso a paso la
implementacin de un Datamart en el Departamento y rea de RR. HH. Del
hospital
FLIX
TORREALVA
DE
ICA,
el
cual
viene
asumiendo
Pgina 1
y los
TESIS II 2010
Pgina 2
TESIS II 2010
CAPITULO I:
Marco Terico
Pgina 3
TESIS II 2010
I.
con
diferentes
insignias,
descripciones
y
1
los maya/
Pgina 4
TESIS II 2010
Siebel,
Peoplesoft).
Estas
aplicaciones
funcionalmente
pobre.
Existan
no
haba
aplicaciones
que
facilitasen
su
explotacin.
- En 1989: Introduccin del trmino Business Intelligence
(Howard Dresner).
- En 1990: Business Intelligence 1.0. Proliferacin de
mltiples
aplicaciones
BI.
Estos
proveedores
empresas
empezaron
interesarse
en
las
Pgina 5
TESIS II 2010
en
informacin
anecdtica,
incompleta
de
los
problemas,
sino
tambin
de
las
oportunidades .
Segn Pea (2006), el trmino Inteligencia de Negocios
procura caracterizar una amplia variedad de tecnologas,
plataformas de software, especificaciones de aplicaciones y
procesos. El objetivo primario de la a Inteligencia de Negocios
es contribuir a tomar decisiones que mejoren el desempeo
de la empresa y promover su ventaja competitiva en el
mercado. En resumen, la Inteligencia de Negocios faculta a la
organizacin a tomar mejores decisiones ms rpidas. Este
concepto se requiere analizar desde tres perspectivas: Hacer
mejores
decisiones
ms
rpido,
convertir
datos
en
Pgina 6
TESIS II 2010
Accesibilidad a la informacin
Pgina 7
TESIS II 2010
Pgina 8
TESIS II 2010
Pgina 9
TESIS II 2010
recursos humanos.14
La solucin DataMart desarrollada por Oracle Consulting
proporciona la puesta en marcha de un entorno Business
Intelligence & Warehouse especifico para el rea de recursos
Humanos en solo 16 semanas, basado en la plataforma
tecnolgica de Oracle y en sus herramientas de explotacin y
manejo de informacin. Son la respuesta a la problemtica
relacionada con la disponibilidad de la informacin, aportando
un entorno integral que cubre el ciclo completo de gestin de
la informacin: adquisicin, almacenamiento e historizacin,
homogeneidad,
modelado,
trasformacin,
acceso
Pgina 10
TESIS II 2010
BI16.
Se ha confirmado que, al disponer de toda la informacin
histrica de gastos consolidada , desde 2002, el usuario tiene
mayor capacidad de detectar tendencias de gasto mediante
los cuadros de mando, de generarse informes ad-hoc para
complementar los mismos, y una exploracin mucho ms
dinmica de toda la informacin, tanto histrica como actual,
mediante un solo visor multidimensional. Con todo ello, se
est pudiendo ajustar los presupuestos de gasto del ejercicio
en curso, y planificar de una forma ms eficiente los de
ejercicios futuros.
Chile17
La empresa se encarga de:
Modelamiento de DataWarehouse
Creacin
de
Bases
de
datos
Relacionales,
Pgina 11
TESIS II 2010
transaccionales
su
Datawarehouse.
Anlisis,
Diseo
Implementacin
de
un
pueden
implementar
para
satisfacer
sus
Pgina 12
TESIS II 2010
Bases Tericas
La existencia de los Data Marts crea nuevas formas de
pensar cuando se disean repositorios corporativos de datos.
Algunas de ellas reemplazan definitivamente el concepto de
DataWarehouse, por varios Data Marts que se van alimentar de
los sistemas operacionales. Otras utilizan los Data Marts como
complemento de los DataWarehouse, quiere decir que de estos
mueven la informacin hacia varios Data Marts con el fin de
permitir un anlisis ms eficiente. La separacin de los datos
se hace tomando criterios como que departamentos utilizan
una informacin, el lugar, tiempo, etc. Los Data Marts se
implementan antes que el Data Warehouse, como un plan
piloto, siendo el conjunto de Data Marts especficos orientados
al Data Warehouse. Y solo personal autorizado debe trabajar
con las bases de datos y acceso a los Data Marts 20.
En la mayora de las empresas del Per y del mundo se
puede apreciar que muchas ya cuentan de una u otra manera
con diferentes Data Marts, los cuales ayudan a la empresa a
tomar decisiones, por que las empresas de hoy necesitan
constantemente de consumir informacin para poder sobrevivir.
Sin embargo muchos de estos Data Marts fueron creados
enfocados en los datos y no en las necesidades de informacin
de los usuarios.
Pgina 13
TESIS II 2010
2.2.1 Pasos para implementar un DATAMARTS21
Paso 1: Identificar los temas de anlisis.
Esta tarea consiste en definir los temas y sus respectivos
indicadores que sern analizados y explotados por los
usuarios, por ejemplo:
Tema: Ventas en una farmacia.
Indicadores: Cantidad Vendida, Precio Unitario, Total,
Descuento, IGV, etc.
Paso 2: Identificar las dimensiones de Informacin
Las dimensiones de Informacin es la forma cmo el
usuario podr agrupar la Informacin.
Las dimensiones siempre deben responder una de estas
6 preguntas: A Quin, Dnde, Cundo, Qu, Cmo y A quien.
Recuerde que el usuario siempre necesitar que el Data
Marts le responda cualquiera de estas preguntas con la
finalidad de poder tomar dediciones mas acertadas.
Paso 3: Elaboracin del Modelo Multidimensional Bsico
Con ayuda de alguna herramienta CASE, deber disear
un modelo multidimensional capaz de soportar cualquiera de
las consultas que los usuarios puedan hacer en un futuro al
Data Marts.
El esquema empleado como Copo de Nieve, Estrella o
cualquiera de los derivados como constelacin de estrellas,
tormenta de nieve, etc., depender de la herramienta de
explotacin que estn utilizando.
Paso 4: Elaboracin del Modelo Multidimensional Complejo
Pgina 14
TESIS II 2010
Pgina 15
TESIS II 2010
de
datos
en
blanco
con
las
caractersticas
programas
de
ETL
deben
cumplir
con
las
Pgina 16
TESIS II 2010
que se requeran.
usuarios
conozcan
los
diferentes
modelo
multidimensionales de la empresa.
b. La Herramienta de explotacin.- Se dice que los
usuarios solo utilizan el 20% de las opciones que
cuentan las herramientas de explotacin por falta de
capacitacin.
c. Las herramientas de gestin.- Los usuarios deben
ser constantemente capacitados en herramientas de
gestin como creacin de Dashboard, Scorecard, etc.
Tipos de Datamart22:
Pgina 17
TESIS II 2010
basarse
en
un
simple
extracto
del
Pgina 18
TESIS II 2010
de
escalabilidad.
Por
otro
lado,
las
ms escalables y son
almacenando
los
datos
multidimensionalmente.
ROLAP:
Relational OLAP. Tanto los datos pre calculados y
agregados como los datos fuente residen en la misma
base de datos relacional. Si el datawarehouse es muy
grande o se necesita rapidez por parte de los usuarios
puede ser un problema.
HOLAP:
Hybrid OLAP: es una combinacin de los dos
anteriores. Los datos agregados y pre calculados se
almacenan en estructuras multidimensionales y los de
menor nivel de detalle en el relacional. Requiere un
Pgina 19
TESIS II 2010
Respuestas
rpidas
por
el
menor
volumen
de
informacin.
24
Metadatos
Uno de los componentes ms importantes de la
arquitectura de un almacn de datos son los metadatos.
Pgina 20
TESIS II 2010
datos,
debe
contener
toda
la
informacin
concerniente a:
Tablas
Columnas de tablas
Entidades y Relaciones
procesos
Pgina 21
TESIS II 2010
Marco Conceptual
Data Marts25
Es una versin especial de almacn de datos. Ayudan
a un rea especfica dentro de un negocio para tomar
mejores decisiones. Es un sistema orientado a la
consulta, en el que se producen procesos batch de carga
de datos (altas) con una frecuencia baja y conocida. En
sntesis, se puede decir que los DATAMARTS son
pequeos data warehouse centrados en un tema o rea
de negocio especifico dentro de una organizacin.
Toma de decisiones26
La toma de decisiones es el proceso mediante el cual
se realiza una eleccin entre las alternativas o formas
para resolver diferentes situaciones de la vida, estas se
pueden presentar en diferentes contextos: a nivel laboral,
familiar, sentimental, empresarial (utilizando metodologas
Pgina 22
TESIS II 2010
ellas.
bsicamente,
La
en
toma
elegir
de
una
decisiones
alternativa
consiste,
entre
las
Integracin de datos27
Integracin de datos se refiere al estado de integrar de
diferentes bases de datos y se vuelva en un solo formato.
Los SGBD relacional deben encargarse de mantener la
integridad de los datos almacenados en una base de
datos
con
respecto
las
reglas
predefinidas
restricciones.
Gestin Hospitalaria29
Gestin Hospitalaria, pueden de acuerdo a los
tratadistas, acotarse a 6 grandes tems:
Interrelaciones personales
Los enfermos
Pgina 23
TESIS II 2010
Pgina 24
TESIS II 2010
CAPITULO II:
Planteamiento
del problema
Pgina 25
TESIS II 2010
II.
Pgina 26
TESIS II 2010
basndose en nuevos y diversos criterios, por lo que se recurre al rea de
informtica y se le solicita algunos cambios en los reportes. Vemos que hay una
dependencia con el rea de informtica y la inflexibilidad con la que se puede
obtener la informacin.
La indisponibilidad de informacin inmediata que tiene el
responsable del rea, de tener el conocimiento adecuado. El tener
que depender de procesos repetitivos. El percibir al negocio en
trminos estadsticos y no criterios analticos para identificar
conocimiento. Ubicado en Av. Cutervo 104, Telfono: 034234450, Departamento: Ica, Provincia: Ica, Distrito: Ica.
2.2
Problema General
En que medida el desarrollo de un DATAMART como
herramienta de gestin va a ayudar a la toma de decisiones en el
rea de RR. HH. del hospital FLIX TORREALVA GUTIRREZ?
Problemas Especficos
En que medida la utilizacin de un DATAMART optimiza la
toma de decisiones en la gestin del rea de RR. HH.?
Pgina 27
TESIS II 2010
B. Relevancia social
Visto que la informacin manejada en el rea de RR.HH gira en
torno a la comunidad hospitalaria es de vital importancia tener
una correcta administracin de ella, ya que permitir que
doctores, administrativos, pacientes, autoridades componentes
y pblico en general puedan beneficiarse de esta informacin
en el momento que lo requieran.
2.4 Objetivos
Objetivos Generales
Desarrollar un Data Mart para el rea de recursos humanos
del hospital Flix Torrealva Gutirrez con el fin de realizar
consultas de forma rpida y en el momento oportuno para
facilitar la toma de decisiones.
Objetivos Especficos
OE1: Comprobar que la utilizacin de un DATAMART permite
optimizar la toma de decisiones.
Pgina 28
TESIS II 2010
Pgina 29
TESIS II 2010
CAPITULO III
Metodologa
Pgina 30
TESIS II 2010
III.
O1
O2
GC
O3
--
O4
Pgina 31
TESIS II 2010
CAPITULO IV:
De Los Instrumentos
De Investigacin
Pgina 32
TESIS II 2010
IV.
+5, -1
+4, -2
+5, -1
+4, -2
Pgina 33
TESIS II 2010
+5, -1
+4, -2
Pgina 34
TESIS II 2010
Fichas de Observacin
Titulo:
Gutirrez
Gutirrez
Descripcin
El problema que podemos observar en el rea de RR. HH. del
hospital en estudio es que requiere de informacin rpida y en un
momento determinado por lo que se apersona al rea de
informtica donde ellos destinan mucho tiempo a la elaboracin
de reportes. Tambin hay ocasiones en donde piden un informe y
al poco tiempo van modificando su peticin por lo que el rea de
informtica emplean tiempo adicional para volver a realizarlo.
En una entrevista con los responsables del rea de RR. HH. se
supo que la informacin con la que cuentan es a modo de
reportes donde se visualizan nmeros que informan como van
trabajando el personal que tienen a cargo. Adicionalmente a los
reportes existentes, constantemente surgen necesidades para
obtener informacin basndose en nuevos y diversos criterios, por
lo que se recurre al rea de informtica y se le solicita algunos
cambios en los reportes. Vemos que hay una dependencia con el
rea de informtica y la inflexibilidad con la que se puede obtener
la informacin.
Pgina 35
TESIS II 2010
4.2
Pgina 36
TESIS II 2010
CAPITULO V:
Contrastacin de las
hiptesis
Pgina 37
TESIS II 2010
V.
Pgina 38
TESIS II 2010
Antes
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Despus
30
30
31
45
24
21
30
20
25
26
27
23
22
16
25
25
25
29
22
23
25,95
33
21
37
39
25
31
35
33
23
28
26
25
36
32
46
39
31
33
30
40
32,15
d
-3
9
-6
6
-1
-10
-5
-13
2
-2
1
-2
-14
-16
-21
-14
-6
-4
-8
-17
-124
= -6.2
27,0251734
Pgina 39
TESIS II 2010
E. Resultado De La Prueba:
= - 1,02597835
Hiptesis 1:
Ha: La utilizacin de un DATAMART optimiza la toma de
decisiones en la gestin del rea de RR. HH.
Pgina 40
TESIS II 2010
Hiptesis 2:
Ha: El sistema de Gestin actual utilizado en el rea de RR.
HH del hospital Flix Torrealva no esta integrada y dificulta la
toma de decisiones.
Dificulta
15
0.75
No dificulta
0.25
TOTAL
20
Pgina 41
TESIS II 2010
E. Resultados de la prueba
Pgina 42
TESIS II 2010
CAPITULO V:
Presentacin,
interpretacin y
discusin de los
resultados de la
investigacin
Pgina 43
TESIS II 2010
PRESENTACIN E INTERPRETACIN
Cuadro N 1: Comparacin de puntajes entre el sistema actual y
el Datamart
Antes
Despus
d
30
33
-3
30
21
31
37
-6
45
39
24
25
-1
21
31
-10
30
35
-5
20
33
-13
25
23
10
26
28
-2
11
27
26
12
23
25
-2
13
22
36
-14
14
16
32
-16
15
25
46
-21
16
25
39
-14
17
25
31
-6
18
29
33
-4
19
22
30
-8
20
23
40
-17
25.95
32.15
-124
Pgina 44
TESIS II 2010
Figura 1
Interpretacin:
Cuadro N 2
Actitudes
Dificulta
15
75%
No dificulta
25%
TOTAL
20
100%
Pgina 45
TESIS II 2010
Figura 2
Pgina 46
TESIS II 2010
B:
PRESENTACIN
DE
ALGUNAS
CUESTIONARIO N 1 Y N 2
PREGUNTAS
DEL
Totalmente de
acuerdo
30%
De acuerdo
20%
Indiferente
25%
En desacuerdo
15%
Totalmente en
desacuerdo
10%
20
100%
TOTAL
FIGURA N 3
Pgina 47
TESIS II 2010
Totalmente de
acuerdo
25%
De acuerdo
10%
Indiferente
10%
En desacuerdo
20%
Totalmente en
desacuerdo
35%
20
100%
TOTAL
FIGURA N 4
Pgina 48
TESIS II 2010
Actitudes
Totalmente de
acuerdo
5%
De acuerdo
15%
Indiferente
10%
En desacuerdo
30%
Totalmente en
desacuerdo
40%
20
100%
TOTAL
FIGURA N 5
Pgina 49
TESIS II 2010
Totalmente de
acuerdo
20%
De acuerdo
10%
Indiferente
20%
En desacuerdo
30%
Totalmente en
desacuerdo
20%
20
100%
TOTAL
FIGURA N 6
Pgina 50
TESIS II 2010
Pgina 51
TESIS II 2010
Si no est
disponibles.
3.- El programador va a personal y
verifica el horario del medico
horarios
buscar
departamento
Pgina 52
TESIS II 2010
Pgina 53
TESIS II 2010
Tarjetero,
personal
de
control
no
oficializada.
- Lactancia
-Maternidad o gravedad.
-Onomstico.
-Refrigerio.
-Enfermedad personal.
-Fallecimiento familiar.
-Licencias personales.
-Motivos
Pgina 54
personales
TESIS II 2010
particulares.
4.- El personal de control de asistencia
entrega este informe al jefe de personal
4.- El jefe de personal registra tardanza
y permisos en la base de datos.
5.-El jefe de personal registra planilla de
pagos en la base de datos.
Pgina 55
TESIS II 2010
Pgina 56
TESIS II 2010
Pgina 57
TESIS II 2010
BASE DE DATOS
Pgina 58
TESIS II 2010
MODELO DIMENSIONAL
Pgina 59
TESIS II 2010
de
la
informacin:
adquisicin,
almacenamiento
Pgina 60
TESIS II 2010
CONCLUSIONES:
1.
El
diseo
del
Datamart
tiene
mejora
pero
no
Pgina 61
TESIS II 2010
RECOMENDACIONES
Pgina 62
TESIS II 2010
VI.
Referencias Bibliogrficas
1. Fernndez L, (2005). Monografias.com S.A. Principios De Data Mining
monografias.com Microsoft Internet Explorer, [fecha de acceso 2009], URL
disponible
en:
http://www.monografias.com/trabajos26/data-mining/datamining.shtml
2. Nakasone N, 1998 Fundamentos de Aplicaciones, Business Intelligence
CYBERTEC
3. Microsoft BI, (2009), Breve historia del Business Intelligence Windows Internet
Explorer
[fecha
de
acceso
2009]
http://www.businessintelligence.info/definiciones/historia-business-intelligence.html
4. Huamantumba R, (2007), Data mart Paso a Paso, rayner datamart. pdf, [fecha de
acceso 2009] http://www.raynerhd.com/wp-content/uploads/rayner-datamart.pdf
5. Calzada L, Abreu J, (2009), El impacto de las herramientas de inteligencia de
negocios en la toma decisiones en los ejecutivos, [fecha de acceso 2009];
http://www.spentamexico.org/revista/volumen4/numero%202/6.%204(2)%201652.pdf
6. Todo Bi, (2005) Business Intelligence, Data Warehouse, CRM Y Mucho Mas:
Microsoft
Internet
Explorer,
[fecha
de
accesos
2009]
http://todobi.blogspot.com/2005_05_01_archive.html
7. Oporto S, (2008) Class 12 lifecycle Data warehouse.ppt, [fecha de acceso 2010]
http://es.ask.com/web?q=Douglas+Hackney+datamart&qsrc=1&o=312&l=dir&dm=all
8. Chacn J, Magaa L, Montoya J. (2009), Data Warehouse [fecha de acceso
2010] http://www.docstoc.com/docs/19978854/Data-warehouse/
9. Fernndez C, (2008), Nigel Pendse | Dataprix [fecha de acceso 2010)
http://www.dataprix.com/en/category/tags/nigel-pendse-0
10. Reyes M, Rosales P, (2007), Desarrollo de un datamart de informacin
acadmica de estudiantes de la escuela de ciencias y sistemas de la facultad de
ingeniera de USAC - Windows Internet Explorer [fecha de acceso 2009],
Guatemala http://biblioteca.usac.edu.gt/tesis/08/08_7974.pdf
11. Velasquez J, (2007) Diseo y Construccin de un Data Mart para la Mantencin
de Indicadores de Sostenibilidad de la Industria del Salmn, [fecha de acceso 2009]
http://www.sistemasdeingenieria.cl/isci/index.php?seccion=casos&id_caso=8
12. Tapia I, (2006). Una metodologa para sectorizar pacientes en el consumo de
medicamentos aplicando Datamart y Dataming en el Hospital Nacional, Windows
Internet
Explorer,
Lima
Per
[fecha
de
acceso
2009]
http://www.cybertesis.edu.pe/sisbib/2006/tapia_ri/html/index-frames.html
13. Vizuete W, Yela C, (2006). Anlisis, diseo e implementacin de un Datamart
para el rea de Sismologa del departamento de Geofsica de la Escuela Politcnica
Pgina 63
TESIS II 2010
Nacional.
Quito
Marzo
[fecha
de
http://bibdigital.epn.edu.ec/bitstream/15000/177/1/CD-0566.pdf
acceso
2009]
14. Solutions Pack, Oracleconsulting, Servicio de implantacin rpida del Data mart
de
recursos
humanos,
[fecha
de
acceso
2009];
http://www.oracle.com/global/es/consultoria/Brochure-DatamartdeRRHH.pdf
15. Stratebi Business Solutions, Casos de xito, Marzo (2009),
http://www.stratebi.es/CasosExito/Gob.%20Rioja,%20Cons.%20ViviendaStratebi%20Caso%20de%20Exito.pdf
16. Stratebi Business Solutions, Casos de xito, septiembre 2009,
http://www.stratebi.es/CasosExito/CSICStratebi%20Caso%20de%20Exito.pdf
17. DATAMART S.A::: (2005) Data Mart S.A. The Business Intelligence
Company:::.. Servicios Microsoft Internet Explorer [fecha de acceso 2009]
Http://Www.Datamart.Cl/Services.Html
18.
Nez
R,
Uposoft
Sistemas
Informaticos
http://Www.Upsoft.Com.Ar/Site/Paginas/Secc_Productos.Aspx?Lang=Es
Argentina
2008,
24. Wikipedia, Almacn de datos, modificada por ltima vez el 15:07, 23 ene 2010,
Licencia Creative Commons http://es.wikipedia.org/wiki/Almacn_de_datos.
25. Wikipedia. Datamart-wilkipedia, la enciclopedia libre - Windows Internet
Explorer. Esta pgina fue modificada por ltima vez el 17:07, 19 ene 2010
http://es.wikipedia.org/wiki/Data_mart
26. Wikipedia, Toma de decisiones, Esta pgina fue modificada por ltima vez el
21:10, 19 ene 2010. http://es.wikipedia.org/wiki/Toma_de_decisiones
27. ALEGSA. Definicin de Integridad de datos - que es integridad de datosMicrosoft
Internet
Explorer,
http://www.alegsa.com.ar/Dic/integridad%20de%20datos.php
Pgina 64
TESIS II 2010
28. The British Standards Institution (2010) Qu son sistemas de gestin? Microsoft
Internet
Explorer
http://www.bsigroup.com.mx/es-mx/Auditoria-yCertificacion/Sistemas-de-Gestion/De-un-vistazo/Que-son-los-sistemas-de-gestion/
[fecha de acceso 2010]
29. Cerda O, gestin hospitalaria - Windows Internet Explorer [fecha de acceso
2010]
http://74.125.113.132/search?q=cache:8evHPSaTWpkJ:prematuros.cl/gestion1/gesti
onormalizacion/modelogestionhigueras.doc+concepto+de+gestion+hospitalaria&cd=
2&hl=es&ct=clnk&gl=pe
Pgina 65