Está en la página 1de 74

UNIVERSIDAD TCNICA PARTICULAR DE LOJA

La Universidad Catlica de Loja


MODALIDAD ABIERTA Y A DISTANCIA

Departamento de Ciencias de la Computacin y Electrnica


Seccin Tecnologas Avanzadas de la Web y SBC

Base de Datos Avanzada


Gua didctica
4 crditos

Titulacin
Ingeniero en Informtica

Ciclo

Autores:

Ing. Juan Carlos Morocho


Ing. Mara Eugenia Enrquez
Estimado estudiante recuerde que la presente gua didctica est disponible en el EVA en formato PDF interactivo,
lo que le permitir acceder en lnea a todos los recursos educativos.

18506

Asesora virtual:
www.utpl.edu.ec

BASE DE DATOS AVANZADA


Gua didctica
Juan Carlos Morocho
Mara Eugenia Enrquez

UNIVERSIDAD TCNICA PARTICULAR DE LOJA


CC Ecuador 3.0 By NC ND
Diagramacin, diseo e impresin:
EDILOJA Ca. Ltda.
Telefax: 593-7-2611418
San Cayetano Alto s/n
www.ediloja.com.ec
edilojainfo@ediloja.com.ec
Loja-Ecuador
Primera edicin
Sptima reimpresin
ISBN-978-9942-08-031-8

Esta versin impresa, ha sido acreditada bajo la licencia Creative Commons Ecuador 3.0 de reconocimiento -no comercial- sin obras derivadas;
la cual permite copiar, distribuir y comunicar pblicamente la obra, mientras se reconozca la autora original, no se utilice con fines comerciales
ni se realicen obras derivadas. http://www.creativecommons.org/licences/by-nc-nd/3.0/ec/
Abril, 2015

2. ndice
2. ndice................................................................................................................................. 3
3. Introduccin.................................................................................................................... 5
4. Lineamientos generales del modelo educativo basado en competencias
y crditos acadmicos UTPL-ECTS......................................................................... 6
4.1. Competencias genricas............................................................................................. 7
4.2. Competencias especficas........................................................................................... 7

5. Bibliografa..................................................................................................................... 8
5.1. Bsica......................................................................................................................... 8
5.2. Complementaria ........................................................................................................ 8

6. Orientaciones generales para el estudio........................................................... 10


7. Proceso de enseanza-aprendizaje para el logro de competencias..... 13
PRIMER BIMESTRE
7.1. Competencias genricas............................................................................................. 13
7.2. Sistema de evaluacin de la asignatura (primero y segundo bimestres).................. 15
7.3. Orientaciones especficas para el aprendizaje por competencias............................... 16

Unidad 1: Metodologa para el desarrollo de bases de datos..................................................... 16


1.1. Introduccin a la metodologa de diseo de bases de datos..................................... 16
1.2. Panormica de la metodologa de diseo de la base de datos ................................. 17
Autoevaluacin 1.................................................................................................................. 20

Unidad 2: Metodologa: diseo fsico de bases de datos relacionales......................................... 21


2.1. Comparacin del diseo lgico y del diseo fsico de bases de datos....................... 21
2.2. Metodologa de diseo fsico de bases de datos relacionales.................................... 21
Autoevaluacin 2.................................................................................................................. 26

Unidad 3: Metodologa: monitorizacin y optimizacin del sistema final................................... 27


3.1. Desnormalizacin e introduccin de redundancia controlada .................................... 27
3.2. Monitorizacin del sistema para mejorar el rendimiento........................................... 29
Autoevaluacin 3.................................................................................................................. 32

Unidad 4: Seguridad............................................................................................................... 33
4.1. Seguridad de la base de datos................................................................................... 33
4.2. Contramedidas: controles informatizados.................................................................. 34
4.3. Seguridad en el SGBD de Microsoft Office Access y en el SGBD Oracle.................... 34
4.4. Seguridad de un SGBD en entornos Web................................................................... 35
Autoevaluacin 4.................................................................................................................. 37

SEGUNDO BIMESTRE
7.4. Competencias genricas............................................................................................. 39
7.5. Orientaciones especficas para el aprendizaje por competencias............................... 41

Unidad 5: Gestin de transacciones......................................................................................... 41


5.1. Soporte de transacciones........................................................................................... 41
5.2. Control de concurrencia.............................................................................................. 42
5.3. Recuperacin de la base de datos.............................................................................. 42
5.4. Modelos avanzados de transacciones........................................................................ 42
Autoevaluacin 5........................................................................................................ 45

Unidad 6: Procesamiento de consultas..................................................................................... 46


6.1. Panormica del procesamiento de consultas.............................................................. 46
6.2. Descomposicin de consultas..................................................................................... 46
6.3. Numeracin de las estrategias de ejecucin alternativas........................................... 48
Autoevaluacin 6........................................................................................................ 49

Unidad 7: Conceptos de almacenes de datos............................................................................ 50


7.1. Introduccin a los almacenes de datos...................................................................... 50
7.2. Arquitectura de un almacn de datos......................................................................... 51
7.3. Flujos de datos en un almacn de datos.................................................................... 53
Autoevaluacin 7........................................................................................................ 54

Unidad 8: Diseo de almacenes de datos................................................................................. 55


8.1. Diseo de la base de datos para un almacn de datos.............................................. 55
8.2. Modelado de la dimensionalidad............................................................................... 56
8.3. Metodologa de diseo de bases de datos para almacenes de datos........................ 56
Autoevaluacin 8........................................................................................................ 60

8. Solucionario.................................................................................................................... 61
8.1. Solucin a las preguntas de ensayo........................................................................... 69

9. Anexos.............................................................................................................................. 73

Gua didctica: Base de Datos Avanzada

PRELIMINARES

3. Introduccin
La asignatura de Base de Datos Avanzada se dicta en quinto ciclo de la carrera de Ingeniera en Informtica,
tiene una valoracin de cuatro crditos y forma parte del grupo de materias troncales de la carrera antes
mencionada.
Actualmente el manejo de informacin en las organizaciones ha venido a tomar un papel protagnico, a tal
punto que se han hecho grandes inversiones en tecnologa que permita manipular de forma adecuada uno de
los recursos ms importantes de las organizaciones: los datos; de ah la importancia de esta asignatura.
En cualquier campo de la informtica en la que se desenvuelva, se encontrar con la necesidad de manipular
de alguna manera bases de datos, por ello lo animamo a desarrollar los contenidos de esta materia que le
ayudarn a adquirir los conocimientos y habilidades necesarios para la administracin y explotacin de las
bases de datos de diferente mbito y complejidad.
Esta asignatura es parte de su formacin como ingeniero en informtica y es de vital importancia ya que
se estudian temas que mejorarn sus habilidades en el uso de metodologas para guiar las operaciones,
la prevencin de vulnerabilidades, tambin conocer las configuraciones las avanzadas de base de datos
como las bases de datos distribuidas, conocer tambin temas de inteligencia de negocios orientado al
diseo de almacenes de datos. Todo ello le ayudar en la adquisicin de las competencias necesarias que se
complementan con las adquiridas en la asignatura de Fundamentos de Base de Datos y dems asignaturas de
la malla curricular de la carrera.
Para la presente asignatura se ha planificado el desarrollo de ocho unidades, de la uno a la cuatro se revisar
en el primer bimestre y de la cinco a la ocho se desarrollar en el segundo bimestre. En el primer bimestre la
unidad uno hace una introduccin a la metodologa de diseo de bases de datos, la unidad dos se refiere al
siguiente paso de la metodologa: el diseo fsico de bases de datos relacionales, la unidad tres se refiere a otra
etapa de la metodologa de diseo de base de datos; la monitorizacin y optimizacin del sistema final y por
ltimo, la unidad cuatro desarrolla el tema de seguridad en cuanto a bases de datos se refiere.
En el segundo bimestre, la unidad cinco hace referencia a la gestin de transacciones, la unidad seis se refiere
al procesamiento de consultas, la unidad siete aborda conceptos de almacenes de datos y por ltimo la unidad
ocho hace referencia al diseo de almacenes de datos.
Esta gua didctica trata de dar una visin real y prctica de la temtica abordada a travs de la inclusin de
explicaciones, ejemplos y otros recursos relacionados al tema, para que usted pueda asimilar de mejor forma
los conceptos y teoras que encontrar en la bibliografa bsica y complementaria.
Finalmente, les deseo el mejor de los xitos en el presente ciclo de estudios y animarle a que realice su mejor
esfuerzo para continuar por el camino de la superacin profesional y personal que contribuyen a una formacin
integral. Recuerde estimado estudiante que estaremos junto a ustedes para acompaarle y orientarle en el
proceso de aprendizaje.

Siga adelante!

Gua didctica: Base de Datos Avanzada

PRELIMINARES

4. Lineamientos generales del modelo educativo basado en


competencias y crditos acadmicos UTPL-ECTS
Seor estudiante: recuerde que usted ha iniciado su formacin de tercer nivel con un sistema educativo
basado en el desarrollo de competencias a travs de crditos acadmicos. Este modelo le convierte
a usted en protagonista de su propia formacin y al profesor en mediador de las experiencias de
aprendizaje.
Surge entonces la necesidad de que tenga claro dos conceptos fundamentales: competencia y crdito
acadmico.

Qu es una competencia? Entendemos por competencia el conjunto de actitudes, habilidades


y conocimientos que el alumno adquiere e incorpora segn sus caractersticas personales y
experiencias laborales y, que se ponen de manifiesto en el desempeo de la actividad profesional.
Las competencias se adquieren a lo largo del proceso formativo de la carrera y se desagregan en
objetivos de aprendizaje propuestos en cada asignatura.
Elementos de una competencia. Tres son los elementos que podemos distinguir en toda
competencia:

Actitudes: son predisposiciones y comportamientos ante situaciones concretas.


Habilidades: son destrezas para ejecutar con xito tareas, utilizar procedimientos y realizar
trabajos. Se desarrollan a travs de la prctica y la experiencia.

Conocimientos: constituyen los contenidos cientficos, conceptuales, tericos, conocidos


tambin como el aprendizaje acadmico.

Qu es un crdito acadmico UTPL/ECTS en la Modalidad Abierta y a Distancia?


Un crdito acadmico es la unidad de medida del trabajo del estudiante, implica 32 horas de
trabajo del alumno (29 horas de trabajo autnomo y 3 horas de interaccin)1.
Los crditos acadmicos que el estudiante ir acumulando en el transcurso de la carrera
involucran: aprendizaje autnomo (estudio personal), tareas de investigacin, interaccin en el
Entorno Virtual de Aprendizaje (EVA), participacin en tutoras, videoconferencias y otros eventos
acadmicos (Jornadas, seminarios, cursos, congresos avalados por la UTPL), prcticas acadmicas,
pasantas preprofesionales y de vinculacin con la colectividad; actividades de evaluacin; as
como la realizacin del trabajo de titulacin.
El modelo adoptado por la UTPL contempla dos tipos de competencias: genricas y especficas.

Genricas: son aquellas capacidades (actitudes, habilidades y conocimientos) comunes a


todas las profesiones que se ofrecen en la UTPL. Constituyen una parte fundamental del
perfil que el estudiante debe desarrollar durante su formacin.

CONESUP (2008): Reglamento del Rgimen Acadmico del Sistema Nacional de Educacin Superior, art. 18.

PRELIMINARES

Gua didctica: Base de Datos Avanzada

Especficas: son propias de la titulacin, aportan a la cualificacin especfica para la profesin,


dndole consistencia social y profesional al perfil formativo.

Estructura general del programa formativo


Las unidades acadmicas o escuelas de la UTPL han estructurado el programa formativo
contemplando cinco mbitos o bloques de asignaturas: formacin bsica (10%); genricas de
carrera (15%); troncales (35%) complementarias (10%); libre configuracin (10%) y adems, el
Prcticum que comprende las Pasantas preprofesionales y de vinculacin con la colectividad y
Prcticum acadmico (20%).

4.1. Competencias genricas


1.

Capacidad de aplicar los conocimientos en la prctica.

2.

Conocimiento sobre el rea de estudio.

3.

Capacidad de investigacin.

4.

Habilidades para buscar, procesar y analizar informacin procedentes de fuentes diversas.

5.

Capacidad creativa e innovadora.

6.

Capacidad para organizar y planificar el tiempo.

7.

Habilidad para trabajar en forma autnoma.

8.

Habilidades en el uso de las tecnologas de la TICs.

9.

Compromiso tico.

4.2. Competencias especficas


Estas competencias se encuentran detalladas en la planificacin de cada bimestre.

Gua didctica: Base de Datos Avanzada

PRELIMINARES

5. Bibliografa
5.1. Bsica
Connolly, T. y Begg, C.(2005). Sistemas de bases de datos. Un enfoque prctico para diseo, implementacin
y gestin. Madrid: Pearson Education.
Este texto propone los temas que se deben abordar dentro de la asignatura de Base de Datos Avanzada.
Su contenido es bastante didctico, ofrece recursos para que el estudiante pueda autoevaluarse al
final de cada unidad; dispone de casos de estudio sobre los cuales se puede ir desarrollando la parte
prctica de la asignatura. Tambin ofrece recursos adicionales en la Web que ayudan al estudiante a
complementar los contenidos del texto.
Morocho, J. y Enriquez, M. (2011). Gua didctica de Base de Datos Avanzada. Loja-Ecuador: UTPL.
Gua didctica diseada para el estudio de Base de Datos Avanzada en la carrera de Ingeniera en
Informtica de la Modalidad Abierta y a Distancia de la Universidad Tcnica Particular de Loja. En este
material encontrar breves explicaciones, comentarios de cada uno de los temas, adems de ejercicios
propuestos y autoevaluaciones, que le ayudarn como un indicador del logro de las competencias
propuestas para la presente asignatura.

5.2. Complementaria
Amiagada, A. y Aranda,J. (2006). Curso de Base de Datos. Universidad de las Amricas. Recuperado el 28 de
febrero del 2011 desde http://nuestro.net78.net/clases_jjaa/Bases_Datos/
Curso de base de datos, en donde puede encontrar temas como conceptos del modelo relacional, lgebra y
clculo relacional que ayudarn a complementar sus conocimientos.
Camps, R., Casillas, L. A., Costal, et. al. (2007).OCW,M2109 Bases de Datos. UniversitatOberta de Catalunya.
Recuperado el 28 de febrero del 2011 desde http://ocw.uoc.edu/informatica-tecnologia-y-multimedia/
bases-de-datos/Course_listing.
Curso de base de datos abierto, en donde puede encontrar temas como conceptos del modelo relacional
y el proceso del modelado E/R, que le ayudarn a complementar sus conocimientos.
Castillo, C. (2007). Convertir Entidad-RelacinenModelo Relacional. Universitat Pompeu Fabra.
Este documento contiene informacin acerca de la transformacin del modelo conceptual al modelo
lgico.
Greenberg, N.,Nathan, P.(2001).Introduction toOracle 9i:SQL.Oracle Corporation.
En este documento puede encontrar todo lo referente al lenguaje SQL Oracle en la versin 9i.

PRELIMINARES

Gua didctica: Base de Datos Avanzada

Martnez, J. L., Martnez, P. y Mingo, J. M. (2008). OCW: Fundamentos de las bases de datos. Grupo de bases
de datos avanzadas, departamento de informtica, Universidad Carlos III de Madrid. Recuperado el 28 de
febrero del 2011 desde http://ocw.uc3m.es/informatica/fundamentos-de-bases-de-datos.
Curso de base de datos abierto, en donde puede encontrar temas como conceptos fundamentales
de base de datos, modelo de datos relacional y lenguaje SQL, que le ayudarn a complementar sus
conocimientos.
Oracle home page. Recuperado el 12 de Febrero del 2011 desde http://www.oracle.com/index.html
Sitio de uno de los sistemas de gestin de base de datos ms reconocido a nivel mundial. Aqu encontrar
recursos como documentacin, podcast, software y noticias relevantes de la industria de base de datos.
Ricardo, C. (2009).Bases de Datos. Mxico, D. F.: McGraw-Hill.
En este texto encontrar material complementario sobre seguridades, transacciones, bases de datos
distribuidas, almacenes de datos y bases de datos e Internet, que ayudarn al estudiante en el desarrollo
de los temas propuestos para la asignatura.
Scott, U.(2002).Oracle 9i PL/SQL Programming.Madrid: McGraw-Hill/Osborne.
Este material bibliogrfico le puede servir para profundizar sobre el lenguaje SQL, tanto manipulacin
como definicin de datos.

Gua didctica: Base de Datos Avanzada

PRELIMINARES

6. Orientaciones generales para el estudio


Estudiar a distancia es un reto que requiere esfuerzo, dedicacin y sobre organizacin, por
ello debe hacer de esta actividad un trabajo continuo y sistemtico, organice su tiempo de
manera que pueda verdaderamente aprovechar los contenidos que se le estn ofreciendo.
Creemos conveniente brindarle algunas recomendaciones de cara al desarrollo de los contenidos en el
semestre:
Recursos
La asignatura de Base de Datos Avanzada, tiene como texto bsico Sistemas de bases de datos. Un
enfoque prctico para diseo, implementacin y gestin, de Connolly y Begg, adems como apoyo
principal la gua didctica, estos sern los principales recursos con los que usted contar para el estudio
de cada uno de los contenidos de esta asignatura y para orientarse en cuanto a su avance.

El texto bsico es amplio en contenidos, cuenta adems con herramientas muy didcticas como:
figuras ilustrativas, casos de estudio, resmenes, actividades recomendadas al final de cada unidad,
ejercicios propuestos, un glosario al que usted podr recurrir cuando encuentre un trmino
desconocido y una serie de apndices en donde encontrar informacin relevante a manera de
resumen.

En cuanto a la gua, su fin principal es el de orientar al estudiante, indicndole los temas del libro
que debe revisar y los conceptos a los cules deber poner un mayor nfasis; la gua didctica
servir tambin para constatar el nivel de asimilacin de conocimientos, as que se proponen
cuestionarios, ejercicios y otras actividades que complementen su aprendizaje.

Es recomendable que desarrolle las autoevaluaciones propuestas en la gua didctica, al final de


cada unidad, pues estas le ayudarn a reforzar sus conocimientos.

Dentro de la gua tambin encuentra de una herramienta muy importante que es la planificacin
para el trabajo del alumno, en la cual est la dosificacin de contenidos que debe ir desarrollando
durante cada semana del semestre acadmico, que le permitirn ir adquiriendo las competencias
que se ha planteado para la asignatura de fundamentos de base de datos.

Es natural que algunos temas le resulten difciles de entender; sin embargo, conforme vaya
avanzando y adentrndose en esta temtica se irn despejando aquellas dudas, le recuerdo que
para ello tambin puede contar con la ayuda de su profesor.

Tcnicas de estudio

En sus estudios, usted deber primero remitirse a la gua didctica en donde se le darn instrucciones
acerca de los temas que deber revisar, luego se remitir al libro y cuando los contenidos hayan
quedado claros deber volver una vez ms a la gua para concentrarse en aquellos conceptos
fundamentales y realizar una serie de actividades complementarias propuestas. Utilice las tcnicas
de estudio que ms se ajusten a usted (subrayados, resmenes, cuadros sinpticos, esquemas,
grficas, etc.).

10

PRELIMINARES

Gua didctica: Base de Datos Avanzada

Es conveniente que siempre considere el calendario acadmico que le fue entregado y organice
su tiempo para que el estudio sea constante. La recomendacin es que debe revisar una unidad
por semana, aunque en ocasiones debido a la dificultad o facilidad de ciertos temas, este tiempo
podr variar.

Interactividad
Adicional al material bsico, usted contar con los siguientes recursos tecnolgicos que le servirn para
profundizar o complementar lo aprendido:

Entorno Virtual de Aprendizaje, en donde usted encontrar documentos, videos, foros, chats en el
que participan adems de su profesor sus compaeros, logrando as una total retroalimentacin
de los contenidos desarrollados.

Biblioteca virtual, a la que puede acceder a travs de la pgina Web de la Universidad http://www.
utpl.edu.ec/biblioteca, en donde encontrar enlaces a importantes bibliotecas virtuales de todo
el mundo que pueden ser consultadas por usted.
En sus evaluaciones a distancia usted encontrar los datos completos de su profesor-tutor, con
el cual se podr comunicar constantemente a travs de la lnea telefnica, correo electrnico,
entorno virtual, googletalk o skype para hacerle llegar sus inquietudes ya que usted est en un
proceso de aprendizaje y siempre se requiere de ayuda para esclarecer alguna duda o para ratificar
sus ideas. Recuerde que siempre ser un gusto poder ayudarle.

Evaluacin
Al final de cada bimestre, deber entregar las evaluaciones a distancia (30% de la calificacin final) en
las fechas establecidas para el efecto y luego rendir sus evaluaciones presenciales (70% de la calificacin
final), que sumados debern dar un total de 20 puntos por bimestre. Debe obtener una nota mnima de
14 puntos sobre 20, de lo contrario tendr que rendir una evaluacin supletoria que reemplazar a la
nota bimestral. Para acreditar la asignatura debe contabilizar un mnimo de 28 puntos.
Estimado profesional en formacin, recuerde que de su constancia y esfuerzo depende el cumplir con
las metas que se ha planteado para el presente semestre y cuente con la ayuda del profesor tutor para
apoyarle en la consecucin de sus objetivos.

11

Gua didctica: Base de Datos Avanzada

PRIMER BIMESTRE

7. Proceso de enseanza-aprendizaje para el logro de competencias


PRIMER BIMESTRE
7.1. Competencias genricas
COMPETENCIAS
ESPECFICAS

INDICADORES DE
APRENDIZAJE

Analiza las
necesidades de
conocimiento
necesarias para
resolver un
problema.

Identifica los
beneficios de
utilizar una
metodologa
de diseo de
base de datos.

Realiza la gestin
y recuperacin
de informacin
generada en
los sistemas
informticos.

Asocia
claramente
las fases de la
metodologa
de diseo
de bases de
datos.

CONTENIDOS
ACTIVIDADES DE APRENDIZAJE
Unidades/Temas
Unidad 1.

Metodologa para el
desarrollo de bases
de datos

1.1. Introduccin a
la metodologa de
diseo de bases de
datos

1.2. Panormica de
la metodologa de
diseo de la base de
datos

Desarrollar un cuadro sinptico


a manera de cronologa sobre la
evolucin de las bases de datos.

Desarrollo de la autoevaluacin 1.

Revisar anuncios publicados en el


EVA.

Empezar el desarrollo de la
evaluacin a distancia que
corresponda a la primera unidad.
Lectura comprensiva del captulo
17 del texto bsico siguiendo las
indicaciones de la gua didctica.

Reconoce
y aplica el
proceso para
pasar del
diseo lgico
a un diseo
fsico.

4 horas de
autoestudio.
4 horas de
interaccin.

Desarrollo de actividades
recomendadas en la gua para la
primera unidad.

Unidad 2.

Metodologa: diseo
fsico de base de
datos

2.1. Comparacin del
diseo lgico y fsico
de bases de datos
Distingue
relacionales
claramente

cundo utilizar 2.2. Metodologa de
ndices para
diseo fsico de bases
mejorar el
de datos relacionales
rendimiento
de la base de
datos.

Lectura comprensiva del captulo


15 del texto bsico segn las
indicaciones de la gua didctica.

CRONOGRAMA
ORIENTATIVO
Tiempo
estimado
Semana 1

Interprete con sus propias palabras


la figura 17.3 de su texto bsico
que se refiere al mapa del uso de
transacciones.

Semana 2 y 3
8 horas de
autoestudio.
8 horas de
interaccin.

Generacin de mapa conceptual


sobre el diseo fsico.
Desarrollo de actividades
recomendadas en la gua para la
segunda unidad.
Desarrollar la autoevaluacin 2.

Revisar anuncios publicados en el


EVA.

Desarrollo de la parte de la
evaluacin a distancia que
corresponda a la segunda .unidad.

13

Gua didctica: Base de Datos Avanzada

COMPETENCIAS
ESPECFICAS

CONTENIDOS

INDICADORES DE
APRENDIZAJE

Demuestra los
beneficios de
monitorear el
rendimiento
de la base de
datos.
Analiza y
describe las
circunstancias
en las cuales
es conveniente
desnormalizar.

Diferencia
claramente las
amenazas a
las cuales est
expuesta una
base de datos.

PRIMER BIMESTRE

ACTIVIDADES DE APRENDIZAJE
Unidades/Temas
Unidad 3.
Metodologa:
monitorizacin y
optimizacin del
sistema final

3.1. Desnormalizacin
e introduccin
de redundancia

controlada
3.2. Monitorizacin
del sistema
para mejorar el
rendimiento

4.2. Contramedidas:
controles
informatizados

Aplica
contramedidas
para minimizar 4.3. Seguridad en el
los efectos de SGBD de Microsoft
las amenazas. Office Access y en el
SGBD de Oracle
4.4. Seguridad de un
SGBD en entornos
Web

Unidades 1 - 4

Esquematice en forma de cuadro


sinptico los criterios para introducir 4 horas de
redundancia.
interaccin
Desarrollo de actividades
recomendadas en la gua para la
tercera unidad
Revisar anuncios en el EVA.

Desarrollo de la parte de
la evaluacin a distancia
correspondiente a la tercera unidad
Lectura comprensiva del captulo
Semana 5 y 6
19 del texto bsico de acuerdo a las
indicaciones de la gua didctica.
8 horas de
autoestudio.
Elaboracin de un mapa mental en
donde se representen los problemas 8 horas de
asociados con la seguridad de BDD interaccin.
en Web.

Desarrollo de actividades
recomendadas en la gua para la
cuarta unidad.

Revisar anuncios en el EVA.

Revisar los ejercicios resueltos en el


texto bsico.

Desarrollar los ejercicios propuestos


al final del captulo en el texto
bsico.

Desarrollo de la parte de la
evaluacin a distancia que
corresponda a la cuarta unidad.
Revisin de foro de consultas al
profesor.

14

4 horas de
autoestudio

Unidad 4. Seguridad
4.1. Seguridad de la
base de datos

Lectura comprensiva del captulo


18 del texto bsico de acuerdo a las
indicaciones de la gua didctica.

CRONOGRAMA
ORIENTATIVO
Tiempo
estimado
Semana 4

Semana 7 y 8.

8 horas de
Realizacin de ejercicios propuestos autoestudio.
en el EVA.
8 horas de
Indicaciones previa a la primera
interaccin.
evaluacin presencial.

Gua didctica: Base de Datos Avanzada

PRIMER BIMESTRE

7.2. Sistema de evaluacin de la asignatura (primero y segundo bimestres)


Formas de evaluacin

Prueba objetiva y de
ensayo

Respeto a las personas y a las


normas de comunicacin

Creatividad e iniciativa

Cumplimiento, puntualidad,
responsabilidad

Esfuerzo e inters en los trabajos

Contribucin en el trabajo
colaborativo y de equipo

X
X

Investigacin (cita fuentes de


consulta)

Aporta con criterios y soluciones

Anlisis y profundidad en el
desarrollo de temas

Emite juicios de valor


argumentadamente

PORCENTAJE

Puntaje

Estrategia de
aprendizaje

Dominio del contenido

10% 10% 10%

TOTAL

70%

14

20 puntos

Actividades
presenciales y en el
EVA

Presentacin, orden y ortografa

Mximo 1 punto
(completa la
evaluacin a
distancia)

Actitudes

3. Coevaluacin

Interaccin en el EVA

Parte objetiva

Comportamiento tico

Conocimientos

Evaluacin
presencial

Competencia: criterio

Habilidades

Evaluacin a
distancia **

Parte de ensayo

1. Autoevaluacin *

2. Heteroevaluacin

Para aprobar la asignatura se requiere obtener un puntaje mnimo de 28/40 puntos, que equivale al 70%.
* Son estrategias de aprendizaje, no tienen calificacin; pero debe responderlas con el fin de autocomprobar su
proceso de aprendizaje.
** Recuerde que la evaluacin a distancia consta de dos partes: una objetiva y otra de ensayo, debe desarrollarla
y entregarla en su respectivo centro universitario.

Seor estudiante:
Tenga presente que la finalidad de la valoracin cualitativa es
principalmente formativa.

15

Gua didctica: Base de Datos Avanzada

PRIMER BIMESTRE

7.3. Orientaciones especficas para el aprendizaje por competencias

Unidad 1: Metodologa para el desarrollo de bases de datos


Recursos educativos multimedia

Estimado estudiante: vamos a iniciar el estudio de la asignatura conociendo una herramienta que nos
ayudar a guiar y formalizar el diseo de una base de datos, como lo es la utilizacin de una metodologa.
Para el desarrollo de esta unidad, vaya revisando conjuntamente con esta gua el captulo
15 del texto bsico sobre Metodologa: diseo conceptual de la base de datos.

1.1. Introduccin a la metodologa de diseo de bases de datos


Iniciemos el estudio de la presente unidad, comparando los conceptos alrededor del trmino
metodologa, para ello puede usar como fuente de consulta la Internet. Seguramente las definiciones
encontradas le harn referencia a un conjunto de herramientas, pasos que se debe seguir en un orden
establecido, lo cual sirve para normar las actividades tendientes a la consecucin de un objetivo.
Pues bien, ahora que ya tiene una idea clara de lo que es una metodologa y cul es su utilidad, vamos a
enfocarla en el proceso de diseo de una base de datos.

Revise en su texto bsico, del apartado 15.1. Introduccin a la metodologa de diseo de bases de
datos, el punto 15.1.1 Qu es una metodologa de diseo?

ACTIVIDAD RECOMENDADA:

Una vez que ha encontrado varias definiciones del trmino metodologa, comprelas con la
propuesta en el texto bsico y construya un nuevo concepto a partir de los ya consultados.
En este punto puede usted dar respuesta a la siguiente interrogante:

Qu es una metodologa y para qu sirve?


Si usted es capaz de responder lo felicito, pues ha logrado asimilar de buena manera los contenidos
estudiados hasta aqu. Si, por el contrario, todava no puede dar respuesta a la interrogante planteada,
conviene que vuelva a revisar los temas analizados.
Para complementar la comprensin del tema, recordemos que en los inicios de las bases de datos, los
diseadores de base de datos trabajaban sin ayuda de herramientas que les permitiesen agilizar su
trabajo y se podra decir, de forma rudimentaria.

16

PRIMER BIMESTRE

Gua didctica: Base de Datos Avanzada

As mismo se vean afectados porque a menudo se confunda el diseo de base de datos con la
implementacin de las mismas. Conforme la tecnologa fue avanzando, tambin se dio un importante
avance en cuanto a los procesos de diseo de bases de datos, es as que en la actualidad contamos con
varias herramientas que nos ayudan en la manipulacin de la informacin, y nos permiten construir
interfaces amigables para que los usuarios interacten con la base de datos, as como herramientas que
nos apoyan en el proceso de diseo, de las que podemos mencionar PowerDesigner, Erwin, entre otras,
pero el avance no solamente ha sido en herramientas tecnolgicas sino que tambin se han estructurado
metodologas y tcnicas de diseo, tal como la que se presenta en el texto bsico, en la cual se definen
claramente unas fases, los objetivos de cada fase y las actividades y/o componentes.
Una desventaja fundamental es que las metodologas de diseo de base de datos no son muy conocidas,
por tanto los diseadores no las aplican y por eso se obtiene malos resultados en el desarrollo de las
aplicaciones como: la base de datos no satisface las necesidades de la organizacin, la administracin se
complica y la documentacin es limitada o nula.
Pues bien, en el texto bsico se propone una metodologa de diseo de bases de datos que identifica
claramente tres fases: diseo conceptual, diseo lgico y diseo fsico.

Es momento de revisar en el texto bsico los apartados 15.1.2. Diseo conceptual, lgico y fsico
de una base de datos y 15.1.3. Factores crticos en el diseo de una base de datos.

reforzar an ms los contenidos del texto, le invito a revisar el material relacionado al tema
Para
que estamos desarrollando del curso OCW y que lo podr encontrar en la siguiente direccin Web:
http://ocw.uc3m.es/informatica/diseno-y-administracion-de-bases-de-datos/teoria/Tema1%28U
naMetodologiaDesarrolloBD%29.pdf
Una vez que haya revisado el material en lnea desde el recurso OCW, contraste con los contenidos
del texto bsico y obtenga sus propias conclusiones.

A continuacin haremos un breve recordatorio de las dos primeras fases, diseo conceptual y lgico de
la metodologa propuesta en el texto bsico y la ltima fase, la del diseo fsico la abordaremos en la
siguiente unidad.

1.2. Panormica de la metodologa de diseo de la base de datos


Estimado estudiante: vamos a recordar las actividades dentro de las fases de diseo conceptual y diseo
lgico, propuestas por la metodologa que plantea el texto bsico y que se revisaron en la asignatura de
Fundamentos de Base de Datos.
El diseo conceptual se fundamenta en las especificaciones de requisitos de los usuarios. El resultado de
esta fase es el modelo E/R, que constituye una descripcin a muy alto nivel de la estructura de la base de
datos, es decir forma un concepto de lo que se requiere representar en la base de datos, sin considerar
aspectos tcnicos como el SGBD (Sistema de Gestin de Base de Datos) a utilizar.
El diseo lgico toma como base el diseo conceptual y describe la estructura de la base de datos en
trminos de las estructuras de datos que son factibles de procesamiento por un SGBD.

17

Gua didctica: Base de Datos Avanzada

PRIMER BIMESTRE

Para complementar la comprensin de tema, refirase al texto bsico y revise el apartado 15.2
Panormica de la metodologa de diseo de la base de datos.

Seguramente habr recordado las actividades que se deben cubrir en las fases de diseo conceptual y
diseo lgico, que propone la metodologa del texto bsico.
Se podr dar cuenta que la metodologa dicta una serie de pasos que se relacionan entre s, e incluso
unas generan documentacin que sirve para la siguiente actividad. Imaginemos solo por un momento
cmo sera nuestro proceso de diseo de bases de datos si no contramos con una metodologa que
nos gue en el proceso. De seguro sera un proceso desordenado, que requerira de mucho esfuerzo y
que generara una pobre documentacin, de ah que la adopcin de un proceso metodolgico resulta
imprescindible.
No olvide que el diseo de una base de datos es un proceso un poco complejo en la cual intervienen
muchos actores de distintos niveles, pero esa complejidad sera manejable si descomponemos ese
gran problema en subproblemas, para poderlos manejar ms efectivamente aplicando las tcnicas y
herramientas apropiadas.
El siguiente grfico sintetiza las fases de la metodologa de diseo planteada en el texto bsico.

Figura 1.1. Esquematizacin de las fases de la metodologa de diseo de bases de datos, segn el texto bsico.

Bien, felicitaciones!, Ha terminado la unidad 1, Con el mismo entusiasmo Siga adelante! Como
parte complementaria en el desarrollo de la presente unidad le invitamos a desarrollar las siguientes
actividades recomendadas.

18

PRIMER BIMESTRE

Gua didctica: Base de Datos Avanzada

ACTIVIDADES RECOMENDADAS:

Estimado estudiante, para medir la asimilacin de sus conocimientos en la presente unidad,


desarrolle las siguientes actividades que estn planteadas al final del captulo de trabajo de
su texto bsico, como cuestiones de repaso. Esto le permitir saber los temas que debe
reforzar.

Desarrolle los puntos 15.1, 15.2, 15.3 y 15.4.

Recuerde que puede solicitar ayuda a su tutor mediante el campus virtual o telefnicamente.
Interactividad virtual
Fortalezca sus criterios y conocimientos respecto al tema y a la asignatura ingresando
peridicamente a travs del campus virtual (http://www.utpl.edu.ec).
Desde su aula virtual de la asignatura, puede conocer los anuncios de su profesor. Todos
los participantes tienen acceso a los foros de discusin donde su aporte es valioso y es an ms
significativo si la participacin involucra conversacin con los integrantes del curso.
En nuestro caso, la participacin en los foros de discusin es obligatoria, pues tienen una
puntuacin en su evaluacin a distancia.

19

Gua didctica: Base de Datos Avanzada

PRIMER BIMESTRE

Autoevaluacin 1

Bien, es momento de evaluar el conocimiento adquirido, por lo que le invitamos a resolver


las siguientes preguntas:

Conteste verdadero (V) o falso (F) a las siguientes proposiciones, segn corresponda:
1.

Una metodologa lo que intenta es controlar las actividades de un proyecto.

2.

Una metodologa no constituye una camisa de fuerza.

3.

Una metodologa dicta qu es lo que hay que realizar en cada actividad.

4.

Una metodologa no cubre de inicio a fin el desarrollo de una base de datos.

5.

Segn la metodologa propuesta por el texto bsico, el paso siguiente a la etapa de


diseo lgico es el diseo conceptual.

6.

No es necesario involucrar a los usuarios en el proceso de diseo de una base de


datos.

7.

Es necesario emplear modelos de datos como instrumentos de diseo.

8.

El diseo lgico traduce el modelo conceptual de datos a un modelo lgico de los


datos.

9.

Un diseo conceptual no puede ser independiente de las consideraciones fsicas.

10.

La normalizacin es una tcnica que ayuda a un correcto diseo conceptual.

Revise sus aciertos consultando el solucionario qu se encuentra en la parte final de esta gua
Ensayo
11. Construya un mapa mental que agrupe las principales actividades para el diseo conceptual y
diseo lgico de bases de datos. Puede ayudarse de alguna herramienta como MindManager, para
elaborar su mapa mental.

Ir a solucionario

20

PRIMER BIMESTRE

Gua didctica: Base de Datos Avanzada

Unidad 2: Metodologa: diseo fsico de bases de datos relacionales


Recursos educativos multimedia

Estimado estudiante: continuaremos estudiando las fases que propone la metodologa de diseo de
bases de datos. En este punto corresponde revisar la fase de diseo fsico.
Para el desarrollo de esta unidad vaya revisando conjuntamente con esta gua el captulo 17 del
texto bsico: Metodologa: diseo fsico de bases de datos relacionales.

2.1. Comparacin del diseo lgico y del diseo fsico de bases de datos
Antes de adentrarnos en la revisin de la fase de diseo fsico, es conveniente hacer una breve comparacin
entre esta fase y la de diseo lgico.
Recuerde que el diseo fsico se fundamenta en el diseo lgico, y constituye una descripcin de la
implementacin de una base de datos en almacenamiento secundario, por lo cual est estrechamente
relacionado con el SGBD a utilizar ya que se debe especificar mediante el lenguaje de definicin de datos
del producto seleccionado.

Vaya al texto bsico y revise el apartado 17.1 Comparacin del diseo lgico y del diseo fsico de
bases de datos.

De seguro que ahora s diferencia algunas actividades entre las fases de diseo antes mencionadas; pues
bien, como usted pudo evidenciar las fases pretenden ser independientes unas de otras, pero a la vez
integradas para darle continuidad al proceso metodolgico.
Siguiendo con el estudio de la fase, vamos a hacer un breve anlisis de cada una de las actividades que
comprende.

2.2. Metodologa de diseo fsico de bases de datos relacionales


Ahora debemos revisar paso a paso las actividades de la fase de diseo fsico, que es el tercer componente
de la metodologa propuesta en el texto bsico.

En el texto bsico revise la pgina 454, el paso 3, Traducir el modelo lgico de los datos al SGBD
seleccionado.

Bien, como ya habr revisado, esta fase pretende obtener un modelo de datos con las tablas definidas,
adems busca seleccionar la mejor representacin para los datos derivados, buscando la eficiencia y, por
lo tanto, los menores tiempos de respuesta.

21

Gua didctica: Base de Datos Avanzada

PRIMER BIMESTRE

Analice la figura 17.1 propuesta en el texto bsico, ah se puede observar la representacin de la relacin
PropertyForRent, utilizando el lenguaje de diseo de base de datos. En la primera parte se presenta la
definicin de dominios de los atributos que componen la relacin; seguidamente se hace la definicin
de la relacin y si nos fijamos para la definicin de los tipos de datos ya se utiliza los dominios definidos
anteriormente; y, finalmente, se puede ver tambin la definicin de los constraints, el primero de ellos
define la clave primaria, y los siguientes hacen referencia a claves forneas.
Podemos observar que se incluye la sentencia ON UPDATE CASCADE, en la definicin del constraint
que referencia a Staff, esto quiere decir que si se actualiza el atributo staffNo de la relacin Staff
automticamente tambin se actualicen dichos valores relacionados en la tabla Property For Rent.
Esto se traduce como la inclusin de parte de la lgica de negocio a travs del diseo de restricciones
generales.
A continuacin proponemos un ejemplo de un modelo de datos para una biblioteca, el cual lo
traduciremos a lenguaje DDL.

Figura 2.1. Diseo de base de datos de una biblioteca (Instituto SISE, 2010)2.

Vamos a transformar a lenguaje DDL el modelo del grfico anterior. Empezaremos por la relacin TIPO_
USUARIO.
CREATE TABLE TIPO_USUARIO
(
idTipoUsuario number(4),
descTipoUsuario varchar2(20) NOT NULL,
CONSTRAINT PK_TIPO_USUARIO PRIMARY KEY(idTipoUsuario) --Aqu definimos la clave primaria
);
CREATE TABLE USUARIO
(
idUsuario varchar2(8) NOT NULL,
idTipoUsuario number(4) NOT NULL,
2

Instituto SISE. (08 de 2010). Metodologa de Diseo de Base de Datos. Recuperado el 13 de 06 de 2011, de http://www.
scribd.com/doc/40031583/49/METODOLOGIA-DE-DISENO-DE-BASES-DE-DATOS.

22

PRIMER BIMESTRE

Gua didctica: Base de Datos Avanzada

apelUsuario varchar2(35) NOT NULL,


nomUsuario varchar2(35) NOT NULL,
direccion varchar2(50) NULL, --Por defecto los campos aceptan valores nulos, por lo que no hara falta especificar
la opcin NULL
habilitado boolean NOT NULL,
fechaExpCarnet datetime NOT NULL,
fechaVencCarnet datetime NOT NULL,
CONSTRAINT PK_USUARIO_idUsuario PRIMARY KEY(idUsuario), --Aqu definimos la clave primaria
CONSTRAINT FK_USUARIO_idTipoUsuario FOREIGN KEY (idTipoUsuario) REFERENCES TIPO_
USUARIO(idTipoUsuario) --Aqu definimos la clave fornea o externa que hace referencia a la tabla TIPO_USUARIO
);
CREATE TABLE MAT_BIBLIO
(
idMatBiblio varchar2(20) NOT NULL,
tituloMatBiblio varchar2(150) NOT NULL,
editorial varchar2(50),
pais varchar(20),
ao datetime,
nPag number,
existencia number NOT NULL,
CONSTRAINT PK_MAT_BIBLIO_idMatBiblio PRIMARY KEY(idMatBiblio)
);
CREATE TABLE PRESTAMO
(
codOper varchar2(7) PRIMARY KEY, --Esta es otra forma de definir la clave primaria
idMatBiblio varchar2(20) NOT NULL,
idUsuario varchar2(8) NOT NULL,
fechaP datetime NOT NULL,
fechaD datetime NOT NULL,
ndias number NOT NULL,
CONSTRAINT FK_PRESTAMO_idMatBiblio1 FOREIGN KEY(idMatBiblio) REFERENCES MAT_
BIBLIO(idMatBiblio),
CONSTRAINT FK_PRESTAMO_idMatBiblio2 FOREIGN KEY(idUsuario) REFERENCES USUARIO(idUsuario)
);
CREATE TABLE AUTOR
(
idAutor varchar2(4) NOT NULL,
nomAutor varchar2(50) NOT NULL,
CONSTRAINT PK_AUTOR_idAutor PRIMARY KEY(idAutor)
);
CREATE TABLE MB_AUTOR
(
idMatBiblio varchar2(20) NOT NULL,
idAutor varchar2(4) NOT NULL,
CONSTRAINT PK_MB_AUTOR_idMatBiblio_idAutor PRIMARY KEY(idMatBiblio,idAutor),

23

Gua didctica: Base de Datos Avanzada

PRIMER BIMESTRE

CONSTRAINT FK_MB_AUTOR_idMatBiblio FOREIGN KEY(idMatBiblio) REFERENCES


BIBLIO(idMatBiblio),
CONSTRAINT FK_MB_AUTOR_idAutor FOREIGN KEY(idAutor) REFERENCES AUTOR(idAutor)
);

MAT_

Como la tabla MB_AUTOR es una tabla intermedia, producto de una relacin muchos a muchos, las
relaciones MAT_BIBLIO y AUTOR; tiene su clave principal formada por las claves de ambas tablas PRIMARY
KEY (idMatBiblio,idAutor). Entonces cada uno de los campos son claves forneas, y la composicin de
los dos atributos forman la clave principal de la tabla MB_AUTOR.
El script, mostrado anteriormente, basta con colocarlo en alguna consola de SQL y ejecutarlo, para que
se creen las estructuras fsicamente en el servidor de base de datos.

Dirjase al texto bsico y revise en la pgina 458, el paso 4 Disear la organizacin de los
archivos y los ndices.

Continuemos revisando las actividades que comprende esta fase de diseo fsico. Como ya haya podido
destacar, se debe hacer un anlisis de las transacciones que se ejecutarn en la base de datos, que
inclusive puede ayudar a prever la carga que tendr el servidor de base de datos. Una forma de hacer
este anlisis es apoyarse en la matrz cruzada de transacciones y relaciones; analice la tabla 17.1 del texto
bsico.
Esta matriz tiene por un lado el listado de todas las relaciones que componen nuestro diseo de base
de datos. Por otro lado contiene las transacciones que se ha identificado junto con las operaciones que
se puede aplicar, como son insercin, lectura, actualizacin y borrado. Entonces para cada transaccin
verificamos qu relacin se utiliza o est implicada y marcamos con una X en la operacin que la
transaccin ejecutara sobre la relacin, as por ejemplo en la transaccin C se hace una lectura a la
relacin Branch.
As mismo se debe considerar la organizacin de los archivos, algo que afecta directamente en el
rendimiento as como la eleccin y creacin de ndices, recuerde que nos podemos valer de la creacin
de tantos ndices secundarios como sean necesarios con el objeto de acelerar los tiempos de respuesta,
eso s teniendo cuidado de la cantidad de espacio en disco que se pueda requerir ya que una creacin
desmedida de objetos de base de datos puede causar que el espacio en disco disminuya rpidamente.
Continuemos

En su texto bsico, revise en la pgina 470, el paso 5 Disear las vistas de usuario.
Bien, ahora que ha revisado el contenido del texto bsico, le ser relativamente fcil responder a la
siguiente interrogante:
Las vistas de usuario juegan un rol importante al momento de imponer los mecanismos de
seguridad?
Si le resulta fcil responder a la pregunta planteada, lo ha hecho muy bien, ha asimilado los contenidos
hasta ahora revisados. Por el contrario si no puede responder a la pregunta, revise nuevamente los
contenidos.

24

PRIMER BIMESTRE

Gua didctica: Base de Datos Avanzada

Nuevamente vaya al texto bsico y revise en la pgina 470, el paso 6 Disear los
mecanismos de seguridad.

Seguramente ahora ya comprende de mejor forma que la base de datos es un activo ms de la organizacin,
por lo que se debe implementar mecanismos de seguridad que salvaguarden la informacin. Estos
mecanismos de seguridad deben ser analizados y deben validar la mejor opcin para ser implementados
de acuerdo a las especificaciones hechas en la etapa de recopilacin y anlisis de requisitos.
Gracias a su esfuerzo, ha terminado una unidad ms. Siga adelante desarrollando las dems unidades.
Para aplicar los conocimientos adquiridos, conviene que desarrolle las actividades recomendadas
descritas a continuacin.
ACTIVIDADES RECOMENDADAS:

Complemente el estudio de la presente unidad, al desarrollar las siguientes actividades


propuestas, esto le permitir saber los temas que debe reforzar.

Desarrolle los puntos 17.2, 17.3, y 17.4.


Ejercicios
Refuerce el nivel de conocimientos de la presente unidad con los ejercicios siguientes de la
seccin ejercicios de su texto bsico.

Ejercicios 17.13.

25

Gua didctica: Base de Datos Avanzada

PRIMER BIMESTRE

Autoevaluacin 2

Bien, es momento de evaluar el conocimiento adquirido, por lo que le invitamos a resolver


las siguientes preguntas:
Conteste verdadero (V) o falso (F) a las siguientes proposiciones, segn corresponda:
1.

DBDL significa DataBaseDefinitionLanguage.

2.

Un atributo derivado no es lo mismo que un atributo calculado.

3.

Un pico de carga es el perodo en el cual se hace la carga inicial de datos desde algn
sistema anterior.

4.

La sentencia para crear una clave primaria en SQL es CREATE PRIMARY KEY

5.

Las sentencias GRANT y REVOKE son excluyentes, es decir solo se puede aplicar una a
la vez.

6.

Las restricciones generales se implementan a travs de constraints de tipo CHECK,


NOT NULL.

7.

Los ndices secundarios ayudan a la eficiencia en la extraccin de informacin pero


hay cierto costo para la administracin de los mismos.

8.

Una base de datos representa un recurso corporativo esencial.

9.

Oracle ofrece una utilidad de diagnstico denominada EXPLAIN PLAN para


inspeccionar la estrategia que toma el optimizador.

10.

Cuando el SGBD procesa una consulta solamente basado en ndices sin acceder al
archivo de datos se denomina plan de solo ndice.

Compruebe sus aciertos sonsultando en solucinario.


Ensayo
11.

En base al modelo de datos de la biblioteca, mostrado en este captulo de la gua de estudio,


defina los ndices que a su criterio ayuden a mejorar el rendimiento de las consultas a la base de
datos.

Ir a solucionario

26

PRIMER BIMESTRE

Gua didctica: Base de Datos Avanzada

Unidad 3: Metodologa: monitorizacin y optimizacin del sistema final


Estimado estudiante, dando continuidad al proceso metodolgico para el diseo de una base de
datos, vamos a revisar ahora el tema de monitoreo y optimizacin. En el captulo anterior vimos cmo
implementar nuestra base de datos fsicamente que posteriormente ponerla en uso. El monitoreo se da
justamente cuando nuestra base de datos ya se est utilizando, y los datos obtenidos del monitoreo nos
servirn para hacer ajustes en donde haga falta.

Para el desarrollo de esta unidad, vaya revisando conjuntamente con esta gua el captulo 18 del
texto bsico lo referente a Metodologa: monitorizacin y optimizacin del sistema final.

3.1. Desnormalizacin e introduccin de redundancia controlada


Ahora vamos a revisar el tema de desnormalizacin, que se contrapone con el proceso de normalizacin.
Para alguno quiz esto suene un poco ilgico, es decir, para qu normalizamos si luego podemos
desnormalizar? La cuestin es que casi siempre necesitamos normalizar, pero haremos lo contrario
solamente en los casos estrictamente necesarios, en donde tengamos una ganancia en el rendimiento,
aunque a veces tambin depende de la naturaleza del problema que estemos resolviendo. Antes de
continuar conviene que se refiera al texto bsico.

Vaya al texto bsico y revise el paso 7: Considerar la introduccin de una cantidad controlada de
redundancia.

Seguramente despus de revisar los contenidos, se han generado ms dudas que certezas; no se
preocupe, vamos a explicar detenidamente esta parte.
Como recordar, una de las actividades dentro de la fase de diseo lgico es la de normalizar, para
que nuestro diseo tenga un mnimo de redundancia, pero ahora en cambio aparece el trmino
desnormalizar, que hace referencia al proceso contrario, es decir que introduce en nuestro modelo cierta
cantidad de redundancia justificado en la mejora de rendimiento que se obtiene a cambio.
Recuerde que la introduccin de redundancia debe ser controlada y se justifica solamente si la mejora
en el rendimiento es considerable. Esta mejora del rendimiento tiene su costo, y es que mientras acelera
las consultas puede ralentizar las actualizaciones, es por eso que hay que tener mucho cuidado cuando
aplicamos desnormalizacin.

27

Gua didctica: Base de Datos Avanzada

PRIMER BIMESTRE

Para ejemplificar mejor este concepto vamos a explicar los ejemplos propuestos en el texto bsico, de
manera que pueda entender mejor el concepto:
Partimos de dos relaciones:
Cliente
Nombre

Descripcin

clientNo

Identificador de cliente

fName

Nombre del cliente

lName

Apellido del cliente

telNo

Nmero telefnico del cliente

prefType

Tipo de preferencia de propiedad (Flat=piso, House=casa)

maxRent

Mxima renta a pagar

Entrevista
Nombre

Descripcin

clientNo

Identificador de cliente

staffNo

Identificador de la sucursal

dateInterview

Fecha de la entrevista

Comment

Comentario de la entrevista

Para introducir desnormalizacin, unimos las dos relaciones en una sola. Dado que no todos los clientes
han hecho una entrevista, existen valores nulos en las columnas staffNo, dateInterview y comment.

Figura 3.1.Combinacin de tablas Cliente-Entrevista (Connolly, 2005)3.

Connolly, T. y. (2005). Sistemas de bases de datos: Un enfoque prctico para diseo, implementacin y gestin (4ta ed.). Madrid,
Espaa: Pearson Educacin.

28

PRIMER BIMESTRE

Gua didctica: Base de Datos Avanzada

Ahora analice la figura 18.3 en el texto bsico. Ah se est introduciendo redundancia al copiar el atributo
lName (Apellido) desde la relacin PrivateOwner (PropietarioPrivado), esto elimina para ciertos casos la
necesidad de aplicar un JOIN entre PropertyForRent y PrivateOwner con lo que estoy haciendo que el
sistema tenga mejor rendimiento, mejores tiempos de respuesta.
El mismo caso anterior aplica para el ejercicio de la figura 18.5 de su texto bsico, en donde se duplica el
atributo description (descripcin) desde la entidad PropertyType (Tipo Propiedad).
Otro caso de introduccin de redundancia son las tablas de extraccin que son bsicamente para
consultas en donde se da un alto grado de desnormalizacin ya que se rene mucha informacin
repetitiva. Por ltimo estn las particiones cuyo trabajo es dividir en partes ms manejables una tabla de
gran tamao, por ejemplo imagine en un banco la tabla en donde se registran las transacciones de los
clientes, la misma crecer aceleradamente por lo que es recomendable particionar la tabla y un criterio
para hacerlo sera por fecha, entonces se generaran particiones por cada mes. Por ejemplo: cuando se
haga una consulta de alguna transaccin, esta se dirigir o buscar nicamente en la particin que le
corresponda y no necesitar buscar en toda la estructura.

3.2. Monitorizacin del sistema para mejorar el rendimiento


Ahora corresponde estudiar la fase de monitoreo del sistema en funcionamiento para poder obtener
indicadores que nos permitan hacer ajustes en el diseo de base de datos.

Vaya al texto bsico y revise el apartado 8 Monitorizacin y optimizacin del sistema final.
De seguro que ya tiene una idea de lo que comprende esta fase. Pues bien, en esta fase lo que se hace es
monitorear el funcionamiento del sistema y hacer ajustes de ser necesario, debido a errores en el diseo
o el cambio/evolucin de algn requisito.
Para esta fase de monitoreo generalmente se utilizan herramientas automatizadas, que nos dan mucha
flexibilidad y variedad de opciones al momento de obtener datos del monitoreo para luego interpretarlos
y tomar las medidas necesarias. Un ejemplo de este tipo de herramientas se muestra en la figura 3-2, en
donde se puede visualizar un pantallazo de un monitoreo a una base de datos Oracle, se pueden ver
detalles como el nmero de usuarios conectados, el estado de los tablespaces, estado de la base de
datos, porcentajes de utilizacin de memoria, procesador y disco, etc.
Con el mismo esfuerzo continuemos con el estudio de la unidad 4.

29

Gua didctica: Base de Datos Avanzada

PRIMER BIMESTRE

Figura 3.2. Herramienta de monitoreo Applications Manager, monitoreo de una base de datos Oracle (Manager, 2011)4.
4

Manager, A. (2011). Application Manager. Recuperado el 17 de 03 de 2011, de http://www.manageengine.com/products/


applications_manager/screenshots.html

30

PRIMER BIMESTRE

Gua didctica: Base de Datos Avanzada

ACTIVIDADES RECOMENDADAS:

A continuacin le proponemos unos ejercicios para desarrollar, lo que le permitir lograr un


mayor entendimiento de la presente unidad.

Desarrolle los puntos 18.1, 18.2, 18.3 y 18.4.


Ejercicios
Para reforzar el nivel de asimilacin de los conocimientos de la presente unidad desarrolle
la siguiente actividad.

Consulte en Internet herramientas de monitoreo similares a Applications Manager y


determine las opciones de monitoreo que ofrecen.

31

Gua didctica: Base de Datos Avanzada

PRIMER BIMESTRE

Autoevaluacin 3

Bien, es momento de evaluar el conocimiento adquirido, por lo que le invitamos a resolver


las siguientes preguntas:

Conteste verdadero (V) o falso (F) a las siguientes proposiciones, segn corresponda:
1.

Cuando combino dos relaciones en una sola estamos hablando de desnormalizacin.

2.

La desnormalizacin es aceptable solamente si disminuye el rendimiento.

3.

El paso final del diseo de base de datos es el cierre del proyecto con el usuario.

4.

Uno de los factores para medir la eficiencia sera el espacio de almacenamiento en


disco.

5.

Al conocer cmo estn actuando la memoria principal, procesador, E/S de disco y red
se podra tener una referencia para mejorar las prestaciones si fuere el caso.

6.

La optimizacin de uso a menudo se conoce por algunos autores por desnormalizacin.

7.

Al hablar de tablas de referencia o listas de seleccin estamos refirindonos a lo


mismo.

8.

El particionamiento de tablas nicamente aplica a nivel de tuplas.

9.

La forma en que se organizan los datos en los discos puede ocasionar problemas
como la contienda de disco.

10.

Una ventaja del particionamiento es la seguridad.

11.

La optimizacin puede evitar tener que comprar hardware adicional.

12.

Una ventaja del particionamiento es la reduccin de las prestaciones

Verifique sus aciertos consultando el solucionario.


Ensayo
13.

Cmo distribuira los datos de su base de datos si contara con un juego de 4 discos duros de
140Gb cada uno?

Ir a solucionario

32

Gua didctica: Base de Datos Avanzada

PRIMER BIMESTRE

Unidad 4: Seguridad
Recursos educativos multimedia

Estimado estudiante, hasta ahora hemos revisado las fases de la metodologa de diseo de base de
datos que sirven para poner en marcha un sistema de base de datos, tambin se ha monitoreado su
funcionamiento para poder hacer los correctivos necesarios, conviene en este momento darle un valor
agregado a nuestro sistema de base de datos que es el de dotarle de seguridad.
Para el desarrollo de esta unidad, vaya revisando conjuntamente con esta gua el captulo 19 del
texto bsico el tema referente a: Seguridad.

4.1. Seguridad de la base de datos


Como todo componente informtico, la base de datos tambin puede ser objeto de ataques mal
intencionados, entonces debemos asegurarnos que est protegida a travs de la implementacin de
medidas de seguridad apropiadas.

Vaya al texto bsico y revise el apartado 19.1 Seguridad de la base de datos.


Luego de haber revisado lo referente a la seguridad de una base de datos se podr haber dado cuenta
que hay varios aspectos que se deben tomar en consideracin, y por ms que creamos que hay algo
evidente, debemos asegurarnos que est bien definido y documentado de manera que podamos
ejecutar algn plan de contingencia en caso de ser necesario.
Tambin habr podido identificar que un ataque mal intencionado no es que solamente afecte por
ejemplo a la base de datos, sino que le afecta a la organizacin entera porque este componente sirve a
la misma en su totalidad.
Es entonces necesario que se considere disear un plan de seguridad en el que se identifique los tipos de
amenaza para poder prevenirlos, ya que la prevencin es la mejor defensa en este tipo de circunstancias.
En la siguiente figura se sintetiza los puntos en los que se debe poner mayor atencin en cuanto a la
seguridad de una base de datos para reducir el riesgo de que puedan ocurrir.

Figura 41. Puntos de atencin en cuanto a seguridad (Connolly, 2005)5.


5

Connolly, T. y. (2005). Sistemas de bases de datos: Un enfoque prctico para diseo, implementacin y gestin (4ta ed.). Madrid,
Espaa: Pearson Educacin.

33

Gua didctica: Base de Datos Avanzada

PRIMER BIMESTRE

4.2. Contramedidas: controles informatizados


Una vez que ha identificado las amenazas de seguridad a las que se enfrenta su sistema de base de
datos, tenemos que averiguar cmo prevenirlas.

Vaya al texto bsico y revise el apartado 19.2. Contramedidas: controles informatizados.


Analicemos la figura 19.1 de su texto bsico, en ella podemos ver las amenazas ms importantes a las
que se enfrentan los sistemas informticos, si nos damos cuenta, estn orientados a varios aspectos
como el hardware, redes de comunicaciones, bases de datos, SGBD y software de aplicacin, usuarios,
programadores/operadores, DBA, etc.
Supongamos un entorno bancario, en donde el DBA tiene acceso total a la base de datos. En esta situacin
conviene tener polticas y procedimientos para el correcto manejo de las operaciones en el rea de base
de datos. Por ejemplo todas las actividades que realiza el DBA deben ser auditadas, as tambin el DBA
no debera conocer el modelo de datos para evitar que sepa en qu tablas est la informacin ms
sensible, la misma que si el SGBD lo permite debera estar encriptada.
Frente a las amenazas de seguridad hay que estar preparado y para ello se aplican contramedidas como
las que constan a continuacin y que estn enfocadas para un entorno multiusuario:

Figura 4.1. Contramedidas de seguridad informatizadas (Connolly, 2005)6.

Remtase al texto bsico para obtener un detalle de cada una de estas contramedidas.

4.3. Seguridad en el SGBD de Microsoft Office Access y en el SGBD Oracle


Veamos ahora las medidas de seguridad que nos proporcionan ciertas herramientas informticas como
por ejemplo Microsoft Office Access u Oracle.
Microsoft Access ofrece seguridad en cuanto a contraseas, ya que no se puede abrir una base de datos
si no proporciona un nombre de usuario y una contrasea. Tambin ofrece seguridad a nivel de usuario,
permitiendo agregar los usuarios a grupos y asignndoles permisos para que puedan acceder objetos
solamente donde estn autorizados.
6

Connolly, T. y. (2005). Sistemas de bases de datos: Un enfoque prctico para diseo, implementacin y gestin (4ta ed.). Madrid,
Espaa: Pearson Educacin.

34

Gua didctica: Base de Datos Avanzada

PRIMER BIMESTRE

En el SGBD Oracle, tambin se manejan usuarios a los que se les puede asignar privilegios a dos niveles,
de sistema como por ejemplo CREATE PROCEDURE y sobre objetos como por ejemplo GRANT SELECT
ON estudiante TOreportes.

En el texto bsico y revise el apartado 19.3. Seguridad en el SGBD de Microsoft Office Access y
19.4. Seguridad en el SGBD de Oracle, estos le brindar informacin con ms detalle.

4.4. Seguridad de un SGBD en entornos Web


Ahora que ya hemos revisado los conceptos de seguridad, amenazas y contramedidas, vamos a revisar
cmo actuar en un entorno Web.

Vaya al texto bsico y revise el apartado 19.5. Seguridad de un SGBD en entornos Web.
Luego de haber revisado su texto bsico, ya debera haber identificado que las medidas de seguridad en
entornos Web se basan en:

Figura 4.2. Medidas de seguridad en entornos Web (Connolly, 2005)7..

Seguramente esta unidad le result un poco difcil, ya que aparece mucha terminologa nueva, pero si
ha llegado hasta aqu ha hecho un gran esfuerzo. nimo! que con esta unidad estamos culminando el
bimestre.
ACTIVIDADES RECOMENDADAS:

A continuacin se proponen algunas actividades recomendadas que al desarrollarlas, le


ayudarn para un mejor entendimiento de la presente unidad.

Desarrolle los puntos 19.2 y 19.3.


Recuerde que puede solicitar ayuda a su tutor mediante el campus virtual o telefnicamente.
7

Connolly, T. y. (2005). Sistemas de bases de datos: Un enfoque prctico para diseo, implementacin y gestin (4ta ed.). Madrid,
Espaa: Pearson Educacin.

35

Gua didctica: Base de Datos Avanzada

PRIMER BIMESTRE

Ejercicios
Para poner sus conocimientos en la prctica, dearrolle los ejercicios siguientes propuestos
al final de la seccin correspondiente de su texto bsico.

36

Ejercicio 19.9.
Adicionalmente piense en una solucin para el problema de clonacin de tarjetas de
dbito que se sucede a diario en nuestro pas. Qu recomendara aplicar para minimizar
esta problemtica, puede abarcar tanto procedimientos, hardware, software como personal
entrenado.

Gua didctica: Base de Datos Avanzada

PRIMER BIMESTRE

Autoevaluacin 4

Bien, es momento de evaluar el conocimiento adquirido, por lo que le invitamos a resolver


las siguientes preguntas:

Conteste verdadero (V) o falso (F) a las siguientes proposiciones, segn corresponda:
1.

Una amenaza puede ser desatada por un suceso en donde se involucre una persona,
accin o circunstancia que pueda llegar a producir dao a la organizacin.

2.

Un control fsico al igual que un procedimiento administrativo puede considerarse


como un tipo de contramedida.

3.

Al decir que un usuario se autentic quiere decir que tena autorizacin.

4.

La responsabilidad de autorizar el uso de un SGBD, usualmente recae sobre el DBA.

5.

Los backups de la base de datos sirven para proteger a la base de datos contra ataques
de hackers.

6.

Una vista es considerada como un nivel de seguridad.

7.

Debemos utilizar el cifrado que ofrecen los SGBDs para cifrar toda la informacin
almacenada en la base de datos.

8.

El hardware en el que el SGBD se ejecute debe ser tolerante a fallos.

9.

En Office Access la nica caracterstica de seguridad que ofrece es la concesin de


privilegios con GRANT y REVOKE.

10.

Un certificado digital es un adjunto que se aade a un mensaje electrnico y que se


utiliza con propsitos de seguridad.

Verifique sus aciertos consultando el solucionario qu se encuentra en la parte final de esta gua

Ir a solucionario

37

Gua didctica: Base de Datos Avanzada

SEGUNDO BIMESTRE

SEGUNDO BIMESTRE
7.4. Competencias genricas
COMPETENCIAS
ESPECFICAS
Realiza la gestin
y recuperacin
de informacin
generada en
los sistemas
informticos.
Administrar
y gestionar
bases de datos
empresariales.

INDICADORES DE
APRENDIZAJE

CONTENIDOS
ACTIVIDADES DE APRENDIZAJE
Unidades/Temas

Diferencia los
Unidad 5. Gestin de
diversos tipos transacciones
de transaccin.
5.1. Soporte de
Distingue los
transacciones
problemas
que pueden
5.2. Control de
presentarse con
concurrencia
la concurrencia.
5.3. Recuperacin de
Identifica las
la base de datos
formas de
recuperacin de 5.4. Modelos
la base de datos.
avanzados de
transacciones

Describir
cada una de
las fases del
procesamiento
de consultas

Unidad 6.
Procesamiento de
consultas

4 horas de
autoestudio

Lectura analtica de los temas


del texto bsico.

Desarrollo de ejercicios
prcticos propuestos en el texto
bsico .

Desarrollo de la autoevaluacin
para esta unidad.

Interaccin en el EVA, con el


tutor y compaeros.

Desarrollo de la evaluacin
a distancia cuyos temas se
relacionan con esta unidad.

Realizar un cuadro resumen de


las formas de recuperacin de
una base de datos.

Leer comprensivamente el
Semana 10
captulo 21: Procesamiento de
consultas del texto bsico.
4 horas de
estudio.
Investigar la forma de cmo
se pueden descomponer las
4 horas de
consultas.
interaccin.

6.1. Panormica del


procesamiento de
consultas

Enumerar las
6.3. Numeracin de
estrategias
las estrategias
de ejecucin
de ejecucin
alternativas ms
alternativas
comunes para el
procesamiento
de consultas.

Semana 9

Identificar
las etapas de
descomposicin 6.2. Descomposicin
de consultas.
de consultas

Estudio autnomo de esta


unidad, basado en los temas
indicados en la gua didctica.

CRONOGRAMA
ORIENTATIVO
Tiempo estimado

4 horas de
interaccin.

Resolver la autoevaluacin
planteada en esta unidad.
Revisar los anuncios del EVA.

39

Gua didctica: Base de Datos Avanzada

COMPETENCIAS
ESPECFICAS

INDICADORES DE
APRENDIZAJE

Analiza la
necesidad de
un almacn de
datos en una
organizacin.
Enumera y
describir cada
uno de los
componentes
de un almacn
de datos.
Describe la
funcin y ruta
de cada uno
de los flujos de
datos.

SEGUNDO BIMESTRE

CONTENIDOS
ACTIVIDADES DE APRENDIZAJE
Unidades/Temas
Unidad 7. Conceptos
de almacenes de datos
7.1. Introduccin a
los almacenes de
datos
7.2. Arquitectura de
un almacn de
datos
7.3. Flujos de datos
en un almacn de
datos

Unidades de la 5 - 8

Semana 11 y 12
8 horas de
autoestudio.
8 hora de
interaccin.

Realizar un mentefacto sobre


los almacenes de datos.

Desarrollar el ejercicio
propuesto en el captulo 31:
Conceptos de almacenes de
datos del texto bsico.

Revisar la informacin
planteada en el EVA.

Responder la autoevaluacin
de esta unidad expuesta en la
presente gua didctica.

Aplicacin de autoevaluaciones Semana 15 y 16


de la gua didctica de las
unidades 6-8
8 horas de
autoestudio.
Revisin de foro de consultas al
profesor
8 horas de
interaccin.
Realizacin de ejercicios
propuestos en el EVA

40

Realizar lectura comprensiva


del texto bsico del captulo
13: Conceptos de almacenes
de datos especficamente de
los temas propuestos en esta
unidad.

CRONOGRAMA
ORIENTATIVO
Tiempo estimado

Gua didctica: Base de Datos Avanzada

SEGUNDO BIMESTRE

7.5. Orientaciones especficas para el aprendizaje por competencias

Unidad 5: Gestin de transacciones


Recursos educativos multimedia

Estimada estudiante, le invito a iniciar esta unidad siguiendo paso a paso cada uno de los temas
planteados, pues le ayudarn a conocer el soporte de transacciones y el control de concurrencia en una
base de datos.
Para el desarrollo de esta unidad, vaya revisando conjuntamente con esta gua el captulo 20 del
texto bsico lo referente a Gestin de transacciones.

5.1. Soporte de transacciones


Para comprender este tema es importante recordar que una transaccin es una accin o serie de acciones
llevadas a cabo por un nico usuario o por un programa de aplicacin que lee y/o actualiza el contenido
de la base de datos.
Toda transaccin debe transformar la base de datos llevndola de un estado coherente a otro, aunque se
acepta que la coherencia se viole tempranamente mientras la transaccin est teniendo lugar.
Cuando usted est ejecutando una tarea en la base de datos y esta se completa con xito, decimos
que la transaccin se ha confirmado quedando la base de datos en un estado coherente, pero si por
el contrario, la transaccin no se ejecuta con xito, entonces decimos que la transaccin se aborta, si
se da este ltimo caso entonces ser necesario restaurar la base de datos al estado coherente en el
que se encontraba antes, en este caso se dice que la transaccin se deshace. Tenga presente que una
transaccin confirmada no puede abortarse. Si se le presenta el caso en el que la transaccin confirmada
era un error, entonces debe realizar otra transaccin de compensacin.
De acuerdo al anlisis anteriormente descrito, a continuacin revisemos un resumen de las palabras que
la mayora de lenguajes de manipulacin de datos utilizan para establecer los diferentes estados de las
transacciones.
Muchos lenguajes de manipulacin de datos incluyen las palabras:
- BEGIN
- TRANSACTION
- COMMIT
- ROLLBACK
Si no se especifica alguno de estos limitadores, el Sistema Gestor de Base de Datos (SGBD)
realizar automticamente una operacin de confirmacin (COMMIT) o de deshacer la transaccin
(ROLLBACK) en caso contrario.

41

Gua didctica: Base de Datos Avanzada

SEGUNDO BIMESTRE

5.2. Control de concurrencia


Una vez que hemos conocido lo que es una transaccin y sus diferentes estados, debemos comprender
que algunas bases de datos se utilizan en entornos multiusuario, lo que significa que varios usuarios
pueden acceder a los mismos objetos de la base de datos al mismo tiempo, por esta razn muchos
motores de base de datos gestionan dichos accesos, a esto se lo conoce como control de concurrencia.

Ahora, completemos el estudio de este tema leyendo en el texto bsico al siguiente apartado
Control de concurrencia que lo podr encontrar en el captulo 20 Gestin de transacciones.

5.3. Recuperacin de la base de datos


En este apartado es importante que usted conozca que entre las responsabilidades de un administrador
de base de datos se encuentra la recuperacin de una base de datos, el mismo que consiste en restaurarla
a un estado correcto en caso de fallo.
Para poder restaurarla debe conocer que existen diferentes tipos de fallos que pueden afectar al
procesamiento de la base de datos, por esta razn cada uno de ellos deber ser tratado de una manera
distinta. Para que comprenda mejor, hagamos una analoga con medicina donde para cada enfermedad
se tiene un tratamiento diferente y medicamentos especficos.

Bien, hasta aqu hemos tenido una pequea explicacin de la recuperacin de la base de datos.
Ahora conviene que usted profundice los contenidos leyendo captulo 20 Gestin de transacciones,
especficamente los puntos tratados en el tema Recuperacin de la base de datos.

Funcionalidades de recuperacin
Un Sistema Gestor de Base de Datos (SGBD) debe proporcionar algunas funcionalidades como apoyo a
la recuperacin, para comprender este tema le invitamos a que, como parte de su autoestudio, realice la
siguiente actividad.
ACTIVIDAD RECOMENDADA:

Destaque las funcionalidades de un SGBD como ayuda a la recuperacin, para esto realice un
cuadro sinptico en el que describa las caractersticas ms importantes de cada una de ellas.

5.4. Modelos avanzados de transacciones


En las secciones anteriores hemos aprendido sobre los modelos simples de transacciones, en
este apartado conoceremos que, a diferencia de las transacciones que surgen en las aplicaciones
empresariales tradicionales como por ejemplo las del sector bancario, existen otros tipos avanzados de
aplicaciones de base de datos, por ejemplo aplicaciones de diseo como el asistido por computadora,
cuyas caractersticas son:

42

SEGUNDO BIMESTRE

Gua didctica: Base de Datos Avanzada

Un diseo puede ser muy grande llegando a estar compuesto de millones de componentes.

El diseo no es esttico sino que evoluciona con el tiempo.

Las actualizaciones tienen un largo alcance debido a las relaciones topolgicas, a las relaciones
funcionales, etc.

Es preciso que aprenda sobre cada una de las caractersticas de los modelos avanzados de
transacciones, para esto puede leer en el texto bsico el captulo Gestin de Transacciones, donde
tambin encontrar algunos problemas que se pueden resolver con los protocolos tradicionales de
gestin de transacciones.

Modelo de transacciones anidadas


Revisando este tema usted podr darse cuenta que en este modelo toda la transaccin forma un rbol
o jerarqua de subtransacciones. Existe una transaccin de primer nivel que pueden tener una serie de
transacciones hijas.
En las transacciones anidadas las operaciones de una transaccin pueden ser as mismo transacciones.
Analicemos el siguiente ejemplo (Colouris, 2005)8,
Begin_transaction Reservacin
...
Begin_transaction Vuelo
...
end. {Vuelo}
...
Begin_transaction Hotel
...
end.
...
end.
Como podr darse cuenta dentro de la transaccin Reservacin se ejecutan dos transacciones ms
Vuelo y Hotel, las mismas que tienen iguales caractersticas que la transaccin que las contiene.
De acuerdo al anlisis, podemos decir que una transaccin anidada dentro de otra transaccin conserva
las mismas propiedades que la de sus padres, esto implica, que puede contener as mismo transacciones
dentro de ella. Existen restricciones obvias en una transaccin anidada: debe empezar despus que su
padre y debe terminar antes que l. Ms an, el commit de una subtransaccin es condicional al commit
de su padre, en otras palabras, si el padre de una o varias transacciones aborta, las subtransacciones hijas
tambin sern abortadas.
Las transacciones anidadas proporcionan un nivel ms alto de concurrencia entre transacciones. Ya
que una transaccin consiste de varios transacciones, es posible tener ms concurrencia dentro de
una sola transaccin. As tambin, es posible recuperarse de fallas de manera independiente de cada
8

Coulouris, Procesamiento de transacciones [En lnea]. Disponible en: http://ldc.usb.ve/~yudith/docencia/Telematica/


TemasSistDist/ProcesamientoTransII.pdf [Consulta 10-06-2011]..

43

Gua didctica: Base de Datos Avanzada

SEGUNDO BIMESTRE

subtransaccin. Esto limita el dao a una parte ms pequea de la transaccin, haciendo que el costo
de la recuperacin sea menor.

El autor del texto bsico en el captulo 20: Gestin de Transacciones, expone de una manera
detallada el modelo de transacciones anidadas y emulacin de las transacciones anidadas
utilizando puntos de salvaguarda. Le invito a revisar este tema detenidamente.

Ha completado con xito el estudio de la presente unidad, debo recordarle que a continuacin se
proponen algunas actividades recomendadas que sera bueno que las desarrolle.
ACTIVIDADES RECOMENDADAS:

Culminemos el estudio de esta unidad realizando las siguientes actividades que le ayudarn
a reforzar lo aprendido:
- Desarrolle los literales (a), (c) y (d) del ejercicio 20.18 propuesto en el texto bsico.
Recuerde que puede solicitar ayuda a su tutor mediante el campus virtual o telefnicamente.
Interactividad virtual
Fortalezca sus criterios y conocimientos respecto al tema y a la asignatura ingresando
peridicamente a travs del campus virtual (http://www.utpl.edu.ec)
Desde su aula virtual de la asignatura, puede conocer los anuncios de su profesor, y todos los
participantes tienen acceso a los foros de discusin donde su aporte es valioso y es an ms significativo
si la participacin involucra conversacin con los integrantes del curso.
En nuestro caso, la participacin en los foros de discusin es obligatoria, dado quetienen una
calificacin en su evaluacin a distancia.

44

Gua didctica: Base de Datos Avanzada

SEGUNDO BIMESTRE

Autoevaluacin 5

Una vez que hemos concluido el estudio de la presente unidad, desarrollemos las siguientes
cuestiones de repaso sin ayuda del texto bsico; luego verifique sus respuestas en la parte
final de la presente gua.
Conteste verdadero (V) o falso (F) a las siguientes proposiciones, segn corresponda:
1.

Una transaccin es una unidad de medida del rendimiento de la base de datos.

2.

Uno de los potenciales problemas producidos por la concurrencia es el problema de


la actualizacin perdida.

3.

Una planificacin no serie es aquella en la que las operaciones de cada transaccin se


ejecutan consecutivamente sin que se entrelacen operaciones de otras transacciones.

4.

Una de las funcionalidades como ayuda a la recuperacin del motor de base de


datos es un mecanismo de copia de seguridad mediante el que se hagan copias de
seguridad semanales del SGBD.

5.

Se conoce como transaccin anidada aquella que no se relaciona o no contiene a


ninguna otra transaccin.

6.

El objetivo de la serializabilidad es encontrar planificaciones no serie que permitan


ejecutar concurrentemente las transacciones sin que estas interfieran entre s.

7.

Si un conjunto de transacciones se ejecuta concurrentemente, decimos que la


planificacin es correcta si produce los mismos resultados que una transaccin no
serie.

8.

Un punto de comprobacin es el punto de sincronizacin entre la base de datos y el


archivo de registro de transacciones.

9.

Los puntos de comprobacin se programan a intervalos indefinidos.

10.

Escribir en el almacenamiento secundario todas las entradas de registro de la memoria


principal es una operacin de los puntos de comprobacin.

Verifique sus aciertos confrontando con el solucionario respectivo

Ir a solucionario

45

Gua didctica: Base de Datos Avanzada

SEGUNDO BIMESTRE

Unidad 6: Procesamiento de consultas


Recursos educativos multimedia

Al empezar esta unidad es importante que recuerde que cuando usted estaba iniciando el estudio de
las bases de datos, entre las tareas bsicas que realizaba eran consultas para obtener informacin de las
mismas, una vez que conoce cmo se las crea es importante que aprenda su manera de trabajo, es por
esto que le invitamos para que revise detenidamente cada tema propuesto en esta unidad.
Con el estudio de la presente unidad se conocer el procesamiento de las consultas en una base de
datos y cul es la mejor forma de volverlas eficientes.

Para el desarrollo de esta unidad, revise conjuntamente con esta gua el captulo 21 del texto bsico.

6.1. Panormica del procesamiento de consultas


Una vez que ha aprendido sobre las transacciones que se ejecutan en una base de datos, es importante
que revisemos el procesamiento de las consultas, este es un tema que ser de mucho inters para usted,
pues la consulta de datos es una de las tareas ms comunes que realizamos en una base de datos, es por
esta razn que entre los objetivos del procesamiento de consultas tenemos:
-

Mejorar el rendimiento de las consultas a travs de la utilizacin de algoritmos eficientes.

Transformar una consulta escrita en un lenguaje de alto nivel, normalmente SQL, en una estrategia
de ejecucin correcta y eficiente.

Fases del procesamiento de consultas


Tomando como referencia el texto bsico realice un diagrama en el que se describa cada una de las fases
del procesamiento de consulta, indicando que entrega y que recibe cada fase.

6.2. Descomposicin de consultas


La descomposicin de consultas, transforma una consulta de alto nivel en una consulta de algebra
relacional y comprueba que dicha consulta sea sintctica y semnticamente correcta.
comprender las etapas tpicas de la descomposicin de consultas vamos revisando
Para
detalladamente cada una de ellas en el texto bsico en el captulo 21: Procesamiento de consultas
y tratando unos pequeos ejemplos que le ayudarn a comprender mejor este tema.

Anlisis: habamos revisado en la seccin anterior que el procesamiento de consultas se asemeja a la


compilacin de los lenguajes de programacin, por lo cual en esta etapa se analiza la consulta lxica y
sintcticamente utilizando las tcnicas de los compiladores.

46

SEGUNDO BIMESTRE

Gua didctica: Base de Datos Avanzada

En el anlisis lxico lo que se verifica es que tanto las palabras que pertenecen al lenguaje como los
nombres de identificadores estn escritos correctamente, mientras que en el anlisis sintctico verifica
que la expresin que refleja la consulta est escrita en la estructura correcta.
Por ejemplo: si tenemos una consulta como la siguiente:
$ELECT * FRON WHERE *
El resultado del anlisis nos devolver error por las siguientes razones:
a)

En el anlisis lxico nos devolver error en la palabra $ELECT porque esa palabra no pertenece a
un lenguaje de consulta.

b)

FRON, lo tomar como un identificador puesto que la palabra reservada correcta es FROM.

c)

Sintcticamente devolver error porque no va a encontrar una estructura correcta despus del
primer asterisco (*).

Normalizacin
La normalizacin convierte la consulta en una forma normalizada que pueda manipularse fcilmente.
Son comnmente empleadas la forma normal conjuntiva y la disyuntiva.
En este punto le propongo realizar un cuadro comparativo de estas dos formas normales.
Anlisis semntico
Al igual que en los compiladores, el anlisis semntico en el procesamiento de las consultas, verifica que
las consultas estn correctamente formuladas o que no sean contradictorias.
Este anlisis es independiente de la extensin o estado almacenado en la BD, por lo que, si puede derivarse
que dicha consulta ser siempre vaca; entonces, dicha consulta ser invalidada semnticamente.

Ahora

bien apoymonos en la figura 21.3 del tema Anlisis semntico del captulo 21
Procesamiento de consultas, para comprender mejor este tema.

Simplificacin
Cuando usted realiza una consulta es importante que esta sea lo ms resumida posible para disminuir
el trabajo que tiene que ejecutar el motor de base de datos, para lograr este objetivo puede utilizar
la simplificacin de expresiones la misma que reduce la complejidad de la consulta utilizando
fundamentalmente equivalencias o leyes lgicas basadas en el lgebra de Boole o Leyes de Morgan.

En el captulo 21 Procesamiento de consultas, usted podr encontrar las leyes antes mencionadas
as como tambin un ejemplo para su mejor comprensin.

47

Gua didctica: Base de Datos Avanzada

SEGUNDO BIMESTRE

Reestructuracin de la consulta
Una vez normalizada, contrastada semnticamente y simplificada la expresin de una consulta, la etapa
final de la descomposicin de una consulta, se reestructura para obtener una implementacin ms
eficiente.
En la siguiente pgina de Internet usted podr encontrar informacin adicional acerca de la
descomposicin de consultas:
-

Departamento de Lenguajes y Sistemas Informticos. Universidad de Sevilla. Proceso de


consultas en bases de datos relacionales. [En lnea] http://www.lsi.us.es/docencia/get.
php?id=4560 [Consulta 12-02-2011].

6.3. Numeracin de las estrategias de ejecucin alternativas


Para garantizar la eficiencia del proceso de optimizacin de consultas un aspecto fundamental es el
espacio de bsqueda de posibles estrategias de ejecucin y el algoritmo de numeracin que se utilice
para explorar este espacio en bsqueda de una estrategia ptima.
Para comprender cmo puede reducirse el espacio de bsqueda y cmo se lo puede procesar de manera
eficiente, vamos a examinar dos cuestiones que tienen relevancia; el concepto de pipeline y rboles
lineales.
Pipeline: tambin se lo conoce como procesamiento en cadena o procesamiento de flujos, consiste en
procesar en cadena los resultados de las distintas operaciones sin crear una relacin temporal para
almacenar el resultado intermedio.
Arboles lineales: se denominan as aquellas estructuras que hacen referencia al modo en que las
operaciones se combinan para ejecutar la consulta; es decir, solo se permite que el lado izquierdo de
una combinacin sea el resultado de otra combinacin anterior.
Ha concluido el estudio de la unidad 6, con el mismo esfuerzo y atencin, le invito a continuar con el
estudio de la unidad 7. Adems, le recuerdo que es importante que desarrolle las actividades de apoyo
que se encuentran a continuacin.
ACTIVIDADES RECOMENDADAS:

Desarrolle lo solicitado a continuacin y revise aquello que no est suficientemente claro.


Desarrolle los literales (a), (b) y (c) del ejercicio 21.17 propuesto en el texto bsico. En el
captulo 21 Procesamiento de consultas.

48

Gua didctica: Base de Datos Avanzada

SEGUNDO BIMESTRE

Autoevaluacin 6

Es necesario que repasemos lo aprendido, para ello desarrolle la actividad siguiente de


manera que evaluemos lo que se ha aprendido en la presente unidad, para ello le invitamos
a desarrollar lo siguiente:
Conteste verdadero (V) o falso (F) a las siguientes proposiciones, segn corresponda:
1.

La fase de optimizacin de consultas se caracteriza porque se da en tiempo de


ejecucin.

2.

La fase de descomposicin de la consulta le enva a la fase de optimizacin de la


consulta la expresin de algebra relacional.

3.

El anlisis semntico se refiere a la estructura correcta de la consulta.

4.

La forma disyuntiva permite generar subconsultas cuyos resultados se pueden


fusionarse mediante joins y/o restricciones.

5.

Para obtener una consulta eficiente acta la etapa de reestructuracin de la consulta.

6.

La etapa de normalizacin del procesamiento de consulta convierte la consulta en


una forma normalizada que pueda manipularse ms fcilmente.

7.

Los objetivos de la etapa de anlisis son detectar las cualificaciones redundantes,


eliminar las subexpresiones comunes y transformar la consulta en otra.

8.

Las actualizaciones realizadas en las base de datos se las registra en el archivo de


transacciones

9.

La copia de seguridad de la base de datos puede utilizarse en caso de que sta resulte
daada o destruida.

10.

Las transacciones representan la unidad de recuperacin bsica de un sistema de


base de datos

Verifique sus aciertos con las respuestas dadas en el solucionario.

Ir a solucionario

49

Gua didctica: Base de Datos Avanzada

SEGUNDO BIMESTRE

Unidad 7: Conceptos de almacenes de datos


En esta unidad conoceremos soluciones que permiten a una organizacin analizar su informacin y de
esta manera tomar decisiones con datos reales.
Para el desarrollo de esta unidad, vaya revisando conjuntamente con esta gua el captulo 31
Conceptos de almacenes de datos que se encuentra en el texto bsico.

7.1. Introduccin a los almacenes de datos


En esta unidad es importante que usted conozca y comprenda la utilidad que algunas soluciones de
inteligencia de negocio le pueden dar a una organizacin.
Como usted conoce, el crecimiento agigantado, que experimentan las organizaciones hoy en da,
ha dado lugar al surgimiento de tecnologas que les ayudan a automatizar sus procesos de toma de
decisiones para mantenerse competitivos en el mercado en el cual se desenvuelven, estas soluciones se
les denomina OLAP (On-Line Analytical Processing).
Un almacn de datos es una solucin OLAP, tambin se lo conoce como data warehouse, se basa en
estructuras multidimensionales (cubos) en las que se almacena la informacin calculando previamente
todas las combinaciones de todos los niveles de todas las aperturas de anlisis9.
Uno de los problemas que resuelve la implementacin de un almacn de datos es la obtencin catica
de informacin de diferentes fuentes.
Note en la figura 7.1 que en una organizacin pueden existir varias fuentes de informacin y por este
hecho al necesitar ciertos datos deben recurrir a algunas de ellas, volvindose un proceso tedioso y
poco confiable con respecto a la informacin obtenida, pues no tienen un mtodo establecido para su
generacin.

Figura 7.1. Obtencin catica de informacin (Academia ALBI Microsoft, 2008).

9 Microsoft. Academia Latinoamericana de Business Intelligence [En lnea][Consulta 2008].

50

Gua didctica: Base de Datos Avanzada

SEGUNDO BIMESTRE

Un data warehouse resuelve fcilmente el problema antes mencionado porque se encarga de centralizar
en un solo repositorio la informacin de las reas de inters de una organizacin.
Comparacin de los sistemas OLTP y los almacenes de datos o soluciones OLAP10
En la siguiente tabla se muestran las diferencias que son clave entre un sistema OLPT y un DW.

Objetivos
Orientacin
Vigencia de los datos
Granularidad de los datos

OLPT
Operacionales
A la aplicacin
Actual
Detallada

Organizacin

Organizacin normalizada

Cambios en los datos

Continuos

Datawarehouse
Informacin para la toma de decisiones
Al sujeto
Actual + histrico
Detallada + resumida
Organizacin estructurada en funcin del anlisis
a realizar
Estable

Una vez que hemos revisado temas importantes sobre los almacenes de datos le invitamos a
completar el estudio de este tema leyendo en el texto bsico desde el captulo 31: Conceptos de
almacenes de datos, el tema Introduccin a los almacenes de datos.

De acuerdo a lo aprendido, le sugiero empezar a desarrollar la actividad complementaria propuesta en


esta unidad.

7.2. Arquitectura de un almacn de datos


Continuemos en la explicacin del siguiente tema analizando la figura 7.2; vamos identificando y
describiendo cada componente de la arquitectura del data warehouse.

Figura 7.2. Arquitectura de un almacn de datos11 (Cseres, 2009).

10 Microsoft. Academia Latinoamericana de Business Intelligence [En lnea][Consulta 2008].


11 Cceres, M. Data Warehouse [En lnea]. Disponible en: http://hp.fciencias.unam.mx/~alg/bd/dwh.pdf [Consulta 12-022011].

51

Gua didctica: Base de Datos Avanzada

SEGUNDO BIMESTRE

Datos operacionales:12
Usted podr notar que las fuentes de los datos para el almacn de datos pueden ser:
-

Mayoritariamente precedentes de sistemas mainframe.

Datos de estaciones de trabajo o servidores privados.

Sistemas externos como las bases de datos comerciales, de proveedores o clientes, o incluso de
Internet.

Datos departamentales almacenados en Sistemas Propietario.

Repositorio de datos
Tambin se lo conoce como ODS (Operational Data Store), el mismo que es un repositorio de datos
operacionales actuales e integrados que se utiliza para el anlisis.
Gestor de carga
Segn acabamos de revisar, los orgenes de datos de un data warehouse es muy diverso y cada uno de
ellos aporta para formar un repositorio centralizado, esto da origen a la necesidad de tener que realizar un
procedimiento que permita estandarizar la diversidad de los datos que encontramos, ante esta situacin
surge un proceso llamado ETL (Extraction, Transformation, Load), el mismo que es el encargado de
realizar las funciones de extraccin de las fuentes de datos (transaccionales o externas), transformacin
(limpieza, consolidacin principalmente) y la carga del almacn de datos, as como tambin hacer el
refresco del almacn (operacin peridica que propaga los cambios de las fuentes externas al almacn
de datos). Con esto evitaremos el problema de presentar datos errneos o faltantes la calidad de la
informacin, generada por su solucin, ser confiable.
Gestor del almacn de datos
Con el procedimiento anterior usted tendr en su solucin los datos listos para que sean utilizados y
pueda realizar las operaciones relacionadas con la gestin de los datos dentro del almacn utilizando
herramientas especficas que realizan operaciones como la transformacin de datos para la incorporacin
de stos en las tablas del almacn de datos, la creacin de ndices y vistas de las tablas base, creacin de
copias de seguridad y archivado de datos, adems del anlisis de los datos para garantizar la coherencia
de los mismos13.
que conozca ms detenidamente sobre los diferentes datos que pueden encontrarse en un
Para
almacn de datos, le invito a revisar el captulo 31 Conceptos de almacenes de datos, del texto
bsico especficamente el tema Gestor del almacn de datos.

Herramientas de acceso para usuarios


En el ltimo nivel de la figura 7.2 (revisada anteriormente en esta gua), usted puede notar que es la
parte en que los usuarios utilizan la solucin data warehouse, para esto necesitan herramientas que les
12 Navarro, S.; Garca, G. Modelos avanzados de base de datos. [En lnea]. Disponible en: http://alarcos.inf-cr.uclm.es/doc/
bbddavanzadas/08-09/FUNCIONALIDAD%204.pdf [Consulta 12-02-2011].
13 Cceres, M. Data Warehouse [En lnea]. Disponible en: http://hp.fciencias.unam.mx/~alg/bd/dwh.pdf [Consulta 12-022011].

52

SEGUNDO BIMESTRE

Gua didctica: Base de Datos Avanzada

proporcione acceso a la informacin generada y proceder a la toma de decisiones estratgicas. Por tanto
la comunicacin entre el almacn de datos y la herramienta ser mediante consultas de tipo ad-hoc.

7.3. Flujos de datos en un almacn de datos

Estimado estudiante: para estudiar este tema, revisemos la figura 31.2, del texto bsico, en el
captulo 31: Conceptos de almacenes de datos.

Note que existen los siguientes tipos de flujos de datos: de entrada, ascendente, descendente, de salida,
metaflujo.
Para comprender mejor este tema, piense en una organizacin que necesite obtener cierta informacin
de sus orgenes de datos por ejemplo puede ser datos de las personas que en ella trabajan, para lo cual
necesitara la base de datos de un sistema de recursos humanos, con este ejemplo le invito a pensar cmo
sera el flujo de los datos en un sistema data warehouse, guese analizando detenidamente el captulo
31 Conceptos de almacenes de datos, del texto bsico especficamente el tema Flujos de datos en un
almacn de datos; y, realice un diagrama en que resuma lo aprendido acerca de los flujos de datos.
Le recomendamos la siguiente pgina de Internet, donde se encuentra una explicacin ms
detallada de este tema:
-

Cceres, M. Data Warehouse [En lnea]. Disponible en: http://hp.fciencias.unam.mx/~alg/bd/


dwh.pdf [Consulta 12-02-2011]http://hp.fciencias.unam.mx/~alg/bd/dwh.pdf

Hasta ahora ha revisado temas importantes que le servirn de mucha ayuda en su vida profesional,
con el mismo empeo contine estudiando el captulo 8. Y desarrolle las actividades propuestas a
continuacin.
ACTIVIDADES RECOMENDADAS:

En esta parte podr aplicar lo aprendido, si comete errores ser un indicador para que
vuelva a revisar los temas de la presente unidad.
Desarrolle el ejercicio 31.15 del texto bsico. En el captulo 31 Conceptos de almacenes de datos.

53

Gua didctica: Base de Datos Avanzada

SEGUNDO BIMESTRE

Autoevaluacin 7

Para medir su comprensin del tema mencionado en este captulo, por favor desarrolle las
siguientes preguntas:
Conteste verdadero (V) o falso (F) a las siguientes proposiciones, segn corresponda:
1.

La diferencia entre un sistema OLTP y un sistema OLAP es que el segundo sirve para
las operaciones diarias de una organizacin.

2.

Un almacn de datos es una coleccin de datos clasificada por temas, integrada,


variable en el tiempo y no voltil.

3.

Una de las ventajas de los almacenes de datos es que permiten tener datos actualizados
en lnea.

4.

Un almacn de datos proporciona una ventaja competitiva para la organizacin que


lo implementa.

5.

El ETL es la etapa del data warehouse en la que se le presenta la informacin al usuario.

6.

En un sistema data warehouse puede existir informacin obtenida de varias fuentes


de datos.

7.

Un sistema OLTP proporciona mayor productividad de los responsables de la toma de


decisiones.

8.

Un OLAP sirve a un nmero relativamente bajo de usuarios de tipo gerencial.

9.

El gestor del almacn de datos realiza todas las operaciones asociadas con el gestor
de los datos del almacn.

10.

El flujo de datos ascendente se da en los procesos asociados con la adicin de


valor a los datos del almacn, mediante los procesos de resumen, empaquetado y
distribucin de los datos.

Verifique sus respuestas consultando el solcucionario.

Ir a solucionario

54

Gua didctica: Base de Datos Avanzada

SEGUNDO BIMESTRE

Unidad 8: Diseo de almacenes de datos


Recursos educativos multimedia

Estimado estudiante, en la unidad anterior aprendimos los conceptos bsicos sobre almacenes de datos,
en esta unidad estudiaremos los problemas asociados con el diseo de base de datos para funcionar
como almacenes de datos, de esta manera usted tendr una visin ms clara de la construccin de
soluciones OLAP.
Para el desarrollo de esta unidad, vaya revise, conjuntamente con esta gua, el captulo 32: Diseo
de almacenes de datos, del texto bsico.

8.1. Diseo de la base de datos para un almacn de datos


Una vez que hemos aprendido qu es un almacn de datos, su arquitectura y diferentes esquemas,
corresponde ahora aprender sobre el diseo del mismo, para esto es importante primero conocer
qu requisitos de usuario son los ms importantes y qu datos debemos considerar en primer lugar?
debemos reducir el alcance del proyecto para que sea ms manejable y al mismo tiempo proporcionar
una infraestructura que pueda posteriormente crecer hasta convertirse en un almacn de datos
completo de mbito corporativo?, para empezar un proyecto de almacn de datos, estas son variables
importantes y determinantes al momento de disear un almacn de datos.
Para construir un data warehouse se necesitan herramientas para ayudar a la migracin y a la
transformacin de los datos hacia el almacn. Una vez construido, se requieren medios para manejar
grandes volmenes de informacin.
Para abordar un proyecto de data warehouse es necesario hacer un estudio de algunos temas generales
de la organizacin o empresa, los cuales se describen a continuacin14:
-

Situacin actual de partida

Tipo y caractersticas del negocio

Entorno tcnico

Expectativas de los usuarios

Etapas de desarrollo

- Prototipo
- Piloto
-

Prueba del concepto tecnolgico

14 WIKIPEDIA, [En lnea] [Disponible en]http://es.wikipedia.org/wiki/Almac%C3%A9n_de_datos[Consultada 07-02-2011].

55

Gua didctica: Base de Datos Avanzada

SEGUNDO BIMESTRE

8.2. Modelado de la dimensionalidad


En la unidad anterior revisamos y aprendimos que una solucin OLAP tiene significativas diferencias
entre una solucin OLTP, en este apartado conoceremos sobre la estructura de almacenamiento de un
almacn de datos, el componente de base de datos de un almacn de datos se describe utilizando una
tcnica denominada modelado de dimensionalidad.
En el mundo del modelado multidimensional encontramos dos componentes bsicos: estos son los
hechos y las dimensiones.
Hechos: proporcionan una informacin cuantitativa sobre las caractersticas del negocio que queremos
analizar. Su finalidad es proporcionar informacin necesaria para la gestin, facilitando el conocimiento del
negocio o proceso a modelar, y fundamentar, entre otras, la toma de decisiones, facilitar los procesos de
marketing (ofertas y promociones), fidelizar clientes, valorar el desempeo de los trabajadores, etc.
Dimensiones: buscan determinar un contexto para el anlisis de los hechos. Se trata de grupos homogneos
de elementos, en muchas ocasiones, jerarquizados. Su papel es promocionar la informacin contenida en los
hechos. Cada tabla de dimensin tiene una clave principal simple que se corresponde con exactamente uno
de los componentes de la clave compuesta de la tabla de hechos.

Para aprender sobre este tema, por favor, revisemos en el captulo 31 Diseo de almacenes de

datos, como podr darse cuenta existen dos modelos que son los ms conocidos y utilizados, el
diagrama en estrella y el diagrama copo de nieve. Para comprender mejor este tema realice un
cuadro comparativo en que destaque semejanzas y diferencias de cada uno de estos diagramas.

Ahora bien, una vez que ha comprendido sobre estos diagrama le invito a analizar la figura 32.1 y 32.2 y
confirme las comparaciones realizadas.

8.3. Metodologa de diseo de bases de datos para almacenes de datos


Una vez que hemos conocido sobre los diagramas de base de datos es preciso que revisemos sobre una
metodologa para el diseo de los almacenes de datos.
Aplique esta metodologa en el ejercicio propuesto en las actividades recomendadas de esta unidad.
Paso 1: seleccin del proceso
Para realizar un mercado de datos es necesario tomar en cuenta que debe ser aquel que resulte ms
probable acabar en el tiempo previsto, con el presupuesto asignado y que permita responder a las
cuestiones que ms importancia tengan desde el punto de vista comercial. Por esta razn para cuando
usted construya un almacn de datos debe centrarse en las necesidades principales de la organizacin
beneficiaria del almacn.
Empecemos con el desarrollo del ejercicio propuesto, seleccionando el proceso a seguir.

56

SEGUNDO BIMESTRE

Gua didctica: Base de Datos Avanzada

Paso 2: seleccin de la granularidad


Cuando se extrae los datos de una fuente de datos, se debe considerar el nivel de detalle con que se
necesita los datos, a esto se le conoce como granularidad, una vez seleccionada usted podr identificar
las dimensiones de dicha tabla.
Revisemos la figura 32.5 del texto bsico y note que en la tabla de hechos se muestran varias medidas
que muestran el nivel de detalle de los datos que se desean medir, esta es la informacin que ser
presentada para la toma de decisiones.
Ahora que ya conoce lo que es la granularidad indique la misma en el ejercicio que estamos desarrollando.
Paso 3: identificacin y conformacin de las dimensiones
Para entender mejor este tema, pongamos como ejemplo un reporte que se genera en un sistema
OLTP, para poder realizarlo usted debe conocer qu es lo que el usuario necesita saber, para lo cual
debe preguntar especficamente qu criterios deben ser medidos; estos criterios son las diferentes
agrupaciones en las que se van a presentar los datos y es a lo que en un almacn de datos se lo conoce
como dimensiones.
Las dimensiones se disean y construyen de acuerdo a los procesos de negocio definidos por el cliente,
organizan los datos en funcin de un rea de inters para los usuarios.
Una dimensin provee al usuario de un gran nmero de combinaciones e intersecciones para analizar
datos. Cada dimensin se define por su clave primaria que sirve para mantener la integridad referencial
en la tabla de hechos a la que se relaciona.
Puede existir que alguna dimensin aparece en dos mercados de datos, deber ser exactamente la
misma direccin, o una de ellas tendr que ser un subconjunto matemticos de la otra, si esto sucede
entonces es una dimensin conformada.
Identifique las dimensiones que deben ser consideradas en el ejercicio que estamos desarrollando.
Paso 4: seleccin de los hechos
Un hecho corresponde a eventos que ocurren dinmicamente en el negocio de la empresa.
Todos los hechos deben expresarse segn el nivel de granularidad elegido. Pueden aadirse hechos
adicionales a cualquier tabla de hechos en un instante posterior, siempre y cuando los nuevos hechos
sean coherentes con la granularidad de la tabla.
Seleccione el hecho del cual obtendremos diferentes resultados de acuerdo a las dimensiones que
identificamos en el paso anterior.
Paso 5: almacenamiento de los valores precalculados en la tabla de hechos
Los valores precalculados son las medidas que se calculan en el cubo en base a los valores de las medidas
naturales.

57

Gua didctica: Base de Datos Avanzada

SEGUNDO BIMESTRE

El sentido de la expresin medidas calculadas es muy amplio y engloba a cualquier manipulacin de las
medidas naturales que nos faciliten el anlisis de los hechos.
En una medida calculada puede haber:

Clculos matemticos.
Expresiones condicionales.
Alertas.
A partir del hecho mencionado en el paso anterior obtenga las medidas que van a ser presentadas en el
ejercicio que estamos desarrollando.
Paso 6: terminacin de las tablas de dimensiones
En este paso se debe aadir las descripciones textuales a las dimensiones como sea posible. La utilidad
de un mercado de datos est determinada por el mbito y la naturaleza de los atributos de las tablas de
dimensin.
Identifique en el ejercicio que estamos desarrollando las descripciones textuales a las dimensiones antes
identificadas.
Paso 7: seleccin de la duracin de la base de datos
En este paso es importante precisar hasta qu momento del pasado se debe retroceder la tabla de
hechos. Cunto ms antiguos son los datos, ms probable es que existan problemas a la hora de leer e
interpretar los archivos o cintas antiguos.
Paso 8: control de las dimensiones lentamente cambiantes
Existen tres tipos de dimensiones lentamente cambiantes: tipo 1, en el que se sobrescribe un atributo de
dimensin modificado, tipo2, el que en un atributo de dimensin modificado hace que se cree un nuevo
registro de dimensin, y el tipo 3, en el que un atributo de dimensin modificado hace que se cree un
atributo alternativo.
Paso 9: seleccin de las prioridades de consulta y de los modos de consulta
A la hora de seleccionar las prioridades y modos de consulta es importante que usted tome en cuenta los
problemas ms crticos que afecta a la percepcin que el usuario final tiene del mercado de datos, estos
son, la ordenacin fsica de la tabla de hechos en el disco y la presencia de resmenes o agregaciones
precalculados.

Ahora bien, para completar este tema revise el captulo 32 Diseo de almacenes de datos,
especficamente cada uno de los pasos de la metodologa, luego seleccione una organizacin y
simule la creacin de una solucin OLAP utilizando la metodologa planteada.

58

SEGUNDO BIMESTRE

Gua didctica: Base de Datos Avanzada

Hemos terminado el estudio de la presente unidad. Recuerde que, adems, cuenta con las actividades
adicionales que le ayudarn a enriquecer sus conocimientos.
ACTIVIDADES RECOMENDADAS:

Es importante para completar el estudio de esta unidad que realice las siguientes actividades
adicionales:
Desarrolle el ejercicio 31.11 del texto bsico. En el captulo 32 Diseo de almacenes de datos.
Elabore el caso de estudio propuesto en el anexo A
Interactividad a travs de los foros de campus virtual
Una vez que hemos terminado de revisar los temas de esta unidad, ingrese al campus virtual
(http://www.utpl.edu.ec) y participe con sus compaeros.
Revise cada uno de los anuncios de su profesor y los foros planteados e interacte con su opinin
y planteando sus inquietudes si las tuviere, esto le ayudar a reforzar sus conocimientos.

59

Gua didctica: Base de Datos Avanzada

SEGUNDO BIMESTRE

Autoevaluacin 8

Culminando con el estudio y anlisis de la presente unidad, debemos retroalimentar lo


aprendido respondiendo a las siguientes inquietudes:
Conteste verdadero (V) o falso (F) a las siguientes proposiciones, segn corresponda:
1.

Existen dos tipos de diagramas ms conocidos para un almacn de datos, el diagrama


en estrella y copo de nieve.

2.

En la mayora de modelos de un almacn de datos, sus datos se encuentran


normalizados.

3.

La granularidad consiste en identificar el nmero de tablas que contendr una


solucin OLAP.

4.

Un diagrama multidimensional es aquel que tiene una tabla de hechos y varias


dimensiones que giran alrededor de un hecho.

5.

Las dimensiones son grupos homogneos de elementos, en muchas ocasiones,


jerarquizados.

6.

En los hechos se encuentran las medidas que son los valores que van a ser analizados
para la toma de decisiones.

7.

Mientras mayor granularidad exista mayor ser el nivel de detalle.

8.

Una dimensin puede o no tener correspondencia con la tabla de hechos.

9.

El diagrama copo de nieve es una variacin del modelo en estrella en el que las
dimensiones contienen datos desnormalizados.

10.

Un sistema OLAP se representa con un diagrama multidimensional.

Verifique sus aciertos consultando el solucionario respectivo.


FELICITACIONES
Hemos llegado al final de nuestra asignatura, el camino ha sido duro pero con esfuerzo y dedicacin ha ido
cosechando muchas satisfacciones. Muchos xitos !!

Ir a solucionario

60

Gua didctica: Base de Datos Avanzada

SOLUCIONARIO

8. Solucionario
UNIDAD 1
Pregunta

Respuesta

1.

2.

3.

4.

5.

6.

7.

8.

9.

10.

61

Gua didctica: Base de Datos Avanzada

SOLUCIONARIO

UNIDAD 2

62

Pregunta

Respuesta

1.

2.

3.

4.

5.

6.

7.

8.

9.

10.

Gua didctica: Base de Datos Avanzada

SOLUCIONARIO

UNIDAD 3
Pregunta

Respuesta

1.

2.

3.

4.

5.

6.

7.

8.

9.

10.

11.

12.

63

Gua didctica: Base de Datos Avanzada

SOLUCIONARIO

UNIDAD 4

64

Pregunta

Respuesta

1.

2.

3.

4.

5.

6.

7.

8.

9.

10.

Gua didctica: Base de Datos Avanzada

SOLUCIONARIO

UNIDAD 5
Pregunta

Respuesta

1.

2.

3.

4.

5.

6.

7.

8.

9.

10.

65

Gua didctica: Base de Datos Avanzada

SOLUCIONARIO

UNIDAD 6

66

Pregunta

Respuesta

1.

2.

3.

4.

5.

6.

7.

8.

9.

10.

Gua didctica: Base de Datos Avanzada

SOLUCIONARIO

UNIDAD 7
Pregunta

Respuesta

1.

2.

3.

4.

5.

6.

7.

8.

9.

10.

67

Gua didctica: Base de Datos Avanzada

SOLUCIONARIO

UNIDAD 8

68

Pregunta

Respuesta

1.

2.

3.

4.

5.

6.

7.

8.

9.

10.

SOLUCIONARIO

Gua didctica: Base de Datos Avanzada

8.1. Solucin a las preguntas de ensayo


Unidad 1

69

Gua didctica: Base de Datos Avanzada

SOLUCIONARIO

Unidad 2
Asumiendo que los identificadores de cada tabla son clave primaria y tienen asociado un ndice,
definiremos ndices para los atributos restantes.
Relacin USUARIO
Se recomienda indexar los atributos apelUsuario, nomUsuario y crear un ndice compuesto entre ambos
campos, separado por un espacio en blanco.

CREATE INDEX idx_apelUsuario ON USUARIO(apelUsuario);


CREATE INDEX idx_nomUsuario ON USUARIO(nomUsuario);
CREATE INDEX idx_apelUsuario ON USUARIO(apelUsuario+ +nomUsuario);
Relacin PRSTAMO
Se recomienda indexar los atributos fechaP y fechaD.
CREATE INDEX idx_fechaP ON PRESTAMO(fechaP);
CREATE INDEX idx_fechaD ON PRESTAMO(fechaD);
Relacin AUTOR
Se recomienda indexar el atributo nomAutor.

CREATE INDEX idx_nomAutor ON AUTOR(nomAutor);


Relacin MAT_BIBLIO
Se recomienda indexar los atributos ttuloMatBiblio, editorial, pas, ao.

CREATE INDEX idx_ttuloMatBiblio ON MAT_BIBLIO(ttulo Matbiblio);


CREATE INDEX idx_editorial ON MAT_BIBLIO(editorial);
CREATE INDEX idx_pas ON MAT_BIBLIO(pas);
CREATE INDEX idx_ao ON MAT_BIBLIO(ao);

70

SOLUCIONARIO

Gua didctica: Base de Datos Avanzada

Unidad 3
Una forma de distribucin de los datos sera la siguiente:

71

DI CTI ONARY

9. Anexos

TH ESA UR US

Gua didctica: Base de Datos Avanzada

ANEXOS

El presente material ha sido reproducido con fines netamente didcticos, cuyo


objetivo es brindar al estudiante mayores elementos de juicio para la comprensin
de la materia, por lo tanto no tiene fin comercial.
Resolver el siguiente ejercicio:

Caso de estudio1

Escenario
La Distribuidora Latinoamericana de Alimentos (DLA) se dedica a la
comercializacin de productos comestibles y bebidas a travs de sus
hipermercados y supermercados.

Si bien cuenta con una amplia e importante cantidad de locales


en la Repblica Argentina, Brasil y Uruguay, un claro objetivo a
mediano plazo es inaugurar locales en el resto de los pases que
conforman el MERCOSUR.

Necesidad: los analistas de DLA, por pedido de sus directivos, necesitan realizar informes en donde
se pueda analizar:

La cantidad de unidades vendidas en los pases que alcanza el mercado actual.


El coste inducido en cada unidad vendida.
El valor de venta de cada producto.
La ganancia obtenida en la venta de cada producto.

Academia Latinoamericana de Business Intelligence. [En lnea] [Consultada 2008] Actualmente no est disponible.

73

Gua didctica: Base de Datos Avanzada

ANEXOS

Esta informacin, requiere que sea presentada por zona geogrfica y sucursal.
A su vez, la empresa quiere:

Armar canastas de productos de acuerdo al perfil de compra de los clientes de cada ciudad en
la que tienen una boca de expendio. Para esto requieren un estudio de las ventas realizadas
abiertas por categora de producto (con la posibilidad de obtener el detalle por producto), por
ciudad, por mes, para los ltimos 13 meses (para detectar estacionalidades).

Premiar anualmente a aquellos vendedores que superen los objetivos de venta que les fueran
asignados. El anlisis, en este caso deber incluir a los vendedores, las ventas realizadas, los
objetivos de venta y el indicador de cumplimiento detallados por mes, para el ao fiscal (el
premio ser distinto si se cumple con los objetivos globalmente para el ao o si, adems, se
cumplen los objetivos en todos los meses en particular).
M-MEE/ymtm/14-07-2011/60
yc/2015/02/06

74

También podría gustarte