Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Titulacin
Ingeniero en Informtica
Ciclo
Autores:
18506
Asesora virtual:
www.utpl.edu.ec
Esta versin impresa, ha sido acreditada bajo la licencia Creative Commons Ecuador 3.0 de reconocimiento -no comercial- sin obras derivadas;
la cual permite copiar, distribuir y comunicar pblicamente la obra, mientras se reconozca la autora original, no se utilice con fines comerciales
ni se realicen obras derivadas. http://www.creativecommons.org/licences/by-nc-nd/3.0/ec/
Abril, 2015
2. ndice
2. ndice................................................................................................................................. 3
3. Introduccin.................................................................................................................... 5
4. Lineamientos generales del modelo educativo basado en competencias
y crditos acadmicos UTPL-ECTS......................................................................... 6
4.1. Competencias genricas............................................................................................. 7
4.2. Competencias especficas........................................................................................... 7
5. Bibliografa..................................................................................................................... 8
5.1. Bsica......................................................................................................................... 8
5.2. Complementaria ........................................................................................................ 8
Unidad 4: Seguridad............................................................................................................... 33
4.1. Seguridad de la base de datos................................................................................... 33
4.2. Contramedidas: controles informatizados.................................................................. 34
4.3. Seguridad en el SGBD de Microsoft Office Access y en el SGBD Oracle.................... 34
4.4. Seguridad de un SGBD en entornos Web................................................................... 35
Autoevaluacin 4.................................................................................................................. 37
SEGUNDO BIMESTRE
7.4. Competencias genricas............................................................................................. 39
7.5. Orientaciones especficas para el aprendizaje por competencias............................... 41
8. Solucionario.................................................................................................................... 61
8.1. Solucin a las preguntas de ensayo........................................................................... 69
9. Anexos.............................................................................................................................. 73
PRELIMINARES
3. Introduccin
La asignatura de Base de Datos Avanzada se dicta en quinto ciclo de la carrera de Ingeniera en Informtica,
tiene una valoracin de cuatro crditos y forma parte del grupo de materias troncales de la carrera antes
mencionada.
Actualmente el manejo de informacin en las organizaciones ha venido a tomar un papel protagnico, a tal
punto que se han hecho grandes inversiones en tecnologa que permita manipular de forma adecuada uno de
los recursos ms importantes de las organizaciones: los datos; de ah la importancia de esta asignatura.
En cualquier campo de la informtica en la que se desenvuelva, se encontrar con la necesidad de manipular
de alguna manera bases de datos, por ello lo animamo a desarrollar los contenidos de esta materia que le
ayudarn a adquirir los conocimientos y habilidades necesarios para la administracin y explotacin de las
bases de datos de diferente mbito y complejidad.
Esta asignatura es parte de su formacin como ingeniero en informtica y es de vital importancia ya que
se estudian temas que mejorarn sus habilidades en el uso de metodologas para guiar las operaciones,
la prevencin de vulnerabilidades, tambin conocer las configuraciones las avanzadas de base de datos
como las bases de datos distribuidas, conocer tambin temas de inteligencia de negocios orientado al
diseo de almacenes de datos. Todo ello le ayudar en la adquisicin de las competencias necesarias que se
complementan con las adquiridas en la asignatura de Fundamentos de Base de Datos y dems asignaturas de
la malla curricular de la carrera.
Para la presente asignatura se ha planificado el desarrollo de ocho unidades, de la uno a la cuatro se revisar
en el primer bimestre y de la cinco a la ocho se desarrollar en el segundo bimestre. En el primer bimestre la
unidad uno hace una introduccin a la metodologa de diseo de bases de datos, la unidad dos se refiere al
siguiente paso de la metodologa: el diseo fsico de bases de datos relacionales, la unidad tres se refiere a otra
etapa de la metodologa de diseo de base de datos; la monitorizacin y optimizacin del sistema final y por
ltimo, la unidad cuatro desarrolla el tema de seguridad en cuanto a bases de datos se refiere.
En el segundo bimestre, la unidad cinco hace referencia a la gestin de transacciones, la unidad seis se refiere
al procesamiento de consultas, la unidad siete aborda conceptos de almacenes de datos y por ltimo la unidad
ocho hace referencia al diseo de almacenes de datos.
Esta gua didctica trata de dar una visin real y prctica de la temtica abordada a travs de la inclusin de
explicaciones, ejemplos y otros recursos relacionados al tema, para que usted pueda asimilar de mejor forma
los conceptos y teoras que encontrar en la bibliografa bsica y complementaria.
Finalmente, les deseo el mejor de los xitos en el presente ciclo de estudios y animarle a que realice su mejor
esfuerzo para continuar por el camino de la superacin profesional y personal que contribuyen a una formacin
integral. Recuerde estimado estudiante que estaremos junto a ustedes para acompaarle y orientarle en el
proceso de aprendizaje.
Siga adelante!
PRELIMINARES
CONESUP (2008): Reglamento del Rgimen Acadmico del Sistema Nacional de Educacin Superior, art. 18.
PRELIMINARES
2.
3.
Capacidad de investigacin.
4.
5.
6.
7.
8.
9.
Compromiso tico.
PRELIMINARES
5. Bibliografa
5.1. Bsica
Connolly, T. y Begg, C.(2005). Sistemas de bases de datos. Un enfoque prctico para diseo, implementacin
y gestin. Madrid: Pearson Education.
Este texto propone los temas que se deben abordar dentro de la asignatura de Base de Datos Avanzada.
Su contenido es bastante didctico, ofrece recursos para que el estudiante pueda autoevaluarse al
final de cada unidad; dispone de casos de estudio sobre los cuales se puede ir desarrollando la parte
prctica de la asignatura. Tambin ofrece recursos adicionales en la Web que ayudan al estudiante a
complementar los contenidos del texto.
Morocho, J. y Enriquez, M. (2011). Gua didctica de Base de Datos Avanzada. Loja-Ecuador: UTPL.
Gua didctica diseada para el estudio de Base de Datos Avanzada en la carrera de Ingeniera en
Informtica de la Modalidad Abierta y a Distancia de la Universidad Tcnica Particular de Loja. En este
material encontrar breves explicaciones, comentarios de cada uno de los temas, adems de ejercicios
propuestos y autoevaluaciones, que le ayudarn como un indicador del logro de las competencias
propuestas para la presente asignatura.
5.2. Complementaria
Amiagada, A. y Aranda,J. (2006). Curso de Base de Datos. Universidad de las Amricas. Recuperado el 28 de
febrero del 2011 desde http://nuestro.net78.net/clases_jjaa/Bases_Datos/
Curso de base de datos, en donde puede encontrar temas como conceptos del modelo relacional, lgebra y
clculo relacional que ayudarn a complementar sus conocimientos.
Camps, R., Casillas, L. A., Costal, et. al. (2007).OCW,M2109 Bases de Datos. UniversitatOberta de Catalunya.
Recuperado el 28 de febrero del 2011 desde http://ocw.uoc.edu/informatica-tecnologia-y-multimedia/
bases-de-datos/Course_listing.
Curso de base de datos abierto, en donde puede encontrar temas como conceptos del modelo relacional
y el proceso del modelado E/R, que le ayudarn a complementar sus conocimientos.
Castillo, C. (2007). Convertir Entidad-RelacinenModelo Relacional. Universitat Pompeu Fabra.
Este documento contiene informacin acerca de la transformacin del modelo conceptual al modelo
lgico.
Greenberg, N.,Nathan, P.(2001).Introduction toOracle 9i:SQL.Oracle Corporation.
En este documento puede encontrar todo lo referente al lenguaje SQL Oracle en la versin 9i.
PRELIMINARES
Martnez, J. L., Martnez, P. y Mingo, J. M. (2008). OCW: Fundamentos de las bases de datos. Grupo de bases
de datos avanzadas, departamento de informtica, Universidad Carlos III de Madrid. Recuperado el 28 de
febrero del 2011 desde http://ocw.uc3m.es/informatica/fundamentos-de-bases-de-datos.
Curso de base de datos abierto, en donde puede encontrar temas como conceptos fundamentales
de base de datos, modelo de datos relacional y lenguaje SQL, que le ayudarn a complementar sus
conocimientos.
Oracle home page. Recuperado el 12 de Febrero del 2011 desde http://www.oracle.com/index.html
Sitio de uno de los sistemas de gestin de base de datos ms reconocido a nivel mundial. Aqu encontrar
recursos como documentacin, podcast, software y noticias relevantes de la industria de base de datos.
Ricardo, C. (2009).Bases de Datos. Mxico, D. F.: McGraw-Hill.
En este texto encontrar material complementario sobre seguridades, transacciones, bases de datos
distribuidas, almacenes de datos y bases de datos e Internet, que ayudarn al estudiante en el desarrollo
de los temas propuestos para la asignatura.
Scott, U.(2002).Oracle 9i PL/SQL Programming.Madrid: McGraw-Hill/Osborne.
Este material bibliogrfico le puede servir para profundizar sobre el lenguaje SQL, tanto manipulacin
como definicin de datos.
PRELIMINARES
El texto bsico es amplio en contenidos, cuenta adems con herramientas muy didcticas como:
figuras ilustrativas, casos de estudio, resmenes, actividades recomendadas al final de cada unidad,
ejercicios propuestos, un glosario al que usted podr recurrir cuando encuentre un trmino
desconocido y una serie de apndices en donde encontrar informacin relevante a manera de
resumen.
En cuanto a la gua, su fin principal es el de orientar al estudiante, indicndole los temas del libro
que debe revisar y los conceptos a los cules deber poner un mayor nfasis; la gua didctica
servir tambin para constatar el nivel de asimilacin de conocimientos, as que se proponen
cuestionarios, ejercicios y otras actividades que complementen su aprendizaje.
Dentro de la gua tambin encuentra de una herramienta muy importante que es la planificacin
para el trabajo del alumno, en la cual est la dosificacin de contenidos que debe ir desarrollando
durante cada semana del semestre acadmico, que le permitirn ir adquiriendo las competencias
que se ha planteado para la asignatura de fundamentos de base de datos.
Es natural que algunos temas le resulten difciles de entender; sin embargo, conforme vaya
avanzando y adentrndose en esta temtica se irn despejando aquellas dudas, le recuerdo que
para ello tambin puede contar con la ayuda de su profesor.
Tcnicas de estudio
En sus estudios, usted deber primero remitirse a la gua didctica en donde se le darn instrucciones
acerca de los temas que deber revisar, luego se remitir al libro y cuando los contenidos hayan
quedado claros deber volver una vez ms a la gua para concentrarse en aquellos conceptos
fundamentales y realizar una serie de actividades complementarias propuestas. Utilice las tcnicas
de estudio que ms se ajusten a usted (subrayados, resmenes, cuadros sinpticos, esquemas,
grficas, etc.).
10
PRELIMINARES
Es conveniente que siempre considere el calendario acadmico que le fue entregado y organice
su tiempo para que el estudio sea constante. La recomendacin es que debe revisar una unidad
por semana, aunque en ocasiones debido a la dificultad o facilidad de ciertos temas, este tiempo
podr variar.
Interactividad
Adicional al material bsico, usted contar con los siguientes recursos tecnolgicos que le servirn para
profundizar o complementar lo aprendido:
Entorno Virtual de Aprendizaje, en donde usted encontrar documentos, videos, foros, chats en el
que participan adems de su profesor sus compaeros, logrando as una total retroalimentacin
de los contenidos desarrollados.
Biblioteca virtual, a la que puede acceder a travs de la pgina Web de la Universidad http://www.
utpl.edu.ec/biblioteca, en donde encontrar enlaces a importantes bibliotecas virtuales de todo
el mundo que pueden ser consultadas por usted.
En sus evaluaciones a distancia usted encontrar los datos completos de su profesor-tutor, con
el cual se podr comunicar constantemente a travs de la lnea telefnica, correo electrnico,
entorno virtual, googletalk o skype para hacerle llegar sus inquietudes ya que usted est en un
proceso de aprendizaje y siempre se requiere de ayuda para esclarecer alguna duda o para ratificar
sus ideas. Recuerde que siempre ser un gusto poder ayudarle.
Evaluacin
Al final de cada bimestre, deber entregar las evaluaciones a distancia (30% de la calificacin final) en
las fechas establecidas para el efecto y luego rendir sus evaluaciones presenciales (70% de la calificacin
final), que sumados debern dar un total de 20 puntos por bimestre. Debe obtener una nota mnima de
14 puntos sobre 20, de lo contrario tendr que rendir una evaluacin supletoria que reemplazar a la
nota bimestral. Para acreditar la asignatura debe contabilizar un mnimo de 28 puntos.
Estimado profesional en formacin, recuerde que de su constancia y esfuerzo depende el cumplir con
las metas que se ha planteado para el presente semestre y cuente con la ayuda del profesor tutor para
apoyarle en la consecucin de sus objetivos.
11
PRIMER BIMESTRE
INDICADORES DE
APRENDIZAJE
Analiza las
necesidades de
conocimiento
necesarias para
resolver un
problema.
Identifica los
beneficios de
utilizar una
metodologa
de diseo de
base de datos.
Realiza la gestin
y recuperacin
de informacin
generada en
los sistemas
informticos.
Asocia
claramente
las fases de la
metodologa
de diseo
de bases de
datos.
CONTENIDOS
ACTIVIDADES DE APRENDIZAJE
Unidades/Temas
Unidad 1.
Metodologa para el
desarrollo de bases
de datos
1.1. Introduccin a
la metodologa de
diseo de bases de
datos
1.2. Panormica de
la metodologa de
diseo de la base de
datos
Desarrollo de la autoevaluacin 1.
Empezar el desarrollo de la
evaluacin a distancia que
corresponda a la primera unidad.
Lectura comprensiva del captulo
17 del texto bsico siguiendo las
indicaciones de la gua didctica.
Reconoce
y aplica el
proceso para
pasar del
diseo lgico
a un diseo
fsico.
4 horas de
autoestudio.
4 horas de
interaccin.
Desarrollo de actividades
recomendadas en la gua para la
primera unidad.
Unidad 2.
Metodologa: diseo
fsico de base de
datos
2.1. Comparacin del
diseo lgico y fsico
de bases de datos
Distingue
relacionales
claramente
cundo utilizar 2.2. Metodologa de
ndices para
diseo fsico de bases
mejorar el
de datos relacionales
rendimiento
de la base de
datos.
CRONOGRAMA
ORIENTATIVO
Tiempo
estimado
Semana 1
Semana 2 y 3
8 horas de
autoestudio.
8 horas de
interaccin.
Desarrollo de la parte de la
evaluacin a distancia que
corresponda a la segunda .unidad.
13
COMPETENCIAS
ESPECFICAS
CONTENIDOS
INDICADORES DE
APRENDIZAJE
Demuestra los
beneficios de
monitorear el
rendimiento
de la base de
datos.
Analiza y
describe las
circunstancias
en las cuales
es conveniente
desnormalizar.
Diferencia
claramente las
amenazas a
las cuales est
expuesta una
base de datos.
PRIMER BIMESTRE
ACTIVIDADES DE APRENDIZAJE
Unidades/Temas
Unidad 3.
Metodologa:
monitorizacin y
optimizacin del
sistema final
3.1. Desnormalizacin
e introduccin
de redundancia
controlada
3.2. Monitorizacin
del sistema
para mejorar el
rendimiento
4.2. Contramedidas:
controles
informatizados
Aplica
contramedidas
para minimizar 4.3. Seguridad en el
los efectos de SGBD de Microsoft
las amenazas. Office Access y en el
SGBD de Oracle
4.4. Seguridad de un
SGBD en entornos
Web
Unidades 1 - 4
Desarrollo de la parte de
la evaluacin a distancia
correspondiente a la tercera unidad
Lectura comprensiva del captulo
Semana 5 y 6
19 del texto bsico de acuerdo a las
indicaciones de la gua didctica.
8 horas de
autoestudio.
Elaboracin de un mapa mental en
donde se representen los problemas 8 horas de
asociados con la seguridad de BDD interaccin.
en Web.
Desarrollo de actividades
recomendadas en la gua para la
cuarta unidad.
Desarrollo de la parte de la
evaluacin a distancia que
corresponda a la cuarta unidad.
Revisin de foro de consultas al
profesor.
14
4 horas de
autoestudio
Unidad 4. Seguridad
4.1. Seguridad de la
base de datos
CRONOGRAMA
ORIENTATIVO
Tiempo
estimado
Semana 4
Semana 7 y 8.
8 horas de
Realizacin de ejercicios propuestos autoestudio.
en el EVA.
8 horas de
Indicaciones previa a la primera
interaccin.
evaluacin presencial.
PRIMER BIMESTRE
Prueba objetiva y de
ensayo
Creatividad e iniciativa
Cumplimiento, puntualidad,
responsabilidad
Contribucin en el trabajo
colaborativo y de equipo
X
X
Anlisis y profundidad en el
desarrollo de temas
PORCENTAJE
Puntaje
Estrategia de
aprendizaje
TOTAL
70%
14
20 puntos
Actividades
presenciales y en el
EVA
Mximo 1 punto
(completa la
evaluacin a
distancia)
Actitudes
3. Coevaluacin
Interaccin en el EVA
Parte objetiva
Comportamiento tico
Conocimientos
Evaluacin
presencial
Competencia: criterio
Habilidades
Evaluacin a
distancia **
Parte de ensayo
1. Autoevaluacin *
2. Heteroevaluacin
Para aprobar la asignatura se requiere obtener un puntaje mnimo de 28/40 puntos, que equivale al 70%.
* Son estrategias de aprendizaje, no tienen calificacin; pero debe responderlas con el fin de autocomprobar su
proceso de aprendizaje.
** Recuerde que la evaluacin a distancia consta de dos partes: una objetiva y otra de ensayo, debe desarrollarla
y entregarla en su respectivo centro universitario.
Seor estudiante:
Tenga presente que la finalidad de la valoracin cualitativa es
principalmente formativa.
15
PRIMER BIMESTRE
Estimado estudiante: vamos a iniciar el estudio de la asignatura conociendo una herramienta que nos
ayudar a guiar y formalizar el diseo de una base de datos, como lo es la utilizacin de una metodologa.
Para el desarrollo de esta unidad, vaya revisando conjuntamente con esta gua el captulo
15 del texto bsico sobre Metodologa: diseo conceptual de la base de datos.
Revise en su texto bsico, del apartado 15.1. Introduccin a la metodologa de diseo de bases de
datos, el punto 15.1.1 Qu es una metodologa de diseo?
ACTIVIDAD RECOMENDADA:
Una vez que ha encontrado varias definiciones del trmino metodologa, comprelas con la
propuesta en el texto bsico y construya un nuevo concepto a partir de los ya consultados.
En este punto puede usted dar respuesta a la siguiente interrogante:
16
PRIMER BIMESTRE
As mismo se vean afectados porque a menudo se confunda el diseo de base de datos con la
implementacin de las mismas. Conforme la tecnologa fue avanzando, tambin se dio un importante
avance en cuanto a los procesos de diseo de bases de datos, es as que en la actualidad contamos con
varias herramientas que nos ayudan en la manipulacin de la informacin, y nos permiten construir
interfaces amigables para que los usuarios interacten con la base de datos, as como herramientas que
nos apoyan en el proceso de diseo, de las que podemos mencionar PowerDesigner, Erwin, entre otras,
pero el avance no solamente ha sido en herramientas tecnolgicas sino que tambin se han estructurado
metodologas y tcnicas de diseo, tal como la que se presenta en el texto bsico, en la cual se definen
claramente unas fases, los objetivos de cada fase y las actividades y/o componentes.
Una desventaja fundamental es que las metodologas de diseo de base de datos no son muy conocidas,
por tanto los diseadores no las aplican y por eso se obtiene malos resultados en el desarrollo de las
aplicaciones como: la base de datos no satisface las necesidades de la organizacin, la administracin se
complica y la documentacin es limitada o nula.
Pues bien, en el texto bsico se propone una metodologa de diseo de bases de datos que identifica
claramente tres fases: diseo conceptual, diseo lgico y diseo fsico.
Es momento de revisar en el texto bsico los apartados 15.1.2. Diseo conceptual, lgico y fsico
de una base de datos y 15.1.3. Factores crticos en el diseo de una base de datos.
reforzar an ms los contenidos del texto, le invito a revisar el material relacionado al tema
Para
que estamos desarrollando del curso OCW y que lo podr encontrar en la siguiente direccin Web:
http://ocw.uc3m.es/informatica/diseno-y-administracion-de-bases-de-datos/teoria/Tema1%28U
naMetodologiaDesarrolloBD%29.pdf
Una vez que haya revisado el material en lnea desde el recurso OCW, contraste con los contenidos
del texto bsico y obtenga sus propias conclusiones.
A continuacin haremos un breve recordatorio de las dos primeras fases, diseo conceptual y lgico de
la metodologa propuesta en el texto bsico y la ltima fase, la del diseo fsico la abordaremos en la
siguiente unidad.
17
PRIMER BIMESTRE
Para complementar la comprensin de tema, refirase al texto bsico y revise el apartado 15.2
Panormica de la metodologa de diseo de la base de datos.
Seguramente habr recordado las actividades que se deben cubrir en las fases de diseo conceptual y
diseo lgico, que propone la metodologa del texto bsico.
Se podr dar cuenta que la metodologa dicta una serie de pasos que se relacionan entre s, e incluso
unas generan documentacin que sirve para la siguiente actividad. Imaginemos solo por un momento
cmo sera nuestro proceso de diseo de bases de datos si no contramos con una metodologa que
nos gue en el proceso. De seguro sera un proceso desordenado, que requerira de mucho esfuerzo y
que generara una pobre documentacin, de ah que la adopcin de un proceso metodolgico resulta
imprescindible.
No olvide que el diseo de una base de datos es un proceso un poco complejo en la cual intervienen
muchos actores de distintos niveles, pero esa complejidad sera manejable si descomponemos ese
gran problema en subproblemas, para poderlos manejar ms efectivamente aplicando las tcnicas y
herramientas apropiadas.
El siguiente grfico sintetiza las fases de la metodologa de diseo planteada en el texto bsico.
Figura 1.1. Esquematizacin de las fases de la metodologa de diseo de bases de datos, segn el texto bsico.
Bien, felicitaciones!, Ha terminado la unidad 1, Con el mismo entusiasmo Siga adelante! Como
parte complementaria en el desarrollo de la presente unidad le invitamos a desarrollar las siguientes
actividades recomendadas.
18
PRIMER BIMESTRE
ACTIVIDADES RECOMENDADAS:
Recuerde que puede solicitar ayuda a su tutor mediante el campus virtual o telefnicamente.
Interactividad virtual
Fortalezca sus criterios y conocimientos respecto al tema y a la asignatura ingresando
peridicamente a travs del campus virtual (http://www.utpl.edu.ec).
Desde su aula virtual de la asignatura, puede conocer los anuncios de su profesor. Todos
los participantes tienen acceso a los foros de discusin donde su aporte es valioso y es an ms
significativo si la participacin involucra conversacin con los integrantes del curso.
En nuestro caso, la participacin en los foros de discusin es obligatoria, pues tienen una
puntuacin en su evaluacin a distancia.
19
PRIMER BIMESTRE
Autoevaluacin 1
Conteste verdadero (V) o falso (F) a las siguientes proposiciones, segn corresponda:
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
Revise sus aciertos consultando el solucionario qu se encuentra en la parte final de esta gua
Ensayo
11. Construya un mapa mental que agrupe las principales actividades para el diseo conceptual y
diseo lgico de bases de datos. Puede ayudarse de alguna herramienta como MindManager, para
elaborar su mapa mental.
Ir a solucionario
20
PRIMER BIMESTRE
Estimado estudiante: continuaremos estudiando las fases que propone la metodologa de diseo de
bases de datos. En este punto corresponde revisar la fase de diseo fsico.
Para el desarrollo de esta unidad vaya revisando conjuntamente con esta gua el captulo 17 del
texto bsico: Metodologa: diseo fsico de bases de datos relacionales.
2.1. Comparacin del diseo lgico y del diseo fsico de bases de datos
Antes de adentrarnos en la revisin de la fase de diseo fsico, es conveniente hacer una breve comparacin
entre esta fase y la de diseo lgico.
Recuerde que el diseo fsico se fundamenta en el diseo lgico, y constituye una descripcin de la
implementacin de una base de datos en almacenamiento secundario, por lo cual est estrechamente
relacionado con el SGBD a utilizar ya que se debe especificar mediante el lenguaje de definicin de datos
del producto seleccionado.
Vaya al texto bsico y revise el apartado 17.1 Comparacin del diseo lgico y del diseo fsico de
bases de datos.
De seguro que ahora s diferencia algunas actividades entre las fases de diseo antes mencionadas; pues
bien, como usted pudo evidenciar las fases pretenden ser independientes unas de otras, pero a la vez
integradas para darle continuidad al proceso metodolgico.
Siguiendo con el estudio de la fase, vamos a hacer un breve anlisis de cada una de las actividades que
comprende.
En el texto bsico revise la pgina 454, el paso 3, Traducir el modelo lgico de los datos al SGBD
seleccionado.
Bien, como ya habr revisado, esta fase pretende obtener un modelo de datos con las tablas definidas,
adems busca seleccionar la mejor representacin para los datos derivados, buscando la eficiencia y, por
lo tanto, los menores tiempos de respuesta.
21
PRIMER BIMESTRE
Analice la figura 17.1 propuesta en el texto bsico, ah se puede observar la representacin de la relacin
PropertyForRent, utilizando el lenguaje de diseo de base de datos. En la primera parte se presenta la
definicin de dominios de los atributos que componen la relacin; seguidamente se hace la definicin
de la relacin y si nos fijamos para la definicin de los tipos de datos ya se utiliza los dominios definidos
anteriormente; y, finalmente, se puede ver tambin la definicin de los constraints, el primero de ellos
define la clave primaria, y los siguientes hacen referencia a claves forneas.
Podemos observar que se incluye la sentencia ON UPDATE CASCADE, en la definicin del constraint
que referencia a Staff, esto quiere decir que si se actualiza el atributo staffNo de la relacin Staff
automticamente tambin se actualicen dichos valores relacionados en la tabla Property For Rent.
Esto se traduce como la inclusin de parte de la lgica de negocio a travs del diseo de restricciones
generales.
A continuacin proponemos un ejemplo de un modelo de datos para una biblioteca, el cual lo
traduciremos a lenguaje DDL.
Figura 2.1. Diseo de base de datos de una biblioteca (Instituto SISE, 2010)2.
Vamos a transformar a lenguaje DDL el modelo del grfico anterior. Empezaremos por la relacin TIPO_
USUARIO.
CREATE TABLE TIPO_USUARIO
(
idTipoUsuario number(4),
descTipoUsuario varchar2(20) NOT NULL,
CONSTRAINT PK_TIPO_USUARIO PRIMARY KEY(idTipoUsuario) --Aqu definimos la clave primaria
);
CREATE TABLE USUARIO
(
idUsuario varchar2(8) NOT NULL,
idTipoUsuario number(4) NOT NULL,
2
Instituto SISE. (08 de 2010). Metodologa de Diseo de Base de Datos. Recuperado el 13 de 06 de 2011, de http://www.
scribd.com/doc/40031583/49/METODOLOGIA-DE-DISENO-DE-BASES-DE-DATOS.
22
PRIMER BIMESTRE
23
PRIMER BIMESTRE
MAT_
Como la tabla MB_AUTOR es una tabla intermedia, producto de una relacin muchos a muchos, las
relaciones MAT_BIBLIO y AUTOR; tiene su clave principal formada por las claves de ambas tablas PRIMARY
KEY (idMatBiblio,idAutor). Entonces cada uno de los campos son claves forneas, y la composicin de
los dos atributos forman la clave principal de la tabla MB_AUTOR.
El script, mostrado anteriormente, basta con colocarlo en alguna consola de SQL y ejecutarlo, para que
se creen las estructuras fsicamente en el servidor de base de datos.
Dirjase al texto bsico y revise en la pgina 458, el paso 4 Disear la organizacin de los
archivos y los ndices.
Continuemos revisando las actividades que comprende esta fase de diseo fsico. Como ya haya podido
destacar, se debe hacer un anlisis de las transacciones que se ejecutarn en la base de datos, que
inclusive puede ayudar a prever la carga que tendr el servidor de base de datos. Una forma de hacer
este anlisis es apoyarse en la matrz cruzada de transacciones y relaciones; analice la tabla 17.1 del texto
bsico.
Esta matriz tiene por un lado el listado de todas las relaciones que componen nuestro diseo de base
de datos. Por otro lado contiene las transacciones que se ha identificado junto con las operaciones que
se puede aplicar, como son insercin, lectura, actualizacin y borrado. Entonces para cada transaccin
verificamos qu relacin se utiliza o est implicada y marcamos con una X en la operacin que la
transaccin ejecutara sobre la relacin, as por ejemplo en la transaccin C se hace una lectura a la
relacin Branch.
As mismo se debe considerar la organizacin de los archivos, algo que afecta directamente en el
rendimiento as como la eleccin y creacin de ndices, recuerde que nos podemos valer de la creacin
de tantos ndices secundarios como sean necesarios con el objeto de acelerar los tiempos de respuesta,
eso s teniendo cuidado de la cantidad de espacio en disco que se pueda requerir ya que una creacin
desmedida de objetos de base de datos puede causar que el espacio en disco disminuya rpidamente.
Continuemos
En su texto bsico, revise en la pgina 470, el paso 5 Disear las vistas de usuario.
Bien, ahora que ha revisado el contenido del texto bsico, le ser relativamente fcil responder a la
siguiente interrogante:
Las vistas de usuario juegan un rol importante al momento de imponer los mecanismos de
seguridad?
Si le resulta fcil responder a la pregunta planteada, lo ha hecho muy bien, ha asimilado los contenidos
hasta ahora revisados. Por el contrario si no puede responder a la pregunta, revise nuevamente los
contenidos.
24
PRIMER BIMESTRE
Nuevamente vaya al texto bsico y revise en la pgina 470, el paso 6 Disear los
mecanismos de seguridad.
Seguramente ahora ya comprende de mejor forma que la base de datos es un activo ms de la organizacin,
por lo que se debe implementar mecanismos de seguridad que salvaguarden la informacin. Estos
mecanismos de seguridad deben ser analizados y deben validar la mejor opcin para ser implementados
de acuerdo a las especificaciones hechas en la etapa de recopilacin y anlisis de requisitos.
Gracias a su esfuerzo, ha terminado una unidad ms. Siga adelante desarrollando las dems unidades.
Para aplicar los conocimientos adquiridos, conviene que desarrolle las actividades recomendadas
descritas a continuacin.
ACTIVIDADES RECOMENDADAS:
Ejercicios 17.13.
25
PRIMER BIMESTRE
Autoevaluacin 2
2.
3.
Un pico de carga es el perodo en el cual se hace la carga inicial de datos desde algn
sistema anterior.
4.
La sentencia para crear una clave primaria en SQL es CREATE PRIMARY KEY
5.
Las sentencias GRANT y REVOKE son excluyentes, es decir solo se puede aplicar una a
la vez.
6.
7.
8.
9.
10.
Cuando el SGBD procesa una consulta solamente basado en ndices sin acceder al
archivo de datos se denomina plan de solo ndice.
Ir a solucionario
26
PRIMER BIMESTRE
Para el desarrollo de esta unidad, vaya revisando conjuntamente con esta gua el captulo 18 del
texto bsico lo referente a Metodologa: monitorizacin y optimizacin del sistema final.
Vaya al texto bsico y revise el paso 7: Considerar la introduccin de una cantidad controlada de
redundancia.
Seguramente despus de revisar los contenidos, se han generado ms dudas que certezas; no se
preocupe, vamos a explicar detenidamente esta parte.
Como recordar, una de las actividades dentro de la fase de diseo lgico es la de normalizar, para
que nuestro diseo tenga un mnimo de redundancia, pero ahora en cambio aparece el trmino
desnormalizar, que hace referencia al proceso contrario, es decir que introduce en nuestro modelo cierta
cantidad de redundancia justificado en la mejora de rendimiento que se obtiene a cambio.
Recuerde que la introduccin de redundancia debe ser controlada y se justifica solamente si la mejora
en el rendimiento es considerable. Esta mejora del rendimiento tiene su costo, y es que mientras acelera
las consultas puede ralentizar las actualizaciones, es por eso que hay que tener mucho cuidado cuando
aplicamos desnormalizacin.
27
PRIMER BIMESTRE
Para ejemplificar mejor este concepto vamos a explicar los ejemplos propuestos en el texto bsico, de
manera que pueda entender mejor el concepto:
Partimos de dos relaciones:
Cliente
Nombre
Descripcin
clientNo
Identificador de cliente
fName
lName
telNo
prefType
maxRent
Entrevista
Nombre
Descripcin
clientNo
Identificador de cliente
staffNo
Identificador de la sucursal
dateInterview
Fecha de la entrevista
Comment
Comentario de la entrevista
Para introducir desnormalizacin, unimos las dos relaciones en una sola. Dado que no todos los clientes
han hecho una entrevista, existen valores nulos en las columnas staffNo, dateInterview y comment.
Connolly, T. y. (2005). Sistemas de bases de datos: Un enfoque prctico para diseo, implementacin y gestin (4ta ed.). Madrid,
Espaa: Pearson Educacin.
28
PRIMER BIMESTRE
Ahora analice la figura 18.3 en el texto bsico. Ah se est introduciendo redundancia al copiar el atributo
lName (Apellido) desde la relacin PrivateOwner (PropietarioPrivado), esto elimina para ciertos casos la
necesidad de aplicar un JOIN entre PropertyForRent y PrivateOwner con lo que estoy haciendo que el
sistema tenga mejor rendimiento, mejores tiempos de respuesta.
El mismo caso anterior aplica para el ejercicio de la figura 18.5 de su texto bsico, en donde se duplica el
atributo description (descripcin) desde la entidad PropertyType (Tipo Propiedad).
Otro caso de introduccin de redundancia son las tablas de extraccin que son bsicamente para
consultas en donde se da un alto grado de desnormalizacin ya que se rene mucha informacin
repetitiva. Por ltimo estn las particiones cuyo trabajo es dividir en partes ms manejables una tabla de
gran tamao, por ejemplo imagine en un banco la tabla en donde se registran las transacciones de los
clientes, la misma crecer aceleradamente por lo que es recomendable particionar la tabla y un criterio
para hacerlo sera por fecha, entonces se generaran particiones por cada mes. Por ejemplo: cuando se
haga una consulta de alguna transaccin, esta se dirigir o buscar nicamente en la particin que le
corresponda y no necesitar buscar en toda la estructura.
Vaya al texto bsico y revise el apartado 8 Monitorizacin y optimizacin del sistema final.
De seguro que ya tiene una idea de lo que comprende esta fase. Pues bien, en esta fase lo que se hace es
monitorear el funcionamiento del sistema y hacer ajustes de ser necesario, debido a errores en el diseo
o el cambio/evolucin de algn requisito.
Para esta fase de monitoreo generalmente se utilizan herramientas automatizadas, que nos dan mucha
flexibilidad y variedad de opciones al momento de obtener datos del monitoreo para luego interpretarlos
y tomar las medidas necesarias. Un ejemplo de este tipo de herramientas se muestra en la figura 3-2, en
donde se puede visualizar un pantallazo de un monitoreo a una base de datos Oracle, se pueden ver
detalles como el nmero de usuarios conectados, el estado de los tablespaces, estado de la base de
datos, porcentajes de utilizacin de memoria, procesador y disco, etc.
Con el mismo esfuerzo continuemos con el estudio de la unidad 4.
29
PRIMER BIMESTRE
Figura 3.2. Herramienta de monitoreo Applications Manager, monitoreo de una base de datos Oracle (Manager, 2011)4.
4
30
PRIMER BIMESTRE
ACTIVIDADES RECOMENDADAS:
31
PRIMER BIMESTRE
Autoevaluacin 3
Conteste verdadero (V) o falso (F) a las siguientes proposiciones, segn corresponda:
1.
2.
3.
El paso final del diseo de base de datos es el cierre del proyecto con el usuario.
4.
5.
Al conocer cmo estn actuando la memoria principal, procesador, E/S de disco y red
se podra tener una referencia para mejorar las prestaciones si fuere el caso.
6.
7.
8.
9.
La forma en que se organizan los datos en los discos puede ocasionar problemas
como la contienda de disco.
10.
11.
12.
Cmo distribuira los datos de su base de datos si contara con un juego de 4 discos duros de
140Gb cada uno?
Ir a solucionario
32
PRIMER BIMESTRE
Unidad 4: Seguridad
Recursos educativos multimedia
Estimado estudiante, hasta ahora hemos revisado las fases de la metodologa de diseo de base de
datos que sirven para poner en marcha un sistema de base de datos, tambin se ha monitoreado su
funcionamiento para poder hacer los correctivos necesarios, conviene en este momento darle un valor
agregado a nuestro sistema de base de datos que es el de dotarle de seguridad.
Para el desarrollo de esta unidad, vaya revisando conjuntamente con esta gua el captulo 19 del
texto bsico el tema referente a: Seguridad.
Connolly, T. y. (2005). Sistemas de bases de datos: Un enfoque prctico para diseo, implementacin y gestin (4ta ed.). Madrid,
Espaa: Pearson Educacin.
33
PRIMER BIMESTRE
Remtase al texto bsico para obtener un detalle de cada una de estas contramedidas.
Connolly, T. y. (2005). Sistemas de bases de datos: Un enfoque prctico para diseo, implementacin y gestin (4ta ed.). Madrid,
Espaa: Pearson Educacin.
34
PRIMER BIMESTRE
En el SGBD Oracle, tambin se manejan usuarios a los que se les puede asignar privilegios a dos niveles,
de sistema como por ejemplo CREATE PROCEDURE y sobre objetos como por ejemplo GRANT SELECT
ON estudiante TOreportes.
En el texto bsico y revise el apartado 19.3. Seguridad en el SGBD de Microsoft Office Access y
19.4. Seguridad en el SGBD de Oracle, estos le brindar informacin con ms detalle.
Vaya al texto bsico y revise el apartado 19.5. Seguridad de un SGBD en entornos Web.
Luego de haber revisado su texto bsico, ya debera haber identificado que las medidas de seguridad en
entornos Web se basan en:
Seguramente esta unidad le result un poco difcil, ya que aparece mucha terminologa nueva, pero si
ha llegado hasta aqu ha hecho un gran esfuerzo. nimo! que con esta unidad estamos culminando el
bimestre.
ACTIVIDADES RECOMENDADAS:
Connolly, T. y. (2005). Sistemas de bases de datos: Un enfoque prctico para diseo, implementacin y gestin (4ta ed.). Madrid,
Espaa: Pearson Educacin.
35
PRIMER BIMESTRE
Ejercicios
Para poner sus conocimientos en la prctica, dearrolle los ejercicios siguientes propuestos
al final de la seccin correspondiente de su texto bsico.
36
Ejercicio 19.9.
Adicionalmente piense en una solucin para el problema de clonacin de tarjetas de
dbito que se sucede a diario en nuestro pas. Qu recomendara aplicar para minimizar
esta problemtica, puede abarcar tanto procedimientos, hardware, software como personal
entrenado.
PRIMER BIMESTRE
Autoevaluacin 4
Conteste verdadero (V) o falso (F) a las siguientes proposiciones, segn corresponda:
1.
Una amenaza puede ser desatada por un suceso en donde se involucre una persona,
accin o circunstancia que pueda llegar a producir dao a la organizacin.
2.
3.
4.
5.
Los backups de la base de datos sirven para proteger a la base de datos contra ataques
de hackers.
6.
7.
Debemos utilizar el cifrado que ofrecen los SGBDs para cifrar toda la informacin
almacenada en la base de datos.
8.
9.
10.
Verifique sus aciertos consultando el solucionario qu se encuentra en la parte final de esta gua
Ir a solucionario
37
SEGUNDO BIMESTRE
SEGUNDO BIMESTRE
7.4. Competencias genricas
COMPETENCIAS
ESPECFICAS
Realiza la gestin
y recuperacin
de informacin
generada en
los sistemas
informticos.
Administrar
y gestionar
bases de datos
empresariales.
INDICADORES DE
APRENDIZAJE
CONTENIDOS
ACTIVIDADES DE APRENDIZAJE
Unidades/Temas
Diferencia los
Unidad 5. Gestin de
diversos tipos transacciones
de transaccin.
5.1. Soporte de
Distingue los
transacciones
problemas
que pueden
5.2. Control de
presentarse con
concurrencia
la concurrencia.
5.3. Recuperacin de
Identifica las
la base de datos
formas de
recuperacin de 5.4. Modelos
la base de datos.
avanzados de
transacciones
Describir
cada una de
las fases del
procesamiento
de consultas
Unidad 6.
Procesamiento de
consultas
4 horas de
autoestudio
Desarrollo de ejercicios
prcticos propuestos en el texto
bsico .
Desarrollo de la autoevaluacin
para esta unidad.
Desarrollo de la evaluacin
a distancia cuyos temas se
relacionan con esta unidad.
Leer comprensivamente el
Semana 10
captulo 21: Procesamiento de
consultas del texto bsico.
4 horas de
estudio.
Investigar la forma de cmo
se pueden descomponer las
4 horas de
consultas.
interaccin.
Enumerar las
6.3. Numeracin de
estrategias
las estrategias
de ejecucin
de ejecucin
alternativas ms
alternativas
comunes para el
procesamiento
de consultas.
Semana 9
Identificar
las etapas de
descomposicin 6.2. Descomposicin
de consultas.
de consultas
CRONOGRAMA
ORIENTATIVO
Tiempo estimado
4 horas de
interaccin.
Resolver la autoevaluacin
planteada en esta unidad.
Revisar los anuncios del EVA.
39
COMPETENCIAS
ESPECFICAS
INDICADORES DE
APRENDIZAJE
Analiza la
necesidad de
un almacn de
datos en una
organizacin.
Enumera y
describir cada
uno de los
componentes
de un almacn
de datos.
Describe la
funcin y ruta
de cada uno
de los flujos de
datos.
SEGUNDO BIMESTRE
CONTENIDOS
ACTIVIDADES DE APRENDIZAJE
Unidades/Temas
Unidad 7. Conceptos
de almacenes de datos
7.1. Introduccin a
los almacenes de
datos
7.2. Arquitectura de
un almacn de
datos
7.3. Flujos de datos
en un almacn de
datos
Unidades de la 5 - 8
Semana 11 y 12
8 horas de
autoestudio.
8 hora de
interaccin.
Desarrollar el ejercicio
propuesto en el captulo 31:
Conceptos de almacenes de
datos del texto bsico.
Revisar la informacin
planteada en el EVA.
Responder la autoevaluacin
de esta unidad expuesta en la
presente gua didctica.
40
CRONOGRAMA
ORIENTATIVO
Tiempo estimado
SEGUNDO BIMESTRE
Estimada estudiante, le invito a iniciar esta unidad siguiendo paso a paso cada uno de los temas
planteados, pues le ayudarn a conocer el soporte de transacciones y el control de concurrencia en una
base de datos.
Para el desarrollo de esta unidad, vaya revisando conjuntamente con esta gua el captulo 20 del
texto bsico lo referente a Gestin de transacciones.
41
SEGUNDO BIMESTRE
Ahora, completemos el estudio de este tema leyendo en el texto bsico al siguiente apartado
Control de concurrencia que lo podr encontrar en el captulo 20 Gestin de transacciones.
Bien, hasta aqu hemos tenido una pequea explicacin de la recuperacin de la base de datos.
Ahora conviene que usted profundice los contenidos leyendo captulo 20 Gestin de transacciones,
especficamente los puntos tratados en el tema Recuperacin de la base de datos.
Funcionalidades de recuperacin
Un Sistema Gestor de Base de Datos (SGBD) debe proporcionar algunas funcionalidades como apoyo a
la recuperacin, para comprender este tema le invitamos a que, como parte de su autoestudio, realice la
siguiente actividad.
ACTIVIDAD RECOMENDADA:
Destaque las funcionalidades de un SGBD como ayuda a la recuperacin, para esto realice un
cuadro sinptico en el que describa las caractersticas ms importantes de cada una de ellas.
42
SEGUNDO BIMESTRE
Un diseo puede ser muy grande llegando a estar compuesto de millones de componentes.
Las actualizaciones tienen un largo alcance debido a las relaciones topolgicas, a las relaciones
funcionales, etc.
Es preciso que aprenda sobre cada una de las caractersticas de los modelos avanzados de
transacciones, para esto puede leer en el texto bsico el captulo Gestin de Transacciones, donde
tambin encontrar algunos problemas que se pueden resolver con los protocolos tradicionales de
gestin de transacciones.
43
SEGUNDO BIMESTRE
subtransaccin. Esto limita el dao a una parte ms pequea de la transaccin, haciendo que el costo
de la recuperacin sea menor.
El autor del texto bsico en el captulo 20: Gestin de Transacciones, expone de una manera
detallada el modelo de transacciones anidadas y emulacin de las transacciones anidadas
utilizando puntos de salvaguarda. Le invito a revisar este tema detenidamente.
Ha completado con xito el estudio de la presente unidad, debo recordarle que a continuacin se
proponen algunas actividades recomendadas que sera bueno que las desarrolle.
ACTIVIDADES RECOMENDADAS:
Culminemos el estudio de esta unidad realizando las siguientes actividades que le ayudarn
a reforzar lo aprendido:
- Desarrolle los literales (a), (c) y (d) del ejercicio 20.18 propuesto en el texto bsico.
Recuerde que puede solicitar ayuda a su tutor mediante el campus virtual o telefnicamente.
Interactividad virtual
Fortalezca sus criterios y conocimientos respecto al tema y a la asignatura ingresando
peridicamente a travs del campus virtual (http://www.utpl.edu.ec)
Desde su aula virtual de la asignatura, puede conocer los anuncios de su profesor, y todos los
participantes tienen acceso a los foros de discusin donde su aporte es valioso y es an ms significativo
si la participacin involucra conversacin con los integrantes del curso.
En nuestro caso, la participacin en los foros de discusin es obligatoria, dado quetienen una
calificacin en su evaluacin a distancia.
44
SEGUNDO BIMESTRE
Autoevaluacin 5
Una vez que hemos concluido el estudio de la presente unidad, desarrollemos las siguientes
cuestiones de repaso sin ayuda del texto bsico; luego verifique sus respuestas en la parte
final de la presente gua.
Conteste verdadero (V) o falso (F) a las siguientes proposiciones, segn corresponda:
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
Ir a solucionario
45
SEGUNDO BIMESTRE
Al empezar esta unidad es importante que recuerde que cuando usted estaba iniciando el estudio de
las bases de datos, entre las tareas bsicas que realizaba eran consultas para obtener informacin de las
mismas, una vez que conoce cmo se las crea es importante que aprenda su manera de trabajo, es por
esto que le invitamos para que revise detenidamente cada tema propuesto en esta unidad.
Con el estudio de la presente unidad se conocer el procesamiento de las consultas en una base de
datos y cul es la mejor forma de volverlas eficientes.
Para el desarrollo de esta unidad, revise conjuntamente con esta gua el captulo 21 del texto bsico.
Transformar una consulta escrita en un lenguaje de alto nivel, normalmente SQL, en una estrategia
de ejecucin correcta y eficiente.
46
SEGUNDO BIMESTRE
En el anlisis lxico lo que se verifica es que tanto las palabras que pertenecen al lenguaje como los
nombres de identificadores estn escritos correctamente, mientras que en el anlisis sintctico verifica
que la expresin que refleja la consulta est escrita en la estructura correcta.
Por ejemplo: si tenemos una consulta como la siguiente:
$ELECT * FRON WHERE *
El resultado del anlisis nos devolver error por las siguientes razones:
a)
En el anlisis lxico nos devolver error en la palabra $ELECT porque esa palabra no pertenece a
un lenguaje de consulta.
b)
FRON, lo tomar como un identificador puesto que la palabra reservada correcta es FROM.
c)
Sintcticamente devolver error porque no va a encontrar una estructura correcta despus del
primer asterisco (*).
Normalizacin
La normalizacin convierte la consulta en una forma normalizada que pueda manipularse fcilmente.
Son comnmente empleadas la forma normal conjuntiva y la disyuntiva.
En este punto le propongo realizar un cuadro comparativo de estas dos formas normales.
Anlisis semntico
Al igual que en los compiladores, el anlisis semntico en el procesamiento de las consultas, verifica que
las consultas estn correctamente formuladas o que no sean contradictorias.
Este anlisis es independiente de la extensin o estado almacenado en la BD, por lo que, si puede derivarse
que dicha consulta ser siempre vaca; entonces, dicha consulta ser invalidada semnticamente.
Ahora
bien apoymonos en la figura 21.3 del tema Anlisis semntico del captulo 21
Procesamiento de consultas, para comprender mejor este tema.
Simplificacin
Cuando usted realiza una consulta es importante que esta sea lo ms resumida posible para disminuir
el trabajo que tiene que ejecutar el motor de base de datos, para lograr este objetivo puede utilizar
la simplificacin de expresiones la misma que reduce la complejidad de la consulta utilizando
fundamentalmente equivalencias o leyes lgicas basadas en el lgebra de Boole o Leyes de Morgan.
En el captulo 21 Procesamiento de consultas, usted podr encontrar las leyes antes mencionadas
as como tambin un ejemplo para su mejor comprensin.
47
SEGUNDO BIMESTRE
Reestructuracin de la consulta
Una vez normalizada, contrastada semnticamente y simplificada la expresin de una consulta, la etapa
final de la descomposicin de una consulta, se reestructura para obtener una implementacin ms
eficiente.
En la siguiente pgina de Internet usted podr encontrar informacin adicional acerca de la
descomposicin de consultas:
-
48
SEGUNDO BIMESTRE
Autoevaluacin 6
2.
3.
4.
5.
6.
7.
8.
9.
La copia de seguridad de la base de datos puede utilizarse en caso de que sta resulte
daada o destruida.
10.
Ir a solucionario
49
SEGUNDO BIMESTRE
50
SEGUNDO BIMESTRE
Un data warehouse resuelve fcilmente el problema antes mencionado porque se encarga de centralizar
en un solo repositorio la informacin de las reas de inters de una organizacin.
Comparacin de los sistemas OLTP y los almacenes de datos o soluciones OLAP10
En la siguiente tabla se muestran las diferencias que son clave entre un sistema OLPT y un DW.
Objetivos
Orientacin
Vigencia de los datos
Granularidad de los datos
OLPT
Operacionales
A la aplicacin
Actual
Detallada
Organizacin
Organizacin normalizada
Continuos
Datawarehouse
Informacin para la toma de decisiones
Al sujeto
Actual + histrico
Detallada + resumida
Organizacin estructurada en funcin del anlisis
a realizar
Estable
Una vez que hemos revisado temas importantes sobre los almacenes de datos le invitamos a
completar el estudio de este tema leyendo en el texto bsico desde el captulo 31: Conceptos de
almacenes de datos, el tema Introduccin a los almacenes de datos.
51
SEGUNDO BIMESTRE
Datos operacionales:12
Usted podr notar que las fuentes de los datos para el almacn de datos pueden ser:
-
Sistemas externos como las bases de datos comerciales, de proveedores o clientes, o incluso de
Internet.
Repositorio de datos
Tambin se lo conoce como ODS (Operational Data Store), el mismo que es un repositorio de datos
operacionales actuales e integrados que se utiliza para el anlisis.
Gestor de carga
Segn acabamos de revisar, los orgenes de datos de un data warehouse es muy diverso y cada uno de
ellos aporta para formar un repositorio centralizado, esto da origen a la necesidad de tener que realizar un
procedimiento que permita estandarizar la diversidad de los datos que encontramos, ante esta situacin
surge un proceso llamado ETL (Extraction, Transformation, Load), el mismo que es el encargado de
realizar las funciones de extraccin de las fuentes de datos (transaccionales o externas), transformacin
(limpieza, consolidacin principalmente) y la carga del almacn de datos, as como tambin hacer el
refresco del almacn (operacin peridica que propaga los cambios de las fuentes externas al almacn
de datos). Con esto evitaremos el problema de presentar datos errneos o faltantes la calidad de la
informacin, generada por su solucin, ser confiable.
Gestor del almacn de datos
Con el procedimiento anterior usted tendr en su solucin los datos listos para que sean utilizados y
pueda realizar las operaciones relacionadas con la gestin de los datos dentro del almacn utilizando
herramientas especficas que realizan operaciones como la transformacin de datos para la incorporacin
de stos en las tablas del almacn de datos, la creacin de ndices y vistas de las tablas base, creacin de
copias de seguridad y archivado de datos, adems del anlisis de los datos para garantizar la coherencia
de los mismos13.
que conozca ms detenidamente sobre los diferentes datos que pueden encontrarse en un
Para
almacn de datos, le invito a revisar el captulo 31 Conceptos de almacenes de datos, del texto
bsico especficamente el tema Gestor del almacn de datos.
52
SEGUNDO BIMESTRE
proporcione acceso a la informacin generada y proceder a la toma de decisiones estratgicas. Por tanto
la comunicacin entre el almacn de datos y la herramienta ser mediante consultas de tipo ad-hoc.
Estimado estudiante: para estudiar este tema, revisemos la figura 31.2, del texto bsico, en el
captulo 31: Conceptos de almacenes de datos.
Note que existen los siguientes tipos de flujos de datos: de entrada, ascendente, descendente, de salida,
metaflujo.
Para comprender mejor este tema, piense en una organizacin que necesite obtener cierta informacin
de sus orgenes de datos por ejemplo puede ser datos de las personas que en ella trabajan, para lo cual
necesitara la base de datos de un sistema de recursos humanos, con este ejemplo le invito a pensar cmo
sera el flujo de los datos en un sistema data warehouse, guese analizando detenidamente el captulo
31 Conceptos de almacenes de datos, del texto bsico especficamente el tema Flujos de datos en un
almacn de datos; y, realice un diagrama en que resuma lo aprendido acerca de los flujos de datos.
Le recomendamos la siguiente pgina de Internet, donde se encuentra una explicacin ms
detallada de este tema:
-
Hasta ahora ha revisado temas importantes que le servirn de mucha ayuda en su vida profesional,
con el mismo empeo contine estudiando el captulo 8. Y desarrolle las actividades propuestas a
continuacin.
ACTIVIDADES RECOMENDADAS:
En esta parte podr aplicar lo aprendido, si comete errores ser un indicador para que
vuelva a revisar los temas de la presente unidad.
Desarrolle el ejercicio 31.15 del texto bsico. En el captulo 31 Conceptos de almacenes de datos.
53
SEGUNDO BIMESTRE
Autoevaluacin 7
Para medir su comprensin del tema mencionado en este captulo, por favor desarrolle las
siguientes preguntas:
Conteste verdadero (V) o falso (F) a las siguientes proposiciones, segn corresponda:
1.
La diferencia entre un sistema OLTP y un sistema OLAP es que el segundo sirve para
las operaciones diarias de una organizacin.
2.
3.
Una de las ventajas de los almacenes de datos es que permiten tener datos actualizados
en lnea.
4.
5.
6.
7.
8.
9.
El gestor del almacn de datos realiza todas las operaciones asociadas con el gestor
de los datos del almacn.
10.
Ir a solucionario
54
SEGUNDO BIMESTRE
Estimado estudiante, en la unidad anterior aprendimos los conceptos bsicos sobre almacenes de datos,
en esta unidad estudiaremos los problemas asociados con el diseo de base de datos para funcionar
como almacenes de datos, de esta manera usted tendr una visin ms clara de la construccin de
soluciones OLAP.
Para el desarrollo de esta unidad, vaya revise, conjuntamente con esta gua, el captulo 32: Diseo
de almacenes de datos, del texto bsico.
Entorno tcnico
Etapas de desarrollo
- Prototipo
- Piloto
-
55
SEGUNDO BIMESTRE
Para aprender sobre este tema, por favor, revisemos en el captulo 31 Diseo de almacenes de
datos, como podr darse cuenta existen dos modelos que son los ms conocidos y utilizados, el
diagrama en estrella y el diagrama copo de nieve. Para comprender mejor este tema realice un
cuadro comparativo en que destaque semejanzas y diferencias de cada uno de estos diagramas.
Ahora bien, una vez que ha comprendido sobre estos diagrama le invito a analizar la figura 32.1 y 32.2 y
confirme las comparaciones realizadas.
56
SEGUNDO BIMESTRE
57
SEGUNDO BIMESTRE
El sentido de la expresin medidas calculadas es muy amplio y engloba a cualquier manipulacin de las
medidas naturales que nos faciliten el anlisis de los hechos.
En una medida calculada puede haber:
Clculos matemticos.
Expresiones condicionales.
Alertas.
A partir del hecho mencionado en el paso anterior obtenga las medidas que van a ser presentadas en el
ejercicio que estamos desarrollando.
Paso 6: terminacin de las tablas de dimensiones
En este paso se debe aadir las descripciones textuales a las dimensiones como sea posible. La utilidad
de un mercado de datos est determinada por el mbito y la naturaleza de los atributos de las tablas de
dimensin.
Identifique en el ejercicio que estamos desarrollando las descripciones textuales a las dimensiones antes
identificadas.
Paso 7: seleccin de la duracin de la base de datos
En este paso es importante precisar hasta qu momento del pasado se debe retroceder la tabla de
hechos. Cunto ms antiguos son los datos, ms probable es que existan problemas a la hora de leer e
interpretar los archivos o cintas antiguos.
Paso 8: control de las dimensiones lentamente cambiantes
Existen tres tipos de dimensiones lentamente cambiantes: tipo 1, en el que se sobrescribe un atributo de
dimensin modificado, tipo2, el que en un atributo de dimensin modificado hace que se cree un nuevo
registro de dimensin, y el tipo 3, en el que un atributo de dimensin modificado hace que se cree un
atributo alternativo.
Paso 9: seleccin de las prioridades de consulta y de los modos de consulta
A la hora de seleccionar las prioridades y modos de consulta es importante que usted tome en cuenta los
problemas ms crticos que afecta a la percepcin que el usuario final tiene del mercado de datos, estos
son, la ordenacin fsica de la tabla de hechos en el disco y la presencia de resmenes o agregaciones
precalculados.
Ahora bien, para completar este tema revise el captulo 32 Diseo de almacenes de datos,
especficamente cada uno de los pasos de la metodologa, luego seleccione una organizacin y
simule la creacin de una solucin OLAP utilizando la metodologa planteada.
58
SEGUNDO BIMESTRE
Hemos terminado el estudio de la presente unidad. Recuerde que, adems, cuenta con las actividades
adicionales que le ayudarn a enriquecer sus conocimientos.
ACTIVIDADES RECOMENDADAS:
Es importante para completar el estudio de esta unidad que realice las siguientes actividades
adicionales:
Desarrolle el ejercicio 31.11 del texto bsico. En el captulo 32 Diseo de almacenes de datos.
Elabore el caso de estudio propuesto en el anexo A
Interactividad a travs de los foros de campus virtual
Una vez que hemos terminado de revisar los temas de esta unidad, ingrese al campus virtual
(http://www.utpl.edu.ec) y participe con sus compaeros.
Revise cada uno de los anuncios de su profesor y los foros planteados e interacte con su opinin
y planteando sus inquietudes si las tuviere, esto le ayudar a reforzar sus conocimientos.
59
SEGUNDO BIMESTRE
Autoevaluacin 8
2.
3.
4.
5.
6.
En los hechos se encuentran las medidas que son los valores que van a ser analizados
para la toma de decisiones.
7.
8.
9.
El diagrama copo de nieve es una variacin del modelo en estrella en el que las
dimensiones contienen datos desnormalizados.
10.
Ir a solucionario
60
SOLUCIONARIO
8. Solucionario
UNIDAD 1
Pregunta
Respuesta
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
61
SOLUCIONARIO
UNIDAD 2
62
Pregunta
Respuesta
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
SOLUCIONARIO
UNIDAD 3
Pregunta
Respuesta
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
63
SOLUCIONARIO
UNIDAD 4
64
Pregunta
Respuesta
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
SOLUCIONARIO
UNIDAD 5
Pregunta
Respuesta
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
65
SOLUCIONARIO
UNIDAD 6
66
Pregunta
Respuesta
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
SOLUCIONARIO
UNIDAD 7
Pregunta
Respuesta
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
67
SOLUCIONARIO
UNIDAD 8
68
Pregunta
Respuesta
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
SOLUCIONARIO
69
SOLUCIONARIO
Unidad 2
Asumiendo que los identificadores de cada tabla son clave primaria y tienen asociado un ndice,
definiremos ndices para los atributos restantes.
Relacin USUARIO
Se recomienda indexar los atributos apelUsuario, nomUsuario y crear un ndice compuesto entre ambos
campos, separado por un espacio en blanco.
70
SOLUCIONARIO
Unidad 3
Una forma de distribucin de los datos sera la siguiente:
71
DI CTI ONARY
9. Anexos
TH ESA UR US
ANEXOS
Caso de estudio1
Escenario
La Distribuidora Latinoamericana de Alimentos (DLA) se dedica a la
comercializacin de productos comestibles y bebidas a travs de sus
hipermercados y supermercados.
Necesidad: los analistas de DLA, por pedido de sus directivos, necesitan realizar informes en donde
se pueda analizar:
Academia Latinoamericana de Business Intelligence. [En lnea] [Consultada 2008] Actualmente no est disponible.
73
ANEXOS
Esta informacin, requiere que sea presentada por zona geogrfica y sucursal.
A su vez, la empresa quiere:
Armar canastas de productos de acuerdo al perfil de compra de los clientes de cada ciudad en
la que tienen una boca de expendio. Para esto requieren un estudio de las ventas realizadas
abiertas por categora de producto (con la posibilidad de obtener el detalle por producto), por
ciudad, por mes, para los ltimos 13 meses (para detectar estacionalidades).
Premiar anualmente a aquellos vendedores que superen los objetivos de venta que les fueran
asignados. El anlisis, en este caso deber incluir a los vendedores, las ventas realizadas, los
objetivos de venta y el indicador de cumplimiento detallados por mes, para el ao fiscal (el
premio ser distinto si se cumple con los objetivos globalmente para el ao o si, adems, se
cumplen los objetivos en todos los meses en particular).
M-MEE/ymtm/14-07-2011/60
yc/2015/02/06
74