Está en la página 1de 11

RESUMEN BASE DE DATOS

Causas de error en un sistema de Base de Datos


Fsicas: son causadas por Fallas del hardware, como por ejemplo del disco o de
la CPU.
De Diseo: son agujeros en el software, ya sea en el SO o en el SGBD.
De Funcionamiento: son causadas por la intervencin humana, debidos a
Fallas del DBA, configuraciones inapropiadas o mal planteamiento de los
procedimientos de backup.
Del Entorno: como por ejemplo desastres naturales, Fallas de corriente,
temperatura excesiva.
Que sucede si se arranca la base de datos en modo de archivelog
Aunque se pierdan los archivos de datos, siempre se puede recuperar la BD con
una copia antigua de los archivos de datos y los archivos de redo log
archivados.
Es posible realizar backups en caliente.
Que es un backup en frio
Implican parar la BD en modo normal y copiar todos los archivos sobre los que
se asienta.
Backup en caliente
El backup en caliente se realiza mientras la BD est abierta y funcionando en
modo ARCHIVELOG.
Tipos de recuperacin en oracle
Bloques: mas simple, y es automatico. Se produce cuando un proceso muere
justo cuando est cambiando un bloque
Threads: Automtico cuando Oracle descubre que una instancia muere
dejando abierto un thread
Fsica: Se realiza como respuesta a un comando RECOVER.
Que es un backup valido
Es una copia de la informacin sobre la BD necesaria para reconstruir la BD a
partir de un estado no utilizable de la misma

Que es Business Inteligence


Es la habilidad para transformar los datos en informacin, y la informacin en
conocimiento, de forma que se pueda optimizar el proceso de toma de
decisiones en los negocios

Datos: Los datos son la mnima unidad semntica y contribuyen a la toma de


decisiones.
Informacin: Conjunto de datos procesados y que tienen un significado y que
por lo tanto son de utilidad para quin debe tomar decisiones
Conocimiento: Es una mezcla de experiencia, valores, informacin y knowhow (saber cmo) que sirve como marco para la incorporacin de nuevas
experiencias e informacin, y es til para la accin.
Soluciones Business intelligence
En definitiva, una solucin BI completa permite:
Observar qu est ocurriendo?
Comprender por qu ocurre?
Predecir qu ocurrira?
Colaborar qu debera hacer el equipo?
Decidir qu camino se debe seguir?

Sistema de Soporte a la Decisin (DSS) es una herramienta de Business


Intelligence enfocada al anlisis de los datos de una organizacin.
Principales componentes de Business intelligence
Datawarehouse
Datamart
Datawarehouse: Un almacn de datos es un sistema que recupera y
consolida datos de forma peridica de los sistemas de fuente en un almacn de
datos dimensional o normalizado

ETL (Extract Transform Load): Es un sistema que tiene la capacidad de


conectar con el sistema fuente(origen), transformar los datos, y la carga en un
sistema de destino (el sistema de destino no tiene que ser un almacn de
datos).
Stage Area (area de ensayo): Almacenamiento temporal de las tablas
origen. Su objetivo es no sobrecargar el sistema fuente(origen) con
transacciones o consultas.
Metadata Metadatos: es una base de datos que contiene informacin
sobre la estructura de datos, el significado de datos, el uso de datos, los datos
de la normas de calidad y otra informacin acerca de los datos.

En resumen para alimentar un Datawarehouse:


1.Identificar las tablas que tiene la informacin a migrar al datawarehouse.
2.Migrar las tablas a la base de datos stage(temporal), para no afectar la base
de datos operacional con operaciones que consumen mucho recurso.
3.Ejecutar la extraccin de datos y almacenamiento en las base de datos
dimensionales.
4.De acuerdo a la madurez del proceso se hace el control de auditoria y calidad
sobre la migracin de informacin.

Base de Datos Operacional


Datos operacionales

Data Warehouse
Datos del negocio para Informacin

Orientado a la aplicacin
Actual
Detallada
Cambia Continuamente

Orientado al sujeto
Actual + histrico
Detallada + ms resumida
Estable

El aspecto ms importante del ambiente data warehousing es que la


informacin encontrada al interior est siempre integrada.

Caracteristicas de un data warehosuse de tiempo variante


Toda la informacin del data warehouse es requerida en algn momento.
Los datos encontrados en el depsito se llaman de "tiempo variante".
Los datos histricos son de poco uso en el procesamiento operacional.

Caracteristicas de un data warehouse no voltil


Los datos se filtran cuando pasan desde el ambiente operacional al de depsito

El horizonte de tiempo de los datos es muy diferente de un ambiente al otro


El data warehouse contiene un resumen de la informacin que no se encuentra
en el ambiente operacional
Datamart
Un data mart es subconjunto de datos del almacn de datos con el propsito
de ayudar a que un rea o departamento especfico pueda tomar mejores
decisiones.
Datamining, es el conjunto de tcnicas y tecnologas que permiten explorar
grandes bases de datos
Etapas principales del Datamining
Determinacin de los objetivos. Trata de la delimitacin de los objetivos
que el cliente desea bajo la orientacin del especialista en data mining.
Preprocesamiento de los datos. Se refiere a la seleccin, la limpieza, el
enriquecimiento, la reduccin y la transformacin de las bases de datos.
Determinacin del modelo. Se comienza realizando unos anlisis
estadsticos de los datos, y despus se lleva a cabo una visualizacin grfica de
los mismos para tener una primera aproximacin.
Anlisis de los resultados. Verifica si los resultados obtenidos son
coherentes y los coteja con los obtenidos por los anlisis estadsticos y de
visualizacin grfica.
Web mining Una de las extensiones del data mining consiste en aplicar sus
tcnicas a documentos y servicios del Web, lo que se llama web mining
(minera de web).
Text mining
Es la extraccin de informacion de que se encuentra almacenada en hojas de
papel.
Fragmentacion
Es una relacin que corresponde a una tabla, consiste en dividirla en
fragmentos menores, cada fragmento se guarda en sitio diferente, tiene como
objetivo buscar alternativas para dividir una las tablas o instancias en otras
ms pequeas.

Fragmentos: Cada relacin global puede ser dividida en porciones llamados


fragmentos.
RAZONES PARA FRAGMENTAR
Encontrar unidad de distribucin ms adecuada.
Disminuir cantidad de accesos remotos.
Incrementar el nivel de concurrencia.
VENTAJAS DE LA FRAGMENTACIN DE TABLAS
Mejorar el rendimiento de las aplicaciones al trabajar con subconjuntos de
relaciones
Da una respuesta eficiente a aplicaciones que trabajan con los mismos datos en
diferentes nodos
Los fragmentos permiten aumentar el nmero de ejecuciones concurrentes.
DESVENTAJAS DE LA FRAGMENTACIN DE TABLAS
Disminuye la eficiencia en las aplicaciones que trabajan con varios fragmentos
La comprobacin de las restricciones de integridad puede ser ms costosa.
CONDICIONES PARA DEFINIR FRAGMENTOS
Completitud: La descomposicin de una relacin R en los fragmentos R1,
R2, ..., Rn es completa si y solamente si cada elemento de datos en R se
encuentra en algn fragmento.
Reconstruccin: Si la relacin R se descompone en los fragmentos R1, R2, ...,
Rn, entonces debe existir algn operador que permita reconstruir la Relacin
Original R.
Disyuncin: Si la relacin R se descompone en los fragmentos R1, R2, ..., Rn,
y el dato di est en Rj, entonces, no debe estar en ningn otro fragmento.
Existen tres tipos de fragmentacin:
1. Fragmentacin horizontal
Se realiza sobre las tuplas de la relacin, es decir que cada fragmento ser un
subconjunto de las tuplas de la relacin.
1.1 La fragmentacin horizontal primaria. Consiste en particionar las
tuplas (columnas) de una relacin global en subconjuntos

1.2 La fragmentacin horizontal derivada Consiste en dividir una relacin


partiendo de los predicados definidos sobre alguna otra.

2. Fragmentacin vertical
Consiste en dividir la relacin en un conjunto de relaciones ms pequeas tal
que algunas de las aplicaciones de usuario slo hagan uso de un fragmento.
Existen dos enfoques heursticos para la fragmentacin vertical de relaciones:
2.1 Agrupacin: Comienza asignando cada atributo a un fragmento, y en cada
paso, junta algunos de los fragmentos hasta que satisface un determinado
criterio.
2.2 Escisin: A partir de la relacin se deciden que fragmentos resultan mejores,
basndose en las caractersticas de acceso de las aplicaciones a los atributos.

3. Fragmentacin Mixta
La fragmentacin mixta puede llevarse a cabo de tres formas diferentes:
desarrollando primero la fragmentacin vertical y, posteriormente, aplicando la
fragmentacin horizontal sobre los fragmentos verticales (denominada
particin VH), o aplicando primero una divisin horizontal para luego, sobre los
fragmentos generados, desarrollar una fragmentacin vertical (llamada
particin HV), o bien, de forma directa considerando la semntica de las
transacciones.
Reglas de Correccion de la fragmentacion
Complecin: No hay prdida de datos ya que todas las tuplas se encuentran
fragmentadas en J1 y J2
Reconstruccin: Se puede reconstruir mediante la unin de todos los
fragmentos, es decir J1 U J2
Disyuncin: En la fragmentacin J1 Escuela = CIME no se va a encontrar EISIC,
y en J2 Escuela = EISIC no se va a encontrar CIME, entonces Jk (k j).
Beneficios al realizar tuning:
Mejorar el tiempo de respuesta de las aplicaciones online
Mejorar el tiempo de las aplicaciones batch (puede llegar el momento en que
traspasen los lmites permisibles + 12 horas?)
Garantizar la escalabilidad de la aplicacin
Reducir la carga del sistema liberar recursos para otros propsitos
Evitar actualizaciones innecesarias (e intiles muchas veces) de hardware

Cundo se debe afinar?


Idealmente SQL debera ser afinado en el momento en que se escribe.
Mientras ms avanzado est el proyecto ms difcil ser realizar el tuning:
Cambiar algunos aspectos implican cambiar muchas otras cosas
Una vez que SQL entra en produccin, la simple adicin de un ndice sobre
una tabla grande puede ser complejo (tiempo, restricciones corporativas
etc.)

Optimizador basado en reglas (RULE)


Es un sistema de optimizacin esttico, no vara de un momento a otro.
Optimizador basado en costes (CHOOSE)
Se basa en las reglas bsicas, pero teniendo en cuenta el estado actual de la
base de datos: cantidad de memoria disponible, entradas/salidas, estado de la
red, etc.
Un hint es un comentario dentro de una consulta SELECT que informa a Oracle
del modo en que tiene que trazar el plan de ejecucin.
Seguridad:
Proteccin de los datos contra su revelacin, su alteracin o su destruccin no
autorizadas.
Integridad:
La precisin o validez de los datos. Proteger los datos de usuarios autorizados.
Control de Acceso Discrecional
Garantiza privilegios a usuarios, incluyendo la capacidad para acceder archivos
de datos especficos, registros o campos para operar de una manera
determinada (read, insert, delete, o update).
WITH GRANT OPTION:
permite que el poseedor de ciertos privilegios pueda transmitirlos a otros
usuarios.

GRANT INSERT, SELECT ON Atletas TO Byron


Byron puede insertar y seleccionar tuplas de Atletas
GRANT DELETE ON Atletas TO Entrenador WITH GRANT OPTION
Entrenador puede borrar tuplas de Atletas y autorizar borrados a
otros usuarios.
GRANT UPDATE (categora) ON Atletas TO Organizador
Organizador puede actualizar solamente la categora en las
tuplas de Atletas.
GRANT SELECT ON VistaAtletasVeteranos TO Josu, Brandon, Alice
Josu, Brandon y Alice NO pueden consultar directamente la
tabla Atletas
REVOKE: Cuando un privilegio le es revocado al usuarioX,
tambin le es revocado a los que lo obtuvieron solamente de
usuarioX.
Control de acceso obligatorio
Clasifica usuarios y datos en mltiples niveles de seguridad, y luego fuerza
determinadas reglas acordes a cada nivel.
Reglas de autorizacin
Las actividades de creacin y mantenimiento de logins y usuarios de las bases
de datos se reparten entre:
System Security Officer (SSO)
System Administrator (SA)
DataBase Owner (DBO).
Procedimientos estndar para la creacin de ususarios

Estndares para la administracin de usuarios

Niveles de clasificacin de datos


Secreto:
Informacin sensible que tpicamente slo el Director de la empresa y sus
colaboradores cercanos conocen.

Confidencial:
Informacin que representa una ventaja competitiva para la Empresa
Restringido:
Datos operacionales de cada rea, en los cuales slo el personal adscrito a esa
rea especfica debe tener acceso
Interno:
Documentos de inters general para todos los empleados, sin importar
adscripcin.
Pblico:
Cualquier documento que se pueda difundir libremente al exterior de la
empresa

También podría gustarte