Documentos de Académico
Documentos de Profesional
Documentos de Cultura
En general, las bases de datos son demasiado grandes para entrar en la memoria primaria.
La memoria secundaria suele ser más barata que la memoria primaria (aunque esta última tiene
mayor velocidad).
La memoria secundaria es más útil para el almacenamiento de datos permanente, puesto que la
memoria primaria es volátil.
Para la gestión del almacenamiento de una base de datos existen 4 conceptos bien definidos que deben
ser conocidos para poder comprender la forma en la que se almacenan los datos. Vamos a ver la
diferencia entre bloque, extensión, segmento y espacio de tablas.
Bloques: Se tratan de la unidad más pequeña. Generalmente debe ser un múltiplo del tamaño de bloque
del sistema operativo, ya que es la unidad mínima que va a pedir Oracle al sistema operativo. Si no fuera
múltiple del bloque del sistema se añadiría un trabajo extra ya que el sistema debería obtener más datos
de los estrictamente necesarios. Se especifica mediante DB_BLOCK_SIZE
Ingeniería en Sistemas Computacionales Administración de Bases de Datos
Extensiones: Se forma con uno o más bloques. Cuando se aumenta el tamaño de un objeto se usa una
extensión para incrementar el espacio.
Segmentos: Grupo de extensiones que forman un objeto de la base de datos, como por ejemplo una
tabla o un índice.
Espacio de tablas: Formado por uno o más datafiles, cada datafile solo puede pertenecer a un
determinado tablespace
El administrador de la base de datos puede crear o borrar nuevos espacios lógicos de objetos, añadir o
eliminar archivos físicos de soporte, utilizados como espacio temporal de trabajo, definir parámetros de
almacenamiento para objetos destinados a ese espacio de datos, todos los gestores relacionales que
venimos introduciendo como ejemplos siguen esta filosofía. En el caso de Oracle, sobre los ficheros
físicos de datos (datafiles) se definen los tablespaces. Por lo tanto, una base de datos Oracle se compone
lógicamente de tablespaces, y físicamente de datafiles. Su creación es sencilla, con la sentencia CREAT
TABLESPACE: CREATE TABLESPACE usuarios DATAFILE `datal.ora' SIZE 50M
Para hacer más grande una base de datos, las opciones disponibles son tres:
Cada base de datos contiene un tablespace llamado SYSTEM que es creado automáticamente al crear la
base de datos. Contiene las tablas del diccionario de datos para la base de datos en cuestión. Es
recomendable no cargar datos de usuario en SYSTEM, para dejarlos como espacio de objetos del
sistema. Si además los datos de usuario están en tablespaces situados en otros dispositivos, el
rendimiento decaerá porque las tablas del diccionario de datos se acceden frecuentemente y por lo
tanto son un cuello de botella potencial desde el punto de vista del acceso a disco. A la hora de estimar
el espacio necesario para cl tablespace sys-nsm hay que tener en cuenta que las unidades de
programación PL-SQL (entorno de programación SQL proporcionado por Oracle) almacenadas en la base
de datos (procedimientos, paquetes, disparos y funciones) almacenan sus datos en SYSTEM.
De acuerdo con lo comentado anteriormente, tablas e índices se ubicarán en el tablespace indicado en el
momento de su creación con la correspondiente sentencia CREATE. Si no se dice nada, se situarán en el
tablespace por defecto asociado al usuario creador.
En cuanto al respaldo de las bases de datos (ver backup), suelen emplearse tanto discos duros, como
cintas magnéticas, discos ópticos o similares.
Ingeniería en Sistemas Computacionales Administración de Bases de Datos
Las técnicas empleadas para almacenar bases de datos son sumamente importantes para la velocidad de
acceso y recuperación de datos. Las técnicas dependen del tipo de almacenamiento, el uso que se le da o
se le dará a la base de datos, la estructura de la misma, el SGBD empleado, etc.
Esta dependencia no significa necesariamente que haya que cambiar la estructura de la base de datos si
se cambian las técnicas empleadas. Las técnicas de almacenamiento son independientes de la base de
datos, pero, de todas maneras, las mejores técnicas muchas veces pueden determinarse viendo la
estructura de la base de datos, entre otras características.
Los encargados de elegir estas técnicas son los diseñadores y administradores de bases de datos, y
dependen también de las capacidades del SGBD. En general, el SGBD ofrece diferentes opciones y
técnicas para organizar los datos.
La idea es que los encargados de la base de datos encuentren las técnicas idóneas, o sea, aquellas que
permitan la mayor velocidad posible de acceso a los datos. Una mala decisión en esta área puede
resultar en una menor velocidad de acceso a la base de datos, o en un uso excesivo del espacio de
almacenamiento, o incluso, puede aumentar la velocidad de consulta de una base de datos, pero
disminuir la velocidad de actualización de la misma.
3.1.2 Definición y creación del espacio asignado para cada base de datos
Las bases de datos se almacenan en ficheros o archivos. Existen diferentes formas de organizaciones
primarias de archivos que determinan la forma en que los registros de un archivo se colocan físicamente
en el disco y, por lo tanto, cómo se accede a éstos.
Existe una segunda forma de acceder a los datos llamada organización secundaria o estructura de acceso
auxiliar. Estas permiten que los accesos a los registros de un archivo basado en campos alternativos,
sean más eficientes que los que han sido utilizados para la organización primaria de archivos.
Archivos de Montículos (o no Ordenados): esta técnica coloca los registros en el disco sin un
orden específico, añadiendo nuevos registros al final del archivo.
Archivos Ordenados (o Secuenciales): mantiene el orden de los registros con respecto a algún
valor de algún campo (clave de ordenación).
Organización Secundaria o Estructura de Acceso Auxiliar: Estas permiten que los accesos a los
registros de un archivo basado en campos alternativos, sean más eficientes que los que han sido
utilizados para la organización primaria de archivos.
Ingeniería en Sistemas Computacionales Administración de Bases de Datos
El DBMS asigna espacio de almacenamiento a las bases de datos cuando los usuarios introducen create
database o alter database. El primero de los comandos puede especificar uno o más dispositivos de base
de datos, junto con la cantidad de espacio en cada uno de ellos que será asignado a la nueva base de
datos.
Si se utiliza la palabra clave default o se omite completamente la cláusula on, el DBMS pone la base
de datos en uno o más de los dispositivos predeterminados de base de datos especificados en
master.sysdevices.
Para especificar un tamaño (por ejemplo, 4MB) para una base de datos que se va a almacenar en una
ubicación predeterminada, se utiliza: on default = size de esta forma:
Para situar la base de datos en dispositivos específicos, dé el nombre del dispositivo o dispositivos en
que desea almacenarla. Como la sintaxis indica, puede solicitar que se almacene en más de un
dispositivo de base de datos, con una cantidad de espacio diferente en cada uno. Todos los dispositivos
mencionados en create database deben estar enumerados en sysdevices . En otras palabras, deben
haberse inicializado con disk init .
La instrucción siguiente crea la base de datos newdb y asigna 3MB en mydata y 2MB en newdata . Como
en el ejemplo anterior, la base de datos y el diario de transacciones no se separan:
Warning! A menos que cree una base de datos pequeña o que no sea crucial, sitúe siempre el diario en
un dispositivo de base de datos aparte.
3.1.3 Bitácoras.
Es una herramienta que permite registrar, analizar, detectar y notificar eventos que suceden en
cualquier sistema de información utilizado en las organizaciones.
La información contenida en una bitácora es muy importante y útil cuando ocurre cualquiera de las
siguientes situaciones:
Incidentes de seguridad.
Al realizar una auditoría de sistemas.
Al presentarse un comportamiento inusual de la información.
Si se presenta algún problema, la información de la bitácora puede ayudar a resolverlos.
Si se requiere información que sirva de evidencia legal.
Una bitácora es de gran ayuda en las tareas de cómputo forense.
Una bitácora también permite guardar las transacciones realizadas sobre una base de datos en
específico, de tal manera que estas transacciones puedan ser auditadas y analizadas posteriormente.
La bitácora puede registrar datos específicos de una transacción como son:
Los registros de la bitácora deben residir en memoria estable como resultado el volumen de datos en la
bitácora puede ser exageradamente grande.
Ejemplo de una creación de una bitácora en MySQL
Enseguida plantearé un ejemplo de una bitácora desarrollada para la siguiente base de datos de MySQL,
llamada proyecto, que tiene las tablas carrera, departamento y maestros.
CREATE DATABASE proyecto;
USE proyecto;
CREATE TABLE IF NOT EXISTS `carrera` (`clave_carrera` int(11) NOT NULL, `nom_carrera` varchar(20) NOT
NULL, `num_depto` int(11) NOT NULL, PRIMARY KEY (`clave_carrera`), KEY `num_depto` (`num_depto`) )
ENGINE=InnoDB DEFAULT CHARSET=latin1;
CREATE TABLE IF NOT EXISTS `departamento` ( `num_departamento` int(11) NOT NULL,`nombre_dept` varchar(20)
NOT NULL, `jefe_num_tarjet` int(11) NOT NULL, PRIMARY KEY (`num_departamento`), KEY `jefe_num_tarjet`
(`jefe_num_tarjet`) ) ENGINE=InnoDB DEFAULT CHARSET=latin1;
CREATE TABLE IF NOT EXISTS `maestros` (`num_tarjeta` int(11) NOT NULL DEFAULT 0,`nombre` varchar(50)
DEFAULT NULL, PRIMARY KEY (`num_tarjeta`)) ENGINE=InnoDB DEFAULT CHARSET=latin1;
La bitácora debe registrar todos los movimientos (insertar, eliminar y modificar) que se realicen en las
tablas de la base de datos además de conservar los valores anteriores cuando son sustituidos por valores
nuevos. Para lograr lo anterior es necesario crear un trigger para que se ejecute después de la operación
de insertar, otro para después de eliminar y el último para después de modificar para cada una de las 3
tablas de la base de datos. Los tres triggers necesarios para que funcione la bitácora con la tabla carrera
son los siguientes (Se le deja al alumno como ejercicio que elabore los demás triggers para las tablas
departamento y maestros) :
/* Triger INSERT para la Tabla carrera */
3.1.4 Particiones
Cuando alguna de las tablas de una base de datos llega a crecer tanto que el rendimiento empieza a ser
un problema, es hora de empezar a conocer algo sobre optimización. Una característica de MySQL son
las particiones.
Particionar tablas en MySQL nos permite rotar la información de nuestras tablas en diferentes
particiones, consiguiendo así realizar consultas más rápidas y recuperar espacio en disco al borrar los
registros. El uso más común de particionado es según la fecha.
Para ver si nuestra base de datos soporta particionado simplemente ejecutamos:
SHOW VARIABLES LIKE '%partition%';
En el siguiente ejercicio debe crear y pone en uso la siguiente base de datos:
CREATE DATABSE industria;
USE industria;
);
La última partición (partDefault) tendrá todos los registros que no entren en las particiones anteriores.
De esta manera nos aseguramos que la información nunca dejará de insertarse en la tabla.
Por Listas: para construir nuestras particiones especificamos listas de valores concretos.
ALTER TABLE contratos
PARTITION BY LIST (YEAR (fechaInicio)) (
PARTITION partDecada80 VALUES IN (1980, 1981, 1982, 1983, 1984, 1985, 1986, 1987, 1988, 1989),
PARTITION partDecada90 VALUES IN (1990, 1991, 1992, 1993, 1994, 1995, 1996, 1997, 1998, 1999),
PARTITION partDecada00 VALUES IN (2000, 2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009),
PARTITION partDecada10 VALUES IN (2010, 2011, 2012, 2013, 2014, 2015, 2016, 2017, 2018, 2019)
);
Por Hash: MySQL se encarga de distribuir las tuplas automáticamente usando una operación de módulo.
Sólo hay que pasarle una columna o expresión que resulte en un entero (el hash) y el número de
particiones que queramos crear.
ALTER TABLE contratos
PARTITION BY HASH (YEAR (fechaInicio))
PARTITIONS 7;
Por Clave: similar a la partición por hash, pero en este caso no necesitamos pasarle un entero; MySQL
utilizará su propia función de hash para generarlo. Si no se indica ninguna columna a partir de la que
generar el hash, se utiliza la clave primaria por defecto.
Ingeniería en Sistemas Computacionales Administración de Bases de Datos
El número de tuplas que MySQL tiene que comprobar se ve disminuido en 2 órdenes de magnitud.
Borrar Particiones
Lo bueno de trabajar con particiones es que podemos borrar rápidamente registros sin tener que
recorrer toda la tabla e inmediatamente recuperar el espacio en disco utilizado por la tabla.
Por ejemplo si queremos borrar la partición más antigua simplemente ejecutamos:
ALTER TABLE reports DROP PARTITION p201111;
Añadir particiones
En el ejemplo anterior las 2 últimas particiones creadas han sido:
PARTITION p201205 VALUES LESS THAN (TO_DAYS ("2012-06-01")),
PARTITION pDefault VALUES LESS THAN MAXVALUE
El problema es que todos los INSERT que se hagan después de mayo de 2012 se insertarán en pDefault.
La solución sería añadir particiones nuevas para cubrir los próximos meses:
ALTER TABLE reports REORGANIZE PARTITION pDefault INTO (
PARTITION p201206 VALUES LESS THAN (TO_DAYS ("2012-07-01")),
PARTITION pDefault VALUES LESS THAN MAXVALUE);
En el caso que no tuviéramos una partición del tipo pDefault simplemente ejecutamos:
Ingeniería en Sistemas Computacionales Administración de Bases de Datos
ALTER TABLE reports ADD PARTITION (PARTITION p201206 VALUES LESS THAN (TO_DAYS ("2012-07-
01")));
Ejemplo de añadir una partición por key a una tabla en mysql:
Primero se muestra el script de la tabla sin partición.
SHOW CREATE TABLE folio;
Mejorar el rendimiento
Separar índices de datos
Aislar los logros en otro disco
Ingeniería en Sistemas Computacionales Administración de Bases de Datos
3.2 Segmentos
Los datos en la BD son almacenados físicamente en bloques Oracle: la mínima unidad de espacio físico, y
es un múltiplo del bloque del SO (2 Kb usualmente). El tamaño del bloque Oracle se fija por el parámetro
DB_BLOCK_SIZE del fichero init.ora. Un tamaño grande de bloque mejora la eficiencia del cache de E/S,
pero el tamaño de la SGA aumentará para contener los mismos DB_BLOCK_BUFFERS, lo que significa un
problema de memoria.
Una serie de bloques contiguos es una extensión, que es una unidad lógica de almacenamiento. Una
serie de extensiones es un segmento. Cuando un objeto es creado, se reserva una extensión en su
segmento. Cuando el objeto crezca, necesitará más espacio y se reservarán más extensiones.
Cada segmento tiene un conjunto de parámetros de almacenamiento que controla su crecimiento:
initial: tamaño de la extensión inicial (10k).
next: tamaño de la siguiente extensión a asignar (10k).
minextents: número de extensiones asignadas en el momento de la creación del segmento (1).
maxextents: número máximo de extensiones (99).
pctincrease: Porcentaje en el que crecerá la siguiente extensión antes de que se asigne, en relación con
la última extensión utilizada (50).
pctfree: porcentaje de espacio libre para actualizaciones de filas que se reserva dentro de cada bloque
asignado al segmento (10).
pctused: porcentaje de utilización del bloque por debajo del cual Oracle considera que un bloque puede
ser utilizado para insertar filas nuevas en él.
tablespace: nombre del espacio de tablas donde se creará el segmento.
Cuando se diseña una BD se ha de tener mucho cuidado a la hora de dimensionar la BD y prever el
crecimiento de las tablas. A continuación se hacen algunas consideraciones sobre la gestión del espacio
para los diferentes segmentos.
Segmentos de Datos
El espacio del diccionario de datos se suele mantener más o menos constante, aunque es crítico que
tenga suficiente espacio para crecer en el espacio de tablas SYSTEM. Así, hay que tener cuidado de
colocar las tablas de usuario, los índices, segmentos temporales y los segmentos de rollback en otros
espacios de tablas.
Además, es recomendable que el espacio de tablas SYSTEM esté al 50% o 75% de su espacio disponible.
Finalmente, asegurarse que los usuarios no tienen privilegios de escritura en el espacio de tablas
SYSTEM.
Ingeniería en Sistemas Computacionales Administración de Bases de Datos
Las tablas crecen proporcionalmente con el número de filas, ya que se puede suponer que la longitud de
las filas es constante.
Segmentos de Índice
Los índices crecen en tamaño en mayor proporción que las tablas asociadas si los datos en la tabla son
modificados frecuentemente. La gestión del espacio es mejor si se mantienen los índices de tablas
grandes en espacios de tablas separados.
Segmentos de Rollback
Los segmentos de rollback almacenan la imagen anterior a una modificación de un bloque. La
información en el segmento de rollback se utiliza para asegurar la consistencia en lectura, el rollback (el
valor en el segmento de rollback se copia en el bloque de datos) y la recuperación.
Es importante comprender cuál es el contenido de un segmento de rollback. No almacenan el bloque de
datos modificado entero, sólo la imagen previa de la fila o filas modificadas. La información del
segmento de roolback consiste en varias entradas llamadas undo. Por ejemplo, si se inserta una fila en
una tabla, el undo necesitará sólo el rowid de la fila insertada, ya que para volver atrás la insercion sólo
hay que realizar un delete. En la operación de actualización, se almacenará el valor antiguo de las
columnas modificadas. El segmento de rollback asegura que la información undo se guardan durante la
vida de la transacción.
Un segmento de rollback como cualquier otro segmento consiste en una serie de extensiones. Sin
embargo, la mayor diferencia entre un segmento de datos y otro rollback es que en este último las
extensiones se utilizan de manera circular. Así, habrá que tener cuidado a la hora de fijar el tamaño del
segmento de rollback para que la cabeza no pille a la cola.
Segmentos Temporales
Los segmentos temporales se crean cuando se efectúan las siguientes operaciones:
Create Index
Select con distinct, order by, union, intersect y minus.
uniones no indexadas.
Ciertas subconsultas correlacionadas.
Si las tablas a ordenar son pequeñas la ordenación se realiza en memoria principal, pero si la tabla es
grande se realiza en disco. El parámetro SORT_AREA_SIZE determina el lugar donde se hace la
ordenación. Incrementándole se reduce la creación de segmentos temporales.
Cuando comenzamos a trabajar con Oracle una de las primeras cosas que aprendemos es a diferenciar
entre estos conceptos: base de datos, instancia e instancia de base de datos.
Una instancia es el conjunto de procesos que se ejecutan en el servidor así como la memoria que
comparten para ello.
Cuando se habla de base de datos, nos referimos a los archivos físicos que componen nuestra base de
datos.
Si queremos referirnos a los procesos que se ejecutan en memoria como a los archivos de base de datos
tendremos que utilizar el término instancia de base de datos.
La instancia en Oracle describe varios procesos residentes en la memoria del computador(es) y un área
de memoria compartida por aquellos procesos. En arquitecturas de bases de datos tales como, Microsoft
SQL Server e IBM BD2, la palabra instancia indica una colección de bases de datos que comparten
recursos de memoria en común, o sea, la relación entre instancia y bases de datos es 1 a N. Pero la
relación entre la instancia de Oracle y la base de datos es 1 a 1 o n a 1. Cuando hay una relación N a 1, la
configuración es llamada RAC (Real Application CLuster), donde la base de datos reside en discos
compartidos y las instancias en múltiples computadores anexados a la base de datos.
La instancia de Oracle es el motor que procesa los requerimientos de datos desde la base de datos. Está
compuesta por procesos en primer plano, en segundo plano y un área de memoria compartida (SGA).
Una instancia de Oracle es un conjunto de estructuras de memoria que están asociadas con los archivos
de datos (datafiles) en una máquina. Una base de datos es una colección de archivos físicos.
Ingeniería en Sistemas Computacionales Administración de Bases de Datos
Instancia de Oracle
La integran los procesos 'background' y la SGA. Abre una y sólo una BDO, y permite acceder a ella.
Nota: con Oracle Real Application Cluster (RAC), más de una instancia usarán la misma BD.
En la máquina donde reside el servidor Oracle, la variable ORACLE_SID identifica a la instancia con la que
estamos trabajando.
Vistas
V$DATABASE (Base de datos).
V$INSTANCE (Instancia).
V$SGA (SGA).
V$SGAINFO (Gestión dinámica de la SGA).
V$SGASTAT (SGA detallada).
V$BUFFER_POOL (Buffers en la caché de datos)
V$SQLAREA (Sentencias SQL).
V$PROCESS (Procesos).
V$BGPROCESS (Procesos background).
V$DATAFILE (Ficheros de datos de la BD).
V$CONTROLFILE (Ficheros de control de la BD).
V$LOGFILE (Ficheros redo log de la BD).
DBA_TABLESPACES (Tablespaces de la BD).
DBA_SEGMENTS (Segmentos que hay en los tablespaces).
DBA_EXTENTS (Extensiones que componen los segmentos).
DBA_USERS (Usuarios de la BD).
En un Oracle RAC, una base de datos puede ser montada por más de una instancia, y en cualquier punto,
una instancia será parte de sólo una Base de datos. El almacén no volátil para archivos de datos que
comprende la Base de datos es igualmente disponible a todos los nodos, para el acceso de lectura y
escritura. De lo anterior se desprende que un RAC de Oracle necesita coordinar y regular el acceso
“simultaneo” a los datos desde múltiples servidores (nodos), por ende, debe existir una red privada que
sea eficiente, confiable y de alta rapidez, entre los nodos del clúster para enviar y recibir datos
Crear Instancias MySQL
Tener dos instancias o más tiene entre otras las siguientes justificaciones. Una se dedicará a desarrollo,
para hacer las modificaciones y pruebas necesarias y otra al de producción.
Proceso
Copiar la carpeta data que se encuentra en nuestro caso en c:\MySQL, como data2
Copiar y pegar la configuración de MySQL. Es decir, del archivo my.ini (en linux my.cnf) generamos una
copia que podría llamarse my2.ini.
Ingeniería en Sistemas Computacionales Administración de Bases de Datos
Ahora con cuidado editamos my2.ini, procure no tocar my,ini a menos que este seguro de lo que hace.
Iniciamos configurando el puerto por donde escuchara MySQL la segunda instancia y la ruta de datos el
archivo de datos.