Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Niveles de RAID
RAID 0
En realidad no es un RAID, porque no cumple con el
objetivo más importante: tolerancia a fallos y
disponibilidad. Sólo sirve para aumentar la velocidad (y
la capacidad porque tenés más discos) Consiste en
hacer STRIPPING, es decir que un archivo se divide en
partes llamadas bandas (strip) y estas se reparten en
varios discos físicos, al hacer esto puedo escribir varias
bandas en simultáneo. Pueden ser dos o más discos,
cuanto más mejor.
RAID 1
Consiste en hacer ESPEJADO, es decir en un disco se
almacena los archivos y el otro es una copia fiel al
original. De esa forma si se rompe un disco tengo la
copia. La escritura se realiza al unísono, no así la
lectura. La velocidad de escritura va a ser el del disco
más lento, puesto no se considera finalizada hasta que
se hayan escrito los dos discos. En cambio, la velocidad
de lectura es la del más rápido, porque no hace falta
leer también el otro.
RAID 0+1
Es un combinación de los dos anteriores. Tenés dos
discos que funcionan con stripping y dos discos
espejados de los mismos. De esa forma hay
tolerancia frente a fallos y velocidad.
1/24 Damian Asman – Claudio – Eve Ondarza – Gutes – Angel- Julieta
“Yegua”- Lili Boba- el hombre lobo- Maradona- Baldassi- Cristina
Kirchner- Koko- Turco (L) Pokemon
RAID 3
Hay dos discos que hacen stripping y un tercer disco que calcula el xor (la
paridad) entre los bloques del primer disco y los bloques del segundo.
Recordamos bit de paridad
A B Xor(A,B)
0 0 0
0 1 1
1 0 1
1 1 0
Entonces se compara el primer bloque del disco 0 con el primer bloque del
disco uno y en el 1 bloque del disco 2 se almacenan los bits de paridad entre
los bits de los bloques 0 y 1. Luego se compara el segundo del disco 0 con el
segundo del disco 1 … y así sucesivamente.
De esa forma si falla un disco de datos teniendo el otro y su paridad puedo
recuperarlo.
El disco de paridad es el más propicio a fallar, porque siempre que se escriba
uno de los discos de datos se debe modificar también al disco de paridad,
entonces sufre mayor desgaste.
RAID5
Es similar al RAID 3, pero en vez de haber
un solo disco dedicado exclusivamente a la
paridad, cada vez se graba el bloque de
paridad en un disco distinto. Así todos los
discos contienen datos y redundancias y no
hay uno que se gaste más que otro.
Este es el más popular de todos los RAID,
porque posee la mejor relación costo-beneficio
RAID6
Similar al RAID 5 pero contiene dos
bloques de redundancia. En realidad el
segundo bloque puede contener código
Reed-Salomon (similar al que se usa en los
cd para asegurarse de que estén bien los
datos). Este es muy seguro pero un poco
caro, por eso no es muy usado.
- Gestor de almacenamiento
Actúa en los niveles más bajos. Es la interfaz entre los datos almacenados en
soporte y todos los programas o consultas que deseen acceder a los mismos.
Su función es traducir las instrucciones LMD a las órdenes de bajo nivel que se
le deben dar al Sistema Operativo que gestiona los archivos, permitiendo así el
almacenamiento, recuperación y actualización de la información almacenada
en soporte.
- Gestor de transacciones
Asegura atomicidad y evita errores de concurrencia
- Gestor de archivos
- Gestor de concurrencia
Se asegura de que no haya inconsistencia ni información incorrecta cuando
varios usuarios o aplicaciones realicen modificaciones al mismo tiempo
- Gestor de recuperación
Asegura la consistencia en caso de que se corte la energía
Base de Datos
Niveles de abstracción
• Nivel físico
El nivel mas bajo de abstracción describe como se almacenan realmente los
datos. En el nivel físico se describen en detalle las estructuras de datos
complejas de bajo nivel.
• Nivel lógico
• Nivel de vistas
El nivel más alto de abstracción describe solo parte de la base de datos
completa. A pesar del uso de estructuras más simples en el nivel lógico, queda
algo de complejidad, debido a la variedad de información almacenada en una
gran base de datos. Muchos usuarios del sistema de base de datos no
necesitan toda esta información. En su lugar, tales usuarios necesitan acceder
solo a una parte de la base de datos. Para que su interacción con el sistema se
simplifique, se define la abstracción a nivel de vistas. El sistema puede
proporcionar muchas vistas para la misma base de datos.
Permite definir las relaciones entre las tablas. Esto se logra mediante el uso de
claves.
• Una base de datos relacional se compone de varias tablas o relaciones.
• No pueden existir dos tablas con el mismo nombre.
• Cada registro representa un objeto del mundo real.
• No pueden existir dos columnas con el mismo nombre en una misma
tabla.
• Los valores almacenados en una columna deben ser del mismo tipo de
dato.
• Todas las filas de una misma tabla poseen el mismo número de
columnas.
Podemos definir a los usuarios como toda persona que tenga todo tipo de
contacto con el sistema de base de datos desde que este se diseña, elabora,
termina y se usa. Pueden clasificarse como:
Integridad de dominio
La integridad referencial
Índice Disperso
Mayor Dirección
40 10
80 11
Primario
Dir Reg 1 Reg 2 Reg 3 Desborde
10 1 20 40 5
Desborde
Dir Reg 1 Reg 2 Reg 3 Desborde
5 5 12 8 6
Índice: Archivo relacionado al archivo de datos que posee registros lógicos con
dos campos: Clave y Dirección. Permite un rápido acceso a los registros de un
archivo. Hay dos tipos de indices: Densos y Dispersos.
Densos: posee una relación de 1 a 1 y posee por cada registro un valor
de índice.
Dispersos: Los valores del índice están subdivididos en temas
relacionados con los registros a los que direcciona. Cada valor de índice
posee varios registros.
El índice puede tener una estructura jerárquica, por ejemplo:
Nodo Raíz -> Disperso -> Disperso (menos jerárquico) -> Denso
Archivos de datos y bd
Un archivo es una estructura de datos que reside en memoria secundaria
(Disco, CD, DVD, Pendrive) consistente en un conjunto de informaciones
estructuradas en unidades de acceso denominadas registros todos del mismo
tipo y en número indeterminado.
Tipos
2.Modos:
Relativa aleatoria accedo a un registro lógico sin pasar por los demás(poco
tiempo de acceso), tengo 1 registro lógico por físico y sirve para grandes
archivos con baja actividad.
Operaciones:
BASE DE DATOS.
Lenguajes:
Funciones de sgbd:
• Acceso a los datos desde algun lenguaje de alto nivel.
• Definición del esquema de la bd y de los distintos
subesquemas.
• Actua como intermediario entre el programa de aplicación y
el s.o. .
• Seguridad.
• Nivel físico
• Nivel lógico
• Nivel de vistas
ACAD.
Tipos de escrituras:
Simultanea: modifica la bd a medida que ejecuta la transacción sin
saber si se va a terminar de ejecutar correctamente.
3) Se llama registro lógico a aquél con el que trabaja la aplicación que utiliza
ese archivo de datos, es decir que es algo abstracto. Se llama registro físico a
la información que está almacenada de forma física en el soporte (con la
estructura propia de un registro).
Clave candidata: Son todos los campos o conjuntos de campos que pueden
llegar a ser utilizados como clave primaria. (La clave primaria es una y sólo una
de las candidatas)
Clave foránea: Campo que contiene la clave primaria de otro registro para
hacer referencia a este. Se usa para relacionar dos registros de una misma
tabla o de tablas diferentes.
- Directo
Se puede acceder a un registro sin tener que recorrer ningún otro registro y
sin tener que aplicar ninguna operación a la clave puesto esta es también la
dirección de la posición de memoria en donde se encuentra el registro. (A
cada registro lógico le corresponde un registro físico completo)
- Aleatorio
Se puede acceder a un registro sin tener que recorrer ningún otro registro,
pero es necesario aplicar una operación sobre la clave, puesto ésta no
coincide con la dirección de la posición de memoria en donde se encuentra
el registro-ya sea porque no entra en el rango o porque no es de tipo
numérico.
En todos los casos es necesario conocer la clave primaria del registro a fin de
poder identificarlo.
18/24 Damian Asman – Claudio – Eve Ondarza – Gutes – Angel- Julieta
“Yegua”- Lili Boba- el hombre lobo- Maradona- Baldassi- Cristina
Kirchner- Koko- Turco (L) Pokemon
Los factores que hay que tener en cuenta para la organización son:
- Tamaño del archivo
8) Organización secuencial
Los registros se encuentran en posiciones continuas y van en el mismo orden
en que fueron ingresados. Como ya dije antes, se accede sí o sí en un orden
fijo de los registros, o sea que para acceder el registro 3 tengo que recorrer
también el 1 y el 2).
Los soportes utilizados pueden ser tanto direccionables como no
direccionables. (Los cuales son más baratos) Y se utiliza todo el soporte,
explotándolo así al máximo.
A diferencia de la organización aleatoria, no es necesario efectuar ninguna
operación sobre la clave. Resulta muy eficiente si se consultan o modifican
muchos registros a la vez.
Sin embargo, localizar un registro puede demorar bastante tiempo; y siempre
se debe trabajar con el archivo entero, no con sus registros individualmente,
por lo tanto en las bajas se debe contar con un archivo auxiliar para volver a
escribir todo el archivo con la cantidad justa de registros.
Se llama índice denso cuando la tabla índice contiene una entrada por cada
clave primaria que tengan los registros del área primaria. Cada registro del
índice contiene dos campos: la clave primaria y la dirección de la célula donde
esta almacenado el primer registro que tenga esa clave. Entonces se ubica el
registro buscado recorriendo secuencialmente desde al dirección indicada en el
índice (Puede haber más de un registro con el valor de la clave de búsqueda,
sólo si coincide con una clave candidata habrá un único registro).De esta forma
la consulta es muy rápida, pero se utiliza mucho espacio y las actualizaciones
demoran más.
Se denomina índice disperso cuando la tabla solo contiene una entrada por
segmento, como lo explicado previamente.
Haciendo una analogía con POO podríamos decir que el esquema es una clase
y el ejemplar una instancia de esa clase
Existen esquemas para cada uno de los niveles de abstracción y cada una de
las vistas.
15) El esquema físico puede cambiar sin que cambie el lógico. Las aplicaciones
que acceden a la base de datos están programadas en base al lógico; por lo
que siguen siendo igualmente válidos. Por más que cambie la forma en que se
representan los datos en el soporte; qué datos y cuál es su relación sigue
siendo igual.
No hay tanta independencia lógica como física. (Ej: si cambio el nombre de un
campo repercute en las aplicaciones que accedían a ese campo) Sin embargo,
puedo agregarle cosas al esquema lógico sin que esto afecte a los datos que
había antes del cambio (y que todavía siguen estando)
Una base de datos relacional está compuesta por tablas. Las filas de las tablas
se llaman registros. Cada registro corresponde a una entidad. Las columnas
se llaman campos. Cada campo corresponde a un atributo de la entidad. Así
una tabla está formada por todos los registros de un mismo tipo. Todos los
elementos de datos de un mismo tipo deben poseer los mimos atributos, o sea
que todos los registros de una tabla poseen los mismos campos. Para
relacionar dos registros se utiliza su identificador único ó clave principal.