Está en la página 1de 14
Sistemas de almacenamiento de la informacién Comprender la problematica derivada del almacenamiento dptimo de la informacién. Tomar cierta perspectiva hist6rica sabre el desarrollo de los sistemas de informacién: similar las caracteristicas de los distintos tipos de fichero. Entender el concepto de indice. Describir los distintos modelos de bases de datos. Familiarizarse con los componentes y funciones de los sistemas gestores de bases de datos. pS ‘Mapa conceptual del capitulo SISTEMAS DE ALMACENAMIENTO DE LA INFORMACION +—>| wironuccion [mmancon | Tipos de ichera sepin a extroctura | ‘de lmacensmiento CH “ipos de soparte de almacenamiento ) Definicién ) [| sass DE Daros = Tipas de baves de datos Componentes del SGD ) Funciones del SGBD ) SISTEMAS GESTORES DE BASES DEDATOS a . | Backup. Copia de seguridad de datos 0 aplicaciones informaticas. Byte. Unidad de informacién compuesta de ocho bits o digitos binarios. Fichero 0 archivo. Entidad consistente en secuencias de bytes que se almacenan en tuna memoria secundaria (diseo duro, cinta magnética, DVD, ete.) Interfaz de linea de comandos (Command-Line Interface, CLI). Forma de interactuar ‘con un software mediante el envio de comandos por parte del usuario y en ausencia de tuna interfaz graifica, Lenguaje de marcas (markup language). Conjunto de instrucciones de codifica {que permiten marcar 0 etiquetar diversas partes de un fichero aportande informacion adicional sobre su contenido, estructura o presentacion. Lenguaje de programacién. Conjunto de normas lingiifsticas que permiten a un orde- rnador comprender y ejecutar un programa, ‘Mainframe. Ordenador de gran potencia utilizado simultneamente: por muchos usua- rios. Es habitual en entornos de banca y grandes empresas. Networking. Area de trabajo relacionada con comunicaciones y redes de ordenadores. Software. Programa informatico. 1.1. Introducci6n Segéin el Diaionario de la Real Academia Espafiola (DRAB), informitica es el «Conjunto de conocimientos cientificos y t€cnicas que hacen posible el tratamiento automiitico de la infor- maci6n por medio de ordenadoress. EI diccionario de Cambridge University Press define infor- mation technolegy (I) como «la ciencia y la actividad de utilizar ordenadores y otras herramientas clectrdnicas para almacenar y enviar informaciéne. En ambos casos, el objeto de la disciplina es lh informacién, y el objetivo su gestibn. Definimos sistema de informacién como el conjunto de procedimientos y funciones dirigidos a recogida, elaboraci6n, evaluaci6n, almacenamiiento, recuperaci6n, condensacién y distribu- ién de informaciones dentro de una organizacién. ‘Antes de que surgieran las bases de datos el procesamiento automatizado de informaci6n se hacia mediante ficheros. Las aplicaciones eran orientadas al proceso (el esfuerzo se enfocaba al tratamiento que los datos recibjan en una aplicacién concreta). Los ficheros se disefiaban a me- dida para cada sistema de informacidn, sin que existiera un formato comin. Figura 1.1. Un mainframe da servicio a muchos usuarios de forma simulténea Esta aproximacién no contemplaba la gestion de la informacion a medio o largo plazo. onganizaci6n disponia de varias aplicaciones que, en algunos casos, trataban la misma informacion (ejemplo: el softcare utilizado por el departamento de recursos humanos debia gestionar un fi- chero con datos de empleados, mientras la aplicacién de contabilidad mantenia otto fichero dis- tinto con los mismos datos organizados de otra forma). Surgian los siguientes problemas: + Redundancia de datos (duplicidad innecesaria de informacién) + Mal aprovechamiento del espacio de almacenamiento. + Aumento en el tiempo de proceso. + Inconsistencia de informaciGn debida a la redundancia (si un dato cambiaba en el fichero de una aplicacién, no cambiaba en los demis) + Aislamiento de la informacién (imposibilidad de transferirla a otros programas a no ser Sn especifico). que se desarrollara un softuwre de migra Habi estructura en definitiva, una gran falta de flexibilidad originada en ka dependencia total de la -a de los datos. 1.2. Ficheros Las aplicaciones gestoras de bases de datos se encargan de configurar una estructura Optima de almacenamiento de informacién con minima intervencién por parte del usuario, No obstante, es interesante completar la perspectiva histrica con una breve descripcién tebrica sobre orga- jan de ficheros. en . | _ Backup. Copia de seguridad de datos 0 aplicaciones informéticas. Byte. Unidad de informacién compuesta de ocho bits o digitos binarios. Fichero:o archivo. Entidad consistente en secuencias de bytes que se almacenan en tuna memoria secundaria (disco duro, cinta magnética, DVD, etc.) Interfaz de linea de comandos (Command-Line Interface, CL). Forma de interactuar ‘con un software mediante el envio de comandos por parte del usuario y en ausencia de una interfaz grafica, Lenguaje de marcas (markup language). Conjunto de instrucciones de codificacién ‘que permiten marcar o etiquetar diversas partes de un fichero aportanda informacién adicional sobre su contenido, estructura o presentacién. Lenguaje de programacién. Conjunto de normas lingifsticas que permiten a un orde~ nador comprender y ejecutar un programa, ‘Mainframe. Ordenador de gran potencia utilizado simulténeamente por muchos usua- Es habitual en entomos de banca y grandes empresas, ‘Networking. Area de trabajo relacionada con comuni Software. Programa informatica. 1es y redes de ordenadores. 1.1. Introducci6én Segiin el Diccionario de la Real Academia Espaiiola (DRAB), informatica es el Conjunto de conocimientos cientificos y tenicas que hacen posible el tratamiento automitico de la infor- macién por medio de ordenadores». El diccionario de Cambridge University Press define infor- mation technology (IT) como sla ciencia y la actividad de utilizar ordenadores y otras herramientas lectrGnicas para almacenar y enviar informaciéns. En ambos casos, el objeto de la disciplina es 1h informaci6n, y el objetivo su gesti6n. Dei ah recogida, elaboracién, evaluaci6n, almacenamiento, recuperaci ‘cidn de informaciones dentro de una organizaci6n, Antes de que surgieran las bases de datos el procesamiento automatizado de informacién se Ihacia mediante ficheros. Las aplicaciones eran orientadas al proceso (el esfuerzo se enfocaba al tratamiento que los datos recibian en una aplicacién concreta). Los ficheros se disefiaban a me dida para cada sistema de informacidn, sin que existiera un formato comin. nos sistema de informacién como el conjunto de procedimientos y funciones dirigidos a,condensacién y disteibu- Figura 1.1. Un mainframe da servicio a muchos usuarios de forma simulténea Esta aproximacién no contemplaba la gestién de la informacién a medio o largo plazo. Us organizaci6n di de varias aplicaciones que, en algunos casos, trataban la misma informacion (ejemplo: el software utilizado por el departamento de recursos humanos debia gestionar un fi- chero con datos de empleados, mientras la aplicacién de contabilidad mantenia otro fichero dis- ganizados de otra forma). Surgian los sigu into con Tos mismos datos o: ntes problemas: + Redundancia de datos (duplicidad innecesaria de informacién). + Mal aprovechamiento del espacio de almacenamiento, + Aumento en el tiempo de proceso. + Inconsistencia de informacién debida a ba redundaneia de una aplicacién, no cambiaba en los dems). + Aislamiento de la informacién (imposibilidad de transferirla a otros programas a no ser que se desarrollara un sofiwure de migracién especi un date cambiaha en el fichero Habia, en definitiva, una gran falta de flexibilidad originada en la dependencia total de la estructura fisica de los datos. 1.2. Ficheros Las aplicaciones gestoras de bases de datos se encargan de configurar una estructura éptima de almacenamiento de informacién con minima intervencién por parte del usuario, No obstante, «5 interesante completar la perspectiva histrica con una breve descripcién te6rica sobre orga- nizacién de ficheros en . | En Ia figura 14 los NIF aparecen ordenados.Tias cada uno de ellos se ha afiadide el nndimero de linea del fichero principal donde se encuentra la informacién asociada. tuna aplicacién sofiware quisiera listar los clientes ordenados por NIE recorreria secuen cialmente el fichero de indice, y al final de cada linea encontraria la Tinea del fichero principal que debe leer para encontrar a cada cliente El siguiente fichero indexaria los clientes ordenados por su primer apellido: carcia. 2-4 [| co7asszirraula ‘Sanz uizaro | 44] = sossvaszvsosé Luis Garefa Peinado 3 aesasgoexravier Peinado sanz 1 P ov6sze0rmnutn bézaro Figura 1.5 Fichero de indice por primer apellido de cliente y fichero de clientes original Aunque se utilice en este caso para simplificar el ejemplo, generalmente el acceso a cada posicién no lo marca el nimero de linea, sino un puntero a la celda de memoria correspondiente. Actividad propuesta 1.1 ee ee ee eee ee ‘mer apellido, segundo opelide y nombre. 1.2.9. Tipos de soporte de almacenamiento De acuerdo a la organizacién fisica de los datos, diferenciamos entre dos tipos de soportes: + Seauenciales.Para accedera un dato hay que recorrer todo el contenido del soporte previo a dicho dato (ejemplo: cintas magnéticas). Figura 1.6 Cinta magnética para guardar Informacion de respaldo wD BASES DE DATOS. DiSERO ¥ GESTION + Direcionables. Se puede acceder directamente a un dato sin tener que recorrer todos los anteriores (ejemplo: disco duro). Figura 1.7 Disco duro, uno de los soportes para datos més extendidos en la actualidad En un soporte direc nable se puede implementar un acceso secuencial, directo o indexado, mientras que en un soporte secuencial solo se podri implementar un acceso secuencial. 1.3. Bases de datos La evolucis ogica de los problemas derivados del uso de ficheros fue estandarivar el acceso a lh informacién, de mado que un diseiio fisico concreto sitviera para todas has aplicaciones de una organivacién. Este nuevo enfogue se centzalza en los datos y no en el proceso, es decir, se estructtiraba el almacenamiento de dichos datos con independencia de las aplicaciones que los fueran a utilizar. Se elirminaba la redundancia y se favorecia la transferencia de info aplicaciones. Aparecia el concepto de base de datos. macioa entre 1.3.1. Definici6n Volviendo nuevamente al DRAB, este nos dice que base de datos es un téemino relacionado con el mundo de la informities, y lo define como «Conjunto de datos organizado de tal modo que permits obtener con rapide diversos tipas de informacién». Adoracién de Miguel y Mario Piattini offecen una definicién mis precisa: Coleccién 0 depésito de datos integrades,almacenados en soporte secundario (no voliti) yy con redundancia controlada. Los datos, que ban de ser compartidos por diferentes usuarios ¥y aplicaciones, deben mantenerse independientes de ellos y su definici6n (estructura de la BD), linia y almacenada junto con los datos, se ba de apoyar en un modelo de datos, el cual ha de permitir captar las interrelaciones y restricciones existentes en el mundo real. Los procedi— rmientos de actualizacién y recaperacién, comunes y bien determinados, facilitarin la seguridad del conjunto de los datos. SISTEMAS DE ALMACENAMIENTO DE LA INFORMACION. En li figura 1.4 los NIF aparecen ordenados. Tras cada uno de ellos se Ina aftadido el mero de linea del fichero principal donde se encuentra la informacién asociada. Si tuna aplicacién software quisiera listar los clientes ordenados por NIF recorreria secuen- cialmente el fichero de indice, y al final de cada linea encontraria la linea del fichero, principal que debe leer para encontrar a cada cliente. EI siguiente fichero indexaria los clientes ordenados por su primer apellido: carcia 2 [> covasszimrauia Sanz uésaro 44] Zt SO6B7152¥s086 Inte Garcia Peinado 3 fe S85a6996xravier Peinade Sanz 1 [ oses2e0rmnutn Lazaro Figura 1.5 Fichero de indice por primer apellido de cliente y fichero de clientes original Aunque se utilice en este easo para simplificar el ejemplo, generalmente el acceso cada posici6n no To marca el némero de Tinea, sino un puntero a la celda de memoria correspondiente. re te ene es amen i | mar apellido, segundo apellido y nombre. i 1.2.2. Tipos de soporte de almacenamiento De acuerdo a la organizacién fisica de los datos, diferenciamos entre dos tipos de soportes: + Seauenciales. Para acceder a un dato hay que recorrer todo el contenido del soposte previo adicho dato (ejemplo: cintas magnéticas) Figura 1.6 Cinta magnética para guardar informacion de respaldo era + Direetionables. Se puede acceder directamente 4 un dato sin tener que recorset todos los anteriores (ejemplo: disco duro). Figura 1.7 Disco duro, uno de los soportes para datos més extendidos en Ia actualidad En un soporte direecionable se puede implementar un acceso secuencial, directo o indexado, mientras que en un soporte secuencial solo se podri implementar um acceso secuencial 1.3. Bases de datos La evoluci6n légica de los problemas derivados del uso de ficheros fue estandarizar el acceso a | informacién, de modo que un disefio fisico concreto sirviera para todas as aplicaciones de una organizacién. Este nuevo enfoque se centraba en los datos y no en el proceso, es decir, se estructuraba el almacenamiento de dichos datos con independencia de las aplicaciones que los fueran a utilizar. Se eli ninaba la redundancia y se Favorecia la translerencia de informacidn entre aplicaciones. Aparecia el concepto de base de datos. 1.3.1. Definicion Volviendo nuevamente al DRAE, este nos dice que base de dates es un término relacionado con el mundo de la informatica, y lo define como «Conjunto de datos organivado de tal modo que permita obtener con rapide diversos tipos de informacién». Adoracién de Miguel y Mario Piattini ofrecen una defin Jn mis precisa: Coleccién © depésito de datos integrados, almacenados en soporte secundario (ne wolitil) ‘y con redundancia controlada. Los datos, que han de ser compartidos por diferentes usuarios ‘Y aplicaciones, deben mantenerse independientes de ellos y su definicign (estructura de la BD), ‘nica y almacenada junto con Ios datos,ce ba de apoyar en un modelo de datex, el cual ha de permitir captar las interrelaciones y restricciones existentes en el mando real. Los procedi- -micntos de actualizacién y recuperacién, cormanes y bien determinados,faciktarin la seguridad del conjunto de los datas. a. | 1.4. Sistemas gestores de bases de datos El sistema gestor de bases de datos (SGD) ¢s el software que el fabricante pone 2 disposicién del usuario para manejar sus bases de datos. Nuevamente, De Miguel y Piattini (1993) nos de~ finen el término con mas detalle: Un conjunto coordinado de progrumas, procedimientas, lenguajes, cte., que suministra, tanto a los usuarios no informiticos como a los analistas, programadores, © al administrador, los medios necesarios para describir, recuperar y manipular los datos almacenados en la base, manteniendo su seguridad, in el mercado hay una amplia tipologia de SGBD que corresponde con el modelo de base de datos subyacente, 1.4.1. Componentes del SGBD Generalizando, podemos encontrar Ia siguiente enumeracién de componentes en la mayoria de los SGBD: Datos. Almacenados de forma eficiente en ficheros del sistema operativo. Herramientas de acceso los datos. Un lenguaje de programacién mediante el que los usua~ rios técnicos puedan erear, leer y modificar la informacién, asi como un diccionario de datos que albergue los metadatos, es decir, la informacién sobre el disefio de cada base de datos. Como minimo, se ofrecer’ una interfaz de linea de comandos mediante la que acceder a estas herramientas. Utididades. Herramientas adicionales para gestiém de backups, estadisticas, tareas programa jento de usuarios, grupos y permisos, etc. del SGBD y sirven como alternativa aka «> Gamana ag Lanauwoe oh rs cabot» rate dbase Admminer 33 323 ‘Create database command bume| oii (esa 2) (Sie Figura 1.10. Interfaz de una base de datos a 1.4.2. Funciones del SGBD ‘A pesar de la gran variedad de modelos y soluciones comerciales, podemos enumerar una serie de funciones comunes a un gran niimero de SGBD: paw saner ws [= + Recuperary modificar la informacién de los ficheros que conforman la buse de datos de forma transparente para el usuario. ‘Garantizar Ia integridad de los datos, impidiendo inconsistencias seminticas. ‘Offecer un lenguaje de programacién mediante el que interaccionar con Ia informacion, Proveer el diccionario de datos. ‘Solucionar los contlictos derivados de accesos concurrentes a la informacién. ‘Gestionar transaceiones, garantizando la unidad de varias instrucciones de escritura rela— cionadas entre si. Incluir wtilidades de backup. + Proporcionar mecanismos de seguridad para evitar accesos y operaciones indebidos. Estos aspectos se desarrollarin en los temas siguientes. Sonera a Segin la consultora estadounidense Gariner, en el afio 2013 la empresa | | Gree Corporation conta con la mayor cot de merc ava sis | de bases de datos con sus SGBD Oracle Database y | MSOl coies Codecs do dinwense ne dss | | traban Microsoft (con SQL Server), Bi am eave Sybase Adaptive Server Enierprise y Sybase IQ). feiss mel Sala See Seow mgmascam caioce | al siguiente indice de popularidad para gestores relacionales y objetore- | lacionales en agosto de 2014: Cuabko 1.1. SGBD(O)R ordenados por indice de popularidad ‘Once Corporation ‘Oracle Corpxation Microsaft Corporation Posigye5Q. Global Development Croup TBM Corporaian "Micah Comporation Di Richard Hipp leaker nconparated ‘SISTEMAS DE ALMACENAMIENTO DE LA INFORMACION WG El almacenamiento de informacién ha sido uno de los grandes problemas de la infor- miatica desde sus comienzos. Inicialmente el uso de ficheros oftecia una enorme falta de flexibilidad, cresndose redundancia y dependencia de la estructura de cada archivo lidad de consulta insercién, modificacién y borrado de informacién, la aparicién de las bases de datos dio solucién al problema de forma estandarizada. De entre los distintos modelos de base de datos, el relacional ha sido el mas exten- dido histéricamente. En la actualidad las bases de datos objeto-relacionales combinan el modelo relacional con elementos del modelo orientado a objetos. EI manejo de las bases de datos se lleva a cabo a través de los sistemas gestores de bases de datos, aplicaciones software que oftecen utilidades mediante las que manipular la informacién a gusto del cliente. EJERCICIOS PROPUESTOS 1. Crear un fichero de texto secuencial agend: lefonos. Los datos que hay que incluir sera secuencial.txt con una agenda de te- Nombre Apellidos Direccién Ciudad Teléfono Incluir un minimo de diez contactos de, al menos, cuatro ciudades distintas. 2. Partiendo de los datas del ejercicio anterior, crear un fichero de texto de acceso directo agenda_acceso_directo.te. Se debe presentar una justificacién del niimero de caracteres elegidos para cada dato. 3. Copiar el fichero agenda_acceso_directo.t del ejercicio anterior a un nuevo fi cchero llamado agenda_indexada.tet. Crear un fichero de indice agenda_apelli dos_nombre.txt que Io ordene por apellidos y nombre, y otra agenda_ciudad txt {que lo ordene: por ciudad. 4. Borrar un contacto cualquiera de agenda_indexada.ttt ¢ insertar un contacto ‘nuevo, actualizando a la vez los ficheras de indice asociadas. Consular en Internet informacién sobre las prestaciones de los SGBD comerciales y libres mas utilizados en la actualidad. [24s econ. vs cso ACTIVIDADES DE AUTOEVALUACION 1. Unarchivo de imagen .png es un fichero: a) Binario. b) Plano. ©) Ninguno de los dos. 2. Un fichero secuencial se puede implementar: a) Sobre un soporte secuencial. 1b) Sobre un soporte direccionable. ©) Sobre ambos. 3. Respecto a los ficheros secuenciales y de acceso directo, los ficheros indexades son mas répidos: a) En inserciones y modificaciones de datos. b) En borrado de datos. ©) En btisqueda de datos. 4. EISGBD comercial Oracle obedece al modelo: a) Relacional. 1b) Objeto-relacional. ©) Orientado a objetos. 5. Un SGBD: a) Debe ofrecer herramientas graficas para acceder a la informaci 1b) Debe ofrecer al menos una Iinea de comands desde la que acceder a la inform: ) Se gestiona con herramientas externas. SOLUCIONES: LObec Bab@ 2B < 20> 4a aa Capiruto 1

También podría gustarte