Unidad I - Contenido - Organizacion - de - Archivos - y - Base - de - Datos - I

ORGANIZACIÓN DE ARCHIVOS Y
BASE DE DATOS I
UNIDAD 1
Introducción
El fin de esta materia es dotar al alumno de conocimientos sobre cómo organizar,
almacenar y manipular los datos. Dar a conocer a los mismos los mecanismos de
formación y gestión de estructuras de datos en almacenamiento secundario;
especialmente en el uso de archivos, como así las operaciones de acceso a los
mismos con el fin de aumentar su rendimiento y eficacia.
Objetivos
General
- Comprender los mecanismos de formación y gestión de estructuras de datos en
almacenamiento secundario, en especial los archivos.
Específicos
- Optimizar la categorización de la información.
- Facilitar el acceso a los documentos.
- Revisar y garantizar la validez de los archivos.
- Brindar soporte directo ante el manejo de los datos y para los dispositivos de
almacenamiento.
- Minimizar la pérdida de datos.

ORGANIZACIÓN DE ARCHIVOS Y BASE DE DATOS I – UNIDAD 1
1.1. Introducción
Un dato es cualquier elemento que necesitemos procesar en un programa. Los programas
trabajan con datos de entrada, los cuales son manipulados mediante los procesos informáticos
para producir unos datos de salida. (Álvarez, 2022)
El dato está muy ligado a otro concepto que necesitamos conocer que es el de "información".
Seguro que has oído comentar que la informática es el tratamiento automatizado de la
información. Entonces ¿Qué es información y qué es dato? Para entender esta diferencia
podemos acudir a algunos ejemplos. (Álvarez, 2022)
Ejemplos de datos: sería el 0, 12, "sHadksdje2so", "Madrid", "lunes" y cosas así. Estos datos no
sabemos a lo que se refieren, simplemente son números o cadenas de un valor determinado.
(Álvarez, 2022)
Ejemplos de información: 0 (el número de Ferrari que tengo en el garaje), 12 (los días del mes),
"Madrid" (capital de España). (Álvarez, 2022)
Los datos se convierten en información cuando les damos un contexto. El número 0 puede ser
cualquier cosa, pero ya cambia si te digo que faltan 0 días para mi cumpleaños ¿no? en ese caso
el 0 es una información, ¡sobre la cual decides que me tendrás que felicitar ya mismo! (Álvarez,
2022)
1.2. Concepto de datos
Un dato es la representación de una variable que puede ser cuantitativa o cualitativa que indica
un valor que se le asigna a las cosas y se representa a través de una secuencia de símbolos,
números o letras. (Etecé,2020)
4
Fuente: (Etecé,2020)
Los datos describen hechos empíricos. Para examinarlos deben ser organizados o tabulados, ya
que un dato por sí mismo no puede demostrar demasiado, sino que se debe evaluar el conjunto
para examinar los resultados. (Etecé,2020)
1.2.1 Bit
5
Binary digit es una expresión inglesa que significa “dígito binario” y que da lugar al término bit,
su acrónimo en nuestra lengua. (Porto, 2011)
El concepto se utiliza en la informática para nombrar a una unidad de medida
de información que equivale a la selección entre dos alternativas que tienen el mismo grado de
probabilidad. (Porto, 2011)
El bit, en otras palabras, es un dígito que forma parte del sistema binario. A diferencia del
sistema decimal, que utiliza diez dígitos (0, 1, 2, 3, 4, 5, 6, 7, 8 y 9), el sistema binario apela a
sólo dos (0 y 1). Un bit, por lo tanto, puede representar a uno de estos dos valores (0 ó 1).
(Porto, 2011)
6
Fuente: (Porto, 2011)
EL BIT EN LA INFORMÁTICA
Para la informática, el bit es la unidad más pequeña de información. Permite representar dos
valores diferentes (como abierto/cerrado o verdadero/falso) y asignar dichos valores al estado de
encendido (1) o apagado (0). (Porto, 2011)
Si un bit nos permite representar dos valores (0 y 1), dos bits nos posibilitan codificar cuatro
combinaciones: 0 0, 0 1, 1 0 y 1 1. Cada una de estas cuatro combinaciones, por su parte,
permite representar cuatro valores diferentes. Palabras, imágenes y números pueden
representarse mediante secuencias de bits. (Porto, 2011)
Esto significa que cuando, haciendo referencia a dos dispositivos digitales, se representan con
dos valores como es el caso del 0 0 significa que los dos están apagados mientras que si la
representación es 0 1 lo que viene a mostrarse es que el primero está apagado y el segundo
encendido. (Porto, 2011)
La tercera representación posible es la 1 1 con la que entenderíamos a la perfección que los dos
mencionados dispositivos están encendidos. Y finalmente está la 1 0 que significa que el

7
primero, el de la izquierda, está encendido y el segundo apagado. (Porto, 2011)
8
Fuente: (Porto, 2011)
1.2.2 Byte
Se conoce como byte a la unidad básica de información empleada en la informática y las
telecomunicaciones, equivalente a un conjunto ordenado y regular de bits (código binario),
generalmente estipulado en 8. Es decir: 8 bits equivalen a un byte, pero dicha cantidad puede
alterarse, así que un byte es equivalente en realidad a n bits ordenados. (Etecé, 2021)
Esta unidad no tiene un símbolo convencional de representación, pero en algunos países se
emplea la letra B. (Etecé, 2021)
9
Fuente: (Etecé, 2021)
El origen de este término se supone en el acrónimo en inglés de Binary Tuple o Tupla binaria, lo
que equivale a una secuencia ordenada de elementos binarios. (Etecé, 2021)
Sin embargo, la semejanza fonética de byte con bite (“morder” o “mordida” en inglés) supuso
también su uso a partir de que era la cantidad mínima de datos que podían alimentarse a un
sistema por vez (la cantidad mínima que podía “morder”). (Etecé, 2021)
En cuanto a la cantidad de información que un byte representa, considérese que se necesita
aproximadamente 8 bits para representar una letra en el código binario de la mayoría de los
sistemas comerciales de computación de hoy en día, es decir: un byte equivale a una letra, por lo
que un párrafo entero podrá superar los 100 B, y un texto brevísimo alcanzará la unidad
inmediatamente superior, el kilobyte (1024 B = 1 kB). (Etecé, 2021)
A partir de entonces se inicia toda una escala de medida de cantidad de información digital, de
la siguiente manera (conforme a la norma ISO/IEC 80000-13):
o 1024 B = 1 kB (un kilobyte, equivalente a un texto brevísimo)
o 1024 kB = 1 mB (un megabyte, equivalente a una novela completa)

10
o 1024 mB = 1 gB (un gigabyte, equivalente a un anaquel entero de biblioteca lleno de

libros)
o 1024 gB = 1 tB (un terabyte, equivalente a una biblioteca completa de poco tamaño)
o 1024 tB = 1 pB (un petabyte, equivalente a la cantidad de datos
manejado por Google por hora en el mundo)
o 1024 pB = 1 eB (un exabyte, equivalente al peso de toda la información de Internet para

finales del año 2001).
Los bytes y sus medidas superiores suelen también emplearse para medir la capacidad de
almacenamiento de los dispositivos de memoria digital, o las tasas de transferencia de datos a
través de redes informáticas de diverso tipo. (Etecé, 2021)
1.2.3 Campos
Un registro se define como una colección finita y heterogénea de elementos. También
representa un tipo de dato estructurado, en el que cada uno de sus componentes se denomina
campo. Los campos de un registro pueden ser todos de diferentes tipos de datos. Por tanto,
también podrán ser registros o arreglos. Cada campo se identifica con un nombre único, el
identificador de campo. Otra diferencia importante con los arreglos es que no es necesario
establecer un orden entre los campos. (Cairo, 2006).
1.2.4 Registros
De acuerdo con lo estudiado en las secciones previas, los arreglos son estructuras de datos muy
útiles para almacenar una colección de datos, todos del mismo tipo. Sin embargo, en la práctica,
11
a veces se necesitan estructuras que permitan almacenar datos de distintos tipos que sean
manipulados como un único dato. Para ilustrar este problema se incluye el siguiente ejemplo.
(Cairo, 2006).
Ejemplo: Una compañía tiene por cada empleado la siguiente información:
o Nombre (cadena de caracteres)
o Dirección (cadena de caracteres)
o Edad (entero)
o Sexo (carácter)
o Antigüedad (entero)
Si se quisiera almacenar estos datos no sería, posible usar un arreglo, ya que sus componentes
deben ser todos del mismo tipo. La estructura que puede guardar esta información de manera
efectiva se conoce como registro o estructura. (Cairo, 2006).
Un registro se define como una colección finita y heterogénea de elementos. También
representa un tipo de dato estructurado, en el que cada uno de sus componentes se denomina
campo. Los campos de un registro pueden ser todos de diferentes tipos de datos. Por tanto,
también podrán ser registros o arreglos. Cada campo se identifica con un nombre único, el
identificador de campo. Otra diferencia importante con los arreglos es que no es necesario
establecer un orden entre los campos. (Cairo, 2006).
12
1.2.5 Archivos
En informática, se conoce como archivo o fichero a un conjunto organizado de unidades de
información (bits) almacenados en un dispositivo. Se les denomina de esa manera
como metáfora a partir de los archivos tradicionales de oficina, escritos en papel, ya que
vendrían a ser su equivalente digital. (Etecé, 2021)
13
Cada archivo posee una identificación única o nombre, la cual puede ser modificada o asignada
a voluntad del usuario o del programador, y una extensión que determina qué tipo de archivo es
y qué funciones cumple. Usualmente ambos términos de su nombre están separados por un
punto, por ejemplo: Command.com (Etecé, 2021)
Dentro de los archivos existen paquetes pequeños de datos expresados en bits (la unidad
informática más pequeña que existe) y que se ordenan en registros o líneas, siendo
individualmente distintos, pero con algún rasgo común. (Etecé, 2021)
El modo de agrupación de esta información depende de quién haga el archivo, por lo
que existen numerosas estructuras de archivo, más simples y más complejas, que están más o
menos estandarizadas hoy día. (Etecé, 2021)
Estas unidades mínimas de operación y organización de un Sistema Operativo que son los
archivos, entonces, se pueden crear, eliminar, reubicar, comprimir, renombrar y
activar (ejecutar, en lenguaje informático), junto con otras operaciones básicas de organización.
(Etecé, 2021)
Los archivos pueden tener numerosas funciones. Desde simplemente contener información de
manera ordenada, como los archivos de texto, y permitir el acceso a ella por parte
de programas determinados, hasta archivos ejecutables que desencadenan cierta secuencia de
acciones (y de otros archivos) que tienen como resultado una acción concreta. (Etecé, 2021)
Desde apagar el computador hasta iniciar un videojuego, todo lo que ocurre en un sistema
14
informático ocurre a través de archivos interconectados ejecutándose por turno en la memoria
del computador. (Etecé, 2021)
Los archivos de un sistema informático tradicional están organizados en carpetas (o directorios)
y subcarpetas (o subdirectorios), como una forma de categorizarlos y distinguir los que
15
pertenecen a una aplicación o programa de los que pertenecen a otro. Las carpetas no son más
que etiquetas para representar los compartimentos de la información. (Etecé, 2021)
De esto se trata el sistema de organización de archivos: de una catalogación compleja que al
mismo tiempo permita una interfaz sencilla con el usuario, ya que el tránsito de algunos
archivos entre dos soportes (digamos: un disco duro y un pendrive) puede ser tan simple como
indicar al sistema que los movilice de la carpeta madre a la carpeta destino, sin que sufran
ninguna modificación en el camino ni corran riesgo de extraviarse. (Etecé, 2021)
Todos los archivos existen necesariamente dentro de una carpeta.
CARACTERÍSTICAS GENERALES DE UN ARCHIVO
En líneas generales, los archivos de un sistema informático son:
o Representables. Los archivos suelen tener un nombre de máximo 255 caracteres y suelen

ser representados en sistemas operativos de interfaz gráfica (como Windows) por un
ícono determinado. (Etecé, 2021)
o Únicos por directorio. En una misma carpeta o directorio no pueden existir dos archivos
idénticos con el mismo nombre. Cuando ello ocurra alguno de los dos habrá de cambiar
levemente su nombre o en todo caso será remplazado uno por otro. (Etecé, 2021)
o Modificables. Excepto aquellos que expresamente hayan sido protegidos contra
modificación, como es el caso de los archivos vitales del sistema informático, que no
deben sufrir cambios pues éste se desestabilizaría, lo común es que los archivos puedan
borrarse, crearse, modificarse, renombrarse a voluntad o necesidad. (Etecé, 2021)
o Poseen un tamaño. De acuerdo con la cantidad de información que un archivo contenga,

éste tendrá un tamaño o “peso”, mensurable en Kb, Mb o incluso Gb. Mientras más
grande sea el archivo, más capacidad deberá tener el soporte donde se encuentre. (Etecé,
2021)
16
FORMATO DE ARCHIVO
La manera en que la información se codifica y ordena dentro de los archivos se conoce como
formato, y responde a diversos estándares existentes. Dependiendo de dichos formatos habrá
compatibilidades o incompatibilidades a la hora de acceder a dicha información, ya que se trata
de una forma de distribución que responde a un patrón determinado. (Etecé, 2021)
Esto se debe a que dentro de los archivos en un soporte cualquiera sólo puede haber bits, dado
que los sistemas informáticos deben poder convertir esa información en código binario (unos y
ceros) para poder procesarla. Así, cada tipo de archivo puede almacenarse en diversos formatos
posibles. (Etecé, 2021)
EJEMPLOS DE ARCHIVO
Algunos ejemplos típicos de archivos son:
o Archivos de texto. Usualmente identificados con extensiones .doc, .txt, .rtf o .odt,

contienen secuencias de caracteres alfanuméricos dispuestos en secuencias específicas,
que denominamos “documentos”. (Etecé, 2021)
o Archivos ejecutables. Usualmente terminados en .exe (executable, “ejecutable” en
inglés), .com (command, “comando”) o .bat (batch, “lote”), son aquellos que disparan las
acciones, como ejecutar una aplicación o un videojuego. (Etecé, 2021)
o Archivos de imagen. Apellidados .jpg, .gif o .tiff normalmente, son imágenes cuya

información recompuesta se traduce en una imagen, ilustración o fotografía. (Etecé,
2021)
1.3. Tipos de datos
Un tipo de datos es un conjunto de valores que tienen una característica en común y que
17
responden a unas operaciones determinadas. (Álvarez, 2022)
En un sistema informático trabajamos con datos y los lenguajes de programación necesitan
saber cuál es el tipo de ese dato, para saber los valores posibles que podrían tener y las cosas
que se permiten hacer con ellos. (Álvarez, 2022)
Por ejemplo, 2 es un número entero. Lo podré sumar, restar y hacer otras operaciones
matemáticas con otros números. "Madrid" es una cadena de caracteres, que la podré comparar
con otras cadenas, concatenar otras cadenas, etc. (Álvarez, 2022)
Dependiendo del lenguaje de programación puede trabajar con unos tipos u otros. Por ejemplo,
hay lenguajes que distinguen entre números enteros y números decimales y otros lenguajes de
programación en los que solamente se tiene el tipo de datos numérico, englobando tanto
decimales como enteros en el mismo saco. (Álvarez, 2022)
CLASIFICACIÓN DE LOS TIPOS DE DATOS
Como hemos dicho, todos los datos tienen un tipo asociado con ellos. Un dato puede ser un
simple carácter, tal como "x", una cadena como "hola", un valor entero tal como 35 o un valor
numérico con coma flotante como "0.55". En todo caso, el tipo de dato nos indica el conjunto de
valores que podría llegar a tomar una variable de un tipo en particular. (Álvarez, 2022)
En todos los lenguajes de programación encontramos una clasificación de tipos de datos
siempre presente, los tipos de datos simples y los tipos de datos compuestos. (Álvarez, 2022)
Fuente: (Álvarez, 2022)
TIPOS DE DATOS SIMPLES
18
Los tipos de datos simples, también llamados tipos de datos primitivos o tipos de datos básicos,
son aquellos que contienen un elemento único de un tipo de datos particular y no se pueden
descomponer en varios datos independientes. (Álvarez, 2022)
Aquí tienes una lista de tipos de datos simples comunes en la mayoría de los lenguajes de
programación, aunque ya depende de la implementación de ese lenguaje qué tipos de datos
manejará:
o Numérico
o Número Entero
o Número Real (con decimales)
o Carácter
o Cadena de caracteres
o Booleano (verdadero o falso)
o Enumerado (un conjunto de valores limitado)
De entre todos los tipos de datos mencionados en el listado anterior, que puede ampliar o
reducir su número dependiendo del lenguaje, los más comunes son los siguientes:
19
o Datos Numéricos: Permiten representar valores forma numérica, ya sean números

enteros o números los reales (con decimales). (Álvarez, 2022)
Los datos de tipo numérico permiten realizar operaciones aritméticas como la suma,
resta, etc. (Álvarez, 2022)
o Datos lógicos: Son aquellos que solo pueden tener dos valores: cierto (true) o falso
(false). Llamamos a estos tipos de datos "booleanos" por la palabra en inglés "Boolean".
Este tipo de datos se da muchas veces cuando se producen comparaciones entre valores
de otros tipos y cuando queremos tomar decisiones con las estructuras condicionales.
(Álvarez, 2022)
o Datos e tipo cadena (string): Los datos de tipo cadena, también llamados "string" o datos
alfanuméricos consisten en una secuencia de caracteres, ya sean números, letras o signos
diversos que aparecen en el teclado. Este tipo de datos es muy común en las aplicaciones
ya que nos permiten guardar cosas como nombres, direcciones, emails... Los valores de
este tipo de datos se representan generalmente encerrado entre comillas. Ya depende del
lenguaje particular si se usan comillas simples, dobles o es posible usar ambas. (Álvarez,
2022)
Existen más clasificaciones que podemos mencionar, aunque no son tan comunes. Por ejemplo,
dentro de los datos básicos podemos encontrar datos estáticos y derivados. Los estáticos son los
datos que manejamos generalmente, como los mencionados en la lista anterior. Cómo dato
derivado nos encontramos con los punteros que hoy en día no se utilizan casi, a no ser que se
programe en C. (Álvarez, 2022)
TIPOS DE DATOS COMPUESTOS
Luego tenemos los tipos de datos compuestos, que también se denominan tipos de datos
complejos o tipos de datos estructurados. Estos tipos de datos se componen de agrupaciones de
tipos de datos simples. (Álvarez, 2022)

20
Podemos poner algunos ejemplos de tipos de datos compuestos:
o Array
o Estructuras
o Objetos
Estos tipos de datos compuestos también dependen del lenguaje de programación que estemos
utilizando. Depende del lenguaje que implemente unos u otros tipos de datos complejos.
(Álvarez, 2022)
CONSTANTES Y VARIABLES
También muy asociados al concepto de tipo de datos encontramos otro como es el de variable, o
constante. Hablaremos con más detalle de ellas, pero de momento podemos adelantar que los
datos manejados en un algoritmo deben llevar asociado un identificador para que nos podamos
referir a él cuando haga falta. Ese identificador es el nombre de la variable o constante.
(Álvarez, 2022)
Generalmente esa variable, o constante, tendrá distintas partes:
o El nombre para referirnos a ella, o identificador
o El tipo de datos de los elementos que podrá almacenar
o El valor que contiene en un momento dado.
Se define como variable a una posición de memoria referenciada por un identificador donde se
21
puede almacenar un valor determinado (Tipo de dato). (Álvarez, 2022)
Se define como constante a un valor que no se modifica a lo largo de toda la ejecución del
programa. (Álvarez, 2022)
IDENTIFICADORES
Los identificadores sirven para etiquetar y referenciar en el código a los datos de un programa
(constantes, variables). (Álvarez, 2022)
Dicho de otro modo, toda variable o constante recibe un identificador a la hora de declararse. A
través de ese identificador podemos referenciarla cuando queramos usar el dato que lleva
dentro. (Álvarez, 2022)
Técnicamente el identificador es una secuencia de caracteres que sirve para identificar una
posición en la memoria de la computadora donde se encuentra un dato en particular. Los
identificadores son los que nos permiten acceder a su contenido. (Álvarez, 2022)
Ejemplos de identificadores:
o Nombre
o Operando
o Num_horas
o Calif2
REGLAS PARA FORMAR UN IDENTIFICADOR
No es posible llamar a las variables o constantes como nos da la gana. En cambio, cada lenguaje
de programación permite crear identificadores con unas reglas determinadas. No obstante, hay
22
algunas reglas que suelen ser comunes en la mayoría de los casos:
o Debe comenzar con una letra (A a Z, mayúsculas o minúsculas) y no deben contener

espacios en blanco.
o Debe contener letras, dígitos y caracteres como la subrayado (guión bajo "_").
o La longitud de identificadores puede ser de varios caracteres. Aquí cada lenguaje tiene
sus límites, pero son generalmente bastante generosos.
CONSEJOS PARA USAR BUENOS IDENTIFICADORES
Nosotros podemos escoger cualquier nombre para las variables y constantes, pero es importante
que los nombres que hayamos elegido sean buenos. (Álvarez, 2022)
Para considerarse buenos nombres podemos seguir unos consejos básicos:
o El nombre del identificador debe dar una idea del significado del valor que contiene
o No se deben usar abreviaciones
o Si se usan varias palabras se pueden separar por guión bajo, como "factura_original".
Pero también podemos usar la notación de camel case que consiste en poner mayúscula
cada letra inicial a partir de la segunda: "facturaOriginal". Generalmente cada lenguaje
tiene una notación más usada que conviene respetar
o Ten cuidado con las mayúsculas y minúsculas, porque la mayoría de los lenguajes las
23
tienen en cuenta. No es lo mismo una variable que se llame "ALTURA" que "altura" o
"Altura".
o Las variables suelen comenzar en minúscula
o Las constantes se suelen colocar con todas las letras en mayúscula
o Sé consistente, si usas una manera de nombrar las variables, usa siempre la misma en
todo el programa
TIPADO ESTÁTICO Y TIPADO DINÁMICO
También queremos hablar ahora de una de las características que más definen a los lenguajes de
programación, que es su capacidad para aceptar distintos tipos de datos en una variable, o fijar
el tipo de datos de la variable de manera que perdure a lo largo del tiempo. (Álvarez, 2022)
o Tipado estático: Son lenguajes donde se fija el tipo de datos de una variable en el
momento de su creación, no pudiendo cambiar el tipo de datos de esa variable a lo largo
del tiempo. (Álvarez, 2022)
o Tipado dinámico: Es una característica de los lenguajes que permiten que las variables
puedan contener cualquier tipo de datos y éste tipo pueda cambiar a lo largo del tiempo.
(Álvarez, 2022)
Lenguajes con tipado estático tenemos a Java, C#, C. Lenguajes con tipado dinámico tenemos a
PHP, Javascript, Python. (Álvarez, 2022)
1.4. Estructura de datos

24
lineales
Las estructuras lineales de datos se caracterizan porque sus elementos están ubicados uno al
lado del otro relacionados en forma lineal. Cada elemento de la estructura puede estar
conformado por uno o varios subelementos o campos que pueden pertenecer a cualquier tipo de
dato. (Martínez, 2021)
1.4.1 Introducción
Dentro de las estructuras lineales podemos encontrar tres tipos:
o Listas enlazadas
o Pilas
o Colas
LISTAS ENLAZADAS
Estas listas, en la estructura de datos, se confeccionan con elementos que están ubicados uno
tras otro en secuencia, donde cada elemento se conecta con el siguiente a través de un enlace
(link) que contiene la posición del siguiente elemento. Sus operaciones dependen de la
necesidad de aplicación y no siguen un mecanismo específico. (Martínez, 2021)
Según Aguilar, una lista enlazada se define por tres puntos:
25
o La información que contienen sus elementos y sus respectivos enlaces.
o El enlace que permite acceder al primer elemento de la lista.
o Un medio para detectar el último elemento de la lista.
Fuente: (Martínez, 2021)
PILAS
La pila, en una estructura de datos, hace referencia a un tipo especial de lista lineal en la que la
inserción y el borrado de nuevos elementos se realiza sólo por un extremo que se denomina
cima o tope. (Martínez, 2021)
Es un elemento que encuentra varias comparaciones con situaciones de la vida real, como lo es
ordenar una pila de libros. Esto se debe a su mecanismo llamado LIFO (last-in, first-out, último
en entrar, primero en salir), en el cual el último elemento que se pone en la pila es el primero
que se puede sacar. (Martínez, 2021)

26
Los elementos se incorporan solo por un extremo que, en este caso, sería la cima de la pila.
Un ejemplo de método LIFO que se da en la vida real, puede ser cuando intentamos apilar
libros, ropa o lo que sea, siempre agregamos objetos por encima y si necesitamos sacar alguno,
quitamos el que se encuentra más arriba. (Martínez, 2021)
COLAS
¿Qué es una cola en una estructura de datos? Podemos decir que son otro tipo de estructura
lineal similar a las pilas, diferenciándose de ellas en el modo de insertar/eliminar elementos. En
este caso, las eliminaciones se realizan por el inicio de la fila, en tanto que las inserciones se
realizan por el otro extremo, es decir, el final. (Martínez, 2021)
27
Las colas en la estructura de datos tienen un mecanismo que se conoce como FIFO (first-in,
first-out - primero en entrar, primero en salir). (Martínez, 2021)
De este modo, la diferencia con las pilas está en el modo en que ingresan y salen los datos. La
utilidad de las colas yace en almacenar datos que necesitan ser procesados según el orden de
llegada. (Martínez, 2021)
Aquí también hay varias analogías con la vida real. Pongamos como ejemplo la cola de un
supermercado en la que el primer elemento que llega (cliente) es el primero en salir al ser
atendido. (Martínez, 2021)
28
1.4.2 Punteros
Un puntero no es más que una variable, en la cual se almacena una dirección de memoria. Esto
parece muy simple, pero luego da muchos quebraderos de cabeza. Al ser una dirección de
memoria, le podemos decir a un puntero que en ese lugar donde apunta queremos almacenar un
valor, por ejemplo un número. (Durán, 2021)
Para realizar una explicación muy sencilla, vamos a decir que un puntero es como un buzón de
correos y nuestra memoria RAM, es similar a una comunidad de vecinos donde hay muchos
buzones. Además, en esta comunidad en lugar de tener el nombre puesto en el buzón, cada uno
va a tener un identificador único. (Durán, 2021)
29
Fuente: (Durán, 2021)
Como se puede ver en la imagen, hay muchos buzones (zonas de memoria), pero no todas las
podemos usar, ya que hay buzones que son nuestros y otros que son de otros vecinos (otros
programas). (Durán, 2021)
El buzón b5 tiene un papel con el número 23 escrito (en esa posición identificada como b5 está
almacenado el número 23). (Durán, 2021)
El buzón b1 es un puntero, ya que lo que tiene almacenado (b5), no es un valor, sino un
identificador de otro buzón (una dirección de memoria). (Durán, 2021)
Una vez que ya sabemos que es un puntero, una variable cuyo valor es una dirección de
memoria, vamos a proceder a explicar cómo se utilizan. (Durán, 2021)
Imaginamos que el cartero sabiendo que hay dos buzones nuestros, decide introducir un paquete
(el valor 23) en uno de nuestros buzones. (Durán, 2021)
Pero se da cuenta de que lo introdujo en el buzón que no era, entonces se le ocurre dejarnos en
el buzón correcto (b1), un papel donde pone “tu paquete está en b5“. (Durán, 2021)
La manera de obtener el valor es bien sencilla, nosotros abriríamos b1, veríamos que lo que hay
30
dentro es el papel y entonces diríamos, para alcanzar el valor, tengo que ir a b5 y obtener su
contenido. (Durán, 2021)
Fuente: (Durán, 2021)
En la imagen superior se puede ver cómo funcionan realmente los punteros. El
carácter * representa a un puntero en C. Si quieres aprender este lenguaje te recomiendo
este curso de programación en C. (Durán, 2021)
En la dirección de memoria 0x67 tenemos almacenado un 5. Podemos decir que la variable cuya
dirección de memoria es 0x67 es un entero o, dicho de otra manera, que tenemos un entero de
valor 5 almacenado en 0x67. (Durán, 2021)
En la dirección de memoria 0x75 tenemos almacenado otra dirección de memoria, la 0x67. En
este caso tenemos un puntero a entero, ya que tenemos en 0x75 almacenada la dirección de
memoria de un entero. Es importante recalcar que tenemos dónde está el entero, no cuál es su
valor. (Durán, 2021)
De igual manera, en la dirección 0x88 tenemos almacenado otra dirección de memoria, pero en
este caso no es un puntero a entero, ya que la dirección de memoria almacenada no es la de un
entero sino la de un puntero a entero. Esto da como resultado que tenemos un puntero a puntero
a entero. (Durán, 2021)
31
Como veis es fácil generalizar su funcionamiento partiendo de este ejemplo.
Respecto al uso dentro de un programa, los punteros se usan ya que permiten realizar
operaciones de manera más eficiente al trabajar con direcciones de memoria. Por ejemplo, si
tuviéramos que intercambiar el valor de dos cadenas de texto de 200bytes cada una, es mucho
más eficiente cambiar los punteros a cada una de las cadenas (2 bytes, uno por puntero), que
copiar el contenido. El tener que gestionar manualmente estos punteros, quizás hacen de C
un lenguaje complejo para empezar a programar. (Durán, 2021)
1.4.3. Listas
En ciencias de la computación, una lista o secuencia es un tipo de dato abstracto que representa
una secuencia ordenada de valores, donde el mismo valor puede ocurrir más de una vez. Un
caso de una lista es una representación computacional del concepto matemático de
una secuencia finita. Las listas son un ejemplo básico de contenedores, cuando contienen otros
valores. Si el mismo valor se repite varias veces, cada ocurrencia está considerada un elemento
distinto. (Durán, 2021)
Una simple estructura de lista enlazada, implementando una lista con 3 elementos enteros.
(Durán, 2021)
El concepto lista es también utilizado para varias estructuras de datos que puede soler
implementar listas abstractas, especialmente listas enlazadas. (Durán, 2021)
Muchos lenguajes de programación proporcionan soporte para tipos de dato de la lista, y tienen
sintaxis especiales y semánticas para listas y operaciones de lista. Una lista a menudo puede ser
construida escribiendo los elementos en secuencia, separado por comas, puntos y comas,
o espacios, dentro de un par de delimitadores como paréntesis'()', corchetes'[]', tirantes '{}', o
paréntesis angulares '<>'. Algunos lenguajes permiten indexación sobre las listas, similar a
32
los array (vectores), en tal caso es más adecuado describirlas como array. En programación
orientada a objetos las listas son normalmente proporcionadas como instancias de una clase
"Lista" genérica, y recorridas por iteradores separados. Los tipo de datos de lista son usualmente
implementados usando estructuras de datos de array o listas enlazadas, pero otras estructuras de
dato pueden ser más apropiadas para algunas aplicaciones. En algunos contextos, como en
programación en Lisp, el término lista se puede referir específicamente a una lista enlazada más
que un array. (Durán, 2021)
1.4.4. Pilas
Una pila representa una estructura lineal de datos en la que se puede agregar o quitar elementos
únicamente por uno de los dos extremos. En consecuencia, los elementos de una pila se
eliminan en orden inverso al que se insertaron; es decir, el último elemento que se mete en la
pila es el primero que se saca. Debido a esta característica, se le conoce como estructura LIFO
(Last-Input, First-Output: el último en entrar es el primero en salir). (Cairo, 2006)
Existen numerosos casos prácticos en los que se utiliza el concepto de pila; por ejemplo, una
pila de platos, una pila de latas en un supermercado, una pila de libros que se exhiben en una
librería, etcétera. En la figura 3.1 se observa una pila de platos. Es de suponer que si el cocinero
necesita un plato limpio, tomará el que está encima de todos, que es el último que se colocó en
la pila. (Cairo, 2006)
Las pilas son estructuras de datos lineales, como los arreglos, ya que los componentes ocupan
lugares sucesivos en la estructura y cada uno de ellos tiene un único sucesor y predecesor, con
excepción del último y del primero, respectivamente. (Cairo, 2006)
Una pila se define formalmente como una colección de datos a los cuales se puede acceder
mediante un extremo, que se conoce generalmente como tope. (Cairo, 2006)
33
1.4.5. Colas
Una cola constituye una estructura lineal de datos en la que los nuevos elementos se introducen
por un extremo y los ya existentes se eliminan por el otro. Es importante señalar que los
componentes de la cola se eliminan en el mismo orden en el cual se insertaron. Es decir, el
primer elemento que se introduce en la estructura será el que se eliminará en primer orden.
Debido a esta característica, las colas también reciben el nombre de estructuras FIFO (First-In,
First-Out: el primero en entrar es el primero en salir). (Cairo, 2006)
Existen numerosos casos de la vida real en los cuales se usa este concepto. Por ejemplo, la cola
de los bancos en las que los clientes esperan para ser atendidos -;.. primera persona de la cola
será la primera en recibir el servicio-, la cola de los niño. que esperan a veces pacientemente
para subir a un juego mecánico, las colas de 1 vehículos esperando la luz verde del semáforo,
las colas para entrar a un cine, teatro' estadio de fútbol, etcétera. (Cairo, 2006)
1.5. Estructura de datos no
lineales
Las estructuras de datos no lineales también son conocidas por el nombre de multienlazadas. En
ellas, cada elemento puede estar enlazado a cualquier otro componente. Esto quiere decir que
cada elemento puede tener varios sucesores o varios predecesores. (Martínez, 2021)
34
Las estructuras no lineales de datos son dos:
o Árboles
o Grafos
1.5.1 Introducción
Los árboles corresponden a una de las subclases de grafos de uso más amplio, particularmente
en computación.
Los grafos se pueden clasificar en dos grupos: dirigidos y no dirigidos. Los árboles forman parte
de los no dirigidos.
Sirven para organizar y relacionar datos en una base de datos, por ejemplo. Esto permite
realizar operaciones de manera eficiente. Por ejemplo, un árbol de definición jerárquica se
utiliza para configurar una base de datos para los registros de libros existentes en
diversas bibliotecas.
Otro ejemplo de la utilización de árboles son los diccionarios. A partir de una palabra, se realiza
una búsqueda en el árbol para saber si está incluida en el conjunto, y si existe, se obtienen sus
datos asociados (por ejemplo, si es un verbo, un sustantivo, un artículo, etc.).
1.5.2. Arboles
Los árboles, en la estructura de datos, son una estructura no lineal que se utiliza para representar
35
datos con una relación jerárquica en la que cada elemento tiene un único antecesor y puede tener
varios sucesores. (Martínez, 2021)
Se puede realizar una clasificación de árboles en estructura de datos:
o Árbol general: que es un árbol donde cada elemento puede tener un número ilimitado de
subárboles. (Martínez, 2021)
o Árboles binarios: que son una estructura de datos homogénea, dinámica y no lineal en
donde a cada elemento le pueden seguir como máximo dos nodos.
Dentro de ellos podemos encontrar:
 Distintos: posee una estructura distinta a la de otros árboles.
 Similares: cuando su estructura es idéntica a la de otros árboles binarios, pero la

información que guardan los nodos es diferente entre sí.
 Equivalentes: cuando su estructura e información de sus nodos es idéntica a la de

otros árboles binarios.
 Equilibrados: las alturas de los dos subárboles de cada uno de los nodos tienen
como máximo una diferencia de una unidad.
 Degenerados: sus nodos tienen solo un subárbol.
36
fuente: (Martínez, 2021)
1.5.3. Grafos
37
Los grafos, en las estructura de datos, son otra estructura no lineal, así como los árboles.
Aguilar los define de la siguiente forma:
“Formalmente un grafo es un conjunto de puntos —una estructura de datos— y un conjunto de
líneas, cada una de las cuales une un punto a otro.
Los puntos se llaman nodos o vértices del grafo y las líneas se llaman aristas o arcos”.
(Martínez, 2021)
Si nos preguntamos ¿qué es un grafo y para qué sirve? Diremos que es una estructura
matemática que permite modelar problemas de la vida cotidiana, mediante una representación
gráfica, formada por nodos, que muestra las relaciones que hay entre los distintos componentes.
(Martínez, 2021)
Podemos poner el ejemplo de una red social donde se establecen relaciones entre las personas
que a su vez generan relaciones entre ellas interactuando, conformando así un grafo. (Martínez,
2021)
38
Llegados a este punto, ya debes tener una idea concreta de qué es una estructura de datos y
cómo funciona para poder aplicarla en tus proyectos. Recuerda que son un medio muy útil que
te permitirá manejar grandes cantidades de datos de manera eficiente. (Martínez, 2021)
Referencias Bibliográficas
1. Bibliografía Básica
- Senn J.A., “Análisis y diseño de sistemas de información”
39
ORGANIZACIÓN DE ARCHIVOS Y BASE DE DATOS I - BIBLIOGRAFÍA
- Cairo y Guardati, “Estructuras de Datos”
2. Bibliografía Complementaria
- Gary W. Hansen, James V. Hansen, Diseño
y Administración de Base de Datos, Segunda Edición.
- Profesor David López, Guía de Estructura y Procesamiento de Datos ,
Segundo semestre U.N.I.R. (Maracaibo).
3. Biblioteca virtual de la UPAP

- Marqués, Mercedes, 2009, Base de datos, Editorial: Universitat
Jaume I. Servei de Comunicació i Publicacions,
ISBN: 9788469301463
40

Unidad I - Contenido - Organizacion - de - Archivos - y - Base - de - Datos - I

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Unidad I - Contenido - Organizacion - de - Archivos - y - Base - de - Datos - I

Cargado por

Copyright:

Formatos disponibles

ORGANIZACIÓN DE ARCHIVOS Y

formación y gestión de estructuras de datos en almacenamiento secundario;

especialmente en el uso de archivos, como así las operaciones de acceso a los

mismos con el fin de aumentar su rendimiento y eficacia.

almacenamiento secundario, en especial los archivos.

- Facilitar el acceso a los documentos.

- Revisar y garantizar la validez de los archivos.

- Minimizar la pérdida de datos.

Un dato es cualquier elemento que necesitemos procesar en un programa. Los programas

trabajan con datos de entrada, los cuales son manipulados mediante los procesos informáticos

para producir unos datos de salida. (Álvarez, 2022)

Seguro que has oído comentar que la informática es el tratamiento automatizado de la

podemos acudir a algunos ejemplos. (Álvarez, 2022)

sabemos a lo que se refieren, simplemente son números o cadenas de un valor determinado.

"Madrid" (capital de España). (Álvarez, 2022)

1.2. Concepto de datos

Un dato es la representación de una variable que puede ser cuantitativa o cualitativa que indica

números o letras. (Etecé,2020)

para examinar los resultados. (Etecé,2020)

su acrónimo en nuestra lengua. (Porto, 2011)

El concepto se utiliza en la informática para nombrar a una unidad de medida

probabilidad. (Porto, 2011)

Fuente: (Porto, 2011)

valores diferentes (como abierto/cerrado o verdadero/falso) y asignar dichos valores al estado de

encendido (1) o apagado (0). (Porto, 2011)

permite representar cuatro valores diferentes. Palabras, imágenes y números pueden

representarse mediante secuencias de bits. (Porto, 2011)

representación es 0 1 lo que viene a mostrarse es que el primero está apagado y el segundo

encendido. (Porto, 2011)

mencionados dispositivos están encendidos. Y finalmente está la 1 0 que significa que el

primero, el de la izquierda, está encendido y el segundo apagado. (Porto, 2011)

Fuente: (Porto, 2011)

Se conoce como byte a la unidad básica de información empleada en la informática y las

telecomunicaciones, equivalente a un conjunto ordenado y regular de bits (código binario),

Esta unidad no tiene un símbolo convencional de representación, pero en algunos países se

emplea la letra B. (Etecé, 2021)

Fuente: (Etecé, 2021)

El origen de este término se supone en el acrónimo en inglés de Binary Tuple o Tupla binaria, lo

que equivale a una secuencia ordenada de elementos binarios. (Etecé, 2021)

Sin embargo, la semejanza fonética de byte con bite (“morder” o “mordida” en inglés) supuso

En cuanto a la cantidad de información que un byte representa, considérese que se necesita

aproximadamente 8 bits para representar una letra en el código binario de la mayoría de los

inmediatamente superior, el kilobyte (1024 B = 1 kB). (Etecé, 2021)

la siguiente manera (conforme a la norma ISO/IEC 80000-13):

o 1024 B = 1 kB (un kilobyte, equivalente a un texto brevísimo)

o 1024 kB = 1 mB (un megabyte, equivalente a una novela completa)

o 1024 mB = 1 gB (un gigabyte, equivalente a un anaquel entero de biblioteca lleno de

o 1024 gB = 1 tB (un terabyte, equivalente a una biblioteca completa de poco tamaño)

o 1024 tB = 1 pB (un petabyte, equivalente a la cantidad de datos

manejado por Google por hora en el mundo)

o 1024 pB = 1 eB (un exabyte, equivalente al peso de toda la información de Internet para

Los bytes y sus medidas superiores suelen también emplearse para medir la capacidad de

almacenamiento de los dispositivos de memoria digital, o las tasas de transferencia de datos a

través de redes informáticas de diverso tipo. (Etecé, 2021)

Un registro se define como una colección finita y heterogénea de elementos. También

establecer un orden entre los campos. (Cairo, 2006).

Ejemplo: Una compañía tiene por cada empleado la siguiente información:

o Nombre (cadena de caracteres)

o Dirección (cadena de caracteres)

efectiva se conoce como registro o estructura. (Cairo, 2006).

Un registro se define como una colección finita y heterogénea de elementos. También

establecer un orden entre los campos. (Cairo, 2006).

En informática, se conoce como archivo o fichero a un conjunto organizado de unidades de