Está en la página 1de 40

ORGANIZACIÓN DE ARCHIVOS Y

BASE DE DATOS I
UNIDAD 1
Introducción
El fin de esta materia es dotar al alumno de conocimientos sobre cómo organizar,

almacenar y manipular los datos. Dar a conocer a los mismos los mecanismos de

formación y gestión de estructuras de datos en almacenamiento secundario;

especialmente en el uso de archivos, como así las operaciones de acceso a los

mismos con el fin de aumentar su rendimiento y eficacia.

Objetivos

General
- Comprender los mecanismos de formación y gestión de estructuras de datos en

almacenamiento secundario, en especial los archivos.

Específicos
- Optimizar la categorización de la información.

- Facilitar el acceso a los documentos.

- Revisar y garantizar la validez de los archivos.

- Brindar soporte directo ante el manejo de los datos y para los dispositivos de

almacenamiento.

- Minimizar la pérdida de datos.


ORGANIZACIÓN DE ARCHIVOS Y BASE DE DATOS I – UNIDAD 1

1.1. Introducción

Un dato es cualquier elemento que necesitemos procesar en un programa. Los programas

trabajan con datos de entrada, los cuales son manipulados mediante los procesos informáticos

para producir unos datos de salida. (Álvarez, 2022)

El dato está muy ligado a otro concepto que necesitamos conocer que es el de "información".

Seguro que has oído comentar que la informática es el tratamiento automatizado de la

información. Entonces ¿Qué es información y qué es dato? Para entender esta diferencia

podemos acudir a algunos ejemplos. (Álvarez, 2022)

Ejemplos de datos: sería el 0, 12, "sHadksdje2so", "Madrid", "lunes" y cosas así. Estos datos no

sabemos a lo que se refieren, simplemente son números o cadenas de un valor determinado.

(Álvarez, 2022)

Ejemplos de información: 0 (el número de Ferrari que tengo en el garaje), 12 (los días del mes),

"Madrid" (capital de España). (Álvarez, 2022)

Los datos se convierten en información cuando les damos un contexto. El número 0 puede ser

cualquier cosa, pero ya cambia si te digo que faltan 0 días para mi cumpleaños ¿no? en ese caso

el 0 es una información, ¡sobre la cual decides que me tendrás que felicitar ya mismo! (Álvarez,

2022)

1.2. Concepto de datos

Un dato es la representación de una variable que puede ser cuantitativa o cualitativa que indica

un valor que se le asigna a las cosas y se representa a través de una secuencia de símbolos,

números o letras. (Etecé,2020)

4
ORGANIZACIÓN DE ARCHIVOS Y BASE DE DATOS I – UNIDAD 1

Fuente: (Etecé,2020)

Los datos describen hechos empíricos. Para examinarlos deben ser organizados o tabulados, ya

que un dato por sí mismo no puede demostrar demasiado, sino que se debe evaluar el conjunto

para examinar los resultados. (Etecé,2020)

1.2.1 Bit
5
ORGANIZACIÓN DE ARCHIVOS Y BASE DE DATOS I – UNIDAD 1

Binary digit es una expresión inglesa que significa “dígito binario” y que da lugar al término bit,

su acrónimo en nuestra lengua. (Porto, 2011)

El concepto se utiliza en la informática para nombrar a una unidad de medida

de información que equivale a la selección entre dos alternativas que tienen el mismo grado de

probabilidad. (Porto, 2011)

El bit, en otras palabras, es un dígito que forma parte del sistema binario. A diferencia del

sistema decimal, que utiliza diez dígitos (0, 1, 2, 3, 4, 5, 6, 7, 8 y 9), el sistema binario apela a

sólo dos (0 y 1). Un bit, por lo tanto, puede representar a uno de estos dos valores (0  ó 1).

(Porto, 2011)

6
ORGANIZACIÓN DE ARCHIVOS Y BASE DE DATOS I – UNIDAD 1

Fuente: (Porto, 2011)

EL BIT EN LA INFORMÁTICA

Para la informática, el bit es la unidad más pequeña de información. Permite representar dos

valores diferentes (como abierto/cerrado o verdadero/falso) y asignar dichos valores al estado de

encendido (1) o apagado (0). (Porto, 2011)

Si un bit nos permite representar dos valores (0 y 1), dos bits nos posibilitan codificar cuatro

combinaciones: 0 0, 0 1, 1 0 y 1 1. Cada una de estas cuatro combinaciones, por su parte,

permite representar cuatro valores diferentes. Palabras, imágenes y números pueden

representarse mediante secuencias de bits. (Porto, 2011)

Esto significa que cuando, haciendo referencia a dos dispositivos digitales, se representan con

dos valores como es el caso del 0 0 significa que los dos están apagados mientras que si la

representación es 0 1 lo que viene a mostrarse es que el primero está apagado y el segundo

encendido. (Porto, 2011)

La tercera representación posible es la 1 1 con la que entenderíamos a la perfección que los dos

mencionados dispositivos están encendidos. Y finalmente está la 1 0 que significa que el


7
ORGANIZACIÓN DE ARCHIVOS Y BASE DE DATOS I – UNIDAD 1

primero, el de la izquierda, está encendido y el segundo apagado. (Porto, 2011)

8
ORGANIZACIÓN DE ARCHIVOS Y BASE DE DATOS I – UNIDAD 1

Fuente: (Porto, 2011)

1.2.2 Byte

Se conoce como byte a la unidad básica de información empleada en la informática y las

telecomunicaciones, equivalente a un conjunto ordenado y regular de bits (código binario),

generalmente estipulado en 8. Es decir: 8 bits equivalen a un byte, pero dicha cantidad puede

alterarse, así que un byte es equivalente en realidad a n bits ordenados. (Etecé, 2021)

Esta unidad no tiene un símbolo convencional de representación, pero en algunos países se

emplea la letra B. (Etecé, 2021)

9
ORGANIZACIÓN DE ARCHIVOS Y BASE DE DATOS I – UNIDAD 1

Fuente: (Etecé, 2021)

El origen de este término se supone en el acrónimo en inglés de Binary Tuple o Tupla binaria, lo

que equivale a una secuencia ordenada de elementos binarios. (Etecé, 2021)

Sin embargo, la semejanza fonética de byte con bite (“morder” o “mordida” en inglés) supuso

también su uso a partir de que era la cantidad mínima de datos que podían alimentarse a un

sistema por vez (la cantidad mínima que podía “morder”). (Etecé, 2021)

En cuanto a la cantidad de información que un byte representa, considérese que se necesita

aproximadamente 8 bits para representar una letra en el código binario de la mayoría de los

sistemas comerciales de computación de hoy en día, es decir: un byte equivale a una letra, por lo

que un párrafo entero podrá superar los 100 B, y un texto brevísimo alcanzará la unidad

inmediatamente superior, el kilobyte (1024 B = 1 kB). (Etecé, 2021)

A partir de entonces se inicia toda una escala de medida de cantidad de información digital,  de

la siguiente manera (conforme a la norma ISO/IEC 80000-13):

o 1024 B = 1 kB (un kilobyte, equivalente a un texto brevísimo)

o 1024 kB = 1 mB (un megabyte, equivalente a una novela completa)


10
ORGANIZACIÓN DE ARCHIVOS Y BASE DE DATOS I – UNIDAD 1

o 1024 mB = 1 gB (un gigabyte, equivalente a un anaquel entero de biblioteca lleno de


libros)

o 1024 gB = 1 tB (un terabyte, equivalente a una biblioteca completa de poco tamaño)

o 1024 tB = 1 pB (un petabyte, equivalente a la cantidad de datos

manejado por Google por hora en el mundo)

o 1024 pB = 1 eB (un exabyte, equivalente al peso de toda la información de Internet para


finales del año 2001).

Los bytes y sus medidas superiores suelen también emplearse para medir la capacidad de

almacenamiento de los dispositivos de memoria digital, o las tasas de transferencia de datos a

través de redes informáticas de diverso tipo. (Etecé, 2021)

1.2.3 Campos

Un registro se define como una colección finita y heterogénea de elementos. También

representa un tipo de dato estructurado, en el que cada uno de sus componentes se denomina

campo. Los campos de un registro pueden ser todos de diferentes tipos de datos. Por tanto,

también podrán ser registros o arreglos. Cada campo se identifica con un nombre único, el

identificador de campo. Otra diferencia importante con los arreglos es que no es necesario

establecer un orden entre los campos. (Cairo, 2006).

1.2.4 Registros

De acuerdo con lo estudiado en las secciones previas, los arreglos son estructuras de datos muy

útiles para almacenar una colección de datos, todos del mismo tipo. Sin embargo, en la práctica,

11
ORGANIZACIÓN DE ARCHIVOS Y BASE DE DATOS I – UNIDAD 1

a veces se necesitan estructuras que permitan almacenar datos de distintos tipos que sean

manipulados como un único dato. Para ilustrar este problema se incluye el siguiente ejemplo.

(Cairo, 2006).

Ejemplo: Una compañía tiene por cada empleado la siguiente información:

o Nombre (cadena de caracteres)

o Dirección (cadena de caracteres)

o Edad (entero)

o Sexo (carácter)

o Antigüedad (entero)

Si se quisiera almacenar estos datos no sería, posible usar un arreglo, ya que sus componentes

deben ser todos del mismo tipo. La estructura que puede guardar esta información de manera

efectiva se conoce como registro o estructura. (Cairo, 2006).

Un registro se define como una colección finita y heterogénea de elementos. También

representa un tipo de dato estructurado, en el que cada uno de sus componentes se denomina

campo. Los campos de un registro pueden ser todos de diferentes tipos de datos. Por tanto,

también podrán ser registros o arreglos. Cada campo se identifica con un nombre único, el

identificador de campo. Otra diferencia importante con los arreglos es que no es necesario

establecer un orden entre los campos. (Cairo, 2006).

12
ORGANIZACIÓN DE ARCHIVOS Y BASE DE DATOS I – UNIDAD 1

1.2.5 Archivos

En informática, se conoce como archivo o fichero a un conjunto organizado de unidades de

información (bits) almacenados en un dispositivo. Se les denomina de esa manera

como metáfora a partir de los archivos tradicionales de oficina, escritos en papel, ya que

vendrían a ser su equivalente digital. (Etecé, 2021)

13
ORGANIZACIÓN DE ARCHIVOS Y BASE DE DATOS I – UNIDAD 1

Fuente: (Etecé, 2021)

Cada archivo posee una identificación única o nombre, la cual puede ser modificada o asignada

a voluntad del usuario o del programador, y una extensión que determina qué tipo de archivo es

y qué funciones cumple. Usualmente ambos términos de su nombre están separados por un

punto, por ejemplo: Command.com (Etecé, 2021)

Dentro de los archivos existen paquetes pequeños de datos expresados en bits (la unidad

informática más pequeña que existe) y que se ordenan en registros o líneas, siendo

individualmente distintos, pero con algún rasgo común. (Etecé, 2021)

El modo de agrupación de esta información depende de quién haga el archivo, por lo

que existen numerosas estructuras de archivo, más simples y más complejas, que están más o

menos estandarizadas hoy día. (Etecé, 2021)

Estas unidades mínimas de operación y organización de un Sistema Operativo que son los

archivos, entonces, se pueden crear, eliminar, reubicar, comprimir, renombrar y

activar (ejecutar, en lenguaje informático), junto con otras operaciones básicas de organización.

(Etecé, 2021)

Los archivos pueden tener numerosas funciones. Desde simplemente contener información de

manera ordenada, como los archivos de texto, y permitir el acceso a ella por parte

de programas determinados, hasta archivos ejecutables que desencadenan cierta secuencia de

acciones (y de otros archivos) que tienen como resultado una acción concreta. (Etecé, 2021)

Desde apagar el computador hasta iniciar un videojuego, todo lo que ocurre en un sistema

14
ORGANIZACIÓN DE ARCHIVOS Y BASE DE DATOS I – UNIDAD 1

informático ocurre a través de archivos interconectados ejecutándose por turno en la memoria

del computador. (Etecé, 2021)

Fuente: (Etecé, 2021)

Los archivos de un sistema informático tradicional están organizados en carpetas (o directorios)

y subcarpetas (o subdirectorios), como una forma de categorizarlos y distinguir los que

15
ORGANIZACIÓN DE ARCHIVOS Y BASE DE DATOS I – UNIDAD 1

pertenecen a una aplicación o programa de los que pertenecen a otro. Las carpetas no son más

que etiquetas para representar los compartimentos de la información. (Etecé, 2021)

De esto se trata el sistema de organización de archivos: de una catalogación compleja que al

mismo tiempo permita una interfaz sencilla con el usuario, ya que el tránsito de algunos

archivos entre dos soportes (digamos: un disco duro y un pendrive) puede ser tan simple como

indicar al sistema que los movilice de la carpeta madre a la carpeta destino, sin que sufran

ninguna modificación en el camino ni corran riesgo de extraviarse. (Etecé, 2021)

Todos los archivos existen necesariamente dentro de una carpeta.

CARACTERÍSTICAS GENERALES DE UN ARCHIVO

En líneas generales, los archivos de un sistema informático son:

o Representables. Los archivos suelen tener un nombre de máximo 255 caracteres y suelen


ser representados en sistemas operativos de interfaz gráfica (como Windows) por un

ícono determinado. (Etecé, 2021)

o Únicos por directorio. En una misma carpeta o directorio no pueden existir dos archivos
idénticos con el mismo nombre. Cuando ello ocurra alguno de los dos habrá de cambiar

levemente su nombre o en todo caso será remplazado uno por otro. (Etecé, 2021)

o Modificables. Excepto aquellos que expresamente hayan sido protegidos contra

modificación, como es el caso de los archivos vitales del sistema informático, que no

deben sufrir cambios pues éste se desestabilizaría, lo común es que los archivos puedan

borrarse, crearse, modificarse, renombrarse a voluntad o necesidad. (Etecé, 2021)

o Poseen un tamaño. De acuerdo con la cantidad de información que un archivo contenga,


éste tendrá un tamaño o “peso”, mensurable en Kb, Mb o incluso Gb. Mientras más

grande sea el archivo, más capacidad deberá tener el soporte donde se encuentre. (Etecé,

2021)
16
ORGANIZACIÓN DE ARCHIVOS Y BASE DE DATOS I – UNIDAD 1

FORMATO DE ARCHIVO

La manera en que la información se codifica y ordena dentro de los archivos se conoce como

formato, y responde a diversos estándares existentes. Dependiendo de dichos formatos habrá

compatibilidades o incompatibilidades a la hora de acceder a dicha información, ya que se trata

de una forma de distribución que responde a un patrón determinado. (Etecé, 2021)

Esto se debe a que dentro de los archivos en un soporte cualquiera sólo puede haber bits, dado

que los sistemas informáticos deben poder convertir esa información en código binario (unos y

ceros) para poder procesarla. Así, cada tipo de archivo puede almacenarse en diversos formatos

posibles. (Etecé, 2021)

EJEMPLOS DE ARCHIVO

Algunos ejemplos típicos de archivos son:

o Archivos de texto. Usualmente identificados con extensiones .doc, .txt, .rtf o .odt,


contienen secuencias de caracteres alfanuméricos dispuestos en secuencias específicas,

que denominamos “documentos”. (Etecé, 2021)

o Archivos ejecutables. Usualmente terminados en .exe (executable, “ejecutable” en

inglés), .com (command, “comando”) o .bat (batch, “lote”), son aquellos que disparan las

acciones, como ejecutar una aplicación o un videojuego. (Etecé, 2021)

o Archivos de imagen. Apellidados .jpg, .gif o .tiff normalmente, son imágenes cuya


información recompuesta se traduce en una imagen, ilustración o fotografía. (Etecé,

2021)

1.3. Tipos de datos

Un tipo de datos es un conjunto de valores que tienen una característica en común y que

17
ORGANIZACIÓN DE ARCHIVOS Y BASE DE DATOS I – UNIDAD 1

responden a unas operaciones determinadas. (Álvarez, 2022)

En un sistema informático trabajamos con datos y los lenguajes de programación necesitan

saber cuál es el tipo de ese dato, para saber los valores posibles que podrían tener y las cosas

que se permiten hacer con ellos. (Álvarez, 2022)

Por ejemplo, 2 es un número entero. Lo podré sumar, restar y hacer otras operaciones

matemáticas con otros números. "Madrid" es una cadena de caracteres, que la podré comparar

con otras cadenas, concatenar otras cadenas, etc. (Álvarez, 2022)

Dependiendo del lenguaje de programación puede trabajar con unos tipos u otros. Por ejemplo,

hay lenguajes que distinguen entre números enteros y números decimales y otros lenguajes de

programación en los que solamente se tiene el tipo de datos numérico, englobando tanto

decimales como enteros en el mismo saco. (Álvarez, 2022)

CLASIFICACIÓN DE LOS TIPOS DE DATOS

Como hemos dicho, todos los datos tienen un tipo asociado con ellos. Un dato puede ser un

simple carácter, tal como "x", una cadena como "hola", un valor entero tal como 35 o un valor

numérico con coma flotante como "0.55". En todo caso, el tipo de dato nos indica el conjunto de

valores que podría llegar a tomar una variable de un tipo en particular. (Álvarez, 2022)

En todos los lenguajes de programación encontramos una clasificación de tipos de datos

siempre presente, los tipos de datos simples y los tipos de datos compuestos. (Álvarez, 2022)

Fuente: (Álvarez, 2022)

TIPOS DE DATOS SIMPLES

18
ORGANIZACIÓN DE ARCHIVOS Y BASE DE DATOS I – UNIDAD 1

Los tipos de datos simples, también llamados tipos de datos primitivos o tipos de datos básicos,

son aquellos que contienen un elemento único de un tipo de datos particular y no se pueden

descomponer en varios datos independientes. (Álvarez, 2022)

Aquí tienes una lista de tipos de datos simples comunes en la mayoría de los lenguajes de

programación, aunque ya depende de la implementación de ese lenguaje qué tipos de datos

manejará:

o Numérico

o Número Entero

o Número Real (con decimales)

o Carácter

o Cadena de caracteres

o Booleano (verdadero o falso)

o Enumerado (un conjunto de valores limitado)

De entre todos los tipos de datos mencionados en el listado anterior, que puede ampliar o

reducir su número dependiendo del lenguaje, los más comunes son los siguientes:

19
ORGANIZACIÓN DE ARCHIVOS Y BASE DE DATOS I – UNIDAD 1

o Datos Numéricos: Permiten representar valores forma numérica, ya sean números


enteros o números los reales (con decimales). (Álvarez, 2022)

Los datos de tipo numérico permiten realizar operaciones aritméticas como la suma,

resta, etc. (Álvarez, 2022)

o Datos lógicos: Son aquellos que solo pueden tener dos valores: cierto (true) o falso
(false). Llamamos a estos tipos de datos "booleanos" por la palabra en inglés "Boolean".

Este tipo de datos se da muchas veces cuando se producen comparaciones entre valores

de otros tipos y cuando queremos tomar decisiones con las estructuras condicionales.

(Álvarez, 2022)

o Datos e tipo cadena (string): Los datos de tipo cadena, también llamados "string" o datos
alfanuméricos consisten en una secuencia de caracteres, ya sean números, letras o signos

diversos que aparecen en el teclado. Este tipo de datos es muy común en las aplicaciones

ya que nos permiten guardar cosas como nombres, direcciones, emails... Los valores de

este tipo de datos se representan generalmente encerrado entre comillas. Ya depende del

lenguaje particular si se usan comillas simples, dobles o es posible usar ambas. (Álvarez,

2022)

Existen más clasificaciones que podemos mencionar, aunque no son tan comunes. Por ejemplo,

dentro de los datos básicos podemos encontrar datos estáticos y derivados. Los estáticos son los

datos que manejamos generalmente, como los mencionados en la lista anterior. Cómo dato

derivado nos encontramos con los punteros que hoy en día no se utilizan casi, a no ser que se

programe en C. (Álvarez, 2022)

TIPOS DE DATOS COMPUESTOS

Luego tenemos los tipos de datos compuestos, que también se denominan tipos de datos

complejos o tipos de datos estructurados. Estos tipos de datos se componen de agrupaciones de

tipos de datos simples. (Álvarez, 2022)


20
ORGANIZACIÓN DE ARCHIVOS Y BASE DE DATOS I – UNIDAD 1

Podemos poner algunos ejemplos de tipos de datos compuestos:

o Array

o Estructuras

o Objetos

Estos tipos de datos compuestos también dependen del lenguaje de programación que estemos

utilizando. Depende del lenguaje que implemente unos u otros tipos de datos complejos.

(Álvarez, 2022)

CONSTANTES Y VARIABLES

También muy asociados al concepto de tipo de datos encontramos otro como es el de variable, o

constante. Hablaremos con más detalle de ellas, pero de momento podemos adelantar que los

datos manejados en un algoritmo deben llevar asociado un identificador para que nos podamos

referir a él cuando haga falta. Ese identificador es el nombre de la variable o constante.

(Álvarez, 2022)

Generalmente esa variable, o constante, tendrá distintas partes:

o El nombre para referirnos a ella, o identificador

o El tipo de datos de los elementos que podrá almacenar

o El valor que contiene en un momento dado.

Se define como variable a una posición de memoria referenciada por un identificador donde se

21
ORGANIZACIÓN DE ARCHIVOS Y BASE DE DATOS I – UNIDAD 1

puede almacenar un valor determinado (Tipo de dato). (Álvarez, 2022)

Se define como constante a un valor que no se modifica a lo largo de toda la ejecución del

programa. (Álvarez, 2022)

IDENTIFICADORES

Los identificadores sirven para etiquetar y referenciar en el código a los datos de un programa

(constantes, variables). (Álvarez, 2022)

Dicho de otro modo, toda variable o constante recibe un identificador a la hora de declararse. A

través de ese identificador podemos referenciarla cuando queramos usar el dato que lleva

dentro. (Álvarez, 2022)

Técnicamente el identificador es una secuencia de caracteres que sirve para identificar una

posición en la memoria de la computadora donde se encuentra un dato en particular. Los

identificadores son los que nos permiten acceder a su contenido. (Álvarez, 2022)

Ejemplos de identificadores:

o Nombre

o Operando

o Num_horas

o Calif2

REGLAS PARA FORMAR UN IDENTIFICADOR

No es posible llamar a las variables o constantes como nos da la gana. En cambio, cada lenguaje

de programación permite crear identificadores con unas reglas determinadas. No obstante, hay

22
ORGANIZACIÓN DE ARCHIVOS Y BASE DE DATOS I – UNIDAD 1

algunas reglas que suelen ser comunes en la mayoría de los casos:

o Debe comenzar con una letra (A a Z, mayúsculas o minúsculas) y no deben contener


espacios en blanco.

o Debe contener letras, dígitos y caracteres como la subrayado (guión bajo "_").

o La longitud de identificadores puede ser de varios caracteres. Aquí cada lenguaje tiene
sus límites, pero son generalmente bastante generosos.

CONSEJOS PARA USAR BUENOS IDENTIFICADORES

Nosotros podemos escoger cualquier nombre para las variables y constantes, pero es importante

que los nombres que hayamos elegido sean buenos. (Álvarez, 2022)

Para considerarse buenos nombres podemos seguir unos consejos básicos:

o El nombre del identificador debe dar una idea del significado del valor que contiene

o No se deben usar abreviaciones

o Si se usan varias palabras se pueden separar por guión bajo, como "factura_original".
Pero también podemos usar la notación de camel case que consiste en poner mayúscula

cada letra inicial a partir de la segunda: "facturaOriginal". Generalmente cada lenguaje

tiene una notación más usada que conviene respetar

o Ten cuidado con las mayúsculas y minúsculas, porque la mayoría de los lenguajes las
23
ORGANIZACIÓN DE ARCHIVOS Y BASE DE DATOS I – UNIDAD 1

tienen en cuenta. No es lo mismo una variable que se llame "ALTURA" que "altura" o

"Altura".

o Las variables suelen comenzar en minúscula

o Las constantes se suelen colocar con todas las letras en mayúscula

o Sé consistente, si usas una manera de nombrar las variables, usa siempre la misma en
todo el programa

TIPADO ESTÁTICO Y TIPADO DINÁMICO

También queremos hablar ahora de una de las características que más definen a los lenguajes de

programación, que es su capacidad para aceptar distintos tipos de datos en una variable, o fijar

el tipo de datos de la variable de manera que perdure a lo largo del tiempo. (Álvarez, 2022)

o Tipado estático: Son lenguajes donde se fija el tipo de datos de una variable en el
momento de su creación, no pudiendo cambiar el tipo de datos de esa variable a lo largo

del tiempo. (Álvarez, 2022)

o Tipado dinámico: Es una característica de los lenguajes que permiten que las variables
puedan contener cualquier tipo de datos y éste tipo pueda cambiar a lo largo del tiempo.

(Álvarez, 2022)

Lenguajes con tipado estático tenemos a Java, C#, C. Lenguajes con tipado dinámico tenemos a

PHP, Javascript, Python. (Álvarez, 2022)

1.4. Estructura de datos


24
ORGANIZACIÓN DE ARCHIVOS Y BASE DE DATOS I – UNIDAD 1

lineales

Las estructuras lineales de datos se caracterizan porque sus elementos están ubicados uno al

lado del otro relacionados en forma lineal. Cada elemento de la estructura puede estar

conformado por uno o varios subelementos o campos que pueden pertenecer a cualquier tipo de

dato. (Martínez, 2021)

1.4.1 Introducción

Dentro de las estructuras lineales podemos encontrar tres tipos: 

o Listas enlazadas

o Pilas

o Colas

LISTAS ENLAZADAS

Estas listas, en la estructura de datos, se confeccionan con elementos que están ubicados uno

tras otro en secuencia, donde cada elemento se conecta con el siguiente a través de un enlace

(link) que contiene la posición del siguiente elemento. Sus operaciones dependen de la

necesidad de aplicación y no siguen un mecanismo específico.  (Martínez, 2021)

Según Aguilar, una lista enlazada se define por tres puntos: 

25
ORGANIZACIÓN DE ARCHIVOS Y BASE DE DATOS I – UNIDAD 1

o La información que contienen sus elementos y sus respectivos enlaces.

o El enlace que permite acceder al primer elemento de la lista.

o Un medio para detectar el último elemento de la lista.

Fuente: (Martínez, 2021)

PILAS

La pila, en una estructura de datos, hace referencia a un tipo especial de lista lineal en la que la

inserción y el borrado de nuevos elementos se realiza sólo por un extremo que se denomina

cima o tope. (Martínez, 2021)

Es un elemento que encuentra varias comparaciones con situaciones de la vida real, como lo es

ordenar una pila de libros. Esto se debe a su mecanismo llamado LIFO (last-in, first-out, último

en entrar, primero en salir), en el cual el último elemento que se pone en la pila es el primero

que se puede sacar. (Martínez, 2021)


26
ORGANIZACIÓN DE ARCHIVOS Y BASE DE DATOS I – UNIDAD 1

Los elementos se incorporan solo por un extremo que, en este caso, sería la cima de la pila. 

Un ejemplo de método LIFO que se da en la vida real, puede ser cuando intentamos apilar

libros, ropa o lo que sea, siempre agregamos objetos por encima y si necesitamos sacar alguno,

quitamos el que se encuentra más arriba. (Martínez, 2021)

Fuente: (Martínez, 2021)

COLAS

¿Qué es una cola en una estructura de datos? Podemos decir que son otro tipo de estructura

lineal similar a las pilas, diferenciándose de ellas en el modo de insertar/eliminar elementos. En

este caso, las eliminaciones se realizan por el inicio de la fila, en tanto que las inserciones se

realizan por el otro extremo, es decir, el final. (Martínez, 2021)

27
ORGANIZACIÓN DE ARCHIVOS Y BASE DE DATOS I – UNIDAD 1

Las colas en la estructura de datos tienen un mecanismo que se conoce como FIFO (first-in,

first-out - primero en entrar, primero en salir). (Martínez, 2021)

De este modo, la diferencia con las pilas está en el modo en que ingresan y salen los datos. La

utilidad de las colas yace en almacenar datos que necesitan ser procesados según el orden de

llegada. (Martínez, 2021)

Aquí también hay varias analogías con la vida real. Pongamos como ejemplo la cola de un

supermercado en la que el primer elemento que llega (cliente) es el primero en salir al ser

atendido.  (Martínez, 2021)

28
ORGANIZACIÓN DE ARCHIVOS Y BASE DE DATOS I – UNIDAD 1

Fuente: (Martínez, 2021)

1.4.2 Punteros

Un puntero no es más que una variable, en la cual se almacena una dirección de memoria. Esto

parece muy simple, pero luego da muchos quebraderos de cabeza. Al ser una dirección de

memoria, le podemos decir a un puntero que en ese lugar donde apunta queremos almacenar un

valor, por ejemplo un número. (Durán, 2021)

Para realizar una explicación muy sencilla, vamos a decir que un puntero es como un buzón de

correos y nuestra memoria RAM, es similar a una comunidad de vecinos donde hay muchos

buzones. Además, en esta comunidad en lugar de tener el nombre puesto en el buzón, cada uno

va a tener un identificador único. (Durán, 2021)

29
ORGANIZACIÓN DE ARCHIVOS Y BASE DE DATOS I – UNIDAD 1

Fuente: (Durán, 2021)

Como se puede ver en la imagen, hay muchos buzones (zonas de memoria), pero no todas las

podemos usar, ya que hay buzones que son nuestros y otros que son de otros vecinos (otros

programas). (Durán, 2021)

El buzón b5 tiene un papel con el número 23 escrito (en esa posición identificada como b5 está

almacenado el número 23). (Durán, 2021)

El buzón b1 es un puntero, ya que lo que tiene almacenado (b5), no es un valor, sino un

identificador de otro buzón (una dirección de memoria). (Durán, 2021)

Una vez que ya sabemos que es un puntero, una variable cuyo valor es una dirección de

memoria, vamos a proceder a explicar cómo se utilizan. (Durán, 2021)

Imaginamos que el cartero sabiendo que hay dos buzones nuestros, decide introducir un paquete

(el valor 23) en uno de nuestros buzones. (Durán, 2021)

Pero se da cuenta de que lo introdujo en el buzón que no era, entonces se le ocurre dejarnos en

el buzón correcto (b1), un papel donde pone “tu paquete está en b5“. (Durán, 2021)

La manera de obtener el valor es bien sencilla, nosotros abriríamos b1, veríamos que lo que hay

30
ORGANIZACIÓN DE ARCHIVOS Y BASE DE DATOS I – UNIDAD 1

dentro es el papel y entonces diríamos, para alcanzar el valor, tengo que ir a  b5 y obtener su

contenido. (Durán, 2021)

Fuente: (Durán, 2021)

En la imagen superior se puede ver cómo funcionan realmente los punteros. El

carácter * representa a un puntero en C. Si quieres aprender este lenguaje te recomiendo

este curso de programación en C. (Durán, 2021)

En la dirección de memoria 0x67 tenemos almacenado un 5. Podemos decir que la variable cuya

dirección de memoria es 0x67 es un entero o, dicho de otra manera, que tenemos un entero de

valor 5 almacenado en 0x67. (Durán, 2021)

En la dirección de memoria 0x75 tenemos almacenado otra dirección de memoria, la 0x67. En

este caso tenemos un puntero a entero, ya que tenemos en 0x75 almacenada la dirección de

memoria de un entero. Es importante recalcar que tenemos dónde está el entero, no cuál es su

valor. (Durán, 2021)

De igual manera, en la dirección 0x88 tenemos almacenado otra dirección de memoria, pero en

este caso no es un puntero a entero, ya que la dirección de memoria almacenada no es la de un

entero sino la de un puntero a entero. Esto da como resultado que tenemos un puntero a puntero

a entero. (Durán, 2021)

31
ORGANIZACIÓN DE ARCHIVOS Y BASE DE DATOS I – UNIDAD 1

Como veis es fácil generalizar su funcionamiento partiendo de este ejemplo.

Respecto al uso dentro de un programa, los punteros se usan ya que permiten realizar

operaciones de manera más eficiente al trabajar con direcciones de memoria. Por ejemplo, si

tuviéramos que intercambiar el valor de dos cadenas de texto de 200bytes cada una, es mucho

más eficiente cambiar los punteros a cada una de las cadenas (2 bytes, uno por puntero), que

copiar el contenido. El tener que gestionar manualmente estos punteros, quizás hacen de C

un lenguaje complejo para empezar a programar. (Durán, 2021)

1.4.3. Listas

En ciencias de la computación, una lista o secuencia es un tipo de dato abstracto que representa

una secuencia ordenada de valores, donde el mismo valor puede ocurrir más de una vez. Un

caso de una lista es una representación computacional del concepto matemático de

una secuencia finita. Las listas son un ejemplo básico de contenedores, cuando contienen otros

valores. Si el mismo valor se repite varias veces, cada ocurrencia está considerada un elemento

distinto. (Durán, 2021)

Una simple estructura de lista enlazada, implementando una lista con 3 elementos enteros.

(Durán, 2021)

El concepto lista es también utilizado para varias estructuras de datos que puede soler

implementar listas abstractas, especialmente listas enlazadas. (Durán, 2021)

Muchos lenguajes de programación proporcionan soporte para tipos de dato de la lista, y tienen

sintaxis especiales y semánticas para listas y operaciones de lista. Una lista a menudo puede ser

construida escribiendo los elementos en secuencia, separado por comas, puntos y comas,

o espacios, dentro de un par de delimitadores como paréntesis'()', corchetes'[]', tirantes '{}', o

paréntesis angulares '<>'. Algunos lenguajes permiten indexación sobre las listas, similar a

32
ORGANIZACIÓN DE ARCHIVOS Y BASE DE DATOS I – UNIDAD 1

los array (vectores), en tal caso es más adecuado describirlas como array. En programación

orientada a objetos las listas son normalmente proporcionadas como instancias de una clase

"Lista" genérica, y recorridas por iteradores separados. Los tipo de datos de lista son usualmente

implementados usando estructuras de datos de array o listas enlazadas, pero otras estructuras de

dato pueden ser más apropiadas para algunas aplicaciones. En algunos contextos, como en

programación en Lisp, el término lista se puede referir específicamente a una lista enlazada más

que un array. (Durán, 2021)

1.4.4. Pilas

Una pila representa una estructura lineal de datos en la que se puede agregar o quitar elementos

únicamente por uno de los dos extremos. En consecuencia, los elementos de una pila se

eliminan en orden inverso al que se insertaron; es decir, el último elemento que se mete en la

pila es el primero que se saca. Debido a esta característica, se le conoce como estructura LIFO

(Last-Input, First-Output: el último en entrar es el primero en salir). (Cairo, 2006)

Existen numerosos casos prácticos en los que se utiliza el concepto de pila; por ejemplo, una

pila de platos, una pila de latas en un supermercado, una pila de libros que se exhiben en una

librería, etcétera. En la figura 3.1 se observa una pila de platos. Es de suponer que si el cocinero

necesita un plato limpio, tomará el que está encima de todos, que es el último que se colocó en

la pila. (Cairo, 2006)

Las pilas son estructuras de datos lineales, como los arreglos, ya que los componentes ocupan

lugares sucesivos en la estructura y cada uno de ellos tiene un único sucesor y predecesor, con

excepción del último y del primero, respectivamente. (Cairo, 2006)

Una pila se define formalmente como una colección de datos a los cuales se puede acceder

mediante un extremo, que se conoce generalmente como tope. (Cairo, 2006)

33
ORGANIZACIÓN DE ARCHIVOS Y BASE DE DATOS I – UNIDAD 1

1.4.5. Colas

Una cola constituye una estructura lineal de datos en la que los nuevos elementos se introducen

por un extremo y los ya existentes se eliminan por el otro. Es importante señalar que los

componentes de la cola se eliminan en el mismo orden en el cual se insertaron. Es decir, el

primer elemento que se introduce en la estructura será el que se eliminará en primer orden.

Debido a esta característica, las colas también reciben el nombre de estructuras FIFO (First-In,

First-Out: el primero en entrar es el primero en salir). (Cairo, 2006)

Existen numerosos casos de la vida real en los cuales se usa este concepto. Por ejemplo, la cola

de los bancos en las que los clientes esperan para ser atendidos -;.. primera persona de la cola

será la primera en recibir el servicio-, la cola de los niño. que esperan a veces pacientemente

para subir a un juego mecánico, las colas de 1 vehículos esperando la luz verde del semáforo,

las colas para entrar a un cine, teatro' estadio de fútbol, etcétera. (Cairo, 2006)

1.5. Estructura de datos no

lineales

Las estructuras de datos no lineales también son conocidas por el nombre de multienlazadas. En

ellas, cada elemento puede estar enlazado a cualquier otro componente. Esto quiere decir que

cada elemento puede tener varios sucesores o varios predecesores. (Martínez, 2021)

34
ORGANIZACIÓN DE ARCHIVOS Y BASE DE DATOS I – UNIDAD 1

Las estructuras no lineales de datos son dos: 

o Árboles 

o Grafos

1.5.1 Introducción

Los árboles corresponden a una de las subclases de grafos de uso más amplio, particularmente

en computación.

Los grafos se pueden clasificar en dos grupos: dirigidos y no dirigidos. Los árboles forman parte

de los no dirigidos.

Sirven para organizar y relacionar datos en una base de datos, por ejemplo. Esto permite

realizar operaciones de manera eficiente. Por ejemplo, un árbol de definición jerárquica se

utiliza para configurar una base de datos para los registros de libros existentes en

diversas bibliotecas.

Otro ejemplo de la utilización de árboles son los diccionarios. A partir de una palabra, se realiza

una búsqueda en el árbol para saber si está incluida en el conjunto, y si existe, se obtienen sus

datos asociados (por ejemplo, si es un verbo, un sustantivo, un artículo, etc.).

1.5.2. Arboles

Los árboles, en la estructura de datos, son una estructura no lineal que se utiliza para representar

35
ORGANIZACIÓN DE ARCHIVOS Y BASE DE DATOS I – UNIDAD 1

datos con una relación jerárquica en la que cada elemento tiene un único antecesor y puede tener

varios sucesores.  (Martínez, 2021)

Se puede realizar una clasificación de árboles en estructura de datos:

o Árbol general: que es un árbol donde cada elemento puede tener un número ilimitado de
subárboles.  (Martínez, 2021)

o Árboles binarios: que son una estructura de datos homogénea, dinámica y no lineal en
donde a cada elemento le pueden seguir como máximo dos nodos.

Dentro de ellos podemos encontrar: 

 Distintos: posee una estructura distinta a la de otros árboles.

 Similares: cuando su estructura es idéntica a la de otros árboles binarios, pero la


información que guardan los nodos es diferente entre sí.

 Equivalentes: cuando su estructura e información de sus nodos es idéntica a la de


otros árboles binarios.

 Equilibrados: las alturas de los dos subárboles de cada uno de los nodos tienen
como máximo una diferencia de una unidad.

 Degenerados: sus nodos tienen solo un subárbol. 

36
ORGANIZACIÓN DE ARCHIVOS Y BASE DE DATOS I – UNIDAD 1

fuente: (Martínez, 2021)

1.5.3. Grafos
37
ORGANIZACIÓN DE ARCHIVOS Y BASE DE DATOS I – UNIDAD 1

Los grafos, en las estructura de datos, son otra estructura no lineal, así como los árboles. 

Aguilar los define de la siguiente forma:

“Formalmente un grafo es un conjunto de puntos —una estructura de datos— y un conjunto de

líneas, cada una de las cuales une un punto a otro.

Los puntos se llaman nodos o vértices del grafo y las líneas se llaman aristas o arcos”.

(Martínez, 2021)

Si nos preguntamos ¿qué es un grafo y para qué sirve? Diremos que es una estructura

matemática que permite modelar problemas de la vida cotidiana, mediante una representación

gráfica, formada por nodos, que muestra las relaciones que hay entre los distintos componentes.

(Martínez, 2021)

Podemos poner el ejemplo de una red social donde se establecen relaciones entre las personas

que a su vez generan relaciones entre ellas interactuando, conformando así un grafo.  (Martínez,

2021)

38
ORGANIZACIÓN DE ARCHIVOS Y BASE DE DATOS I – UNIDAD 1

Fuente: (Martínez, 2021)

Llegados a este punto, ya debes tener una idea concreta de qué es una estructura de datos y

cómo funciona para poder aplicarla en tus proyectos. Recuerda que son un medio muy útil que

te permitirá manejar grandes cantidades de datos de manera eficiente. (Martínez, 2021)

Referencias Bibliográficas

1. Bibliografía Básica
- Senn J.A., “Análisis y diseño de sistemas de información”

39
ORGANIZACIÓN DE ARCHIVOS Y BASE DE DATOS I - BIBLIOGRAFÍA
ORGANIZACIÓN DE ARCHIVOS Y BASE DE DATOS I – UNIDAD 1

- Cairo y Guardati, “Estructuras de Datos”

2. Bibliografía Complementaria
- Gary W. Hansen, James V. Hansen, Diseño

y Administración de Base de Datos, Segunda Edición.

- Profesor David López, Guía de Estructura y Procesamiento de Datos ,

Segundo semestre U.N.I.R. (Maracaibo).

3. Biblioteca virtual de la UPAP


- Marqués, Mercedes, 2009, Base de datos, Editorial: Universitat

Jaume I. Servei de Comunicació i Publicacions,

ISBN: 9788469301463

40

También podría gustarte