Documentos de Académico
Documentos de Profesional
Documentos de Cultura
DATOS
Historia
El ser humano siempre ha tenido la necesidad de guardar información es por ello que los
orígenes de tener bases de datos provienen de la antigüedad en donde ya se tenía en
existencia grandes bibliotecas y toda clase de registros entre ellos los que se llevaban de las
cosechas.
La primera vez que se escuchó el término de bases de datos fue en 1963 en un simposio,
refiriéndose a ella como un conjunto de “información” relacionada que se encuentra
agrupara o estructurada
En 1884, Herman Hollerith desarrolló el tabulador electromagnético de tarjetas perforadas
con el fin de ayudar en el resumen de información y posteriormente a la contabilidad.
En la década de los 50 (1950-1960) se da origen a las cintas magnéticas ayudando a la
automatización de la información y realizar respaldos.
Historia
En la década de los 60 (1960-1970) los ordenadores bajaron de, esto dio paso a que se
popularizara el uso de los discos duros (información persistente), o sea, que perdura en el
tiempo.
En esta misma época comenzó la primera generación de bases de datos de red y las bases de
datos jerárquicas, ya que abría la posibilidad de almacenar estructuras de datos en listas y
árboles.
IBM y Amercan Airlines, porque que gracias a esto surgió un sistema que manejaba las
reservas de vuelos, transacciones e información sobre los pasajeros de la compañía
American Airlines.
Charles Bachman desarrolló un tipo de bases de datos conocido como modelo en red que
permitió la creación de un “estándar” en los sistemas de bases de datos, gracias a la creación
de nuevos lenguajes de sistemas de información.
En la década de los 70 (1970-1980), un científico de la informática, llamado Edgar Frank
Codd aclaró el modelo relacional a la vez que publicó una serie de reglas para los sistemas
de datos relacionales. Este hecho dio el nacimiento de la segunda generación de los Sistemas
Gestores de Bases de Datos (SGBD).
Larry Ellison basado en el trabajo de Edgar Frank Codd creó el Relational Software System
que actualmente se conoce como Oracle Corporation, desarrollando así un Sistema de
Gestión de Bases de Datos Relacional llevando por nombre el mismo que el de la empresa.
En la década de los 80 (1980-1990) se creó un lenguaje de consulta estructurado (SQL -
Structured Query Language) que permitió realizar consultas con el fin de recuperar datos de
interés de una Database (BD) y realizar modificaciones.
Structured Query Language (SQL) comenzó a ser el modelo de la industria con bases de
datos relacionales con su sistema de tablas pudieron competir con las bases de datos de red
y las jerárquicas.
En la década de los 90 (1990-2000) surgió las bases de datos orientas a objetos que
tuvieron, incluso en la actualidad, bastante éxito en el momento de ejecutar datos complejos
en los lugares donde las bases de datos relacionales no han podido desenvolverse con una
manera eficaz. De esta forma se desarrollaron herramientas como Excel y Access. Así se
creó la tercera generación de Sistemas Gestores de Bases de Datos.
Qué es una BDD
Una base de datos (BBDD) es un conjunto de datos organizado de tal forma que permite
obtener rápidamente varios tipos de información.
Todas las bases de datos ordenan y clasifican los datos para después poder investigar y
analizar los mismos. Hay softwares especiales que trabajan con BBDD conocidos como
sistemas gestores de bases de datos (SGBD). Lógicamente, hay distintos softwares para cada
tipo de base de datos.
Es una colección organizada de datos
Una base de datos es un sistema electrónico que permite que los datos sean fácilmente
accesibles, manipulados y actualizados.
¿Qué es un dato?
Un dato nos permite describir un objeto. A dicho objeto se le puede llamar entidad, como
por ejemplo una casa en la que viven personas. La casa es la entidad y la cantidad de
personas que viven en ella es un dato, que en este caso es numérico.
Hay diversos tipos de datos en las bases de datos: caracteres, numéricos, imágenes,
fechas, monedas, texto, bit, decimales y varchar y su elección adecuada depende del tipo
de dato. Es esencial comparar un dato con otros para que adquiera significado y poder
identificar comportamientos.
Datos estructurados
Los datos semiestructurados son un tipo de datos que tienen algunas características consistentes y
definidas.
No se limita a una estructura rígida como la necesaria para las bases de datos relacionales. Las
empresas usan propiedades organizacionales como metadatos o etiquetas semánticas con datos
semiestructurados para hacerlo más manejable. Sin embargo, todavía contiene cierta variabilidad e
inconsistencia.
Un ejemplo de datos en formato semiestructurado son los archivos delimitados. Contiene
elementos que pueden dividir los datos en jerarquías separadas.
Por ejemplo, si toma una foto desde un teléfono inteligente, tendría algunos atributos estructurados
como geoetiquetado, ID de dispositivo y sello de fecha y hora. Después de guardarlas, puede
asignar etiquetas a imágenes como 'mascota' o 'perro' para proporcionar una estructura.
En algunas ocasiones, los datos no estructurados se clasifican como datos semiestructurados
porque tienen uno o más atributos de clasificación.
Datos no estructurados
Se definen como datos presentes en forma absoluta sin procesar. Estos datos son difíciles de
procesar debido a su compleja organización y formato.
Los datos no estructurados incluyen publicaciones en redes sociales, chats, imágenes
satelitales, datos de sensores de IoT, correos electrónicos y presentaciones.
Gestión de datos no estructurados toma estos datos para organizarlos de manera lógica y
predefinida en el almacenamiento de datos.
Las herramientas de procesamiento de lenguaje natural (NLP) ayudan a comprender los
datos no estructurados que existen en un formato escrito.
Puede ser un párrafo de un libro con información relevante o una página web. Un ejemplo
de datos no estructurados también podrían ser los archivos de registro que no son fáciles de
separar. Los comentarios y las publicaciones en las redes sociales tampoco están
estructurados.
Diferencias entre datos estructurados,
semiestructurados y no estructurados
En una entrevista de formato no estructurado, las preguntas que se hacen son completamente a
elección del entrevistador. Puede decidir las preguntas que quiere hacer y el orden en que las hará.
Los ejemplos populares de preguntas no estructuradas incluyen "Cuéntame sobre ti" y "Describe tu
rol ideal".
Entrevista estructurada. En este caso, el entrevistador seguirá estrictamente un guión creado por el
departamento de recursos humanos y utilizará el mismo guión para todos los candidatos. Del
mismo modo, los datos estructurados frente a los no estructurados siguen un formato organizado
con un esquema menos flexible.
Organización: Los datos estructurados están bien organizados. Por lo tanto, tiene el más alto nivel
de organización. Los datos semiestructurados están parcialmente organizados; por lo tanto, el nivel
de organización es menor que el de los datos estructurados pero mayor que el de los datos no
estructurados. Por último, la última categoría no está organizada en absoluto.
Flexibilidad y escalabilidad: Los datos estructurados dependen de una base de datos relacional o de
un esquema, por lo que son menos flexibles y difíciles de escalar, mientras que los datos
semiestructurados son más flexibles y fáciles de escalar que los datos estructurados. Sin embargo,
los datos no estructurados no tienen un esquema que los convierta en los más flexibles y escalables
de los otros dos.
Versionado: Dado que los datos estructurados se basan en una base de datos relacional, el
control de versiones se realiza sobre tuplas, filas y tablas. Por otro lado, en los datos
semiestructurados, las tuplas o los gráficos son posibles, ya que solo se admite una base de
datos parcial. Por último, en los datos no estructurados, es probable que el control de
versiones sea un dato completo, ya que no hay soporte de base de datos.
Bases de datos estáticas: las BBDD estáticas están diseñadas para la lectura
de datos. En otras palabras, sólo almacenan y registran los datos. Son
especialmente utilizadas para implementar proyecciones estadísticas y
orientar procesos de tomas de decisiones en el ámbito empresarial.
Bases de datos dinámicas: las BBDD dinámicas son, por el contrario,
modificables con el paso del tiempo. Así, los datos pueden actualizarse,
editarse y eliminarse. Por ejemplo, muchas tiendas varían sus inventarios y
los precios de sus productos según la temporada, por lo que una BBDD
dinámica es ideal.
2|Según el contenido
Almacén orientado a
Almacén de gráficos: Para
columnas: Guardan los datos
Las aplicaciones modernas analizar las relaciones entre
en columnas en lugar de en
empezaron a requerir grandes puntos de datos heterogéneos
filas. Estos tipos de BDD se
bases de datos no y encontrar relaciones, como
utilizan a menudo en los
estructuradas, con imágenes y en la prevención del fraude o
grandes almacenes de datos
archivos de texto para la extracción de datos
porque su funcionalidad sirve
involucrados. sobre los clientes de las redes
para realizar consultas
sociales
analíticas.
Se utiliza el modo de almacenamiento en “almacenes”. Estos pueden ser de:
Tener un buen diseño de base de datos desde el principio te Para decidir entre una base de datos SQL o NoSQL, debe
puede ayudar a ahorrar tiempo a la hora de programar. Las reflexionar entre
bases de datos relacionales (con el estándar SQL) y no Relacion de datos
relacionales se organizan de forma diferente, también
admiten tipos de datos específicos, por eso debes entender Escalabilidad
cómo se diseña cada una. Cantidad de información
Crecimiento de los datos en el tiempo
Complejidad de los datos
Enlaces
https://intelequia.com/es/blog/post/tipos-de-base-de-datos
https://platzi.com/blog/historia-origen-bases-de-datos/
https://www.astera.com/es/type/blog/structured-semi-structured-and-unstructured-
data/