Está en la página 1de 13

BASE DE DATOS

ESTUDIANTE:
DIEGO FERNANDO CASTRO MONTAÑA

UNIVERSIDAD COOPERATIVA DE COLOMBIA


MINERIA DE DATOS
PROGRAMA DE INGENIERIA DE SISTEMA
2020
BASE DE DATOS

ESTUDIANTE:
DIEGO FERNANDO CASTRO MONTAÑA

PRESENTADO:
ING. IRLESA INDIRA SANCHEZ MEDINA

UNIVERSIDAD COOPERATIVA DE COLOMBIA


MINERIA DE BASE DE DATOS
PROGRAMA DE INGENIERIA DE SISTEMA
2020
CONTENIDO

INTRODUCCION.......................................................................................................4
CONCEPTO DE UNA BASE DE DATOS..............................................................5
Reseña histórica...............................................................................................6
La normalización de bases de datos...........................................................8
Tipos de datos y modelos de base de datos............................................10
CONCLUCION...........................................................................................12
REFERENTE...........................................................................................13
INTRODUCCION

En este informe se hablara sobre algunos concepto básicos y fundamentales para


el curso de mineria de datos, por lo tanto se encontrara definiciones y
normalizaciones sobre las bases de datos y conceptos de la información, Se
pondra en practica los conceptos admiridos y expliccado durante la clase,
elaborando una base de datos. Este ejercio nos ayudara a poner en practica y
comprender mejor dichos concepto para que mas Adelante se nos lleguara a
presenter tener idea de que es, como es y como se elabora una base de datos.
CONCEPTO DE UNA BASE DE DATOS

Una base de datos consiste en ordenar un conjunto de información de una manera


eficiente y ordenada en la cual se pueda utilizar. Un ejemplo que se puede dar es
elaborar un directorio telefónico, un calendario, calificaciones de unos alumnos de
dicho colegio o simplemente una base que tenga toda una información básica de
los estudiantes y profesores, etc. Las bases de datos nos permiten asociar o
guardar grandes cantidades de información de una manera organizada para que
después se pueda manejar y encontrar más rápido la información que se esté
buscando o solicitando. Cada base se compone de una o varias tablas que
guardan un conjunto de datos que tienen columnas y filas en cada una de las
tablas.
Reseña histórica

El término bases de datos fue escuchado por primera vez en un simposio


celebrado en California en 1963. En 1884, Herman Hollerith desarrolló el tabulador
electromagnético de tarjetas perforadas con el fin de ayudar en el resumen de
información y posteriormente a la contabilidad.

“Su invención de la máquina de tarjetas perforadas de tabulación marca el


comienzo de la era de la semiautomáticas de procesamiento de datos de
sistemas”. Más información de Herman Hollerith la puedes leer aquí.

El concepto de bases de datos ha estado ligado a la Informática, sin embargo un


dato curioso es que a raíz de la necesidad de tener “tratamientos automáticos de
la información” surge el concepto de “Informática” que no es más que la
combinación entre: Información y Automatización.

En la década de los 50 (1950-1960) se da origen a las cintas magnéticas


ayudando a la automatización de la información y realizar respaldos. Por medio de
este mecanismo se comenzó a automatizar información pero con la desventaja de
que sólo se podía hacer de forma secuencial.

En la década de los 60 (1960-1970) los ordenadores bajaron de precio con el fin


de que las compañías las pudieran adquirir, esto dio paso a que se popularizara el
uso de los discos (cosa que fue un buen adelanto para la época ya que un disco
duro tiene información persistente, o sea, que perdura en el tiempo).

En esta misma época comenzó la primera generación de bases de datos de red y


las bases de datos jerárquicas ya que abría la posibilidad de almacenar
estructuras de datos en listas y árboles.

Es importante destacar de esta época la alianza entre IBM y Amercan Airlines ya


que gracias a esto surgió un sistema que manejaba las reservas de vuelos,
transacciones e información sobre los pasajeros de la compañía American Airlines.

Tiempo después, Charles Bachman desarrolló un tipo de bases de datos conocido


como modelo en red que permitió la creación de un “estándar” en los sistemas de
bases de datos, gracias a la creación de nuevos lenguajes de sistemas de
información.

CODASYL (Conference on Data Systems Languages) era una asociación de


industrias informáticas que tenían en común el objetivo de regularizar un lenguaje
de programación estándar que pudiera ser utilizado en un sin fin de ordenadores.
En la década de los 70 (1970-1980) un científico de la informática, llamado Edgar
Frank Codd aclaró el modelo relacional a la vez que publicó una serie de reglas
para los sistemas de datos relacionales. Este hecho dio el nacimiento de la
segunda generación de los Sistemas Gestores de Bases de Datos (SGBD).

Más tarde a este evento Larry Ellison basado al trabajo de Edgar Frank Codd creó
el Relational Software System que actualmente se conoce como Oracle
Corporation, desarrollando así un Sistema de Gestión de Bases de Datos
Relacional llevando por nombre el mismo que el de la empresa.

En la década de los 80 (1980-1990) se creó un lenguaje de consulta de estructurado


(SQL) que permitió realizar consultas con el fin de recuperar datos de interés de una
Database (BD) y realizar modificaciones.
Durante este tiempo Structured Query Language (SQL) comenzó a ser el modelo
de la industria con bases de datos relacionales con su sistema de tablas pudieron
competir con las bases de datos de red y las jerárquicas.

En la década de los 90 (1990-2000) surgió las bases de datos orientas a objetos


que tuvieron (incluso actualmente a la fecha Oct 25, 2017) bastante éxito en el
momento de ejecutar datos complejos en los lugares donde las bases de datos
relacionales no han podido desenvolverse con una manera eficaz, de esta forma
se desarrollaron herramientas como Excel y Access. Así se creó la tercera
generación de Sistemas Gestores de Bases de Datos.

Fuente: https://platzi.com/tutoriales/1183-bd/1520-breve-resena-de-los-origines-de-las-bases-
de-datos/
La normalización de bases de datos

Es el proceso de organizar los datos de una base de datos, valga la redundancia.


Debemos tener en cuenta la creación de tablas y las reglas que se usan para
definir las relaciones, estas reglas son diseñadas para proteger los datos, y para
que la base de datos sea flexible con el fin de eliminar redundancias y
dependencias incoherentes.

¿Por qué se normalizan las bases de datos?

Las bases de datos relacionales se normalizan para:

 Evitar la redundancia de los datos.


 Disminuir problemas de actualización de los datos en las tablas.
 Proteger la integridad de los datos.
 Facilitar el acceso e interpretación de los datos.
 Reducir el tiempo y complejidad de revisión de las bases de datos.
 Optimizar el espacio de almacenamiento.
 Prevenir borrados indeseados de datos.

Requisitos de la normalización

Para que las tablas de nuestra BD estén normalizadas deben cumplir las siguientes
reglas:

 Cada tabla debe tener su nombre único.


 No puede haber dos filas iguales.
 No se permiten los duplicados.
 Todos los datos en una columna deben ser del mismo tipo.

Reglas o niveles de normalización

Para normalizar una base de datos existen principalmente 3 reglas, las cuales se
deberían cumplir para evitar redundancias e incoherencias en las dependencias. A estas
reglas se les conoce como "Forma normal" qué va de la 1 a la 3 y si la base de datos
cumple con cada regla se dice que está en la "primera o segunda o tercera forma normal"

Aunque son posibles otros niveles de normalización, la tercera forma normal se considera
el máximo nivel necesario para la mayoría de las aplicaciones.

A. Primera forma normal

Elimine los grupos repetidos de las tablas individuales.


Cree una tabla independiente para cada conjunto de datos relacionados.
Identifique cada conjunto de datos relacionados con una clave principal.
B. Segunda forma normal

 Cree tablas independientes para conjuntos de valores que se apliquen a varios


registros.
 Relacione estas tablas con una clave externa.
C. Tercera forma normal

Elimine los campos que no dependan de la clave.


Cada nivel de normalización exige cierta complejidad, pero debes analizar si en realidad
necesitas llegar hasta la tercera forma normal, debes buscar lo que mejor se adapte a la
empresa.

Fuente: https://ed.team/blog/normalizacion-de-bases-de-datos
Tipos de datos y modelos de base de datos

Hoy en día el mercado sigue siendo dominado por DB2, SQL Server, Oracle e
IBM. En Mainframe o Unix/Linux, Oracle y DB2 suelen ser los líderes, mientas que
en sistemas operativos Windows SQL Server suele ser la mejor opción.

Oracle
Base de datos que puede correr en casi cualquier sistema operativo. De Oracle
destacamos la abundancia de perfiles con experiencia en esta tecnología y la gran
cantidad de herramientas que hay para su administración y monitorización.
Benchmark de Oracle: http://www.oracle.com/us/solutions/performance-
scalability/index.html

IBM DB2
Suele ser la segunda base de datos más utilizada en entornos Unix/Linux después
de Oracle. Es claramente un indiscutible ganador en Mainframe. Hay perfiles
profesionales para DB2 pero no tanto como para Oracle. Por otro lado, el perfil de
DB2 Mainframe no tiene por qué saber moverse en DB2 linux/unix.
Benchmark de DB2: http://www-01.ibm.com/software/data/db2/performance.html

Microsoft SQL Server


Base de datos con compatibilidad únicamente para sistemas Windows. Hay
muchos perfiles expertos en SQL Server y no es difícil su adquisición. Su
integración con Microsoft Azure ha mejorado mucho su flexibilidad y rendimiento.
Benchmark: http://www.microsoft.com/en-us/server-cloud/products/sql-server-
benchmarks/industry.aspx

Teradata
Destaca sobre los demás tipos de bases de datos por su capacidad de
almacenamiento y de análisis de datos. Suele ser utilizado en grandes
instalaciones de Big Data.

SAP Sybase
Aunque ya no vive los momentos de éxito de hace una década, sigue destacando
por su escalabilidad y rendimiento.

Informix
Mejores Bases de Datos de libre distribución relacionales
Ahora entramos a hablar de las mejores bases de datos relacionales libres. Sus
beneficios: su comunidad, la posibilidad de ver e incluso modificar el código a
nuestra conveniencia y la no necesidad de pago.
Las bases de datos más importantes son MySQL, María DB y PostgreSQL.
Sistemas y herramientas de mineria de datos

Existen muchas herramientas de software para la elaboración de modelos de


minería de datos tanto libres como comerciales como, por ejemplo:

 RapidMiner
 KNIME
 Neural Designer
 OpenNN
 Orange
 R
 SPSS Modeler
 SAS
 STATISTICA
 Weka
CONCLUCION

La conclución que podemos decir con base a este informe sobre la base de datos
es que se adquirió y se aclararon ciertas inquietudes sobre el tema, aprendiendo
ciertos conceptos básico y fundamentales donde podemos decir definir que una
base de datos que es un conjunto de datos o información usados para dar
servicios a muchas aplicaciones al mismo tiempo y los requerimientos puedo
deducir que cumple las misma tarea de análisis del software que tiene como
característica relacionar la información ordenadamente.

Otra conclusión podemos decir que gracias a los tres modelos lógicos principales
dentro de una base de datos es el jerárquico, de redes y el relacional los cales
tiene como ventaja de procesamiento y de negocios.
REFERENTE

 Programa de Minería de Datos, University of Central Florida


 Proyecto Medical Miner. Integración de minería de texto y de datos en biomedicina
 https://www.tecnologias-informacion.com/mineria-de-datos.html
 https://blog.es.logicalis.com/analytics/como-elegir-sistema-de-mineria-de-datos

También podría gustarte