Está en la página 1de 12

Resumen Dia de película

Platzy

Jhonatan Murcia Posso

Cod. 461220238

Universidad de Cundinamarca

Ciencia de datos

Ing. Edgar Bustos Caldas


Bases de Datos en la Vida Real:

Las bases de datos son sistemas estructurados que almacenan y organizan datos para su

posterior recuperación y análisis. Existen dos tipos principales: bases de datos relacionales y

no relacionales.

Bases de Datos Relacionales:

Son estructuradas en tablas con filas y columnas, y utilizan un lenguaje llamado SQL para

consultas y manipulación. Ejemplos incluyen MySQL, PostgreSQL, SQL Server y Oracle.

Bases de Datos No Relacionales:

También conocidas como NoSQL, almacenan datos en formas más flexibles, como

documentos, grafos o pares clave-valor. Ejemplos son MongoDB, Cassandra y Redis.


Herramientas para Consultas Complejas en Bases de Datos Relacionales:

Para realizar consultas más complejas en bases de datos relacionales, se pueden utilizar

herramientas como subconsultas, joins, vistas y funciones de agregación.

Big Data:

Se refiere al manejo y análisis de grandes volúmenes de datos que exceden las capacidades

de las herramientas tradicionales. Surge debido al aumento exponencial en la generación de

datos.
Cassandra:

Es una base de datos NoSQL diseñada para manejar grandes cantidades de datos distribuidos

en clústeres de servidores. Se destaca por su escalabilidad y alta disponibilidad.

Ventajas y Desventajas de Cassandra:

Ventajas: Alta escalabilidad, tolerancia a fallos, distribución geográfica.

Desventajas: Complejidad de configuración, menor flexibilidad en ciertas consultas.

Extracción de Datos en Big Data:

La extracción de datos en entornos de big data implica recopilar, limpiar y transformar datos

de diversas fuentes para su análisis.


Bases de Datos Especializadas en Big Data:

Ejemplos son Hadoop y Spark, que permiten el procesamiento y análisis de grandes

volúmenes de datos distribuidos.

Data Warehouse:

Es un repositorio centralizado de datos extraídos de diversas fuentes, transformados y

organizados para facilitar el análisis y la toma de decisiones.


Diferencia entre Data Warehouse y Big Data:

Un data warehouse almacena datos estructurados para análisis, mientras que big data trata

con grandes volúmenes y variedad de datos, tanto estructurados como no estructurados.

Función del Data Warehouse:

Un data warehouse sirve para almacenar datos históricos y actuales, ofreciendo una visión

consolidada y procesable de la información.


Base de Datos Bigtable:

Es una base de datos NoSQL desarrollada por Google, diseñada para manejar grandes

volúmenes de datos en un entorno distribuido.

Minería de Datos:

Es el proceso de descubrir patrones y conocimientos útiles en grandes conjuntos de datos.

Ayuda a tomar decisiones informadas y predecir tendencias.


Importancia de la Minería de Datos:

Permite revelar información oculta en datos, identificar oportunidades y mejorar la toma de

decisiones.

Ciencia de Datos y Minería de Datos:

La ciencia de datos involucra el análisis, visualización y modelado de datos para obtener

información valiosa, y la minería de datos es una de sus herramientas fundamentales.


Siguiente Paso en Minería de Datos:

El siguiente paso es la creación de modelos predictivos y prescriptivos para anticipar eventos

futuros y recomendar acciones.

ETL para Ciencia de Datos:

ETL (Extract, Transform, Load) es el proceso de extraer datos de diversas fuentes,

transformarlos en formatos adecuados y cargarlos en un sistema para su análisis.


Empresas Inteligentes (Business Intelligence):

Se refiere al uso de datos y análisis para tomar decisiones informadas en una organización,

mejorando la eficiencia y el rendimiento.

Machine Learning:

Es una rama de la inteligencia artificial que permite a las computadoras aprender y mejorar

su rendimiento en tareas específicas a través de la experiencia.


Modelo de Machine Learning:

Es un algoritmo entrenado en datos históricos que puede realizar predicciones o tomar

decisiones en nuevos datos.

Predicción de Datos:

El machine learning se utiliza para predecir resultados futuros basados en patrones

encontrados en datos históricos.


En resumen, en la ciencia de datos, las bases de datos son fundamentales para el

almacenamiento y acceso a datos, tanto en entornos relacionales como no relacionales. La

minería de datos permite descubrir patrones, mientras que el machine learning utiliza esos

patrones para hacer predicciones. Un data warehouse almacena datos organizados para

análisis, mientras que big data trata grandes volúmenes y variedades de datos. El proceso

ETL conecta la parte de almacenamiento con la minería de datos. Business intelligence utiliza

análisis para la toma de decisiones en empresas. En conjunto, estos elementos forman la base

de la ciencia de datos y el análisis de datos en diversas aplicaciones.

También podría gustarte