Resumen Pelicula Plazzy

Resumen Dia de película
Platzy
Jhonatan Murcia Posso
Cod. 461220238
Universidad de Cundinamarca
Ciencia de datos
Ing. Edgar Bustos Caldas

Bases de Datos en la Vida Real:
Las bases de datos son sistemas estructurados que almacenan y organizan datos para su
posterior recuperación y análisis. Existen dos tipos principales: bases de datos relacionales y
no relacionales.
Bases de Datos Relacionales:
Son estructuradas en tablas con filas y columnas, y utilizan un lenguaje llamado SQL para
consultas y manipulación. Ejemplos incluyen MySQL, PostgreSQL, SQL Server y Oracle.
Bases de Datos No Relacionales:
También conocidas como NoSQL, almacenan datos en formas más flexibles, como
documentos, grafos o pares clave-valor. Ejemplos son MongoDB, Cassandra y Redis.

Herramientas para Consultas Complejas en Bases de Datos Relacionales:
Para realizar consultas más complejas en bases de datos relacionales, se pueden utilizar
herramientas como subconsultas, joins, vistas y funciones de agregación.
Big Data:
Se refiere al manejo y análisis de grandes volúmenes de datos que exceden las capacidades
de las herramientas tradicionales. Surge debido al aumento exponencial en la generación de
datos.
Cassandra:
Es una base de datos NoSQL diseñada para manejar grandes cantidades de datos distribuidos
en clústeres de servidores. Se destaca por su escalabilidad y alta disponibilidad.
Ventajas y Desventajas de Cassandra:
Ventajas: Alta escalabilidad, tolerancia a fallos, distribución geográfica.
Desventajas: Complejidad de configuración, menor flexibilidad en ciertas consultas.
Extracción de Datos en Big Data:
La extracción de datos en entornos de big data implica recopilar, limpiar y transformar datos
de diversas fuentes para su análisis.

Bases de Datos Especializadas en Big Data:
Ejemplos son Hadoop y Spark, que permiten el procesamiento y análisis de grandes
volúmenes de datos distribuidos.
Data Warehouse:
Es un repositorio centralizado de datos extraídos de diversas fuentes, transformados y
organizados para facilitar el análisis y la toma de decisiones.

Diferencia entre Data Warehouse y Big Data:
Un data warehouse almacena datos estructurados para análisis, mientras que big data trata
con grandes volúmenes y variedad de datos, tanto estructurados como no estructurados.
Función del Data Warehouse:
Un data warehouse sirve para almacenar datos históricos y actuales, ofreciendo una visión
consolidada y procesable de la información.

Base de Datos Bigtable:
Es una base de datos NoSQL desarrollada por Google, diseñada para manejar grandes
volúmenes de datos en un entorno distribuido.
Minería de Datos:
Es el proceso de descubrir patrones y conocimientos útiles en grandes conjuntos de datos.
Ayuda a tomar decisiones informadas y predecir tendencias.

Importancia de la Minería de Datos:
Permite revelar información oculta en datos, identificar oportunidades y mejorar la toma de
decisiones.
Ciencia de Datos y Minería de Datos:
La ciencia de datos involucra el análisis, visualización y modelado de datos para obtener
información valiosa, y la minería de datos es una de sus herramientas fundamentales.

Siguiente Paso en Minería de Datos:
El siguiente paso es la creación de modelos predictivos y prescriptivos para anticipar eventos
futuros y recomendar acciones.
ETL para Ciencia de Datos:
ETL (Extract, Transform, Load) es el proceso de extraer datos de diversas fuentes,
transformarlos en formatos adecuados y cargarlos en un sistema para su análisis.

Empresas Inteligentes (Business Intelligence):
Se refiere al uso de datos y análisis para tomar decisiones informadas en una organización,
mejorando la eficiencia y el rendimiento.
Machine Learning:
Es una rama de la inteligencia artificial que permite a las computadoras aprender y mejorar
su rendimiento en tareas específicas a través de la experiencia.

Modelo de Machine Learning:
Es un algoritmo entrenado en datos históricos que puede realizar predicciones o tomar
decisiones en nuevos datos.
Predicción de Datos:
El machine learning se utiliza para predecir resultados futuros basados en patrones
encontrados en datos históricos.

En resumen, en la ciencia de datos, las bases de datos son fundamentales para el
almacenamiento y acceso a datos, tanto en entornos relacionales como no relacionales. La
minería de datos permite descubrir patrones, mientras que el machine learning utiliza esos
patrones para hacer predicciones. Un data warehouse almacena datos organizados para
análisis, mientras que big data trata grandes volúmenes y variedades de datos. El proceso
ETL conecta la parte de almacenamiento con la minería de datos. Business intelligence utiliza
análisis para la toma de decisiones en empresas. En conjunto, estos elementos forman la base
de la ciencia de datos y el análisis de datos en diversas aplicaciones.

Resumen Pelicula Plazzy

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Resumen Pelicula Plazzy

Cargado por

Copyright:

Formatos disponibles

Resumen Dia de película

Jhonatan Murcia Posso

Ing. Edgar Bustos Caldas

Bases de Datos Relacionales:

consultas y manipulación. Ejemplos incluyen MySQL, PostgreSQL, SQL Server y Oracle.

Bases de Datos No Relacionales:

documentos, grafos o pares clave-valor. Ejemplos son MongoDB, Cassandra y Redis.

herramientas como subconsultas, joins, vistas y funciones de agregación.

de las herramientas tradicionales. Surge debido al aumento exponencial en la generación de

en clústeres de servidores. Se destaca por su escalabilidad y alta disponibilidad.

Ventajas y Desventajas de Cassandra:

Ventajas: Alta escalabilidad, tolerancia a fallos, distribución geográfica.

Desventajas: Complejidad de configuración, menor flexibilidad en ciertas consultas.

Extracción de Datos en Big Data:

de diversas fuentes para su análisis.

Ejemplos son Hadoop y Spark, que permiten el procesamiento y análisis de grandes

volúmenes de datos distribuidos.

Es un repositorio centralizado de datos extraídos de diversas fuentes, transformados y

organizados para facilitar el análisis y la toma de decisiones.

con grandes volúmenes y variedad de datos, tanto estructurados como no estructurados.

Función del Data Warehouse:

consolidada y procesable de la información.

volúmenes de datos en un entorno distribuido.

Es el proceso de descubrir patrones y conocimientos útiles en grandes conjuntos de datos.

Ayuda a tomar decisiones informadas y predecir tendencias.

Permite revelar información oculta en datos, identificar oportunidades y mejorar la toma de

Ciencia de Datos y Minería de Datos:

La ciencia de datos involucra el análisis, visualización y modelado de datos para obtener

información valiosa, y la minería de datos es una de sus herramientas fundamentales.

El siguiente paso es la creación de modelos predictivos y prescriptivos para anticipar eventos

futuros y recomendar acciones.

ETL para Ciencia de Datos:

ETL (Extract, Transform, Load) es el proceso de extraer datos de diversas fuentes,

transformarlos en formatos adecuados y cargarlos en un sistema para su análisis.

mejorando la eficiencia y el rendimiento.

su rendimiento en tareas específicas a través de la experiencia.

Es un algoritmo entrenado en datos históricos que puede realizar predicciones o tomar

decisiones en nuevos datos.

El machine learning se utiliza para predecir resultados futuros basados en patrones

encontrados en datos históricos.

almacenamiento y acceso a datos, tanto en entornos relacionales como no relacionales. La

de la ciencia de datos y el análisis de datos en diversas aplicaciones.

También podría gustarte