Está en la página 1de 54

Clase 02.

Data Analytics

Bases de datos
RECUERDA PONER A GRABAR
LA CLASE
● Conocer qué es una base de datos y sus
generalidades.
● Identificar los componentes de una base de
datos.
● Identificar los tipos de bases de datos.
OBJETIVOS DE LA ● Integrar conocimientos generales de data
CLASE warehouse.
BASES DE DATOS:
INTRODUCCIÓN
Los temas que veremos en esta clase son
introductorios.

En nuestro módulo de base de datos


relacionales profundizaremos en los más
importantes.
¿QUÉ ES UNA BASE DE DATOS?

Un conjunto de datos
almacenados en un formato
específico e interrelacionados por
un contexto en común
COMPONENTES DE UNA BASE DE
DATOS
INFORMACIÓN
La información se obtiene de la
base de datos, está integrada y
además es compartida.

SGBD
Sistema de gestión de base de
datos (DBMS por sus siglas en
inglés). Ej: Oracle, MySQL,
SQLServer, Access, entre otros.
USUARIOS
Aplicaciones y Personas que
interactúan con la BD

HARDWARE
- Almacenamiento secundario.
- Procesadores, memoria, etc.
SGBD: Sistemas de gestión de bases de datos

Aplicaciones que han sido


diseñadas para gestionar
grandes cantidades de
información.
¡Nosotros usaremos este!

La gestión de los datos implica


tanto la definición de
estructuras para almacenar la
información como la provisión
de mecanismos para la
manipulación de la
información.
Características de un SGBD
Recuperación Integridad
Capacidad de proteger los datos ante fallos Se refiere a la correctitud y completitud de
en el sistema o en las aplicaciones. la información en una base de datos.

Concurrencia
Seguridad
Permiten que muchas transacciones puedan
Es la protección de la base de datos frente
acceder a una misma base de datos a la
a usuarios no autorizados
vez.
MODELO DE BASE DE DATOS
Concepto

Un modelo de base de datos


permite generar la estructura
lógica de la base, incluidas las
relaciones y limitaciones que
determinan cómo se almacenan
los datos y cómo se accede a
ellos.
TIPOS DE MODELO DE BASE DE DATOS
Relacional Entidad - Relación
Percepción del mundo real que consiste
Colección de tablas para representar tanto
en una colección de objetos básicos,
los datos como sus relaciones
denominados entidades, y de las
relaciones entre ellos

¡Nosotros usaremos estos!


Orientado a objetos No Relacional
La información se representa mediante No tienen un identificador que sirva de
objetos como los presentes en la relación entre un conjunto de datos y
programación orientada a objetos. otros
Jerárquico Red
Los datos son organizados en una Set de registros, los cuales están
estructura parecida a un árbol conectados entre sí por medio de
enlaces en una red
MODELADO DE BASE DE DATOS
Concepto

Permite definir la estructura y comunicarse con


una base de datos. Típicamente permite
describir:
Estructuras de datos

Las estructuras de datos de la base: el tipo de


datos que hay en la base y la forma en que se
relacionan.
Restricciones de integridad

Las restricciones de integridad: Un


conjunto de condiciones que deben cumplir
los datos para reflejar la realidad deseada.
Operaciones de manipulación

Operaciones de manipulación de los datos:


generalmente, operaciones de agregado,
borrado, modificación y recuperación de los
datos de la base.
LENGUAJES DE CONSULTAS
ESTRUCTURADAS
Lenguaje de consultas estructuradas

Los sistemas de gestión


proporcionan un lenguaje de
definición para especificar el
esquema de la base de datos y un
lenguaje de manipulación para
expresar las consultas y las
modificaciones de la base. Structured Query Language
Sublenguajes del SQL

Data Definition Language: Data Manipulation Language:


Permite crear, modificar y DD DM Permite modificar el contenido.
eliminar estructuras. L L

Data Control Language: DC TC Transaction Control


Permite asignar y modificar Language: Permite gestionar
permisos.
L L transacciones.
DATAWAREHOUSE
Concepto

Permite a una organización o empresa


ejecutar análisis potentes en
grandes volúmenes (petabytes y
petabytes) de datos históricos de
formas que una base de datos estándar
simplemente no puede.
Tecnologías que intervienen

Forrester Wave™: Data


Management for Analytics, Q1
2020.

El Forrester Wave, es la herramienta creada por


Forrester Research (consultora de investigación
tecnológica), para medir las herramientas más
usadas en distintas disciplinas de la tecnología.

BREAK
¡5/10 MINUTOS Y
VOLVEMOS!
¿Sabías que premiamos a nuestros
estudiantes por su dedicación
durante la cursada?

Conocé los beneficios del TOP10

¡5/10 MINUTOS Y
BASE DE DATOS EN UNA
ARQUITECTURA DE RED
Diseñarán el diagrama de una arquitectura de red, vista en la vida cotidiana, y
resaltaremos las bases de datos que allí podemos encontrar.
Tiempo: 40 minutos
Las bases de datos están en todos lados

Una arquitectura de red es la conexión de varios dispositivos por medio de una red cableada o
WiFi. Por ejemplo nuestro modem en casa conecta al mismo tiempo a nuestros celulares y
computadoras con nuestros almacenamientos en la nube o impresora.
1. En base al diagrama de ejemplo (siguiente slide), crearás un diagrama en el que se puedan
identificar al menos tres bases de datos.
2. La red puede ser real o ficticia. Podemos inspirarnos en una empresa, escuela, universidad o
hasta nuestra propia casa.
3. Durante 15 minutos te reuniras con tu equipo para desarrollar el desafío, y luego de esto
haremos una puesta en común para debatir con el resto de la clase.
EJEMPLO
¡PARA PENSAR!
CONTESTA LAS ENCUESTAS DE ZOOM
● El entregable se compone de temas vistos hasta el
momento más otros que verán en este módulo.

● Recuerden que tendrán hasta 7 días para


resolverlo y subirlo.
1ra pre-entrega
A) Descripción de la temática de los datos.
B) Tipo de análisis
C) Entrega del dataset seleccionado para el análisis
1

PRIMERA ENTREGA DEL PROYECTO


FINAL
Deberán entregar el archivo que será la base de datos correspondiente a la
primera entrega de tu proyecto final.
PRIMERA ENTREGA DEL PROYECTO FINAL
1
Formato: Archivo plano formato xls/csv/txt. El cual contenga una solapa por cada tabla, o un
archivo por cada tabla.
Sugerencia: activar comentarios en el archivo, y también la opción compartir.

>>Objetivos Generales:
1. Reconocer el modelo relacional.

>>Objetivos Específicos:
2. Reconocer las tablas
3. Identificar los tipos de datos de las tablas.
PRIMERA ENTREGA DEL PROYECTO FINAL
Formato: La base de datos debe ser un archivo plano de tipo xls, csv o txt. La documentación debe 1
ser formato pdf.
Sugerencia: activar comentarios en el archivo, y también la opción compartir.

>>Se debe entregar:


Cada documento debe llevar por título el nombre del proyecto y nombre y apellido de los integrantes del
equipo. En el caso de la base de datos, agregarlos en un documento txt adicional o en la primera solapa.

En el archivo pdf:
1. Descripción de la temática de los datos.
2. tipos de análisis
3. Entrega del dataset seleccionado para el análisis

En el archivo plano:
4. Cada solapa/archivo debe llevar un nombre claro que permita identificar la temática.
PRIMERA ENTREGA DEL PROYECTO FINAL
Formato: La base de datos debe ser un archivo plano de tipo xls, csv o txt. La documentación debe 1
ser formato pdf.
Sugerencia: activar comentarios en el archivo, y también la opción compartir.

>>Ejemplo
BONUS: GUÍA PARA
SELECCIONAR LA FUENTE DE
INFORMACIÓN
Mientras busquen un set de datos para explorar, es importante que se hagan
las siguientes preguntas:

1) ¿Es este un tema que nos interesa?


No elijan un set de datos de forma indiferente. Busquen uno que realmente les
atraiga para crear algo interesante. Por ejemplo, si tienen interés en el deporte,
busquen datos que les permitan identificar ideas sobre Mundiales, Olimpiadas, etc.
2) ¿Este set de datos nos permitirá realizar visualizaciones claras sin
tener que transformar de manera significativa los datos?

Deben asegurarse de que el conjunto de datos esté listo para su análisis. De lo


contrario, requerirá una gran inversión de tiempo en la limpieza de datos
antes de que puedan realizar cualquier análisis.
3) ¿Los datos están en forma numérica?

El set de datos que elijan puede incluir una combinación de datos categóricos (no
numéricos), pero también debe tener datos numéricos. Luego utilizaremos
estadísticas para analizarlos. Pueden tomar como parámetro los sets brindados en la
consigna para comparar.
4) ¿Cuál es el nivel de complejidad?

No es recomendable elegir un set de datos demasiado complejo para el análisis.


Tengan en cuenta que luego deberán presentar la información de manera
convincente. Si parece demasiado difícil de explicar e interpretar, puede ser
recomendable buscar otra alternativa.
También consideren que no sea un set con información sensible.
Les recomendamos realizarse estas preguntas previo a seleccionar su
set de datos. También pueden seleccionar más de una alternativa, para
quedarse con la mejor.
¿QUIERES SABER MÁS? TE
DEJAMOS MATERIAL AMPLIADO
DE LA CLASE
● Youtube : Historia de las bases de datos | CodeTuts
● Artículo & E-book: ¿Que es un Data Warehouse? |
IBM
¡PARA RECORDAR!

Para la próxima clase deberás tener instalada la aplicación


Microsoft SQL Server Express. En la carpeta de la camada
encontrarás un instructivo de instalación.
¿PREGUNT
AS?
¡MUCHAS
GRACIAS!
Resumen de lo visto en clase hoy:
- Bases de datos.
- Tipos de modelos de datos.
- Modelado de datos.
OPINA Y VALORA ESTA
CLASE
#DEMOCRATIZANDOLAEDUC
ACIÓN

También podría gustarte