Está en la página 1de 52

Clase 02.

Data Analytics

Bases de datos
RECUERDA PONER A GRABAR LA
CLASE
● Conocer qué es una base de datos y
sus generalidades.
● Identificar los componentes de una base
de datos.
OBJETIVOS DE LA CLASE ●

Identificar los tipos de bases de datos.
Integrar conocimientos generales de
data warehouse.
BASES DE DATOS:
INTRODUCCIÓN
Los temas que veremos en esta clase son
introductorios.

En nuestro módulo de base de datos


relacionales profundizaremos en los más
importantes.
¿QUÉ ES UNA BASE DE DATOS?

Un conjunto de datos
almacenados en un formato
específico e interrelacionados
por un contexto en común
COMPONENTES DE UNA BASE DE DATOS
INFORMACIÓN
La información se obtiene de
la base de datos, está
integrada y además es
compartida.
SGBD
Sistema de gestión de base
de datos (DBMS por sus
siglas en inglés). Ej: Oracle,
MySQL, SQLServer, Access,
entre otros.
USUARIOS
Aplicaciones y Personas que
interactúan con la BD

HARDWARE
- Almacenamiento secundario.
- Procesadores, memoria, etc.
SGBD: Sistemas de gestión de bases de datos

Aplicaciones que han sido


diseñadas para gestionar
grandes cantidades de
información.
¡Nosotros usaremos este!

La gestión de los datos


implica tanto la definición de
estructuras para almacenar
la información como la
provisión de mecanismos para
la manipulación de la
información.
Características de un SGBD
Recuperación Integridad
Capacidad de proteger los datos ante Se refiere a la correctitud y completitud
fallos en el sistema o en las de la información en una base de datos.
aplicaciones.

Concurrencia
Seguridad
Permiten que muchas transacciones
Es la protección de la base de datos
puedan acceder a una misma base de
frente a usuarios no autorizados
datos a la vez.
MODELO DE BASE DE DATOS
Concepto

Un modelo de base de datos


permite generar la estructura
lógica de la base, incluidas
las relaciones y limitaciones
que determinan cómo se
almacenan los datos y cómo
se accede a ellos.
TIPOS DE MODELO DE BASE DE DATOS
Relacional Entidad - Relación
Percepción del mundo real que
Colección de tablas para representar
consiste en una colección de objetos
tanto los datos como sus relaciones
básicos, denominados entidades, y de
las relaciones entre ellos

¡Nosotros usaremos estos!


Orientado a objetos No Relacional
La información se representa mediante No tienen un identificador que sirva de
objetos como los presentes en la relación entre un conjunto de datos y
programación orientada a objetos. otros
Jerárquico Red
Los datos son organizados en una Set de registros, los cuales están
estructura parecida a un árbol conectados entre sí por medio de
enlaces en una red
MODELADO DE BASE DE DATOS
Concepto

Permite definir la estructura y comunicarse


con una base de datos. Típicamente permite
describir:
Estructuras de datos

Las estructuras de datos de la base: el tipo


de datos que hay en la base y la forma en
que se relacionan.
Restricciones de integridad

Las restricciones de integridad: Un


conjunto de condiciones que deben
cumplir los datos para reflejar la realidad
deseada.
Operaciones de manipulación

Operaciones de manipulación de los


datos: generalmente, operaciones de
agregado, borrado, modificación y
recuperación de los datos de la base.
LENGUAJES DE CONSULTAS ESTRUCTURADAS
Lenguaje de consultas estructuradas

Los sistemas de gestión


proporcionan un lenguaje de
definición para especificar el
esquema de la base de datos y
un lenguaje de manipulación para
expresar las consultas y las
modificaciones de la base. Structured Query Language
Sublenguajes del SQL

Data Definition Data Manipulation


Language: Permite crear, DDL DML Language: Permite modificar
modificar y eliminar el contenido.
estructuras.

Data Control Language: DCL TCL Transaction Control


Permite asignar y modificar Language: Permite
permisos. gestionar transacciones.
DATAWAREHOUSE
Concepto

Permite a una organización o


empresa ejecutar análisis
potentes en grandes volúmenes
(petabytes y petabytes) de datos
históricos de formas que una base
de datos estándar simplemente no
puede.
Tecnologías que intervienen

Forrester Wave™: Data


Management for Analytics, Q1
2020.

El Forrester Wave, es la herramienta creada por


Forrester Research (consultora de investigación
tecnológica), para medir las herramientas más
usadas en distintas disciplinas de la tecnología.

BREAK
¡5/10 MINUTOS Y VOLVEMOS!
¿Sabías que premiamos a nuestros
estudiantes por su dedicación
durante la cursada?

Conocé los beneficios del TOP10

¡5/10 MINUTOS Y VOLVEMOS!


BASE DE DATOS EN UNA ARQUITECTURA DE
RED
Diseñarás el diagrama de una arquitectura de red, vista en la vida cotidiana, y
resaltaremos las bases de datos que allí podemos encontrar.
Tiempo: 40 minutos
Las bases de datos están en todos lados

Una arquitectura de red es la conexión de varios dispositivos por medio de una red
cableada o WiFi. Por ejemplo nuestro modem en casa conecta al mismo tiempo a nuestros
celulares y computadoras con nuestros almacenamientos en la nube o impresora.
1. En base al diagrama de ejemplo (siguiente slide), crearás un diagrama en el que se
puedan identificar al menos tres bases de datos.
2. La red puede ser real o ficticia. Podemos inspirarnos en una empresa, escuela,
universidad o hasta nuestra propia casa.
3. Durante 15 minutos te reuniras con tu equipo para desarrollar el desafío, y luego de esto
haremos una puesta en común para debatir con el resto de la clase.
EJEMPLO
¡PARA PENSAR!
CONTESTA LAS ENCUESTAS DE ZOOM
3

DEFINICIÓN DE LA FUENTE DE INFORMACIÓN


Seleccionar la base de datos que usaremos en el Proyecto Final.
El trabajo en equipo nos permite conocer diferentes fuentes de información. Si tu equipo
cuenta con un set de datos y tú no ¡es momento de aprender de una nueva temática!
DEFINICIÓN DE LA FUENTE DE INFORMACIÓN
Formato: Base de datos almacenada en formato de archivo plano (xls, csv, txt).

>> Consigna:
● Presentar (máximo) tres sets de datos que puedan ser usados como fuente de información
para sus proyectos finales.
● IMPORTANTE: La información será accedida por todo el equipo, así como sus tutores y
profesor. Evitar utilizar datos sensibles.
>> Recomendaciones:
● Una forma correcta de seleccionar un set de datos es pensar en alguna iniciativa o proyecto
personal, laboral o de estudio en el que necesites analizar datos y medir información relevante.
Por ejemplo, la información recolectada para un proyecto de tesis, o el histórico de ventas vs
presupuesto de un emprendimiento.
● Lo ideal es que los archivos que serán su fuente de información estén relacionados con las
temáticas definidas en la clase uno, pero no es obligatorio. En esta instancia los cambios de
temáticas aún son bienvenidos.
DEFINICIÓN DE LA FUENTE DE INFORMACIÓN
Formato: Base de datos almacenada en formato de archivo plano (xls, csv, txt).

>>Aspectos a incluir en el entregable:


● Cada set de datos debe contener al menos diez columnas con datos. Si contiene
varias hojas también es aceptado.
>>Ejemplo:
● Si no cuentan con un set de datos, propio o conocido, algunas bases de datos
públicas:
https://www.ncdc.noaa.gov/cdo-web/datatools/lcd
https://data.buenosaires.gob.ar/dataset/estaciones-bicicletas-publicas
https://data.worldbank.org/
https://www.imf.org/en/Data
http://data.europa.eu/euodp/en/data/
https://trends.google.com/trends/?q=google&ctab=0&geo=all&date=all&sort=0
https://www.aeaweb.org/resources/data/us-macro-regional
https://www.kaggle.com/datasets
DEFINICIÓN DE LA FUENTE DE INFORMACIÓN
Formato: Base de datos almacenada en formato de archivo plano (xls, csv, txt).

>>Ejemplo:
BONUS: GUÍA PARA SELECCIONAR LA
FUENTE DE INFORMACIÓN
Mientras busquen un set de datos para explorar, es importante que se
hagan las siguientes preguntas:

1) ¿Es este un tema que nos interesa?


No elijan un set de datos de forma indiferente. Busquen uno que realmente les
atraiga para crear algo interesante. Por ejemplo, si tienen interés en el deporte,
busquen datos que les permitan identificar ideas sobre Mundiales,
Olimpiadas, etc.
2) ¿Este set de datos nos permitirá realizar visualizaciones claras sin
tener que transformar de manera significativa los datos?

Deben asegurarse de que el conjunto de datos esté listo para su análisis. De


lo contrario, requerirá una gran inversión de tiempo en la limpieza de datos
antes de que puedan realizar cualquier análisis.
3) ¿Los datos están en forma numérica?

El set de datos que elijan puede incluir una combinación de datos categóricos
(no numéricos), pero también debe tener datos numéricos. Luego utilizaremos
estadísticas para analizarlos. Pueden tomar como parámetro los sets
brindados en la consigna para comparar.
4) ¿Cuál es el nivel de complejidad?

No es recomendable elegir un set de datos demasiado complejo para el


análisis. Tengan en cuenta que luego deberán presentar la información de
manera convincente. Si parece demasiado difícil de explicar e interpretar,
puede ser recomendable buscar otra alternativa.
También consideren que no sea un set con información sensible.
Les recomendamos realizarse estas preguntas previo a seleccionar
su set de datos. También pueden seleccionar más de una
alternativa, para quedarse con la mejor.
¿QUIERES SABER MÁS? TE DEJAMOS
MATERIAL AMPLIADO DE LA CLASE
● Youtube : Historia de las bases de datos |
CodeTuts
● Artículo & E-book: ¿Que es un Data Warehouse? |
IBM
¡PARA RECORDAR!

Para la próxima clase deberás tener instalada la aplicación


Microsoft SQL Server Express. En la carpeta de la camada
encontrarás un instructivo de instalación.
¿PREGUNTAS?
¡MUCHAS GRACIAS!
Resumen de lo visto en clase hoy:
- Bases de datos.
- Tipos de modelos de datos.
- Modelado de datos.
OPINA Y VALORA ESTA CLASE
#DEMOCRATIZANDOLAEDUCACIÓN

También podría gustarte