Está en la página 1de 14

BIG DATA TALLER 3

DOCENTE: Luz Mónica Rojas Varillas

INTEGRANTES:
• AMBLODEGUI GARCIA FERNANDO ALBERTO
• ATANACIO ROJAS MARIA MARCOSA
• FLORES GARATE NEHEMISH PIAGET
• SOTO MORALES JOSHELIN YERIKA
Big data
Big Data es un término que describe el En el año 1989 Erik
gran volumen de datos, tanto Larson utiliza por primera vez el
estructurados como no estructurados, término Big Data, en un artículo
que inundan los negocios cada día. sobre el marketing 
CARACTERIS
TICAS
Volumen variabilidad Velocidad Veracidad valor
TIPOS DE DATOS
ESTRUCTURADOS

CREADOS PROVOCADOS TRANSACCIONALES COMPILADOS EXPERIMENTALES

Datos generados como


Datos generados por Datos creados de manera Resultan al finalizar una Resúmenes de datos de parte de pruebas o
nuestros sistemas de una indirecta a partir de una acción previa de manera empresa, servicios simulaciones que
manera predefinida acción previa correcta públicos de interés grupal permiten validar si existe
oportunidad de negocio
NO
ESTRUCTURAD
OS

GENERADOS
CAPTURADOS
POR USUARIOS

Creados a partir
Datos que
del
especifican un
comportamiento
usuario
de un usuario
MULTIESTRUCTURA
DOS O HIBRIDOS

MERCADOS
E-COMMERCE METEOROLOGÍA
EMERGENTES
FUENTES DE DATOS
MASIVOS
WEB AND MACHINE TO BIG BIOMETRICS HUMAN
SOCIAL MEDIA MACHINE (M2M) TRANSACTION • DATOS DE GENERATED
• INCLUYE • TECNOLOGIAS QUE DATA INFORMACION • INCLUYEN LOS
CONTENIDO E PERMITEN BIOMETRICA DATOS GENERADOS
• LOS REGISTROS DE
INFORMACION DE CONECTARSE A FACTURACION DE POR PERSONAS
LAS REDES SOCIALES OTROS DISPOSITIVOS TELECOMUNICACION
, COMO SENSOSRES O ES Y REGISTROS DE
MEDIDORES QUE TALLADOS DE
CAPTURAN UN LLAMADAS
EVENTO EN
PARTICULAR
Se considera como el núcleo de Hadoop. El término
MapReduce en realidad se refiere a dos procesos separados
que ejecuta Hadoop.

son un conjunto de librerías que soportan varios sub- Hadoop Los datos en el clúster de Hadoop son divididos en pequeñas
proyectos de Hadoop. piezas llamadas bloques y distribuidas a través del clúster.
MapReduce

Hadoop Hadoop
Common Distributed File
System (HDFS)

Plataformas
Avro ZooKeeper
de Big Data

Proporciona una infraestructura centralizada de servicios que


pueden ser utilizados por aplicaciones para asegurarse de que
Es un proyecto de Apache que provee servicios de los procesos a través de un clúster sean serializados o
serialización. sincronizados.
Cuando se guardan datos en un archivo, el esquema que
define ese archivo es guardado dentro del mismo;
Oozie Pig

Es un proyecto de código abierto que simplifica los flujos de


trabajo y la coordinación entre cada uno de los procesos que Es un lenguaje de programación que simplifica las tareas
deben ser ejecutados en distintos momentos. comunes de Hadoop, como son la carga de datos, la expresión
de las transformaciones sobre los datos.
La digitalización de prácticamente todo, que ha
generado en diferentes sectores nuevos tipos de
grandes datos en tiempo real, muchos de ellos no
¿A qué se debe el auge normalizados que no pueden ser correctamente
procesados por los warehouses relacionales,
actual del Big Data? Diferencias entre las actividades
tradicionales y estructurados.
actuales de Big Data y las
anteriores:
Las tecnologías y técnicas de análisis avanzado de
hoy en día, que hacen posible que las organizaciones
extraigan conocimientos de los datos con un nivel de
sofisticación, velocidad y precisión nunca antes visto

Explica este fenómeno a partir de la diferencia entre


los datos estructurados que se utilizaban antes y el
Luis Joyanes, en su libro Big Data enorme volumen de datos de carácter no estructurado
manejado en la actualidad, proveniente de todo tipo
de fuentes.
BIG DATA EN
SALUD
analítica y nuevas aplicaciones en
visualización salud

BIG DATA EN
SALUD

procesamiento y
plataformas
gestión
Tecnologías de la información y las
comunicaciones (TIC)
■ Tienen un rol preponderante en los avances en el sector; por esto, se habla de tecnologías
4.0 para cuidado de la salud (Health Care 4.0 o HC4.0).
■ Traerá beneficios valiosos en el bienestar y la calidad de vida en general, tanto para
personas sanas como para los pacientes, ya que promoverá buenos hábitos y tratamientos
oportunos mientras se reducen los costos de hospitalización y atención médica.
■ la aplicación de Big Data en salud favorece la sostenibilidad de los sistemas de salud,
aumenta la calidad de la atención sanitaria, mejora la adecuación de los medicamentos y
abre nuevas maneras de hacer medicina.
■ Big Data será el gran impulsor de la medicina del futuro, llamada “Medicina de las 4P”:
personalizada, predictiva, preventiva y participativa.
GRACIAS

También podría gustarte