Está en la página 1de 20

Big Data y Ciencia

Computacional
Csar Beltrn Castan Ph.D.
cbeltran@pucp.pe
Pontificia Universidad Catlica del Per
2015-2016 Vice-President, IEEE Computer Society - Peru
The community for technology leaders

http://ouzor.github.io/blog/2015/02/02/data-science-definition.html

Large-Scale Data
Management
Machine
Learning

Big Data Analytics


Data Science and Analytics

Como ensear al computador a extraer conocimiento valioso de grandes


cantidades de informacin?
3

Revolucin de la informacin

Big Data vs. Data Mining

Definicin de Big Data

No existe una nica definicin


Big Data es informacin cuya escala,
diversidad, y complejidad requiere nueva
arquitectura, tcnicas, algoritmos y anlisis
para manejarla y extraer valor y
conocimiento escondido de ella.

Caractersticas de Big Data:


1-Escala (Volumen)

Volumen de informacin
Incremento en 44x desde 2009 al 2020
De 0.8 zettabytes a 35 Zb

Volumen de informacin crece


exponencialmente

Incremento exponencial en la
recoleccin/generacin de data

Caractersticas de Big Data:


2-Complejidad (Variedad)

Varios formatos, tipos, y


estructuras
Texto, numerico, imgenes,
audio, video, secuencias, series
de tiempo, social media data,
matrices multi-dim, etc
Data esttica vs. streaming data
Una simple aplicacin puede ser
generar/colectar varios tipos de
data

Para extraer conocimiento todos estos


tipos de informacin necesitan estar
juntos

Caractersticas de Big Data:


3-Velocidad (Velocidad)

Data est siendo generada rpido y necesita


ser rpidamente procesada.
Anlisis de data Online
Decisiones tardas prdida de
oportunidades
Ejemplos
E-Promotions: Basado en su actual ubicacin, su histrico de
compra, lo que gusta envo de promociones al momento de la
tienda prxima a Ud.
Monitoreo del cuidad de la salud: sensores monitoreando sus
actividades y su cuerpo cualquier medida anormal requiere
una inmediata reaccin

Big Data 3Vs

http://www.teradata.com/

Quines generan Big Data?

Dispositivos mviles
(Siguiendo objetos todo el tiempo)
Social media y networks
(todos generamos data)

Instrumentos cientficos
(colectando todo tipo de data)
Tecnologia y redes de sensores
(midiendo todo tipo de data)

El progreso e innovacin no esta limitada por la habilidad de colectar data.

Sino, por la habilidad de gestionar, analizar, resumir, visualizar y descubrir


conocimiento a partir de la data colectada de forma peridica y de manera
escalable.

Big Data Visualization

http://d3js.org/
12

Data scientist
=
statistician, programmer,
consultant and visualizer

Grandes analistas necesitan ser curiosos!!

http://strataconf.com/stratany2012/public/schedule/detail/25491

Herramientas de Big Data - Analytics

15

Nueva formacin en Ciencia de la


Computacin
Ciencia
de la Computacin
=
Programacin de Computadoras?
Habilidad de programacin es importante,
pero no lo nico.
Let's Help Computer-Science Students Crack the Code
http://chronicle.com/article/Lets-Help-Computer-Science/137649/

16

Nueva formacin en Ciencia de la


Computacin
El ambiente de computacin
de hoy no es el
mismo de las dcadas pasadas,
-Pero la curricula no ha cambiado mucho.
-Antes la formacin era centrada en el
computador
-Hoy se re-orienta a la data data-oriented
computation, la cual involucra grafos,
algoritmos para memoria intensiva,
aprendizaje de mquina,

Qu habilidades necesito potenciar?

18

Crea tu Captulo IEEE Computer Society - Per

19

Gracias
IEEE Computer Society
The community for technology leaders

www.computer.org

Sguenos en:
https://es-la.facebook.com/IEEEComputerSocietyPeru
20

También podría gustarte