Está en la página 1de 15

UNIVERSIDAD PARA EL DESARROLLO ANDINO

FACULTAD DE CIENCIAS E INGENIERÍA ESCUELA


PROFESIONAL INGENIERÍA INFORMÁTICA
“Anti hatun yachay wasi, iskay simi yachachiypi umalliq”

CURSO: ANÁLISIS Y DISEÑO DE SISTEMAS

TEMA: BIG DATA

CATEDRA: Ing. BENDEZÚ URETA, Rolando Yossef

CICLO: VIII

INTEGRANTES DEL GRUPO:

 FLORES CÁRDENAS, Miriam


 HUAMANI MARCAS, Aurora
 PÉREZ SEDANO, Walter
 TAIPE LLANCARI, Andreo

Lircay – Angaraes – Huancavelica

2018

I
Este trabajo va dedicado a Dios, a nuestros

padres y docentes del curso, con mucho

respeto y agradecimientos de corazón.

II
Índice

PORTADA
INTRODUCCIÓN ........................................................................................................ 4

CAPITULO I .................................................................................................................... 5

1.1. DEFINICIÓN ..................................................................................................... 5

1.2. COMO FUNCIONA .......................................................................................... 7

CAPITULO II ................................................................................................................. 10

2.1. CARACTERISTICAS DEL BIG DATA ........................................................ 10

2.2. BENEFICIOS DEL BIG DATA...................................................................... 10

2.3. TIPOS DE BIG DATA .................................................................................... 11

2.4. ALMACENAMIENTO ................................................................................... 11

2.5. UTILIDAD ...................................................................................................... 12

CONCLUSIONES ...................................................................................................... 13

REFERENCIAS BIBLIOGRÁFICAS ........................................................................... 14

ANEXO ...................................................................................................................... 15

III
INTRODUCCIÓN

Big Data proviene del inglés que significa literalmente “datos masivos” es un concepto

que hace referencia a grandes conjuntos de información, disponibles en diversos formatos

y tipos de estructuras, recopilada primariamente a través de Internet mediante la

interacción de los usuarios de computadores, teléfonos móviles y dispositivos GPS, entre

otros.

Big Data nació con el objetivo de cubrir unas necesidades no satisfechas por las

tecnologías existentes, como es el almacenamiento y tratamiento de grandes volúmenes

de datos que poseen unas características muy concretas definidas como las tres V’s

(Volumen, Velocidad, Variedad y puede haber más).

4
CAPITULO I

1.1. DEFINICIÓN

Big Data es información de gran volumen, a alta velocidad y de diferente variedad,

que requiere nuevas formas de procesamiento para permitir la comprensión en

mayor profundidad; la mejora en la toma de decisiones, y la optimización de los

procesos.

Si bien Big Data es un término que hace ya algunos años se viene utilizando, aún

hoy en día es difícil encontrar una definición global aceptada que explique este

fenómeno. Un enfoque bastante común, es el de asociar a Big Data con los

enormes volúmenes de información existentes y con las herramientas necesarias

para tratar los mismos. Sin embargo, este tipo de definiciones carentes de una

realidad y contexto, fallan en brindar un verdadero entendimiento del impacto y

profundidad que se encuentra detrás de lo que llamamos Big Data.

5
Realidad y Contexto

Para mejorar nuestra perspectiva sobre el volumen de información del que

hablamos, podemos decir, por ejemplo, que en Facebook se generan 30 billones

de trozos de información mensualmente por sus usuarios. 175 millones de tweets

son enviados diariamente; esto corresponde a 12 terabytes de datos por día.

Pero no sólo las redes sociales generan datos. Un Airbus A380 genera 512 GB de

datos por vuelo.

La bolsa de valores de Nueva York crea 1 TB de información al día. Un drone

militar en una sola misión genera 70 TB de información.

En el año 2012, la cantidad de información en el universo digital llegó a 2.8

zettabytes (ZB); según un informe de la consultora IDC Digital Universe para el

año 2020 se podrían alcanzar los 40 ZB de datos generados por personas y

dispositivos.

Entonces acercándonos a una visión un poco más acorde, cuando hablamos de Big

Data estamos refiriéndonos a un conjunto de datos cuyo tamaño, se encuentra por

encima de la capacidad de las herramientas de base de datos típicas utilizadas para

capturar, almacenar, administrar y analizar información.

6
Pero Big Data no está definida sólo por el volumen de la información ya que a

medida que la tecnología de almacenamiento avanza, también lo harán el conjunto

de datos que calificamos como Big Data. Es así que hay dos características más,

también fundamentales, que debemos considerar para lograr una definición

apropiada: velocidad y variedad.

Velocidad: Es la rapidez con la que la información se encuentra disponible. En

las redes sociales, por ejemplo, la información se propaga de forma casi

instantánea.

Variedad: Estructurados o no, los datos pueden provenir de diversas fuentes y

formas. Imágenes, videos, tweets, etiquetas RFID, historias clínicas, sensores de

movimiento, etcétera.

Este conjunto de las 3V, como se las denomina (volumen, velocidad y variedad),

son los pilares que conforman lo que hoy conocemos como Big Data. Son gracias

a estas cualidades las que nos permite poder formular una definición. (IDATHA.,

2014)

1.2. COMO FUNCIONA

El Big Data trabaja sobre el siguiente principio, entre más se tiene conocimiento

sobre una situación, con más confianza podemos obtener nuevos conocimientos y

hacer predicciones sobre lo que sucederá en el futuro.

Mediante la comparación de conjuntos de datos, nuevas relaciones que

inicialmente se encontraban ocultas empezarán a aparecer. Estas relaciones nos

permitirán el aprendizaje y la toma de decisiones.

Comúnmente esto se hace a través de un proceso que implica la construcción de

modelos en base a los datos que podemos recoger, y luego correr simulaciones,

7
ajustar cada vez más el valor de puntos de datos y el seguimiento de cómo afecta

a nuestros resultados.

Este proceso es automático mediante la tecnología analítica avanzada que hoy en

día ejecutará millones de estas simulaciones. El proceso ajustará todas las

variables posibles hasta que encuentre un patrón o una idea que ayuda a resolver

el problema que está trabajando.

Cada vez, los datos ingresan en una forma no estructurada, esto significa que no

se puede poner fácilmente en tablas estructuradas con filas y columnas.

Muchos de estos datos están en forma de fotos y videos a partir de imágenes de

satélite o fotografías subidas a Facebook o Twitter, también comunicaciones por

correo electrónico y la mensajería instantánea y grabaciones de llamadas

telefónicas.

Para darle sentido a este tema, los proyectos de grandes volúmenes de datos a

menudo utilizan el análisis de vanguardia, la participación de la inteligencia

artificial y aprendizaje automático.

El reconocimiento de imágenes o el procesamiento del lenguaje natural se da al

momento de enseñarle a los ordenadores a identificar lo que un dato representa,

por ejemplo, que puedan aprender a detectar patrones mucho más rápido y

confiable que los humanos.

Una fuerte tendencia en los últimos años ha sido la entrega de herramientas de

datos grandes y tecnología a través de una plataforma de “as a service”. Las

empresas y organizaciones alquilan a los proveedores de servicios cloud de

terceros servidores espaciales, sistemas de software y capacidades de

procesamiento. Todo el trabajo se lleva a cabo al proveedor de los sistemas de

servicios y el cliente simplemente paga por lo que fue utilizado.

8
Este modelo está llevando a una gran transformación basada en datos accesibles

a cualquier organización que reduce la necesidad de gastar grandes sumas de

dinero en hardware, software, instalaciones y personal técnico. (process, 2017)

9
CAPITULO II

2.1. CARACTERISTICAS DEL BIG DATA

 Volumen de los datos.

 Velocidad con la que se generan los datos

 Variedad de los datos

 Valor

 Veracidad de los datos. (POWER DATA, s.f.)

2.2. BENEFICIOS DEL BIG DATA

Permite que una empresa tenga ventajas considerables. Por ejemplo, puede

animar a divisiones con peores resultados a mejorar sin intervención directa

de la dirección de la empresa. Una aplicación común es clasificar los

objetivos de ventas por división o incluso por empleado.

10
2.3. TIPOS DE BIG DATA

 Datos estructurados (Structured Data): Datos que tienen bien

definidos su longitud y su formato, como las fechas, los números o las

cadenas de caracteres. Se almacenan en tablas. Un ejemplo son las

bases de datos relacionales y las hojas de cálculo.

 Datos no estructurados (Unstructured Data): Datos en el formato

tal y como fueron recolectados, carecen de un formato específico. No

se pueden almacenar dentro de una tabla ya que no se puede desgranar

su información a tipos básicos de datos. Algunos ejemplos son los

PDF, documentos multimedia, e-mails o documentos de texto.

 Datos semiestructurados (Semistructured Data): Datos que no se

limitan a campos determinados, pero que contiene marcadores para

separar los diferentes elementos.

2.4. ALMACENAMIENTO

 Almacenamiento Clave-Valor (Key-Valué): Los datos se almacenan

de forma similar a los mapas o diccionarios de datos, donde se accede

al dato a partir de una clave única

 Almacenamiento Documental: Las bases de datos documentales

guardan un gran parecido con las bases de datos Clave-Valor,

diferenciándose en el dato que guardan.

 Almacenamiento en Grafo: Las bases de datos en grafo rompen con

la idea de tablas y se basan en la teoría de grafos, donde se establece

que la información son los nodos y las relaciones entre la información

son las aristas 25, algo similar en el modelo relacional.

11
 Almacenamiento Orientado a Columnas: Por último, el

almacenamiento Column-Oriented es parecido al Documental. Su

modelo de datos es definido como “un mapa de datos

multidimensional poco denso, distribuido y persistente. (POWER

DATA, s.f.)

2.5. UTILIDAD

Éste conjunto de tecnologías se puede usar en una gran variedad de ámbitos,

como los siguientes:

 Empresarial

 Consumo

 Big Data e intimidad

 Deportes

12
CONCLUSIONES

 Big data es el término inglés que designa los conjuntos de datos de gran tamaño y

generalmente desestructurados que resultan difíciles de manejar usando las

aplicaciones de bases de datos convencionales.

 Como se pudo notar en el presente trabajo, implementar una solución alrededor

de Big Data implica de la integración de diversos componentes y proyectos que

en conjunto forman el ecosistema necesario para analizar grandes cantidades de

datos.

 La naturaleza de la información hoy es diferente a la información en el pasado.

Debido a la abundancia de sensores, micrófonos, cámaras, escáneres médicos,

imágenes, etc. en nuestras vidas, los datos generados a partir de estos elementos

serán dentro de poco el segmento más grande de toda la información disponible.

 El uso de Big Data ha ayudado a los investigadores a descubrir cosas que les

podrían haber tomado años en descubrir por si mismos sin el uso de estas

herramientas, debido a la velocidad del análisis, es posible que el analista de datos

pueda cambiar sus ideas basándose en el resultado obtenido y retrabajar el

procedimiento una y otra vez hasta encontrar el verdadero valor al que se está

tratando de llegar.

13
REFERENCIAS BIBLIOGRÁFICAS

 IDATHA., W. P. (12 de 2014). BIG DATA – Conceptos Generales.


(IDATHA.COM, Ed.) IDATHA.
 POWER DATA. (s.f.). Recuperado el 10 de SEPTIEMBRE de 2018, de
https://www.powerdata.es/big-data
 POWER DATA. (s.f.). Recuperado el 10 de SEPTIEMBRE de 2018, de
https://www.powerdata.es/big-data
 process, i. (24 de 08 de 2017). itprocess.cloud. Recuperado el 10 de 09 de 2018,
de http://itprocess.cloud/big-data-funciona/

14
ANEXO

15

También podría gustarte