Está en la página 1de 3

BIG DATA

Es un conjunto enorme de datos que son utilizados para ser procesados y analizados y
convertirse posteriormente en información útil para las organizaciones, dicha información no
puede ser analizada o procesada utilizando procesos o herramientas tradicionales, sino
haciendo uso de herramientas informáticas especializadas.
Tipo de datos
Estructurados: Los datos estructurados tienen perfectamente definido la longitud, el formato y
el tamaño de sus datos. Se almacenan en formato tabla, hojas de cálculo o en bases de datos
relacionales.
No estructurados: Los datos no estructurados se caracterizan por no tener un formato
específico. , generalmente son datos binarios que no tienen estructura interna identificable. Es
un conglomerado masivo y desorganizado de varios objetos que no tienen valor hasta que se
identifican y almacenan de manera organizada. Correos electrónicos.
Archivos de procesador de texto, Archivos PDF, Hojas de cálculo, Imágenes digitales, Vídeo
Audio, Publicaciones en medios sociales.
Semiestructurados: serían aquellos datos que no residen de bases de datos relacionales, pero
presentan una organización interna que facilita su tratamiento, tales como documentos XML y
datos almacenados en bases de datos NoSQL.
Las 5 Vs del Big Data
Volumen: Tradicionalmente, los datos se han venido generando de forma manual. Ahora
provienen de máquinas o dispositivos y se gestan de manera automática, por lo que el volumen
a analizar es masivo. Esta característica del Big Data se refiere al tamaño de las cantidades de
datos que se generan actualmente.
Velocidad: El flujo de datos es masivo y constante y son en tiempo real. Este gran volumen
provoca que los datos queden desfasados rápidamente y que pierdan su valor cuando aparecen
otros nuevos. Las empresas, por lo tanto, deben reaccionar muy rápido para poder recopilarlos,
almacenarlos y procesarlos. El reto para el área de tecnología es almacenar y gestionar grandes
cantidades de datos que se generan continuamente. El resto de áreas también deben trabajar a
gran velocidad para convertir esos datos en información útil antes de que pierdan su valor.
El origen de los datos es altamente heterogéneo. Provienen de múltiples soportes, herramientas
y plataformas: cámaras, Smartphone, coches, sistemas GPS, redes sociales, registros de viajes,
movimientos bancarios, etc. A diferencia de hace unos años, cuando los datos que se
almacenaban se extraían, principalmente, de hojas de cálculo y bases de datos.
Variedad: Los datos que se recopilan pueden venir estructurados (son más fáciles de gestionar)
o no estructurados (en forma de documentos, vídeos, mensajes de correo electrónico, redes
sociales, etc.). Dependiendo de esta diferenciación, cada tipo de información se tratará de
manera distinta, a través de unas herramientas específicas. La esencia del Big Data reside en,
posteriormente, combinar y configurar unos datos con otros. Cada tipo de información se trata
de manera distinta, mediante herramientas específicas, pero después la esencia del Big Data
reside en combinar y configurar unos datos con otros. Es por este motivo por el que aumenta el
grado de complejidad en los procesos de almacenamiento y de análisis de los datos.
Veracidad: Esta característica del Big Data probablemente sea la que supone un mayor reto. El
gran volumen de datos que se genera puede hacer que dudemos del grado de veracidad de
todos ellos, ya que la gran variedad de los datos provoca que muchos de ellos lleguen
incompletos o incorrectos. Esto se debe a múltiples factores, por ejemplo, si los datos provienen
de distintos países o si los proveedores utilizan diferentes formatos. Estos datos deben ser
limpiados y analizados, una actividad incesante ya que continuamente se generan otros nuevos.
La incertidumbre en cuanto a la veracidad de los datos puede provocar ciertas dudas sobre su
calidad y su disponibilidad en un futuro. Por ello, las empresas deben asegurarse de que los
datos que están recopilando tengan validez, es decir, que sean los adecuados para los objetivos
que se pretenden alcanzar con ellos.
Valor: Esta característica representa el aspecto más relevante del Big Data. El valor que generan
los datos, una vez convertidos en información, puede considerarse el aspecto más importante.
Con ese valor, las empresas tienen la oportunidad de sacar el máximo partido a los datos para
introducir mejoras en su gestión, definir estrategias más óptimas, obtener una clara ventaja
competitiva, realizar ofertas personalizadas a los clientes, aumentar la relación con el público, y
mucho más.
La unidad de estado sólido, SSD (acrónimo inglés de solid-state drive) es un tipo de dispositivo
de almacenamiento de datos que utiliza memoria no volátil, como la memoria flash, para
almacenar datos, en lugar de los platos o discos magnéticos de las unidades de discos duros
(HDD) convencionales.
Disco duro o HDD (Hard Drive Disk)
Los discos duros, también conocidos como HDD, son un componente informático que sirve para
almacenar de forma permanente tus datos. Esto quiere decir, que los datos no se borran cuando
se apaga la unidad como pasa en los almacenados por la memoria RAM. La primera empresa en
comercializarlos fue IBM en 1956.
Están compuestos de piezas mecánicas, de ahí que a veces se le llame discos duros mecánicos,
y utilizan el magnetismo para grabar tus datos y archivos. Se compone de uno o varios discos
rígidos unidos por un mismo eje y que giran a gran velocidad dentro de una caja metálica. En
cada plato y en cada una de sus caras, un cabezal de lectura/escritura lee o graba tus datos sobre
los discos. Cuánto más finos sean los discos mejor será la grabación, y cuanto más rápido giran
a mayor velocidad se transmiten los datos, tanto a la hora de leerlos como al escribirlos.
Unidad de estado sólido o SSD
Las unidades de estado sólido o SSD (Solid State Drive) son una alternativa a los discos duros. La
gran diferencia es que mientras los discos duros utilizan componentes mecánicos que se
mueven, las SSD almacenan los archivos en microchips con memorias flash interconectadas
entre sí. Por lo tanto, casi podríamos considerarlos como una evolución de las memorias USB.
Los SSD suelen utilizar memorias flash basadas en NAND, que como también son no-volátiles
mantienen la información almacenada cuando el disco se desconecta. No tienen cabezales
físicos para grabar los datos, en su lugar incluyen un procesador integrado para realizar
operaciones relacionadas con la lectura y escritura de datos.

Estos procesadores, llamados controladores, son los que toman las "decisiones" sobre cómo
almacenar, recuperar, almacenar en caché y limpiar los datos del disco, y su eficiencia es uno de
los factores que determinan la velocidad total de la unidad. Además, al no depender del giro de
un componente físico, también se logra una unidad más silenciosa que los discos mecánicos.
LOS SISTEMAS INTELIGENTES Y LA BIOINFORMATICA

Un sistema inteligente es un programa de computación que cuenta con características y


comportamientos similares a los de la inteligencia humana o animal, es decir que cuenta con la
capacidad de decidir por sí mismo que acciones realizara para alcanzar sus objetivos basándose
en sus percepciones, conocimientos y experiencias acumuladas.

Componentes de un sistema inteligente

También podría gustarte