El Big Data en Nuestro Ambiente (Sofía Jiménez)

Instituto Tecnológico de Las Américas
Nombre/s: Sofía
Apellido/s: Jiménez Durán
Matricula: 2022-0905
Asignatura: Electiva 1
Sección: 1
Tema: Introducción a Big Data
Profesor/a: Francis Ramírez

El Big Data en nuestro ambiente
a. ¿Cuántos tipos de datos existen?
Los tipos de datos que podemos manejar en Big Data son:
Datos estructurados: Los datos estructurados son información

que ha sido formateada y transformada en un modelo de datos
bien definido, se suelen encontrar en la mayoría de bases de
datos relacionales (RDBMS). Suelen ser archivos de texto que se
almacenan en formato tabla, hojas de cálculo o bases de datos
relacionales con títulos para cada categoría que permite
identificarlos.
Dada su estructura ordenada, son los más fáciles de gestionar,

tanto digital como manualmente. También, dada su alto grado
de organización, permiten una mayor predictibilidad que otros
tipos.
Datos semiestructurados: Son aquellos con un nivel medio de

estructuración y rigidez organizativa. Se encuentran a medio
camino entre los estructurados y los no estructurados. Tienen un
cierto nivel de estructura, jerarquía y organización, aunque
carecen de un esquema fijo. En lugar de estructuras
esquemáticas, como en el caso de los estructurados, se podría
decir que lo son en forma de árbol, con etiquetas para facilitarte
el manejo. Además, contienen metadatos (etiquetas y
elementos) que se utilizan para agruparlos y describir cómo se
almacenan.
Entre sus principales características está, también, que tienen

algunas propiedades organizativas que facilitan su análisis. De
hecho, si los procesas puedes conseguir su almacenamiento en
la base de datos relacional y también en filas y columnas. Sin
embargo, no todos los que se colocan en un grupo tienen
siempre las mismas propiedades. A veces difieren en tipo y
tamaño.
Datos no estructurados: La característica principal de este tipo

de datos, generalmente binarios, es que no poseen una
estructura interna identificable. Se trata de un cúmulo de
información que deben identificarse y almacenarse de forma
organizada a través de una base de datos no relacional (NoSQL).
La gestión de datos no estructurados puede tomar datos de
muchas formas, incluidas publicaciones en redes sociales, chats,
imágenes satelitales, datos de sensores de IoT, correos
electrónicos y presentaciones, para organizarlos de una manera
lógica y predefinida.
Los datos no estructurados son cualitativos, no cuantitativos, por

lo que en su mayoría son de naturaleza categórica y
característica.
b. ¿Qué es Big Data?

Cuando hablamos de Big Data nos referimos a conjuntos de
datos o combinaciones de conjuntos de datos cuyo tamaño
(volumen), complejidad (variabilidad) y velocidad de crecimiento
(velocidad) dificultan su captura, gestión, procesamiento o
análisis mediante tecnologías y herramientas convencionales,
tales como bases de datos relacionales y estadísticas
convencionales o paquetes de visualización, dentro del tiempo
necesario para que sean útiles.
El objetivo de trabajar con Big Data es extraer información

valiosa, patrones, tendencias y conocimientos que puedan
utilizarse para tomar decisiones informadas, mejorar los
negocios, optimizar procesos y realizar investigaciones científicas,
entre otros usos.
c. ¿Cuál es el objetivo principal de la analítica de datos?

La analítica de datos permite a las organizaciones analizar todos
sus datos (en tiempo real, históricos, no estructurados,
estructurados, cualitativos) para identificar patrones y generar
conocimientos para informar y, en algunos casos, automatizar
decisiones, conectando la inteligencia y la acción.
El objetivo principal de la analítica de datos se basa en sacar

conclusiones sobre la información para poder tomar decisiones,
o simplemente ampliar los conocimientos sobre diversos temas.
d. Etapas en donde la ética puede ayudar a la Ciencia de Datos.

La ética desempeña un papel fundamental en la Ciencia de Datos
en todas las etapas del proceso, desde la recopilación de datos
hasta la toma de decisiones basadas en datos.
En la etapa de recopilación de datos la ética puede ayudar al
garantizar que las personas cuyos datos se recopilan
comprendan cómo se utilizarán sus datos y otorguen su
consentimiento de manera informada, y protegiendo la
privacidad de las personas al recopilar datos.
En la etapa de preprocesamiento de datos, la ética puede ayudar
al garantizar que los datos estén limpios y libres de sesgos para
evitar que los algoritmos aprendan y perpetúen sesgos injustos, y
al ocultar información que pueda identificar a individuos en los
datos para proteger su privacidad.
En la etapa de modelado y entrenamiento, la ética puede ayudar
al asegurarse de que los modelos sean comprensibles y
explicables para que las decisiones basadas en ellos sean
transparentes.
En la etapa de evaluación de modelos, la ética puede ayudar al
utilizar métricas que reflejen preocupaciones éticas, como la
equidad y la justicia, además de métricas de rendimiento
tradicionales.
En la etapa de implementación de resultados, la ética puede
ayudar al utilizar los resultados de la Ciencia de Datos de manera
ética y considerar las implicaciones sociales y éticas de las
decisiones que se tomen.
En la etapa de monitoreo continuo, la ética puede ayudar al
continuar monitoreando y evaluando las decisiones y resultados
para ajustar las prácticas de Ciencia de Datos según sea necesario
para mantener la ética en el centro.

El Big Data en Nuestro Ambiente (Sofía Jiménez)

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

El Big Data en Nuestro Ambiente (Sofía Jiménez)

Cargado por

Copyright:

Formatos disponibles

Instituto Tecnológico de Las Américas

Apellido/s: Jiménez Durán

Tema: Introducción a Big Data

Profesor/a: Francis Ramírez

Datos estructurados: Los datos estructurados son información

Dada su estructura ordenada, son los más fáciles de gestionar,

Datos semiestructurados: Son aquellos con un nivel medio de

Entre sus principales características está, también, que tienen

Datos no estructurados: La característica principal de este tipo

Los datos no estructurados son cualitativos, no cuantitativos, por

b. ¿Qué es Big Data?

El objetivo de trabajar con Big Data es extraer información

c. ¿Cuál es el objetivo principal de la analítica de datos?

El objetivo principal de la analítica de datos se basa en sacar

d. Etapas en donde la ética puede ayudar a la Ciencia de Datos.

También podría gustarte