Está en la página 1de 6

Actividad práctica de reconocimiento

Presentado por:
Sindy Lorena Ortiz González

PROCESAMIENTO DE DATOS
Fundación Universitaria Compensar
Especialización en Big Data
11 de Octubre de 2021
Actividad

Consultar sobre la importancia, los usos y en qué áreas se aplica:

a. Técnicas de extracción

El proceso de extracción de datos se ocupa de extraer información importante de fuentes,

como correos electrónicos, documentos PDF, formularios, archivos de texto, redes

sociales, códigos de barras e imágenes con la ayuda de herramientas de extracción de

contenido. Las herramientas y técnicas de extracción de datos adecuadas permiten que la

información atrapada dentro de sistemas dispares se estandarice y esté lista para

transformaciones posteriores, de modo que los equipos de ETL puedan extraer

información fácilmente de los datos.

Además, la extracción de datos y el uso de herramientas de extracción de datos en un

almacén de datos ofrece numerosos beneficios, que incluyen:

 Mejor análisis y toma de decisiones.

 Calidad de datos mejorada

 Mayor accesibilidad a los datos.

 Mejor eficiencia de los datos.

 Extracción de datos en tiempo real para análisis de macro datos.

Por otra parte. Los dos métodos de extracción de bases de datos más utilizados son:
 Extracción completa.

 Extracción incremental.

b. Técnicas de almacenamiento de datos

TECNICA CLASE DESCRIPCIÓN BENEFICIOS

Usa sistemas de software de gestión por extracción Usted elige el hardware que ejecutará los
para separar los datos del hardware antes de cambiar servicios de almacenamiento.
su formato y organizarlos para su uso en la red. En Es rentable.
Definido por particular, el SDS es útil para las cargas de trabajo de Puede unir varias fuentes de datos para
software contenedores y microservicios que utilizan datos sin diseñar su infraestructura de
A estructurar, ya que puede expandirse a un nivel que almacenamiento.
L las soluciones de almacenamiento conectadas El SDS se adapta automáticamente a medida
M simplemente no pueden alcanzar. que cambian sus necesidades de capacidad.
A
C Es la organización de los datos almacenados en cierto No es necesario que esté conectado a una
E lugar al que puede acceder cualquier persona que red interna (conocida como
N tenga los permisos adecuados, a través de Internet. almacenamiento adjunto a la red o NAS)
Almacenamiento
A Clases: No se necesita que acceda a los datos desde
en la nube
M a) Almacenamiento en bloques . un sistema de hardware conectado
I b) Almacenamiento de objetos. directamente a la computadora.
E c) Almacenamiento de archivos.
N Tecnología de almacenamiento dedicada a compartir Capacidad de ampliación
T la capacidad de almacenamiento de un Los clientes obtienen un mejor
O computador/ordenador (servidor) con computadoras rendimiento.
Almacenamiento
personales o servidores clientes a través de una red Configuración sencilla.
adjunto a la red
D (normalmente TCP/IP), haciendo uso de un sistema Mejor accesibilidad.
E operativo optimizado para dar acceso con los Tolerancia a los errores, a fin de garantizar la
protocolos CIFS, NFS, FTP o TFTP. integridad de los datos.
D
A Los datos almacenados en estos objetos no
El almacenamiento de objetos divide los datos en
T Almacenamiento están comprimidos ni cifrados, lo cual
unidades independientes y las combina con los
O de objetos permite que las cargas de trabajo que
metadatos para brindar contexto sobre su contenido.
S cambian rápidamente, como los
contenedores, accedan a ellos a gran escala.
Los usuarios pueden solicitarlos con
identificadores únicos, como el nombre, la
Almacenamiento Organiza los datos como archivos jerárquicos que los
ubicación o la URL.
de archivos usuarios pueden abrir y explorar en su totalidad.
Es el formato de almacenamiento legible
por el ojo humano más usado.

Tabla 1Técnicas de almacenamiento de datos

c. La minería de datos.
TECNICAS CLASIFICACIÓN CARACTERISTICAS EJEMPLOS
Regresión
Análisis de varianza y covarianza
Especifican el modelo para los datos en base a un
Series temporales
PREDICTIVAS conocimiento teórico previo. Enfocadas al
M Métodos bayesianos
descubrimiento.
I Algoritmos genéricos
N Clasificación ad hoc
D
E Los modelos se crean automáticamente partiendo del Clasificación ad hoc
A
R reconocimiento de patrones. No se supone la Asociación
T
I existencia de variables dependientes ni Dependencia
O DESCRIPTIVAS
A independientes, ni la existencia de un modelo previo Reducción de la dimensión
S
para los datos. Enfocadas enfocadas al Análisis exploratorio
D descubrimiento Escalamiento multidimensional
E Son herramientas de apoyo superficiales y limitadas.
Proceso analítico de transacciones OLAP
Métodos basados en técnicas estadísticas
TECNICAS AUXILIARES SQL y herramientas de consulta
descriptivas, consultas e informes enfocados a la
Reporting
verificación

Tabla 2 Minería de datos

Trabajo individual

1. Una matriz de conceptos; donde se evidencien los elementos determinantes el


procesamiento de datos vs la importancia y aplicabilidad de cada uno.
ELEMENTOS IMPORTANCIA APLICABILIDAD
Es el origen donde reposan los datos, existen fuentes
estructuradas y no estructuradas, se manejan según la
necesidad y se debe escoger la técnica adecuada para la Las fuentes de datos proporcionan diversidad en el
extracción según las características del origen y el resultado análisis de los datos por lo cual es importante para
FUENTES DE DATOS esperado. Se pueden presentar como archivos, bases de el proceso de toma de decisiones e inteligencia de
datos, información de terceros, su importancia radica en la negocios, contar con datos históricos diversos y de
variedad y cantidad de datos históricos que alojan, ya que calidad.
cada uno de estos nos puede brindar un conocimiento
especifico al final del análisis.
Bases de datos no normalizadas para el soporte de las
Proveen una plataforma solida de información
BODEGAS DE DATOS decisiones son manejadas por separado de las bases de datos
histórica consolidada útil para el análisis.
organizacionales, combinan diferentes fuentes de datos.

Mejor análisis y por ende mejor toma de decisiones.


Un buen software de extracción de documentos
permite a los usuarios extraer información
Mediante las herramientas ETL de consolidación de datos
significativa oculta dentro de fuentes de datos no
permiten a los usuarios de información romper los silos de
estructuradas.
datos, combinar datos de múltiples fuentes, convertirlos a un
Mejor calidad y mayor accesibilidad de datos.
formato consistente y cargarlos en un destino de destino.
extracción de datos en tiempo real, mejorando la
Implica la extracción de datos, que básicamente ayuda a
EXPLORACIÓN DE DATOS eficiencia.
extraer datos de fuentes estructuradas o no estructuradas.
Un software de extracción de datos inteligente
Las herramientas y técnicas de extracción de datos adecuadas
debería permitir a los usuarios exportar los datos
permiten que la información atrapada dentro de sistemas
convertidos a destinos populares, como SQL Server,
dispares se estandarice y esté lista para transformaciones
Oracle, PostgreSQL y varias herramientas de BI
posteriores,
como Tableau. Permiten a las empresas acceder a
información significativa más rápido para la toma
de decisiones oportuna.
Visualización de datos mediante graficas personalizadas
enfocadas en el problema para facilitar la toma de decisiones.
Visualizar información desde diferentes perspectiva
Se puede implementar la minería de datos proceso que se
amplia la visión de las oportunidades de mejora,
utiliza para buscar patrones, anomalías y correlaciones en sus
DESPLIEGUE DE DATOS brindando mejor conocimiento para la toma de
datos. Por lo tanto, una herramienta de minería de datos
decisiones. El análisis con datos depurados y con
permite a los usuarios analizar datos desde múltiples
gran variedad permite tener amplio conocimiento.
perspectivas para identificar patrones ocultos en grandes
conjuntos de datos.

Tabla 3 Matriz de conceptos

2. Una infografía sobre el análisis estadístico de la información, la minería de datos y


la inteligencia de negocios.

Ver archivo “Actividad 1 Infografía”

También podría gustarte