Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Actividad 1 Reconocimiento
Actividad 1 Reconocimiento
Presentado por:
Sindy Lorena Ortiz González
PROCESAMIENTO DE DATOS
Fundación Universitaria Compensar
Especialización en Big Data
11 de Octubre de 2021
Actividad
a. Técnicas de extracción
Por otra parte. Los dos métodos de extracción de bases de datos más utilizados son:
Extracción completa.
Extracción incremental.
Usa sistemas de software de gestión por extracción Usted elige el hardware que ejecutará los
para separar los datos del hardware antes de cambiar servicios de almacenamiento.
su formato y organizarlos para su uso en la red. En Es rentable.
Definido por particular, el SDS es útil para las cargas de trabajo de Puede unir varias fuentes de datos para
software contenedores y microservicios que utilizan datos sin diseñar su infraestructura de
A estructurar, ya que puede expandirse a un nivel que almacenamiento.
L las soluciones de almacenamiento conectadas El SDS se adapta automáticamente a medida
M simplemente no pueden alcanzar. que cambian sus necesidades de capacidad.
A
C Es la organización de los datos almacenados en cierto No es necesario que esté conectado a una
E lugar al que puede acceder cualquier persona que red interna (conocida como
N tenga los permisos adecuados, a través de Internet. almacenamiento adjunto a la red o NAS)
Almacenamiento
A Clases: No se necesita que acceda a los datos desde
en la nube
M a) Almacenamiento en bloques . un sistema de hardware conectado
I b) Almacenamiento de objetos. directamente a la computadora.
E c) Almacenamiento de archivos.
N Tecnología de almacenamiento dedicada a compartir Capacidad de ampliación
T la capacidad de almacenamiento de un Los clientes obtienen un mejor
O computador/ordenador (servidor) con computadoras rendimiento.
Almacenamiento
personales o servidores clientes a través de una red Configuración sencilla.
adjunto a la red
D (normalmente TCP/IP), haciendo uso de un sistema Mejor accesibilidad.
E operativo optimizado para dar acceso con los Tolerancia a los errores, a fin de garantizar la
protocolos CIFS, NFS, FTP o TFTP. integridad de los datos.
D
A Los datos almacenados en estos objetos no
El almacenamiento de objetos divide los datos en
T Almacenamiento están comprimidos ni cifrados, lo cual
unidades independientes y las combina con los
O de objetos permite que las cargas de trabajo que
metadatos para brindar contexto sobre su contenido.
S cambian rápidamente, como los
contenedores, accedan a ellos a gran escala.
Los usuarios pueden solicitarlos con
identificadores únicos, como el nombre, la
Almacenamiento Organiza los datos como archivos jerárquicos que los
ubicación o la URL.
de archivos usuarios pueden abrir y explorar en su totalidad.
Es el formato de almacenamiento legible
por el ojo humano más usado.
c. La minería de datos.
TECNICAS CLASIFICACIÓN CARACTERISTICAS EJEMPLOS
Regresión
Análisis de varianza y covarianza
Especifican el modelo para los datos en base a un
Series temporales
PREDICTIVAS conocimiento teórico previo. Enfocadas al
M Métodos bayesianos
descubrimiento.
I Algoritmos genéricos
N Clasificación ad hoc
D
E Los modelos se crean automáticamente partiendo del Clasificación ad hoc
A
R reconocimiento de patrones. No se supone la Asociación
T
I existencia de variables dependientes ni Dependencia
O DESCRIPTIVAS
A independientes, ni la existencia de un modelo previo Reducción de la dimensión
S
para los datos. Enfocadas enfocadas al Análisis exploratorio
D descubrimiento Escalamiento multidimensional
E Son herramientas de apoyo superficiales y limitadas.
Proceso analítico de transacciones OLAP
Métodos basados en técnicas estadísticas
TECNICAS AUXILIARES SQL y herramientas de consulta
descriptivas, consultas e informes enfocados a la
Reporting
verificación
Trabajo individual