Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Ingeniera en Informática
22/08/2019
Los datos en IDA.
Tipos de datos
Estructurados
1. Cuantitativos
2. Cualitativos
3. Simbólicos
4. Ordenados jerárquicamente
Bloques de datos binarios
1. Imágenes
2. Sonido
No Estructurados
1. Textos
Hoy en día, los datos no están restringidos a tuplas representadas únicamente con números
o caracteres. El avance de la tecnología para la gestión de bases de datos hace posible
integrar diferentes tipos de datos, tales como imagen, video, texto, y otros datos
numéricos, en una base de datos sencilla, facilitando el procesamiento multimedia. Como
resultado, la mezcla tradicional ad hoc de técnicas estadísticas y herramientas de gestión
de datos no son adecuadas por más tiempo para analizar esta vasta colección de datos
desiguales.
LIMPIEZA DE DATOS
Limpieza de Datos
• Resuelve redundancias
Proceso de limpieza
Posibles errores:
Soluciones:
VISUALIZACION
Como todo proceso, la minería de datos también se lleva a cabo en distintas fases, y
como sucede en la minería tradicional, también existen varias técnicas de extracción (en
nuestro caso, para extraer esa información considerada relevante para el negocio y
mostrarla de un modo comprensible).
Los pasos que incluye cualquier proceso de data mining empiezan con una selección de
los datos a tratar en función de variables de predicción y cálculo, es decir, de un
conjunto de variables objetivas y otro de variables independientes: las primeras son las
que guían la elección en función de los objetivos que se persiguen con el análisis, y las
segundas determinan de qué modo se llevará a cabo el proceso.
Técnicamente, el ACP busca la proyección según la cual los datos queden mejor
representados en términos de mínimos cuadrados. Esta convierte un conjunto de
observaciones de variables posiblemente correlacionadas en un conjunto de valores de
variables sin correlación lineal llamadas componentes principales.
El ACP se emplea sobre todo en análisis exploratorio de datos y para construir modelos
predictivos. El ACP comporta el cálculo de la descomposición en autovalores de la
matriz de covarianza, normalmente tras centrar los datos en la media de cada atributo.
Debe diferenciarse del análisis factorial con el que tiene similaridades formales y en el
cual puede ser utilizado como un método de aproximación para la extracción de
factores.
Cambios de escala.
Modelo: Consiste en una estructura en gran escala que resume las relaciones sobre
muchos casos
Patrón: Consiste en una estructura local satisfecha por algunos pocos casos o una
pequeña región del espacio de los datos.
(QuestionPro, s.f.)
(Wikipedia, 2019)
Referencias
QuestionPro. (s.f.). QuestionPro. Obtenido de https://www.questionpro.com/es/analisis-de-
datos.html
Universidad privada telesup. (s.f.). escuela privada telesup. Obtenido de
https://escueladeposgrado.edu.pe/blog/analisis-inteligente-de-datos/