Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Los datos que pueden ser minados se puede aplicar a cualquier tipo: bases de datos,
dbms, base de datos relacional.
Tipos de modelos:
Un modelo predictivo: se entrena (estima) un modelo usando los datos
recolectados para hacer predicciones futuras. Nunca es 100% precisa y lo que
más importa es el rendimiento del modelo cuando es aplicado a nuevos datos.
Un modelo descriptivo sirve para identificar patrones que permiten explorar las
propiedades de los datos examinados no para predecir sino para describir
futuros datos. Este modelo permite descubrir las características más
importantes de la BD.
Data warehouse: usualmente son modelados bajo una estructura de datos
multidimensional llamada cubo de datos, en donde cada dimensión corresponde a un
atributo o conjunto de ellos y cada celda almacena valores.
BD transaccional: Base de datos transaccionales registran el día a día de un
proceso o de una compañía.
Patrones que pueden ser minados.
Descriptivos: Representan propiedades de un conjunto de datos específico.
Predictivos: Desarrollan inducciones con los datos actuales para realizar predicciones
de comportamientos
Preparación de entradas: consumen la mayor parte del esfuerzo, reúnen los datos,
identificar que grado de agregación es apropiado (nivel de cliente, si será mensual o
trimestral, etc.).
Para los datos sesgados (asimétricos), una mejor medida del centro de los datos es la
mediana, que es el valor medio en un conjunto de valores de datos ordenados, sin
embargo, está más enfocada en los datos o atributos ordinales.
El rango del conjunto es la diferencia entre el valor más grande (max) y el más pequeño
(min), mientras que Los cuartiles son puntos tomados a intervalos regulares de una
distribución de datos, dividiéndola en conjuntos consecutivos que en esencia sean
iguales