Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Modalidad virtual
OBJETIVO:
DESCRIPCIÓN:
INTERNAL
DESARROLLO:
b. Antecedentes
Oracle Data Miner fue intoducido en 2002. Fue el sucesor del conjunto de
herramientas Darwin desarrollado por Thinking machines corporation, en la
decada de los noventas y distribuido por Oracle después de la adquisión de la
empresa en 1999. De igual manera, el producto es un rediseño completo de la
aplicación, mientras que Darwin era un workbench analítico basado en GUI,
ODM es toda una plataforma de desarrollo e implementación integrada en la
base de datos de Oracle.
c. Funciones
Funciones de minería de datos supervisadas:
Importancia de atributos. Identifica los atributos más importantes al
predecir un atributo.
Clasificación. Asigna items a clases discretas y predice la clase a la que
pertenece.
Regresión. Aproxima y prevee valores continuos.
Funciones no supervisadas:
INTERNAL
Detección de anomalías. Identifica outliers que noo satisfacen las
características de datos normales.
Reglas de asociación. Encuentra items que tienden a correlacionarse en
los datos y especifica las reglas que definen su correlación.
Clustering. Encuentra agrupaciones naturales en los datos.
Extracción de características. Crea nuevos atributos usando
combinaciones lineales de los atributos originales.
d. Componentes
Oracle Data Miner consiste en un servidor y uno o más clientes. ODM es el
cliente y es una característica integrada del Oracle SQL developer.
INTERNAL
Random forest
Máquinas de vector
Algoritmos no supervisados
Apriori
Decomposición de matriz CUR
Maximización de la expectativa
Análisis semántico explícito.
K-means
Factorización de matriz no negativa.
Máquinas de vector de una clase
Clustering por partición ortogonal
Análisis de descomposión de un valor y componente principal.
INTERNAL
j. Caso de Éxito (Descripción de uso exitoso de la herramienta por parte de los
usuarios o clientes)
no hay información al respecto que sea de dominio público
k. Ejemplo de alguna función de la herramienta (video que describa algún
proceso o tarea de Data Mining) –incluir enlace al video-
INTERNAL
RapidMiner
1. Investigar los siguintes aspectos sobre las herramientas de Data Mining:
a. Características
Análisis de datos automatizado
Flujo de trabajo analítico y visual
Ciencia de datos basado en código
Manejo de datos en tiempo real
b. Antecedentes
Rapidminer nace de un proyecto de ciencia de datos en la universidad de
Dortmund en Alemania, por alf Klinkenberg, Ingo Mierswa, y Simon Fischer en la
unidad de inteligencia artificial de su universidad.
c. Funciones
ETL
Procesamiento de datos
Visualización de datos
Análisis predictivo
Modelos estadísticos
Evaluación de modelos
d. Componentes
Usa un modelo de cliente, servidor. RapidMiner provee de una solución de
análisis avanzado a traves de frameworks basados en plantillas, lo que acelera
la velocidad de entrega y reduce los errores ya que casi elimina la necesidad de
escribir código.
e. Modelos y técnicas de Data Mining
Naive Bayes
Modelo linear generalizado
Regresión logística
Deep learning
Árboles de decisión
Random Forest
INTERNAL
Gradient Boosted trees
Support Vector Machine
INTERNAL
1. Investigar los siguintes aspectos sobre las herramientas de Data Mining:
a. Características
Soperte a diversas fuentes de datos
Implementación sencilla de modelos
Preparación automática de datos
Modelado automático
Flujos de análisis visuales
Análisis de textos
Metodos de machine learning
b. Antecedentes
Las primeras versiones del software se llamaban Clementine y estaban basadas
en UNIX. La primera versión de este software se liberó en 1994. Fue
desarrollado por una compañía británica llamada Integral Solutions Limited en
colaboración con investigadores de la universidad se Sussex. En 1998 ISL es
adquirido por SPSS Inc. Quien lo vió con potencial paraser una herramienta de
minería de datos. La versión 14.0 de IBM SPSS Modeler fue la primera versión
lanzada por IBM en el 2010.
c. Funciones
d. Componentes
La interfaz gráfica de IBM está basada en nodos y flujos. Nodos son los íconoc
que representan opraciones en los datos. Los nodos están conectados en un
flujo que representa el movimiento de los datos a través de cada operación. Los
algoritmos son representados como un tipo especial de nodo llamado nodo de
modelado.
e. Modelos y técnicas de Data Mining
ARMA
ARIMA
Suavizado exponencial
Detección de valores atípicos.
Modelado causa temporal
INTERNAL
Máquina de vectores
Series de tiempo
Predicción espacio-temporal
Redes de confrontación generativa
INTERNAL
k. Ejemplo de alguna función de la herramienta (video que describa algún
proceso o tarea de Data Mining) –incluir enlace al video-
CONCLUSIONES:
La minería de datos es una de las tecnologías con más potencial para los años
siguientes, sus diversos usos y aplicaciones son de gran ayuda para la industria
y la investigación.
BIBLIOGRAFIA:
Mena, C. D. (2014, 6 agosto). Minería de datos: información precisa y relevante. Forbes
México. https://www.forbes.com.mx/mineria-de-datos-informacion-precisa-y-
relevante/#:%7E:text=La%20miner%C3%ADa%20de%20datos%20es%20el%20
proceso%20de,an%C3%A1lisis%20matem%C3%A1tico%20para%20deducir%2
0las%20tendencias%20que%20existen.
INTERNAL