Está en la página 1de 8

1/12/22, 12:37 Data Mining.

Principios y aplicaciones

Glosario
A
Algoritmo
Conjunto ordenado de operaciones de forma sistemática que permiten hacer un cálculo y hallar la solución de un tipo
de problema.
Análisis descriptivo
Es un análisis en el que se pretende encontrar patrones o relaciones entre los datos que definan una situación tal y
como es sin llegar a definir situaciones probables o futuras.
Análisis predictivo
Es un proceso mediante el cual se utiliza el análisis de datos para realizar predicciones basadas en estos. En este
proceso se hace uso de los datos junto con técnicas analíticas, que normalmente son estadísticas y de aprendizaje
automático para crear un modelo predictivo para predecir una serie de eventos futuros.
Analista de datos
Es la persona encargada de extraer, limpiar, analizar y limpiar los datos que se encuentren almacenados en un lugar
determinado. La información obtenida la trasladará junto con el contexto social pertinente a las personas interesadas.
Analítica de datos
Es la ciencia que examina datos en bruto con el propósito de sacar conclusiones sobre la información.
Aprendizaje automático
Es un campo perteneciente a las ciencias de la computación y una rama de la inteligencia artificial que tiene como
objetivo desarrollar técnicas que permitan que las computadoras aprendan de forma automática.
Aprendizaje inductivo
Es un proceso de aprendizaje donde el interesado en aprender realiza un procedimiento que comienza con la
observación y el análisis de características concretas para luego crear reglas que expliquen las características.
https://campusvirtual.ibecon.org/mod/scorm/player.php?a=2311&currentorg=ORG-479FB91EAC78D7C4D9B3163034DB7907&scoid=23878&sesskey=t0R46zDZRw&display=popup&mode=normal 1/8
1/12/22, 12:37 Data Mining. Principios y aplicaciones

Atributo
En el contexto de almacén de datos en tablas, son cada uno de los campos o variables (columnas) contenidas en un
conjunto de datos que definen características de una observación (fila).

B
Base de datos ad hoc
En el contexto de Data Mining es una base de datos destinada específicamente para los datos que se van a trabajar
durante el proceso de Data Mining.
Base de datos
Se define como un sistema formado por un conjunto de datos almacenados en dispositivos que permiten el acceso a
ellos y el conjunto de programas que manipulan ese conjunto de datos.
Big Data
Big Data o macrodatos, se define como un conjunto de datos de un tamaño tan grande que van a superar la capacidad
del software existente para poder ser capturados, gestionados y procesados. Estos conjuntos de datos se caracterizan
por los conceptos de volumen, velocidad y variedad. 

C
Centroide
En clustering un centroide representa aquel punto que hace mínimas las sumas de cada una de las similitudes de los
elementos, es decir, el punto donde la suma total de las distancias entre este y cada ítem es la menor.
Clave foránea
Una clave foránea o clave ajena identifica una columna o grupo de columnas de una tabla que se considera tabla hija
referida a otra columna o columnas de otra tabla considerada tabla maestra, en donde esta clave estará definida como
clave principal. Es una forma de relacionar dos tablas mediante un atributo de enlace.
Clave principal

https://campusvirtual.ibecon.org/mod/scorm/player.php?a=2311&currentorg=ORG-479FB91EAC78D7C4D9B3163034DB7907&scoid=23878&sesskey=t0R46zDZRw&display=popup&mode=normal 2/8
1/12/22, 12:37 Data Mining. Principios y aplicaciones

En el diseño de bases de datos de tipo relacional, una clave principal es un campo o combinación de campos que
identifican de forma única a cada fila de una tabla. No podrán existir dos filas con una misma clave.
Clúster
En minería de datos, es un conjunto de datos agrupados que contienen características comunes entre ellos.
Clustering
Proceso analítico de tipo exploratorio mediante el cual se segmentan o agrupan los datos en clústeres o grupos con
características comunes o relaciones entre ellos.
CRISP-DM
Es una guía de referencia o metodología estandarizada que define los pasos a seguir en la implementación de un
proyecto de Data Mining. Está compuesta por seis fases sucesivas que recorren horizontalmente todo el proceso de DM
divididas en tareas y actividades.
Customer Relationship Mangement (CRM)
Es un mecanismo que gestiona las relaciones de la organización con los clientes. Se gestionan normalmente tres áreas
básicas: la gestión comercial, el marketing y el servicio de atención al cliente.

D
Data Warehouse
Es la base de datos central de una organización, de gran tamaño y que a veces se presenta en forma distribuida si el
volumen de almacenamiento es demasiado grande. En él se recogen todos los datos pertenecientes a todas las áreas
de una organización.
Dataset
Es el conjunto de datos que se obtiene en la fase de preparación de datos y que es usado para el trabajo de análisis del
proyecto. Normalmente se creará un Dataset para cada uno de los objetivos de Data Mining.
Datos de entrenamiento
Conjunto de datos que se utilizarán para crear el modelo predictivo de Data Mining. Normalmente debe ser entre el 60 %
y el 80 % del Dataset.
https://campusvirtual.ibecon.org/mod/scorm/player.php?a=2311&currentorg=ORG-479FB91EAC78D7C4D9B3163034DB7907&scoid=23878&sesskey=t0R46zDZRw&display=popup&mode=normal 3/8
1/12/22, 12:37 Data Mining. Principios y aplicaciones

Datos de prueba
Es el conjunto de datos que se utilizará para realizar las pruebas de precisión del modelo predictivo creado con los
datos de entrenamiento.

E
Estadística
Es la rama de la matemática que utiliza grandes conjuntos de datos numéricos para el cálculo de probabilidades.
Etiqueta de clase
Es un valor nominal mediante el cual cada elemento queda definido dentro de una determinada clase.

F
Formato
Es el estándar que define la forma en que la información está codificada en un archivo informático.

G
Gestión de datos
Realizar operaciones con los datos para obtener valor de ellos.

H
Hardware
Conjunto de aparatos físicos que componen una computadora.

I
Implementación
Poner en funcionamiento una cosa o llevar a cabo alguna acción determinada.
https://campusvirtual.ibecon.org/mod/scorm/player.php?a=2311&currentorg=ORG-479FB91EAC78D7C4D9B3163034DB7907&scoid=23878&sesskey=t0R46zDZRw&display=popup&mode=normal 4/8
1/12/22, 12:37 Data Mining. Principios y aplicaciones

Inteligencia artificial
Disciplina científica que se ocupa de crear programas informáticos que son capaces de ejecutar operaciones
comparables a las que realiza la mente humana, como el aprendizaje o el razonamiento lógico.
Internet
Red informática mundial y descentralizada, formada por la conexión directa entre computadoras mediante un protocolo
de comunicación.

K
Knowledge Discovery in Databases (KDD)
Es el proceso mediante el cual se realiza el proceso de descubrimiento de conocimiento en bases de datos. En este
proceso uno de los pasos es la propia minería de datos.

L
Lenguaje de programación
Es un lenguaje escrito y formado por un conjunto de reglas que es capaz de especificar diferentes instrucciones
comprensibles para una máquina. Mediante estos lenguajes se escriben programas que pueden controlar el
comportamiento físico y lógico de una máquina y dotarla de funcionalidad y de cierta inteligencia. Cada uno de los
lenguajes existentes contiene unas reglas diferentes y una estructura propia y, además, están orientados a objetivos
distintos, interfaces gráficas, operaciones matemáticas, etc.

M
Marketing
También llamado mercadotecnia, es un conjunto de principios y prácticas que buscan el aumento de ventas y la mejora
del comercio entre consumidores y empresas.
Microsoft SQL Server
Es un sistema para el manejo de bases de datos relacionales desarrollado por Microsoft.

https://campusvirtual.ibecon.org/mod/scorm/player.php?a=2311&currentorg=ORG-479FB91EAC78D7C4D9B3163034DB7907&scoid=23878&sesskey=t0R46zDZRw&display=popup&mode=normal 5/8
1/12/22, 12:37 Data Mining. Principios y aplicaciones

Modelo de base de datos


Es un modelo que determina la estructura lógica de una base de datos, por lo que determina el modo de almacenar,
organizar y manipular los datos.
Modelo de Data Mining
Estructura lógica que, una vez creada, es capaz de trabajar de forma autónoma con conjuntos de datos y extraer
conocimiento.

P
Patrón
Son estructuras de datos que se repiten de forma recurrente.
Plan de mantenimiento
Es un conjunto de tareas de supervisión que se realizan de forma programada, agrupadas o no, siguiendo algún tipo de
criterio, y que incluye una serie de equipos.
Procesado de datos
Es la acumulación y la manipulación de datos para producir información útil.

R
Ruido de datos
Representan los datos no deseados almacenados en una base de datos. Estos datos contendrán espacios vacíos,
valores incorrectos o datos redundantes.

S
SEMMA
Es el acrónimo de Sample, Explore, Modify, Model, and Assess. Es una metodología de implantación para proyecto DM
que se centra en mayor medida en el desarrollo de un modelo DM desde el punto de vista estadístico en cuanto a
definir sus características.
https://campusvirtual.ibecon.org/mod/scorm/player.php?a=2311&currentorg=ORG-479FB91EAC78D7C4D9B3163034DB7907&scoid=23878&sesskey=t0R46zDZRw&display=popup&mode=normal 6/8
1/12/22, 12:37 Data Mining. Principios y aplicaciones

Software libre
Son los programas que dan libertad a los usuarios para mejorarlos, utilizarlos, distribuirlos y ejecutarlos sin necesidad de
pagar para ello.
Software
Son el conjunto de programas que permiten a una computadora realizar tareas.
SQL
SQL o Structured Query Language (en español, “lenguaje de consulta estructurada), es un lenguaje desarrollado por IBM
para el acceso y consulta de bases de datos relacionales y con ello extraer información y, además, modificarla.

T
Técnica de análisis
Proceso que sirve para determinar si existe una relación entre varios elementos de forma que genere algo nuevo o
desconocido hasta el momento.
Text Mining
Text Mining o Minería de textos, es el proceso de minería de datos por el que se analizan bloques de textos para
encontrar información nueva a partir de su contenido.
Tiempo real
Tiempo real o SRT es la capacidad que tiene un sistema digital para interactuar activamente con el entorno en vivo o en
el mismo instante.

V
Variable cualitativa
Son las variables cuyos valores se refieren a características o cualidades que no pueden ser medidas con números.
Variable cuantitativa
Son las variables que tienen valores numéricos.
https://campusvirtual.ibecon.org/mod/scorm/player.php?a=2311&currentorg=ORG-479FB91EAC78D7C4D9B3163034DB7907&scoid=23878&sesskey=t0R46zDZRw&display=popup&mode=normal 7/8
1/12/22, 12:37 Data Mining. Principios y aplicaciones

Ventaja competitiva
Es cualquier característica de una organización que la diferencia de otras, colocándola en una posición relativa superior
para competir.

https://campusvirtual.ibecon.org/mod/scorm/player.php?a=2311&currentorg=ORG-479FB91EAC78D7C4D9B3163034DB7907&scoid=23878&sesskey=t0R46zDZRw&display=popup&mode=normal 8/8

También podría gustarte