Está en la página 1de 7

Nombre del estudiante: Danira Patricia Hernández Coronado.

Nombre del trabajo: Glosario, Minería de datos

Asignatura: Analítica y Minería de Datos

Fecha de entrega: 05/06/2022.

Campus: Nogales, Son.

Posgrado: Maestría en mercadotecnia.

Nombre del maestro: José Rubén Román Ortiz.


Introducción

El minado de datos es un conjunto de técnicas y tecnologías que permiten explorar


grandes bases de datos, de manera automática o semiautomática, con el objetivo de
encontrar patrones repetitivos que expliquen el comportamiento de estos datos.

La minería de datos surgió con la intención o el objetivo de ayudar a comprender una


enorme cantidad de datos y que estos pudieran ser utilizados para extraer conclusiones
para contribuir en la mejora y el crecimiento de las empresas. Sobre todo, por lo que
hace a las ventas o fidelización de clientes.

En el presente documento se abordará un glosaría sobre este tema.

1 | Página
Algoritmo

En Ciencias de la Computación, un algoritmo es una secuencia lógica, finita y con


instrucciones que forman una fórmula matemática o estadística para realizar el análisis
de datos.

Analytics

Es la forma de capturar informaciones, procesarlas y analizarlas para que se conviertan


en insights.

Big Data

Big Data es la expresión utilizada para designar un conjunto de datos tan grande que
es difícil trabajar con los medios habituales (bases de datos). Se suele decir que el Big
Data responde a las tres V: volumen de datos importante, variedad de datos, velocidad
a la que llegan.

Blaze

Blaze es una interfaz para consultar datos en diferentes sistemas de almacenamiento.


Se le conoce también como una librería de Python (lenguaje de programación) que
ayuda a almacenar, describir, consultar y procesar datos.

Business Inteligence

Es la forma con la que se trabajan todos los datos que puede manejar un negocio pero
de forma inteligente. Es decir, no se trata sólo de manejar datos sino de trabajar a partir
de la información que los datos aportan y aprovecharla para mejorar las estrategias de
negocio

2 | Página
Ciencia de datos

Son métodos científicos en los que se utilizan algoritmos, estadísticas, procesos,


sistemas, ingeniería software para obtener conocimiento, resolver problemas analíticos
y tener un mejor entendimiento de la información.

Cluster

Se refiere a datos desconocidos que pueden perderse o almacenarse, sin la posibilidad


de accederse o analizarse en caso de que el sistema no esté configurado para eso.

Dark Data

Se refiere a datos desconocidos que pueden perderse o almacenarse, sin la posibilidad


de accederse o analizarse en caso de que el sistema no esté configurado para eso.

Data Lake

Es un lago de datos en el cual se almacenan informaciones en su estado natural y en


gran volumen, es allí donde el Data Scientist debe sumergirse para encontrar sus
principales insights.

Datos estructurados y no estructurados

Los datos estructurados tienen una organización lógica, pero con posibilidades
pequeñas de extracción de informaciones para el Big Data. Los no estructurados son
desorganizados, como los mensajes en emails y redes sociales, pero permiten una
gran posibilidad de extracción de insights comerciales.

3 | Página
Dirty Data

Registros que no se han limpiado. Datos que se capturaron, almacenaron y que se


usarán, pero que precisan ser primeramente trabajados.

Fast Data

Datos que pierden valor a lo largo del tiempo y que por ese motivo necesitan ser
analizados prácticamente en tiempo real para que generen respuestas estratégicas
para las empresas que necesitan dar respuestas y tomar decisiones de forma
instantánea.

Geomarketing

Se trata de un sistema integrado de información de datos de diversa índole, métodos


estadísticos y representaciones gráficas orientados a dar respuestas a cuestiones de
marketing de forma rápida y sencilla.

Indicador Lift

Según define la unidad de datos de telefónica “Luca”, en la minería de datos y el


aprendizaje automático este indicador de confianza “compara la frecuencia de un
patrón observado con la frecuencia en que podríamos ver ese mismo patrón por
casualidad”.

Lingüística computacional

4 | Página
en las ciencias de la computación, la lingüística computacional estudia el idioma
hablado para convertirlo en datos estructurados mediante herramientas
computacionales.

NoSQL

Son sitemas de gestión de bases de datos y estructuras que permiten almacenar


información cuando las bases de datos relacionales dan problemas.

Python

Es un lenguaje de programación multiparadigma que se utiliza en la ciencia de datos.


Python se utiliza para denominar a las librerías especializadas en automatic learning y
generación de gráficos.

Sentiment Analytics

El análisis de sentimientos o minería de opinión es el proceso automatizado de


comprender una opinión sobre un tema dado del lenguaje escrito o hablado.

Small Data

Son los análisis de datos que se realizan sobre cantidades menores a las consideradas
como Big Data.

Weka

5 | Página
Es una colección de algoritmos de aprendizaje automático para tareas de minería de
datos. Contiene herramientas para la preparación de datos, clasificación, regresión,
agrupación, extracción de reglas de asociación y visualización.

6 | Página

También podría gustarte