Está en la página 1de 8

INSTITUTO TECNOLÓGICO DE ORIZABA.

MAESTRÍA EN INGENIERÍA ADMINISTRATIVA.

ALUMNO:
Irene Valencia Lagunes.

MATERIA:
Fundamentos de ingeniería administrativa.
PROFESOR:
Dr. Fernando Aguirre y Hernández

ARTÍCULO:
MINERÍA DE DATOS.
FECHA:
14 de Abril del 2021.
Resumen
Hoy en día estamos viviendo una revolución digital, en donde las empresas realizan todas sus
operaciones de manera electrónica, procesando y almacenando una enorme cantidad de información,
constituyendo una estructura fundamental para las mismas.
Las bases de datos permiten almacenar cada operación realizada en las empresas, así como la
interacción con otras empresas, proveedores y clientes. Es por ello que es esencial transformar toda
esa información existente en conocimiento, para que sea posteriormente analizada y utilizada en la
toma de decisiones. De nada le sirve a una empresa tener una enorme cantidad de datos, si éstos no
se analizan.
En el presente artículo se presenta una descripción general de la minería de datos, el proceso, las
tareas y los métodos empleados para llevarla a cabo.

Abstract
Today we are experiencing a digital revolution, where companies carry out all their operations
electronically, processing and storing an enormous amount of information, constituting a fundamental
structure for them.
The databases allow to store each operation carried out in the companies, as well as the interaction
with other companies, suppliers and customers. That is why it is essential to transform all that existing
information into knowledge, so that it is subsequently analyzed and used in decision-making. It is
useless for a company to have an enormous amount of data, if it is not analyzed.
This article presents an overview of data mining, the process, tasks and methods used to carry it out.

Introducción
Hoy en día estamos viviendo una revolución digital, en donde las empresas realizan todas sus
operaciones de manera electrónica, procesando y almacenando una enorme cantidad de información,
constituyendo una estructura fundamental para las mismas.
Las bases de datos permiten almacenar cada operación realizada en las empresas, así como la
interacción con otras empresas, proveedores y clientes. Es por ello que es esencial transformar toda
esa información existente en conocimiento, para que sea posteriormente analizada y utilizada en la
toma de decisiones. De nada le sirve a una empresa tener una enorme cantidad de datos, si éstos no
se analizan.
Descubrir conocimientos de una enorme cantidad de datos, representa un gran reto para la empresas.
En el presente artículo se presenta una descripción general de la minería de datos y de opiniones y
sentimientos.
La minería de datos es un conjunto de técnicas agrupadas con el objetivo de crear mecanismos aptos
de dirección, entre ellos podemos encontrar la estadística, el reconomiento de patrones, así como la
clasificación y la predicción. [1]
El autor Pérez Márquez la define como “conjunto de técnicas orientadas al descubrimiento de la
información contenida en grandes conjuntos de datos. Analizando comportamientos, patrones,
tendencias, asociaciones y otras características del conocimiento inmerso en datos.” [2]
Esta herramienta tecnológica ha sido de gran ayuda para diversas áreas como medicina,
telecomunicaciones, ingeniería, comercio, marketing, etc.
En la actualidad una enorme cantidad de empresas están llevando a cabo proyectos de minería de
datos con el objetivo de desarrollar estrategias con el análisis de la información obtenida.
Por otro lado tenemos a la minería de opiniones y sentimientos, la cual se define como una
herramienta que aplica técnicas de procesamiento de lenguaje humano sumando a éste el lenguaje
computacional y la utilización de técnicas de minería de textos con el objetivo de descubrir información
relativa en base a la información generada por las opiniones de usuarios, respecto a algunos
productos, dicha información es publicada en diferentes páginas de internet y muy valiosa para las
empresas, debido a que les permite generar conocimiento y de acuerdo a éste tomar decisiones.

Proceso del descubrimiento de conocimiento en bases de datos.


El hallazgo de conocimiento en bases de datos, podemos definirlo como un proceso en el cual se
logran identificar patrones significativos en los datos que sean útiles de acuerdo a un fin establecido.
El proceso global para la extracción del conocimiento se logra transformando información de bajo nivel
en conocimiento de alto nivel.
A continuación se presentan los pasos para llevar a cabo la extracción de conocimiento aplicando la
herramienta de minería de datos:
Paso 1: conocer el dominio de aplicación, es decir qué tipo de datos se van a analizar.
Paso 2: Extracción de la base de datos a analizar, evaluando la calidad de los mismos mediante un
análisis exploratorio.
Paso 3: Preparación de los datos, ésta actividad incluye la transformación, integración y la reducción
de los datos. El objetivo es mejorar la calidad de los datos disminuyendo también el tiempo requerido
para las operaciones del algoritmo.
Paso 4: Una vez que los datos se encuentran listos en esta etapa se lleva a cabo la minería de datos,
esta es la fase más importante del proceso, en este paso ocurren ciertas funciones que más adelante
detallaremos, por mencionar algunas tenemos a la clasificación, regresión, clustering y resumen.
Paso 5: En este paso se lleva a cabo la explicación de los patrones encontrados y se logran visualizar.
Paso 6: En este último paso se hace uso del conocimiento descubierto, así como del modelo creado.
[3]
Proceso de minería de datos
El proceso de minería de datos involucra el ajuste de modelos o la determinación de patrones a partir
de los datos obtenidos. Dicho ajuste es de tipo estadístico normalmente, es decir que permite un cierto
grado de error o ruido.
Los pasos a seguir para la ejecución de un proyecto de minería de datos son normalmente los
mismos, independientemente de la técnica de extracción de conocimiento empleada.
A continuación se presenta la visión general del proceso de minería de datos y una breve descripción de cada
etapa:

En la primera etapa se inicia con la selección de los datos que se desean emplear para la minería de
datos.
En la segunda etapa los datos en bruto son preprocesados, es decir los datos son filtrados, logrando
con ello eliminar valores erróneos o desconocidos; de acuerdo a las necesidades y algoritmo a
emplear. Al final se logra obtener muestras de los mismos o se reduce el número de valores posibles.
En la tercera etapa tenemos la selección de características, la cual consiste en reducir el tamaño de
los datos, eligiendo variables más influyentes en el problema, sin sacrificar la calidad del modelo de
conocimiento obtenido. Existen básicamente dos métodos para la selección de características: Los
que se basan en la selección de los mejores atributos del problema y los que buscan variables
independientes por medio de test de sensibilidad, algoritmos de distancia o heurísticos.
En la cuarta etapa se lleva a cabo la minería de datos, obteniendo en sí un modelo de conocimiento,
que representa patrones de comportamiento, que se observan en los valores de las variables del
problema o relaciones de asociación entre las variables.
En la quinta y última etapa se lleva a cabo la validación comprobando que las conclusiones que se
obtienen sean válidas y satisfactorias.

Principales tareas de la minería de datos


La minería de datos involucra determinar patrones a partir de datos. Este proceso es de tipo
estadístico, debido a que permite un cierto grado de error.
A continuación se muestran algunas tareas realizadas por los algoritmos de minería de datos. Dichas
tareas se clasifican en tareas de predicción, que se llevan a cabo cuando no se conocen los datos, o
de descripción, que se refieren a patrones ya conocidos.
Agrupamiento o identificación de clases. En esta tarea se busca realizar la identificación
de un conjunto de categorías para describir los
datos. Ejemplo de ello puede ser una
subpoblación homogénea de consumidores en
una base de datos de mercados.
Clasificación Habilidad para adquirir una función que
clasifique un elemento de un dato a una de
varias clases ya predefinidas.
Condensación Consiste en hallar un método que permita
descubrir una descripción compacta de un
subconjunto de datos.
Detección de desviaciones Esta tarea tiene el objetivo de detectar cambios
significativos en los datos respecto a valores
pasados o normales, determinando con ello
cuando una desviación es significativa.
Modelado de dependencias. Se basa en encontrar un modelo que describa
las dependencias significantes entre las
variables.
Regresión Se refiere a adquirir una función que logre
mapear un elemento de dato a una variable de
predicción de un valor real.

Métodos de minería de datos


La meta de los métodos en la minería de datos se centra en predecir datos desconocidos y la
descripción de patrones.
Se pueden utilizar diversos criterios de clasificación de sistemas de minería de datos.
En base al objetivo para el cual es realizado el aprendizaje, podemos distinguir los siguientes
sistemas:
Clasificación: Los datos se clasifican en clases predefinidas.
Regresión: Los datos se convierten en valores de una función de predicción.
Agrupamiento de conceptos: Se realiza una búsqueda de conceptos para agrupar los datos.
Compactación: Búsqueda de descripciones más compactas de los datos.
Modelado de dependencias: Existe dependencia entre las variables de los datos.
Detección de desviaciones: Se lleva a cabo la búsqueda de desviaciones en los datos respecto a
valores anteriores.
A continuación se describen brevemente los distintos métodos de representación del conocimiento
empleados en la minería de datos.
Agrupamiento (clustering)
Esta herramienta empleada también es llamada segmentación y permite la identificación de tipologías
o grupos en donde los elementos guardan cierta similitud o diferencia entre sí. Se basa en técnicas
estadísticas empleando algoritmos matemáticos, de generación de reglas y de redes neuronales para
el tratamiento de registros.
Asociación.
Esta herramienta constituye las posibles relaciones o correlaciones existentes entre diferentes
acciones independientes, logrando identificar la manera en cómo la ocurrencia de un suceso puede
inducir la aparición de otro.
Secuenciamiento.
Esta herramienta posibilita la identificación de que la ocurrencia de una acción desencadena otras.
Reconocimiento de patrones.
Esta herramienta permite la asociación de una señal de información de entrada con otra con la que
guarda mayor similitud. Dichas herramienta son empleadas por elementos habituales como un
procesador de texto o un despertador.
Previsión.
Esta herramienta permite establecer el comportamiento futuro más probable dependiendo de la evolución
pasada y presente. Tiene un uso fundamental en el tratamiento de series temporales y las técnicas asociadas
disponen de una importante madurez.

Simulación.
Esta herramienta forma parte de un conjunto de herramientas veteranas en la investigación
científica.Un ejemplo son las herramientas de diseño y producción asistidas por ordenador CAD, CAM,
en las que se revisa el diseño sometiéndoles una amplia serie de condiciones reales normales y
extremas.
Optimización.
Esta herramienta es muy utilizada en la resolución de problemas asociados a la logística de
distribución y la gestión de stock en un negocio.
Clasificación
Esta herramienta agrupa las herramientas que permiten asignar a un elemento la pertenencia a un
grupo o clase. Las herramientas de Clasificación hacen uso de técnicas como algoritmos matemáticos,
análisis discriminante y de variaciones, sistemas expertos y sistemas de conocimiento e inducción de
reglas.
Conclusión
La Minería de datos se considera una herramienta tecnológica de gran apoyo para las empresas,
debido a que implementándola se puede explorar, analizar y aplicar el conocimiento obtenido por
medio de grandes volúmenes de datos, descubriendo patrones que apoyen identificando estructuras
en los datos.
El lograr convertir datos en información y que a su vez esta información se convierta en conocimiento
y ayude en la tome de decisiones en las empresas es un gran reto que tienen los gerentes.
La base de las nuevas tendencias en los negocios es el conocimiento y es a partir de la minería de
datos que el manejo de la información se puede lograr. La aplicación de dichas herramientas ha
permitido que en la actualidad se lleve a cabo el surgimiento de nuevas oportunidades de negocio.

Propuesta de tesis
Aplicación de minería de datos para determinar patrones de consumo en adolescentes en el estado
de Veracruz.
Objetivo
Realizar un encuesta on line para jóvenes entre 12 y 17 años y difundirla por medio de redes sociales
con el objetivo de lograr identificar sus patrones de consumo.

Agradecimientos
Agradezco el apoyo y las facilidades otorgadas por el Instituto Tecnológico de Orizaba en especial al
área de posgrado de la maestría en Ingeniería Administrativa.
Agradezco al Consejo Nacional de Ciencia y Tecnología por su apoyo económico para la realización
de esta meta planteada, sin duda alguna sin su apoyo no estaría estudiando esta maestría.
Agradezco al Dr. Fernando Aguirre y Hernández, por impartir de manera excepcional sus
conocimientos y plantearme nuevos retos que sin duda me están ayudando a desarrollar nuevas
habilidades que me servirán de mucho en mi vida profesional.
Finalmente agradezco el apoyo de mi familia, quienes siempre han confiado en mí y me han
demostrado su amor incondicional.
Bibliografía

[1] Y. Rodríguez Suárez y A. Díaz Amador, «Herramientas de mineria de datos,» Revista cubana de
ciencias informaticas, vol. 3, nº 3-4, pp. 73-80, 2009.

[2] M. M. Pérez, Minería de datos a traves de ejemplos, Madrid: RC libros, 2014.

[3] J. Riquelme, R. Ruiz y K. Gilbert, «Minería de Datos: Conceptos y Tendencias,» , Revista


Iberoamericana de Inteligencia Artificial, nº 29, pp. 11-18, 2006.

[4] B. Beatriz, «Mineria de datos,» Puebla, 2008.

[5] Y. Rodriguez y A. Diaz, «Herramientas de Mineria de datos,» Revista Cubana de ciencias


informaticas, vol. 3, nº 3-4, pp. 73-80, 2009.

[6] T. Aluja, «Mineria de datos: entre la estadistica y la inteligencia artificial,» QUESTII ¨ O, vol. 25,
nº 3, pp. 479-498, 2001.

[7] C. Pérez y D. Santín, Minería de datos:Técnicas y herramientas, Madrid: Thomson, 2007.

También podría gustarte