El Concepto de Minería de Datos

Instituto Tecnológico de las Américas (ITLA).
Nombre: Sebastián de Jesús Vargas Vargas.
Tema: Minería de datos (Concepto, Historia y Precursores).
Materia: Minería de datos e inteligencia de negocios.
Docente: Jorge Ramon Taveras.
Matricula: 2019-7820.
Fecha de entrega: 3/6/2021.

El concepto de minería de datos
Hace tan solo unos años los datos de las empresas estaban orientados
principalmente, a alimentar sus sistemas contables y financieros, así como
inventarios, los procesos de producción, recursos humanos y ventas.
La minería de datos es el proceso de búsqueda en grandes bases de datos para

encontrar información útil que sirva para la toma de decisiones. También se utiliza
el término en inglés «data mining».
Se puede entender como la tecnología y software utilizado para encontrar patrones

de comportamiento dentro de la base de datos. La base fundamental de esto es que
esos patrones ayuden a la toma de decisiones. Por ejemplo, podría ayudar a
empresas, a conocer los patrones de comportamiento de sus clientes. De manera
que le facilitaría el establecimiento de estrategias para incrementar las ventas o
reducir costes.
Con la gran velocidad a la cual ha venido evolucionando la tecnología, las

empresas de hoy disponen de herramientas de software y hardware cada vez más
sofisticadas que posibilitan el almacenamiento de grandes cantidades de
información y el análisis de esta. El avance tecnológico, sumado a la aparición de
mercados cada vez más competidos, sugiere a las empresas el mejoramiento
continuo de sus esquemas de administración y toma de decisiones, explotando una
de las más grandes fuentes de competitividad como lo es la información.
Existen diferentes técnicas que posibilitan la explotación de los datos, extrayendo

información que no es detectada a simple vista. Una de estas técnicas es la
denominada Minería de Datos, la cual combina técnicas semiautomáticas de
inteligencia artificial, análisis estadístico, bases de datos y visualización gráfica,
para la obtención de información que no esté representada explícitamente en los
datos.
Ventajas de la minería de datos
La ventaja fundamental de este proceso de análisis de datos es la gran cantidad de

escenarios empresariales a los que se puede aplicar, a modo de ejemplo tenemos:
➢ Predicción: Pronóstico de las ventas de la compañía.

➢ Probabilidad: Selección de los mejores clientes para un contacto directo ya sea vía
telefónica o correo electrónico.
➢ Análisis de secuencias: Análisis de los productos que los clientes han comprado
y comprobar la interrelación entre ellos.
Etapas de la minería:
➢ Objetivo y recolección de datos: Lo primero de todo es centrarnos de en qué tipo
de información queremos obtener. Imaginemos el ejemplo que un supermercado
quiere conocer a qué hora del día es donde más asistencia de clientes hay. Este
sería el objetivo y la información que quiere obtener el comercio en este caso.
➢ Procesamiento y gestión de los datos: Una vez que sabemos los datos que
queremos recopilar ponemos a trabajar a los datos. Esta quizás sea la fase más
complicada del proceso. Pues requiere seleccionar la muestra representativa sobre
la que se va a realizar el análisis. Una vez escogida la muestra se debe analizar
qué tipo de variables o modelo de regresión se va a realizar sobre la muestra.
➢ Selección del modelo: Está muy relacionado con la anterior fase. Se trata de crear
un modelo o Algoritmo que nos arroje el mejor resultado posible. Para ello hay
que hacer un análisis exhaustivo de las variables a incluir en el modelo. Esto se
convierte en una tarea complicada ya que dependerá del tipo de información a
analizar. Por ello, los mineros de datos llevan a cabo distintos exámenes del
algoritmo como: regresión lineal, árbol de decisión, series temporales, red
neuronal, etc.
➢ Análisis y revisión de resultados: Básicamente es analizar los resultados para

comprobar si arrojan una explicación lógica. Explicación que facilite la toma de
decisiones en base a la información suministrada por los resultados.
➢ Actualización del modelo: El último paso del proceso sería la actualización del
modelo. Es muy importante que se vaya haciendo con el paso del tiempo para que
no quede obsoleto. Las variables del modelo podrían pasar a ser no significativas
y por tanto se requiere un control periódico del mismo.
Historia de la minería de datos
La idea de Minería de Datos no es nueva. Ya desde los años sesenta los

estadísticos manejaban términos como Data Fishing, Data Mining (DM) o Data
Archaeology con la idea de encontrar correlaciones sin una hipótesis previa en
bases de datos con ruido.
A principios de los años ochenta, Rakesh Agrawal, GioWiederhold, Robert Blum

y Gregory Piatetsky-Shapiro entre otros, empezaron a consolidar los términos de
Minería de Datos y KDD ("Knowledge Discovery in Databases").
Esta tecnología ha sido un buen punto de encuentro entre personas pertenecientes

al ámbito académico y al de los negocios.
La minería de datos surgió con la intención o el objetivo de ayudar a comprender

una enorme cantidad de datos, y que estos, pudieran ser utilizados para extraer
conclusiones para contribuir en la mejora y crecimiento de las empresas, sobre
todo, por lo que hace a las ventas o fidelización de clientes.
En la última década, los avances en el poder y la velocidad de procesamiento nos

han permitido llegar más allá de las prácticas manuales, tediosas y que toman
mucho tiempo al análisis de datos rápido, fácil y automatizado.
Cuanto más complejos son los conjuntos de datos recopilados, mayor es el

potencial que hay para descubrir insights relevantes. Los comerciantes detallistas,
bancos, fabricantes, proveedores de telecomunicaciones y aseguradoras, entre
otros, utilizan la minería de datos para descubrir relaciones entre todas las cosas,
desde precios, promociones y demografía hasta la forma en que la economía, el
riesgo, la competencia y los medios sociales afectan sus modelos de negocios,
ingresos, operaciones y relaciones con clientes.
La evolución de sus herramientas en el transcurso del tiempo puede dividirse en

cuatro etapas principales:
• Colección de Datos (1960).

• Acceso de Datos (1980).
• Almacén de Datos y Apoyo a las Decisiones (principios de la década de
1990).
• Minería de Datos Inteligente.(nales de la década de 1990).
Precursores
Gio Wiederhold
Giovanni "Gio" Corrado Melchiore Wiederhold (nacido el 24 de junio de 1936)

es un informático nacido en Italia que pasó la mayor parte de su carrera en la
Universidad de Stanford. Su investigación se centra en el diseño de sistemas de
gestión de bases de datos a gran escala, la protección de su contenido, a menudo
utilizando técnicas basadas en el conocimiento. Después de su jubilación formal,
se centró en los métodos de valoración de la propiedad intelectual y el capital
intelectual.
Gio Wiederhold nació el 24 de junio de 1936 en Varese, Italia y se graduó C.Ae.

Cum laude en Ingeniería Aeronáutica del TMS Technicum en Rotterdam,
Holanda en 1957. De 1957 a 1958 realizó estudios de posgrado en la Technische
Hogeschool de Delft. Emigró a los Estados Unidos en 1958. Desde 1966 está
casado con la judía Voy Yat.
En 1976, Wiederhold se unió a la facultad de la Universidad de Stanford. Integró

la tecnología de base de conocimientos explotando conceptos de inteligencia
artificial para proporcionar acceso inteligente y eficiente a bases de datos a las que
llamó KBMS. Es autor de un libro de texto sobre aspectos cuantitativos de los
sistemas de gestión de bases de datos, publicado por primera vez por McGraw-
Hill en 1977. Se publicó una segunda edición en 1983. En 1995, los derechos de
autor fueron transferidos a Wiederhold, quien publicó una versión ampliada del
libro en 2001. También publicó un libro sobre organización de archivos para bases
de datos en 1987.
Desde 1991 hasta 1994, Wiederhold se desempeñó como gerente de programa en

la Agencia de Proyectos de Investigación Avanzada de Defensa (DARPA). Inició
el programa DARPA Intelligent Integration of Information (I3). Un componente
visible es el esfuerzo de la Biblioteca Digital, que fue delegado a la National
Science Foundation; la investigación ha abierto nuevos campos de aplicación en
Internet y ha financiado proyectos como Google.
Sus artículos sobre la interoperabilidad semántica de datos están en el origen de

la arquitectura moderna orientada a servicios y el éxito de XML.Fue nombrado
miembro del Colegio Americano de Informática Médica en 1984, miembro del
Instituto de Ingenieros Eléctricos y Electrónicos en 1991. y miembro de la
Association for Computing Machinery (ACM) en 1995.
Rakesh Agrawal
Rakesh Agrawal es un científico informático que hasta hace poco era miembro
técnico en Microsoft Search Labs. Rakesh es bien conocido por desarrollar
conceptos y tecnologías fundamentales de minería de datos y ser pionero en
conceptos clave en la privacidad de datos, incluida la base de datos hipocrática, el
intercambio de información soberana y la privacidad Preservando la minería de
datos. El producto de minería de datos comercial de IBM, Intelligent Miner,
surgió de su trabajo. Su investigación se ha incorporado a otros productos de IBM,
incluidos DB2 Mining Extender, DB2 OLAP Server y WebSphere Commerce
Server, y ha influido en varios otros productos, prototipos y aplicaciones
comerciales y académicos. Sus otras contribuciones técnicas incluyen el sistema
de tipos orientado a objetos Polyglot, el sistema de base de datos activa Alert, Ode
(base de datos de objetos y entorno), Alpha (extensión de bases de datos
relacionales con cierre transitivo generalizado), sistema distribuido Nest, gestión
de transacciones y máquinas de bases de datos.
En 2006, Rakesh fue elegido miembro de la Academia Nacional de Ingeniería

para el desarrollo de técnicas para extraer información de bases de datos muy
grandes.
Antes de unirse a Microsoft en marzo de 2006, Rakesh fue miembro de IBM y

dirigió el grupo Quest en IBM Almaden Research Center. Anteriormente, estuvo
en Bell Laboratories, Murray Hill de 1983 a 1989. También trabajó durante tres
años en una empresa líder de la India, Bharat Heavy Electricals Ltd. Recibió su
M.S. y Ph.D. Licenciados en Ciencias de la Computación de la Universidad de
Wisconsin-Madison en 1983. También tiene un B.E. Licenciado en Ingeniería
Electrónica y Comunicaciones de IIT-Roorkee, y un Diploma de Postgrado de dos
años en Ingeniería Industrial del Instituto Nacional de Ingeniería Industrial
(NITIE), Bombay.
Gregory Piatetsky-Shapiro
Gregory I. Piatetsky-Shapiro (nacido el 7 de abril de 1958) es un científico de

datos y cofundador de las conferencias KDD , y cofundador y ex presidente del
grupo SIGKDD de la Asociación de Maquinaria de Computación para el
Descubrimiento del Conocimiento, la Minería de Datos y la Ciencia de Datos. Es
el fundador y presidente de KDnuggets, un sitio web de discusión y aprendizaje
para Business Analytics , Data Mining y Data Science.
Se incorporó a GTE Laboratories , donde trabajó en interfaces inteligentes

relacionadas con bases de datos . En 1989, propuso un nuevo proyecto en GTE
llamado " Descubrimiento de conocimiento en bases de datos ". El proyecto creó
prototipos avanzados, incluido KEFIR (Key Findings Reporter), un sistema para
el análisis y resumen de cambios clave en grandes bases de datos, que fue un
precursor de sistemas como Google Analytics Intelligence. Se aplicó un prototipo
de KEFIR a los datos de atención médica de GTE y recibió el premio técnico más
alto de GTE .
En 1997, dejó GTE para unirse a Knowledge Stream Partners (KSP), donde fue
director y luego vicepresidente y científico jefe.En abril de 2000, KSP fue
adquirida por Xchange, Inc., donde Piatetsky se desempeñó como vicepresidente
y científico jefe.
Piatetsky dejó Xchange en mayo de 2001 para convertirse en consultor autónomo

y centrarse en KDnuggets.
Bibliografía
https://concepto.de/dato-en-informatica/
https://en.wikipedia.org
https://es.wikipedia.org/wiki/Miner%C3%ADa_de_datos
https://economipedia.com/definiciones/mineria-de-datos.html
https://clinic-cloud.com/blog/data-mining-que-es-definicion-mineria-de-datos/
Libro Minería de datos - MC Beatriz Beltrán Martínez

El Concepto de Minería de Datos

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

El Concepto de Minería de Datos

Cargado por

Copyright:

Formatos disponibles

Instituto Tecnológico de las Américas (ITLA).

Nombre: Sebastián de Jesús Vargas Vargas.

Tema: Minería de datos (Concepto, Historia y Precursores).

Materia: Minería de datos e inteligencia de negocios.

Docente: Jorge Ramon Taveras.

Fecha de entrega: 3/6/2021.

La minería de datos es el proceso de búsqueda en grandes bases de datos para

Se puede entender como la tecnología y software utilizado para encontrar patrones

Con la gran velocidad a la cual ha venido evolucionando la tecnología, las

Existen diferentes técnicas que posibilitan la explotación de los datos, extrayendo

Ventajas de la minería de datos

La ventaja fundamental de este proceso de análisis de datos es la gran cantidad de

➢ Predicción: Pronóstico de las ventas de la compañía.

➢ Análisis y revisión de resultados: Básicamente es analizar los resultados para

La idea de Minería de Datos no es nueva. Ya desde los años sesenta los

A principios de los años ochenta, Rakesh Agrawal, GioWiederhold, Robert Blum

Esta tecnología ha sido un buen punto de encuentro entre personas pertenecientes

La minería de datos surgió con la intención o el objetivo de ayudar a comprender

En la última década, los avances en el poder y la velocidad de procesamiento nos

Cuanto más complejos son los conjuntos de datos recopilados, mayor es el

La evolución de sus herramientas en el transcurso del tiempo puede dividirse en

• Colección de Datos (1960).

Giovanni "Gio" Corrado Melchiore Wiederhold (nacido el 24 de junio de 1936)

Gio Wiederhold nació el 24 de junio de 1936 en Varese, Italia y se graduó C.Ae.

En 1976, Wiederhold se unió a la facultad de la Universidad de Stanford. Integró

Desde 1991 hasta 1994, Wiederhold se desempeñó como gerente de programa en

Sus artículos sobre la interoperabilidad semántica de datos están en el origen de

En 2006, Rakesh fue elegido miembro de la Academia Nacional de Ingeniería

Antes de unirse a Microsoft en marzo de 2006, Rakesh fue miembro de IBM y

Gregory I. Piatetsky-Shapiro (nacido el 7 de abril de 1958) es un científico de

Se incorporó a GTE Laboratories , donde trabajó en interfaces inteligentes

Piatetsky dejó Xchange en mayo de 2001 para convertirse en consultor autónomo

Libro Minería de datos - MC Beatriz Beltrán Martínez

También podría gustarte