Está en la página 1de 6

Unidad 1.

Introducción a la minería de datos

Evidencia de Aprendizaje.

Alumno: Adrián Toledano Sánchez


Matricula: ES1921013601
Grupo: MT-MCOM2-2202-B2-001
Asignatura: Computación 2
Profr. José Luis Mondragón Diego
Licenciatura: Matemáticas

15 de octubre de 2022
Universidad Abierta y a Distancia de México
Descripción de la actividad/ indicaciones de la actividad:

1. Introducción

Como sabemos, la minería de datos es el proceso de hallar anomalías, patrones y


correlaciones en grandes conjuntos de datos sobre un fenómeno o experimento particular
con el fin de que nos permitan hacer una explicación o una predicción en el mejor de los
casos. Por otro lado, también se puede entender como la tecnología y software utilizado
para encontrar patrones de comportamiento dentro de la base de datos. La base
fundamental de esto es que esos patrones ayuden a la toma de decisiones (López Abellán,
2018).

Es así como las instituciones y empresas (públicas y privadas) coleccionan bastante


información (ventas, clientes, cobros, pacientes, tratamientos, estudiantes, calificaciones,
fenómenos meteorológicos, etcétera, según su giro), aprovechando que las computadoras
y los discos de almacenamiento se han abaratado, y las comunicaciones son también
baratas y confiables (Martínez Luna, 2011). Revisemos las herramientas tecnológicas.

2. Resumen

Tipos de herramientas para la minería de datos, uso de la minería de datos en


diferentes áreas, impacto de la minería de datos en la sociedad.

Herramientas

De acuerdo con el documento “Herramientas para la extracción, procesamiento, análisis y


visualización de datos (2011)” podemos clasificar en cinco grupos, de acuerdo con su
funcionalidad principal, a los instrumentos que nos permiten extraer, procesar, analizar y
visualizar los datos.

1. Web scraping o extracción de datos: es un conjunto de técnicas de


programación con las cuales es posible extraer información o datos de la web, sea
cual sea su presentación. Esta información se recopila y se exporta a un formato
procesable por el usuario, como puede ser una hoja de cálculo o ficheros tipo texto.

Herramientas: Parsehub, Scrapy, Table Capture, Función IMPORTHTML, Rapid Miner.


2. Depuración de datos: es el conjunto de tareas de preparación de datos extraídos
de un origen de datos y su transformación a un formato concreto, adecuadamente
estructurado y libre de errores, normalmente denominada vista minable de datos.
Herramientas: Open Refine, Talend Open Studio, Apache Mahout.

2.1. Conversión de datos: La conversión se lleva a cabo para que los datos puedan
ser leídos por herramientas de análisis o visualización que solo aceptan
determinados formatos.
Herramientas: Mr. Data Converter, Beautify Converter, Tabula.

3. Análisis de datos y Lenguajes de programación: La aplicación de distintas


herramientas y procesos cuantitativos y cualitativos utilizados para extraer
información de valor de los datos. Las metodologías de analítica incluyen tareas
ligadas a los siguientes tipos de análisis: exploratorio de datos (tratamiento
estadístico); análisis descriptivo (exploración de los datos) y análisis predictivo
(predecir valores futuros).
Herramientas: Weka, Knime, Orange, son herramientas para persona con poca o nula
experiencia en programación. Mientras que R, Python, GNU Octave son herramientas para
experimentados en manejo de leguajes de programación.

4. Visualización: la representación gráfica para interpretar la información subyacente


a los datos, como gráficos, mapas, diagramas, entre otros. Nos permiten una mayor
comprensión e interpretabilidad de los datos, así como detectar patrones, tendencias,
datos anómalos, proyectar predicciones o comunicar inferencia derivada del análisis
de datos.
Herramientas: Kibana, Tableau Public, SpagoBI, Grafana,

4.1. APIS y librerías de visualización: Existe una amplia gama de librerías y APIs que
implementan funcionalidades relacionadas con la visualización de datos, para
diferentes lenguajes de programación o plataformas.
Herramientas: Google Chart Tools, JavaScript InfoVis, Toolkit, D3.js, Matplolib, Bokeh.

4.2. Visualización y tratamiento de datos geoespaciales: la georreferenciación de


los datos nos permite la representación visual de la información geográfica.
Herramientas: Carto, OpenLayers, OpenStreetMap, Geocoder, Geopy, GDAL, PROJ.4 y
PROJ.4S
5. Análisis de redes: es el proceso de representar, analizar y extraer patrones con
significado a partir de datos de medios sociales. Lo que nos permite observar
relaciones entre entidades de un sistema, para poder describir comportamientos,
estructura o mecanismos de influencia. Haciendo énfasis en el estudio de las
relaciones entre personas, cosas, países u organizaciones entre otros elementos que
configuran un sistema.
Herramientas: Gephi, NodeXL.

De esta manera, la minería de datos también consiste en utilizar datos previamente


analizados por herramientas y técnicas que se basan en gran medida en enfoques
estadísticos para informar sobre un problema empresarial o cualquier otro problema en el
que los datos puedan ofrecer la solución (Schwab, 2021). Diferentes tipos de software que
nos permiten extraer, procesar, analizar y visualizar gráficamente los datos.

Uso de la minería de datos en diferentes áreas, impacto de la minería de datos en la


sociedad.
Si bien la aplicación de la minería de datos va más enfocada al sector empresarial (estudios
de mercado, publicidad) este conjunto de herramientas estadísticas, computacionales e IA
puede aplicarse en sectores como:
- Educación
La minería de datos ayuda a los educadores a acceder a datos de los estudiantes, a predecir
niveles de logro y a detectar estudiantes o grupos de estudiantes que necesitan atención extra.
- Manufactura
La alineación de planes de suministro con pronósticos de demanda es esencial, como lo es
también la detección temprana de problemas, garantía de calidad e inversión en equidad de
marca.
- Bancos
La minería de datos ayuda a las compañías de servicios financieros a tener una mejor vista de
los riesgos del mercado, a detectar el fraude en menos tiempo, a gestionar las obligaciones de
cumplimiento de las regulaciones y a obtener retornos óptimos de sus inversiones en marketing.

- Retail
A través de modelos de datos más precisos, las compañías detallistas pueden ofrecer
campañas más enfocadas – y encontrar la oferta que tenga el mayor impacto en el cliente.
- Salud
Segmentar los pacientes del hospital en grupos con características homogéneas, clasificación
del paciente en base al riesgo de reingreso o riesgo de reacción adversa a la medicación, o
predecir la demanda de urgencias para cada día y hora del años, etc.

3. Conclusiones

De acuerdo con la investigación, en la minería de datos confluyen la estadística, la


inteligencia artificial y el Machine-Learning (aprendizaje computacional), por lo que es una
herramienta de análisis de datos muy potente, en gran medida gracias a la evolución de la
tecnología computacional.
Gracias a la minería de datos podemos analizar un enorme conjunto de datos y obtener
patrones, anomalías y correlación entre ellos, a través del tiempo. Por ello, s e debe tener
cuidado en el manejo de los datos, desde su recolección (preguntas pertinentes, selección
de modelo), posterior análisis y finalmente su presentación. Se pueden utilizar la tecnología
y software, ya sea de libre acceso (código abierto) o versiones de paga, con la finalidad de
encontrar patrones de comportamiento dentro de la base de datos (data set). La base
fundamental de esto es que esos patrones ayuden a la toma de decisiones de empresas e
instituciones públicas o privadas.

Fuentes consultadas

Chambers, John, William Cleveland, Beat Kleiner, and Paul Tukey, (1983), Graphical Methods for Data
Analysis, Wadsworth

CEUPE. (s. f.). De qué se trata la Minería de Datos en el Big Data https://ceupe.com.ar/blog/de-
que-se-trata-la-mineria-de-datos-en-el-big-data/

Engineering Statistic Handbook (s. f.). Graphical Techniques: Alphabetic [Web]. 25 de abril de 2022.
https://www.itl.nist.gov/div898/handbook/eda/section3/eda33.htm

Herramientas de procesado y visualización de datos. (febrero de 2021). Herramientas de procesado


y visualización de datos [PDF].
https://datos.gob.es/sites/default/files/doc/file/herramientas_de_procesado_y_visualizacion_de_da
tos.docx.pdf
Martínez Luna, Gilberto Lorenzo (2011). Minería de datos: como hallar la aguja en un pajar [PDF].
https://www.revistaciencia.amc.edu.mx/images/revista/62_3/PDF/mineria_aguja.pdf

SAS. (s. f.). La Minería de Datos de la a A la Z (PDF). 25 de abril de 2022.


https://www.sas.com/content/dam/SAS/es_mx/doc/assets/data-minig.pdf

Schwab, Pierre-Nicolas. (10 May, 2021). Minería de datos: Definición, 5 herramientas gratuitas y
técnicas https://www.intotheminds.com/blog/es/mineria-de-datos-definicion-5-herramientas-
gratuitas-y-tecnicas/

UNADM (s. f). Unidad 1. Minería de datos [PDF].

Valerie J. Easton y John H. McColl's Statistics Glossary v1.1 [Web]


http://www.stat.yale.edu/Courses/1997-98/101/stem.htm.

También podría gustarte