Documentos de Académico
Documentos de Profesional
Documentos de Cultura
EJE 1
Conceptualicemos
Fuente: adobestock/205110625
Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
Conclusión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
Bibliografía . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
ÍNDICE
Introducción
Gartner indica en su revista del 19 de julio de 2021 que la demanda de los profe-
sionales especializados en minería de datos será de un 25% hasta finales del primer
semestre de 2022. La posición de la minería de datos en relación con las estadísticas,
matemática, computación, sistemas, informática, modelado de datos, entre otras,
se relacionan con métodos y conceptos teóricos que existen en cada una, todas
proporcionan la materia prima (datos), los recursos informáticos y la comunicación
canales (la salida de los resultados). Entender la minería de datos también propor-
cionará un correcto análisis de las limitaciones legales sobre el procesamiento de
datos personales; estas limitaciones han sido establecidas para proteger las liberta-
INTRODUCCIÓN
des individuales de las personas cuyos datos se están procesando, ello conlleva a la
privacidad de los datos referente a la ética. Este campo no es solo para especialistas,
sino también para expertos en busca de predominio en la moderna era de las tec-
nologías emergentes. La minería de datos permite que las empresas ganen eficacia
en su Marketing campaings, comercializaciones, estudios prospectivos y toma de
medidas específicas. Para rendir al máximo los beneficios de este conocimiento, es
bueno considerar los servicios de un especialista en el campo.
Entonces, la minería de datos es un activo real para las empresas, pero ¿de qué
manera? Para responder a esta pregunta, necesita saber qué es realmente la minería
de datos y qué hace para las empresas.
La minería de datos no es nueva, debemos tener eso en cuenta, este tipo de metodo-
logía (si se puede llamar así) se remonta tan atrás en la historia. En China se atribuye
al emperador Tang, Yao, la voluntad de contar las cosechas en 2238 a. C.; en Egipto, el
faraón Amasis organizó el censo de su población en el siglo V a.C. No fue hasta el siglo
XVIII que se comenzó a querer analizar los datos para buscar características comunes.
En 1763, Thomas Bayes demostró que se pueden determinar, no solo las probabilidades a
partir de las observaciones resultantes de un experimento, sino también los parámetros
relacionados con estas probabilidades. Presentado en el caso particular de una distribu-
ción binomial, este resultado fue extendido independientemente por Laplace, lo que llevó
a una formulación general del teorema de Bayes. Legendre publicó en 1805 un ensayo
sobre el método de mínimos cuadrados que permite comparar un conjunto de datos con
un modelo matemático.
Instrucción
”
Hay una infinidad de concepciones sobre Según SAS:
la expresión minería de datos, lo encan-
tador es que los literatos no acuerdan
normalizar la definición, pero convergen La minería de datos es el proceso de
que parte de la definición debe explicar hallar anomalías, patrones y correla-
el comportamiento de los datos, el cual ciones en grandes conjuntos de datos
varía dependiendo del contexto en el cual para predecir resultados. Empleando
se esté trabajando, igual acuerdan que el una amplia variedad de técnicas,
desarrollo potencial de la minería de datos, puede utilizar esta información para
en ámbito de los negocios es crucial para el incrementar sus ingresos, recortar
costos, mejorar sus relaciones con
estudio y toma de medidas.
clientes, reducir riesgos y más (2021).
Para Microsoft:
¿Sabía que?
”
Es interesante saber que, el
volumen de datos produ- La minería de datos es el proceso
cidos se triplica cada dos de detectar la información pro-
años. Los datos no estruc- cesable de los conjuntos grandes
de datos. Utiliza el análisis mate-
turados por sí solos confor-
mático para deducir los patrones
man el 90% del universo
y tendencias que existen en los
digital. Pero más informa-
datos. Normalmente, estos pa-
ción no significa necesaria-
trones no se pueden detectar me-
mente más conocimientos.
diante la exploración tradicional
de los datos porque las relaciones
son demasiado complejas o por-
que hay demasiados datos (2021).
Instrucción
Para Belinchón:
”
Los invito a realizar la actividad
pódcast con preguntas.
Se conoce como minería de da-
tos a todo un conjunto de téc-
nicas encargadasde la extrac-
ción de conocimiento proce-
sable, implícito en las bases de
Ahora que llegamos a este punto, nos tenemos que hacer la gran pregunta, ¿A qué tipo
o tipos de datos se puede destinar la minería de datos? Inicialmente, el concepto se puede
aplicar a cualquier ejemplo de indagación, existiendo
técnicas de minería disímiles para cada una de ellas.
Simplificando vamos a distinguir entre datos estruc- BDD:
Acrónimo que se utiliza para abreviar
turados que provienen de BDD relacionales, datos Bases de Datos.
estructurados en BDD (multimedia, temporales,
espaciales y textuales) y otros tipos de repositorios,
también datos no estructurados derivados de la web.
Las herramientas para analizar datos en minería de datos combinan, además de las
nociones de la estadística, el análisis lingüístico, lexicográfico y multilingüe de datos
no estructurados como correos electrónicos, respuestas a cuestionarios o encuestas,
quejas de clientes, blogs de Internet, noticias online, chats, etc., por ejemplo, el grado
de satisfacción (o insatisfacción) del cliente. Sus aplicaciones más rudimentarias son la
lucha contra el spam, así como el análisis de contenido. Los más ambiciosos se refieren
a la evaluación por análisis de informes de prensa, la imagen de una empresa, un clima
político o bursátil, o la categorización automática de la información.
• De dominio que limitan el o los valores que pueda tener un atributo con relación
a su dominio, ello puede limitar a ser nulos o no.
• De referencia aquí los valores de las claves foráneas convienen relacionarse con
uno y solo un valor de la tabla a la cual se hace referencia.
• PostgreSQL.
• DB2.
Lectura complementaria
ORACLE
Las BDD Relacionales son las más empleadas en la actualidad, no está de más, que
realices una pequeña comparación con otras BDD que también se explotan actualmente,
ahora lo que hace tomar en cuenta una más que otra dependerá esencialmente de las
necesidades de la organización o la empresa, inclusive podrás combinar BDD desiguales
y así obtener mejores resultados y elaborar análisis más perfectos. Para preservar la
integridad de una BDD cuando la trabajamos para utilizar minería de datos, es impor-
tante verificar que todos los valores sean correspondientes a la BDD o tendríamos un
problema de integridad, así que ten muy presente que algunos SGBBD no verifican esta
restricción (no devuelven ningún error en caso de un problema), lo que puede causar un
comportamiento errático al final si se analizan los datos.
Para entender un poco más, sobre cómo se estructuran los datos en la minería de
datos, debemos conocer un poco sobre el modelo "ACID" y la gestión de transacciones. El
modelo ACID define las reglas de las avenencias para garantizar la estabilidad de la BDD.
Esto es esencial para manejar solicitudes de diferentes aplicaciones. Una transacción per-
mite envolver varias solicitudes que imperativamente deben ejecutarse secuencialmente
en la misma unidad. Si alguna vez fuera imposible procesar la transacción completa, el
sistema volverá a un estado estable anterior. Las características son:
• Sostenibilidad: una vez validados, los cambios provocados por la transacción son
sostenibles.
Existen diversas formas de representar modelos y cada una de ellas establecen la téc-
nica y el tipo que se pueden utilizar para deducirlos. Ejemplo de ello sería que las BDM son
mejores para obtener vista de unos datos en función de otros. En la práctica, los modelos
pueden presentarse en 2 tipos:
• Válido: los modelos o patrones corresponden seguir siendo exactos para poder
lograr datos nuevos (con grado de certidumbre), y no solo para aquellos que han
sido usados en su obtención.
• Potencialmente útil: la información debe llevar a acciones que logren algún tipo
de patrocinio para el usuario.
https://youtu.be/DmNqizRa1YQ
¿Sabía que?
Aunque los dos términos KDD y Data Mining se usan de manera muy intercambiable,
se refieren a dos conceptos relacionados, pero ligeramente diferentes. KDD es el proceso
general de extraer conocimiento de los datos, mientras que la minería de datos es un
paso en el proceso KDD, que implica identificar patrones en los datos. En otras palabras,
la minería de datos es solo la aplicación de un algoritmo específico basado en el objetivo
general del proceso KDD.
Instrucción
Las formas más básicas de extracción de datos son datos de bases de datos, datos
de almacenamiento de datos y datos transaccionales. Las técnicas de minería de datos
también se pueden aplicar a otras formas, como flujo de datos, datos secuenciados,
datos de texto y datos espaciales.
e. Sistemas para la toma de decisión: son sistemas que generan ayuda a los direc-
tores a resolver inconvenientes dentro de la empresa y también en la toma de de-
cisiones. Uno de sus objetivos es proporcionar información ineludible para ejecutar
decisiones asertivas y efectivas en el perímetro empresarial, al igual que tareas de
determinación y ejemplo de ello puede ser la medicina. (Oracle, s. f.).
• Educación.
• Medicina.
• Seguros y salud.
• Computación.
• Telecomunicaciones.
• Garantías de productos.
• Procesos industriales.
• Legal y Política.
• Fabricación.
• Venta a detalles.
• Bancos y financieras.
• Turismo.
• Hacienda.
• Policía y ejército.
• Deportes
• Etc.
Conclusión
Investigar los datos para revelar lazos ocultos y profetizar directrices a futuro se definen
a lo largo de mucho tiempo. Esto se conoce como "descubrimiento de conocimientos en
BDD", y la expresión "minería de datos" salió a la luz en la época de los 1990, el piso o
columna de la minería de datos se ancla en el trípode científico disciplinar entrelazado:
<<la estadística que es la disertación numérica de las relaciones de los datos>>, <<la
magnánima inteligencia artificial, razón similar a la humana, que es expuesta por el sof-
tware y/o las máquinas>> y el machine learning que son algoritmos que pueden educarse
mediante datos para formar, descubrir y realizar predicciones>>. Lo que antiguamente se
utilizaba de una manera no muy concreta, hoy en día otra vez es nuevo y está de moda, la
minería de datos continúa progresando a la par de la evolución tecnológica para igualar
el ritmo de otras técnicas y modelos haciéndose asequible.
Estos últimos diez años, los avances en el poder de cálculo unido a la velocidad de pro-
cesamiento y cómputo, adicionando los grandes adelantos del hardware, han permitido
alcanzar resultados que van mucho más allá de las experiencias comunes y monótonas,
que sin duda desgastan cantidad de tiempo al estudio de datos tradicionales, ahora
todo es relativamente fácil y automatizado. Cuando la recopilación de los datos es más
compleja, mucho más elevado es el potencial que existe para expresar insights nota-
bles. Los especialistas en big data, aseguradoras, proveedores de telecomunicaciones,
fabricantes, bancos, entre muchos otros, manipulan la minería de datos para dejar ver
relaciones entre valores que se pueden analizar, algunos desde demografía, promociones,
precios y hasta la forma como puede proyectarse la economía, también la competencia,
el riesgo, y las redes sociales, etc., y es tan complejo el análisis de los datos que todas
ellas terminan afectando los modelos de operaciones, ingresos, negociaciones y también
las recomendaciones con clientes.
Las exploraciones de los datos son de naturaleza "parasitaria", pero como algunos
parásitos, la minería de datos se alimenta del organismo huésped solo durante una parte
de su ciclo de vida. En otra fase, crea, produce y utiliza sus propias herramientas y "sus-
Garassino, A. (2020). ¿Para qué sirve la minería de datos o data mining? - Sylop-
er. Syloper. Transformación Digital. Desarrollo de software a medida y aplica-
ciones. Obtenido de https://www.syloper.com/blog/recursos/para-que-sirve-
la-mineria-de-datos/
gartner.com/en/research/methodologies/methodologies
Oracle. (s. f.). ¿Qué es una base de datos relacional? El significado de base de
datos relacional. Obtenido de https://www.oracle.com/co/database/what-is-
a-relational-database/