Documentos de Académico
Documentos de Profesional
Documentos de Cultura
- MÓDULO III
- PROFUNDIZACIÓN: INFORMÁTICA
Tecnologías de la Información.
Infraestructura, Seguridad
y Análisis de datos.
DNI: 17.369.291
ESPECIALIDAD: Informática
Nº de Registro: 254.986
1
CUESTIONARIO:
RESPUESTAS:
De forma general, los datos son la materia prima bruta. En el momento que el usuario les
atribuye algún significado especial pasan a convertirse en información. Cuando los
especialistas elaboran o encuentran un modelo, haciendo que la interpretación que surge
entre la información y ese modelo represente un valor agregado, entonces nos referimos
al conocimiento.
2
- ¿Qué NO es “Minería de Datos”?:
No hay que confundir “Minería de Datos” con el simple análisis de los datos, o con la
búsqueda de datos, o con patrones de estudio de base de datos, o con el estudio de
“Muestreos estadísticos”, o con la gestión y procesamiento de datos o con el desarrollo
de técnicas de “Búsqueda y Análisis” (SEARCH&BREAKDOWN).
La “Minería de Datos” es mucho más que “Analizar” datos, ya que hoy más que nunca
en el siglo XXI con las TIC’S y la revolución de Internet se vuelve crucial el manejo de
los datos para la toma de decisiones, el manejo de los datos para encontrar patrones,
relaciones, hacer predicciones y analizar ese gran flujo de información que hoy fluye no
sólo por Internet, sino en soportes digitales, celulares y TV.
En otras palabras, lo que busca la “Minería de Datos” es un análisis exhaustivo y
profundo de la información en todas sus plataformas, para extraer conocimiento de los
datos.
Las áreas del saber que abarca la minería de datos son cinco disciplinas dentro de la
informática que se han estado desarrollando en los últimos años con una tremenda
fuerza, y que seguirán creciendo mucho más durante los próximos años, como son la
BIG DATA o al análisis de los grandes volúmenes de datos. En un mundo sacudido por
la velocidad de los cambios tecnológicos, por el fenómeno que muchos llaman la
globalización digital, por el entramado increíble que se de las redes sociales, la
computación móvil y las TIC’S
3
Entre las principales “Áreas del saber” que se involucran en la “Minería de Datos” se
pueden mencionar las siguientes:
El Análisis de base de datos y soporte de decisiones.
Análisis y gestión de mercado.
Detección de Fraudes.
Análisis de riesgos crediticios.
La minería de texto.
Análisis de flujos de datos.
Por otro lado, también existen técnicas tradicionales de explotación de datos basadas en
la existencia de hipótesis o modelos previos a diferencia entre el análisis utilizando
minería que buscan el descubrimiento del conocimiento sin una hipótesis preconcebida.
Al igual que otros muchos procesos, la “Minería de Datos” posee su propio estándar, o
protocolo llamado CRISP-DM (Cross-Industry Standar Process for Data Mining), que
establece los seis pasos a seguir para aplicar la “Minería de Datos”, a saber:
1. Entender el área en el que queremos usar data mining para
definir con claridad el problema.
2. Recolectar y entender los datos.
3. Preparación de los datos: hacer tablas con los campos
requeridos, eliminar datos innecesarios.
4. Selección de la técnica de modelado, construcción del modelo y
puesta a prueba del modelo. Data mining.
5. Evaluación de los resultados y revisión del proceso.
4
6. Despliegue: implementación de un proceso de data mining
repetible.
La estadística es la ciencia que utiliza conjuntos de datos numéricos que tienen una
determinada característica en común para obtener, a partir de ellos, inferencias basadas
en el cálculo de probabilidades para poder llegar a conclusiones a partir de los datos
numéricos extraídos.
5
La siguiente imagen representa en forma cabal el concepto de “Minería de Datos”:
La metáfora del ICEBERG se refiere a que en la superficie están los datos primarios e
intuitivos. Mientras que en la “Minería de Datos”, se refiere a la búsqueda en
PROFUNDIDAD de análisis de datos muy grandes en todo el “Campo Virtual” y de
clasificación de esos miles de datos recolectados a través de varias técnicas y usando
distintos tipos de herramientas.
5) Diferencia entre Minería de datos y análisis de grandes volúmenes de datos (Big Data):
6
Mientras que la “Minería de Datos” se entiende como el análisis de datos y como el
proceso de obtener conocimiento a partir del análisis de los mismos.
Esta situación impulsó la aparición de una disciplina emergente llamada Data Science,
la cual permite que las organizaciones puedan derivar valor del negocio a partir del
análisis de grandes datos. Data Science representa la síntesis de varias disciplinas como
estadística, matemáticas, visualización de datos, y ciencias de la computación que
posibilita desarrollar algoritmos avanzados con el propósito de analizar enormes
cantidades de información para generar nuevo valor y mejorar la toma de decisiones.
Es decir, resumiendo: Yo creo que la “Minería de Datos” usa al BIG DATA, como lugar
o fuente desde donde abreva, busca y analiza la información.
Es decir que el BIG DATA sería la “Materia prima”, mientras que la “Minería de
Datos” es la ciencia que a través de una serie de pasos y de técnicas “bucea” en ese gran
caudal de datos para analizar, depurar y clasificar la información y adquirir
CONOCIMENTO.
7
8