Está en la página 1de 3

Asignatura Datos del estudiante Fecha

Apellidos: Maycol Javier

Nombre: Garcia Pacheco

Actividad 2
Protocolo individual de la unidad n°: 2

Análisis y síntesis: 
Síntesis e interpretación personal de los temas vistos en la unidad

Minería de datos
La minería de datos se utiliza con muchos objetivos, que variarán en función  de quien los
necesita por ejemplo:
 Prevención y riesgo: analizar datos para determinar dónde hubo problemas
anteriormente
 Agrupación: como por ejemplo agrupar datos repetidos en un conjunto
CICLO DATA MINING

El proceso data Mining consta de las siguientes etapas:

Selección del conjunto de datos: se refiere a los datos que se desean predecir, calcular o
inferir, que sirven para determinar los cálculos o los procesos.

Análisis de las propiedades de los datos: son los histogramas, los diagramas de
dispersión, los valores atípicos y también la ausencia de datos.

Transformación del conjunto de datos de entrada: se realiza en función del análisis


previo para poder prepararlo y aplicarlo a la técnica de minería de datos que mejor se adapte
a la información que se desea analizar. A este proceso también se lo conoce como pre
procesamiento de los datos.

Selección y aplicación de la técnica de minería de datos: aquí es cuando se construye el


modelo que permitirá realizar la predicción, la clasificación o la segmentación de la
información.

Extracción de conocimiento: se realiza mediante una técnica de minería de datos,


obteniéndose un modelo de conocimiento que va a representar los patrones de
comportamiento.
Interpretación y evaluación de los datos: se efectúa una vez que se ha obtenido el
modelo, comprobando que las conclusiones obtenidas son válidas y satisfactorias.

EL ALCANCE DE DATA MINING


Las técnicas de Data Mining pueden redituar los beneficios de automatización en las
plataformas de hardware y software existentes y puede ser implementadas en sistemas
nuevos a medida que las plataformas existentes se actualicen y nuevos productos sean
desarrollados. Cuando las herramientas de Data Mining son implementadas en sistemas de
procesamiento paralelo de alto performance, pueden analizar bases de datos masivas en
minutos. Procesamiento más rápido significa que los usuarios pueden automáticamente
experimentar con más modelos para entender datos complejos.
Alta velocidad hace que sea práctico para los usuarios analizar inmensas cantidades de
datos. Grandes bases de datos, a su vez, producen mejores predicciones.
Asignatura Datos del estudiante Fecha
Apellidos: Maycol Javier

Nombre: Garcia Pacheco

Redes Neuronales: Esta tecnología puede ser desarrollada tanto en software como en
hardware y con ella se pueden construir sistemas capaces de aprender, de adaptarse a
condiciones variantes, o inclusive si se dispone de una colección suficiente grande de datos,
predecir el estado futuro de algunos modelos
Las redes neuronales artificiales se utilizan para clasificar información, poder vaticinar
resultados y juntar datos. Por ejemplo, Google usa una red neuronal de 30 capas para
fomentar Google Photos y sus recomendaciones de YouTube; Facebook utiliza RNA para su
algoritmo DeepFace, para reconocer caras hasta con un 97% de precisión, como los seres
humanos reconocemos las caras de las personas que ya hemos visto alguna vez.
Árbol de decisión
Un árbol de decisión es un modelo de predicción utilizado en diversos ámbitos que van
desde la inteligencia artificial hasta la Economía. Dado un conjunto de datos se fabrican
diagramas de construcciones lógicas, muy similares a los sistemas de predicción basados
en reglas, que sirven para representar y categorizar una serie de condiciones que ocurren de
forma sucesiva, para la resolución de un problema.

Conclusión: la minería de datos surge en los años 80 como una necesitada de extraer y
procesar grandes volumen de información con el fin de sacar los datos más importante des
de estas masivas fuentes de almacenamiento, tales como información de clientes, que es lo
que más busca, edades, etc. para que esto suceda, existen muchas herramientas
actualmente y con diversas aplicaciones, depende de quien la utiliza tendrá mejores o
peores resultados, La MD es una disciplina que proporciona herramientas para "aprender de
los datos", convirtiendo los datos en información y conocimiento.
Un ejemplo de eso será la empresa Google, que recopila toda la información cuando
navegamos por su sitio y aplicaciones, esto conlleva a que Google tenga herramientas de
procesamiento de datos y que regularmente nos aparezcan anuncios relacionados con los
temas que buscamos por internet, esto le ayuda a dicha empresa predecir o mostrar al
usuario opciones de productos o servicios que le serán de utilidad para este.
Asignatura Datos del estudiante Fecha
Apellidos: Maycol Javier

Nombre: Garcia Pacheco

Discusión: 
Dudas, desacuerdos, discusiones
Con respecto a las redes neuronales
Según la información que estuve investigando las redes neuronales son capaces de aprender
esto quiere decir que con la tecnología suficiente y con los avenes de la ciencia esta redes
¿puedes ser capaces el superar el cerebro humano?

También podría gustarte