Big Data Mineria de Datos y Redes Neuronales

BIG DATA
En primer lugar, para definir el concepto de Big Data sería conveniente hablar:
De datos no estructurados que son datos que no tienen un orden específico;
datos estructurados ya son los datos guardados de forma ordenada, luego
hablemos de una base de datos que es en donde almacenamos los datos También
tenemos el término on price que son las empresas que nos almacenan nuestros
datos.
Se puede definir a Big Data como un gran volumen de información de diferentes

Fuentes, en cuenta una sola fuente por más grande que sea esta fuente tiene que
venir de diferentes Fuentes con diferentes estructuras y a una velocidad tan
rápida que se puede hacer on-price con herramientas como hadot, pero lo mejor
es subir en la nube porque es más barato.
El Big data debe cumplir con 5V:
• Volumen: gran cantidad de información.

• Variabilidad: que los datos sean diferentes.
• Velocidad: con que velocidad cambian los datos.
• Veracidad: saber que datos son veraces y que no.
• Valor: saber que tan pertinente es esta información.
Se analizan los datos con un proceso llamado ETL.
E: extracción, cuando se capturan todos los datos de la fuente y los

centralizamos.
T: transformación, cuando estandarizamos los datos.
L: lout, es la carga de información.
El ciclo de la vida de los datos.

• Captura(ingesta)
• Almacenamiento
• Procesamiento y análisis
• Exploración y visualización.
LA MINERIA DE DATOS
Es importante definir que la minería de datos es un método que se aplica

para obtener conocimientos, KDD son procesos en el cual se identifican
patrones útiles, los almacenes de datos forman parte del KDD y que es
una colección de datos, almacenados bajo un esquema unitarios, reside
en un único lugar.
El KDD:
• Se usa para procesar grandes cantidades de datos.
• Identificar patrones relevantes.
• General resultados.
Además, se puede decir que la minería de datos son distintos procesos

cualitativos en donde trabajamos con grandes cantidades de datos,
haciendo uso de herramientas como lo son las bases de datos algunos
sistemas computacionales para generar información y como resultado
final vamos a tener información para ser analizada y estudiada para
generar más conocimiento.
• Métodos de la minería de datos
• Clasificación.
• Clustering.
• Asociación.
Clustering: Es una técnica de análisis de datos, el objetivo es ordenar

datos en grupos de forma que el nivel de asociación o similitud entre ellos
sea fuerte.
Entre la clasificación de clustering tenemos la jerárquica y no jerárquica;
y los métodos aglomerados y divisivos.
FASE DE LA MINERIA DE DATOS
Las fases de la minería de datos son las siguientes:
• Selección: seleccionar datos fuentes adecuados a nuestros problemas.

• Procesamiento: preparación previa de los datos a trabajar; para eliminar
errores, anomalías, inconsistencias.
• Selección de variables: elegir los mejores atributos del problema, buscar
variables independientes mediante test.
• Extracción del conocimiento: a partir de patrones se generan un modelo
que representa el comportamiento de los valores del problema.
• Interpretación: conclusiones válidas.
la minería de datos se aplica en: marketing, webmining, universidades, control

de calidad, negocios, predicción.
Redes Neuronales
Las Redes Neuronales son un campo muy importante dentro de la Inteligencia

Artificial. Inspirándose en el comportamiento conocido del cerebro humano
(principalmente el referido a las neuronas y sus conexiones), trata de crear
modelos artificiales que solucionen problemas difíciles de resolver mediante
técnicas algorítmicas convencionales.
En esta página web trataremos de acercar al visitante a este tema, mostrando las
bases neurológicas y matemáticas, los principales modelos vigentes y ejemplos
interactivos que solucionan algunos problemas de forma eficaz.
LA NEURONA BIOLÓGICA
Fue Ramón y Cajal (1888) quién descubrió la estructura celular (neurona) del
sistema nervioso. Defendió la teoría de que las neuronas se interconectaban
entre sí de forma paralela, y no formando un circuito cerrado como el sistema
sanguíneo.
Una neurona consta de un cuerpo celular (soma) de entre 10 y 80 mm, del que
surge un denso árbol de ramificaciones (dendritas) y una fibra tubular (axón) de
entre 100 mm y un metro.
De alguna forma, una neurona es un procesador de información muy simple:
Canal de entrada: dendritas.
Procesador: soma.
Canal de salida: axón.
Una neurona cerebral puede recibir unas 10.000 entradas y enviar a su vez su
salida a varios cientos de neuronas.
La conexión entre neuronas se llama sinapsis. No es una conexión física, si no
que hay unos 2 mm de separación. Son conexiones unidireccionales, en la que
la transmisión de la información se hace de forma eléctrica en el interior de la
neurona y de forma química entre neuronas; gracias a unas sustancias
específicas llamadas neurotransmisores.
No todas las neuronas son iguales, existen muchos tipos diferentes según el
número de ramificaciones de sus dendritas, la longitud del axón y otros detalles
estructurales. Sin embargo, como hemos visto, todas ellas operan con los
mismos principios básicos.
MODELO DE NEURONA ARTIFICIAL
El modelo de Rumelhart y McClelland (1986) define un elemento de proceso

(EP), o neurona artificial, como un dispositivo que, a partir de un conjunto de
entradas, xi (i=1...n) o vector x, genera una única salida y.
RED NEURONAL ARTIFICIAL
Una red neuronal artificial (RNA) se puede definir (Hecht – Nielssen 93)
como un grafo dirigido con las siguientes restricciones:
1. Los nodos se llaman elementos de proceso (EP).
2. Los enlaces se llaman conexiones y funcionan como caminos

unidireccionales instantáneos
3. Cada EP puede tener cualquier número de conexiones.
4. Todas las conexiones que salgan de un EP deben tener la misma señal.
5. Los EP pueden tener memoria local.

6. Cada EP posee una función de transferencia que, en función de las
entradas y la memoria local produce una señal de salida y / o altera la
memoria local.
7. Las entradas a la RNA llegan del mundo exterior, mientras que sus salidas
son conexiones que abandonan la RNA.
ARQUITECTURA DE LAS RNA
La arquitectura de una RNA es la estructura o patrón de conexiones de la red.

Es conveniente recordar que las conexiones sinápticas son direccionales, es
decir, la información sólo se transmite en un sentido.
En general, las neuronas suelen agruparse en unidades estructurales

llamadas capas. Dentro de una capa, las neuronas suelen ser del mismo tipo. Se
pueden distinguir tres tipos de capas:
De entrada: reciben datos o señales procedentes del entorno.
De salida: proporcionan la respuesta de la red a los estímulos de la entrada.
Ocultas: no reciben ni suministran información al entorno (procesamiento

interno de la red).
Generalmente las conexiones se realizan entre neuronas de distintas capas, pero

puede haber conexiones intracapa o laterales y conexiones
de realimentación que siguen un sentido contrario al de entrada-salida.

Big Data Mineria de Datos y Redes Neuronales

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Big Data Mineria de Datos y Redes Neuronales

Cargado por

Copyright:

Formatos disponibles

BIG DATA

Se puede definir a Big Data como un gran volumen de información de diferentes

El Big data debe cumplir con 5V:

• Volumen: gran cantidad de información.

Se analizan los datos con un proceso llamado ETL.

E: extracción, cuando se capturan todos los datos de la fuente y los

T: transformación, cuando estandarizamos los datos.

L: lout, es la carga de información.

El ciclo de la vida de los datos.

Es importante definir que la minería de datos es un método que se aplica

Además, se puede decir que la minería de datos son distintos procesos

Clustering: Es una técnica de análisis de datos, el objetivo es ordenar

FASE DE LA MINERIA DE DATOS

Las fases de la minería de datos son las siguientes:

• Selección: seleccionar datos fuentes adecuados a nuestros problemas.

la minería de datos se aplica en: marketing, webmining, universidades, control

Las Redes Neuronales son un campo muy importante dentro de la Inteligencia

De alguna forma, una neurona es un procesador de información muy simple:

Canal de entrada: dendritas.

Canal de salida: axón.

MODELO DE NEURONA ARTIFICIAL

El modelo de Rumelhart y McClelland (1986) define un elemento de proceso

RED NEURONAL ARTIFICIAL

1. Los nodos se llaman elementos de proceso (EP).

2. Los enlaces se llaman conexiones y funcionan como caminos

3. Cada EP puede tener cualquier número de conexiones.

4. Todas las conexiones que salgan de un EP deben tener la misma señal.

5. Los EP pueden tener memoria local.

ARQUITECTURA DE LAS RNA

La arquitectura de una RNA es la estructura o patrón de conexiones de la red.

En general, las neuronas suelen agruparse en unidades estructurales

De entrada: reciben datos o señales procedentes del entorno.

De salida: proporcionan la respuesta de la red a los estímulos de la entrada.

Ocultas: no reciben ni suministran información al entorno (procesamiento

Generalmente las conexiones se realizan entre neuronas de distintas capas, pero

También podría gustarte