Está en la página 1de 7

BIG DATA

En primer lugar, para definir el concepto de Big Data sería conveniente hablar:
De datos no estructurados que son datos que no tienen un orden específico;
datos estructurados ya son los datos guardados de forma ordenada, luego
hablemos de una base de datos que es en donde almacenamos los datos También
tenemos el término on price que son las empresas que nos almacenan nuestros
datos.

Se puede definir a Big Data como un gran volumen de información de diferentes


Fuentes, en cuenta una sola fuente por más grande que sea esta fuente tiene que
venir de diferentes Fuentes con diferentes estructuras y a una velocidad tan
rápida que se puede hacer on-price con herramientas como hadot, pero lo mejor
es subir en la nube porque es más barato.

El Big data debe cumplir con 5V:

• Volumen: gran cantidad de información.


• Variabilidad: que los datos sean diferentes.
• Velocidad: con que velocidad cambian los datos.
• Veracidad: saber que datos son veraces y que no.
• Valor: saber que tan pertinente es esta información.

Se analizan los datos con un proceso llamado ETL.

E: extracción, cuando se capturan todos los datos de la fuente y los


centralizamos.

T: transformación, cuando estandarizamos los datos.

L: lout, es la carga de información.

El ciclo de la vida de los datos.


• Captura(ingesta)
• Almacenamiento
• Procesamiento y análisis
• Exploración y visualización.

LA MINERIA DE DATOS

Es importante definir que la minería de datos es un método que se aplica


para obtener conocimientos, KDD son procesos en el cual se identifican
patrones útiles, los almacenes de datos forman parte del KDD y que es
una colección de datos, almacenados bajo un esquema unitarios, reside
en un único lugar.

El KDD:
• Se usa para procesar grandes cantidades de datos.
• Identificar patrones relevantes.
• General resultados.

Además, se puede decir que la minería de datos son distintos procesos


cualitativos en donde trabajamos con grandes cantidades de datos,
haciendo uso de herramientas como lo son las bases de datos algunos
sistemas computacionales para generar información y como resultado
final vamos a tener información para ser analizada y estudiada para
generar más conocimiento.
• Métodos de la minería de datos
• Clasificación.
• Clustering.
• Asociación.

Clustering: Es una técnica de análisis de datos, el objetivo es ordenar


datos en grupos de forma que el nivel de asociación o similitud entre ellos
sea fuerte.
Entre la clasificación de clustering tenemos la jerárquica y no jerárquica;
y los métodos aglomerados y divisivos.

FASE DE LA MINERIA DE DATOS

Las fases de la minería de datos son las siguientes:

• Selección: seleccionar datos fuentes adecuados a nuestros problemas.


• Procesamiento: preparación previa de los datos a trabajar; para eliminar
errores, anomalías, inconsistencias.
• Selección de variables: elegir los mejores atributos del problema, buscar
variables independientes mediante test.
• Extracción del conocimiento: a partir de patrones se generan un modelo
que representa el comportamiento de los valores del problema.
• Interpretación: conclusiones válidas.

la minería de datos se aplica en: marketing, webmining, universidades, control


de calidad, negocios, predicción.
Redes Neuronales

Las Redes Neuronales son un campo muy importante dentro de la Inteligencia


Artificial. Inspirándose en el comportamiento conocido del cerebro humano
(principalmente el referido a las neuronas y sus conexiones), trata de crear
modelos artificiales que solucionen problemas difíciles de resolver mediante
técnicas algorítmicas convencionales.

En esta página web trataremos de acercar al visitante a este tema, mostrando las
bases neurológicas y matemáticas, los principales modelos vigentes y ejemplos
interactivos que solucionan algunos problemas de forma eficaz.

LA NEURONA BIOLÓGICA

Fue Ramón y Cajal (1888) quién descubrió la estructura celular (neurona) del
sistema nervioso. Defendió la teoría de que las neuronas se interconectaban
entre sí de forma paralela, y no formando un circuito cerrado como el sistema
sanguíneo.

Una neurona consta de un cuerpo celular (soma) de entre 10 y 80 mm, del que
surge un denso árbol de ramificaciones (dendritas) y una fibra tubular (axón) de
entre 100 mm y un metro.

De alguna forma, una neurona es un procesador de información muy simple:

Canal de entrada: dendritas.

Procesador: soma.

Canal de salida: axón.

Una neurona cerebral puede recibir unas 10.000 entradas y enviar a su vez su
salida a varios cientos de neuronas.
La conexión entre neuronas se llama sinapsis. No es una conexión física, si no
que hay unos 2 mm de separación. Son conexiones unidireccionales, en la que
la transmisión de la información se hace de forma eléctrica en el interior de la
neurona y de forma química entre neuronas; gracias a unas sustancias
específicas llamadas neurotransmisores.

No todas las neuronas son iguales, existen muchos tipos diferentes según el
número de ramificaciones de sus dendritas, la longitud del axón y otros detalles
estructurales. Sin embargo, como hemos visto, todas ellas operan con los
mismos principios básicos.

MODELO DE NEURONA ARTIFICIAL

El modelo de Rumelhart y McClelland (1986) define un elemento de proceso


(EP), o neurona artificial, como un dispositivo que, a partir de un conjunto de
entradas, xi (i=1...n) o vector x, genera una única salida y.

RED NEURONAL ARTIFICIAL

Una red neuronal artificial (RNA) se puede definir (Hecht – Nielssen 93)
como un grafo dirigido con las siguientes restricciones:

1. Los nodos se llaman elementos de proceso (EP).

2. Los enlaces se llaman conexiones y funcionan como caminos


unidireccionales instantáneos

3. Cada EP puede tener cualquier número de conexiones.

4. Todas las conexiones que salgan de un EP deben tener la misma señal.

5. Los EP pueden tener memoria local.


6. Cada EP posee una función de transferencia que, en función de las
entradas y la memoria local produce una señal de salida y / o altera la
memoria local.

7. Las entradas a la RNA llegan del mundo exterior, mientras que sus salidas
son conexiones que abandonan la RNA.

ARQUITECTURA DE LAS RNA

La arquitectura de una RNA es la estructura o patrón de conexiones de la red.


Es conveniente recordar que las conexiones sinápticas son direccionales, es
decir, la información sólo se transmite en un sentido.

En general, las neuronas suelen agruparse en unidades estructurales


llamadas capas. Dentro de una capa, las neuronas suelen ser del mismo tipo. Se
pueden distinguir tres tipos de capas:

De entrada: reciben datos o señales procedentes del entorno.

De salida: proporcionan la respuesta de la red a los estímulos de la entrada.

Ocultas: no reciben ni suministran información al entorno (procesamiento


interno de la red).

Generalmente las conexiones se realizan entre neuronas de distintas capas, pero


puede haber conexiones intracapa o laterales y conexiones
de realimentación que siguen un sentido contrario al de entrada-salida.

También podría gustarte