Está en la página 1de 3

ANALISIS EXPLORATORIO DE DATOS

 La finalidad del Análisis Exploratorio de Datos (AED) es examinar los datos previamente
a la aplicación de cualquier técnica estadística
 Nos ayudan a organizar la información que nos dan los datos de manera de detectar
algún patrón de comportamiento así como también apartamientos importantes al
modelo subyacente
 Nos presentan los datos de modo tal que sobresalga su estructura.
 Explorar los datos, debe ser la primera etapa de todo análisis de datos.
El análisis exploratorio de datos es el primer paso en el proceso de análisis de
resultados de un proyecto

Hay varias formas de organizar los datos:

♣ Métodos gráficos: permiten detectar tanto las características sobresalientes como las
características inesperadas.
♣ Medidas resumen: resumirlos en uno o dos números que pretenden caracterizar el
conjunto con la menor distorsión o pérdida de información posible.

¿Para qué sirve el análisis exploratorio de datos?


♣ Detectar errores y datos faltantes
♣ Mapeo de la estructura subyacente de los datos
♣ Identificación de las variables más importantes
♣ Listado de anomalías y valores atípicos
♣ Probar una hipótesis / verificar suposiciones relacionadas con un modelo específico
♣ Establecimiento de un modelo parsimonioso (uno que puede usarse para explicar
relaciones entre los datos utilizando un número mínimo de variables predictores)
♣ Estimación de parámetros y determinación de los intervalos de confianza asociados

¿Por qué explorar tu conjunto de datos por adelantado?

El propósito del análisis exploratorio de datos es “conocer” la muestra que tienes


entre manos
Hacerlo por adelantado hará que el resto del proyecto transcurra sin sobresaltos, en 3
formas principales: rápido, eficiente y con seguridad
Herramientas y técnicas para hacer análisis exploratorio de datos
Entre los paquetes estadísticos más importantes que se utilizan para realizar el análisis
exploratorio de datos se encuentran SPSS, SAS, Minitab y R.
Las funciones y técnicas estadísticas específicas que pueden llevarse a cabo con estas
herramientas incluyen:
Técnicas de agrupación y reducción de dimensiones, que te ayudan a crear gráficos
multidimensionales que contienen muchas variables;
Visualización univariable de cada campo en el conjunto de datos sin procesar, con
estadísticas de resumen;
Visualizaciones bivariadas y estadísticas de resumen que te permiten evaluar la
relación entre cada variable en el conjunto de datos y la variable objetivo;
Visualizaciones multivariadas, para mapear y comprender las interacciones entre
diferentes campos en los datos;
K-Means Clustering (creación de “centros” para cada cluster, basado en la media más
cercana);
Modelos predictivos, p. Ej. Regresión lineal

ETAPAS DEL A.E.D.


Para realizar un A.E.D. conviene seguir las siguientes etapas:

1) Preparar los datos para hacerlos accesibles a cualquier técnica estadística.

2) Realizar un examen gráfico de la naturaleza de las variables individuales a analizar y un


análisis descriptivo numérico que permita cuantificar algunos aspectos gráficos de los datos.

3) Realizar un examen gráfico de las relaciones entre las variables analizadas y un análisis
descriptivo numérico que cuantifique el grado de interrelación existente entre ellas.
4) Evaluar, si fuera necesario, algunos supuestos básicos subyacentes a muchas técnicas
estadísticas como, por ejemplo, la normalidad, linealidad y homocedasticidad.

5) Identificar los posibles casos atípicos (outliers) y evaluar el impacto potencial que puedan
ejercer en análisis estadísticos posteriores.

6) Evaluar, si fuera necesario, el impacto potencial que pueden tener los datos ausentes
(missing) sobre la representatividad de los datos analizados.

EJM: APLICACIÓN DE GEOESTADÍSTICA COMO METODOLOGÍA PARA LA ESTIMACIÓN DE


RECURSOS DE UN YACIMIENTO SEDIMENTARIO (MINAS PAZDELRIO S.A.)

También podría gustarte