Está en la página 1de 6

1

MINERÍA DE DATOS
APLICADA A REDES ELÉCTRICAS

ANÁLISIS DE DATOS MULTIVARIANTES

Dr.-Ing. Jaime Cepeda


Mayo 2023
1
2

Problema del Manejo de Información


Sistemas Eléctricos: generación, transmisión, distribución y comercialización

Componentes Componentes Componentes


Técnicos Administrativo Financieros

Genera gran cantidad y diversidad información


Software de adquisición de datos y almacenamiento: SCADA, registros
de carga, sistemas de información geográfica y sistemas comerciales

Análisis y tratamiento de datos (Análisis Multivariantes)

Planificar, administrar y gestionar de forma


óptima el sistema y suministro de energía eléctrica. SMART GRID
3

Análisis Multivariante
Definición:
 “El Análisis Multivariante es la rama de la Estadística y del análisis
de datos, que estudia, interpreta y elabora el material estadístico
sobre un conjunto de p>1 variables, que pueden ser
cuantitativas, cualitativas o una mezcla.” (Cuadras, 1981)

Objetivos:
1. Resumir los datos mediante un pequeño conjunto de nuevas
variables con la mínima pérdida de información
2. Encontrar grupos en los datos, si existen
3. Clasificar nuevas observaciones en grupos definidos
4. Relacionar dos conjuntos de variables
5. Clasificación, regresión, predicción, aprendizaje
4

Análisis Multivariante
 El análisis de datos multivariante puede plantearse a dos niveles:

1. Queremos extraer la información que contienen los datos


disponibles EXPLORACIÓN DE DATOS (o minería de
datos)
2. Buscamos obtener conclusiones sobre la población que ha
generado los datos lo que requiere construir un modelo que
explique su obtención y permita prever valores futuros
INFERENCIA - APRENDIZAJE
5

Análisis Multivariante
Objetivos Enfoque descriptivo Enfoque inferencial
(información) (conocimiento)

Resumir los Descripción de datos Construcción de modelos


datos
Obtener Componentes principales Feature extraction
Indicadores Escalado multidimensional Feature reduction
Análisis de correspondencias
Clasificar Análisis de conglomerados Machine Learning
Agrupar Análisis de conglomerados Machine Learning
Relacionar Regresión multivariable Machine Learning
variables
6

Programas de Análisis Estadístico


 STATGRAPHICS: buenas capacidades gráficas fáciles de usar.
 MINITAB: más completo, también de fácil manejo, más cómodo para
la manipulación de datos y la lectura de ficheros en distintos formatos.
 SPSS: más avanzado y con mejores capacidades para el manejo de
datos. Permite analizar gran cantidad de variables de distintos tipos.
 S-PLUS: muchas rutinas que se pueden combinar para hacer análisis de
datos más complejos y puede ser programado.
 Software R: es similar a S-PLUS y tiene las ventajas de ser robusto,
poseer rutinas base y paquetes adicionales, estar en constante
actualización y ser de distribución gratuita.
 MATLAB: excelentes capacidades para manejo de matrices,
permiten escribir programas propios y probar análisis nuevos.
 PYTHON: es un lenguaje de programación versátil ideal para scripting
y desarrollo de aplicaciones en diversas áreas (e.g. análisis de datos).

También podría gustarte