Está en la página 1de 9

1 Tabla de contenido

2 Análisis Descriptivo, Predictivo y Prescriptivo de datos............................ 2

3 Bibliografía................................................................................................ 9
2 Análisis Descriptivo, Predictivo y Prescriptivo de datos

Hay tres tipos de análisis de datos que podemos realizar: descriptivo, predictivo y
prescriptivo. Veamos en qué consiste cada uno de ellos y cómo combinarlos.

• Análisis Descriptivo

El análisis descriptivo se ocupa de estudiar el pasado. Como el nombre indica, el


análisis descriptivo se usa para describir lo que ha pasado. Hay varias formas de
describir el pasado:

Usando estadísticas fáciles de entender, en plan: mínimo, máximo, media, mediana,


cuartiles, desviación típica, los 10 mejores / peores. La misma información se puede
dar agrupada. Por ejemplo, estadísticas de las ventas de una multinacional
agrupadas por país.

Usando gráficos que resuman los datos. Hay varios tipos de gráficos que pueden
ser útiles. Por ejemplo, evolución de ventas, beneficios y costes como serie
temporal. O también de distribución de datos; por ejemplo, histogramas con la edad
de los clientes.

Las tablas también son un aspecto fundamental del análisis descriptivo. Si habéis
visto el balance de una empresa a final de año, sabes de qué estoy hablando.

DIPLOMADO VIRTUAL EN: BIG DATA BUSINESS INTELLIGENCE


UNIDAD DIDÁCTICA 3: GESTIÓN DE LOS DATOS
TIPOS DE ANALÍTICA DE DATOS (DESCRIPTIVA,
DOCUMENTO:
DIAGNÓSTICA, PREDICTIVA Y PRESCRIPTIVA)
Pág. 2
• Análisis Predictivo

El análisis predictivo se refiere al uso de aprendizaje automático supervisado. A


efectos prácticos, normalmente consta de estos pasos:

Decidir qué es lo que queremos predecir en el futuro. Por ejemplo, predecir la


probabilidad de que un cliente haga click en un anuncio de Internet.

Decidir en qué datos van a estar basadas estas predicciones (atributos relevantes).
Por ejemplo, historial de compras, productos que ha buscado, productos que
normalmente se compran juntos, etc.

Darle a la Inteligencia Artificial datos históricos. Debemos incluir tanto los atributos
relevantes como el resultado que obtuvimos.

DIPLOMADO VIRTUAL EN: BIG DATA BUSINESS INTELLIGENCE


UNIDAD DIDÁCTICA 3: GESTIÓN DE LOS DATOS
TIPOS DE ANALÍTICA DE DATOS (DESCRIPTIVA,
DOCUMENTO:
DIAGNÓSTICA, PREDICTIVA Y PRESCRIPTIVA)
Pág. 3
Como estamos interesados en predecir, tenemos que estar seguros que la IA no
haya aprendido los datos de memoria. Es importante estar seguros que «ha
entendido» los datos. Esto quiere decir que ha extraído un modelo que refleja la
relación entre los datos de entrada y los resultados a predecir. Para estar seguros
tendremos que medir la generalización del modelo y realizar un análisis de errores.
Una vez que tenemos un modelo de IA del que nos podemos fiar, sólo nos queda
usarlo para predecir. Siguiendo el ejemplo anterior, podemos calcular la
probabilidad de que un usuario haga click en varios anuncios. Después podemos
ordenar los anuncios, de mayor a menor probabilidad, y mostrar los más probables.
Si quieres profundizar en las fases del proceso del análisis predictivo, puedes
consultar este artículo.

Como resumen, quédate con que en el análisis predictivo, lo más importante es la


calidad de la predicción.

• Análisis Prescriptivo

Con el análisis prescriptivo intentamos cambiar el futuro. Es decir, vamos a usar


Inteligencia Artificial para descubrir qué tenemos que hacer para obtener los
resultados que queremos.

Una forma de realizar análisis prescriptivo es usando modelos de inteligencia


artificial explicables. Por «explicables» quiero decir que podamos entender cómo el
modelo de machine learning está realizando su predicción.

DIPLOMADO VIRTUAL EN: BIG DATA BUSINESS INTELLIGENCE


UNIDAD DIDÁCTICA 3: GESTIÓN DE LOS DATOS
TIPOS DE ANALÍTICA DE DATOS (DESCRIPTIVA,
DOCUMENTO:
DIAGNÓSTICA, PREDICTIVA Y PRESCRIPTIVA)
Pág. 4
Actualmente los modelos de machine learning que mejor resultados dan para
predecir, son difíciles de interpretar. Por ejemplo, esto le pasa a las redes
neuronales profundas (deep learning) y a los bosques aleatorios (random forests).

Por ejemplo, para realizar el análisis de las noticias de portada de menéame, usé
regresión logística. La regresión logística es un modelo fácilmente interpretable. Así
que podemos inspeccionar lo que ha aprendido y cómo los datos de entrada influyen
en los resultados.

Si conseguimos encontrar qué causa los resultados que queremos … entonces ya


sabremos lo que tenemos que hacer. Aunque con cuidado.

Tenemos que tener cuidado cuando inspeccionamos los modelos de machine


learning. Aunque un modelo sea muy bueno prediciendo, podría haber aprendido
los datos de memoria. Primero hay que asegurarse de que el modelo generaliza
bien.

También ayuda mucho la Inteligencia Humana (IH). Nosotros podemos en muchos


casos validar lo que nos está diciendo la IA, especialmente si tenemos una mente
abierta y sentido común.

• Experimentos aleatorios (randomized tests)

Después de usar una IA explicable, asegurarnos que generaliza bien y usar nuestra
inteligencia humana … el último paso es realizar experimentos aleatorios
(randomized tests).

DIPLOMADO VIRTUAL EN: BIG DATA BUSINESS INTELLIGENCE


UNIDAD DIDÁCTICA 3: GESTIÓN DE LOS DATOS
TIPOS DE ANALÍTICA DE DATOS (DESCRIPTIVA,
DOCUMENTO:
DIAGNÓSTICA, PREDICTIVA Y PRESCRIPTIVA)
Pág. 5
Estos experimentos se usan mucho en farmacia. Son el estándar para demostrar la
efectividad de un medicamento. También se usan mucho para la optimización de
sitios web y marketing. En este contexto se les llama tests A/B.

• Ejemplo de test aleatorio

Por ejemplo, creamos un modelo de machine learning para predecir cuánto tiempo
un usuario va a visitar un sitio web. Usamos un modelo de machine learning
explicable y nos damos cuenta que unos de los factores principales es el tamaño de
letra de la página que visitan.

Podríamos concluir que lo que tenemos que hacer es aumentar el tamaño de letra
de todos los artículos. Pero hay otros factores que no estamos considerando. Por
ejemplo, a lo mejor los distintos tamaños de letra corresponden a las preferencias
de los autores de los artículos. Así que, en este casos, los visitantes del sitio web
tendrían preferencia por el autor, en lugar de por el tamaño de letra.

Para estar seguros tendríamos que realizar un experimento aleatorio. Conforme


vayan llegando usuarios, aleatoriamente les daríamos una de dos versiones: una
en la que todas las páginas tienen una fuente mayor, y otra en la que la fuente es
normal. Al medir los resultados de este experimento podríamos saber realmente si
un tamaño de letra mayor es una causa del tiempo en el sitio web.

DIPLOMADO VIRTUAL EN: BIG DATA BUSINESS INTELLIGENCE


UNIDAD DIDÁCTICA 3: GESTIÓN DE LOS DATOS
TIPOS DE ANALÍTICA DE DATOS (DESCRIPTIVA,
DOCUMENTO:
DIAGNÓSTICA, PREDICTIVA Y PRESCRIPTIVA)
Pág. 6
• Resumen

En este artículo hemos visto las diferencias entre los análisis descriptivo, predictivo
y prescriptivo. Una resumen rápido sería:

• Análisis Descriptivo: describe lo que ha pasado con estadísticas, gráficos,


tablas e informes.
• Análisis Predictivo: realiza predicciones que van a ser útiles en el futuro. La
calidad de la predicción es lo más importante
• Análisis Prescriptivo: ayuda a entender qué tenemos que hacer para obtener
los resultados que queramos en el futuro

Relacionado:

Inteligencia Artificial aplicada a meneame.net En este artículo, vamos a aplicar


Inteligencia Artificial a todas las noticias de portada de meneame.net en 2018.
Empezaremos realizando un análisis estadístico y visualización de datos. Después
usaremos Procesamiento...

Redes neuronales desde cero (I) – Introducción En este primer post de una serie de
tres, hablaremos de una de las ramas más importantes del Machine Learning y la
Inteligencia Artificial, las redes neuronales. Abordaremos este tema...

Análisis de Errores en Machine Learning El análisis de errores es una de las fases


del proceso de machine learning más importantes. El análisis de errores nos va a
permitir saber qué hacer para mejorar el...

DIPLOMADO VIRTUAL EN: BIG DATA BUSINESS INTELLIGENCE


UNIDAD DIDÁCTICA 3: GESTIÓN DE LOS DATOS
TIPOS DE ANALÍTICA DE DATOS (DESCRIPTIVA,
DOCUMENTO:
DIAGNÓSTICA, PREDICTIVA Y PRESCRIPTIVA)
Pág. 7
Clustering (Agrupamiento), K-Means con ejemplos en python El clustering consiste
en la agrupación automática de datos. Es un tipo de aprendizaje automático no-
supervisado. En castellano se denomina agrupamiento. Vamos a ver en más detalle
en qué consiste...

DIPLOMADO VIRTUAL EN: BIG DATA BUSINESS INTELLIGENCE


UNIDAD DIDÁCTICA 3: GESTIÓN DE LOS DATOS
TIPOS DE ANALÍTICA DE DATOS (DESCRIPTIVA,
DOCUMENTO:
DIAGNÓSTICA, PREDICTIVA Y PRESCRIPTIVA)
Pág. 8
3 Bibliografía

• https://www.iartificial.net/analisis-predictivo-y-prescriptivo-con-machine-
learning/

DIPLOMADO VIRTUAL EN: BIG DATA BUSINESS INTELLIGENCE


UNIDAD DIDÁCTICA 3: GESTIÓN DE LOS DATOS
TIPOS DE ANALÍTICA DE DATOS (DESCRIPTIVA,
DOCUMENTO:
DIAGNÓSTICA, PREDICTIVA Y PRESCRIPTIVA)
Pág. 9

También podría gustarte