Está en la página 1de 26

Fundamentos de Analítica: Métodos y

Alejandro Flores Z. PhD.


fuentes de datos
• Comprender los principales elementos
de analítica de datos
Objetivos • Identificar los conceptos básicos del
proceso de analítica
Contenidos
• Analítica y analítica avanzada
• Proceso de Optimización
• Modelo de madurez de analítica
• Algunos conceptos básicos de analítica
¿Cuáles son los desafíos de política pública en materia
educacional y laboral que impone el advenimiento de
la automatización y la IA?
Algunos datos
• En los próximos años, el 17% de los
trabajos en Chile tienen un alto riesgo
de automatización*
• Esto significa que cerca de 1.100.000
empleos pueden ser desarrollados por
robots, en reemplazo de los humanos
• En el largo plazo el promedio de
probabilidad de automatización alcanza
el 42%
• Las áreas con mayor probabilidad de
automatización son minería, transporte y
comunicaciones
*Centro Latinoamericano de Políticas Económicas y Sociales de la Pontificia Universidad Católica de Chile (Clapes UC)
Analytics
• Analytics se refiere a las habilidades, tecnologías, aplicaciones y
prácticas para la exploración iterativa continua y la investigación de
datos para obtener información e impulsar el análisis en la
organización
• Corresponde al uso de técnicas de modelado para predecir eventos
futuros o descubrir patrones que de otro modo no se pueden
detectar
• El análisis puede responder a preguntas como "Por qué está
sucediendo esto", "qué pasa si estas tendencias continúan", "qué
sucederá después" (predicción), "qué es lo mejor que puede suceder"
(optimización)
Advanced Analytics
• Advanced Analytics se ocupa de la comunicación automática
y de patrones significativos en datos estructurados y no
estructurados
• Con análisis avanzados los analistas se preguntan ¿qué va a
pasar?, el análisis puede anticipar acciones
• Las metodologías y tecnologías tanto de estadísticas como
de la informática desempeñan un papel importante en el
desarrollo de análisis avanzados, contribuyendo a la
disciplina de Advanced Analytics
• Las principales contribuciones provienen de Machine
Learning y Data Mining
Acciones
Nivel de capacidad Analítica ¡Abismo!
Productividad
optimizadas
Clasificación Gartner para

(Valor)
(Sistemas Autónomos)
grupos analíticos
Análisis
Prescriptivo
Análisis ¿Cuál es la
Predictivo mejor
acción?
Autoservicio BI
Reportes Ágil ¿Cómo hacer que
Ad Hoc y visualización esto ocurra?
Reportes ¿Qué pasará?
Datos OLAP
Datos Limpios estándar
Fuentes ¿Por qué pasó?
Modelos
¿Qué pasó? Causales

Madurez de las capacidades analíticas


(Inteligencia mejorada de máquina)
Previsión

Visión

Valor
Visión
¿Cómo podemos
hacer que pase?
Retrospectiva
¿Qué pasará?

Organizaciones utilizan
Organizaciones utilizan
análisis prescriptivo para
proponer acciones
basadas en predicciones
Analytics y
¿Por qué pasó?
análisis predictivo para
previsualizar los mas
probables resultados de
eventos que se estén
valor para
En un nivel más

¿Qué pasó?
profundo, se aplica
analítica descriptiva para
obtener una visión de
suscitando. Utilizando
para ello diversas fuentes
de datos estructurados y
organizations
El nivel más básico de situaciones utilizando no estructurados
uso de Data Analytics datos complejos
El objetivo es construir Usuarios miden y analizan
repositorios de datos y métricas como el ROI u
reportar situaciones otros indicadores
concurrentes

Dificultad
Descriptive analytics
• Estos análisis son los más fáciles de implementar, pero
muchas veces no ofrecen el valor de otros métodos, que
generalmente son más complejos y sofisticados
• El análisis descriptivo generalmente cae en una de las
siguientes categorías:
• Estadísticas descriptivas y resúmenes numéricos
• Representación visual
Diagnostic analytics
• Es una forma de análisis avanzado que examina datos o contenido
para responder a la pregunta: "¿Por qué sucedió?"
• Es causal y retrospectiva
• Tiene un significado causal en el sentido de que un cambio en un atributo
(una causa) general o específicamente resultará en un cambio observable en
un segundo atributo (el efecto)
• Además, la causa debe preceder al efecto
• Es importante tener en cuenta la diferencia en la asociación o correlación con
la causalidad (ver el cuadro gris a continuación sobre "Causalidad vs
Correlación")
Predictive Analytics
• El análisis predictivo es la práctica de analizar datos para hacer predicciones
estadísticamente precisas sobre eventos futuros
• El análisis predictivo abarca una variedad de técnicas de estadísticas asistidas por
computadora, Machine Learning y minería de datos que analizan hechos actuales
e históricos para realizar predicciones sobre eventos futuros o desconocidos
• En entornos empresariales, los modelos predictivos encuentran y explotan
automáticamente los patrones que se encuentran en los datos históricos y
transaccionales para extrapolar eventos y, por ese medio, predecir el futuro más
probable
• Los modelos que describen esos patrones capturan relaciones entre muchos más
factores de los que los seres humanos pueden manejar. Esto permite, por
ejemplo, la identificación de riesgos y oportunidades previamente desconocidos
Prescriptive Analytics
• El análisis prescriptivo es un tipo de análisis de datos que utiliza
tecnologías para ayudar a las empresas a tomar mejores decisiones a
través del análisis de datos sin procesar
• Específicamente, el análisis prescriptivo tiene información sobre
posibles situaciones o escenarios, los recursos disponibles, el
rendimiento pasado y el rendimiento actual, y sugiere un curso de
acción o estrategia
• Se puede utilizar para tomar decisiones en cualquier horizonte
temporal, desde lo inmediato hasta a largo plazo
• Lo opuesto al análisis prescriptivo es el análisis descriptivo, que
examina las decisiones y los resultados después del hecho
Ir más allá de los datos tabulados

• Cuando la mayoría de las personas de negocios piensan en datos,


imaginan una base de datos clásica, o una hoja de cálculo, filas
organizadas o columnas de números normalmente, es decir, datos
tabulares. Sin embargo, cada vez más datos que se recopilan hoy en
día no están estructurados. También están relacionados con el análisis
predictivo campos como:
• Análisis de texto, que permite a los usuarios obtener información a partir de
datos no estructurados como colecciones de texto
• Multimedia Analytics, que utiliza tecnología similar para transformar datos no
estructurados como imágenes, audio y vídeo en un formato estructurado que
se puede utilizar como base para análisis predictivos o descriptivos
Proceso de Optimización
• Utilizamos la palabra optimización de una manera muy estricta y
rigurosa
• En general comenzamos con una función objetiva que declaramos
explícitamente, Indicamos si queremos maximizar o minimizar esta
función, esto es optimización
• Agregamos restricciones que no se pueden violar
• Luego buscamos soluciones que maximicen o minimicen nuestra
función y no violen nuestras restricciones
• La solución tiene el valor más alto o más bajo de la función objetivo es la
solución óptima
Embedded Analytics Maturity Model

Autoservicio
Respuesta u
Valor para el usuario

Flujo de trabajo
UI

Seguridad

Datos
Nivel 0 Nivel 1 Nivel 2 Nivel 3 Nivel 4
Stand-alone analytics
• Es la primer estado en la introducción de analítica en una
organización
• Se caracteriza por soluciones parcializadas no integradas y que, por lo
generar, se han incorporado para dar soluciones a requerimientos
particulares de usuarios o áreas de la empresa
• Otra característica es que su adquisición, en la mayoría de los casos,
no es parte de un plan de desarrollo de TICs que forme parte de la
estrategia de la empresa
• El resultado es herramientas heterogenias provenientes de diversos
proveedores que no interactúan entre si.
Bolt-on Analytics
• El software Bolt-on es un software que se puede conectar fácilmente
a un proyecto de cliente, por ejemplo, un sitio web
• El término "bolt-on" es similar al término "plug-and-play" que se
utiliza para describir piezas de software que se integran fácilmente en
otros sistemas más grandes
• Algunos también podrían llamar a estos "complementos".
• Pueden ser o no parte de la estrategia principal de la compañía
• Normalmente son aplicaciones adiciónalas a las ya adquiridas y que
proveen un nivel de análisis histórico y o predictivo limitado
Inline analytics
• Inline analytics, la forma más popular de incrustación, es la etapa 2 en
el modelo de madurez
• En este modelo, la funcionalidad de análisis aparece dentro de la
interfaz de usuario general de la aplicación, lo que crea una mejor
experiencia de usuario
• El análisis en línea a menudo se implementa como una pestaña o
módulo de informes
• Otro ejemplo sería un panel en la página principal de la aplicación
que los usuarios ven directamente al iniciar sesión
• Con análisis integrados en el nivel de presentación de la aplicación, es
ideal para que la apariencia de la funcionalidad de análisis coincida
con la interfaz de usuario de la aplicación principal
Infused Analytics
• Lo que hace que una gran experiencia de usuario para las aplicaciones de consumo hoy
en día es la forma en que incorporan datos y análisis como parte natural de su aplicación,
proporcionando la información necesaria que conduce a su transacción deseada
• Por ejemplo, Amazon proporciona revisiones y sugerencias de productos junto con el
botón Comprar ahora
• Al infundir análisis directamente en flujos de trabajo de aplicaciones principales como lo
hacen las aplicaciones de consumo, las aplicaciones empresariales también pueden crear
una experiencia de usuario potente e innovadora, al combinar la información analítica
con sus capacidades transaccionales
• Por ejemplo, un CRM puede proporcionar a un administrador de ventas la capacidad de
analizar el rendimiento de ventas por territorio, identificar un territorio de bajo
rendimiento y cambiar las asignaciones de territorio en la misma pantalla
Genius Analytics

• El estado final es la
completa integración de
analítica a las
aplicaciones utilizadas
diariamente por lo
tomadores de decisiones
• Una integración completa
que permite una
experiencia de uso y
simpleza en el proceso de
toma de decisiones
Algunos conceptos básicos de analítica
• Escalas de medición: a un nivel muy básico, los datos pueden
asumir cuatro niveles de medición:
• Escala nominal: solo por "nombre", no tienen valor numérico. Esta es la escala de
medición más baja. No hay orden de elementos y las medidas son cualitativas. Un
ejemplo es el color: rojo, verde, azul.
• Escala ordinal: similar a la nominal en el sentido de que no hay una relación
numérica explícita, excepto que las mediciones de este tipo tienen orden. Las
mediciones son cualitativas. Ejemplo, corredores en una carrera lugar 1º, 2º, 3º, etc.
• Escala de intervalos: los datos de intervalos no solo tienen orden, sino que también
la distancia relativa entre los números en la escala es igual (proporcional) y se puede
evaluar matemáticamente. Las mediciones son cuantitativas. Ejemplo: ganancia.
Puede ser positivo, negativo o cero y una duplicación de la ganancia es lo mismo si se
pasa de US$10 a US$20 o US$2M a US$4M.
• Escala de relación: la escala más alta, la escala de relación tiene las características de
la escala de intervalo y tiene un cero verdadero. Las mediciones son cuantitativas.
Ejemplo – Altura. No se puede tener una altura cero o negativa.
Algunos conceptos básicos de analítica
• Formato de los datos: puede referirse a tipos de datos, formatos de
grabación y contenido, formatos de archivo y más:
Formato del Datos Ejemplo de aplicación analítica
Palabras Text Analytics, Natural Language, Search Analytics, Web Analytics
Números Healthcare Analytics, Business Analytics, Risk Analytics, Financial
Analytics
Imágenes/Dibujos Image Analytics, Sports Analytics, Visual Analytics, Geospatial Analytics
Audio/Sonidos Voice Recognition/Transcription, Security Analytics, Call Center
Analytics
Video Video Analytics, IoT and Smart Cities, Retail Analytics, Streaming
Analytics
Algunos conceptos básicos de analítica
• Almacenamiento de los datos: La mayoría de los datos analíticos se
almacenan al menos temporalmente. Se puede pensar que todo el
desarrollo analítico utiliza el almacenamiento de datos:
• Archivos locales, hojas de cálculo, bases de datos, texto, xml, html
• Bases de datos relacionales en las instalaciones
• Bases de datos semiestructuradas (no lake) en las instalaciones (JSON,
XML, logs, NoSQL)
• Data lake, big data stores (Apache y Hadoop)
• Opciones de almacenamiento en la nube (software como servicio, base
de datos como servicio, infraestructura y plataforma como servicio)
• Streaming data, esto es más un conector que un almacenamiento; se
señala aquí, ya que el análisis de Streaming está creciendo rápidamente
Provisionamiento de datos para
el análisis: Ciclo del dato

También podría gustarte