Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Presentación de Sesiones 13-14
Presentación de Sesiones 13-14
ANALÍTICA
PARA LA TOMA
DE DECISIONES
Sesiones 13-14
Caso
Aprendizaje Supervisado
Aprendizaje No Supervisado
Otros Ejemplos:
• Recomendaciones de compra basado en historial de compras y navegación
• Agrupar artículos que se suelen vender juntos.
Indicador: Análisis de Compra
Importancia Relativa (Support):Indica el porcentaje de transacciones que llevan el antecedente y el
consecuente, con respecto al total de transacciones analizadas.
(𝑿 ∪ 𝒀)
𝑺= X= Antecedente , Y = Consecuente, T= # Transacciones
𝑻
T1 T2 T3
Este indicador señala que tan frecuente es la relación entre productos con respecto al universo. Pero
no indica si existe vínculo entre ambos productos.
Indicador: Análisis de Compra
Confiabilidad (confidence):Supone una relación que se desea medir. Indica el porcentaje de
transacciones que llevan el antecedente y el consecuente juntos, con respecto al total de transacciones
que llevan el antecedente.
.
𝑺(𝑿 ∪ 𝒀) X= Antecedente , Y = Consecuente, T= # Transacciones
𝑪=
𝑺(𝑿)
1 Vez Consecuente
T1 T2 T3
𝑺(𝑪𝒆𝒓𝒗𝒆𝒛𝒂 ∪ 𝑷𝒖𝒓𝒆)
𝑪𝒐𝒏𝒇𝒊𝒂𝒏𝒛𝒂(𝑪𝒆𝒓𝒗𝒆𝒛𝒂 → 𝑷𝒖𝒓𝒆) = = 1/2 = 50%
𝑺(𝑪𝒆𝒓𝒗𝒆𝒛𝒂)
En este caso el denominador indica la cantidad de veces en las cuales se ha presentado el producto
antecedente (en el ejemplo es Cerveza), en nuestro caso en 2 transacciones.
Entonces la confiabilidad es 1/2 para Cerveza=> Pure, que se leería confianza de que se compre el
producto Puré, habiéndose comprado también el producto Cerveza.
Indicador: Análisis de Compra
• Ganancia (Lift): Es un valor o puntaje que representa que antecedente y consecuente aparecen
muchas veces juntos mas de lo esperado; esto significa que la ocurrencia del antecedente tiene
positivo efecto sobre la ocurrencia del consecuente o que el antecedente esta positivamente
correlacionado. 𝑺𝒖𝒑𝒑𝒑𝒐𝒓𝒕 (𝑿∪ 𝒀)
𝑳𝒊𝒇𝒕 =
𝑺𝒖𝒑𝒑𝒐𝒓𝒕 𝑿 .𝑺𝒖𝒑𝒑𝒐𝒓𝒕 (𝒀)
#1 #2 #3
Support Alto: Significa que debería aplica a una gran cantidad de casos de canastas.
Confidence Alto: Significa que debería ser muchas veces la canasta correcta.
Lift Alto: Significa que esto no es solo una coincidencia, que se cumple la regla de asociación de
productos con la canasta correcta.
Segmentación (Clustering)
Valor Medio
Alto valor
Otros Ejemplos:
p1
p3 p4
p2
p1 p2 p3 p4
Dendrograma Particional
Conglomerado Particional
p1
p3 p4
p2
p1 p2 p3 p4
Conglomerado Jerárquico Dendograma Jerárquico
Text Mining
• Text Mining
• Data Mining
– Procesamiento lingüístico o
– procesar directamente
procesamiento de lenguaje natural
– Identificar relacion causal (PNL)
– Datos de transacciones – Descubrir información hasta ahora
numéricas estructuradas que desconocida
residen en un almacén de
– Las aplicaciones se ocupan de
datos racional.
colecciones de sistemas y formatos
mucho más diversas.
Text Mining – Clasificación Palabras