Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Rights info:eu-repo/semantics/openAccess
TECNOLOGÍAS DE LA INFORMACIÓN
Autores:
Wilmer Rodríguez
TRABAJO DE INVESTIGACIÓN
INFORMACIÓN
DEDICATORIA
Dedicamos el presente trabajo de tesis a nuestras familias, padres, esposas e hijos por
AGRADECIMIENTOS
En primer lugar damos gracias a Dios y a nuestras familias, padres, esposas e hijos que
nos han brindado todo su apoyo y comprensión en esta etapa de nuestras vidas.
A los profesores de la maestría, porque hemos aprendido algo nuevo de cada uno de ellos.
Un especial agradecimiento a nuestro asesor de tesis, Sr. Andrés Melgar, quien ha tenido
RESUMEN
En la actualidad las empresas del sector farmacéutico establecen diferentes políticas para
organizaciones.
Para desarrollar el presente trabajo de tesis se ha seleccionado a una empresa del sector
farmacéutico, tomando como referencia los datos de las ventas y devoluciones de los últimos
inteligencia de negocios para el área comercial de una empresa del rubro farmacéutico” tiene
por objetivo determinar el comportamiento de compra de los clientes, para predecir las
devoluciones de los productos para identificar el problema planteado. Con esta información se
plantearán los objetivos del proyecto, los resultados esperados y se mencionarán los métodos
mencionarán los beneficios directos e indirectos del proyecto así como un estudio de
farmacéutico haciendo énfasis en las características comunes y estrategias del sector. También
se hace una revisión de los conceptos de Bussines Analytics y Data Science, y como estos se
relacionan.
En el capítulo 3, se hace una revisión del “Estado del arte”, en el cual se muestran los
metodología “CRISP-DM”, la cual a través de sus diferentes fases permitirá comprender los
objetivos del negocio planteados e identificar, explorar y preparar los datos necesarios que
nos servirán para construir los modelos analíticos predictivo. Asimismo, se muestra una
obtenidos en el anterior capítulo y como estos han contribuido a cumplir con los objetivos del
presente trabajo.
vi
Índice
1.7 Justificación................................................................................................................ 30
2.5 Conclusión.................................................................................................................. 47
MODELO ................................................................................................................................. 60
determinados productos..................................................................................................... 78
GLOSARIO ......................................................................................................................... 87
BIBLIOGRAFÍA ................................................................................................................. 88
ANEXOS ............................................................................................................................. 91
x
Lista de figuras
Figura 6. Evolución de la venta total y neta para los años 2013,2014 y 2015 ......................... 23
Figura 17. Estructura de archivo de trabajo con los atributos específicos ............................... 64
Figura 18. Devolución Vs Compra en Cantidades por Clientes Directos año 2013 al 2015.... 65
Figura 19. Promedio de devoluciones mensual de Clientes Indirectos (año 2015) .................. 66
Figura 20. Promedio del Importe de devoluciones por Clientes Indirectos (año 2015) ........... 67
Figura 23. Promedio de Cantidad de devoluciones mensual de Productos del año 2015 ....... 69
Figura 24. Promedio del Importe de devoluciones por Productos mensual año 2015 ........... 70
xi
Figura 25. Frecuencia mensual de la devolución por franquicia de productos en el año 2015 71
Figura 17. Resultados del algoritmo de regresión para los clientes indirectos......................... 74
Figura 18. Resultados del algoritmo SimpleKmeans para los clientes indirectos .................... 75
Figura 20. Resultados del algoritmo SimpleKmeans para los productos ................................. 79
Lista de tablas
2015) ......................................................................................................................................... 20
Tabla 9. Patrones de la industria farmacéutica y las técnicas de minería de datos usadas .... 54
Tabla 10. Modelo analíticos predictivos de regresión para Clientes Indirectos ..................... 77
Tabla 12. Modelos analíticos de regresión para el cliente indirecto (INK-2712) y productos
principal se localiza en Europa y posee una filial en Perú. La empresa desarrolla sus
• Productos farmacéuticos.
• Medicamentos genéricos.
Para lograr los objetivos organizacionales, la empresa asume un constante compromiso con
los pacientes, los cuales son la inspiración para revolucionar la investigación, el desarrollo y
Colaboración y Desempeño.
Dado que el presente proyecto de tesis tiene como objetivo realizar un estudio del
políticas comerciales de la empresa, de tal forma que el problema pueda ser contextualizado a
través de la relación con los clientes y las políticas que se generan entorno a ellas.
de clientes:
directos y lo vende a los usuarios finales. Actualmente dentro de este grupo de clientes
existen dos sub categorías, clientes del sector privado y clientes del sector público.
b.1. Clientes indirectos del sector privado: son las farmacias conformadas por: cadenas
b.2. Clientes indirectos del sector público: son entidades del Estado.
usuario final.
(FEFO por sus siglas en inglés,”First Expires First Out”), la inspección de inventarios
- Devoluciones para clientes directos: la devolución debe ser formalizada por una carta
cliente directo con el fin de garantizar una adecuada rotación de los productos.
clientes directos.
de los productos devueltos hasta la reposición de los productos nuevos, así mismo; se
pueden observar las interacciones entre los clientes directos, clientes indirectos y la
empresa farmacéutica.
16
• Relacionada a las existencias: el stock de las existencias en los clientes directos serán
tres últimos meses. Dicho promedio permitirá determinar la existencia mínima que cada
cliente directo debe mantener y será reportada a la empresa farmacéutica para efectos de
control y seguimiento.
médico, los clientes directos, los clientes indirectos conformados por entidades privadas y
Figura 3.
17
Cliente
Indirecto
Cliente
Directo
Las devoluciones a los clientes indirectos sólo se realizan mediante los clientes
directos (distribuidores).
Los clientes directos realizan sus ventas al sector público mediante licitaciones
Se realiza mediante un representante médico que busca impulsar las ventas con
Lo que se busca es promocionar los productos, para tal caso existen muestras
correspondiente al periodo 2015. Este análisis se realizó bajo las perspectivas de clientes y
los datos los clientes y productos (por códigos); tales como nombres de producto, razón social
Corresponde a los diez principales clientes indirectos, que representaron el 65% de la venta
total del periodo. En la Figura 4, se observa un gráfico de burbujas para analizar tres
Así mismo, se puede observar que los clientes indirectos “MIF-3028” e “INK-2712” con
niveles de compra similares, tienen una gran diferencia respecto al importe devuelto, “INK-
2712” devolvió S/. 1’718,160 y “MIF-3028” reportó S/. 870,671 con una diferencia
porcentaje de devolución en relación al total por cada uno de los diez principales clientes. La
línea final de “Otros” representa la venta total del resto de clientes que tiene la empresa.
20
2015)
DEVOLUCIÓN
CLIENTE INDIRECTO COMPRA % DE LA COMPRA
SOLES
ESS-1957 16,103,835 -514,224 3.2%
MIF-3028 13,924,230 -870,671 6.3%
INK-2712 13,801,031 -1,718,160 13.0%
BOT-1391 5,755,888 -238,729 0.0%
CL.-1642 3,654,430 -242,039 7.0%
CL.-1615 3,649,424 -61,185 1.8%
ONC-3134 2,840,356 -34,025 4.2%
ONC-3132 2,060,715 -12,304 1.4%
HOS-2668 1,879,870 -587,582 31.3%
ALB-0030 1,671,522 -166,057 22.9%
OTROS 28,202,570 -1,154,026 4.1%
Total 93,543,870 -5,599,003
interrogantes:
• ¿El importe de las devoluciones se relaciona con el volumen de compra de los clientes
indirectos?
• ¿El tipo de cliente indirecto, público o privado influye sobre el importe de las
devoluciones?
En una primera revisión, se evidencia que no existe una relación directa entre el volumen
Además, se puede observar que los productos “LUC-0031” y “EXF-0015” ambos con
ventas similares, tienen una marcada diferencia en el importe devuelto entre ambos
productos; teniendo “EXF-0015” S/. 594,972, el cual representa más del triple de
También, se tienen casos de venta promedio con índices muy bajos de devolución, como
por ejemplo; el producto “CER-0007” con ventas de S/. 5’444,985, donde se evidencia que
la devolución no excede el 1% del total de devoluciones, siendo este producto el más bajo de
porcentaje de devolución en relación al total para cada uno de los diez principales productos
final de “Otros” representa la venta total del resto de productos que tiene la empresa.
22
• ¿El importe de las devoluciones se relaciona con el volumen de compra de los productos?
• ¿El tipo de franquicia del producto influye sobre el importe de las devoluciones?
Como se muestra, tampoco existe una relación entre la cantidad vendida del producto y el
importe de la devolución. Esto demuestra que se deben evaluar otras variables para
Luego de haber realizado un análisis preliminar de las ventas y devoluciones bajo las
últimos periodos 2013, 2014 y 2015. La línea azul representa la venta total, la línea roja
23
diferencia entre estas dos líneas representa los descuentos por devoluciones
92.00 94.75
90.00 93.54
88.00
86.00 Descuento por
84.00 88.66 Devolución de
86.39 85.32
82.00 mercadería
80.00
78.00 81.85
76.00
74.00
72.00
70.00
2013 2014 2015
Venta total (en millones de soles) Venta Neta (en millones de soles)
Figura 6. Evolución de la venta total y neta para los años 2013,2014 y 2015
Fuente: elaboración propia
Además, se observa de forma resumida en la Figura 7; que los importes por devolución se
9.00 8.13
8.00 7.96
7.00 6.48
6.00
5.00
4.00
3.00
2.00
1.00
-
2013 2014 2015
también se pueden mencionar otros efectos originados por el desconocimiento de los patrones
incurren en costos de alquiler de espacio, seguridad, seguros contra pérdidas y/o daño de
a vencer?
conocimiento de los patrones de compra de los clientes y de esta manera contribuir a brindar
una alternativa de solución con respecto al soporte de la información que se requiere para
tomar decisiones.
25
Un modelo predictivo además podrá sugerir la cantidad de productos que los clientes
directos e indirectos deben comprar. Esto apoyará la toma de decisiones e incluso a partir de
los resultados proponer nuevas políticas comerciales para clientes y productos con altos
niveles de devolución.
los clientes.
clientes indirectos.
productos adquiridos.
26
soporte a la tomas de decisiones para llevar a una acción, como se muestra en la Figura 8.
En la Figura 8, se aprecian las respuestas a las diferentes preguntas (¿qué?, ¿por qué?,
¿qué sucederá?, ¿qué debo hacer?) y el uso herramientas y técnicas que requieren diferentes
niveles de intervención humana para llegar a una decisión, y por último a una acción.
Una de estas capacidades, es la analítica predictiva; la cual se toma como marco de trabajo
La analítica predictiva, es un método que permite atender la necesidad del negocio para
compra de los clientes para evaluar la demanda y entrega futura de los productos.
“El análisis predictivo es la aplicación de la lógica y las matemáticas a los datos para
anticipar el comportamiento futuro o estimación desconocida de los resultados”.
(Gartner, 2010)
1.6.3 Procedimientos
Para poder cumplir con los objetivos de analizar los patrones de comportamiento de
muestra en la Figura 9.
cuales interactúan de forma cíclica durante su desarrollo como se muestra en la Figura 10.
28
mediante el análisis de los datos históricos; un modelo que evalúe la probabilidad de que un
cliente y/o producto con ciertas características se le asignará un estimado de devolución. Esta
• Entendimiento del negocio: esta primera fase es la más importante y agrupa las tareas de
comprensión de los objetivos y requisitos del proyecto desde una perspectiva de negocio,
• Entendimiento de los datos: esta segunda fase, comprende la recolección inicial de los
datos con el objetivo de establecer un primer contacto con el problema, familiarizarse con
ellos, identificar su calidad y establecer las relaciones más evidentes que permitan
• Preparación de los datos: comprende las actividades para adaptar los datos a las técnicas
de minería de datos. La preparación de los datos incluye las tareas generales de selección
de datos a los cuales se aplicará una determinada técnica de modelado, limpieza de datos,
de formato.
• Modelado: en esta fase, se utilizan las técnicas de minería de datos más apropiadas al tipo
de problema que se quiere resolver. Para esta selección, se debe considerar el objetivo
principal del proyecto y la relación con las herramientas de minería de datos existentes.
Figura 11:
Las técnicas mostradas en la Figura 11, forman parte de la analítica predictiva, las cuales
a) Las técnicas de clasificación; se utilizan para segmentar los clientes y los productos en
b) Las técnicas de regresión; se usan para poder determinar un valor específico, por
de clasificación.
Estas técnicas, permitirán comparar los modelos y determinar que algoritmos son los
los criterios de éxito del problema. Debe considerarse además, que la fiabilidad
calculada para el modelo se aplica solamente para los datos sobre los que se realizó el
análisis.
• Implantación: en esta fase, y una vez que el modelo ha sido construido y validado, se
Para el presente trabajo se utiliza esta metodología como un marco de referencia para el
desarrollo de los modelos propuestos. No forma parte de los objetivos, desarrollar cada fase
de la metodología.
1.7 Justificación
Se ha identificado los siguientes elementos, los cuales justifican las razones para el
desarrollo de la propuesta:
del costo logístico para la gestión de la devolución de los productos. Así como el
los mismos.
• Fuerza de Ventas, que podrán tener un mejor soporte de información para direccionar
Gerencia Logística, en tanto que disminuirá el proceso logístico que se necesita para la
• Flujo de Caja Libre. Para poder justificar financieramente el proyecto, se estima que el
flujo de caja libre bajo un escenario moderado, sería como se muestra en la Tabla 3:
para la ejecución del proyecto con una inversión estimada de S/. 70,000. Los gastos son en
Anexo1.
• Bajo un escenario pesimista, el proyecto es rentable con un VAN de S/. 5,899 (incluye la
recuperación de la inversión).
• Bajo un escenario optimista se obtiene un VAN de S/. 347,374 para el proyecto y una
la compañía.
vencimiento, así como el uso de los materiales (materia prima y empaque) utilizado para la
fabricación de los productos. También, se reducen las emisiones de CO2 utilizado por el
1.8 Alcance
desarrollada en el curso de “Tesis I” y “Tesis II”. Finalmente, el curso de “Big & Smart
presente investigación.
• Organizativo, el presente trabajo tiene como ámbito de acción, brindar un soporte en base
farmacéutica.
34
• Procesos, el análisis de la información de los procesos del área comercial como ventas y
devoluciones.
zonas geográficas.
2.1 Introducción
acuerdo a lo establecido por Melé (2006), las principales empresas del rubro comparten
es la orientación a servir y lograr hacer sentir mejor a los pacientes. Dicho compromiso
con la salud y el bienestar es fundamental para lograr los objetivos de cada una de estas
organizaciones.
sector:
36
• Pfizer (EEUU, promedio de ventas a nivel mundial 25 mil millones de dólares al año),
nuestra misión, “Llegaremos a ser la empresa más valiosa del mundo para pacientes,
• Sanofi (Francia, promedio de ventas a nivel mundial 52 mil millones de dólares al año),
que ofrezcan nuevas soluciones terapéuticas para los pacientes. Nuestra estrategia para
• Novartis (Suiza, promedio en ventas a nivel mundial 28 mil millones de dólares al año),
desempeño y una compensación adecuada a los que invierten ideas y trabajo en nuestra
embargo, se entiende que este punto está considerado indirectamente y es fundamental para
sistema de gestión ambiental basado en la norma ISO 14001:2004 con el fin de minimizar la
transparentes utilizando códigos de conducta que suelen incluir los siguientes aspectos:
• Mantener confidencialidad.
• Tipo de clientes.
• Autoridades públicas.
Según lo establecido por Correa (2004: 4) se resalta la importancia de las patentes sobre el
sector farmacéutico porque de todos los mercados este es uno que presenta la mayor
mercado médico. Para reforzar este punto, se puede mencionar que dentro de las
mantener un canal de comunicación directo con los proveedores para velar que se respecten
márgenes altos, debido a la exclusividad de las patentes por periodos entre cinco a veinte
años. Una vez cumplido el periodo de vigencia de la patente, la fórmula utilizada para la
que demanda altos costos y tiempos para lograr desarrollar un nuevo producto.
Técnicamente esta estrategia emplea una formula equivalente a la utilizada por los productos
cuya patente cumplió su vigencia. Citando un ejemplo de esto, se tiene el caso descrito por
“Sildenafil” (50 mg/t (2014: 75), de un producto genérico y el medicamento original (2014)
en el cual se logró demostrar que los resultados son homogéneos entre ambos productos.
Cabe indicar que en ambas estrategias el precio es regulado por el país en donde se
comercializa el producto.
39
• Cliente indirecto: punto final de venta (farmacias, hospitales, clínicas, cadenas, entre
otros).
solicitud del cliente indirecto (punto final de venta), dicha solicitud se realiza mediante
los productos vencidos y reponer el lote respectivo. Esta nueva mercadería es llevada al
almacén del distribuidor quien a su vez se encargará de trasladar el producto al almacén del
previamente descrito.
40
Dado que el presenta proyecto de tesis tiene como objetivo determinar el patrón de
compras de los clientes directos e indirectos, es necesario conocer los conceptos básicos
utilizadas para construir los modelos de análisis y simulaciones para crear escenarios,
pág. 41
42
Esta capacidad de crear, entender y predecir es lo que permite a las empresas generar
Estos modelos analíticos, impulsan que la toma de decisiones sea menos subjetiva
De acuerdo con Alex Liu, (2015: 6), Data Science o ciencia de datos en español es
sistemas y procesos muy diferentes a los utilizados en el pasado, como son: modelos,
organizaciones.
datos
el éxito de su aplicación (Liebowitz, 2014: 8). Para tal caso, se debe tener una estrategia
para poder gestionar este cambio en las organizaciones como se verá en la Figura 14.
44
La figura 14, muestra cómo la ciencia del análisis de los datos genera un “Insight”,
pero por si sólo el “Insight” no genera una acción. El valor del “Insight” tiene que ser
poder medir lo que realmente se prometió en la definición. Cuando estos cuatro puntos
se cumplan, es que se puede hablar de un cambio y/o mejora. “Este ciclo descrito
Es por eso que toda iniciativa analítica necesita de estos cuatro puntos que se
describen a continuación:
• Definir el valor, para construir las bases y evitar una falta de interés.
entrega de valor.
estos cuatro puntos para aprovechar los “Insights” obtenidos con el análisis de la
Ciencia de datos. Esto combinado con una arquitectura de valor, plantea una estrategia
Actualmente existen muchos desafíos que las empresas están afrontando como:
• Una diversidad de capacidades analíticas y una casi infinita cantidad de datos que
ofrecen una gran oportunidad para nuevos “Insights”, el cual hace cada vez más
acciones y decisiones.
empresas carecen de una estrategia formal para estar preparados y afrontar estos
Como consecuencia de esto, en los últimos años los directores ejecutivos o llamados
CEOs por sus siglas en inglés (“Chief Executive Officer”), están colocando a Business
Los líderes de las empresas deben mejorar la madurez de Business Analytics en las
estrategia integral que incorpore todos los aspectos importantes más allá de la selección
y la implementación de la tecnología.
Es por eso que ahora los directores de información, conocidos como CIOs por sus
Business Analytics, porque el reto ahora no sólo es la tecnología, sino también una
“Cómo llegar, a dónde quieres llegar, identificar y asignar recursos, definir cómo
medir el éxito de forma dinámica, adaptarse a las circunstancias cambiantes y
actuar tanto de manera proactiva y reactiva”. (Gartner, 2015).
2.5 Conclusión
del sector, así como la definición general del proceso de devoluciones que realizan las
conceptos de Business Analytic, Data Science y Data Mining, y cómo estos brindan las
clientes.
48
3.1 Introducción
El estado del arte del presente trabajo, permitirá conocer los estudios e
del sector farmacéutico. A partir de este problema identificado, se plantean los objetivos
problema descrito.
farmacéutico.
Haughton, D., Hua, G., Jin, D., Lin, J., Wei, Q. and Zhang, C. (2015)
‘, 9(4), pp. 289–305. doi: 10.1108/ijphm-03-2013-0008.
documentación actual que permitan ver las tendencias asociadas a las buenas prácticas
distribuidores deben estar alineados en base al promedio de venta de los tres últimos
52
farmacéutica. Este control tiene por fin, evitar generar un sobrestock para los
principal problema de este control, es que se evalúa el total de stock contra el promedio
de venta de los tres últimos meses, no existe un detalle a nivel de producto para validar
la existencia
sistema FEFO, norma de primero en caducar primero en salir. Este control brinda
forma semestral con el fin de evaluar que exista un bajo índice de productos con corta
farmacéutica y permite tomar acciones para promover la rotación de los productos con
riesgo de pronta expiración. El objetivo de este primer punto es apoyar el control de los
Como segundo punto, se tiene lo establecido por Hugo Santiago Aguirre Mayorga,
el enfoque que se brinda al proceso de planeación, que siendo un paso previo al proceso
productos para abastecer el stock local de la farmacéutica, siendo este punto el inicial
Para reforzar el punto anterior, se tiene lo establecido por Mónica Estefanía Abad
que la empresa objeto de estudio realiza en la actualidad para tener trazabilidad y apoyar
sobre el margen de ventas. Debido a que los controles del proceso de devolución son tan
nivel de exactitud. Esto con el fin de garantizar una trazabilidad en el proceso y apoyar
Beneficios y Aplicaciones
En este contexto se menciona que las técnicas de minería de datos pueden dar
usadas
55
pueden ser utilizadas para resolver el problema planteado en el presente trabajo. Por
otro lado, los beneficios que se pueden obtener pueden ser diversos y aplicados a
de un producto.
de atención al cliente, para analizar qué conduce a los médicos a recetar ciertos
y de farmacia.
Algunos de estos beneficios, permitirán tener un mayor análisis para poder abordar y
determinar los patrones de comportamiento de los clientes y los productos que compran.
el sector farmacéutico
menciona que:
También, se afirma que una predicción precisa de la venta es una forma esencial y de
bajo costo que las empresas pueden utilizar para aumentar sus ganancias, disminuir sus
costos y lograr una mayor flexibilidad a los cambios. En otras palabras, la previsión de
del cliente y los costos de inventario (Gupta, Maranas & Mcdonald, 2000).
puede ser muy beneficiosos, debido a la corta vida útil de muchos productos
Este estudio fue realizado en uno de los distribuidores líderes del sector farmacéutico
• Se llegó a trabajar la investigación con datos reales y con los altos directivos de
las cuatro principales empresas del sector farmacéutico que representaban el 70% de las
ventas a farmacias.
histórica de las ventas y devoluciones así como de los atributos de los productos y
clientes, con la finalidad de poder predecir una estimación de una compra más eficiente
enmarca dentro de lo que se conoce como administración de las relaciones con los
Según Ronald Swift (2002), “CRM es un enfoque empresarial que permite conocer la
conducta de los clientes e influir en esta a través de una comunicación congruente para
desde varias perspectivas. Esto con la finalidad de evitar el sesgo que existe al
Perspectivas Descripción
FILOSÓFICA (Fairhurst, 2001; Piccoli et El CRM se centra en construir y mantener
al., 2003) relaciones a largo plazo con los clientes.
Toda la organización debe tener al cliente
como principal referencia.
factores de éxito de una estrategia CRM. La gestión del conocimiento como una
Para llevar esto al sector farmacéutico, primero se debe identificar quiénes son los
clientes. Esto dependerá de la estrategia que lleve a cabo la compañía. Los clientes
pueden ser los pacientes, los médicos o las empresas que participan en la cadena de
suministro como las descritas en el capítulo 1, los llamados clientes directos y clientes
En un estudio realizado por (Maheshkumar & otros, 2011) para comparar las
estrategias CRM llevadas a cabo en la web, determinó que las empresas Merck,
Novartis y Eli Lilly están en ventaja con relación a otras organizaciones. La compañía
Wyeth estuvo más orientada a las relaciones con el paciente mientras que Eli Lilly tuvo
alternativas de solución.
con frecuencia, enviando correos electrónicos y notificaciones, así mismo brindó acceso
clientes, tomando nota de sus comentarios sobre los productos adquiridos. Por otro lado,
los representantes del servicio al cliente llamaron a cada cliente dentro de los tres días
información que requieren los procesos de compra de clientes directos e indirectos que
DEL MODELO
En este capítulo se presentan las etapas para la elaboración del modelo. Se ha tomado
donde se identificará los objetivos de negocio que plantea el presente proyecto de tesis
predicciones lo más fiable posible a partir del análisis del comportamiento de compra de
para poder predecir las cantidades de productos a devolver y de esta manera contribuir a
Contexto
pedidos de compra y ventas que realizan los clientes. Esta información transaccional es
modelos predictivos para resolver las preguntas formuladas en la sección 1.2, en donde
Desde el punto de vista del negocio, se establece como criterio de éxito los siguientes
puntos:
entre otros.
63
farmacéutica en estudio.
• Cliente indirecto: cada cliente indirecto está identificado por un identificador (ID).
Los clientes indirectos están asociados a los clientes directos (distribuidores) y con
los productos que compran. Los clientes indirectos están agrupados de la siguiente
forma: canal del cliente indirecto, tipo de cliente indirecto y cliente indirecto.
• Cliente directo (Distribuidores): cada cliente directo está identificado por un ID.
• Productos: cada producto está identificado por un ID. Los productos están agrupados
• Ubigeo: cada ubigeo está identificado por un ID. El ubigeo utiliza la siguiente
• Fechas: Las fechas son extraídas en formado yyyymmdd, por ejemplo 20161011.
ejemplo: facturas, nota de devolución, nota de crédito, nota de débito entre otros)
Los atributos específicos que se utilizarán para la minería de datos en este proyecto
• División. • Importe.
A continuación en la Figura 17, se muestra la estructura del archivo en Excel con los
atributos mencionados.
pág. 64
65
Clientes Directos
unidades de los clientes directos desde el año 2013 al 2015. Para el ejemplo; el Cliente
compra.
Figura 18. Devolución Vs Compra en Cantidades por Clientes Directos año 2013 al
2015
Fuente: elaboración propia
Clientes Indirectos
análisis, datos del año 2015, el cual brinda una información más reciente del
devolución en el año 2015 clasificadas en rangos, por ejemplo; existen 126 clientes
140
126
120
100
Número de Clientes
80 75
60
38
40
20
8
0
<0,1> <1-10> <10-100> <100+>
Promedio de Cantidad de Devoluciones
Figura 20. Promedio del Importe de devoluciones por Clientes Indirectos (año 2015)
Fuente: elaboración propia
clientes han tenido devoluciones para el año 2015. Por Ejemplo, existen 47 clientes que
han tenido devoluciones entre 1 a 3 meses en el año 2015 y 169 clientes que por lo
180 168
160
140
Número de Clientes
120
100
80
60 47
40 27
20 5
0
<0,1> <1-3> <3-9> <9+>
Frecuencia en Meses
Por Ejemplo, existen 70 clientes que han tenido devoluciones en el cuarto trimestre
2015, así como se puede observar que hay 52 clientes que no han devuelto productos
80
70
70 63
62
60
Cantidad de Clientes
52
50
40
30
20
10
0
4° 3° 2° 1°
Trimestre
Productos
datos del año 2015, el cual brinda una información más reciente del comportamiento de
las devoluciones.
devolución por grupo y/o franquicia de productos en el año 2015 clasificado en rangos,
69
RETINA
OTROS
NEUROCIENCIA
Franquicias de Productos
SANDOZ
RESPIRATORIO
METABOLICO
MADUROS
CARDIOVASCULAR
TUMORS
HEMATOLOGY
INMUNO-DERMA
0 1 2 3 4 5 6 7 8
Número de Productos
Figura 23. Promedio de Cantidad de devoluciones mensual de Productos del año 2015
Fuente: elaboración propia
RETINA
OTROS
NEUROCIENCIA
SANDOZ
Franquicias de Productos
RESPIRATORIO
METABOLICO
MADUROS
CARDIOVASCULAR
TUMORS
HEMATOLOGY
INMUNO-DERMA
0 1 2 3 4 5 6 7 8 9
Número de Productos
Figura 24. Promedio del Importe de devoluciones por Productos mensual año 2015
Fuente: elaboración propia
productos han tenido devoluciones para el año 2015. Por Ejemplo, existen cinco
RETINA
OTROS
NEUROCIENCIA
SANDOZ
Franquicias de Productos
RESPIRATORIO
METABOLICO
MADUROS
CARDIOVASCULAR
TUMORS
HEMATOLOGY
INMUNO-DERMA
0 1 2 3 4 5 6
Número de Productos
productos para el año 2015. Por Ejemplo, existen doce productos de la franquicia de
“MADUROS” que han tenido devoluciones en el cuarto trimestre del 2015, así como se
trimestres.
72
RETINA
OTROS
NEUROCIENCIA
RESPIRATORIO
METABOLICO
MADUROS
CARDIOVASCULAR
TUMORS
HEMATOLOGY
INMUNO-DERMA
0 2 4 6 8 10 12 14
Número de Productos
4 3 2 1
Luego de haber realizado la exploración de los datos, se puede afirmar que los datos
organización, los cuales no contienen errores, por lo que el riesgo de ruido en el proceso
minería de datos denominado WEKA por sus siglas en inglés (Waikato Enviroment for
analíticos.
lineal.
devolución.
Teniendo en cuenta que previamente se han definido dos objetivos, esta sección se va
a dividir en dos partes, una por cada objetivo, dado que, los parámetros para el modelo,
los datos de venta y devoluciones de los años 2013 al 2015, usando el algoritmo de
indirectos.
Figura 27. Resultados del algoritmo de regresión para los clientes indirectos.
Fuente: elaboración propia, tomada de aplicación WEKA
clientes indirectos, con el fin de predecir las cantidades a devolver. Para esto, se realizó
los años 2013 al 2015, se procedió a aplicar una técnica de clasificación; esta vez, el
Figura 28. Resultados del algoritmo SimpleKmeans para los clientes indirectos
Fuente: elaboración propia, tomada de aplicación WEKA
76
clusterizados.
• Determinar los modelos predictivos de regresión para los clientes indirectos según
el importe de devoluciones
lineal, para cada uno de los clientes indirectos, utilizando el algoritmo de “Regresión
CLIENTE INDIRECTO
CLUSTER 0 CLUSTER 1
INK-2712 MIF-3028 BOT-1391 ALB-0030 ESS-1949 FON-2555 ESS-1957 CL.-1642
Modelo
-0.07 Y + 4005 0.10 Y– 1434 0.06 Y + 86 -0.30 Y + 1256 0.33 Y - 82 0.14 Y -16 0.03 Y -1467 0.61 Y -2067
Devolución =
T1 Coeficiente
98% 89% 84% 99% 99% 99% 82% 86%
Correlación
Modelo
-0.07 Y + 4005 0.10 Y– 2161 0.06 Y + 86 -0.30 Y + 1256 0.33 Y - 82 0.14 Y -16 0.03 Y -1467 0.61 Y -2067
Devolución =
T2 Coeficiente
98% 85% 84% 99% 99% 99% 82% 86%
Correlación
Modelo
-0.07 Y +2988 0.10 Y– 2161 0.06 Y + 86 -0.30 Y + 1256 0.33 Y - 82 0.14 Y -16 0.03 Y -1467 0.61 Y -2067
Devolución =
T3 Coeficiente
94% 85% 84% 99% 99% 99% 82% 86%
Correlación
Modelo
-0.10 Y +3833 0.10 Y– 2161 0.06 Y + 86 -0.30 Y + 1256 0.33 Y - 82 0.14 Y -16 0.03 Y -1467 0.18 Y -613
Devolución =
T4 Coeficiente
98% 85% 84% 99% 99% 99% 82% 85%
Correlación
Fuente: elaboración propia
la ejecución del algoritmo para los clientes indirectos de los clúster 0 y 1; también, se
incluyeron las variables de estacionalidad T1, T2, T3 y T4, que representan los cuatro
trimestres del año. Para una mejor interpretación de esta tabla, se puede mencionar que,
el Cliente “INK-2712” para el trimestre T1 (T1), dio como resultado un modelo con
98% de correlación.
Dónde:
Los modelos identificados en la Tabla 12, permitirán realizar una predicción de las
indirectos.
y determinados productos.
Una vez identificados los modelos predictivos para la devolución de los clientes, se
Con la información de las ventas y devoluciones de los productos en los años 2013 al
los clústers de los productos; tal como se muestran en las figuras 30 y 31.
79
Importe de Devolución
Cluster Instancias Producto Franquicia
(2013 al 2015)
DIO-0011 CARDIOVASCULAR
GAL-0021 METABOLICO
EXF-0015 CARDIOVASCULAR
EXE-0014 NEUROCIENCIA
Cluster 0 8 (S/292,320 a S/1'148,529)
DIO-0010 CARDIOVASCULAR
VOL-0059 MADUROS
TAS-0052 HEMATOLOGY
EXF-0016 CARDIOVASCULAR
MYF-0035 INMUNOLOGIA Y DERMA
LUC-0031 RETINA
TON-0054 MADUROS
EXE-0013 NEUROCIENCIA
GLI-0024 HEMATOLOGY
TEG-0053 MADUROS
Cluster 2 12 (S/39,842 a S/292,320)
SIM-0047 INMUNOLOGIA Y DERMA
CER-0007 INMUNOLOGIA Y DERMA
ACL-0001 MADUROS
STA-0048 NEUROCIENCIA
SAN-0045 SOLID TUMORS
NEO-0037 INMUNOLOGIA Y DERMA
Cluster 1 43 (S/.0 a S/39,842) OTROS OTROS
productos comprados
indirecto; en esta sección, se incluye a los modelos la variable de producto, para así
poder tener un modelo predictivo más completo, que permita predecir las devoluciones
de los productos que compre un determinado clientes; en este análisis, se tomó como
Lineal Simple” sólo para el clúster 0 de productos, con mayor importe de devolución,
ejecución del algoritmo para el cliente indirecto “INK-2712” y los productos del clúster
representan los cuatro trimestres del año. En general, se observa que el coeficiente de
si existiera compra del producto “DIO-0011” en el trimestre T1, el modelo sólo asegura
de compra está en función del cliente; esto implica que, depende de la gestión individual
que cada cliente realice sobre sus ventas, más que de los tipos de producto que compra,
debido a que, en general el índice de correlación con los productos es menor y muy
Desde el punto de vista del negocio, se estableció dos criterios de éxito para lo cual
solicitudes de compra de los clientes, con una tasa promedio de confiabilidad del
91% para los datos analizados; esto permitirá poder atender los pedidos de compra,
promedio de confiabilidad de 60% según los datos analizados para el cliente “INK-
2712”; esto permitirá poder predecir la devolución futura de los productos que
compra un cliente, y con mayor nivel de probabilidad sobre algunas trimestres del
año específicos.
• Se incluyó en el análisis la variable producto para poder realizar una predicción por
• Los análisis de los clientes indirectos y productos permitió obtener modelos con
.
84
5.1 Conclusiones
Luego de elaborar los modelos y analizar los resultados obtenidos llegamos a las
siguientes conclusiones:
predictivo).
incluyendo la variable producto para cumplir con el objetivo de: “Determinar las
• Debido a que se lograron obtener los modelos que cumplen con los objetivos
la propuesta realizada
85
5.2 Observaciones
razón social de los clientes por códigos. Los montos facturados y devueltos fueron
indirectos.
• Se identificó que los productos tiene una correlación mayor asociada a la temporada
.
86
identificados.
los puntos finales del consumidor, para poder determinar las devoluciones en las
valor, así como la puesta en acción, para luego medir y evaluar el valor entregado y
GLOSARIO
Rebate: Monto deducido para compras futuras por alcanzar un objetivo de venta.
características.
BIBLIOGRAFÍA
ABAD, Mónica
2011 Implementación de un modelo para la administración de la demanda de una
empresa farmacéutica a fin de optimizar el inventario en el mercado. (Tesis de grado).
Quito: USFQ
CHAMAGUA, Guillermo
2012 Propuesta de un manual de procedimientos estándares de operación a partir de la
guía de inspección de buenas prácticas de almacenamiento para droguerías. Licenciatura
thesis, Universidad de El Salvador.
CORREA, Carlos
Patentes, industria farmacéutica y biotecnología. México: UAM
MELÉ, Domenec
2006 Las cinco principales compañías farmacéuticas. España: Universidad de Navarra
GALÁN, Víctor
2015 Aplicación de la metodología CRISP-DM a un proyecto de minería de datos en el
entorno universitario. (Proyecto fin de carrera). Madrid. Universidad Carlos III de
Madrid
GARTNER
2015a Use the Gartner Business Analytics Compass to Drive Strategy. [19 November].
https://www.gartner.com/doc/3170223/use-gartner-business-analytics-compass
GARTNER
2015b Survey Analysis: ITScore Assessments Show BI Maturity Remains Low, With
Organizations Ill-Prepared for Challenges Ahead. Cindi Howson. [05 August].
https://www.gartner.com/doc/3106521/survey-analysis-itscore-assessments-bi
GARTNER
2014 IT Glossary. Business Analytics. http://www.gartner.com/it-glossary/business-
analytics.
GARTNER
2010 Clarifying the Many Meanings of "Analytics" [31 de marzo].
https://www.gartner.com/doc/1332127/clarifying-meanings-analytics
HAUGHTON, D y otros
2015 Optimization of the promotion mix in the healthcare industry’,International
Journal of Pharmaceutical and Healthcare Marketing , 9(4), pp. 289–305.
JAYANTHI, Ranjan
1988 Data mining in pharma sector: benefits", International Journal of Health Care
Quality Assurance, Vol. 22 Iss: 1, pp.82 – 92.
LIEBOWITZ, Jay
2014 Business Analytics: An introduction. New York: Taylor & Francis Group.
LIU, Alex
2015 Data Science and Data Scientist. IBM Analytics.
http://www.researchmethods.org/DataScienceDataScientists.pdf
90
PÉREZ, Esteban
2014 Análisis comparativo de la uniformidad de contenido en tabletas de sildenafil (50
mg/tab), de un producto genérico y el medicamento original. En Revista Pensamiento
Actual - Vol. 14 - No. 23.
PFIZER
s.f. Conozca Pfizer. Perú. http://www.pfizer.com.pe/content/nuestrahistoria
DATAMONITOR
2004 Roche, GlaxoSmithKline and Eli Lilly case studies. ©
SWIFT, Ronald
2002 Accelerating Customer Relationships:Using CRM and Relationship Technologies.
New York: Accelerating
STUBBS, Evan.
2013 Delivering Business Analytics:Practical GuideLines for Best Practique.
Hoboken,New Jersey :JhonWiley
WANG, J y otros
2011 Data decoding in drug discovery and development”, InternationalJournal of
Decision Sciences 2011, 2(2), 93-107.
91
ANEXOS
Horas de Trabajo
Integrante del Equipo de Proyecto Mes 1 Mes 2 Mes 3 Total Horas Costo (Soles /Hora Total (Soles)
Experto en Analytics 160 160 320 S/. 90.00 S/. 28,800
Desarrollador 160 160 320 S/. 90.00 S/. 28,800
Project Manager 40 40 44 124 S/. 100.00 S/. 12,400
Total: S/. 70,000
(Escenario pesimista)