Está en la página 1de 10

Índice

1. Información de la empresa .................................................................................... 1


2. Elegir una de las cinco empresas presentadas en el trabajo anterior, o una nueva
empresa........................................................................................................................ 4
3. Para la empresa elegida, identificar un problema que se pueda solucionar con la
ciencia de datos y formular la pregunta o preguntas adecuadas. .................................. 5
4. Basándose en la lectura “Los lenguajes de la ciencia de datos”, indicar cuál sería
el lenguaje más apropiado para este caso y por qué .................................................... 5
5. Redactar el perfil de un científico de datos para la empresa elegida en la sesión
anterior, tomando en consideración el rubro de la empresa y el tipo de problemas que
se deberá resolver. ....................................................................................................... 5
6. Evaluar si la empresa elegida cumple con principio éticos en el análisis de datos, y
si está en capacidad de evitar los cuatro errores mencionados en el artículo de
Lambrecht y Tucker del HBR. ....................................................................................... 6
Bibliografía ..................................................................... Error! Bookmark not defined.
1. Información de la empresa

a. Razón social y comercial de la empresa:


Desde el 2018, la Sodimac y Maestro unifican su Registro Único de
Contribuyentes para llamarse Tiendas del Mejoramiento del Hogar S.A.

b. Ubicación de sus oficinas, plantas, almacenes, etc.

El domicilio fiscal de la empresa está ubicado en la Av. Angamos Este Nro.


1805 Int. 2 (Oficina 2) - Surquillo.

Adicionalmente, cuenta con 128 establecimientos anexos entre locales


comerciales y depósitos, distribuidos en Lima y provincias.

c. Mercado / industria en la que compite, descripción de la industria en la que


se encuentra, entorno de la empresa.

Sodimac es una empresa que se desenvuelve en la industria del retail, en el


mercado de tiendas para el mejoramiento del hogar.

Sus principales actividades están orientadas a satisfacer las necesidades de


mejoramiento y decoración de los hogares de sus clientes, así como hacia
el desarrollo de soluciones en diferentes proyectos de construcción.

d. Productos y/o servicios que comercializa

Sodimac se dedica a la venta al por mayor y menor de materiales de


construcción, artículos de ferretería, y equipo y materiales de fontanería y
calefacción.

e. Indicar si comercializa sus productos/servicios a nivel local, nacional,


multinacional:

La empresa comercializa sus productos a nivel nacional. Es así como, en la


actualidad, cuenta con 56 tiendas en todo el país, entre Sodimac y Maestro.

f. Indicar si se trata de una franquicia nacional/extranjera:

Sodimac es una cadena chilena, perteneciente al holding Falabella. Está


presente en Chile, Perú, Colombia, México, Argentina, Uruguay y Brasil.

1
g. Origen de los capitales (peruanos, extranjeros, de qué país)

Sodimac se fundó en Chile como una cooperativa abastecedora de


empresas constructoras, convirtiéndose en sociedad anónima en los años
1980.

h. Antigüedad de la empresa:

En 1952 nace la Sociedad Distribuidora de Materiales de Construcción y en


el año 2004 inicia sus operaciones en el Perú.

i. Número de colaboradores:

El número de colaboradores entre Sodimac y Maestro es de 9,755, de los


cuales el 38% corresponde a mujeres, mientras que el 62% a hombres.

2
j. Organigrama:

3
k. El valor de sus ventas anuales aproximadamente

En el año 2018 las ventas de la empresa ascendieron aproximadamente a


S/ 3 300 miles de millones.

l. Su posición en el mercado (empresa líder o seguidora)

Sodimac se posiciona en el mercado retail de tienda para el mejoramiento


del hogar como empresa líder.

m. Principales competidores

Entre los principales competidores de Sodimac se encuentran los siguientes:

Canal Moderno

● Promart
● Casinelli
● Castor
● Martín Representaciones

Canal tradicional:

● Ferreterías
● Malvinas

2. Elegir una de las cinco empresas presentadas en el trabajo anterior, o una


nueva empresa.

A lo largo del desarrollo del presente trabajo, se investigó la aplicación de Data


Science en diversas empresas con la finalidad de familiarizar los conceptos
aprendidos, entre ellas podemos mencionar el Banco de Crédito del Perú, Banco
Interbank, Compañía Agrícola Monsanto y Sodimac Perú. De lo analizado
optamos por la empresa Sodimac Perú para aplicar los conceptos estudiados en
clases Con la intención de presentar una empresa no estudiada por otros.

Sodimac Perú es una empresa que pertenece a la corporación chilena Grupo


Falabella, inició operaciones en el Perú desde el año 2004 y hoy en día se
encuentra entre los principales retails de tienda para el mejoramiento del hogar

4
3. Para la empresa elegida, identificar un problema que se pueda solucionar
con la ciencia de datos y formular la pregunta o preguntas adecuadas.

De acuerdo a lo analizado en la empresa seleccionada, hemos identificado que


el problema que se puede solucionar con la ciencia de datos está orientado a
mejorar la percepción de los precios que tienen los clientes y mejorar la
rentabilidad de la empresa a través de optimización de procesos operativos e
identificación de los KVIs (Key Value Items) para mejorar los márgenes
comerciales.

A partir de ello se plantean las siguientes preguntas:

 ¿Quién realiza la definición de los KVIs actualmente?


 ¿Qué variables se tienen en consideración para la definición de los KVIs
actualmente?
 ¿Cómo le ayudan los KVIs al negocio a generar más ganancia?
 ¿Cuáles son los productos que atraen más clientes?
 ¿Cuáles son los productos más competitivos?
 ¿Qué productos son los que generan más tráfico en las tiendas?

4. Basándose en la lectura “Los lenguajes de la ciencia de datos”, indicar cuál


sería el lenguaje más apropiado para este caso y por qué

Para este caso el lenguaje identificado como el más apropiado es el lenguaje de


programación R, tomando en cuenta la gran cantidad de datos y análisis
estadísticos que se realizarán en este caso, además considerando que el
lenguaje de programación R es interactivo, que permite gradualidad en la
programación y contiene gran cantidad de librerías que pueden ser desarrolladas
en diversos lenguajes.

5. Redactar el perfil de un científico de datos para la empresa elegida en la


sesión anterior, tomando en consideración el rubro de la empresa y el tipo
de problemas que se deberá resolver.

Para la elaboración de un perfil adecuado del científico de datos es necesario


establecer un requerimiento de habilidades blandas y habilidades técnicas. Es
recomendable dar prioridad al primer tipo de habilidades ya que es mucho más

5
factible capacitar en competencias duras como por ejemplo un nuevo lenguaje
de programación, en comparación a cualidades como la habilidad para
relacionarse, o un alto nivel de comunicación. Asimismo, en lo posible reconocer
los valores de la empresa en la persona que ocupe el puesto. En cuanto a las
habilidades técnicas, lo correcto es partir de las funciones que se requieren y del
tipo de lenguajes de programación o entorno informático que se planee usar.

Data Scientist

Ingeniero de sistemas, estadístico, economista, matemático u otra carrera afín


con sólida base en estadística, matemáticas y herramientas informáticas.
Experiencia previa en proyectos de investigación de mercados o en áreas de
marketing relacionadas a desarrollo de productos o fijación de precios.

-Habilidades blandas: Buena comunicación y storytelling. Capacidad para


relacionarse. Flexibilidad. Manejo de presión y stress.

-Conocimientos técnicos: Conocimientos avanzados en estadística. Manejo y


almacenamiento de data. Office Avanzado. Deseable: Conocimientos de pricing.
Programación en R y/o Python.

6. Evaluar si la empresa elegida cumple con principio éticos en el análisis de


datos, y si está en capacidad de evitar los cuatro errores mencionados en
el artículo de Lambrecht y Tucker del HBR.

Sodimac realiza esfuerzos adecuados para mantener principios éticos que


garanticen la protección de la información privada de sus clientes. Para tal fin,
cuenta con una Política de protección de datos personales la cual respeta los
principios rectores establecidos en la normativa vigente. Dichos principios
incluyen: el principio de legalidad, el principio de consentimiento, el principio de
finalidad, el principio de proporcionalidad, el principio de calidad, el principio de
seguridad, el principio de disposición de recurso y el principio de nivel de
protección adecuado.

Gracias a estas previsiones no se registran incidentes, reclamos o denuncias por


violación a la privacidad o fuga de información.

6
Con respecto a los errores mencionados por Lambrecht y Tucker podemos
mencionar lo siguiente:

Error 1: No comprender los errores de integración.


La compañía enfrenta la problemática de integrar la data de la venta física con
la “intención” de compra online, lo cual perjudica también la definición de los
KVI’s. En cierta medida podemos afirmar que se comete este error ya que no
hay una solución óptima al respecto. Una propuesta de solución es realizar un
mapa de calor de las tiendas tipo que se usan para los KVI, con la navegación
de la página web, según la ubicación del cliente.
Error 2: No darse cuenta de los límites de los datos no estructurados.
Una proporción mayoritaria de los datos disponibles son estructurados, por lo
cual no se incurre en este error. Sin embargo, se propone el uso de datos no
estructurados (como video) para mejorar la definición de los KVI. Dado que hay
muchas aplicaciones para este tipo de data en retail, es necesaria su
implementación teniendo en cuenta sus limitaciones, constantemente evaluando
su utilización, mejorando progresivamente su uso.
Error 3: Asumir que las correlaciones tienen algún significado.
A fin de evitar que las correlaciones sean establecidas como relaciones de
causalidad, el algoritmo que utiliza la compañía está limitado por reglas de
negocio que son determinadas de acuerdo a los efectos de unas variables sobre
otros en la realidad.
Error 4: Subestimar las habilidades laborales que se necesitan.
Sodimac se preocupa por contar con profesionales que dominen el negocio, en
paralelo a las habilidades técnicas requeridas, por encima de las características
y/o volumen de la data que se recopile. Esto debido a que el conocimiento del
negocio se traducirá en algoritmos más eficaces.

7. Utilizar el complemento Solver de Excel para reducir la suma de las


diferencias de las estimaciones con el método de promedio móviles
ponderados, aplicados a una serie de tiempo de las ventas de la empresa
elegida para el trabajo del curso.

7
8. Identificar un problema real o supuesto en la empresa elegida, que pueda
resolverse mediante el clustering, y esbozar el esquema de solución

La utilidad del clustering radica en la posibilidad de agrupar subconjuntos de


datos con características similares, otorgando mayor profundidad al
conocimiento que se pueda tener de una población amplia. Llevándolo al campo
empresarial, esto puede permitir diseñar estrategias más específicas en
cualquiera de los elementos de la cadena productiva de una empresa, cual sea
su rubro.
En relación a Sodimac y el caso de estudio, la utilización de clusters puede ser
beneficiosa para un mejor conocimiento de los grupos de clientes,
segmentándolos de acuerdo a sus intereses, permitiendo identificar KVI’s de
manera eficiente y proactiva. A continuación, se detalla un esquema de
aplicación del método k-means clustering para una categoría de productos en el
cual la empresa haya lanzado ofertas. (las imágenes son referenciales para el
caso de cómodas y no corresponden a datos reales de la compañía).

Esquema de solución para una categoría “X” de productos.

1. Obtención de datos. Para la aplicación del método, se necesitan dos


tablas: a) Detalle de cada oferta lanzada, incluyendo columnas por “x”
características que se consideren clave en el producto escogido. b) Listado de
cada transacción realizada para cada oferta, detallando el cliente que la realizó.

8
2. Modelado de datos. Para poder relacionar ambas fuentes de datos es
necesario ordenar de manera matricial las transacciones realizadas. Esto puede
ser realizado a través del uso de una tabla dinámica tomando las ofertas como
filas, los clientes como columnas, y el conteo de ofertas como valores. Este
conteo mostrará 1 si existe el par cliente/oferta, y 0 de lo contrario.

Esta matriz puede ser añadida a la tabla a), a partir de la primera columna vacía
a la derecha de los datos. De esta manera, ya se contaría con una matriz que
además consolide las descripciones de cada una de las ofertas.

Para el siguiente paso, copiar todos los datos en una nueva tabla. Insertar una
columna por cluster entre la matriz y las columnas originales de datos.

También podría gustarte