Está en la página 1de 14

ORIGINAL Mapeo de oportunidades de negocio regionales

utilizando
ARTÍCULO

geomarketing y machine learning


Mapeo de oportunidades de negocio regionales utilizando
geomarketing y aprendizaje automático
Marcelo Fernando Felix de Oliveira 1 , Pedro Henrique Melo Albuquerque1 ,
Peng Yao Hao1, Pedro Alexandre Henrique1

Universidad de Brasilia - UnB, Laboratorio de Aprendizaje Automático en Finanzas y Organizaciones,


1

Campus Darcy, Brasilia, DF, Brasil. Correo electrónico: felixmarcelo.mf@gmail.com; pedroa@unb.br;


peng.yaohao@gmail.com; pedroalexandre.df@gmail.com

Cómo citar: Oliveira, M. F. F., Albuquerque, P. H. M., Hao, P. Y., & Henrique, P. A. (2020). Mapeo de
oportunidades de negocio regionales utilizando geomarketing y aprendizaje automático. Gestão &
Produção, 27(3), e4158. https://doi.org/10.1590/0104-530X4158-20

Resumen: El objetivo de este estudio es desarrollar una herramienta cuantitativa, basada en


Machine Learning y Geomarketing para identificar oportunidades de negocio y contribuir a la
estrategia proceso de elección local de la red de franquicias seleccionando regiones que
tienen una alta demanda y una falta de oferta de productos. Además, realizamos un análisis
cualitativo de los lugares de negocio seleccionados en base a criterios definidos. Esta
predicción viene dada por la construcción de un patrón de consumo, definido por un clasificador,
basado en las características de los derechos reservados. Inicialmente, para una mejor
comprensión sobre este tema, se realizó un fondo teórico que abarca los principales
conceptos sobre Geomarketing y Machine Learning y sus aplicaciones. . Después de eso para
una demostración de los resultados, optamos por la aplicación del método para el mercado de
chocolates finos (Cacau-Show) en el Distrito Federal. Las principales bases de datos utilizadas
en este trabajo fueron Pesquisa de Orçamentos Familiares y del Instituto Brasileiro de Estatística
e Geografia (IBGE). Como resultado, se obtuvo el Gasto Estandarizado, que indica el
requerimiento para cada Sector Censitar, como información georreferenciada de la
competencia, que contiene 44 tiendas que tienen como principal producto de chocolate fino, y
como mallas digitales del Distrito Federal. El cruce está disponible para la elaboración de un
mapa que facilita la identificación de las oportunidades de negocio para el mercado de
chocolates finos en el Distrito Federal, Brasil.
Palabras clave: Geomarketing; Soporte vectorial machine; Economía regional; Franquicias
estratégicas; Aprendizaje supervisado.

Resumen: El objetivo de este estudio es la elaboración de una herramienta cuantitativa,


basada en técnicas de Geomarketing y Machine Learning, capaz de identificar oportunidades
de negocio y contribuir al proceso estratégico de elección de localización de un red de
franquicias, seleccionando regiones que tienen una previsión de alta demanda y una falta de
oferta de productos. Además, se realizó un análisis cualitativo de los puntos comerciales
seleccionados en base a criterios definidos durante el trabajo. Esta predicción se basa en la
construcción de un patrón de consumo, definido por un clasificador, basado en las
características de los individuos que suelen comprar el producto. Inicialmente, para una mejor
comprensión del tema, se realizó una base teórica , incluyendo los principales conceptos
sobre Geomarketing y Machine Learning y sus aplicaciones. Luego, para la demostración de la
1/14
Cartografía regional negocio Oportunidades...

Recibido el 18 de septiembre de 2017 - Aceptado el 29 de junio de


Apoyo financiero: Ninguno.
Este eso Uno arti de accesoCle
abierto de Atribución Creativo Procomún, que permite
distribuido bajo los términos de la Licencia
uso, distribución y reproducción sin restricciones en cualquier medio, siempre que la obra original se cite adecuadamente.

Gestión y producción, 27(3), e4158, 2020 | https://doi.org/10.1590/0104-530X4158-20

Resultados, se optó por aplicar el método para el mercado dechocolates finos (Cacau-Show) en el Distrito Federal.
Las principales bases de datos utilizadas en este estudio provienen de la Encuesta de Presupuestos Familiares y
el Censo Demográfico, ambos desarrollados por el Instituto Brasileño de Estadística y Geografía (IBGE). Como
resultado, obtuvimos el Gasto Estandarizado, que indica el nivel de demanda para cada Sección Censal,
la información georreferenciada de la competencia, que contiene 44 tiendas que tienen como producto principal
el chocolate fino, y las mallas. del Distrito Federal. El cruce de esta información permitió la elaboración de un
mapa que facilita la identificación de oportunidades de negocio para el mercado de chocolates finos en el Distrito
Federal.
Palabras clave: Geomarketing; Máquinas de soporte vectorial; Economía regional; Franquicias estratégicas;
Aprendizaje supervisado.

1 Introducción
La ubicación es un elemento crucial para el éxito o el fracaso de una empresa. Se sabe que una
parte representativa de los empresarios que cerraron sus empresas no sabían el número de clientes
que tendrían y su consumo. hábitos; el número de competidores presentes en la región; y la mejor
ubicación para la instalación de su negocio. Estos datos expresan la importancia de elegir el punto fo
el futuro de una organización.
Según Cliquet (2006), la cobertura territorial tanto a nivel regional como internacional es al menos
tan importante como el volumen de ventas para determinar la fortaleza de una red de tiendas. En este
contexto, y considerando la necesidad de que una red de franquicias cuente con un proceso de
decisión juicioso y estratégico en la determinación de un punto comercial, este trabajo tiene el siguiente
problema de investigación:
"Demostrar el potencial del Geomarketing, combinado con técnicas de Machine Learning, para
mejorar las estrategias de elección de ubicación en una red de franquicias".
Así, el objetivo de este artículo es la elaboración de un método cuantitativo que ayude al proceso
de decisión profesional de una red de franquicias a partir del uso de Técnicas de Geomarketing y
Machine Learning. Durante el transcurso del estudio, se preparó una cesta de productos de acuerdo
a lo que ofrece la red de franquicias elegida y que están presentes en el POF 2008-2009. Además,
se elaboró un modelo explicativo basado en las variables contenidas en el POF 2008-2009 que fueron
relevantes para explicar el consumo del producto ofrecido. por la franquicia. Esto se hizo para
construir un modelo de aprendizaje machine capaz de predecir el comportamiento del consumidor
de acuerdo con la información recopilada por el POF 2008-2009. Después de eso, la función de
decisión estimada por el clasificador se aplicó en la base de datos del Censo Demográfico de la
Universidad Brasileña de Geografía y Estadística (IBGE, 2010) de 2010, para obtener pronósticos
sobre el consumo de la población del Distrito Federal. Finalmente, se realizó una construcción
cartográfica, con la ayuda del software Qgis y técnicas de Geomarketing, de la competencia y la
distribución de la demanda del producto elegido a lo largo del territorio del Distrito Federal; así como
indicar, mediante criterios eliminatorios y clasificatorios, el lugares que representan negocios.
Según Dobbs y Hamilton (2007 apud Machado, 2016) y Wright & Stigliani (2012 apud Machado,
2016), el entorno externo y las condiciones de oferta y demanda pueden o no favorecer el crecimiento
de una empresa. . Un mercado competitivo se caracteriza por la incertidumbre y su compacidad
requiere el uso de una gran cantidad de información para la toma de decisiones (Janssen, 2009 apud
Machado, 2016).
Administración & Producción, 27(3), e4158, 2020 2/14
Cartografía regional negocio Oportunidades...

Es fundamental para cualquier empresa conocer su mercado en detalle. La combinación de una


base de datos que proporciona información conductual a los posiblesclientes - como sus hábitos de
consumo, ingresos, escolaridad, entre otros- y sus Los resultados de la información espacial permiten
al gerente saber cómo se comportan, cuáles son sus características y dónde se encuentran estos
individuos. Esta unión de información permite un análisis más exhaustivo y es posible gracias a las
técnicas de Geomarketing.
Este conocimiento sobre los consumidores, más la herramienta de Geomarketing, información
sobre dónde y cómo estos clientes se colocan gráficamente en el mercado, es de gran valor para
implementar un enfoque de marketing. Según Cliquet (2006), existe una creciente necesidad de una
comprensión más precisa del mercado, que se manifiesta a través de segmentaciones crecientes y
específicas. Esta segmentación se debe a la fragmentación gr adual de la población y a la necesidad
de definir una estrategia diferenciada para cada segmento.
Por lo tanto, es una herramienta muy útil para los gerentes, ayudando en la toma de decisiones y
facilitando la identificación de oportunidades y amenazas para usted. Además, es posible afirmar que
las técnicas de Geomarketing contribuyen a una mejor asignación de los recursos disponibles
(Baviera-Puig et al., 2009; Mangini et al., 2017); reducir los riesgos que conlleva el proceso de
apertura de una nueva spo t comercial, evitando cuestiones como la falta de demanda, la escasa
aceptación del público o el exceso competencia; y optimizar los resultados de la organización, ya que
es capaz de identificar el entorno ideal para el desarrollo empresarial y, en el caso de las franquicias,
dirigirse a los regones con un brecha de cobertura, que termina representando un costo para una red
de tiendas.
La aplicación del machine learning en la literatura de geomarketing es escasa. Aunque aún no es
un tema muy extendido en Brasil, es una metodología consolidada internacionalmente que presenta
una amplia variedad de disciplinas que hacen uso de esta herramienta como objeto de estudio, como
Agricultura, Sanidad e Ingeniería. Esta tecnología está presente en bancos, redes sociales,
aplicaciones, e incluso en la forma en que funcionan los ordenadores y smartphones para ofrecer un
servicio personalizado al propietario. Todo esto es posible porque la máquina puede acumular
experiencias y aprender de ellas, y así es capaz de hacer predicciones. El potencial sobre la unión
entre estas dos tecnologías es grande, teniendo en cuenta que el modelo puede, a través de una base
de datos georreferenciada, aprender cómo contras Los umers se comportan y devuelven, también en
este formato, un pronóstico de cómo se comportarán los individuos de una región determinada frente
a la apertura. de un nuevo negocio en su zona residencial.
En este sentido, la principal motivación teórica para la resolución de este problema es la falta de
exploración de este campo de conocimiento y la contribución que este estudio tiene. puede
proporcionar el desarrollo académico en esta área.

2 Referencia teórica
El avance de las técnicas y herramientas en el área de la cartografía ha sido increamente útil y
eficaz en las más diversas áreas del conocimiento. La cantidad de datos que se pueden insertar en
los mapas es cada vez mayor, lo que ha cousado la pérdida de espacio por el sistema analógico
(manual,) ya que la tendencia es la inserción de variasinformaciónes en el mismo mapa. El aumento
de la demanda de una representación cada vez mayor de los datos dentro de un mapa, paralelo al
avance de las computadoras, llevó a la aparición de una poderosa herramienta. , Sistemas de
Información Geográfica (SIG).
La ubicación óptima de un establecimiento, según Daskin (1995) apud Briozo & Musetti (2015) es
la que maximiza el servicio prestado. Además, el análisis estratégico de los posibles puntos para
invertir en un negocio es esencial para la supervivencia del negocio, ya que, en varios casos, impacta
directamente en su capacidad productiva (Kloose & Drexl, 2005 apud Briozo & Musetti, 2015).

Administración & Producción, 27(3), e4158, 2020 3/14


Cartografía regional negocio Oportunidades...

2.1 Aplicaciones SIG


Según Burrough y McDonnell (1998) apud Carnasciali & Delazari (2011, p. 107), Geographic
Information Systems (GIS) are "[...] un conjunto de herramientas para recopilar, almacenar, recuperar,
transformar y representar visualmente datos espaciales". Tienen la capacidad de integrar datos de
diversas fuentes con una base de datos georreferenciada, con el fin de realizar análisis diversos y
complejos a partir del resultado de dichos integración. La capacidad de integrar y combinar información
hace que el Sistema de Información Geográfica sea capaz de generar nuevas representaciones que
ayuden en el proceso de toma de decisiones. Habiendo sido desarrollado inicialmente con una
herramienta computacional capazde almacenar, manipular y permitir análisis y presentaciones de
datos geográficos, SIG, con avances tecnológicos y la reducción de sus costes, se han convertido
en una herramienta muy utilizada para la resolución de problemas que requieren un análisis espacial
preciso, como es el caso en el contexto del análisis de mercado (Martin et al., 2005 apud Fan &
Collischonn, 2014)
Con el desarrollo de los Sistemas de Información Geográfica y el ascenso de las máquinas a la
etapa de avance tecnológico moderno, el Geoprocesamiento - "[...] un conjunto de conocimientos
destinados al tratamiento de la información relativa a objetos, sucesos o fenómenos asociados a
posiciones relativas de la superficie terrestre" ( Furlan, 2011, p. 98) - se ha convertido en un elemento
dinámico en el proceso de conocimiento y representación de la superficie de la tierra.
Considerar la cantidad de información que se puede generar, como la identificación de segmentos
de mercado, el conocimiento profundo de cada grupo de consumidores, sus demandas y
especificidades, así como su ubicación en el espacio - la importancia del geomarketing tiende a
consolidarse cada vez más, ya que es vital para las empresas, especialmente en tiempos de crisis,
como lo es la actual Escenario brasileño, el uso de técnicas y herramientas que permiten atraer
clientes y mejorar las estrategias de ventas y publicidad orientadas a maximizar los resultados.

2.2 Sistema de Información Geográfica (SIG) y marketing.


Uniendo los conceptos de geografía y marketing, siendo el primero la distribución territorial de
los fenómenos y el segundo como "[...] el acto de conocer el mercado de acción de una organización,
para posteriormente ofrecer, de forma innovadora y creativa, los productos y servicios que este
mercado wants" (Zela, 2004 apud Furlan, 2011, p. 100), define el geomarketing como "[...] la disciplina
que estudia las relaciones existentes entre las estrategias y políticas de Marketing y el territorio o
espacio, donde se encuentra la institución, sus clientes, proveedores y se localizan puntos de
distribución " (Davies, 1976 apud Furlan, 2011, p. 100).
La base para el éxito de la marcade relaciones es la identificación de grupos de clientes específicos
que tienen características homogéneas en detalle. Para identificar estos segmentos, es necesario
un gran número de información para conocer las particularidades de cada grupo y poder
satisfacersus necesidades. El proceso de segmentación es largo y complejo, ya que requiere la
confirmación de que los segmentos existen, la determinación de sus características y ubicación para
que, a partir de esta información, es posible elaborar formas de asignar a cada cliente en el segmento
correcto (Shepard, 1993).
El SIG, y en consecuencia el Geomarketing, integran tres tipos de archivos: base de datos;
archivos geográficos; y archivos de puntos. La base de datos es información puramente externa a la
empresa, que contiene, por ejemplo, datos económicos, demográficos y de mercado social. Los
archivos geográficos contienen las entidades geográficas definidas por sus coordenadas utilizadas en
la producción de mapas. El tercer tipo de archivo es la unión de los dos primeros, donde los datos
recopilados se asocian con su ubicación geográfica. La combinación de estos tres archivos hace
posible la creación de mapas y la aplicación de colores, patrones y símbolos, representando
simultáneamente varios tipos de datos ( Aranha, 1996). El resultado final es el análisis del potencial

Administración & Producción, 27(3), e4158, 2020 4/14


Cartografía regional negocio Oportunidades...

de mercado, segmentación, localización del cliente o identificación del mejor punto comercial para un
organización

2.3 Sistemas expertos como subvención para la toma de decisiones locales


La decisión sobre la ubicación geográfica de una empresa es decisiva para su éxito o fracaso. Por
lo tanto, decidir la ubicación de una empresa requiere decisiones estratégicas basadas en estudios
cuidadosos, no solo en asuntos de sentido común o asesoramiento experto. Para ello, existen
herramientas y técnicas informáticas disponibles para apoyar este proceso de decisión, como los
Sistemas de Información Geográfica (SIG) y los Sistemas Expertos (ES).
A partir de las diversas definiciones de SIG y geomarketing presentadas en este trabajo es posible
afirmar que se trata de una herramienta muy útil para ayudar a la toma de decisiones en el análisis
espacial. La posibilidad de combinar datos sobre la ubicación de negocios y estaciones de servicio,
tanto de la propia red como de la competencia, con datos socioeconómicos, como ingresos,
escolaridad y densidad demográfica, y hacer previsiones basadas en esta información representa un
avance en el análisis de datos, que anteriormente, de forma aislada, sí lo hacía. no generar grandes
beneficios para las organizaciones. Este diferencial en el análisis es posible a través de metodologías
de Machine Learning.

2.3.1 El aprendizaje automático como mecanismo de los sistemas expertos


Feigenbaum, un experto líder en Especialistas en Sistemas (ES), según Waterman (1983) y
Harmon & King (1988), define un Sistema Experto como un "[... ] programa informático inteligente que
utiliza conocimientos y procedimientos inferenciales para resolver problemas que requieren
experiencia humana para su solución". Según Waterman (1986), los SE son programas informáticos
que manipulan el conocimiento para resolver problemas de manera eficiente en un área específica.
Un sistema experto se compone entonces de una amplia base de conocimientos y reglas sobre un
tema determinado y un procesador de inferencia, que utiliza la base para sacar conclusiones y producir
juicios sobre ese tema. La máquina interpreta y decide cómo deben usarse las reglas y en qué
orden, infiriendo así nuevos conocimientos (Genaro, 1986).
En este estudio, el Machine Learning se utilizará como un mecanismo de Sistema Especializado.
Según Monard & Baranauskas (2003), un Sistema de Aprendizaje Automático es un programa deco-
mputer que puede tomar decisiones basadas en experiencias acumuladas.
Este programa utiliza la inferencia inductiva para derivar nuevos conocimientos y predecir eventos
futuros. La inducción es una forma de inferencia lógica que permite la generalización de un modelo
validado para una muestra específica. Por esta razón, es necesario ser cauteloso al elegir la cantidad
y calidad de los ejemplos que se presentarán, ya que esto puede causar el hipótesis generadas para
ser de poco valor y no preservar la verdad (Monard & Baranauskas, 2003).
El aprendizaje inductivo se divide entre supervisado y no supervisado. En el primer caso, los datos
de entrenamiento se proporcionan al inductor (algoritmo de aprendizaje) que contiene individualmente
una serie de características, así como la clase asociada a ellas. . Es decir, en el aprendizaje
supervisado se proporciona para el algoritmo un conjunto de ejemplos, donde cada uno está asociado
a un grupo de características que definen un determinado clase, perteneciente a un conjunto discreto
(nominal) de clases {C1, C2, .. . En este way, el algoritmo de inducción será capaz de determinar
correctamente la clase de un nuevo ejemplo que presenta sólo su grupo de características como
información. (Monard & Baranauskas, 2003).
En el aprendizaje no supervisado, el inductor analiza los ejemplos proporcionados y trata de
determinar si hay alguna forma de agruparlos, formando los llamados clusters. Después de este paso,
generalmente es necesario un análisis para identificar lo que significa cada agrupación en el contexto
del problema que se está estudiando.
Administración & Producción, 27(3), e4158, 2020 5/14
Cartografía regional negocio Oportunidades...

Según Michalski (1983 apud Monard & Baranauskas, 2003) y Kubat, Bratko, Michalski (1988 apud
Monard & Baranauskas, 2003), los sistemas de aprendizaje se pueden clasificar en dos grandes
categorías:
I. Sistemas de caja negra: los sistemas que no presentan resultados internos claros sobre el
concepto creand. Es decir, su proceso interno de representación y reconocimiento no puede ser
fácilmente interpretado por los humanos;
II. Sistemas orientados al conocimiento: Su objetivo es crear resultados en forma de estructuras
simbólicas que sean comprensibles para los humanos.
En general, se produce la especificación del problema y la selección del conjunto de ejemplos
que servirán de entrada al inductor. Después de la inducción, se genera un clasificador capaz de
tomar decisiones futuras en función de la información que se le proporciona en el primer paso.
Después dela misma, se realiza una validación clasificadora, donde, teniendo en cuenta su precisión,
se realizan cambios en la especificación del problema y la selección de datos, con el fin de mejorar
la sistema en su conjunto.
Otra forma interesante de ilustrar el proceso de Machine Learning es imaginar un gráfico que
contenga todos los ejemplos ofrecidos al inductor. En este escenario, el objetivo del clasificador es
identificar qué clase pertenece a cada ejemplo y separarlos de forma lineal, como se muestra en la
Figura 1:

Figura 1. Separación of ejemplos. Fuente: Elaborado por los autores.

Figura 2. Maximización entre líneas. Fuente: Elaborado por los autores.

Como puede ver, hay infinitas formas de separar los clasificadores. Por lo tanto, el clasificador
encontrará el que proporciona el mayor margen entre clases, con el objetivo de aumentar la distancia

Administración & Producción, 27(3), e4158, 2020 6/14


Cartografía regional negocio Oportunidades...

(n) entre los límites de cada clase. . Cuanto mayor sea el valor de n, menor será la probabilidad de
error de clasificación, como se ilustra en la Figura 2.

3 Métodos y técnicas de búsqueda

3.1 Descripción general de la búsqueda


Las bases de datos utilizadas en este estudio fueron la Pesquisa de Orçamentos Familiares (POF)
2008-2009 y el Censo Demográfico de 2010, puesto a disposición por el Instituto Brasileño de
Geografía y Estadística (IBGE). Según el IBGE (2010), el POF 2008-2009 tuvo como objetivo la
composición de los presupuestos nacionales mediante la recopilación de datos sobre los hábitos de
consumo, la asignación del gasto y la distribución del ingreso, también considerando las
características de los hogares y personas entrevistadas. También según el IBGE, el Censo
Demográfico es una investigación realizada cada diez años, donde visitan investigadores del Instituto
Brasileño de Geografía y Estadística. todos los hogares del país aplican cuestionarios que tienen como
objetivo medir la densidad de población y conocer el perfil de la población brasileña.
Teniendo en cuenta que esta investigación tiene como objetivo la elaboración de un método
cuantitativo que ayude al proceso de decisión local para una red de franquicias, es importante destacar
que la elección de la franquicia a estudiar tiene una importancia secundaria dentro de la construcción
de los resultados, ya que el propósito es construir un método. que se puede reproducir para cualquier
institución que se encuentre en un proceso similar al que se está presentando.
La actividad elegida para la aplicación del método fue la comercialización de chocolates, que cuenta
con una de sus principales franquicias la red Cacau Show.
La población se definió entonces como todas las tiendas, ubicadas en el Distrito Federal, que tienen
como producto principal el chocolate fino, así como todas las personas que residen en el Distrito
Federal y el consumo de chocolate. En cuanto a la muestra, se localizaron 44 chocolaterías en el
Distrito Federal y todas las personas identificadas como consumidoras de chocolate en la Encuesta
de Presupuesto Familiar 2008-2009.
También es necesario tener una segmentación precisa del mercado. Como se vio anteriormente,
el aprendizaje automático, según Monard y Baranauskas (2003), utiliza la inferencia inductiva para
generalizar modelos y predecir eventos futuros basados en un conjunto de ejemplos suministrados. to
el inductor. De esta forma, los datos obtenidos en base al IBGE POF 2008-2009 servirán de insumo
para que la Máquina reconozca patrones entre los consumidores de chocolate y luego sea capaz de
predecir la demanda del producto dentro de la región estudiada.
Definió la demanda del producto deseado y la muestra de franquicias y empresas dentro del
Distrito Federal que venden productos similares o que pueden considerarse competidores, será
posible identificar oportunidades de negocio para la instalación de una nueva empresa.

3.2 Cesta de productos


Para la elaboración de la canasta de productos, se seleccionaron todos los productos
relacionados con el consumo de chocolates finos encontrados en POF 2008-2009. Tras la selección,
la cesta final de productos relacionados con el consumo de chocolates finos obtuvo un total de 62
artículos.

3.3 Selección de variables


Tras la elaboración de la Cesta de Productos, el siguiente paso fue seleccionar las variables que
pueden influir en el consumo de chocolate. La empresa Ipsos realizó en 2015 una investigación cuyo
Administración & Producción, 27(3), e4158, 2020 7/14
Cartografía regional negocio Oportunidades...

objetivo era identificar las principales motivaciones de los consumidores para comprar chocolate. En
su investigación, realizada con el foco en el chocolate, se encontró que la edad es un factor muy
relevante a la hora de tratar de entender el consumo de chocolateen Brasil. Sus datos muestran que
el 89% de los encuestados, con edades comprendidas entre los 13 y los 19 años, afirman consumir
chocolate, mientras que solo el 42% de los encuestados mayores de 60 años tuvieron una respuesta
positiva respecto a la consumo de este producto, mostrando que la discriminación por edad puede
revelar patrones muy diferentes, y la inclusión de esta variable en el modelo tiende a aumentar su
poder explicativo.
Además, se ha encontrado que el consumo de chocolate también varía según el género del
individuo. La encuesta explica que el 71% de las mujeres respondieron que sí al chocolate, mientras
que solo el 64% de los hombres respondieron de la misma manera. Las mujeres también consumen
el producto con más frecuencia, ya que el 35% de los encuestados dijeron que comen chocolate al
menos una vez a la semana, y para los hombres ese número se reduce al 30%. De manera similar a
la observada con consumidores de diferentes grupos de edad, la heterogeneidad observada entre
géneros también es relevante para el problema analizado en este estudio. .
Otra variable que puede influir en el consumo de chocolate son los ingresos. El chocolate es una
mercancía de consumo normal, es decir, su consumo tiende a crecer a medida que aumentan los
ingresos del comprador; por otro lado, se trata de un producto alimenticio, por lo que se espera
que a niveles muy altos de ingresos el consumo de este producto tienda a mostrar m arginalmente
aumentos menores. Por lo tanto, los ingresos no solo influyen decisivamente en el consumo de
chocolate, sino que también constituyen una relación potencialmente no lineal, lo que justifica su
inclusión en el presente. estudio. Así, se definen las variables que se considerarán influyentes en
el consumo de chocolate: edad, sexo e ingresos.

3.4 Tratamiento de datos y aplicación del método


Tras la selección de las variables, se inició el proceso de Machine learning, con el objetivo de
obtener, en base a los datos del POF 2008-2009, el consumo de individuos encontrados en el Censo
Demográfico de 2010, realizado por el Instituto Brasileño de Geografía y Estadística (IBGE, 2010).
Con esto en mente el proceso de entrenamiento de la máquina, el primer paso fue leer los datos
POF 2008-2009. El trabajo se realizó utilizando la información de gastos de los encuestados, así
como la información socioeconómica de estos, ambos disponibles en el sitio web del IBGE.
El objetivo era hacer que la máquina utilizara los datos de POF 2008-2009 para establecer un
patrón de consumo para el mercado del chocolate. Este proceso se dividió en dos etapas: la primera
fue la capacitación y la segunda la validación del asificador cl.
Esta división tiene como objetivo evitar el subajuste, que ocurre cuando se ofrecen pocos ejemplos
representativos al sistema de aprendizaje, haciendo que la hipótesis se ajuste muy poco al conjunto
de entrenamiento, y sobreajuste, que se caracteriza por un sobreajuste de la hipótesis en relación con
el conjunto de entrenamiento. Por lo tanto, a partir de la manipulación de la muestra utilizada en la
etapa de entrenamiento, es posible inducir hipótesis que mejor se ajusten al conjunto de
entrenamiento, lo que compromete su rendimiento en nuevos ejemplos. Siguiendo el mismo
razonamiento, una hipótesis en la situación de subinaptación funciona mal en un conjunto de pruebas
y presenta una mejora de rendimiento muy pequeña en el conjunto de entrenamiento. Para evitar
estos dos extremos, la base de datos se dividió en dos partes, con un 70% para el entrenamiento
de la máquina y un 30% para el validación del clasificador. (Monard & Baranauskas, 2003, p. 46).

Explicando brevemente el método, tenemos un ejemplo (x xi1, i2, , ... x yim, i )=(x yi, i ) que tiene m
atributos xij y cada atributo corresponde a una coordenada en el espacio de descripción 1 ≤ ≤i n y n
representa una serie de ejemplos. Además, cada coordenada definida por un atributo xij se inserta en

Administración & Producción, 27(3), e4158, 2020 8/14


Cartografía regional negocio Oportunidades...

una región del espacio de descripción, que fue asociada, por el clasificador, con un clase yi . (Monard
& Baranauskas, 2003, p. 45).
Otro punto importante en el entrenamiento de una máquina es la definición de la tasa de error de
un clasificador h, así como su precisión. La tasa de error no es más que una comparación
entre la clase verdadera del ejemplo y la etiqueta imputada por el clasificador, generalmente
1n

representada por la fórmula Err h( )= ∑yi ≠ h x( i ) , donde el operador E retorna el


n i 1=
velue 1 cuando el conditiono E es verdadero y 0 en caso contrario. Esta relación informa la tasa de
error del clasificador. Por lo tanto, para definir el nivel de precisión, Acc h( )= − 1 Err h( ) .
(Monard & Baranauskas, 2003)
En este trabajo, por tratarse de un problema de regresión, la comparación entre la clase real del
ejemplo y la asignación dada por la máquina se realizó a través de la Error cuadrático medio, dado por
(1):

1n 2

mse err h_ ( )= ∑(y −h x( )))


(1)
n
Es importante tener en cuenta que queremos la construcción de clasificadores con una baja tasa
de error (1) en relación con el conjunto de pruebas. Por lo tanto, el cálculo de la precisión (o error) de
la hipótesis se centró en el 30% de la muestra destinada a la etapa de validación.
Una vez realizada la división de la base de datos, el siguiente paso fue la creación de la lista de
parámetros, C y σ, que se utilizarán en el aprendizaje de la máquina. Ambos parámetros son
establecidos por el usuario del método. El parámetro de regularización C representa, en mayor o
menor grado, el nivel de importancia de los errores de clasificación generados por el clasificador,
mientras que el parámetro σ está relacionado con la precisión del clasificador.
Para la definición de cada par de parámetros, se utilizó el que tenía el lowest Medium Square
Error ( mse err h_ ( ) ). Esto provoca una reducción en la diferencia entre el valor real y el asignado
por el clasificador, haciendo que la máquina sea más precisa y más cercana a la realidad.

3.4.1 Aplicación del método


Esto provoca una reducción de la diferencia entre el valor real y el asignado por el clasificador,
haciendo que la máquina se vuelva más completa. El aprendizaje automático se ha completado y el
comportamiento de consumo de chocolate en el Distrito Federal ha comenzado. Como se ha visto en
la sesión de procesamiento de datos, se puede observar que el POF 2008-2009 y el Censo
Demográfico 2010 del IBGE (Distrito Federal) están organizados de tal manera que , en ambas bases,
las variables de edad, sexo e ingresos se comportan de la misma manera, y solo POF 2008-2009
tiene información relacionada con el gasto (gasto) del chocolate. Así, la máquina, de forma sencilla,
comparó las dos bases, aplicando el patrón de consumo establecido a partir del POF 2008-2009 en el
Censo 2010. En otras palabras, los individuos con características similares de edad, género e ingresos,
hipotéticamente, tendrán patrones de consumo que también son similares . Y cerca de la realidad.
Después del proceso de aprendizaje, se inició el comportamiento de consumo de chocolate en el
Distrito Federal. Como se vio en la sesión de procesamiento de datos , se puede observar que el
POF 2008-2009 y el Censo Demográfico 2010 del IBGE (Distrito Federal) están organizados de tal
manera que, en ambas bases, las variables de edad, género e ingresos se comportan de la misma
Administración & Producción, 27(3), e4158, 2020 9/14
Cartografía regional negocio Oportunidades...

manera, y solo PDE 2008-2009 tiene información relacionada con el gasto (gasto) del chocolate. Así,
la máquina, de forma sencilla, comparó las dos bases, aplicando el patrón de consumo establecido a
partir del POF 2008-2009 en el Censo 2010. En otras palabras, los individuos con características
similares de edad, género e ingresos, hipotéticamente, tendrán patrones de consumo similares.
El POF 2008-2009 es una encuesta a nivel nacional y se utilizó en su totalidad para establecer un
patrón de consumo. En cuanto al censo de 2010, que también es una encuesta nacional, sólo se
utilizaron datos referidos al Distrito Federal.
Después de la fase de solicitud, determine el Gasto Estandarizado (GP) para cada sector censal del
Distrito Federal. El GP sigue la misma lógica de la puntuación estandarizada y se definió aquí como
la diferencia entre el pronóstico de gastos (G), asignado a un censo en particular. sector, y el Gasto
Promedio (G ) registrado en el Distrito Federal, dividido por la desviación estándar (σ), como se
muestra en la Ecuación 2 a continuación:

(G G− )
GP= (2) s
Esta ecuación permite comparar la posición relativa de cada sector censal, en el caso del gasto
en chocolate, en relación con los demás. Así, cuanto más cerca de cero esté el GP del sector
censal, más cerca estará del Gasto Promedio del Distrito Federal (G ).
Así, a través del índice (GP), las secciones censales se clasificaron según su nivel de demanda
de chocolate, como se muestra en la Tabla 1 a continuación:

Tabla 1. Clasificación de los sectores censales por demanda.

N INTERVALO DE COLOR DE LA CLASIFICACIÓN GP


1 0.00000 - 0.08522 Demanda extremadamente baja
2 0.08523 - 0.08617 Muy baja demanda
3 0.08618 - 0.08685 Baja demanda
4 0.08686 - 0.08738 Baja demanda media
5 0.08739 - 0.08787 Demanda media
6 0.08788 - 0.08838 Alta demanda media
7 0.08839 - 0.08904 Alta demanda
8 0.08905 - 0.08997 Muy alta demanda
9 0.08998 - 0.09285 Demanda
extremadamente alta
Fonte: Elaborado por los autores.

La Tabla 1 muestra cómo se construyó la clasificación de las secciones censales, considerando


nueve niveles de demanda. En el nivel más bajo, las secciones censales que presentaron un Gasto
Estandarizado entre 0.00000 y 0.08522 tienen una demanda de chocolate muy baja en comparación
con el resto de la Distrito Federal. Para el nivel más alto, aquellos que tenían su GP entre 0.08998 y
0.09285 fueron considerados como regiones de muy alta demanda para el producto.

4 Resultados y discusión

4.1 Negocios y oportunidades


Después de la etapa de capacitación y el cálculo del consumo estandarizado para cada sección
censal del Distrito Federal, el proceso de reconocimiento de los puntos que podrían clasificarse como
Administración & Producción, 27(3), e4158, 2020 10/14
Cartografía regional negocio Oportunidades...

negocios. se iniciaron las oportunidades. Esta etapa consiste en identificar las áreas que están
predispuestas al consumo de chocolate, teniendo en cuenta la información generada por el método de
Machine Learning y la aplicación de los patrones de consumo del POF 2008-2009 en el censo
demográfico del IBGE (2010) para el Distrito Federal.
Además de la información obtenida en la sesión anterior sobre el perfil de quién consume chocolate
y cuáles son las características demográficas de estos individuos, algunos criterios cualitativos tienen
abeja definida para que cualquier punto pueda ser clasificado como una oportunidad de negocio. Por
lo tanto, se estableció que una oportunidad de negocio debe respetar los siguientes criterios:
CRITERIOS ELIMINATORIOS
Estar dentro de una región clasificada por el IBGE (2010) como urbana; Estar
ubicado en una zona comercial.
Formar parte de un sector censal que, según su GP, presente una clasificación de demanda alta,
muy alta o extremadamente alta.
CRITERIOS CLASIFICATORIOS
Cuanto mayor sea el pronóstico del GP , mejor será la oportunidad de negocio en comparación
con los demás.
Refiriéndose al mencionado punto "b" de los criterios eliminatorios, que trata de la restricción
de la competencia en el mismo establecimiento comercial, es necesario definición detallada de qué
tiendas, presentes en el Distrito Federal, serán consideradas como competencia para una nueva
franquicia de cacao-show.
Así, continuamos con la búsqueda, a través de Google Maps, de tiendas que cuenten con una
propuesta similar a la presentada por Cacau Show. El resultado de esta investigación fue una lista de
44 tiendas, donde 15 son del cacauí S, ya que la asignación de estas tiendas cercanas a cada una
otros pueden generar un proceso de "canibalismo" dentro de la red. Además, 9 tiendas pertenecen a
la franquicia Brasil Cacau, 10 tiendas a la cadena Kopenhague, 3 tiendas a Kaebisch Chocolatey las
marcas Aguimar Ferreira Bombons, Baby Chocolates, Brigadeirando, Chocolataria Gramado Brasilia,
Dulce Patagonia, Fábrica de Chocolate y Chocolate Stans tienen una tienda cada uno.
A continuación, se utilizó el programa Qgis para crear el mapa. Este software permite la
conexiónpráctica entre el Gasto Estandarizado (GP), la competencia y las mallas digitales del Distrito
Federal . Como resultado de este cruce de datos, se creó un mapa coloreado según el GP (Tabla
1) y marcado con la ubicación de cada una de las 44 tiendas que venden chocolates finos de el Distrito
Federal.
Con esto, se realizó un análisis general del DF, con el propósito de hacer posible la identificación
de puntos de oportunidad para el mercado de chocolates finos de la Federal. Distrito. Como espropio
en el mapa a continuación, hay regiones que se pueden identificar fácilmente como de baja
competencia y una demanda interesante para abrir una nueva tienda. De forma rápida y estratégica,
teniendo en cuenta la información sobre la previsión de la demanda y la competencia disponible en
el mapa, es posible definirlas. regiones como posibles puntos de oportunidad.
La Figura 3 muestra que incluso con el alto número de tiendas competitivas, hay puntos fácilmente
identificables a través de los tonos más oscuros de rojo, que deberían ser rojos como posibilidades.
para abrir un nuevo negocio. Como resultado, se genera un análisis complejo, considerando aspectos
demográficos que influyen en la previsión de la demanda del producto, y al mismo tiempo eficiente
puede reducir en un aspecto relevante la forma en que las regiones deben analizarse en profundidad
rápidamente, ahorrando tiempo y disponibilidad de recursos organizacionales en el proceso de
selección de ubicación.

Administración & Producción, 27(3), e4158, 2020 11/14


Cartografía regional negocio Oportunidades...

Figura 3. Mapa general de pronóstico de demanda de chocolate en el Distrito Federal.


Fuente: Elaborado por los autores.

5 Conclusión y recomendaciones

5.1 Conclusión
El método propuesto consistió en construir una herramienta cuantitativa capaz de identificar
oportunidades de negocio en el Distrito Federal. Para ello, se eligió el mercado de chocolates finos
y se inició el tratamiento de datos de la Encuesta de Presupuesto Familiar 2008-2009, creando las
variables deseadas y eliminando información innecesaria para este análisis. Dentro del POF 2008-
2009, se seleccionaron productos relacionados con el chocolate fino. Next, identificamos qué
individuos consumieron al menos uno de los ítems seleccionados, obteniendo el gasto total de cada
encuestado con chocolate, así como sus ingresos. , información de sexo, edad y ubicación. A partir
de esta información, el clasificador se able ab le para establecer un consumo estandarizado del
producto, teniendo, como requisito previo para el pronóstico, las características obtenidas en el POF
- 2008-2009. Después del Machine Learning, la etapa de aplicación se produjo en la base de datos del
Censo IBGE 2010, con el resultado final mapeando la demanda de chocolates finos en todo el Distrito
Federal.
Desde el análisis de los resultados y el mapeo exitoso de oportunidades de negocio hasta el
mercado del chocolate fino en el Distrito Federal, se puede decir, con un fou práctico. ndation, que
el Geomarketing, combinado con técnicas de machine learning, representa una herramienta con
valiosos recursos para la delimitación de estrategias organizacionales, ya sea en la ayuda de acciones
de marketing o en materia de elección de ubicación y expansión de negocio, con posibilidad de
enfoque y previsiones de consumo para un público objetivo específico.
La herramienta cuantitativa desarrollada en el presente trabajo ha demostrado ser capaz de
ayudar al proceso de decisión de localización de una red de franquicias, logrando con éxito la
creaciónde una Solución al problema de investigación, dado que el potencial de la herramienta para
generar mejoras en las estrategias de elección de ubicación se evidenció una red de franquicias a
través de la elaboración del mapa como resultado final, que contiene los pronósticos de demanda para

Administración & Producción, 27(3), e4158, 2020 12/14


Cartografía regional negocio Oportunidades...

el mercado de chocolates en todo el Distrito Federal, y la ubicación de la competencia directa del red
elegida.
Uno de los mayores éxitos de este estudio fue su contribución intelectual a un área de conocimiento
que aún no está desarrollada, principalmente en Brazil, y que puede traer muchos beneficia tanto al
sector privado como a la esfera pública. El diferencial de esta metodología es la posibilidad de realizar
estimaciones de demanda, o aceptación de un determinado producto, a nuevos mercados, es decir,
regiones. que aún no tienen un historial de consumo en relación con el objeto de análisis. Además,
el resultado final del análisis, como se muestra en la Figura 3, ofrece al gestor mapas
georreferenciados que contienen información detallada sobre el funcionamiento del mercado. en
relacióncon su sector de actividad. Un ejemplo de esto es la clasificación de cada subdistrito por
bandas de Gastos Estándar (GP) y la ubicación de la competencia. Un producto final como este
reduce el riesgo involucrado en la decisión y permite al pesebre, teniendo el informe a mano, rastrear
sus estrategias de forma rápida y eficiente.

5.2 Limitaciones y recomendaciones


En cuanto a las limitaciones, se identificaron algunas observaciones y recomendaciones para
futuros trabajos en el área de Geomarketing y Aprendizaje y Máquina. El objetivo de este estudio fue,
de manera objetiva, la elaboración de una herramienta cuantitativa capaz de identificar oportunidades
de negocio y contribuir a la proceso de elección de localización de una red de franquicias. Sin
embargo, sería interesante que, tras identificar los puntos clasificados como oportunidades de
negocio, se hiciera un "ranking" basado en las ventas estimadas de cada punto de negocio. . La
intención sería encontrar el lugar más ventajoso para abrir el negocio. Además, una de las
limitaciones identificadas durante el estudio fue el hecho de que la base de datos utilizada en la
aplicación - Censo Demográfico IBGE - contiene información recopilada en el año 2010. Ciertamente
las características demográficas del Distr Federal ict han sufrido cambios durante estos seis años,
que terminan comprometiendo, en cierto modo, la predicción del clasificador. La misma crítica se
hace para los datos de capacitación y validación - Encuesta de Presupuestos Familiares -
considerando que fueron recopilados durante los años de 2008 y 2009 y pueden no reflejar de manera
confiable el comportamiento del consumidor en 2016.
Otro punto que requiere especial atención es el hecho de que el POF 2008-2009 no puede incluir,
dependiendo del objeto elegido para la previsión, algunos productos o servicios. Una muestra de esto
son los mercados de lujo, que podrían no ser capaces de utilizar este conjunto de datos para mapear
su mercado, teniendo en cuenta que POF 2008-2009, para el que se trata de se observó, no tiene
especificaciones de producto para este tipo de demanda. El mercado de los chocolates finos, used
en la aplicación del método, es un área que encaja, en cierto modo, en este mercado de lujo. Quien
consume un chocolate Cocoa-Show no es necesariamente la misma persona que compra una barra
de chocolate en el supermercado, lo que termina comprometiendo la predicción del clasificador. A
pesar de estas limitaciones, que se centraron básicamente en la base de datos utilizada, el método
demostró ser extremadamente robusto y demostró ser útil. tanto para el sector privado como para la
esfera pública.
Los resultados de esta aplicación en el mercado de chocolatedel Distrito Federal proporcionan una
ventana de perspectivas que tienen el potencial de sedimentar un análisis más detallado para un
gran variedad de circunstancias, ya que la metodología es robusta para aplicaciones versátiles. De
esta manera, los resultados del artículo son de gran valor para los inversores, empresarios, gerentes,
tomadores de decisiones, responsables políticos, instituciones de desarrollo y gobiernos. Por lo
tanto, se recomienda la reproducción del presente estudio para diferentes segmentos de mercado
para diferentes ubicaciones y diferentes cortes de tiempo.

Administración & Producción, 27(3), e4158, 2020 13/14


Cartografía regional negocio Oportunidades...

Referencias
Araña, F. (1996). Sistemas de información geográfica: un arma estratégica para el Marketing de Bases de Datos.
RAE - Revista de Administración de Empresas, 36(2), 12-16. http://dx.doi.org/10.1590/S0034-
75901996000200003.
Baviera-Puig, A., Buitrago, J. M., Escriba, C., & Clemente, J. S. (2009). Geomarketing: aplicación de los sistemas
de información geográfica al marketing. In Octava Conferencia Iberoamericana en Sistemas, Cibernética e
Informática. Winter Garden: International Institute of Informatics and Systemics.
Briozo, R. A., & Musetti, A. (2015). Método de toma de decisiones multicriterio : aplicación a la ubicación
espacial de una Unidad de Atención de Urgencias - UPA 24 h. Revista Management & Production,
22(4), 805-819. http://dx.doi.org/10.1590/0104-530X975-13.
Carnasciali, A. M. S., & Delazari, L. S. (2011). Ubicación geográfica como recurso organizativo. Uso de Sistemas
Especializados para Spara tomar la Decisión de Decisión Local del Sector Bancario. , 15(1), 103-125.
Cliquet, G. (2006). Geomarketing: métodos y estrategias en marketing espacial. Londres: ISTE Limited.
Fan, F., & Collischonn, W. (2014). Integración del Modelo MGB-IPH con el Sistema de Información Geográfica .
Revista Brasileña de Recursos Hídricos, 19(1), 243-254. http://dx.doi.org/10.21168/rbrh.v19n1.p243-254.
Furlan, A. A. (2011). Geoprocesamiento: Estudios de geomarketing y las posibilidades de su aplicación en la
planificación del desarrollo socioeconómico. Espacio y Tiempo, 29, 97105.
Genaro, S. (1986). Sistema experto: conocimiento artificial. Río de Janeiro: Libros Técnicos y Científicos Editora
S. A.
Harmon, P., & King, D. (1988). Sistemas expertos (A. F. Carpintero, Trad.). Río de Janeiro: Campus.
Instituto Brasileño de Geografía y Estadística - IBGE. (2010). Encuesta de Presupuestos Familiares 2008-2009:
gastos, ingresos y condiciones de vida. Río de Janeiro: IBGE.
Machado, H. P. V. (2016). Crecimiento de las pequeñas empresas: revisión de la literatura y perspectivas de
estudio. Revista Ges So & Production, 1(2), 419-432. http://dx.doi.org/10.1590/0104-530x1759-14.
Mangini, E. R., Rossini, F. H. B., Santos, A., & Urdan, A. T. (2017). Análisis de ubicación de estaciones de
ferrocarril y uso de Geomarketing. Revista Brasileña de Gestión y Desarrollo Regional, 13(2), 129-152.
Monard, M. C., & Baranauskas, J. A. (2003). Conceptos sobre machine learning. En S.O. Rezende (Ed.). Sistemas
inteligentes-fundamentos y aplicaciones (pp. 89-114). Barueri: Manole.
Shepard, D. (1993). Marketing de bases de datos: el nuevo marketing directo. São Paulo: Makron Books.
Waterman, D. A. (1983). Construcción de sistemas expertos. Canadá: Addison-Wesley Publishing Company.
Waterman, D. A. (1986). Una guía de tallos de sy expertos. Canadá: Addison-Wesley Publishing Company.

Administración & Producción, 27(3), e4158, 2020 14/14

También podría gustarte