Está en la página 1de 13

78.

585 Marketing cuantitativo


Curso 2022-23 / 2º semestre

Solución orientativa

Prueba de evaluación continua 5.


Repaso de los cinco módulos de la asignatura

Enunciado

PREGUNTAS DE RESPUESTA BREVE (máximo 15 líneas por pregunta) – TOTAL 4 PUNTOS

1. (1 punto) Una vez acabado el semestre en la UOC, los estudiantes son invitados a contestar la encuesta
de satisfacción. Con estas respuestas, la organización elabora un informe del cual hace públicos los
principales resultados. En el siguiente enlace encontraréis los Resultados de la encuesta de valoración de
los estudiantes del semestre 2020-2021. Tras leerlo detenidamente, indicad como mínimo 2 análisis
multivariantes que se hayan estudiado a lo largo del curso y se puedan aplicar con las variables que se
muestran en estos resultados, diciendo el motivo de su adecuación y los objetivos que estarían cubriendo,
indicando así la información que estarían facilitando. Argumentando vuestra respuesta (14 líneas como
máximo).
Para dar respuesta a la pregunta, en primer lugar, tenemos que identificar de qué tipo de información
disponemos. Según los resultados de la Web, podemos comprobar que tenemos las valoraciones de una
serie de preguntas que se desglosan según los colectivos que han respondido (estudiantes que se
incorporan, estudiantes que han recibido docencia, estudiantes graduados y profesorado). Estas preguntas
hacen referencia a la satisfacción de diferentes aspectos que se ha medido en una escala del 1 al 5. Es
verdad que no se resumen con la media muestral, sino con el % que suma la respuesta de los “Satisfechos”
y “Muy satisfechos”. Con todo, podemos considerar que tenemos una escala cuantitativa.
Teniendo en cuenta la tipología de variables, se podría aplicar un análisis clúster -jerárquico o no jerárquico
k-medias- para identificar grupos de estudiantes que se diferencien según la satisfacción percibida.
Utilizaríamos las variables que están en el bloque “Grado de satisfacción de los estudiantes con la docencia
recibida” donde hay 6 preguntas de satisfacción. Hay que tener en cuenta que hay 4 preguntas que la
pueden valorar todos los estudiantes y dos que sólo lo hacen los que han cursado la asignatura de prácticas
y/o han realizado el trabajo final de grado. Podríamos hacer una segmentación de los estudiantes en
general, sin tener en cuenta estas dos últimas preguntas, y ver los segmentos resultantes. Después
podríamos escoger únicamente a los estudiantes que valoran la asignatura en prácticas y realizar la
segmentación incluyendo esta cuestión a las 4 variables iniciales. Repetiríamos la misma operación con la
variable que hace referencia a la satisfacción con la asignatura de trabajo final.
Otra técnica que podríamos aplicar es un análisis de regresión lineal múltiple. Las variables independientes
serían las mencionadas en el párrafo anterior y la dependiente podría ser tanto la satisfacción global o la
recomendación que hacen de la universidad a amigos y familiares. Nuevamente, deberíamos prestar
especial atención a las variables que son respondidas únicamente por un colectivo de estudiantes.
No tendría sentido implicar todas las variables independientes en alguna técnica de agrupación como el
análisis de componentes principales, porque algunas son valoradas para unos determinados estudiantes,
como la satisfacción con los mecanismos de información/proceso de matriculación para los estudiantes de
nueva incorporación o con la opción de volver a escoger la misma titulación/universidad para los estudiantes
ya graduados.

2. (1 punto) Un portal de viajes que opera a través de Internet está intentando determinar en qué medida las
diferentes promociones de productos que diseñan, inciden en una mayor tasa de contratación, es decir, en
qué medida consiguen que se contraten más viajes a través de su canal web.
Con este objetivo están pensando en realizar un diseño de experimento y analizar el volumen de las
contrataciones para determinar qué escenario es el idóneo.
Tienen pensado controlar las siguientes variables:
- Campañas de comunicación (F1): pop up al visitar la página (C1), banner en páginas
relacionadas (C2), o envío de correos electrónicos a la base de datos que disponen (C3).

78585_20222_SolPEC5 1/13
PEC5. Repaso de los cinco módulos de la asignatura.
- Tipo de promoción (F2): ofertas de 2x1 (P1), descuentos del 70% en servicios
complementarios (P2) y acumulación de puntos en su tarjeta de fidelización (P3).
- Paquete vacacional (F3): Cruceros (V1), Territorio Europeo (V2), Otros continentes (V3)
- Nº de personas que viajan (F4): variable discreta de 1 a 20.
- Predicción del tiempo del destino (F5): Estival (T1), Lluvioso (T2), Frío/Nieve (T3).
Con esta información, ayudad al portal de viajes definiendo el diseño de experimentos más apropiado para
su caso con la información disponible para cubrir el objetivo. Indicad qué variables incluiríais, el nombre del
diseño y qué análisis estadístico se debería de aplicar. Argumentando vuestra respuesta (14 líneas
como máximo).
En primer lugar, tenemos que identificar si las variables descritas son controlables o no. Empezando por
las campañas de comunicación, podemos afirmar que es controlable por el investigador/ portal de viajes ya
que pueden decidir con qué campaña impactar al usuario. Pasa lo mismo con el tipo de promoción, el portal
de viajes también puede incidir en el tipo de promoción que comunica en cada en cada uno de las campañas
de comunicación. El paquete vacacional, si lo entendemos como la elección del consumidor, obviamente,
no sería controlable por la empresa o investigador, pero si lo entendemos como el producto al cual se le
aplica la promoción y se comunica en las diferentes campañas, sí que se puede considerar controlable. El
nº de personas que viajan sí que la debemos considerar no controlable, ya que el investigador no sabe
para cuantos viajeros sería la reserva del cliente que entra en el portal. Por último, la predicción del tiempo
del destino no es controlable, por no poderse saber de antemano.
Con todo, tenemos 3 variables controlables: Campañas de comunicación (F1), Tipo de promoción (F2) y
Paquete vacacional (F3) por lo que podríamos aplicar un análisis de cuadros latinos, analizando los
resultados con una ANOVA de 3 factores. En el caso de considerar que el Paquete vacacional (F3) se
registra desde el punto de vista de la elección del consumidor, sólo podríamos considerar 2 variables
controlables y aplicar un diseño de experimento de bloques aleatorios, aplicando, para su análisis, una
ANOVA de 2 factores.

3. (1 punto) Una compañía de seguros se está planteando una nueva campaña publicitaria para captar nuevos
clientes. La quieren diseñar en base a unos mensajes que el consumidor considere más importante a la
hora de escoger una compañía de seguros. Con este objetivo, han lanzado un cuestionario online a una
muestra de clientes que tienen registrados en su base de datos. En este cuestionario se les pedía que
respondieran a una serie de preguntas muy sencillas que consistían en que indicaran si consideran muy
importante, algo importante o nada importante una serie de aspectos que se detallan a continuación:

COD Aspecto a preguntar Nivel de importancia


C1 Precio del seguro Mucho (C1_1) Algo (C1_2) Nada(C1_3)
C2 Servicio atención al cliente Mucho (C2_1) Algo (C2_2) Nada(C2_3)
C3 Garantía del servicio Mucho (C3_1) Algo (C3_2) Nada(C3_3)
C4 Coberturas Mucho (C4_1) Algo (C4_2) Nada(C4_3)

Con los datos recopilados, la empresa realiza el siguiente análisis:

Call:
"res<-MCA(PREG3_PEC5.MCA, ncp=5, graph = FALSE)"

> res$eig
eigenvalue percentage of variance cumulative percentage of variance
dim 1 0.3345025 16.725125 16.72513
dim 2 0.2963900 14.819502 31.54463
dim 3 0.2739309 13.696543 45.24117
dim 4 0.2656222 13.281108 58.52228
dim 5 0.2414245 12.071225 70.59350
dim 6 0.2273363 11.366816 81.96032
dim 7 0.1953622 9.768110 91.72843
dim 8 0.1654314 8.271571 100.00000

> res$var
$coord
Dim 1 Dim 2 Dim 3 Dim 4 Dim 5

78585_20222_SolPEC5 2/13
PEC5. Repaso de los cinco módulos de la asignatura.
C1_1 -0.711320831 0.17300664 0.12176938 0.09807205 0.05930570
C1_2 0.687683080 -0.43533132 -0.78380183 0.02101635 0.11125888
C1_3 1.245774509 0.51462933 1.81827952 -0.52503851 -0.61807637
C2_1 0.454026369 0.82607643 -0.01735722 0.24861187 -0.02833521
C2_2 -0.556801263 -0.01474126 0.03523523 -0.94637367 -0.50814841
C2_3 0.001845961 -0.97681847 -0.01376592 0.63083263 0.53291161
C3_1 -0.097602800 1.12256866 -1.13290521 1.22434927 -1.17469951
C3_2 0.294023497 -0.18679415 0.03095753 -0.36060137 0.15934883
C3_3 -1.635372284 -0.06981086 1.00147006 0.85082474 0.28648819
C4_1 0.581150383 -0.25099158 0.69533771 0.72444589 -0.25584338
C4_2 -0.292699236 -0.18948543 -0.30186872 -0.28659246 -0.27752485
C4_3 0.024254847 1.53893190 -0.20808311 -0.35370082 1.98252725

$contrib
Dim 1 Dim 2 Dim 3 Dim 4 Dim 5
C1_1 20.31241174429 1.356100016 0.726883875 0.48624597 0.19563264
C1_2 12.31995430632 5.571960162 19.543547510 0.01449046 0.44680686
C1_3 13.25596839098 2.553038768 34.483576601 2.96517258 4.52100400
C2_1 5.81043533961 21.708146393 0.010369681 2.19394290 0.03135578
C2_2 7.14984731699 0.005655897 0.034963026 26.01098046 8.25078988
C2_3 0.00008004062 25.294655263 0.005435436 11.77141460 9.24258964
C3_1 0.09357395181 13.969858539 15.394869074 18.54283607 18.78027849
C3_2 4.79965491769 2.186292490 0.064973593 9.09150440 1.95326762
C3_3 25.12803513972 0.051678163 11.506934416 8.56526027 1.06845628
C4_1 7.35613713764 1.548555722 12.859460658 14.39526798 1.97532779
C4_2 3.76862554198 1.782490439 4.894794391 4.54992685 4.69420010
C4_3 0.00527617236 23.971568148 0.474191739 1.41295746 48.84029092

Según estos resultados, contestad las siguientes preguntas argumentando vuestra respuesta:
a) ¿Qué técnica se ha aplicado? ¿Es correcta para el caso que nos ocupa? En caso negativo, indicad
que técnica sería la más apropiada. Justificad vuestra respuesta: 7 líneas como máximo.
Se ha realizado un análisis de correspondencias múltiple (ACM). Es posible aplicar esta técnica ya que
se dispone de 4 variables cualitativas. Sin embargo, atendiendo a las preguntas realizadas, se plantea
obtener la importancia de cada uno de los diferentes aspectos, con el objetivo de explicar las
preferencias del usuario. Por tanto, no es adecuado aplicar el ACM. En este caso deberíamos realizar
un análisis conjunto, que se aplica mediante un análisis de regresión lineal múltiple. Nos permitiría
explicar la preferencia de los clientes (variable dependiente) en función de los diferentes niveles de
importancia de cada aspecto.

b) ¿Podemos aplicar un análisis de conglomerados k-medias para segmentar a los clientes y así
ofrecerles una estrategia de e-mail marketing diferenciada? Justificad vuestra respuesta: 7
líneas como máximo.

78585_20222_SolPEC5 3/13
PEC5. Repaso de los cinco módulos de la asignatura.
No se podría aplicar un análisis de conglomerados, ni k-medias ni jerárquico, ya que las variables son
cualitativas. Únicamente tenemos la variable dependiente, preferencia, que sería cuantitativa; pero esta
variable no se podría incluir en el análisis porque justamente es la dependiente. Tal y como se ha
indicado en el apartado anterior, las preguntas se han planteado de esta manera al cliente para poder
realizar un análisis conjunto.
Para poder saber si deberían realizar una estrategia diferenciada se podría realizar otro tipo de
preguntas que se puedan recoger con una escala cuantitativa.

4. (1 punto) Una distribuidora de muebles de hogar de lujo se plantea ampliar su mercado creando una nueva
línea “low cost”. Para el planteamiento de negocio quieren incluir cuál es la situación actual en cuanto al
posicionamiento e imagen de los operadores más fuertes en el mercado nacional. Encargaron un estudio
a un instituto de investigación, que realizó un cuestionario online entre los consumidores de este mercado
preguntando por los atributos asociados a una serie de marcas que se les mostraba. A continuación se
detallan las marcas y atributos:

MARCA ATRIBUTO
Casika Calidad (AT1)
Sklum Diseños atractivos (AT2)
Kave Home Económico (AT2)
IKEA Diversidad de estilos (AT4)
Kenay Home Servicio de entrega (AT5)
Respetuoso con el medio ambiente (AT6)

Tras recopilar 324 encuestas válidas y analizar la información, el instituto de investigación presenta el
siguiente mapa de posicionamiento:

Según estos resultados, contestad las siguientes preguntas argumentando vuestra respuesta:
a) ¿Qué marca sería la que tiene un mejor posicionamiento? Justificad vuestra respuesta: 7 líneas
como máximo.
La marca que presenta mejor posicionamiento es IKEA, ya que está asociada al atributo Económico
(AT3) mediante la primera dimensión y a Diversidad de estilos (AT4) en la dimensión 2. También
podemos afirmar que se encuentra en una posición totalmente opuesta al Servicio de entrega (AT5),
por lo que estaría posicionado en el concepto opuesto.
Del resto de marcas, quizás Sklum es la que también tiene un posicionamiento más diferenciado al
resto ya que se encuentra en el extremo de la dimensión 2 parte positiva, donde también están
posicionados los atributos Económico (AT3) y Servicio de entrega (AT5). Hay que indicar que Casika
también aspira a este posicionamiento, aunque Sklum tiene una asociación más fuerte.

b) ¿Consideráis que hay posibilidades de incluir esta nueva línea de muebles de “low cost” de la
distribuidora de muebles estudiada y conseguir un posicionamiento diferenciador? Justificad
vuestra respuesta: 7 líneas como máximo.

78585_20222_SolPEC5 4/13
PEC5. Repaso de los cinco módulos de la asignatura.
En el mapa de posicionamiento se aprecia cómo los atributos Calidad (AT1) y Diseños atractivos (AT2)
no están vinculados a ninguna de las marcas analizadas, ya que están muy próximas al origen. Justo
estos atributos son los que fácilmente se podrían vincular a la nueva marca “low cost” que viene de una
distribuidora originaria en muebles de hogar de lujo. Por tanto, la respuesta sería que sí, con el
posicionamiento actual de las marcas analizadas, la nueva marca podría conseguir un posicionamiento
diferenciado en atributos ya asociados a la marca original de lujo.

EJERCICIOS – TOTAL 6 PUNTOS

5. Una cadena de ropa y complementos femeninos, con una red de 56 tiendas por todo el territorio nacional,
está inmersa en un desarrollo de un nuevo modelo comercial. Este nuevo modelo comercial consiste en
definir una estrategia de ventas diferenciada por tienda. Como a nivel de gestión sería imposible sostener
un modelo para cada una de las 56 tiendas han considerado oportuno agrupar las tiendas que más se
asemejen entre ellas y así definir una estrategia para cada grupo de tiendas. Con este objetivo estratégico,
lo que hacen en primer lugar es recoger la información que consideran relevante para cada una de las
tiendas para realizar la segmentación. A continuación se detallan estas variables:
V1: m2
V2: Volumen de ventas medias mensuales (en miles)
V3: % de las ventas en productos rebajados
V4: % de las ventas en complementos
V5: años de antigüedad

Una vez recopilada la información en una base de datos, se han estandarizado las variables para evitar
sesgo en los resultados por las diferentes magnitudes entre las variables. A continuación, han realizado el
siguiente análisis para segmentar las tiendas:

> summary(as.factor(cutree(HClust.1, k = 3))) # Cluster Sizes


1 2 3
20 17 19

> by(model.matrix(~-1 + Z.V1 + Z.V2 + Z.V3 + Z.V4 + Z.V5, EX5PAC5),


as.factor(cutree(HClust.1, k = 3)), colMeans)
+ # Cluster Centroids
INDICES: 1
Z.V1 Z.V2 Z.V3 Z.V4 Z.V5
-0.7706677 -0.6899671 -1.1963609 0.5629339 -0.5207740
------------------------------------------------------------------------------
-----------
INDICES: 2
Z.V1 Z.V2 Z.V3 Z.V4 Z.V5
-0.5173317 -0.5442374 0.6081849 -1.3001643 0.2967646
------------------------------------------------------------------------------
-----------
INDICES: 3
Z.V1 Z.V2 Z.V3 Z.V4 Z.V5
1.2741049 1.2132304 0.7151618 0.5707429 0.2826569

> biplot(princomp(model.matrix(~-1 + Z.V1 + Z.V2 + Z.V3 + Z.V4 + Z.V5, EX5PAC5)),


xlabs =
+ as.character(cutree(HClust.1, k = 3)))

78585_20222_SolPEC5 5/13
PEC5. Repaso de los cinco módulos de la asignatura.

A partir de la información anterior, contestad a las siguientes preguntas argumentando vuestra respuesta:
a) (0,5 puntos) ¿La técnica de segmentación aplicada es la más adecuada para el caso que nos
ocupa?
Se ha aplicado un análisis de conglomerados jerárquico y en este caso sí es correcto. Es apropiado
porque disponemos de variables interdependientes entre ellas, es decir, no hay ninguna variable
dependiente a explicar, y todas las variables son cuantitativas.
También es apropiado por el objetivo que cubre, ya que lo que busca la cadena es segmentar sus
tiendas en grupos más pequeños para poder aplicar una estrategia diferenciada.
b) (1 punto) Interpretad los resultados de manera detallada, indicando cuántos segmentos hay y sus
características diferenciadoras.
El resumen del dendograma resultante del análisis de conglomerados jerárquico nos ofrece la
información de 3 grupos. Si nos fijamos en el gráfico se puede ver claramente cómo las tiendas
principalmente se agrupan en estos 3 grupos; bajar a más segmentos implicaría reducir mucho el
tamaño de algunos segmentos. Para analizar los aspectos que más diferencian a los grupos, podemos
verlas a través del siguiente gráfico:

1.5

0.5

0
V1 V2 V3 V4 V5
-0.5

-1

-1.5

Cl.1 Cl.2 Cl.3

78585_20222_SolPEC5 6/13
PEC5. Repaso de los cinco módulos de la asignatura.
En primer lugar, el que más destaca es el clúster 3, compuesto por 19 tiendas (33,9%), por ser el
segmento con las puntuaciones más altas en la mayoría de las variables analizadas, especialmente en
los metros cuadrados (V1) y el volumen de ventas medias (V2). En el resto de variables también tienen
unos valores muy altos, aunque comparten liderazgo con otro segmento.
El segundo segmento, con 17 tiendas (30,4%), agrupa tiendas donde las variables de metros cuadrados
y ventas tienen unos valores más bien bajos –aunque no los más bajos-, en las variables de % de
ventas de productos rebajados (V3) y años de antigüedad (V5) tienen puntuaciones altas, compartiendo
esta característica con el segmento 3 ya analizado. Sin embargo, el % de ventas en complementos
(V4) obtiene un valor muy bajo.
Por último, el primer segmento, con 20 tiendas (35,7%), tiene las puntuaciones más bajas en todos los
aspectos, a excepción del % de las ventas en complementos que comparte liderazgo con el segmento
nº 2.

En un segundo paso, han querido saber qué elementos son los que más diferencian un grupo de otro para
poder definir mejor la estrategia comercial para cada segmento. Para ello, han realizado el siguiente
análisis:
> AnovaModel.1 <- aov(V1 ~ cluster_, data=EX5PAC5)

> summary(AnovaModel.1)
Df Sum Sq Mean Sq F value Pr(>F)
cluster_ 2 16853914 8426957 162.1 <2e-16 ***
Residuals 53 2755333 51987
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

> with(EX5PAC5, numSummary(V1, groups=cluster_, statistics=c("mean", "sd")))


mean sd data:n
1 1555.850 307.1050 20
2 1707.118 218.6441 17
3 2776.789 105.0114 19

Multiple Comparisons of Means: Tukey Contrasts

Fit: aov(formula = V1 ~ cluster_, data = EX5PAC5)

Linear Hypotheses:
Estimate Std. Error t value Pr(>|t|)
2 - 1 == 0 151.27 75.22 2.011 0.119
3 - 1 == 0 1220.94 73.04 16.715 <0.0001 ***
3 - 2 == 0 1069.67 76.12 14.052 <0.0001 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
(Adjusted p values reported -- single-step method)

> AnovaModel.2 <- aov(V2 ~ cluster_, data=EX5PAC5)

> summary(AnovaModel.2)
Df Sum Sq Mean Sq F value Pr(>F)
cluster_ 2 14020549 7010275 90.31 <2e-16 ***
Residuals 53 4113865 77620
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

> with(EX5PAC5, numSummary(V2, groups=cluster_, statistics=c("mean", "sd")))


mean sd data:n
1 115.8500 16.79998 20

78585_20222_SolPEC5 7/13
PEC5. Repaso de los cinco módulos de la asignatura.
2 199.5294 127.55642 17
3 1208.6842 462.37143 19

Multiple Comparisons of Means: Tukey Contrasts

Fit: aov(formula = V2 ~ cluster_, data = EX5PAC5)

Linear Hypotheses:
Estimate Std. Error t value Pr(>|t|)
2 - 1 == 0 83.68 91.91 0.91 0.636
3 - 1 == 0 1092.83 89.25 12.24 <0.0001 ***
3 - 2 == 0 1009.15 93.01 10.85 <0.0001 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
(Adjusted p values reported -- single-step method)

> AnovaModel.3 <- aov(V3 ~ cluster_, data=EX5PAC5)

> summary(AnovaModel.3)
Df Sum Sq Mean Sq F value Pr(>F)
cluster_ 2 0.28270 0.14135 114.1 <2e-16 ***
Residuals 53 0.06568 0.00124
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

> with(EX5PAC5, numSummary(V3, groups=cluster_, statistics=c("mean", "sd")))


mean sd data:n
1 0.1405000 0.02892367 20
2 0.2841176 0.03675235 17
3 0.2926316 0.03955897 19

Multiple Comparisons of Means: Tukey Contrasts

Fit: aov(formula = V3 ~ cluster_, data = EX5PAC5)

Linear Hypotheses:
Estimate Std. Error t value Pr(>|t|)
2 - 1 == 0 0.143618 0.011612 12.368 <0.0001 ***
3 - 1 == 0 0.152132 0.011277 13.490 <0.0001 ***
3 - 2 == 0 0.008514 0.011752 0.724 0.75
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
(Adjusted p values reported -- single-step method)

> AnovaModel.4 <- aov(V4 ~ cluster_, data=EX5PAC5)

> summary(AnovaModel.4)
Df Sum Sq Mean Sq F value Pr(>F)
cluster_ 2 0.13543 0.06772 79.61 <2e-16 ***
Residuals 53 0.04508 0.00085
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

> with(EX5PAC5, numSummary(V4, groups=cluster_, statistics=c("mean", "sd")))


mean sd data:n
1 0.14850000 0.03048295 20
2 0.04176471 0.02455486 17
3 0.14894737 0.03142800 19

Multiple Comparisons of Means: Tukey Contrasts

78585_20222_SolPEC5 8/13
PEC5. Repaso de los cinco módulos de la asignatura.
Fit: aov(formula = V4 ~ cluster_, data = EX5PAC5)

Linear Hypotheses:
Estimate Std. Error t value Pr(>|t|)
2 - 1 == 0 -0.1067353 0.0096210 -11.094 <0.000001 ***
3 - 1 == 0 0.0004474 0.0093433 0.048 0.999
3 - 2 == 0 0.1071827 0.0097366 11.008 <0.000001 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
(Adjusted p values reported -- single-step method)

> AnovaModel.5 <- aov(V5 ~ cluster_, data=EX5PAC5)

> summary(AnovaModel.5)
Df Sum Sq Mean Sq F value Pr(>F)
cluster_ 2 146.7 73.36 4.803 0.0121 *
Residuals 53 809.5 15.27
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

> with(EX5PAC5, numSummary(V5, groups=cluster_, statistics=c("mean", "sd")))


mean sd data:n
1 4.650000 3.216323 20
2 8.058824 4.709971 17
3 8.000000 3.785939 19

Multiple Comparisons of Means: Tukey Contrasts

Fit: aov(formula = V5 ~ cluster_, data = EX5PAC5)

Linear Hypotheses:
Estimate Std. Error t value Pr(>|t|)
2 - 1 == 0 3.40882 1.28923 2.644 0.0285 *
3 - 1 == 0 3.35000 1.25201 2.676 0.0263 *
3 - 2 == 0 -0.05882 1.30472 -0.045 0.9989
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
(Adjusted p values reported -- single-step method)

A partir de la información anterior, contestad a las siguientes preguntas argumentando vuestra respuesta:
c) (0,75 puntos) Indicad qué técnica se ha aplicado y si da respuesta al objetivo planteado. ¿Tiene
sentido que se aplique con las variables originales en lugar de las variables tipificadas?
Se ha aplicado un análisis ANOVA para cada variable (5 en total) para saber si existen entre los 3
grupos obtenidos en el análisis de segmentación previo. Esta técnica es adecuada, ya que lo que se
pretende es saber en qué variables los grupos se diferencias más. Esto lo podremos saber a través del
p-valor, que nos indicará si las diferencias son significativas y a través de la F-value que contra mayor
sea, más diferencia hay entre los grupos.
Sí, tiene sentido aplicarlo con las variables originales, ya que únicamente se han normalizado los datos
para poder aplicar el análisis clúster evitando el sesgo de la propia escala de las variables, que éste es
muy diferente entre ellas. Una vez obtenidos los segmentos, tiene sentido que miremos las diferencias
con sus datos reales, ya que esto nos hará entender mejor los resultados y sus diferencias.
d) (1,25 puntos) Interpretad los resultados conjuntamente de las dos técnicas aplicadas en el ejercicio
e indicad qué estrategia comercial debería de desarrollar para cada grupo de tiendas.
Primero vamos a interpretar los resultados de las pruebas ANOVA y comprobar qué conclusiones nos
arrojan. Vemos como todas las variables muestran diferencias significativas entre los grupos. Esto lo
podemos confirmar porque todos los p-valores (marcados en amarillo) son inferiores al 0,05 que nos

78585_20222_SolPEC5 9/13
PEC5. Repaso de los cinco módulos de la asignatura.
hace rechazar la hipótesis de igualdad de medias. Para ver que variables son las que hacen maximizar
las diferencias entre los segmentos, ya que en todas se encuentran diferencias, tenemos que mirar el
valor F-value de cada variable para analizar este punto:

F-value P-valor
V1 162,1 <2e-16
V2 90,31 <2e-16
V3 114,1 <2e-16
V4 79,61 <2e-16
V5 4,803 0,0121

Las variables V1 (m2) y V3 (% de las ventas en productos rebajados) son las que tienen una F-value
más alta y por lo tanto es donde estas diferencias son más marcadas.
Si vamos un paso más allá y analizamos las diferencias entre los segmentos dentro de cada variables,
observamos cómo en la de m2 (V1) es el segmento 3 el que se diferencia del resto por tener un valor
más alto. En la V2 –volumen de ventas- es nuevamente el segmento 3 el que tiene diferencias
significativas con el segmento 1 y 2. En la variable sobre las ventas de productos rebajados (V3) es el
segmento 1 el que se desmarca de los otros dos grupos, pero en este caso por tener un valor más bajo
que el resto de los segmentos. En las ventas de los complementos (V4) es el segmento 2, que tiene
unos valores más bajos que el segmento 1 y 3. Por último, nuevamente es el segmento 1 que se
desmarca en negativo, ya que tiene una media inferior al resto de grupos en los años de antigüedad.
Ahora con esta información, podemos marcar en el gráfico con un círculo donde se encuentras las
diferencias:

1.5

0.5

0
V1 V2 V3 V4 V5
-0.5

-1

-1.5

Cl.1 Cl.2 Cl.3

Vemos claramente que el segmento 1 se caracteriza principalmente por tener pocas ventas en rebajas
y tener menos años de antigüedad, es decir, agrupa las tiendas más nuevas. En estos establecimientos
se debería potenciar los complementos, ya que tiene una proporción de ventas similares a las tiendas
con más metros y más ventas en general. El segundo segmento se caracteriza por tener bajas ventas
de complementos, pero tiene unas ventas altas en productos rebajados y agrupa tiendas más antiguas,
por lo que habría que potenciar los productos rebajados y quizás realizar más promociones en estas
tiendas vs. las del segmento 1. Por último, tenemos el 3er segmento que se caracteriza por ser las más
grandes, en consecuencia las que más ventas atrae en general y también tienen un % de ventas de
productos rebajados y complementos altas, esto puede ser debido al tamaño de las mismas que les
permite disponer de más espacio para más variedad.

6. Un fabricante de cosmética facial está inmerso en la definición de su nueva campaña de comunicación para
su producto estrella, la crema anti-age, que se extenderá a los diferentes canales de comunicación. Para
decantarse por el mensaje más acertado quieren basarse en el estudio que realizaron recientemente de
satisfacción de sus clientes. En este estudio pedían la satisfacción que tenían en general con el producto y
en concreto con una serie de aspectos que debían de valorar en una escala tipo Likert de 7 puntos (desde
1: muy insatisfecho hasta 7: muy satisfecho). A continuación se detallan estas preguntas:

78585_20222_SolPEC5 10/13
PEC5. Repaso de los cinco módulos de la asignatura.

Código Aspectos a valorar según satisfacción


V1 La eficacia de la crema
V2 Los principios activos que lleva la crema
V3 La textura de la crema
V4 La absorción de la crema
V5 El coste de la crema
GL La satisfacción general con el producto

En esta nueva campaña, como elemento diferenciador, quieren incluir también comunicación para el
público masculino, ya que en los últimos años han realizado varios lanzamientos de productos masculinos
y están incrementando su cuota de mercado en este mercado. Por este motivo, en la base de datos, aparte
de la información de las variables detalladas anteriormente, también hay una columna que indica el género
de la persona (código GE) donde las opciones son Masculino (1) y Femenino (2). Encontraréis toda la
información en el fichero 78585_20222_EJ6PEC5.xlxs.
Con toda esta información, contestad las siguientes preguntas, argumentando vuestra respuesta:

a) (0,75 puntos) Ejecutad un análisis que nos permita saber qué aspectos potencian la satisfacción
global con el producto. Tened en cuenta que la empresa desea conocer este detalle diferenciando
entre el género masculino y femenino.
El análisis que se debe aplicar es un análisis de regresión lineal múltiple, ya que queremos explicar
una variable cuantitativa dependiente, la satisfacción general, (GL) mediante una serie de variables
cuantitativas que son independientes (de V1 a V5). Tenemos que tener en cuenta que queremos ver
esta información diferenciando según si el género es masculino o femenino.
Para ejecutar este análisis diferenciando por el género, primero hemos de filtrar la base. Vamos a
empezar por el código 1 que es el género masculino:

Hacemos la misma operación para obtener también la otra parte en otra base de datos filtrada:

Una vez tenemos las dos bases de datos, realizamos el análisis de regresión lineal múltiple, con cada
una de las bases filtradas, seleccionando la variable explicada la satisfacción global (GL) y como
variables explicativas de la V1 a la V5:

78585_20222_SolPEC5 11/13
PEC5. Repaso de los cinco módulos de la asignatura.

A continuación se muestran los resultados:

MASCULINO:
Call:
lm(formula = GL ~ V1 + V2 + V3 + V4 + V5, data = MASCULINO)

Residuals:
Min 1Q Median 3Q Max
-0.93405 -0.34462 0.02007 0.27037 1.08685

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 2.456372 0.778960 3.153 0.002343 **
V1 0.120317 0.026053 4.618 0.0000162 ***
V2 -0.008838 0.090580 -0.098 0.922543
V3 0.170301 0.044970 3.787 0.000311 ***
V4 0.158055 0.057471 2.750 0.007504 **
V5 0.080028 0.032916 2.431 0.017501 *
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 0.4384 on 73 degrees of freedom


Multiple R-squared: 0.5232, Adjusted R-squared: 0.4905
F-statistic: 16.02 on 5 and 73 DF, p-value: 1.246e-10

FEMENINO
Call:
lm(formula = GL ~ V1 + V2 + V3 + V4 + V5, data = FEMENINO)

Residuals:
Min 1Q Median 3Q Max
-1.80966 -0.39415 0.00377 0.36519 1.18960

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.15848 0.12342 1.284 0.201
V1 0.24066 0.01905 12.633 < 2e-16 ***
V2 0.19838 0.02989 6.636 3.88e-10 ***
V3 0.15312 0.02677 5.719 4.54e-08 ***
V4 0.14636 0.03254 4.498 1.25e-05 ***
V5 0.19424 0.02477 7.842 4.19e-13 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 0.4927 on 175 degrees of freedom

78585_20222_SolPEC5 12/13
PEC5. Repaso de los cinco módulos de la asignatura.
Multiple R-squared: 0.8408, Adjusted R-squared: 0.8363
F-statistic: 184.9 on 5 and 175 DF, p-value: < 2.2e-16

b) (1 punto) Interpretad los resultados de manera detallada, indicando claramente, a qué valor de la
salida de RCommander hacéis referencia y haciendo una comparativa entre los resultados
obtenidos del género masculino y femenino.
Para hacer un buen análisis comparativo, lo ideal es poner los principales valores a analizar en una
tabla. A continuación, se muestran estos valores tales como el coeficiente estimado, el efecto relativo,
el t-valor y p-valor:

GE Masculino GE Femenino
β Efecto β Efecto
t-valor (p-valor) t-valor (p-valor)
VAR estimado relativo estimado relativo
V1 0,120 23,1% 4,618 (0,00002) 0,241 25,9% 12,633 (< 2e-16)
V2 -0,009 -1,7% -0,098 (0,923) 0,198 21,2% 6,636 (3.88e-10)
V3 0,170 32,8% 3,787 (0,0003) 0,153 16,4% 5,719 (4.54e-08)
V4 0,158 30,4% 2,750 (0,0075) 0,146 15,7% 4,498 (1,25e-05)
V5 0,080 15,4% 2,431 (0,0175) 0,194 20,8% 7,842 (4,19e-13)

Lo primero que se observa es que, para el género masculino, no todos los atributos contribuyen en la
satisfacción general, los principios activos de la crema (V2) parece no ser lo suficientemente relevante
para ellos. Sin embargo, para el género femenino todas las variables son importantes, influyendo
significativamente.
Otra gran diferencia que nos encontramos al fijarnos en el coeficiente estimado y el efecto relativo es
que las variables no tienen el mismo orden de importancia para un género u otro. En la siguiente tabla
mostramos el orden de los atributos para cada grupo:

GE GE
VAR Masculino Femenino
V1 3º 1º
V2 ---- 2º
V3 1º 4º
V4 2º 5º
V5 4º 3º

El género masculino considera la textura (V3) y la absorción de la crema (V4) lo más importante (1º y
2º respectivamente), sin embargo, el género femenino los considera en 4º y 5º posición. Por otro lado,
el género femenino consideran más importante la eficacia de la crema (V1) y sus principios activos
(V2), cuando el género masculino considera la eficacia (V1) el 3er atributo más importante y los
principios activos (V2) ni si quiera contribuye en la satisfacción global.

c) (0,75 puntos) Según estos resultados, ¿podrían realizar una única campaña para los dos géneros
y así ahorrarse los costes de creatividad y producción de la agencia de comunicación? En caso
contrario, ¿qué aspectos deberían potenciar en cada campaña?
Como acabamos de exponer en el apartado anterior, la importancia que tiene cada variable es muy
diferente entre los dos grupos analizados, por lo que no se recomendaría una única campaña. Lo ideal
sería diseñar dos campañas potenciando aquellos aspectos más importantes para cada grupo. En el
caso del género femenino la campaña de comunicación debería focalizarse en resaltar la eficacia de
la crema (V1  1º) y los principios activos que lleva el producto (V2  2º). Por su parte, para el género
masculino se debería de focalizar la comunicación en la textura de la crema (V3  1º) y en su
absorción (V4  2º).

Nota1: para filtrar la base de datos en el apartado a, podéis seguir la ruta Datos > Conjunto de Datos Activo
> Filtrar el conjunto de datos activos. En el campo “Expresión de la selección” escribiremos GE==“1” y
llamamos a la nueva base MASCULINO. Debéis repetir el proceso desde la base completa para filtrar la
submuestra del género femenino (GE==“2”, y la llamaremos FEMENINO).

78585_20222_SolPEC5 13/13

También podría gustarte