Está en la página 1de 8

Examen de Investigación Publicitaria

Profesores: Víctor Hernández-Santaolalla y Noelia García Estévez


Grado en Publicidad y Relaciones Públicas
Universidad de Sevilla

CONVOCATORIA DE JUNIO DE 2019


(EJERCICIOS ESTADÍSTICOS)

1. Tras realizar una encuesta sobre los atributos que más valoran los consumidores de las cervezas
de importación, se obtiene la siguiente tabla de contingencia que cruza dichos atributos con el lugar
habitual de consumo:
Cervecerías
Casa Pubs Restaurantes Otros
internacionales
Envase/etiqueta 71 119 92 64 62
Sabor 122 107 137 92 66
Textura 68 62 78 101 58
Grado de alcohol 72 78 89 78 75
Exclusividad 66 64 68 75 77
Otros 71 119 92 64 62

¿Qué estadístico utilizaría para saber si existe algún tipo de relación entre las variables?
a) El coeficiente de correlación de Pearson, ya que son variables cuantitativas, que requieren de un
estadístico paramétrico.
b) El estadístico chi-cuadrado, ya que son variables nominales, que requieren de un estadístico no
paramétrico.
c) Ambos estadísticos, pues es la triangulación metodológica la que aporta mayor información ala
investigación.

2. El alcalde de Villahermosa de la Calceta quiere construir un tobogán que tenga una mayor
repercusión que el de Estepona. No obstante, antes decide hacer un pretest con el objetivo de
conocer cuál es el diseño, material y altura preferidos por su público objetivo que, si bien cuenta
con diferentes características, por cuestiones de salud física se sabe que no será inferior a los 12
años ni superará los 38 años. Para ello decide realizar un estudio en una población de 252.321
habitantes que se distribuye según los datos reflejados en la tabla. Atendiendo a esta información,
calcule el tamaño de la muestra para un nivel de confianza del 95% y un error de +/- 3.

Edad Votó por el alcalde No votó por el alcalde


Menos de 12 años 0% 9%
13-25 años 19% 14%
26-38 años 17% 7%
39-51 años 2% 11%
52-64 años 0% 8%
Más de 65 años 1% 12%

1
a) 1016 personas.
b) 1067 personas.
c) 338 personas.

3. Los datos recogidos en la siguiente tabla corresponden a los programas más vistos durante el
lunes 4 de junio de 2019 en prime time. Suponiendo que en ese momento había 16.557.692 de
personas viendo la televisión y que la población española controlable por medio de audímetros es
de 40.000.000, ¿cuál fue la cuota obtenida por la serie La otra mirada?

Canal Programa Audiencia


Antena 3 El Hormiguero 2.583.000
Telecinco Supervivientes 2.423.000
La 1 La otra mirada 1.571.000
La Sexta El Intermedio 1.583.000

a) No se puede calcular porque desconocemos las duplicaciones.


b) 9,49%
c) 3,93%

4. Tras realizar un estudio para conocer la valoración de la población andaluza (8.770.000 personas)
hacia la programación de la televisión pública a 1.501 personas, se obtiene una media de 7,16
(valorado del 1 al 10). ¿Entre qué intervalos se encontraría dicha media en la población para un
nivel de confianza del 95,5%?
a) Entre 5,22 y 9,10
b) Entre 4,58 y 9,74
c) No hacen falta intervalos, pues la muestra ya es representativa.

5. Para conocer el nivel de recuerdo y notoriedad de una nueva marca de refrescos tras una campaña
en radio, se realiza una encuesta en dos poblaciones distintas, ya que en cada una de ellas se había
emitido una cuña diferente. Atendiendo a la posición que ocupa en la short list de los encuestados, en la
población A (673 encuestados) se ha obtenido una puntuación media de 4,6 con una varianza de 10,8
y en la población B (842 encuestados) una puntuación media de 4,6 y una desviación típica de 4,5. ¿En
cuál de las dos poblaciones el grado de dispersión de las puntuaciones es mayor?
a) En la A.
b) En la B.
c) Las dos por igual.

6. Una empresa de snacks dulces quiere conocer cuál es el mejor formato para vender sus nuevas
galletas saludables de distintos sabores para “picar entre horas”. La idea es que las personas se
lleven el pack al lugar de trabajo para tener siempre disponible el producto. Para conocer cuántas
galletas deben incluir en cada paquete, deciden analizar diferentes marcas de la competencia,
concluyendo que un trabajador/a tipo consume, como media, 3,6 galletas a la semana (de lunes a
viernes) con una desviación típica de 23,45. Para que a la empresa le salga rentable, deberían incluir

2
6 galletas por paquete. Teniendo en cuenta toda la información anterior, ¿qué porcentaje de
personas consumirá entre 4 y 6 galletas a la semana?
a) 3,18%
b) 53,59%
c) 8,53%

Ejercicio:
En la siguiente tabla se recoge los resultados de una encuesta en la que se preguntaba, entre otras
cuestiones, qué personaje de Juego de Tronos era el preferido para ocupar el trono de hierro y el nivel
de valoración del final en función de sus expectativas.

Mejor de lo que Más o menos como Peor de lo que


esperaba esperaba esperaba
Daenerys Targaryen 75 90 103
Jon Snow 95 76 86
Tyrion Lannister 72 85 47
Sansa Stark 63 96 172
The Night King 47 58 35

1. Teniendo en cuenta la información expuesta, ¿existe relación significativa entre ambas


variables? ¿Cuál es el nivel de confianza máximo con el que se puede asegurar dicha relación?
Razone su respuesta.

2. En el caso de que existiese relación, ¿cómo de intensa es? Razone su respuesta.

SOLUCIONES
1. Tras realizar una encuesta sobre los atributos que más valoran los consumidores de las cervezas
de importación, se obtiene la siguiente tabla de contingencia que cruza dichos atributos con el lugar
habitual de consumo:
Cervecerías
Casa Pubs Restaurantes Otros
internacionales
Envase/etiqueta 71 119 92 64 62
Sabor 122 107 137 92 66
Textura 68 62 78 101 58
Grado de alcohol 72 78 89 78 75
Exclusividad 66 64 68 75 77
Otros 71 119 92 64 62

¿Qué estadístico utilizaría para saber si existe algún tipo de relación entre las variables?
a) El coeficiente de correlación de Pearson, ya que son variables cuantitativas, que requieren de un
estadístico paramétrico.
b) El estadístico chi-cuadrado, ya que son variables nominales, que requieren de un
estadístico no paramétrico.
c) Ambos estadísticos, pues es la triangulación metodológica la que aporta mayor información ala
investigación.

3
2. El alcalde de Villahermosa de la Calceta quiere construir un tobogán que tenga una mayor
repercusión que el de Estepona. No obstante, antes decide hacer un pretest con el objetivo de
conocer cuál es el diseño, material y altura preferidos por su público objetivo que, si bien cuenta
con diferentes características, por cuestiones de salud física se sabe que no será inferior a los 12
años ni superará los 38 años. Para ello decide realizar un estudio en una población de 252.321
habitantes que se distribuye según los datos reflejados en la tabla. Atendiendo a esta información,
calcule el tamaño de la muestra para un nivel de confianza del 95% y un error de +/- 3.

Edad Votó por el alcalde No votó por el alcalde


Menos de 12 años 0% 9%
13-25 años 19% 14%
26-38 años 17% 7%
39-51 años 2% 11%
52-64 años 0% 8%
Más de 65 años 1% 12%

a) 1016 personas.
b) 1067 personas.
c) 338 personas.

En este caso hay dos soluciones posibles en función de cómo se interpreten los datos.
En cualquier caso, en primer lugar, habría que restar, del total de la población, a los menores de 12
años y a los mayores de 38. En total, la población de estudio sería de 143.823, por lo que es infinita.
A partir de ahí, las dos posibilidades sería, o bien tomar el hecho de votar o no por el alcalde como
un índice de heterogeneidad poblacional, por lo que P=39% y Q=61%, o bien entender que esa
información no es relevante para la opinión relativa al tobogán y, por lo tanto, situarse en la opción
de máxima heterogeneidad: P=50% y Q=50%.
Siguiendo la primera opción, la solución sería:
1,962 × 39 × 61
𝑛= = 1.016
32

Y siguiendo la segunda, sería:

1,962 × 50 × 50
𝑛= = 1.067
32

3. Los datos recogidos en la siguiente tabla corresponden a los programas más vistos durante el
lunes 4 de junio de 2019 en prime time. Suponiendo que en ese momento había 16.557.692 de
personas viendo la televisión y que la población española controlable por medio de audímetros es
de 40.000.000, ¿cuál fue la cuota obtenida por la serie La otra mirada?

Canal Programa Audiencia


Antena 3 El Hormiguero 2.583.000
Telecinco Supervivientes 2.423.000
La 1 La otra mirada 1.571.000
La Sexta El Intermedio 1.583.000

4
a) No se puede calcular porque desconocemos las duplicaciones.
b) 9,49%
c) 3,93%

En este caso preguntaban por la cuota, es decir, el porcentaje de personas que estaba viendo el
programa La otra mirada en relación al total que estaba viendo la televisión. Por lo tanto:

1.571.000
𝐶𝑢𝑜𝑡𝑎𝐿𝑎 𝑜𝑡𝑟𝑎 𝑚𝑖𝑟𝑎𝑑𝑎 = × 100 = 9,49%
16.557.692

4. Tras realizar un estudio para conocer la valoración de la población andaluza (8.770.000 personas)
hacia la programación de la televisión pública a 1.501 personas, se obtiene una media de 7,16
(valorado del 1 al 10). ¿Entre qué intervalos se encontraría dicha media en la población para un
nivel de confianza del 95,5%?
d) Entre 5,22 y 9,10
e) Entre 4,58 y 9,74
f) No hacen falta intervalos, pues la muestra ya es representativa.

Para resolver esta pregunta, lo primero que había que hacer era obtener el error muestral para
poblaciones infinitas, teniendo en cuenta que desconocemos la varianza poblacional, por lo que nos
deberíamos situar en el escenario de máxima heterogeneidad.

50 × 50
𝑆𝑒(𝑌̅) = √ = 1,29
1.501

Una vez obtenido dicho error muestral, el siguiente paso era calcular los intervalos de confianza,
teniendo en cuenta que en este caso el valor z es igual a 2 y que la media es 7,16. De esta forma:

7,16 ± (2 × 1,29) = 7,16 ± 2,58 = 4,58 𝑦 9,74

5. Para conocer el nivel de recuerdo y notoriedad de una nueva marca de refrescos tras una campaña
en radio, se realiza una encuesta en dos poblaciones distintas, ya que en cada una de ellas se había
emitido una cuña diferente. Atendiendo a la posición que ocupa en la short list de los encuestados, en la
población A (673 encuestados) se ha obtenido una puntuación media de 4,6 con una varianza de 10,8
y en la población B (842 encuestados) una puntuación media de 4,6 y una desviación típica de 4,5. ¿En
cuál de las dos poblaciones el grado de dispersión de las puntuaciones es mayor?
a) En la A.
b) En la B.
c) Las dos por igual.

En este caso, ya que en ambas poblaciones se ha obtenido una misma media y las mediciones
parece que han sido equivalentes, solo había que comparar la varianza (o la desviación típica)
obtenida en cada una de ellas. Así, en la primera la varianza fue de 10,7 y en la segunda fue de 20,25
(4,52). Así, el grado de dispersión fue mayor en la población B.

5
6. Una empresa de snacks dulces quiere conocer cuál es el mejor formato para vender sus nuevas
galletas saludables de distintos sabores para “picar entre horas”. La idea es que las personas se
lleven el pack al lugar de trabajo para tener siempre disponible el producto. Para conocer cuántas
galletas deben incluir en cada paquete, deciden analizar diferentes marcas de la competencia,
concluyendo que un trabajador/a tipo consume, como media, 3,6 galletas a la semana (de lunes a
viernes) con una desviación típica de 23,45. Para que a la empresa le salga rentable, deberían incluir
6 galletas por paquete. Teniendo en cuenta toda la información anterior, ¿qué porcentaje de
personas consumirá entre 4 y 6 galletas a la semana?
d) 3,18%
e) 53,59%
f) 8,53%

Para poder conocer el porcentaje de personas que consumirá entre 4 y 6 galletas había que acudir a
la tabla de distribución normal, para lo cual, lo primero, era tipificar ambos valores. Así:

4 − 3,6
𝑧4 = = 0,02 → 0,49202 → 49,20%
23,45

6 − 3,6
𝑧6 = = 0,10 → 0,46017 → 49,02%
23,45

Como lo que piden es el porcentaje de personas que consumirá entre 4 y 6 galletas a la semana, lo
que habría que hacer es restar ambas proporciones. De esta forma:

49,20 − 46,02 = 3,18%

Ejercicio:
En la siguiente tabla se recoge los resultados de una encuesta en la que se preguntaba, entre otras
cuestiones, qué personaje de Juego de Tronos era el preferido para ocupar el trono de hierro y el nivel
de valoración del final en función de sus expectativas.

Mejor de lo que Más o menos como Peor de lo que


esperaba esperaba esperaba
Daenerys Targaryen 75 90 103
Jon Snow 95 76 86
Tyrion Lannister 72 85 47
Sansa Stark 63 96 172
The Night King 47 58 35

1. Teniendo en cuenta la información expuesta, ¿existe relación significativa entre ambas


variables? ¿Cuál es el nivel de confianza máximo con el que se puede asegurar dicha relación?
Razone su respuesta.

6
Para resolver la primera cuestión había que acudir al estadístico chi-cuadrado. Para ello, lo primero
era calcular los totales de las diferentes filas y columnas, ya que es necesario para calcular las
frecuencias esperadas.
Mejor de lo Más o menos Peor de lo que Total
que esperaba como esperaba esperaba
Daenerys Targaryen 75 90 103 268
Jon Snow 95 76 86 257
Tyrion Lannister 72 85 47 204
Sansa Stark 63 96 172 331
The Night King 47 58 35 140
Total 352 405 443 1200

A continuación, como se señalaba, habría que calcular las frecuencias esperadas, multiplicando el
total de cada fila por el total de cada columna y dividiéndolo por el total. De esta forma, la tabla
quedaría de la siguiente forma (recuérdese que los totales se van a mantener):
Mejor de lo Más o menos Peor de lo que Total
que esperaba como esperaba esperaba
Daenerys Targaryen 78,61 90,45 98,94 268
Jon Snow 75,39 86,74 94,88 257
Tyrion Lannister 59,84 68,85 75,31 204
Sansa Stark 97,09 111,71 122,19 331
The Night King 41,07 47,25 51,68 140
Total 352 405 443 1200

Como paso posterior, y siguiendo la fórmula, se resta cada frecuencia observada y su frecuencia
esperada, se eleva dicha diferencia al cuadrado y se divide entre la frecuencia esperada
correspondiente:

Mejor de lo Más o menos Peor de lo que Total


que esperaba como esperaba esperaba
Daenerys Targaryen 0,17 0,00 0,17 0,34
Jon Snow 5,10 1,33 0,83 7,26
Tyrion Lannister 2,47 3,79 10,64 16,90
Sansa Stark 11,97 2,21 20,30 34,48
The Night King 0,86 2,45 5,39 8,69
Total 20,57 9,78 37,33 67,67

Así, como se puede observar en la tabla anterior, la suma total es igual a 67,67, que sería el
estadístico chi-cuadrado. No obstante, la primera pregunta es si existe relación significativa entre las
variables. Para ello hay que acudir a la tabla de distribución chi-cuadrado.

7
En este caso, sabemos que los grados de libertad son 8, pues el total de filas es igual a cinco y el
total de columnas es igual a 3 (5-1 x 3-1 = 8). Sabiendo esto, y que el error máximo permitido es de
0,05, observamos en la tabla que el valor mínimo de chi-cuadrado a obtener para poder hablar de
relación significativa es 15,507. Como el hallado es superior, se rechaza la hipótesis nula y se
establece que existen diferencias significativas.

No obstante, una segunda cuestión preguntaba por cuál era el nivel máximo de confianza con el
que se podría establecer dicha relación. Para ello, vamos reduciendo el error, y observamos que,
para un error de 0,001, nuestro estadístico sigue siendo mayor, por lo que se asegura que existe
relación con un 99,9% de nivel de confianza.

2. En el caso de que existiese relación, ¿cómo de intensa es? Razone su respuesta.


Para responder a la última pregunta había que hallar el coeficiente de contingencia.

67,67
𝐶=√ = 0,23
67,67 + 1200

A la luz de los datos, se señala que la intensidad es media-baja, ya que el coeficiente de contingencia
toma valores entre 0 y 1.

También podría gustarte