Está en la página 1de 10

Caso de estudio “Consumo de cerveza1”

Supongamos que se ha realizado una pequeña encuesta dirigida a jóvenes. El


número total de personas es de 30 que componen un grupo de clases en una
universidad.

En la Tabla 1, se presentan los datos recopilados de la aplicación de la encuesta,


la cual presenta como variables principales el sexo, la edad en años cumplidos,
el consumo promedio mensual de cervezas y el ingreso promedio mensual en
dólares.

El objetivo fundamental de la encuesta radica en conocer el consumo de


cervezas por parte de los jóvenes con la finalidad de brindar una charla sobre
los perjuicios que tiene el consumo excesivo de este producto dentro del
organismo y la sociedad.
Se realizará el análisis estadístico de los datos resultantes de la aplicación de la
encuesta, dicho análisis debe de contemplar los siguientes elementos:
1. Explicar si la encuesta fue aplicada a una muestra o a una población.
2. Clasificación y tipo de las variables.
3. Distribución de frecuencias de la edad en años cumplidos.
4. Tabla cruzada que relacione el sexo y la edad en años cumplidos.
5. Representación gráfica de un histograma de la edad en años cumplidos.
6. Representación gráfica de la variable sexo, por medio de un gráfico
circular o de pastel.
7. Las medidas de tendencia central (media, mediana, moda) obtenidas de
la tabla de distribución de frecuencias.
8. Las medidas de dispersión (rango, varianza, desviación estándar
y coeficiente de variación) obtenidas de la tabla de distribución de
frecuencias.

Además, la Dirección del programa, ha seleccionado una muestra de 10


observaciones, bajo la técnica probabilística de muestreo aleatorio sistemático,
a partir de la siguiente expresión:
𝑵
𝒌=
𝒏
En donde,
𝑘:𝑚𝑢𝑒𝑠𝑡𝑟𝑒𝑜 𝑠𝑖𝑠𝑡𝑒𝑚á𝑡𝑖𝑐𝑜.
𝑁:𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛.
𝑛:𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎.
Al aplicar la ecuación anterior, se obtiene como resultado lo siguiente:
𝑵 𝟑𝟎
𝒌= = =𝟑
𝒏 𝟏𝟎
El valor de 𝑘, es igual a 3, por lo que se seleccionará como parte de la muestra,
cada 3 elementos que conforman la población. Para que todos tengan la misma
probabilidad de ser seleccionados, se determina que el primer elemento de
entrada será la encuesta número 12 (este último número fue tomado por la fecha
del día que se procedió a seleccionar la muestra), por lo que los elementos
seleccionados fueron los siguientes números de encuestas:

12, 15, 18, 21, 24, 27, 30, 3, 6, 9

Dada la muestra de los 10 elementos tomados de la población, le solicitan lo


siguiente:
1. Las medidas de tendencia central de la muestra, correspondiente a la
variable edad en años cumplidos.
2. Las medidas de dispersión de la muestra, de la variable edad.
Tabla 1. Tabla de datos derivada de la aplicación de la encuesta.

No. Encuesta Sexo Edad Consumo de cervezas Ingresos mensual


1 2 47 12 1533
2 1 27 24 292
3* 1 42 15 979
4 1 51 10 3685
5 2 39 18 847
6* 2 44 14 1299
7 1 35 19 537
8 1 33 20 522
9* 2 29 24 310
10 1 49 12 2652
11 2 29 23 329
12* 1 29 23 460
13 2 49 11 3048
14 2 43 15 1243
15* 1 32 20 505
16 1 54 5 4538
17 2 35 18 590
18* 1 53 9 4024
19 2 53 9 4048
20 1 44 14 1449
21* 2 44 13 1477
22 1 45 13 1526
23 1 31 21 485
24* 2 37 18 648
25 1 44 13 1503
26 2 53 6 4118
27* 1 51 10 3991
28 1 25 24 247
29 1 42 15 1202
30* 1 39 16 928
Procedimiento
Se responderá a cada inciso contenido en el caso de estudio.

1. Explicar si la encuesta fue aplicada a una muestra o a una población.


 La encuesta fue aplicada a una población.

Justificación:
En la explicación del Caso a estudiar se dice que la encuesta se aplica al
"número total de estudiantes matriculados en dicha maestría es de 30
estudiantes", lo cual se asocia con el concepto de Población.

2. Clasificación y tipo de las variables.


En la encuesta se observan cuatro variables:
 Sexo
 Edad
 Consumo de cerveza
 Ingreso mensual

Clasificación:

Sexo
Es una variable cualitativa, ya que su medición no es de forma numérica, sino
por medio de palabras (masculino, femenino).

Edad
Es una variable cuantitativa del tipo discreta si se ha dicho que es en años
cumplidos. Este tipo de variables producen datos por medio de un proceso de
conteo, y corresponde a valores enteros positivos de la recta numérica.

Consumo de cerveza
Es una variable cuantitativa discreta, si se considera el consumo en unidades.

Ingreso mensual
En general las variables que producen datos en unidades de dinero son
cuantitativas continuas, ya que incluyen centavos (dos decimales), pero en el
caso de lo presentado en la encuesta, todo se clasifica en unidades enteras, por
lo tanto es una variable cuantitativa discreta.

3. Distribución de frecuencias de la edad en años cumplidos.

Ordenamos los datos


25 27 29 29 29 31 32 33 35 35
37 39 39 42 42 43 44 44 44 44
45 47 49 49 51 51 53 53 53 54
Determinamos el Rango de los datos

𝑹 = 𝑿𝒎𝒂𝒚𝒐𝒓 − 𝑿𝒎𝒆𝒏𝒐𝒓
 𝑹 = 𝟓𝟒 − 𝟐𝟓 = 𝟐𝟗

El número de clases o intervalos

𝒌=𝟓

Amplitud del intervalo de clase

𝑹 𝟐𝟗
𝑪= = = 𝟓. 𝟖
𝒌 𝟓

Tomar 𝑪 = 𝟔

En resumen
Usaremos 𝒌 = 𝟓 y 𝑪 = 𝟔, para formar los intervalos de clases.

Consideraremos intervalos del tipo: [𝒂 − 𝒃)


25 27 29 29 29 31 32 33 35 35
37 39 39 42 42 43 44 44 44 44
45 47 49 49 51 51 53 53 53 54

Intervalos Frecuencias Frecuencia Frecuencias absoluta Frecuencia relativa


absoluta, 𝒇 relativa, 𝒇𝒓 , % acumulada, 𝑭 acumulada, 𝑭𝒓,%
25 - 31 5 16.7 5 16.7
31 - 37 5 16.7 10 33.4
37 - 43 5 16.7 15 50.1
43 - 49 7 23.3 22 73.4
49 - 55 8 26.6 30 100
∑ 𝑓 = 30 ∑ 𝑓𝑟 = 100

4. Tabla cruzada que relacione el sexo y la edad en años cumplidos.


Edad, años cumplidos Mujeres Varones Total
25 - 31 3 2 5
31 - 37 4 1 5
37 - 43 3 2 5
43 - 49 3 4 7
49 - 55 5 3 8
Total 18 12
5. Representación gráfica de un histograma de la edad en años
cumplidos
HISTOGRAMA
9
8
8
7
EDAD, AÑOS CUMPLIDOS

7
6
5 5 5
5
4
3
2
1
0
25 -31 31 - 37 37 - 43 43 - 49 49 - 55
NUMERO DE ESTUDIANTES

6. Representación gráfica de la variable sexo, por medio de un


gráfico circular o de pastel.

Asumimos qué:
1 = FEMENINO
2=MASCULINO

Sexo de los encuestados


MASCULINO 12 40%
FEMENINO 18 60%
TOTAL 30 100%

Sexo de los encuestados

40%
Varon
60%
Mujer
7. Las medidas de tendencia central (media, mediana, moda) obtenidas de
la tabla de distribución de frecuencias.

La Media aritmética
∑ 𝒇𝑿𝑴
𝝁=
𝑵

𝑵 = 𝟑𝟎

Intervalos Frecuencias Punto Medio o marca 𝒇𝑿𝑴


absoluta, 𝒇 de clase, 𝑿𝑴
25 - 31 5 28 140
31 - 37 5 34 170
37 - 43 5 40 200
43 - 49 7 46 322
49 - 55 8 52 416
∑ 𝑓 = 30 ∑ 𝒇𝑿𝑴 = 1248

Entonces
𝟏𝟐𝟒𝟖
𝝁= = 𝟒𝟏. 𝟔
𝟑𝟎

La mediana
  N / 2  f 
M  Li    xC
 Fm 

Dónde:
Li , Límite inferior de la clase mediana. La clase mediana, es aquella que debe
contener a la mediana (contiene la posición de la mediana)
𝒇, Suma de todas las frecuencias que están antes de la frecuencia mediana
𝑭𝒎 , Frecuencia absoluta de la clase mediana
𝐶, Amplitud de clase

 La clase mediana es la cuarta clase

Datos:
𝑳𝑰 = 𝟒𝟑
𝒇 = 𝟏𝟓
𝑭𝒎 = 𝟕
𝑪=𝟔
𝑵 𝟑𝟎
= = 𝟏𝟓
𝟐 𝟐
𝟏𝟓−𝟏𝟓
 𝑴 = 𝟒𝟑 + [ 𝟕 ] × 𝟔 = 𝟒𝟑
La Moda
 d1 
M o  Li    xC
 d1  d 2 
Donde:
𝑳𝒊 : Límite inferior de la clase modal, (la clase con mayor frecuencia absoluta)
𝒅𝟏 : Diferencia entre la frecuencia de la clase modal y la frecuencia de la clase
anterior
𝒅𝟐 : Diferencia entre la frecuencia de la clase de la modal y la frecuencia de la
clase siguiente.

 La clase mediana es la quinta clase

Datos:
𝑳𝑰 = 𝟒𝟗
𝑪=𝟔
𝒅𝟏 = 𝟖 − 𝟕 = 𝟏
𝒅𝟐 = 𝟖 − 𝟎 = 𝟖
𝑭𝒎𝒐 = 𝟖

𝟏
 𝑴𝟎 = 𝟒𝟗 + [𝟏+𝟖] × 𝟔 = 𝟒𝟗. 𝟕

8. Las medidas de dispersión (rango, varianza, desviación estándar


y coeficiente de variación) obtenidas de la tabla de distribución de
frecuencias.

El Rango de los datos

𝑹 = 𝑿𝒎𝒂𝒚𝒐𝒓 − 𝑿𝒎𝒆𝒏𝒐𝒓
 𝑹 = 𝟓𝟒 − 𝟐𝟓 = 𝟐𝟗

La varianza
Se considera una medida de variación y es igual a la desviación estándar al
cuadrado.

2
∑ 𝑓(𝑋𝑀 − 𝜇)2
𝜎 =
𝑁

Intervalos Frecuencias Punto Medio o marca 𝑓(𝑋𝑀 − 𝜇)2


absoluta, 𝒇 de clase, 𝑿𝑴
25 - 31 5 28 5(28 – 41.6)2=369.92
31 - 37 5 34 5(34 – 41.6)2=288.80
37 - 43 5 40 5(40 – 41.6)2=12.8
43 - 49 7 46 7(46 – 41.6)2=135.52
49 - 55 8 52 8(52 – 41.6)2=865.28
∑ 𝑓 = 30 ∑ 𝒇(𝑿𝑴 − 𝝁)𝟐 =1,672.32

2
∑ 𝑓(𝑋𝑀 − 𝜇)2 1,672.32
𝜎 = = = 55.74
𝑁 30

𝝈𝟐 = 𝟓𝟓. 𝟕𝟒

Desviación Estándar:
La desviación estándar miden la variación “promedio” de los datos con
respecto a la media aritmética (valor promedio), es decir como las observaciones
se distribuyen por arriba y por abajo del valor de la media aritmética.

∑ 𝑓(𝑋𝑀 − 𝜇)2
𝜎=√
𝑁

𝝈 = √𝟓𝟓. 𝟕𝟒 = 𝟕. 𝟒𝟕

El coeficiente de variación
Expresa a la desviación estándar como un porcentaje de la media aritmética. Se
utiliza para saber si la variación de los datos es grande o no.
𝜎
𝐶𝑉 = × 100
𝜇

𝟕.𝟒𝟕
 𝑪𝑽 = × 𝟏𝟎𝟎 = 𝟏𝟕. 𝟗𝟔%
𝟒𝟏.𝟔

Dada la muestra de los 10 elementos tomados de la población,


le solicitan lo siguiente:
1. Las medidas de tendencia central de la muestra, correspondiente a la
variable edad en años cumplidos.

Muestra seleccionada
42 44 29 29 32 53 44 37 51 39

a. Medidas de tendencia central:

La Media Aritmética:

X 
X i
Dónde: 𝒏= tamaño de la muestra;
n
∑ 𝑿𝒊 = 𝑿𝟏 + 𝑿𝟐 + ⋯ + 𝑿𝒏
∑ 𝑋 42 + 44 + 29 + 29 + 32 + 53 + 44 + 37 + 51 + 39
𝑋̅ = = = 40
𝑛 10

 La edad promedio del grupo es 40 años de acuerdo con la media


aritmética.

La Mediana: 𝐦
La Mediana de un conjunto de números ordenados en magnitud, es el valor
central.

Datos ordenados
29 29 32 37 39 42 44 44 51 53

𝑛+1 10+1
Posición de la mediana 𝑝= = = 5.5
2 2

Determinamos la mediana de acuerdo con la posición encontrada, promediamos


los dos valores centrales:
𝟑𝟗 + 𝟒𝟐
𝒎= = 𝟐𝟕
𝟐
 El valor central o valor mediano del conjunto de edades es 27 años.

La Moda: 𝐦𝐨
La Moda de un conjunto de datos es el valor que ocurre con mayor frecuencia;
es decir el valor más frecuente o repetitivo.

 En este conjunto de edades, existen dos valores que se repiten un


máximo de dos veces, las edades de 27 y 44 años, por lo cual se puede
afirmar que el grupo de edades tiene dos modas:
𝒎𝟎𝟏 = 𝟐𝟕 𝒂ñ𝒐𝒔
𝒎𝟎𝟐 = 𝟒𝟒 𝒂ñ𝒐𝒔

2. Las medidas de dispersión de la muestra, de la variable


edad.

La varianza muestral

∑(𝑋 − 𝑋̅)2
𝑆2 =
𝑛−1
Entonces
2
(29 − 40)2 + (29 − 40)2 + (32 − 40)2 + (37 − 40)2 + (39 − 40)2 + (42 − 40)2 +
𝑆 =
10 − 1
+(44 − 40) + (44 − 40)2 + (51 − 40)2 + (53 − 40)2
2

10 − 1
 𝑺𝟐 = 𝟕𝟏. 𝟑𝟑
Desviación Estándar:
La desviación estándar miden la variación “promedio” de los datos con
respecto a la media aritmética (valor promedio).

̅ )𝟐
∑(𝑿 − 𝑿
𝑺=√
𝒏−𝟏

O también:
𝑺 = √𝑺𝟐 , es decir la Desviación estándar es la raíz cuadrada de la Varianza que
ya la hemos calculado.

Entonces
𝑺 = √𝟕𝟏. 𝟑𝟑 = 𝟖. 𝟒𝟓

 𝑺 = 𝟖. 𝟒𝟓

El coeficiente de variación

𝑺
𝑪𝑽 = × 𝟏𝟎𝟎
̅
𝑿

Entonces
𝟖. 𝟒𝟓
𝑪𝑽 = × 𝟏𝟎𝟎 = 𝟐𝟏. 𝟏𝟐%
𝟒𝟎

 El valor de la Desviación estándar representa el 𝟐𝟏. 𝟏𝟐% con respecto al


valor de la media aritmética muestral.

También podría gustarte