Está en la página 1de 13

Taller 1

Estadística I - 2020-I

1. Con el fin de determinar los mejores alojamientos, en la tabla “Hoteles” se presenta


una muestra de nueve hoteles europeos. Los precios de una habitación estándar van
de $(precio más bajo) a $$$$(precio más alto). La calificación corresponde a la
evaluación de habitaciones, servicio, restaurante, ubicación y áreas públicas; cuanta
más alta sea la calificación, mayor es el nivel de satisfacción.

a. ¿Cuántos elementos hay en ese conjunto de datos?


R/ El conjunto de datos tiene 10 elementos

b. ¿Cuántas variables hay en este conjunto de datos?


R/ En el conjunto de datos hay 4 variables

c. ¿Cuáles variables son cualitativas y cuáles cuantitativas?


R/
 Cualitativas: país y calificación general
 Cuantitativas: precio de la habitación y número de habitaciones

d. ¿Qué tipo de escala de medición se usa para cada variable?


R/
 País: escala nominal

e. ¿Cuál es el número promedio de habitaciones en los nueve hoteles?


R/ (18+166+54+47+326+45+120+10+22)/9= 89.77

f. Calcule la calificación promedio


R/ (83.6+86.3+77.8+76.8+80.9+73.7+85.5+76.9+90.6)/9= 81.34

g. ¿Qué porcentaje de los hoteles se encuentra en Inglaterra?


R/
2/9= 0.22
0.22*100= 22%

h. ¿En qué porcentaje de los hoteles el precio de la habitación de $$?


R/
4/9=0.44
0.44*100=44%
2. En la tabla “Equipos” se muestran los precios, calidad de sonido, duración batería,
portabilidad y salidas de audio adicionales de una muestra de 10 reproductores de
sonido.

a. ¿Cuántos elementos contiene este conjunto de datos?


R/ El conjunto de datos contiene 9 elementos

b. ¿Cuál es la población?
R/ Reproductores de sonido

c. Calcule el precio promedio de la muestra


R/
(250.000+500.000+200.000+170.000+170.000+150.000+300.000+500.000+400.00
0+500.000)/10= 314.000

d. Estime cuál es el tiempo promedio de duración de la batería de la población


R/ (3+1+3+5+3+3+3+5+3+1)/10=3

e. ¿Cuántas variables hay en este conjunto de datos?


R/ 5 variables

f. De estas variables, ¿cuáles son cuantitativas y cuáles son cualitativas?


R/ Cualitativas: Calidad de sonido y sintonización FM
Cuantitativas: Precio, capacidad para CD y caseteras
g. ¿Qué porcentaje de los reproductores tienen una calidad de sonido Muy buena?
R/
4/9= 0.4
0.4*100= 40%

3. Cinco de las marcas de carros más vendidas en Colombia son Chevrolet, Renault, Ford,
Mazda y Kia. En la tabla “Autos” se presenta una muestra de 50 compras de
automóviles.

a. Elabore una distribución de frecuencia y otra de frecuencia porcentual


R/

 Marca fi fr
Renault 13 0,26
Ford 10 0,2
Chevrolet 14 0,28
Kia 7 0,14
Mazda 6 0,12
 Total 50 1

b. ¿cuál es la marca más vendida?


R/ La marca más vendida es Chevrolet

c. Haga una representación gráfica


R/
16

14
12
10
8

6
4
2

0
Renault Ford Chevrolet Kia Mazda

4. Las estadísticas acerca de las áreas que son elegidas por 64 estudiantes nuevos se
presenta en la tabla “Áreas”. Las cinco áreas más elegidas son artes y humanidades
(A), administración de negocios (B), ingeniería (E), política (P) y ciencias sociales (S). En
otras categorías (O) se agruparon áreas como física, ciencias de la computación y
educación.

a. Realice una distribución de frecuencia y otra de frecuencia porcentual


R/

Área fi fr
S 5 8%
P 6 9%
O 22 34%
B 13 20%
E 11 17%
A 7 11%
Total 64 1

b. Elabore una gráfica de barras


R/
fi
25

20

15

10

0
S P O B E A

c. ¿Qué porcentaje de los estudiantes nuevos elige una de las cinco áreas más
elegidas?
R/ El 65% de los estudiantes nuevos escoge una de las áreas más elegidas.
8+9+20+17+11=65%

d. ¿Cuál es el área más elegida por los estudiantes nuevos? ¿Qué porcentaje de los
estudiantes nuevos elige esta área?
R/
 El área más elegida por los estudiantes nuevos es otras categorías (O).
 El 34% de los estudiantes nuevos elige esta área.

5. Busque los datos de la población en el último censo para cada departamento de


Colombia y a partir de este conjunto de datos:

a. Elabore una distribución de frecuencia, una de frecuencia porcentual y un


histograma.
R/

fi
departamentos fi acumulada fr frecuencia porcentual
Antioquia 6.407.102 6.407.102 0,133 13,28
Atlántico 2.535.517 8.942.619 0,053 5,25
Bogotá, D.C. 7.412.566 16.355.185 0,154 15,36
Bolívar 2.070.110 18.425.295 0,043 4,29
Boyacá 1.217.376 19.642.671 0,025 2,52
Caldas 998.255 20.640.926 0,021 2,07
Caquetá 401.849 21.042.775 0,008 0,83
Cauca 1.464.488 22.507.263 0,030 3,03
Cesar 1.200.574 23.707.837 0,025 2,49
Córdoba 1.784.783 25.492.620 0,037 3,70
Cundinamarca 2.919.060 28.411.680 0,060 6,05
Chocó 534.826 28.946.506 0,011 1,11
Huila 1.100.386 30.046.892 0,023 2,28
La Guajira 880.560 30.927.452 0,018 1,82
Magdalena 1.341.746 32.269.198 0,028 2,78
Meta 1.039.722 33.308.920 0,022 2,15
Nariño 1.630.592 34.939.512 0,034 3,38
Norte de Santander 1.491.689 36.431.201 0,031 3,09
Quindío 539.904 36.971.105 0,011 1,12
Risaralda 943.401 37.914.506 0,020 1,95
Santander 2.184.837 40.099.343 0,045 4,53
Sucre 904.863 41.004.206 0,019 1,88
Tolima 1.330.187 42.334.393 0,028 2,76
Valle del Cauca 4.475.886 46.810.279 0,093 9,27
Arauca 262.174 47.072.453 0,005 0,54
Casanare 420.504 47.492.957 0,009 0,87
Putumayo 348.182 47.841.139 0,007 0,72
Archipiélago de San
61.280
Andrés 47.902.419 0,001 0,13
Amazonas 76.589 47.979.008 0,002 0,16
Guainía 48.114 48.027.122 0,001 0,10
Guaviare 82.767 48.109.889 0,002 0,17
Vaupés 40.797 48.150.686 0,001 0,08
Vichada 107.808 48.258.494 0,002 0,22
48.258.49
  4   1,000 100

b. Explique el sesgo de la distribución


R/

c. ¿Qué observaciones puede hacer acerca de la población en todos los


departamentos?
R/
 Los departamentos con mayor cantidad de habitantes, son los que tienen
más industria, comercio y turismo.
 Algunos departamentos con menor cantidad de habitantes son los que a
través de los años han sufrido mayor afectación por el conflicto armado y
mayor territorio rural.

6. En una encuesta realizada a 1000 personas sobre la preferencia de una marca para un
determinado artículo, se sabe que 125 prefieren la marca A, 260 la B y 240 la D.

a. Indique qué tipo de variable se está estudiando.


R/ Estamos estudiando una variable cualitativa

b. Elabore una distribución de frecuencias completa y obtenga todas las medidas


descriptivas para resumir esta información.
R/
Media: 250
Moda: No hay
Mediana: 250
Desviación estándar: 88, 6707393

Marca fi fr %
A 125 0,13 13
B 260 0,26 26
C 375 0,38 38
D 240 0,24 24
  1000 1,00 100

c. Represente gráficamente la distribución de frecuencias.


R/

fi
400

350

300

250

200

150

100

50

0
A B C D

7. A continuación se muestra el nivel de ingresos de 30 personas

Muy bajo Bajo Medio Bajo Medio


Medio Muy bajo Bajo Alto Bajo
Alto Muy alto Muy alto Muy bajo Medio
Muy bajo Bajo Bajo Bajo Medio
Medio Muy alto Medio Muy alto Alto
Muy alto Bajo Alto Muy alto Bajo

a. Comente qué diferencias hay entre el tipo de variables del ejercicio 1 y 2, y si eso
afecta a las medidas descriptivas que se pueden calcular.
R/
Ingresos fi fi ac. fr %
Muy bajo 4 4 0.13 13%
Bajo 9 13 0.3 30%
Medio 7 20 0.23 23%
Alto 4 24 0.13 13%
Muy alto 6 30 0.2 20%
Total 30   0.99 99%

b. Elabore una distribución de frecuencias.


R/ Media: (4+9+7+4+6)/5=6
Mediana: 4, 4, 6, 7, 9, la mediana es 6
Moda: es 4

c. Realice una representación gráfica de la distribución de frecuencias.


R/

fi
10
9
8
7
6
5
4
3
2
1
0
Muy bajo Bajo Medio Alto Muy alto

8. Se quiere analizar el número de prendas de vestir compradas durante las rebajas. Para
ello se entrevista a 20 personas, obteniendo los siguientes resultados

3 7 5 2 5
5 2 3 6 3
3 5 5 5 7
4 1 3 4 2
a. Elabore la distribución de frecuencias correspondiente.
R/
Prendas fi fr %
1 1 0,05 5%
2 3 0,15 15%
3 5 0,25 25%
4 2 0,1 10%
5 6 0,3 30%
6 1 0,05 5%
7 2 0,1 10%
Total 20 1 100

b. Realice una representación gráfica de la distribución de frecuencias.


R/

fi
7

0
1 2 3 4 5 6 7

c. Calcule el número medio de prendas de vestir compradas durante las rebajas.


R/ Media= 4

d. Obtenga el número más frecuente de prendas de vestir compradas durante las


rebajas
R/ Moda= 5

e. ¿Qué porcentaje de las personas compran por lo menos 4 prendas?


R/ (1+3+5+2)/20=0.55
0.55*100=55%

f. ¿Qué porcentaje de las personas compran como máximo 5 prendas?


R/ (1+3+5+2+6)/20=0.85
0.85*100=85%

g. Determine e interprete el rango intercuartílico.


R/ Q1= 3
Q2= 4
Q3= 5
Q3 – Q1= 2

9. Los precios (en millones de pesos) de los vehículos, vendidos en junio en el


concesionario de la zona norte son

36 40,8 45,8 40,3 29,8 40,9


32,3 42,5 28,4 33,5 29,5 32,7
41,7 29,5 41,3 36,7 30,8 36,2
27,5 34,2 28,9 26,5 29,5 29,8
28,8 34,3 30,8 35,4 35,7 32,5

a. Construya la distribución de frecuencias correspondiente


R/
Días junio fi Fr %
1 36 0.040 4%
2 40,8 0.045 4.5%
3 45,8 0.051 5.1%
4 40,3 0.045 4.5%
5 29,8 0.033 3.3%
6 40,9 0.045 4.5%
7 32,3 0.036 3.6%
8 42,5 0.047 4.7%
9 28,4 0.031 3.1%
10 33,5 0.037 3.7%
11 29,5 0.033 3.3%
12 32,7 0.036 3.6%
13 41,7 0.046 4.6%
14 41,3 0.046 4.6%
15 36,7 0.041 4.1%
16 30,8 0.034 3.4%
17 36,2 0.040 4.0%
18 27,5 0.030 3.0%
19 34,2 0.038 3.8%
20 28,9 0.032 3.2%
21 26,5 0.029 2.9%
22 28,8 0.032 3.2%
23 34,3 0.038 3.8%
24 35,4 0.039 3.9%
25 35,7 0.040 4.0%
26 32,5 0.036 3.6%
total 903 30 100%

b. Realice la representación gráfica de la distribución de frecuencias


R/

fi
3.5

2.5

1.5

0.5

0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26

c. ¿Cuál es el precio medio de los vehículos vendidos en Junio?


R/ El precio medio de los vehículos vendidos en junio es 32.743.333

d. Determine el precio de venta más frecuente.


R/ El precio de venta más frecuente es 29.500.000

10. A partir del siguiente gráfico responda las siguientes preguntas

a. ¿Qué tipo de gráfico es y qué representa?


R/ Es una gráfica de barras o un diagrama de barras y representa los datos
cualitativos de una distribución de frecuencia, de frecuencia relativa o de
frecuencia porcentual.

b. ¿Cuál es el rango de la variable?


R/ El rango de la variable es 10

c. ¿En qué intervalo está el valor más frecuente?


R/ El intervalo más frecuente es 7-8
d. ¿Qué puede decir acerca de la moda?
R/ La moda es el valor que más se repite en un conjunto de datos, siendo en este
caso el intervalo 7-8

e. A partir del gráfico, ¿tiene sentido afirmar que la media es 2.25, la media 4 y la
desviación estándar 35.4?
R/ No tiene sentido afirmar que estas son las medidas de localización, ya que sus
Medidas respectivas son:
Media: 5.5
Mediana: 5
Desviación estándar: 3.16

11. El número diario de consultas a la plataforma del módulo virtual de estadística por
parte de los 80 alumnos del módulo se encuentra resumido en la siguiente distribución
de frecuencias:

No. Consultas ni fi Ni Fi
0 9 0,11 9 0,11
1 19 0,24 28 0,35
2 21 0,26 49 0,61
3 18 0,23 67 0,84
4 13 0,16 80 1

a. Complete la tabla.
b. Obtenga el número medio de diario de consultas en el módulo y su desviación
estándar.
R/
Media: (0+1+2+3+4)/5=2
Desviación estándar: 1.41

c. Calcule el número diario de consultas más frecuente.


R/ El número diario de consultas más frecuentes son 2

d. Determine el número de estudiantes que realizan, por lo menos dos consultas


diarias.
R/ El número de estudiantes que realiza por lo menos dos consultas es 52

e. Qué porcentaje de estudiantes realizan entre 2 y 3 consultas diarias.


R/ El 49% de los estudiantes realiza entre 2 y 3 consultas diarias

12. Los salarios mensuales (en millones de pesos) de los trabajadores de una empresa se
distribuyen de la siguiente forma

Salario Trabajadores
1.2 - 2.2 9
2.2 - 3.2 30
3.2 - 4.2 15
4.2 - 5.2 8
5.2 - 6.2 6

a. Obtenga el salario medio de los trabajadores de esta empresa


R/ El salario medio de los trabajadores de la empresa es de 3.700.000

b. Obtenga el porcentaje de trabajadores que tienen como máximo un salario de


$4.200.000.
R/
El 79% de los trabajadores tienen como máximo un salario de $4.200.000
9/68=0.13
30/668=0.44
15/68= 0.22
0.13+0.44+0.22=0.79
0.79*100= 79%

c. Si se produce un aumento salarial del 4,2%, ¿aumentaría o disminuiría la


dispersión de los salarios?
R/ No aumentaría la dispersión porque el aumento es el mismo para todos los
intervalos, por lo tanto permanecen constantes.

d. Determine el intervalo salarial más frecuente en la empresa.


R/ El intervalo salarial más frecuente en la empresa es 2.200.000 – 3.200.000

e. Se sabe que en otra empresa del mismo sector la media de los salarios mensuales
es de $4.600.000, con una desviación estándar de $1.265.000. ¿En qué empresa
existe mayor dispersión de los salarios?
R/ En la segunda empresa hay mayor dispersión debido a que el promedio es de y
la desviación tienen más diferencia que la primer empresa donde la media es de $
3’288.000= y la desviación de $ 1’270.000=

f. Si en las dos empresas los salarios mensuales se incrementaron en $200.000, ¿en


cuál de las dos empresas sería mayor la dispersión salarial?
R/ Continuaría la segunda empresa presentando la mayor dispersión debido a que
el salario aumentaría para todos los intervalos y no tendría un cambio significativo
los datos.

13. Una cadena de concesionarios de vehículos importados tiene 100 sedes en todo el país
y la información de la superficie de estas se recoge en la siguiente tabla

Superficie (m2) 120-200 200-280 280-360 360-440


N. Concesionarios 20 35 30 15
a. Determine el intervalo modal.
R/ El intervalo modal es (200 – 280)

b. Calcule la superficie media de los concesionarios.


R/ M = (160*20+240*35+320*30+ 400*15)/100
M= (3200+5400+ 9600+6000)/100
M = 27200/100
M=272

c. ¿Es correcto afirmar que 60% de los concesionarios tienen por lo menos una
superficie de 200 m2? Justifique su respuesta.
R/ Si, ya que si dice por lo menos se deben observar los 3 últimos intervalos que
corresponden a más del 60% de los concesionarios.

d. Calcule la desviación estándar.


R/ 7,90569415

e. ¿Es correcto afirmar que el 30% de los concesionaros no tienen como mínimo una
superficie de 200 m2?
R/ No, ya que los concesionarios que no tienen como mínimo una superficie de
200 m2 son 20 que corresponden al primer intervalo.

Si en todos los concesionarios se realiza una reducción de la superficie en 25 m 2,


calcule todos los apartados anteriores.

También podría gustarte