Está en la página 1de 10

Estadística I

Prof. Javier Martínez

EJERCICIOS DE ESTADÍSTICA DESCRIPTIVA

Problema 1:
Un censor de textos contabiliza el número de erratas que encuentra en cada página.
Después de pasar este censor por un texto de 50 páginas, se obtiene el siguiente número
de erratas por página:
2 3 5 0 1 4 0 6 2 1
1 0 2 4 5 3 1 2 3 2
2 5 4 1 3 2 6 8 2 0
1 0 2 3 1 5 10 2 1 3
3 1 2 4 4 6 2 0 1 3

Elaborar las tablas de datos agrupados y no agrupados. Elabore gráficos, y además,


calcule las distintas medidas descriptivas de la distribución de frecuencia.

Elaboración de Tabla de datos No Agrupados

Tabla de Datos No Agrupados


Frecuencia
Frecuencia Frecuencia
Variable Frecuencia Relativa 𝒇𝒊 𝒙𝒊 𝒇𝒊
𝒙𝒊 𝒇𝒊
Relativa hi Acumulada ̅)𝟐
(𝒙 − 𝒙
𝒇𝒊 /𝒏 𝑭𝒊
Acumulada 𝒏 𝒏−𝟏 𝒊
𝑯𝒊

0 6 0,12 6 0,12 0 0,879


1 10 0,2 16 0,32 0,2 0,576
2 12 0,24 28 0,56 0,48 0,113
3 8 0,16 36 0,72 0,48 0,017
4 5 0,1 41 0,82 0,4 0,178
5 4 0,08 45 0,9 0,4 0,439
6 3 0,06 48 0,96 0,36 0,675
8 1 0,02 49 0,98 0,16 0,578
10 1 0,02 50 1 0,2 1,094
Número de 2,68 4,549
Datos n = 50

𝑥𝑖 𝑓𝑖
𝑴𝒆𝒅𝒊𝒂 = ∑ = 𝟐. 𝟔𝟖
𝑛

Varianza= 4,549

1
Estadística I
Prof. Javier Martínez

Moda = Termino de mayor frecuencia = 2 Formula de la Mediana


Si n Par Si n
Impar
(x(25) + 𝑥(26) ) (2 + 2)
𝑴𝒆𝒅𝒊𝒂𝒏𝒂 = = =𝟐 (𝒙(𝒏) + 𝒙(𝒏+𝟏) )
2 2 𝟐 𝟐 𝒙 𝒏+𝟏
( )
𝟐 𝟐

Calculo de los Cuartiles

𝒒𝟏 = 𝒑𝟐𝟓
𝑖 25
(100) 𝑛 = (100) 50 = 12,5

Dado que no es entero, 𝒑𝟐𝟓 = 𝑥(13) = 1 = 𝒒𝟏

𝒒𝟐 = 𝒑𝟓𝟎
𝑖 50
(100) 𝑛 = (100) 50 = 25
𝑥(25) +𝑥(26) 2+2
Dado que es entero, 𝒑𝟓𝟎 = 2
= 2
= 2 = 𝒒𝟐 = 𝑴𝒆𝒅𝒊𝒂𝒏𝒂

𝒒𝟑 = 𝒑𝟕𝟓
𝑖 75
( )𝑛 = ( ) 50 = 37,5
100 100
Dado que no es entero, 𝒑𝟕𝟓 = 𝑥(38) = 4 = 𝒒𝟑

2
Estadística I
Prof. Javier Martínez

Construcción de Boxplot
Nota: En esta oportunidad utilizaremos los datos alcanzados con la tabla de valores no
agrupados. Es posible implementar los valores alcanzados con la tabla de datos
agrupados.

𝑹𝒂𝒏𝒈𝒐 𝑰𝒏𝒕𝒆𝒓𝒄𝒖𝒂𝒓𝒕𝒊𝒍 (𝑹𝑰) = 𝑞3 − 𝑞1 = 4 − 1 = 𝟑


𝑳𝒊𝒎𝒊𝒕𝒆 𝑺𝒖𝒑𝒆𝒓𝒊𝒐𝒓 = 𝑞3 + (𝟏, 𝟓)𝑹𝑰 = 4 + (𝟏, 𝟓)𝟑 = 𝟖, 𝟓
𝑳𝒊𝒎𝒊𝒕𝒆 𝑰𝒏𝒇𝒆𝒓𝒊𝒐𝒓 = 𝑞1 − (𝟏, 𝟓)𝑹𝑰 = 1 − (𝟏, 𝟓)𝟑 = −𝟑, 𝟓

Tras el grafico de caja, es posible notar que el centro de la distribución (mediana) es


igual a 2, el primer y tercer cuartil son 1 y 4, respectivamente. Además, se observa la
presencia del 10 como un valor atípico.

Cálculos Implementando la tabla de datos Agrupados

𝑵ú𝒎𝒆𝒓𝒐 𝒅𝒆 𝑪𝒍𝒂𝒔𝒆𝒔 = √n = √50 ~ 𝟕

𝑹𝒂𝒏𝒈𝒐 = xmax − xmin = 10 − 0 = 𝟏𝟎


𝑅𝑎𝑛𝑔𝑜 10
𝑨𝒎𝒑𝒍𝒊𝒕𝒅 = = = 𝟏. 𝟒𝟑 ~𝟐
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝐶𝑙𝑎𝑠𝑒𝑠 7

3
Estadística I
Prof. Javier Martínez

Marca Frecuencia Frecuencia Frecuencia


Variable Frecuencia Relativa hi Relativa 𝒇𝒊 𝒇𝒊
de Clase Acumulada 𝒙̇ ̅)𝟐
(𝒙̇ − 𝒙
𝒙𝒊
𝒙̇ 𝒊
𝒇𝒊
𝑭𝒊
Acumulada 𝒏 𝒊 𝒏−𝟏 𝒊
𝒇𝒊 /𝒏 𝑯𝒊
[0,2) 1 16 0,32 16 0,32 0,32 1,580

[2,4) 3 20 0,4 36 0,72 1,2 0,016

[4,6) 5 9 0,18 45 0,9 0,9 0,595

[6,8) 7 3 0,06 48 0,96 0,42 0,884

[8,10] 9 2 0,04 50 1 0,36 1,373

3,20 4,449
Número de Datos 50

Media= 3,20
Varianza= 4,449

𝑎 𝑛 2 50
𝑴𝒆𝒅𝒊𝒂𝒏𝒂 = 𝑙𝑖 + ( − 𝐹𝑎 ) = 2 + ( − 16) = 𝟐, 𝟗
𝑓𝑚𝑒𝑑 2 20 2

𝑓𝑚𝑜𝑑 − 𝑓𝑎 20 − 16
𝑴𝒐𝒅𝒂 = 𝑙𝑖 + 𝑎 =2+ (2) = 𝟐, 𝟓𝟑
(𝑓𝑚𝑜𝑑 − 𝑓𝑎 ) + (𝑓𝑚𝑜𝑑 − 𝑓𝑠 ) (20 − 16) + (20 − 9)

4
Estadística I
Prof. Javier Martínez

Cálculo de los Cuartiles

𝒒𝟏 = 𝒑𝟐𝟓

𝑎 𝑛25 2 50(25)
𝑝25 = 𝑙𝑖 + ( − 𝐹𝑎 ) = 0 + ( − 0) = 𝟏, 𝟓𝟔
𝑓𝑗 100 16 100

𝒒𝟐 = 𝒑𝟓𝟎

𝑎 𝑛50 2 50(50)
𝑝50 = 𝑙𝑖 + ( − 𝐹𝑎 ) = 2 + ( − 16) = 𝟐, 𝟗 = 𝑴𝒆𝒅𝒊𝒂𝒏𝒂
𝑓𝑗 100 20 100

𝒒𝟑 = 𝒑𝟕𝟓

𝑎 𝑛75 2 50(75)
𝑝75 = 𝑙𝑖 + ( − 𝐹𝑎 ) = 4 + ( − 36) = 𝟒, 𝟑𝟑
𝑓𝑗 100 9 100

Asignación: Hacer Gráfico de Caja para la tabla de datos agrupados.

5
Estadística I
Prof. Javier Martínez

Problema 2

Los siguientes datos son obtenidos a partir de una encuesta realizada entre los alumnos
de la clase 1 de la universidad B.
Hombres con bachillerato en Humanidades: 8
Hombres con bachillerato en Ciencias: 22
Mujeres con bachillerato en Humanidades: 16
Mujeres con bachillerato en Ciencias: 14
(a) Construir una tabla de distribución de frecuencias.
(b) Construir el gráfico de barras correspondiente.
(c) Construir el diagrama de tortas correspondiente.

Tabla de Distribución de Frecuencia

Frecuencia Frecuencia Frecuencia


Variable Frecuencia Relativa hi Acumulada Relativa
%
𝒙𝒊 𝒇𝒊 Acumulada
𝑭𝒊
𝑯𝒊
𝒇𝒊 /𝒏
Hombres con bachillerato en
8 0,133 8 0,133 13,333
Humanidades

Hombres con bachillerato en Ciencias 22 0,367 30 0,500 36,667

Mujeres con bachillerato en


16 0,267 46 0,767 26,667
Humanidades

Mujeres con bachillerato en Ciencias 14 0,233 60 1 23,333

Número de Datos n = 60

Gráfico de Barras
25

20

15

10

0
Hombres con Hombres con Mujeres con Mujeres con
bachillerato en bachillerato en bachillerato en bachillerato en
Humanidades Ciencias Humanidades Ciencias

6
Estadística I
Prof. Javier Martínez

GRÁFICO DE TORTA
Hombres con bachillerato en Humanidades
Hombres con bachillerato en Ciencias
Mujeres con bachillerato en Humanidades
Mujeres con bachillerato en Ciencias

13%
23%

37%
27%

Problema 3:
Los siguientes datos representan el promedio de artículos vendidos a diario por dos
empleados de una tienda durante 5 días:

Empleado A Empleado B
25 15
20 25
15 27
30 23
35 35

(a) Calcular el promedio de artículos vendidos a diario por cada empleado.


(b) ¿Cuál de los dos empleados parece mantener un promedio de ventas más
homogéneo durante la semana?

𝑥𝑖 25 + 20 + 15 + 30 + 35
𝑷𝒓𝒐𝒎𝒆𝒅𝒊𝒐 𝑬𝒎𝒑𝒍𝒆𝒂𝒅𝒐 𝑨 = ∑ = = 𝟐𝟓
𝑛 5
𝑦𝑖 15 + 25 + 27 + 23 + 35
𝑷𝒓𝒐𝒎𝒆𝒅𝒊𝒐 𝑬𝒎𝒑𝒍𝒆𝒂𝒅𝒐 𝑩 = ∑ = = 𝟐𝟓
𝑛 5

7
Estadística I
Prof. Javier Martínez

Calculando las varianzas para hallar el coeficiente de variación.

(𝑥𝑖 − 𝑥̅ )2 0 + 25 + 100 + 25 + 100


𝑽𝒂𝒓𝒊𝒂𝒏𝒛𝒂 𝑬𝒎𝒑𝒍𝒆𝒂𝒅𝒐 𝑨 = ∑ = = 𝟔𝟐, 𝟓
𝑛−1 5−1
(𝑦𝑖 − 𝑦̅)2 100 + 0 + 4 + 4 + 100
𝑽𝒂𝒓𝒊𝒂𝒏𝒛𝒂 𝑬𝒎𝒑𝒍𝒆𝒂𝒅𝒐 𝑩 = ∑ = = 𝟓𝟐
𝑛−1 5−1

𝑆𝐴 √62,5
𝑪𝑽 𝑬𝒎𝒑𝒍𝒆𝒂𝒅𝒐 𝑨 = ( ) 100% = ( ) 100% = 31,62%
𝑥̅ 25

La desviación típica de la muestra del empleado A es el 31,62% del valor de la media de


la muestra.
𝑆𝐵 √52
𝑪𝑽 𝑬𝒎𝒑𝒍𝒆𝒂𝒅𝒐 𝑩 = ( ) 100% = ( ) 100% = 28,84%
𝑦̅ 25
La desviación típica de la muestra del empleado B es el 28,84% del valor de la media de
la muestra.
Por tanto, el empleado B muestra un promedio de ventas más homogéneo por presentar
un coeficiente de variación menor.

Problema 4:
Las siguientes medidas corresponden a las estaturas (metros) de cincuenta niños y
niñas:
1,56 1,59 1,63 1,62 1,65 1,61 1,59 1,51 1,62 1,62
1,53 1,49 1,57 1,54 1,53 1,59 1,58 1,57 1,47 1,64
1,55 1,59 1,53 1,56 1,53 1,47 1,57 1,6 1,54 1,56
1,5 1,62 1,59 1,62 1,54 1,68 1,52 1,62 1,59 1,49
1,65 1,53 1,59 1,56 1,54 1,58 1,52 1,63 1,56 1,62

Elaborar las tablas de datos agrupados. Elabore gráficos, y además, calcule las distintas
medidas descriptivas de la distribución de frecuencia.

𝑵ú𝒎𝒆𝒓𝒐 𝒅𝒆 𝑪𝒍𝒂𝒔𝒆𝒔 = √n = √50 = 𝟕, 𝟎𝟕

𝑹𝒂𝒏𝒈𝒐 = xmax − xmin = 1,68 − 1,47 = 𝟎, 𝟐𝟏


𝑅𝑎𝑛𝑔𝑜 0,21
𝑨𝒎𝒑𝒍𝒊𝒕𝒖𝒅 (𝒂) = = = 𝟎, 𝟎𝟑
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝐶𝑙𝑎𝑠𝑒𝑠 7,07

8
Estadística I
Prof. Javier Martínez

Marca Frecuencia
Frecuencia Frecuencia
Variable de Frecuencia Relativa 𝒇𝒊 𝒇𝒊
Relativa hi Acumulada 𝒙̇ ̅)𝟐
(𝒙̇ − 𝒙
𝒙𝒊 Clase 𝒇𝒊
𝒇𝒊 /𝒏 𝑭𝒊
Acumulada 𝒏 𝒊 𝒏−𝟏 𝒊
𝒙̇ 𝒊 𝑯𝒊
[1,47, 1,50) 1,485 4 0,08 4 0,08 0,1188 0,00073364

[1,50, 1,53) 1,515 4 0,08 8 0,16 0,1212 0,00034278

[1,53, 1,56) 1,545 10 0,2 18 0,36 0,309 0,00024715

[1,56, 1,59) 1,575 10 0,2 28 0,56 0,315 4,702E-06

[1,59, 1,62) 1,605 9 0,18 37 0,74 0,2889 0,00011664

[1,62, 1,65) 1,635 10 0,2 47 0,94 0,327 0,00062184

[1,65, 1,68] 1,665 3 0,06 50 1 0,0999 0,00044443

1,5798 0,0025
Número de Datos
50
n=

𝑀𝑒𝑑𝑖𝑎 = 𝟏, 𝟓𝟕𝟗𝟖
𝑽𝒂𝒓𝒊𝒂𝒏𝒛𝒂 = 𝟎, 𝟎𝟎𝟐𝟓

𝑎𝑛 0,03 50
𝑚𝑒𝑑𝑖𝑎𝑛𝑎 = 𝑙𝑖 + ( − 𝐹𝑎 ) = 1,56 + ( − 18) = 𝟏, 𝟓𝟖𝟏
𝑓𝑚𝑒𝑑 2 10 2
10 − 4
𝑚𝑜𝑑𝑎 1 = 1,53 + 0.03 = 𝟏, 𝟓𝟔
(10 − 4) + (10 − 10)
10 − 10
𝑚𝑜𝑑𝑎 2 = 1,56 + 0.03 = 𝟏, 𝟓𝟔
(10 − 10) + (10 − 9)
10 − 9
𝑚𝑜𝑑𝑎 3 = 1,62 + 0.03 = 𝟏, 𝟔𝟐
(10 − 9) + (10 − 3)

En conclusión la distribución es doble modal (1,56 y 1,62)

𝒒𝟏 = 𝒑𝟐𝟓

𝑎 𝑛25 0,03 50(25)


𝑝25 = 𝑙𝑖 + ( − 𝐹𝑎 ) = 1,53 + ( − 8) = 𝟏, 𝟓𝟒𝟑𝟓
𝑓𝑗 100 10 100

𝒒𝟐 = 𝑝50 = 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 = 𝟏, 𝟓𝟖

9
Estadística I
Prof. Javier Martínez

𝒒𝟑 = 𝒑𝟕𝟓

𝑎 𝑛75 0,03 50(75)


𝑝75 = 𝑙𝑖 + ( − 𝐹𝑎 ) = 1,62 + ( − 37) = 𝟏, 𝟔𝟐𝟏𝟓
𝑓𝑗 100 10 100

𝑹𝒂𝒏𝒈𝒐 𝑰𝒏𝒕𝒆𝒓𝒄𝒖𝒂𝒓𝒕𝒊𝒍 (𝑹𝑰) = 𝑞3 − 𝑞1 = 1,6215 − 1,5435 = 𝟎, 𝟎𝟕𝟖


𝑳𝒊𝒎𝒊𝒕𝒆 𝑺𝒖𝒑𝒆𝒓𝒊𝒐𝒓 = 𝑞3 + (𝟏, 𝟓)𝑹𝑰 = 1,62 + (𝟏, 𝟓)𝟎, 𝟎𝟕𝟖 = 𝟏, 𝟕𝟑𝟕
𝑳𝒊𝒎𝒊𝒕𝒆 𝑰𝒏𝒇𝒆𝒓𝒊𝒐𝒓 = 𝑞1 − (𝟏, 𝟓)𝑹𝑰 = 1,54 − (𝟏, 𝟓)𝟎, 𝟎𝟕𝟖 = 𝟏, 𝟒𝟐𝟑

(𝑥̅ − 𝑀𝑒𝑑𝑖𝑎𝑛𝑎) (1,5798 − 1,581)


𝑆𝐾 = 3 =3 = −𝟎, 𝟎𝟕𝟐
𝑆 0,05
𝑆𝐾 < 0 La asimetría es negativa. La distribución es sesgada a la izquierda en este caso,
𝑥̅ < 𝑚𝑒𝑑𝑖𝑎𝑛𝑎.
𝑘
1 𝑥̇ 𝑖 − 𝑥̅ 4 1
𝛾2 = [( ) ∑ 𝑓𝑖 ( ) ] − 3 = [( ) 106,0515] − 3 = −𝟎, 𝟖𝟕𝟗
𝑛 𝑆 50
𝑖=1

𝛾2 < 0 entonces se trata de una Curva platicúrtica

10

También podría gustarte