Está en la página 1de 12

Cálculo y EstadísTICa. Primer Semestre.

EstadísTICa
Curso Primero
Graduado en Geomática y Topografía
Escuela Técnica Superior de Ingenieros en Topografía, Geodesia y Cartografía.
Universidad Politécnica de Madrid

Capítulo I
Ejercicios resueltos

ESTADÍSTICA DESCRIPTIVA

Manuel Barrero Ripoll. Mª Ángeles Castejón Solanas.


Mª Luisa Casado Fuente. Luis Sebastián Lorente.

Departamento de Ingeniería Topográfica y Cartografía


Universidad Politécnica de Madrid
2 Ejercicios resueltos
ESTADÍSTICA DESCRIPTIVA

Ejercicio 1. Se ha medido dieciséis veces la longitud en metros que separa dos puntos,
Los resultados obtenidos se muestran en la siguiente tabla 1.1:

13,404 13,443 13,445 13,447 13,449 13,450 13,453 13,455


13,457 13,460 13,460 13,465 13,455 13,453 13,445 13,455
Tabla 1.1

Calcular la moda, la mediana, los cuartiles y el percentil 90.


a) Para realizar este apartado, ordenamos los datos utilizando la tabla de distribución de
frecuencias absolutas acumuladas. (Tabla 1.2).

La moda es el valor de máxima frecuencia. La distancia 13.455 se


xi Ni
repite tres veces y es la distancia de mayor frecuencia, por tanto
13.404 1
13.443 2
M0=13.455 metros s
13.445 4
13.447 5
n
13.449 6 Por ser es un valor entero, la mediana (M) es el valor medio de las
13.450 7 2
n n
13,453 9 observaciones que ocupen los lugares = 8 y + 1 = 9 , de modo que
13.455 12 2 2
13.457 13
13.453 + 13.453
13.460 15 -M= =13.453 metros s
2
13.465 16
Tabla 1.2 n
Ya que
es un valor entero, el primer cuartil Q1 es el valor medio de
4
n n
los valores situados entre el cuarto y el quinto dato, = 4 y + 1 = 5 , así pues,
4 4

13.445 + 13.447
- Q1 = P25 = = 13.446 metros s
2

El 75 % del total de las observaciones es 12, el tercer cuartil Q3 estará entre los valores que
n n
ocupan los lugares 3 = 12 y 3 + 1 = 13 , es decir,
4 4

13.455 + 13.457
- Q3= P75 = = 13.456 metros s
2

Los nueve décimos de 16 es 14.4, por tanto el percentil 90 ocupará el lugar 15,

D9=P90 = 13,460 metros s

manuel.barrero@topografía.upm.es
3-I
A continuación exponemos el procedimiento para calcular los parámetros anteriores utilizando
las funciones específicas de las que EXCEL dispone para ello.

Para nuestro ejemplo supondremos que los valores están situados en el rango de datos A2:A17
y escribiremos en la columna E las funciones de Excel como se muestran en la columna G de
la figura 1.1:

Figura 1.1

lu_seb@topografia.upm.es
4 Ejercicios resueltos
ESTADÍSTICA DESCRIPTIVA

Ejercicio 2. De los datos del ejercicio anterior, calcular: la media, varianza, desviación
típica, cuasivarianza, desviación típica de la muestra y los coeficientes de asimetría de
Pearson, de Fisher y de apuntamiento.

Para calcular los parámetros pedidos necesitamos hallar los momentos no centrales hasta el
orden cuarto. Para ello utilizamos una tabla como la que se muestra a continuación:

( ) ( ) ( )
2 3 4
xi ni ni xi xi − X ni xi − X ni xi − X ni xi − X

13.404 1 13.404 -0.045750 0.00209 -0.000096 0.000004


13.443 1 13.443 -0.006750 0.00005 0.000000 0.000000
13.445 2 26.890 -0.004750 0.00005 0.000000 0.000000
13.447 1 13.447 -0.002750 0.00001 0.000000 0.000000
13.449 1 13.449 -0.000750 0.00000 0.000000 0.000000
13.450 1 13.450 0.000250 0.00000 0.000000 0.000000
13.453 2 26.906 0.003250 0.00002 0.000000 0.000000
13.455 3 40.365 0.005250 0.00008 0.000000 0.000000
13.457 1 13.457 0.007250 0.00005 0.000000 0.000000
13.460 2 26.920 0.010250 0.00021 0.000002 0.000000
13.465 1 13.465 0.015250 0.00023 0.000004 0.000000
Sumas 16 215.196 0.00279 -0.000090 0.000004
Tabla 2.1

n i x i 215.196
Media aritmética: X=∑ = Media = 13.4498 metros s
n 16

∑ n (x )
2
i i −X 0.00279
Varianza: σ2 = = = 0.00019
n 16

Varianza = 0.00019 7

Desviación típica: σ = Varianza = 0.00017 ≈ 0.01321

Desviación típica = 0.01321 1

∑ n (x )
2
n 2 i i −X 0.002791
Cuasivarianza o varianza muestral: S2 = σ = = = 0.00018
n −1 n −1 15

Cuasivarianza = 0.00018 8

manuel.barrero@topografía.upm.es
5-I
∑n (x )
2
n i i −X 0.00279
Desviación típica muestral: S= σ= = ≈ 0.01364
n −1 n −1 15

Desviación típica muestral = 0.01364 8

X − Mo 13.44975 − 13.455
Coeficiente de asimetría de Pearson: As = = ≈ −0.39743
σ 0.01321

Coeficiente de asimetría de Pearson As=-0.39743 3

−0.000090
1
(
∑ ni xi − X )
3

Coeficiente de asimetría de Fisher: g1 = n = 16 = −2.5047


σ3 0.013213

Coeficiente de asimetría de Fisher g1=-2.504 7

1
(
∑ ni xi − X ) 0.000004
4

Coeficiente de apuntamiento: g2 = n −3 = 16 − 3 = 5.65051


σ4 0.013214

Coeficiente de apuntamiento g2 = 5.6505 1

En la figura 2.2 exponemos el procedimiento para calcular los parámetros anteriores utilizando
algunas de las funciones específicas
de las que EXCEL dispone.

Para terminar este apartado,


advertimos que algunas fórmulas
empleadas por EXCEL pueden
producir resultados distintos que
con las utilizadas en clase. Por
ejemplo los coeficientes de
asimetría y apuntamiento de Fisher
producen resultados distintos, ello
es debido a que nosotros
calculamos los coeficientes de
asimetría y curtosis de la población
o del conjunto de datos, mientras
que EXCEL calcula los estimadores
o valores muestrales.

lu_seb@topografia.upm.es
6 Ejercicios resueltos
Ejercicio 4 Dada la distribución de frecuencias absolutas mostrada en la tabla 4.1:
Intervalos 10 - 15 15 - 20 20 - 25 25 - 30 30 - 35 35 - 40 40 - 45 45 - 50
ni 48 60 80 30 13 10 6 3
Tabla 4.1

Calcular la moda, mediana, cuartiles y el percentil 10.


En este caso los datos están agrupados en intervalos, así pues, para el cálculo de los
parámetros pedidos, formamos la tabla de distribución de frecuencias y procedemos de la
forma siguiente:
Marca de Frecuencia Moda:
Intervalo Frecuencia ni El intervalo modal es [20, 25) y
clase xi Ni
10-15 12.5 48 48 tomamos como moda, M0, el punto
medio del intervalo.
15-20 17.5 60 108
20-25 22.5 80 188
M0 =22.5 5
25-30 27.5 30 218
30-35 32.5 13 231 Mediana: El valor de n/2 es 125,
35-40 37.5 10 241 por tanto, el intervalo mediano es
40-45 42.5 6 247 [20, 25) y el valor de la mediana
45-50 47.5 3 250
Tabla 4.2
M = 20 +
(125 − 108) 5 = 21.06
80

n
Primer cuartil: El valor de es 62.5, por tanto, el primer cuartil estará en el
4
intervalo [15, 20) y su valor es:

Q1 = 15 +
( 62.5 − 48) 5 = 16.21
60

3
n es 187.5, así pues el tercer cuartil Q3 está en el intervalo [20, 25) y su valor es:
4

Q3 = 20 +
(187.5 − 108) 5 = 24.97
80

El percentil 10 estará en el intervalo [10, 15) y su valor es:

P10 = 10 +
( 25 − 0 ) 5 = 12.60
48

lu_seb@topografia.upm.es
8 Ejercicios resueltos
ESTADÍSTICA DESCRIPTIVA

Ejercicio 5. Representar el histograma de frecuencias y los polígonos de frecuencias


absolutas y absolutas acumuladas del ejercicio 4.

Para representar el histograma y el polígono de frecuencias absolutas acumuladas, utilizamos


la tabla 5.1 de distribución de frecuencias absolutas ni.

Histograma de frecuencias absolutas

100

80
Intervalos ni
60
10-15 48
40
15-20 60
20
20-25 80
0
25-30 30 10 - 15 - 20 - 25 - 30 - 35 - 40 - 45 - 50

30-35 13 Poligono de fre cue ncias absolutas

35-40 10 100
80
40-45 6
60
45-50 3
40
Tabla 5.1
20
0
7.5 12.5 17.5 22.5 27.5 32.5 37.5 42.5 47.5 52.5

Figura 5.1

Para representar el polígono de frecuencias absolutas acumuladas, utilizamos la distribución


de frecuencias absolutas acumuladas Ni.

Intervalos Ni Polígono de fre cue ncias absolutas acumuladas


10 - 15 48 300
15 - 20 108 250
20 - 25 188 200
25 - 30 218 150
30 - 35 231 100
35 - 40 241 50
40 - 45 247
0
45 - 50 250 10 15 20 25 30 35 40 45 50
Tabla 5.2

manuel.barrero@topografía.upm.es
9-I
Ejercicio 6. Del ejercicio 4 hallar la media, varianza, desviación típica, cuasivarianza,
desviación típica muestral y los coeficientes de asimetría y apuntamiento de Fisher.

Para el cálculo de los parámetros estadísticos pedidos, utilizamos la tabla 6.1 y las fórmulas de
la tabla 6.1.

Marca de Frecuencia
(x − X) ( ) ( ) ( )
2 3 4
Intervalos ni xi i ni xi − X ni xi − X ni xi − X
clase xi absoluta ni
10-15 12.5 48 600 -9.38 4223.25 -39614.10 371580.22
15-20 17.5 60 1050 -4.38 1151.06 -5041.66 22082.47
20-25 22.5 80 1800 0.62 30.75 19.07 11.82
25-30 27.5 30 825 5.62 947.53 5325.13 29927.23
30-35 32.5 13 422.5 10.62 1466.20 15571.01 165364.17
35-40 37.5 10 375 15.62 2439.84 38110.36 595283.87
40-45 42.5 6 255 20.62 2551.11 52603.81 1084690.64
45-50 47.5 3 142.5 25.62 1969.15 50449.70 1292521.44
250 5470 64.96 14778.90 117423.34 3561461.88
Tabla 6.1

Parámetro estadístico. Fórmula. Valor.

Media X=
∑n x i i
=
5470
=21.88
n 250

∑ n (x )
2

Varianza i i −X 14778.90
σ2 = = =59.11
n 250
Desviación típica σ = σ2 = 7.69

∑ n (x )
2

Cuasivarianza i i −X n 2
S2
= = σ =59.34
n −1 n −1
n 2
Desviación típica muestral S = S2 = σ = 7.7
n −1
1
∑ (
117423.34
)
3
ni x − X
Coef. de asimetría de Fisher 250
g1 = n = =1.03
σ3 454.55
1
∑ ( 3561461.88
)
4
ni x − X
Coeficiente de apuntamiento 250
g2 = n −3 = − 3 =1.06
σ4 59.112
Tabla 6.2

lu_seb@topografia.upm.es

10 Ejercicios resueltos
ESTADÍSTICA DESCRIPTIVA

Ejercicio 7. Los siguientes valores corresponden a la temperatura máxima diaria (ºF) de


36 días, obtenidos a las 14 horas en una cierta estación meteorológica.

84, 49, 61, 40, 83, 67, 45, 66, 70, 69, 80, 58, 68, 60, 67, 72, 75, 76,
73, 70, 63, 70, 78, 52, 67, 53, 67, 75, 61, 70, 81, 76, 79, 58, 57, 21.

a) Calcular: media, desviación típica muestral, cuartiles superior e inferior y la


mediana.
b) Estudiar la existencia de datos atípicos. Si existe algún valor atípico omitir, dicho
valor y calcular de nuevo el apartado a).
c) Con los datos de los apartados a y b construir un gráfico con el diagrama de caja, de
ambos apartados.
x i n i Ni n i xi n i xi2
Para el cálculo del apartado a) utilizaremos la tabla 7.1. 21 1 1 21 441
40 1 2 40 1600
2361 45 1 3 45 2025
a) - Media: X = ≈ 65.58
36 49 1 4 49 2401
160811 2 52 1 5 52 2704
- Varianza de la población: σ 2 = − X ≈ 165,80 53 1 6 53 2809
36
57 1 7 57 3249
- Desviación típica de la población:
58 2 9 116 6728
σ = σ2 = 165,8 ≈ 12.88 60 1 10 60 3600
61 2 12 122 7442
- Varianza muestral o cuasivarianza:
63 1 13 63 3969
36
S2 = 165,8 ≈ 170.54 66 1 14 66 4356
35
67 4 18 268 17956
- Desviación típica muestral: S = S2 = 170.536 ≈ 13.06 . 68 1 19 68 4624
n n 58 + 60 69 1 20 69 4761
- Primer cuartil: = 9 y + 1=10 ⇒ Q1 = = 59 .
4 4 2 70 4 24 280 19600
3 3 75 + 75 72 1 25 72 5184
- Tercer cuartil: n = 27 y n + 1 = 28 ⇒ Q3 = = 75 . 73 1 26 73 5329
4 4 2
75 2 28 150 11250
2 2 67 + 68
- Mediana: n = 18 y n + 1 = 19 ⇒ M = = 67.5 . 76 2 30 152 11552
4 4 2 78 1 31 78 6084
79 1 32 79 6241
b) El rango intercuatílico y las barreras del gráfico son: 80 1 33 80 6400
81 1 34 81 6561
LS =mín[ xmáx, Q3+1.5·16]=mín[84, 99]=84.
83 1 35 83 6889
IQR=75-59=16
84 1 36 84 7056
LI =máx[ xmin, Q1-1.5·16]=máx[21, 35]=35.
2361 160811
Tabla 7.1

El valor x=21 ºF es una temperatura atípica del conjunto de datos.

manuel.barrero@topografía.upm.es
11 - I
c) Si omitimos la observación 21ºF y procedemos de forma análoga al apartado a) se tiene:

xi ni Ni n i xi n i x i2 - Media: X =
2340
= 66.86
40 1 1 40 1600 35
160370 2
45 1 2 45 2025 - Varianza de la población: σ 2 = − X = 112.12
49 1 3 49 2401 35
35
52 1 4 52 2704 - Varianza muestral: S2 = 112.122 = 115.42
53 1 5 53 2809 34
57 1 6 57 3249 - Desviación típica de la población: σ = σ 2 = 10.59
58 2 8 116 6728
- Desviación típica de la muestra: S = S2 = 10.74 .
60 1 9 60 3600
61 2 11 122 7442 n
- Primer cuartil:= 8.75 ⇒ Q1 = 60
63 1 12 63 3969 4
66 1 13 66 4356 3
- Tercer cuartil: n = 26.25 ⇒ Q3 = 75
67 4 17 268 17956 4
68 1 18 68 4624 2
- Mediana: n = 17.5 ⇒ M = 68
69 1 19 69 4761 4
70 4 23 280 19600 Los valores del rango intercuartílco y de las barreras son:
72 1 24 72 5184
73 1 25 73 5329 Rango intercuartílico: IQR=75-59=15.
75 2 27 150 11250
76 2 29 152 11552 LI =máx[ xmin, Q1-1.5·16] = máx[40, 37.5]=40.
78 1 30 78 6084
79 1 31 79 6241 LS =mín[ xmáx, Q3+1.5·15] = mín[84, 97.5] = 84.
80 1 32 80 6400
Con los datos calculados anteriormente, obtenemos
81 1 33 81 6561
el diagrama de cajas de ambas series de datos
83 1 34 83 6889
84 1 35 84 7056 Realizado el diagrama de cajas en ambos casos, una
2340 160370 lectura de este gráfico sería que la dispersión y la
Tabla 7.2

asimetría son mayores en el


5
4,5
apartado a) que en el apartado
4 b). En a) la caja es algo más
3,5 ancha y, por tanto, mayor la
3 dispersión. También
2,5
observamos que en b) la
2
1,5
media está más próxima a la
1 mediana que en a) y por ello
0,5 es más simétrica y más
0 significativa en b) al ser
0 20 40 60 80 100 menor la dispersión.

lu_seb@topografia.upm.es
12 Ejercicios resueltos

También podría gustarte