Está en la página 1de 12

Clculo y EstadsTICa. Primer Semestre.

EstadsTICa
Curso Primero
Graduado en Geomtica y Topografa
Escuela Tcnica Superior de Ingenieros en Topografa, Geodesia y Cartografa.
Universidad Politcnica de Madrid

Captulo I
Ejercicios resueltos

ESTADSTICA DESCRIPTIVA

Manuel Barrero Ripoll. M ngeles Castejn Solanas.


M Luisa Casado Fuente. Luis Sebastin Lorente.

Departamento de Ingeniera Topogrfica y Cartografa


Universidad Politcnica de Madrid
2 Ejercicios resueltos
ESTADSTICA DESCRIPTIVA

Ejercicio 1. Se ha medido diecisis veces la longitud en metros que separa dos puntos,
Los resultados obtenidos se muestran en la siguiente tabla 1.1:

13,404 13,443 13,445 13,447 13,449 13,450 13,453 13,455


13,457 13,460 13,460 13,465 13,455 13,453 13,445 13,455
Tabla 1.1

Calcular la moda, la mediana, los cuartiles y el percentil 90.


a) Para realizar este apartado, ordenamos los datos utilizando la tabla de distribucin de
frecuencias absolutas acumuladas. (Tabla 1.2).

La moda es el valor de mxima frecuencia. La distancia 13.455 se


xi Ni
repite tres veces y es la distancia de mayor frecuencia, por tanto
13.404 1
13.443 2
M0=13.455 metros s
13.445 4
13.447 5
n
13.449 6 Por ser es un valor entero, la mediana (M) es el valor medio de las
13.450 7 2
n n
13,453 9 observaciones que ocupen los lugares = 8 y + 1 = 9 , de modo que
13.455 12 2 2
13.457 13
13.453 + 13.453
13.460 15 -M= =13.453 metros s
2
13.465 16
Tabla 1.2 n
Ya que
es un valor entero, el primer cuartil Q1 es el valor medio de
4
n n
los valores situados entre el cuarto y el quinto dato, = 4 y + 1 = 5 , as pues,
4 4

13.445 + 13.447
- Q1 = P25 = = 13.446 metros s
2

El 75 % del total de las observaciones es 12, el tercer cuartil Q3 estar entre los valores que
n n
ocupan los lugares 3 = 12 y 3 + 1 = 13 , es decir,
4 4

13.455 + 13.457
- Q3= P75 = = 13.456 metros s
2

Los nueve dcimos de 16 es 14.4, por tanto el percentil 90 ocupar el lugar 15,

D9=P90 = 13,460 metros s

manuel.barrero@topografa.upm.es
3-I
A continuacin exponemos el procedimiento para calcular los parmetros anteriores utilizando
las funciones especficas de las que EXCEL dispone para ello.

Para nuestro ejemplo supondremos que los valores estn situados en el rango de datos A2:A17
y escribiremos en la columna E las funciones de Excel como se muestran en la columna G de
la figura 1.1:

Figura 1.1

lu_seb@topografia.upm.es
4 Ejercicios resueltos
ESTADSTICA DESCRIPTIVA

Ejercicio 2. De los datos del ejercicio anterior, calcular: la media, varianza, desviacin
tpica, cuasivarianza, desviacin tpica de la muestra y los coeficientes de asimetra de
Pearson, de Fisher y de apuntamiento.

Para calcular los parmetros pedidos necesitamos hallar los momentos no centrales hasta el
orden cuarto. Para ello utilizamos una tabla como la que se muestra a continuacin:

( ) ( ) ( )
2 3 4
xi ni ni xi xi X ni xi X ni xi X ni xi X

13.404 1 13.404 -0.045750 0.00209 -0.000096 0.000004


13.443 1 13.443 -0.006750 0.00005 0.000000 0.000000
13.445 2 26.890 -0.004750 0.00005 0.000000 0.000000
13.447 1 13.447 -0.002750 0.00001 0.000000 0.000000
13.449 1 13.449 -0.000750 0.00000 0.000000 0.000000
13.450 1 13.450 0.000250 0.00000 0.000000 0.000000
13.453 2 26.906 0.003250 0.00002 0.000000 0.000000
13.455 3 40.365 0.005250 0.00008 0.000000 0.000000
13.457 1 13.457 0.007250 0.00005 0.000000 0.000000
13.460 2 26.920 0.010250 0.00021 0.000002 0.000000
13.465 1 13.465 0.015250 0.00023 0.000004 0.000000
Sumas 16 215.196 0.00279 -0.000090 0.000004
Tabla 2.1

n i x i 215.196
Media aritmtica: X= = Media = 13.4498 metros s
n 16

n (x )
2
i i X 0.00279
Varianza: 2 = = = 0.00019
n 16

Varianza = 0.00019 7

Desviacin tpica: = Varianza = 0.00017 0.01321

Desviacin tpica = 0.01321 1

n (x )
2
n 2 i i X 0.002791
Cuasivarianza o varianza muestral: S2 = = = = 0.00018
n 1 n 1 15

Cuasivarianza = 0.00018 8

manuel.barrero@topografa.upm.es
5-I
n (x )
2
n i i X 0.00279
Desviacin tpica muestral: S= = = 0.01364
n 1 n 1 15

Desviacin tpica muestral = 0.01364 8

X Mo 13.44975 13.455
Coeficiente de asimetra de Pearson: As = = 0.39743
0.01321

Coeficiente de asimetra de Pearson As=-0.39743 3

0.000090
1
(
ni xi X )
3

Coeficiente de asimetra de Fisher: g1 = n = 16 = 2.5047


3 0.013213

Coeficiente de asimetra de Fisher g1=-2.504 7

1
(
ni xi X ) 0.000004
4

Coeficiente de apuntamiento: g2 = n 3 = 16 3 = 5.65051


4 0.013214

Coeficiente de apuntamiento g2 = 5.6505 1

En la figura 2.2 exponemos el procedimiento para calcular los parmetros anteriores utilizando
algunas de las funciones especficas
de las que EXCEL dispone.

Para terminar este apartado,


advertimos que algunas frmulas
empleadas por EXCEL pueden
producir resultados distintos que
con las utilizadas en clase. Por
ejemplo los coeficientes de
asimetra y apuntamiento de Fisher
producen resultados distintos, ello
es debido a que nosotros
calculamos los coeficientes de
asimetra y curtosis de la poblacin
o del conjunto de datos, mientras
que EXCEL calcula los estimadores
o valores muestrales.

lu_seb@topografia.upm.es
6 Ejercicios resueltos
Ejercicio 4 Dada la distribucin de frecuencias absolutas mostrada en la tabla 4.1:
Intervalos 10 - 15 15 - 20 20 - 25 25 - 30 30 - 35 35 - 40 40 - 45 45 - 50
ni 48 60 80 30 13 10 6 3
Tabla 4.1

Calcular la moda, mediana, cuartiles y el percentil 10.


En este caso los datos estn agrupados en intervalos, as pues, para el clculo de los
parmetros pedidos, formamos la tabla de distribucin de frecuencias y procedemos de la
forma siguiente:
Marca de Frecuencia Moda:
Intervalo Frecuencia ni El intervalo modal es [20, 25) y
clase xi Ni
10-15 12.5 48 48 tomamos como moda, M0, el punto
medio del intervalo.
15-20 17.5 60 108
20-25 22.5 80 188
M0 =22.5 5
25-30 27.5 30 218
30-35 32.5 13 231 Mediana: El valor de n/2 es 125,
35-40 37.5 10 241 por tanto, el intervalo mediano es
40-45 42.5 6 247 [20, 25) y el valor de la mediana
45-50 47.5 3 250
Tabla 4.2
M = 20 +
(125 108) 5 = 21.06
80

n
Primer cuartil: El valor de es 62.5, por tanto, el primer cuartil estar en el
4
intervalo [15, 20) y su valor es:

Q1 = 15 +
( 62.5 48) 5 = 16.21
60

3
n es 187.5, as pues el tercer cuartil Q3 est en el intervalo [20, 25) y su valor es:
4

Q3 = 20 +
(187.5 108) 5 = 24.97
80

El percentil 10 estar en el intervalo [10, 15) y su valor es:

P10 = 10 +
( 25 0 ) 5 = 12.60
48

lu_seb@topografia.upm.es
8 Ejercicios resueltos
ESTADSTICA DESCRIPTIVA

Ejercicio 5. Representar el histograma de frecuencias y los polgonos de frecuencias


absolutas y absolutas acumuladas del ejercicio 4.

Para representar el histograma y el polgono de frecuencias absolutas acumuladas, utilizamos


la tabla 5.1 de distribucin de frecuencias absolutas ni.

Histograma de frecuencias absolutas

100

80
Intervalos ni
60
10-15 48
40
15-20 60
20
20-25 80
0
25-30 30 10 - 15 - 20 - 25 - 30 - 35 - 40 - 45 - 50

30-35 13 Poligono de fre cue ncias absolutas

35-40 10 100
80
40-45 6
60
45-50 3
40
Tabla 5.1
20
0
7.5 12.5 17.5 22.5 27.5 32.5 37.5 42.5 47.5 52.5

Figura 5.1

Para representar el polgono de frecuencias absolutas acumuladas, utilizamos la distribucin


de frecuencias absolutas acumuladas Ni.

Intervalos Ni Polgono de fre cue ncias absolutas acumuladas


10 - 15 48 300
15 - 20 108 250
20 - 25 188 200
25 - 30 218 150
30 - 35 231 100
35 - 40 241 50
40 - 45 247
0
45 - 50 250 10 15 20 25 30 35 40 45 50
Tabla 5.2

manuel.barrero@topografa.upm.es
9-I
Ejercicio 6. Del ejercicio 4 hallar la media, varianza, desviacin tpica, cuasivarianza,
desviacin tpica muestral y los coeficientes de asimetra y apuntamiento de Fisher.

Para el clculo de los parmetros estadsticos pedidos, utilizamos la tabla 6.1 y las frmulas de
la tabla 6.1.

Marca de Frecuencia
(x X) ( ) ( ) ( )
2 3 4
Intervalos ni xi i ni xi X ni xi X ni xi X
clase xi absoluta ni
10-15 12.5 48 600 -9.38 4223.25 -39614.10 371580.22
15-20 17.5 60 1050 -4.38 1151.06 -5041.66 22082.47
20-25 22.5 80 1800 0.62 30.75 19.07 11.82
25-30 27.5 30 825 5.62 947.53 5325.13 29927.23
30-35 32.5 13 422.5 10.62 1466.20 15571.01 165364.17
35-40 37.5 10 375 15.62 2439.84 38110.36 595283.87
40-45 42.5 6 255 20.62 2551.11 52603.81 1084690.64
45-50 47.5 3 142.5 25.62 1969.15 50449.70 1292521.44
250 5470 64.96 14778.90 117423.34 3561461.88
Tabla 6.1

Parmetro estadstico. Frmula. Valor.

Media X=
n x i i
=
5470
=21.88
n 250

n (x )
2

Varianza i i X 14778.90
2 = = =59.11
n 250
Desviacin tpica = 2 = 7.69

n (x )
2

Cuasivarianza i i X n 2
S2
= = =59.34
n 1 n 1
n 2
Desviacin tpica muestral S = S2 = = 7.7
n 1
1
(
117423.34
)
3
ni x X
Coef. de asimetra de Fisher 250
g1 = n = =1.03
3 454.55
1
( 3561461.88
)
4
ni x X
Coeficiente de apuntamiento 250
g2 = n 3 = 3 =1.06
4 59.112
Tabla 6.2

lu_seb@topografia.upm.es

10 Ejercicios resueltos
ESTADSTICA DESCRIPTIVA

Ejercicio 7. Los siguientes valores corresponden a la temperatura mxima diaria (F) de


36 das, obtenidos a las 14 horas en una cierta estacin meteorolgica.

84, 49, 61, 40, 83, 67, 45, 66, 70, 69, 80, 58, 68, 60, 67, 72, 75, 76,
73, 70, 63, 70, 78, 52, 67, 53, 67, 75, 61, 70, 81, 76, 79, 58, 57, 21.

a) Calcular: media, desviacin tpica muestral, cuartiles superior e inferior y la


mediana.
b) Estudiar la existencia de datos atpicos. Si existe algn valor atpico omitir, dicho
valor y calcular de nuevo el apartado a).
c) Con los datos de los apartados a y b construir un grfico con el diagrama de caja, de
ambos apartados.
x i n i Ni n i xi n i xi2
Para el clculo del apartado a) utilizaremos la tabla 7.1. 21 1 1 21 441
40 1 2 40 1600
2361 45 1 3 45 2025
a) - Media: X = 65.58
36 49 1 4 49 2401
160811 2 52 1 5 52 2704
- Varianza de la poblacin: 2 = X 165,80 53 1 6 53 2809
36
57 1 7 57 3249
- Desviacin tpica de la poblacin:
58 2 9 116 6728
= 2 = 165,8 12.88 60 1 10 60 3600
61 2 12 122 7442
- Varianza muestral o cuasivarianza:
63 1 13 63 3969
36
S2 = 165,8 170.54 66 1 14 66 4356
35
67 4 18 268 17956
- Desviacin tpica muestral: S = S2 = 170.536 13.06 . 68 1 19 68 4624
n n 58 + 60 69 1 20 69 4761
- Primer cuartil: = 9 y + 1=10 Q1 = = 59 .
4 4 2 70 4 24 280 19600
3 3 75 + 75 72 1 25 72 5184
- Tercer cuartil: n = 27 y n + 1 = 28 Q3 = = 75 . 73 1 26 73 5329
4 4 2
75 2 28 150 11250
2 2 67 + 68
- Mediana: n = 18 y n + 1 = 19 M = = 67.5 . 76 2 30 152 11552
4 4 2 78 1 31 78 6084
79 1 32 79 6241
b) El rango intercuatlico y las barreras del grfico son: 80 1 33 80 6400
81 1 34 81 6561
LS =mn[ xmx, Q3+1.516]=mn[84, 99]=84.
83 1 35 83 6889
IQR=75-59=16
84 1 36 84 7056
LI =mx[ xmin, Q1-1.516]=mx[21, 35]=35.
2361 160811
Tabla 7.1

El valor x=21 F es una temperatura atpica del conjunto de datos.

manuel.barrero@topografa.upm.es
11 - I
c) Si omitimos la observacin 21F y procedemos de forma anloga al apartado a) se tiene:

xi ni Ni n i xi n i x i2 - Media: X =
2340
= 66.86
40 1 1 40 1600 35
160370 2
45 1 2 45 2025 - Varianza de la poblacin: 2 = X = 112.12
49 1 3 49 2401 35
35
52 1 4 52 2704 - Varianza muestral: S2 = 112.122 = 115.42
53 1 5 53 2809 34
57 1 6 57 3249 - Desviacin tpica de la poblacin: = 2 = 10.59
58 2 8 116 6728
- Desviacin tpica de la muestra: S = S2 = 10.74 .
60 1 9 60 3600
61 2 11 122 7442 n
- Primer cuartil:= 8.75 Q1 = 60
63 1 12 63 3969 4
66 1 13 66 4356 3
- Tercer cuartil: n = 26.25 Q3 = 75
67 4 17 268 17956 4
68 1 18 68 4624 2
- Mediana: n = 17.5 M = 68
69 1 19 69 4761 4
70 4 23 280 19600 Los valores del rango intercuartlco y de las barreras son:
72 1 24 72 5184
73 1 25 73 5329 Rango intercuartlico: IQR=75-59=15.
75 2 27 150 11250
76 2 29 152 11552 LI =mx[ xmin, Q1-1.516] = mx[40, 37.5]=40.
78 1 30 78 6084
79 1 31 79 6241 LS =mn[ xmx, Q3+1.515] = mn[84, 97.5] = 84.
80 1 32 80 6400
Con los datos calculados anteriormente, obtenemos
81 1 33 81 6561
el diagrama de cajas de ambas series de datos
83 1 34 83 6889
84 1 35 84 7056 Realizado el diagrama de cajas en ambos casos, una
2340 160370 lectura de este grfico sera que la dispersin y la
Tabla 7.2

asimetra son mayores en el


5
4,5
apartado a) que en el apartado
4 b). En a) la caja es algo ms
3,5 ancha y, por tanto, mayor la
3 dispersin. Tambin
2,5
observamos que en b) la
2
1,5
media est ms prxima a la
1 mediana que en a) y por ello
0,5 es ms simtrica y ms
0 significativa en b) al ser
0 20 40 60 80 100 menor la dispersin.

lu_seb@topografia.upm.es
12 Ejercicios resueltos

También podría gustarte