Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1. Los datos que se dan a continuacin corresponden a los pesos en Kg. de ochenta
personas:
(a) Obtngase una distribucin de datos en intervalos de amplitud 5, siendo el primer
SOLUCIN:
(a) Como se trata de efectuar una distribucin de datos agrupados, debemos obtener primero los
intervalos correspondientes, situando los datos en sus lugares respectivos:
Li-1 - Li
[50;55)
[55; 60)
[60; 65)
[65;70)
[70; 75)
[75; 80)
[80; 85]
ni
Ni
2
7
17
30
14
2
9
26
56
70
7
3
77
80
80
26
100 = 32,5%
80
(c) El nmero de individuos con peso comprendido entre 70 y 85 Kg. es:
n5 + n6 + n7 = 14 + 7 + 3 = 24
lo que es equivalente a: N7 N4 = 80 56 = 24
1 2 3 4 5 6
5 7 9 6 7 6
SOLUCIN:
La tabla que se obtiene es la siguiente:
xi
ni
1
2
3
4
5
6
5
7
9
6
7
6
40
fi
Fi
0,125 0,125
0,175 0,300
0,225 0,525
0,15
0,675
0,175 0,85
0,15 1
1
3. Las edades de los empleados de una determinada empresa son las que aparecen en la
siguiente tabla:
N o empleados
Edad
Menos
Menos
Menos
Menos
Menos
de
de
de
de
de
25
35
45
55
65
22
70
121
157
184
SOLUCIN:
Es preciso obtener, en principio, la distribucin de frecuencias absolutas:
Li-1 - Li
ni
[18; 25)
[25; 35)
[35; 45)
[45; 55)
[55; 65]
22
48
51
36
27
184
N. de
empleados
Ms de 18
Ms de 25
Ms de 35
Ms de 45
Ms de 55
184
162
114
63
27
13 14 15 16 17 18 19 20 21 22
1
SOLUCIN:
8
7
6
5
4
Dias
3
2
1
0
13 14 15 16 17 18 19 20 21 22
ni
9
22
13
23
8
25
SOLUCIN:
(a) La tabla pedida es la siguiente:
(b)
xi
ni
fi
Ni
Ni
1
2
3
4
5
6
9
22
13
23
8
25
0,09
0,22
0,13
0,23
0,08
0,25
9
31
44
67
75
100
100
91
69
56
33
25
100
30
25
20
15
10
5
0
1
30
25
20
15
10
5
0
1
(c)
100
80
60
40
20
0
1
100
80
60
40
20
0
Li-1-Li
0-10
ni
22
10-20
20-30
30-40
40-50
50-60
60-70
26
92
86
74
27
12
SOLUCIN:
Como es una distribucin de datos agrupados, o de tipo III, cuyos intervalos tienen
amplitudes iguales (a = 10), su representacin grfica es el histograma siguiente, en
el que se han colocado como alturas las frecuencias absolutas:
100
80
60
Frecuencias
Absolutas
40
20
0
0 10 20 30 40 50 60 70
ni
1-3
3-7
7-8
8-10
10-13
13-20
3
29
35
26
6
1
(a) Constryase una tabla en la que aparezcan las marcas de clase, las frecuencias
SOLUCIN:
construir el histograma.
ni
Li-1-Li
[1;3)
[3;7)
[7; 8)
[8; 1)
[10;13)
[13;20]
3
29
35
26
6
1
xi
2
5
7,5
9
11,5
16,5
100
fi
0,03
0,29
0,35
0,26
0,06
0,01
Ni
3
32
67
93
99
100
Ni
100
97
68
33
7
1
ai
2
4
1
2
3
7
hi
1,5
7,25
35
13
2
0,143
(b) Con la primera y ltima columna de la tabla anterior se obtienen el siguiente histograma
y su polgono de frecuencias:
35
30
25
20
hi
15
10
5
0
9 11 13 15 17 19
40
35
30
25
20
15
10
5
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
SOLUCIN:
Efectuando el recuento de los datos se obtiene:
xi
ni
21
15
1
50
0 1 2 3 4
N de familias(ni) 5 6 8 4 2 25
SOLUCIN:
Las cuatro distribuciones de frecuencia sern:
X i ni
fi
Ni
Fi
0'20 5
0'24 11 0'44
0'32 19 0'76
0'16 23 0'92
0'08 25 1
25 1
0'20
a=
x
i 1
ni
0 5 + 1 6 + 2 8 + 3 4 + 4 2 42
=
= 1,68
25
25
vp =
1,19062
100 = 70,869
1,68
Ap =
1,68 2
= 0,2688
1,1906
SOLUCIN:
Ahora realizamos las cuatro distribuciones de frecuencias:
Xi
ni
fi
Ni Fi
0,06 3 0,375 3 0,375
0,07 1 0,125 4 0,500
0,16 1 0,125 5 0,625
0,17 1 0,125 6 0,750
0,20 1 0,125 7 0,875
0,22 1 0,125 8
1
__________________________
Total 8
1
Calculamos la media aritmtica:
a=
ni
1
= 0,125.
8
Me =
x j 1 + x j
2
0,07 + 0,16
= 0,115.
2
SOLUCIN:
Como sabemos el segundo cuartil es igual a la mediana:
P2 4 = M e = 0,115.
Para determinar los otros dos cuartiles p1/4 Y p3/4, debemos establecer primero las desigualdades:
N j 1 <
r
n < N j
k
1
8 = 2 < 3 = N1
4
Es decir menor que la primera frecuencia absoluta acumulada, por tanto:
P1 4 = 0,06.
Ahora calculamos el tercer cuartil:
N4 = 6 =
p3 4 =
3
8 = 6 < 7 = N5
4
0,17 + 0,2
= 0,185.
2
SOLUCIN:
Varianza:
S2 = [ f x 2 [ ( f x ) 2 / N ] ] / (N 1 )
S2 = [ 376272 [ ( 5788 ) 2 / 90 ] ] / (90 1 )
S2 = 45,402.
Desviacin tpica:
( Raiz cuadrada de la varianza.)
S = 6,74
13. Para los siguientes datos, calcular:
A) El intervalo de intercuartil.
B) La desviacin del cuartil.
97 72 87 57 39 81 70 84 93 79
84 81 65 97 75 72 84 96 94 77
x2
2704
3136
3600
4096
4624
5184
5776
f. x 2
18928
31360
57600
81920
83232
57024
46208
376272
SOLUCIN:
A)
Q3 Q1
= IQ
2
15
RQ =
2
= RQ = 7,5
RQ =
B)
IQ = Q 3 Q1
= 87 72
= IQ = 15
14. Unos grandes almacenes disponen de un aparcamiento para sus clientes. Los
siguientes datos que se refieren al nmero de horas que permanecen en el
aparcamiento una serie de coches:
4 5 5 1 7 4 4 3 6 5
3 2 4 4 3 6 6 4 5 5
6 4 3 3 4 5 4 3 2 4
5 2 4 7 3 6 2 2 4 1
2 1 3 7 3 1 5 1 7 2
4 4 2 4 5 3 6 3 5 3
Se pide:
A- Obtener la tabla de frecuencias para ese conjunto de datos. Interpretar
la tabla.
B- Obtener la tabla de frecuencias ascendente y descendente.
C- Determinar e interpretar la tercera cuartilla y el centil del 42%.
D- Calcular el tiempo medio de permanencia de los coches en el
aparcamiento. Interpretar el resultado y los elementos que intervienen.
SOLUCIN:
A- El primer paso para construir la tabla de frecuencias es determinar el nmero
de valores diferentes en observacin, k, que en este caso es 7. A continuacin
podemos ver que esos 7 valores van desde el 1, x 1 , al 7 7 , y podemos
determinar la frecuencia absoluta y relativa de cada uno de esos valores. Una vez
calculadas las frecuencias resulta la siguiente tabla de frecuencias.
x1 (n horas)
1
2
3 4
5
6
7
ni (n coches)
5
8
12 15 10
6
4
f i (%coches) 8.33 13.33 20 25 16.67 10 6.67
En esta tabla aparecen por filas el nmero de horas que permanecen los coches en
el aparcamiento, el nmero de coches que han aparcado durante cada nmero de
horas y la proporcin de coches en % que han estado aparcados durante cada
nmero de horas. Una de las columnas, por ejemplo la cuarta, nos dice que 15
coches, que representa el 25% de los coches analizados, han estado aparcados
durante 4 horas en el aparcamiento.
B- La tabla de frecuencias ascendente es
xi (n horas)
13
25
40
50
56
60
(n _ coches _ acumulados)
j =1
i
j =1
xi (n horas)
60
55
47
35
20
10
(n coches _ acumulados)
j =i
7
j =i
x( 45) + x( 46 )
2
5+5
= 5 horas
2
___
X =
n
i =1
* xi
231
= 3.85 horas
60
X =
i =1
f * x = 3.85 horas
i
60.951 38.420
Se pide:
a- Construir una taba de frecuencias para esos datos tomando como
nmero de intervalos el que proporciona la frmula de Sturgess.
Interpretas la tabla.
b- Construir las tablas de frecuencias acumuladas ascendente y
descendente.
c- Dibujar el histograma de frecuencias relativas sin acumular y
acumulado.
d- Calcular las principales medidas de tendencia central e interpretarlas.
e- Obtener las medidas de dispersin ms importantes e interpretarlas.
SOLUCIN:
a- La frmula de Sturgess propone como nmero k de intervalos, para agrupar un
conjunto de N observaciones en intervalos.
k=1+ [3.3*log N]
En este caso N=100, luego k=7. ahora debemos propones el lmite inferior del
primer intervalo y el lmite superior del ltimo intervalo. Al ser el valor mnimo
4.3068 se propone 4 como lmite inferior del primer intervalo, y al ser 7
intervalos se propone como anchura 13 para cada uno de ellos, para que sea un
valor entero, con lo cual el lmite superior del ltimo intervalo es 95.
La tabla de frecuencias ser:
Intervalo _ I i
Frecuencia
absoluta _ ni
Frecuencia
relativa _ f i
Ii
ni
fi
19
.02
.02
.19
En esta tabla aparecen por filas los intervalos, junto con la frecuncia absoluta y la
frecuencia relativa. Por ejemplo la cuarta columna se puede interpretar diciendo
que el 27% de estos neumticos han recorrido entre 43000 y 5600 Km hasta que
se ha producido un pinchazo o reventn.
b- La tabla de frecuencias acumuladas ascendente sera:
Intervalos _ I i
i
n
j =1
23
50
79
93
100
Intervalos _ I i
k
n
j =1
98
96
77
50
21
Frecuencias relativas
Frecuencia
0,4
0,3
0,2
0,1
82
_9
2
69
_8
56
_6
9
43
_5
6
3
30
_4
17
_3
0
4_
17
Intervalo
Figura 1
_9
5
82
_8
2
69
_6
9
56
_5
6
43
_4
3
30
17
4_
_3
0
1,2
1
0,8
0,6
0,4
0,2
0
17
frecuencias acumuladas
Intervalo
Figura 2
d- Para calcular las medidas de tendencia central trabajamos con la tabla de
frecuencias del apartado a. resulta que la media aritmtica es
___
X = 55870 Km
Se interpreta diciendo que son los 100 neumticos analizados se han recorrido
5587000 de Km antes de un pinchazo o reventn.
La mediana ser
Me = 56000 Km
Significa que la mitad de los neumticos han recorrido a lo sumo 56000 Km
antes de un pinchazo o reventn.
La moda ser
Mo = 56 + 13*
2
= 57529 Km
2 + 15
g=
s
* 100% = 30.24
x
V1 =
55.87 57.529
= 0.09817
16.899
V2 =
55.87 56.00
= 0.02308
16.899
__ 3
m3 = f i ( xi x ) = 421.39015
i =i
m4 =
i =1
Luego
__
f (x x )
i
= 234594.7408
g2 =
m4
3 = 0.12343
s4
7
= 46.37
27
Muestra n de _ observaciones
1
600
2
400
__
__
x y sx
5 12 2
7 10 3
sy
3
4
rxy
0.6
0.7
Se pide:
a- Recta de regresin de Y sobre X en cada muestra.
b- Si consideramos la muestra que resulta de agrupar las dos muestras en
una sola de tamao 1000, obtener el nuevo coeficiente de correlacin
lineal de Pearson y explicar el hecho de que sea inferior a los de cada
una de las muestras tomadas por separado.
SOLUCIN:
a- La recta de regresin de Y sobre X en cada muestra es
__
y = y+
___
m11
(
x
X)
s x2
rxy =
m11
sx s y
y = Y + rxy
sy
sx
___
(x X )
Luego, sustituyendo, las rectas de regresin de Y sobre X en cada una de las dos
muestras son:
Muestra 1: y=12+0.9*(x-4)
Muestra 2: y=10+0.93*(x-7)
b- Se trata de calcular el coeficiente de correlacin lineal de Pearson en la nueva
muestra de tamao 1000, que notaremos por r xy,t y que ser
r xy ,t =
m11,T
s x ,T s y ,T
___
e Y
___
___
2, Y
___
XT
___
___
___
X * 600 + X 2 * 400
= 1
1000
___
Y 1 * 600 + Y 2 * 400
=
1000
___
___
m 1,h =
resulta que:
ij , h
xi ,h y j ,h
Nh
___ ___
X h Yh
x y j ,1
ij ,1 i ,1
N1
x yl ,2
ij , 2 1, 2
N2
= 8.4 + 7 * 10 = 78.4
ij
xi y j
x y j ,1 + nij , 2 xij , 2 xi , 2 y j , 2
ij ,1 i ,1
N
N
63.6 * 600 + 78.4 * 400
=
= 69.52
1000
Por tanto
m 11,T =
ij
xi y j
___ ___
XT Y
___ 2
___ 2
s x,T = a 2, xT X T y s y,T = a 2, yT Y
donde
a 2, xT =
a 2, yT =
a 2, x1 * 600 + a 2, x 2 * 400
1000
a 2, y1 * 600 + a 2, y 2 * 400
1000
siendo
___ 2
a 2, Xh = s X2 ,h + X h
___
a 2,Yh = sY2 ,h + Y
2
h
para h=1,2.
Luego
a 2, XT =0.6*29+0.4*58=40.6
a 2,YT =0.6*153+0.4*116=138.2
de donde
s X ,T = 40.6 5.8 2 = 2.6382
s Y ,T = 138.2 11.2 2 = 3.5721
Luego resulta que
r xy,T =
4.56
= 0.4838
2.6382 * 3.5721
17. En una compaa area se sabe que, por trmino medio, el 65% de los vuelos
tiene retraso. La distribucin de los vuelos retrasados es la siguiente:
Duracin del retraso
(centsimas de hora)
0-10
10-20
20-30
30-50
50-100
Numero de vuelos
2000
3000
2500
2000
500
Se pide:
a- Determinas el retraso medio y la desviacin tpica del tiempo de retraso
para los vuelos retrasados.
b- Determinar el centil del 60% e interpretarlo.
c- La compaa ha determinado que por cada vuelo con retraso se producen
unas prdidas fijas de 17000 pts y unas prdidas variables de 10000 pts
por cada minuto de retraso. Entre qu cantidades se encuentran al
menos las tres cuartas partes de las prdidas generadas por cada vuelo
retrasado?
d- Resolver el apartado a- para el total de los vuelos. Es representativa la
nueva media? En caso negativo propones razonadamente otra medida de
centralizacin.
SOLUCIN:
a-
15
25
40
75
fi
0.2
0.3
0.25
0.2
0.05
[a i 1 ,a i )
[0,10)
[10,20)
[20,30)
[30,50)
[50,100)
0.2
0.5
0.75
0.95
f
j =1
0.1 *10
=4
0.25
As c 0.6 =24 centsimas de hora y significa que el 60% de los vuelos retrasados
(con menos tiempo de retraso) han tenido un retraso de a lo sumo 24 centsimas de
hora y significa que el 60% de los vuelos retrasados (con menos tiempo de retraso)
han tenido un retraso de a lo sumo 24 centsimas de horas.
c-
6
X
10
6
X.
10
___
entre Y 2s y e Y + 2s y . Como
___
___
x
___
16.6658
= 0.7092
23.5
99994.8
= 0.6329
158000
gy=
sy
___
Al considerar el total de los vuelos hay que modificar la tabla del anunciado
por la tabla siguiente
Como g X * =
17.5
= 1.1457 > 1 la nueva media no es representativa al existir
15.275
18. En una clnica se han registrado durante un mes las longitudes en metros que los nios
andan el primer da que comienzan a caminar, obtenindose los siguientes resultados:
Nmero de metros 1 2 3 4 5 6 7 8
Nmero de nios
2 6 10 5 10 3 2 2
Construir la distribucin de frecuencias adecuada para la variable longitud y realizar los
grficos pertinentes que la representen.
SOLUCIN:
La tabla de frecuencias relativa a la variable se presenta a continuacin:
Xi
1
2
3
4
5
6
7
8
ni
2
6
10
5
10
3
2
2
Ni
2
8
18
23
33
36
38
40
fi
0.05
0.15
0.25
0.125
0.25
0.075
0.05
0.05
Fi
0.05
0.2
0.45
0.575
0.825
0.9
0.95
1
35
30
25
20
Comida
Transporte
Alojamiento
15
10
0
Ene
Feb
Mar
Abr
May
Jun
19.- La distribucin de los costes salariales de los 100000 empleados de una multinacional
se presenta en la tabla siguiente:
Salarios
0 15000
15000 20000
20000 25000
25000 30000
30000 35000
35000- 40000
4000 50000
50000 100000
N de empleados
2145
1520
840
955
1110
2342
610
328
Li
15000
20000
25000
30000
35000
40000
50000
100000
300000
ni
2145
1520
840
955
1110
2342
610
328
150
10000
Marcas = Xi
7500
17500
22500
27500
32500
37500
45000
75000
200000
Xi*ni
16087500
26600000
18900000
26262500
36075000
87825000
27450000
24600000
30000000
293800000
Ni
2145
3665
4505
5460
6570
8912
9522
9850
10000
ci
15000
5000
5000
5000
5000
5000
10000
50000
200000
Di = ni/ci
0.143
0.304
0.168
0.191
0.222
0.4684
0.061
0.00656
0.00075
293800000 =29380
1000
Para hallar el salario ms frecuente se calcula la moda de la variable X. Para ello hemos de tener
presente que los intervalos de la distribucin de frecuencias son desiguales, por lo que l
intervalo modal ser el correspondiente al mayor valor de di, es decir ser el intervalo (3500040000).por lo tanto la moda se calcula como sigue:
M0 = Li-1 + __d+1__ ci = 35000 +
0,061___ 5000 = 36077,74
di-1+ di+1
0,222+0,061
Para hallar el salario tal que la mitad de los restantes sea inferior a l se calcula la
mediana. Para llo, como N/2 = 5000, el intervalo mediano ser (25000-3000) ya que
Ni-1<N/2>Ni es equivalente en este problema a 4505 < 50000< 5460.la mediana se calcular
como sigue:
Me=Li-1 + N/2 Ni-1 ci = 25000 + 1000/2 4505 5000 = 27591,62
ni
955
Para calcular el primer cuartil (primer cuartil de orden 4) observamos que como N/4 =
2500, el intervalo relativo al primer cuartel ser (15000-20000) ya que
Ni-1<2500<Ni es equivalente en este problema a 2145<2500<3655.El primer cuartel se calcular
como sigue:
20. Los rendimientos de cinco inversiones distintas realizadas por un individuo y las
cantidades iniciales invertidas n unidades monetarias son los siguientes:
Cantidades iniciales
200.000
360.000
250.000
240.000
180.000
Rendimientos
1000
900
500
800
1200
N
(1 / xi ) * ni
793,5
9,58 = 1,07
8,95
7,86 = 0,82
9,58
8,96 = 1,14
7,86
9,17 = 1,02
8,96
8,92 = 0,93
9,54
9,57 = 1,04
9,17
8,95 = 1,003
8,92
10,2 = 1,06
9,57
22. En la siguiente tabla se muestran las diferentes cantidades de IVA que se imponen en
la compra de una obra de arte.
Pas
Espaa
Italia
Blgica
Holanda
Alemania
Portugal
Luxemburgo
Finlandia
IVA
0,16
0,20
0,06
0,06
0,07
0,17
0,06
0,22
El recorrido:
La varianza:
s2 =
-
1 6 2
0,1586
x i ni a 2 =
= 0,125 2 = 0,0042
n i =1
8
s = s 2 = 0,048 = 0,06481
-
La cuasivarianza:
S2 =
-
ns 2 8 * 0,0042
=
= 0,0048
n 1
7
S = S 2 = 0,0048 = 0,06928
-
Vp =
-
Ap =
-
s
0,06481
*100 =
*100 = 51,848
a
0,125
a M d 0,125 0,06
=
= 1,00293
s
0,06481
Af =
(x
i =1
a ) 3 * ni
n*S
0,000423
= 0,159
8 * 0,0003325
n
37
198
191
149
79
46
55
51
26
25
25
11
2
SOLUCIN:
-
a=
La media aritmtica:
1 k
27678,5
x i * ni =
= 30,93
n i =1
895
- La mediana:
Para ello nos valemos del clculo de frecuencias absolutas acumuladas:
Este tipo de datos nos dice el nmero de datos que hay igual o inferiores a uno
determinado.
Se calcula con la siguiente formula: N i =
As de esta forma:
Tamao tabla
3-6
6-11
n
j =1
= N i =1 + n j
Frecuencia acumulada
37
235
11-16
16-21
21-26
26-31
31-41
41-51
51-76
76-101
101-201
201-501
501-1000
426
575
654
700
755
806
832
857
882
893
895
N 3 = 426 <
n 895
=
= 447,5 < 575 = N 4
2
2
Con lo que podemos decir que la mediana esta en el intervalo [16,21)siendo la mediana el
valor:
n
N j 1
447,5 426
M e = x j 1 + 2
* 5 = 16,72
* c j = 16 +
nj
149
24. Con los datos del ejercicio anterior calcular el primer cuartel y el sexto decil.
SOLUCIN:
a) El primer cuartil:
37 <
1
* n = 223,75 < 235
4
p1 / 4
1
1
* 895 37
* n N j 1
= x j 1 + 4
* 5 = 10,716
*cj = 6 + 4
nj
198
6
60
6
*n =
* n = * 895 = 537
10
100
10
Por las frecuencias absolutas acumuladas:
25. Mediante los datos del ejercicio numero 23 calcular las medidas de dispersin
SOLUCIN:
- El recorrido:
La varianza es:
s2 =
1 k
1 k
3713428,25
30,93 2 = 3192,47
( xi a ) 2 * ni = xi2 ni a 2 =
n i =1
n i =1
895
- La cuasivarianza
n * s 2 895 * 3192
S =
=
= 3195,988
n 1
894
2
- La desviacin tpica:
s = s 2 = 3192,417 = 56,50
-
La cuasidesviacin tpica:
S = S 2 = 3195,988 = 56,53
-
Vp =
-
s
56,50
* 100 =
*100 = 182,67
a
30,93
Ap =
a Md 30,93 9,78
=
= 0,374
s
56,50
Por lo que obtenemos al calcularlo: f1= 32/148= 0,216; f2= 27/148= 0,1824; f3= 58/148=
0,39; f4= 31/148= 0,20;
2- de la misma forma calcularemos las frecuencias correspondientes para las nias:
- Para las frecuencias absolutas: x1=0 n1=43; x2= 0 n2=24; x3=0 n3=32;
x4=1 n4=31;
- Para las frecuencias relativas: f1= 43/161= 0,267; f2= 24/161= 0,15; f3=
32/161= 0,20; f4= 62/161= 0,38;
3- Pasemos a la representacin grafica, para ello debemos partir de las frecuencias relativas
y calcular cada porcin del diagrama mediante esta formula:
1 360
as de esta forma obtenemos:
=
fi
diagrama nios
0,2; 20%
0,216; 22%
1
0,1824; 18%
2
3
4
0,39; 40%
diagrama nias
0,267; 27%
0,38; 38%
1
2
3
4
0,15; 15%
0,2; 20%
27. Establecido un balance de explotacin sobre las ocho sucursales de una cadena de
almacenes, result la siguiente estimacin:
Sucursal
Ventas totales
28
500
15
126
24
432
32
870
17
180
23
450
18
912
25
713
ji-pi
pi
28
500
14000
15
126
1890
24
432
10368
32
870
27840
17
180
3060
23
450
10350
18
912
16416
713
17825
4183
101479
De donde:
x=
101479
= 24,32%
4183
28. Una prestigiosa frutera tiene como norma clasificar los mangos segn su
tamao, de cara a la venta, en superiores y normales. Los superiores son aquellos
cuyo peso es superior a 450 g. De una partida, representativa de los mangos que
recibe normalmente, se ha obtenido la distribucin de frecuencias siguientes:
Peso
250-300
300-350
350-400
400-450
Nm. De mangos
3
10
15
25
450-500
500-550
550-600
600-650
650-700
a-
32
20
19
4
2
b-
SOLUCIN:
a-
Primero habr que calcular el nmero de mangos cuyo peso es supereior a 625
gamos. Bajo la hiptesis de distribucin uniforme de la frecuencia en los
intervalos, resulta que en el intervalo (625-800] hay 5 mangos de la partida.
Por tanto se apartarn para el aristcrata el 3.85% de los mangos recibidos.
Ya que el frutero decide retirar de la venta aquellos cuyo peso sea a lo sumo
de 317.5 g, la distribucin del peso de los mangos normales, vaqriables notada
por X N , ser
b-
Peso
(317.5-350]
(350-400]
(400-450]
N de mangos
15
25
Peso
(450-500]
N
32
La del aristcrata es X A
Peso
N
(625-700]
3
(500-550]
20
(550600]
19
(600625]
1
(700-800]
2
X S == 517.19 g. y
___
= 697.5 g.
Por lo tanto en esta partida el frutero espera tener 46*396.79 = 18.25 kg de mangos
normales, 72*517.19 =37.24 kg de mangos superiores y 5*697.5=3.49kg de mangos
destinados al aristcrata. Con lo cual espera ganar por esta partida la cantidad de
300*18*253+500*37.24+400*3.49=25490 pts.
En este primer anlisis, las rentas son valores que oscilan entre 200.000 ptas.
y 38 millones; la renta media familiar es de 1.964.000 ptas.; es una distribucin
que tiende a ser simtrica (el coeficiente de asimetra es igual a 01697) y el
coeficiente de curtosis es negativo, que indica que la distribucin est por debajo de
la distribucin normal tipificada, es decir, es platicrtica.
Agrupemos los datos en intervalos de amplitud 05; como la renta toma
valores positivos y no superan el valor 4, podemos considerar rango 0-4.
Li-1-Li
00-05
05-10
10-15
15-20
20-25
25-30
30-35
35-40
xi
025
075
125
175
225
275
325
375
ni
2
4
10
8
13
6
5
2
Ni
2
6
16
24
37
43
48
50
Los intervalos con mayor frecuencia estn situados en el centro; agrupar los
datos en un sentido u otro hace que el coeficiente de asimetra cambie (el nuevo
valor es 0046), aunque en todos los casos toma valores cercanos a cero.
A pesar de que el intervalo con marca 225 es el de mayor frecuencia (por
encima de la grfica de la distribucin normal), los intervalos adyacentes reflejan lo
contrario. Debido a esta situacin, el coeficiente de curtosis es negativo.
Si consideramos intervalos con mayor amplitud:
Li-1-Li
0-1
1-2
2-3
3-4
xi
05
15
25
35
ni
6
18
19
7
Ni
6
24
43
50
Media: 204
Varianza: 07684
Desviacin Tpica: 08766
Moda: 228
Mediana: 20526
Asimetra: -00331
Curtosis: - 06989
Coef. Pearson: 04297
Y =
i =1
y i ni
n
i =1
(xi
+ a) ni
i =1
i =1
i =1
xi ni
n
i =1
i =1
n
i =1
Moda
M o (Y ) = y k = x k + a = M o (x ) + a
M o (Y ) = Li 1 + a + ci
hi + 1
= M o (x ) + a
hi 1 + hi + 1
Mediana
*Si los datos estn sin agrupar en intervalos, por ser frecuencias de X y de Y
las mismas, la mediana de Y ser la mediana de X trasladada en a unidades.
**Si la distribucin esta agrupada en intervalos de clase N / 2 < N i
la mediana se encuentra en el i-simo intervalo tanto para X como para Y.
Me(Y ) = Li 1
N
N i 1
2
+ a + ci
= Me(x ) + a
ni
Pj (Y ) = Pj (x ) + a con j=1,___,99.
31. Para lanzar un nuevo producto al mercado, una empresa estudia el
tiempo de publicidad, en segundos, empleando en los medios audiovisuales por
otra empresa que produce un producto similar.
Duracin
0-20
20-25
25-30
30-40
40-60
N de
Anuncios
3
17
13
9
8
= x + a
a)
b)
c)
d)
e)
f)
Importe
N de vehculos
0-60
10
60-80
20
80-120
40
120-180
10
Calcular el importe medio. Estudiar la representatividad en esta medida.
Calcular la mediana y estudiar su representatividad.
Cul es el importe ms habitual?
Qu interpretacin tiene en este caso los deciles? Calcular el tercer decil.
Cul es el importe mnimo pagado por las 75 reparaciones ms baratas.
Estudiar la concentracin del importe de las facturas.
SOLUCIN:
a) X = 90000 ptas. VX = 036. Es moderadamente representativa.
7 . Es representativa.
b) Me = 90000 ptas. DMe = 25. VMe = 0.2
c) Hay dos modas: Mo1 = 77143 ptas. y Mo2 = 85714 ptas.
d) D3 = 74000 ptas.
e) P75 = 110000 ptas.
2.
f) IG = 0
33. Dos compaas aseguradoras tienen formas diferentes de pagar a sus
empleados. La compaa A lo hace mediante un sueldo fijo mensual y la
compaa B a travs de un porcentaje sobre los seguros realizados. La
distribucin de los salarios por categoras es:
Compaa A
Sueldo
(miles ptas.)
50-80
80-100
100-150
Compaa B
N
empleados
35
21
14
Sueldo
(miles ptas.)
50-80
80-100
100-140
140-200
N
empleados
21
25
34
15
Sean:
X = 84.5
Y = 107.842105
b)
VX = 0.27273876, VY = 0.31479111, los sueldos estn menos dispersos
en la empresa A.
c)
Mo = 80000 pesetas.
d)
IG(Y) = .200456171
e)
Z = Y + 10
Z = Y + 10 = 107.842105 + 10 = 117.842105
SZ =SY
34. Las notas finales de 100 estudiantes de una Escuela Superior son las
siguientes:
11
35
26
1
43
11
52
3
41
20
46
2
42
12
33
22
32
17
59
36
58
37
51
21
48
29
51
39
60
59
25
68
29
6
47
14
44
22
41
38
48
70
59
32
43
31
57
40
51
40
18
31
92
15
69
46
60
65
10
43
41
44
56
67
49
19
43
30
63
18
35
84
5
47
21
49
65
31
41
60
59
64
52
61
9
51
73
16
74
71
28
82
8
47
15
71
62.
80
81
44
Determinar:
1El nmero de estudiantes con nota superior a 80
2La nota del estudiante n 38 en orden a la peor puntuacin de la
distribucin del tipo III:
SOLUCIN:
Li-1 li
0-10
10-20
20-30
30-40
40-50
||||
||||
||||
||||
||||
|||
||||
||||
||||
||||
||
||||
||||
||||
ni
8
12
10
14
21
Ni
8
20
30
44
65
50-60
60-70
70-80
80-90
90-100
||||
||||
||||
|||
|
||||
||||
||||
16
10
5
3
1
100
81
91
96
99
100
N 6 + N 7 + N8 = 16 + 10 + 5 = 31
2 Nota del estudiante nmero 38: De 30 a 40 puntos
35. Dada la siguiente distribucin de frecuencias:
Li-1 Li
-4 -2
-2 0
02
24
46
ni
4
3
2
4
1
1 Representarla grficamente
2 Obtener la serie de frecuencias acumuladas
3 Representar la distribucin de frecuencias acumuladas
SOLUCIN:
1 Representar grficamente el histograma:
Por tratarse de una distribucin con intervalos de igual amplitud, podemos
tomar la ni, como altura, obtenindose:
4,5
4
3,5
3
2,5
Serie1
2
1,5
1
0,5
0
[-4, -2]
[-2, 0]
[0, 2]
ni
4
Ni
4
[2, 4]
[4, 6]
-2 0
02
24
46
3
2
4
1
7
9
13
14
Serie1
6
4
2
0
[-4, -2]
[-2, 0]
[0, 2]
[2, 4]
[4, 6]
Donde se han tomado hi=Ni por tratarse de una distribucin de intervalos de igual
amplitud.
36. Hallar la mediana de la siguiente distribucin de frecuencias:
Li-1 Li
01
12
23
34
45
ni
12
13
11
8
6
SOLUCIN:
Li-1 Li
01
12
23
34
45
ni
12
13
11
8
6
50
Ni
12
25
36
44
50
N 50
=
= 25
2
2
37. Se ha observado la vida de 280 bombillas obtenindose la siguiente distribucin:
Vida en horas
0 500
500 1000
1000 1500
1500 2000
2000 2500
2500 3000
N de bombillas
4
21
107
78
44
24
280
Hallar la moda.
SOLUCIN:
Se trata de una distribucin del tipo III con intervalos constantes.
Mo = Li 1 +
ni + 1
78
a1 = 1000 +
500 = 1000 + 394 = 1394
ni 1 + ni + 1
21 + 78
1
2
2
6
3
10
4
5
5
10
6
3
7
2
8
2
ni
2
6
10
5
10
3
2
2
fk=nk/N
Fk=Nk/N
Ni
2
8
18
23
33
36
38
40
N=n1 ++nk=Nk
fi
0,05
0,15
0,25
0,125
0,25
0,075
0,05
0,05
Fi
0,05
0,2
0,45
0,575
0,825
0,9
0,95
1
Graficos.
Ni
ni
12
10
10
8
6
4
2
10
ni
3
0
1
45
40
35
30
25
20
15
10
5
0
Ni
FIGURA 1
FIGURA 2
39. La distribucin de los costes salariales de los 100 000 empleados de una
multinacional se presenta en la tabla siguiente:
Salarios
0-15000
15000-20000
20000-25000
25000-30000
30000-35000
35000-40000
40000-50000
50000-100000
100000-300000
N de empleados
2145
1520
840
955
1110
2342
610
328
150
N de
empleados=
ni
2145
1520
Marcas = xi
xi* ni
Ni
ci
di= ni/ ci
7500
17500
22500
16087500
26600000
18900000
2145
3665
4505
15000
5000
5000
0,143
0,304
0,168
27500
26262500
5460
5000
0,191
32500
36075000
6570
5000
0,222
37500
87825000
8912
5000
0,4684
45000
27450000
9522
10000
0,061
75000
2460000
9850
50000
0,0056
200000
30000000
10000
200000
0,00075
40
25000-30000
55
30000-35000
110
35000-40000
342
40000-50000
10
50000-100000
28
100000-300000
50
293800000
0000
X=
1
N
i =1
xini=
293800000 29380
=
10000
d i +1
0,061
ci=35000+
5000= 36077,74
di 1 + d i +1
0,222 + 0,061
Para hallar el salario tal que la mitad de los restantes sea inferior a l se calcula
la mediana. Para ello, como N/2 = 5000, el intervalo mediano ser (25000 3000) ya
que Ni-1 < N/2 < Ni es equivalente en este problema a 4505 < 5000 <5460. La mediana
se calcular como sigue:
N
10000
N i 1
2145
Me = Li-1 + 2
ci = 25000+ 2
5000 = 27591,62
ni
955
Para calcular el primer cuartel ( primer cuantil de orden 4) observamos que
como N/4 = 2500, el intervalo relativo al primer cuartel ser (15000-20000) ya que Ni1<2500<Ni es equivalente en este problema a 2145<2500<3665.El primer cuartel se
calcular como sigue:
N
10000
N i 1
2145
Q1,4 = Li-1+ 4
ci = 15000 + 4
5000 = 16167,76
1520
ni
75 N
75 *10000
N i 1
6570
100
100
1+
ci = 35000 +
5000 = 36985,48
ni
2342
El percentil 75 se interpreta como el valor de la variable para el que el 75% de
los valores son inferiores a l y el 25% restante son superiores.
El percentil 75 tambin podr haberse calculado como el tercer cuartil (cuantil
3de orden 4). Como 75N/100=7500=3N/4, el tercer cuartil se calculara como sigue:
Q3, 4
3N
3 * 10000
N i 1
6570
4
= Li 1 + 4
ci = 35000 +
5000 = 36985,48
ni
2342
El tercer cuartil se interpreta como el valor de la variable para el que las tres
cuartas partes de los valores son inferiores a l y la cuarta parte restante es superior.
Como las tres cuartas partes son el 75%, el percentil 75 coincide con el tercer cuartil.
40. Los rendimientos de cinco inversiones distintas realizadas por un
individuo y las cantidades iniciales invertidas en unidades monetarias son los
siguientes:
Cantidades iniciales
200 000
360 000
250 000
240 000
180 000
Rendimientos
1000
900
500
800
1200
H=
200000 + 360000 + 250000 + 240000 + 180000
N
= 793,5
=
k
200000 360000 250000 240000 180000
1
+
+
+
+
900
500
800
1200
i =1
xi 1000
Aunque en este problema es menos adecuada, podramos haber utilizado
tambin la media aritmtica ponderada, que se calcula como sigue:
X=
1
200000 *100 + 360000 * 900 + 250000 * 500 + 240000 * 800 + 180000 *120
=
x
i ni
N i =1
200000 + 360000 + 250000 + 240000 + 180000
k
X = 859,35
Tambin podra utilizarse la media geomtrica, ya que las cantidades a
promediar son no nulas y positivas. Para hallar esta media es conveniente aplicar
logaritmos (en este caso neperianos) y calcular el valor final como se indica a
continuacin:
G=
n1
n2
x x
nk
... x k ln(G ) =
1 k
ln( ) =
N i =1 ni xi
200000 * ln(100) + 360000 * ln(900) + 250000 * ln(500) + 240000 * ln(800) + 180000 * ln(120)
200000 + 360000 + 250000 + 240000 + 180000
=672 G=e6,72=828,82
41. En el cuadro siguiente se presentan los consumos de electricidad en
Espaa en miles de millones de de kw/hora desde diciembre en 1985 hasta
diciembre de 1986.
Meses
Dic
Ene
Feb
Mar
Abr
May
Jun
Jul
Ago
Sep
Oct
Nov
Dic
Consumo
10.1
10.7
9.96
9.46
9.54
8.92
8.95
8.58
7.86
8.96
9.17
9.57
10.2
10,7
= 1,06
10,1
9,58
= 1,07
8,95
9,96
= 0,93
10,7
7,86
= 0,82
9,58
9,46
= 0.95
9,96
8,96
= 1,14
7,86
9,54
= 1,008
9,45
9,17
= 1,02
8,96
8,92
= 0,93
9,54
8,95
= 1,003
8,92
9,57
10,2
= 1,04
= 1,06
9,17
9,57
G = 12 1,06 * 0,93 * 0,95 * 1,008*,0,93 * 1,003 * 1,07 * 0,82 * 1,14 * 1,02 * 1,04 * 1.06 =1,01
SOLUCIN:
Al tratarse de clculo de una velocidad media utilizaremos la media armnica,
que se clcula como se indica a continuacin:
H=
N
60 + 40
=
= 56,45 km/h
60 40
1
n1 50 + 70
I =1 x1
k
Numero de empleados
3
3
7
10
12
8
Se pide:
a) media aritmtica, mediana, cuartil inferior, percentil 60 y desviacin tpica.
b) Qu tanto por cien de empleados tuvieron menos de 83 pulsaciones?
SOLUCIN:
a) media= 88.198
Me= 89.25
Q1= 83.393
P60= 91.167
b) 23.721%
46. En el marco de un estudio sobre la posible incidencia que tiene la religin profesada
por los distintos matrimonios en la presencia de una mayor menor frecuencia de
divorcios, se ha tomado una muestra aleatoria a nivel mundial de tamao 32000
Religin \ Divorcio
Catlicos
Ateos
Musulmanes
Protestantes
Otros
Divorcio
1435
845
160
610
1250
No divorcio
7565
2155
7840
4390
5750
SOLUCIN:
a) Basando tus razonamientos y afirmaciones en las frecuencias relativas que
resulten mas informativas para este estudio seala cual es la religin donde los
matrimonios presentan una mayor probabilidad de terminar en divorcio y cual es
en la que se dan menos.
En este caso las frecuencias que proporcionan ms informacin son las frecuencias relativas
condicionales de Divorcio/Religin.
Frec. Relativa (Divorcio/ Catlicos) = 1435/(1435+7565)=15.94% de los matrimonios
catlicos acaban en divorcio
Frec. Relativa (Divorcio/Ateos) = 845/(845+2155)=28.17% de los matrimonios ateos acaban
en divorcio
Frec. Relativa (Divorcio/Musulmanes) =160/(160+7840)=2% de los matrimonios
musulmanes acaban en divorcio
Frec. Relativa (Divorcio/Protestantes) = 610/(610+4390)= 12.2% de los matrimonios
musulmanes acaban en divorcio.
Frec. Relativa (Divorcio/ Otros) = 1250/(1250+5750)=17.9% de los otros matrimonios acaban
en divorcio
A partir de los datos se observa que en el caso de los ateos hay mas probabilidad de que los
matrimonios acaben en divorcio 28.17%. En la religin musulmana ocurrir justo lo contrario
con solo un 2% de divorcios.
b) Obtener las frecuencias marginales absolutas y relativas de la variable divorcio.
Frecuencias marginales de la variable divorcio:
Frecuencias absolutas marginales:
divorcio si: 4300
divorcio no: 27700
Frecuencias relativas marginales:
divorcio si: 4300/32000=13.44%
divorcio no:27700/32000=86.56%
47. Para estudiar la eficacia de un tratamiento sobre las resistencias de un determinado
hormign se ha realizado un ensayo sobre 15 probetas. Se han medido los das
transcurridos hasta que el hormign alcance la resistencia de 40MPa y los datos han sido
los siguientes:
15
15
13
9
10
16
28
13
12
10
17
19
18
11
14
SOLUCIN:
a)
La poblacin es todo el hormign de ese tipo. La variable aleatoria son el nmero de das
transcurridos hasta alcanzar los 40MPa.Cuantitativa y discreta
b)
9
10
28
11
12
13
13
14
15
15
16
17
18
Mediana=14
Cuartil 1=11
Cuartil 3=17
IIC=Intervalo intercuartilico=17-11=6
C3+1.5*IIC=17+1.5*6=26
C1-1.5*IIC=11-1.5*6=2
El bigote de la izquierda llegar, como mucho a 2.Como el valor observado posterior es 9, el bigote
de la izquierda llegar a 9.
El bigote de la derecha llegar, como mucho a 26.Como el valor observado inmediatamente
CANTIDAD DE TIERRA
421
350
259
80
% CULTIVADO
46.7
21.0
8.7
18.8
%=
307.68 *100
= 27.97
1100
49. Los alumnos de ltimo curso de Bachillerato de un Instituto eligen carrera segn los datos
de la tabla siguiente:
CARRERA MEDICINA DERECHO
250
176
ALUMNOS
CIENCIAS
127
LETRAS
314
INEF.
103
OTRAS
30
Construir la distribucin de frecuencias adecuada para la variable carrera elegida por los
alumnos y realizar los grficos pertinentes que la representen.
SOLUCIN:
Dado que se trata de una variable cualitativa, podemos comenzar realizando su representacin
mediante un diagrama de rectngulos, que se construye asignando a cada modalidad de la
variable cualitativa un rectngulo con altura igual (o proporcional) a su frecuencia absoluta ni y
con base constante. La tabla de frecuencias relativa a la variable se presenta a continuacin.
CARRERA
Medicina
Derecho
Ciencias
Letras
Inef
Otras
ALUMNOS
(ni)
fi = n i / N
250
176
127
314
103
30
N=1000
i=
0,25
0,176
0,127
0,314
0,103
0,03
1
360fi
90
63,36
45,72
113,04
37,08
10,8
360
314
176
127
103
TR
AS
EF
IN
LE
TR
AS
30
M
ED
IC
IN
A
D
ER
EC
H
O
C
IE
N
C
IA
S
350
300 250
250
200
150
100
50
0
Figura
Tambin podra realizarse la representacin de la distribucin de frecuencias de muestra
variable cualitativa mediante el diagrama de sectores con porcentajes de la Figura 1-14. Los
porcentajes relativos a cada carrera se calculan mediante 100fi y los ngulos centrales de cada
sector se calculan mediante 360fi.
ESTUDIANTES POR CARRERAS
INEF
10%
LETRAS
31%
OTRAS
3%
CIENCIAS
13%
MEDICINA
25%
MEDICINA
DERECHO
18%
DERECHO
CIENCIAS
LETRAS
INEF
OTRAS
50. Las puntuaciones obtenidas por 100 opositores en el ltimo ejercicio se presentan en el
cuadro siguiente:
7
3
2
8
0
9
6
4
4
8
1.
2.
3.
4.
5.
3
2
5
6
2
7
1
6
7
5
2
4
6
3
1
3
0
2
6
2
4
9
5
4
5
4
5
1
3
7
5
8
4
0
6
3
7
1
5
1
1
1
7
10
4
5
8
2
0
4
8
0
1
2
3
7
5
6
2
6
6
2
3
5
5
4
2
7
8
3
1
4
0
7
2
6
3
4
2
5
5
1
5
4
3
5
10
5
7
6
SOLUCIN:
Para construir la distribucin de frecuencias de la variable aleatoria X que representa las
distintas calificaciones, tabulamos los datos haciendo un recuento de los opositores que obtienen
cada calificacin (frecuencias absolutas de cada calificacin) y derivando el resto de las
columnas de la tabla de frecuencias tal y como se indica a continuacin:
Xi
ni
0
1
2
3
4
5
6
7
8
9
10
6
10
13
11
13
16
11
10
6
2
2
N = 100
fi = n i / N
0,06
0,1
0,13
0,11
0,13
0,16
0,11
0,1
0,06
0,02
0,02
fi = 1
Ni
6
16
29
40
53
69
80
90
96
98
100
Fi = Ni /N
0,06
0,16
0,29
0,4
0,53
0,69
0,8
0,9
0,96
0,98
1
Puesto que las frecuencias relativas pueden interpretarse como el peso relativo de cada
valor en la distribucin, el porcentaje de alumnos que aprob la oposicin (o sea, que
obtuvieron un 5) ser la frecuencia relativa correspondiente al valor 5 de la variable, es decir, el
16 por ciento (0,16).
Puesto que las frecuencias absolutas acumuladas correspondientes a un valor dado de la
variable pueden interpretarse como el nmero de valores iguales o inferiores a ese valor dado,
resulta que para el valor 6 de la variable hay 80 opositores que obtuvieron una calificacin
inferior o igual a 6. Por lo tanto habr 20 opositores (100-80=20) que han obtenido una
calificacin superior a 6. Este resultado quiere decir que en caso de haber slo 20 plazas, la
nota mnima para superar la oposicin hay que situarla por encima del 6. Es decir, superarn la
oposicin los alumnos que obtengan ms de un 6.
El diagrama de barras y el polgono de frecuencias suelen ofrecer informacin sobre la
simetra y la normalidad de la distribucin. En este caso vemos que estas representaciones no se
desvan demasiado de una campana de Gauss, lo que indica que puede admitirse la normalidad
de los datos. En cuanto a la simetra se observa que la parte izquierda de la distribucin
aglomera ms frecuencia, por lo que podra haber una asimetra dbil en esa direccin. No
obstante, podra admitirse tambin la simetra, al igual que la normalidad con un margen de
error no muy elevado.
N de empresas
25
37
12
22
21
13
5
3
2
SOLUCIN:
[Li-1;Li) ci
[0;100)
[100;200)
[200;300)
[400;500)
[500;600)
[600;700)
[700;800)
[800;900)
[900;1000)
ni
50
150
250
450
550
650
750
850
950
25
37
12
22
21
13
5
3
2
fi
Ni
0,178571
0,264286
0,085714
0,157143
0,15
0,092857
0,035714
0,021429
0,014286
25
62
74
96
117
130
135
138
140
Fi
0,178571
0,442857
0,528571
0,685714
0,835714
0,928571
0,964286
0,985714
1
52. Un examen consta de 5 preguntas en las que dos alumnos A y B obtienen las siguientes
calificaciones segun el orden de las preguntas:
A: 5, 8, 6, 5, 4.
B: 3, 7, 8, 6, 3.
a) cual de los dos alumnos tuvo mejor nota sabiendo que los ejercicios 1,3 y 4
puntuan la mitad que los ejercicios 2 y 5?
b) si consideramos que todas las preguntas valen igual, que alumno obtendra mejor
calificacion si utilizamos la media geometrica? y si usamos la media cuadratica?
SOLUCIN:
a) Se calcula la media ponderada con los pesos que se indican para cada uno de los alumnos
siendo el alumno con mayor media el que obtuvo mejor nota.
Los pesos para los problemas 1, 3 y 4 sera 1 y para los problemas 2 y 5 sera 2. asi, obtendremos
los siguientes resultados:
G=
Xi fi
i 1
C=
1 k
fi Xi 2
n i 1
NUMERO DE VEHICULOS
1240
3575
746
327
218
44
XI
30
90
150
210
300
900
NI
1240
3575
746
327
218
44
6150
XI.NI
37200
321750
111900
68670
65400
39600
644520
CI
60
60
60
60
120
1080
NI
1240
4815
5561
5888
6106
6150
La medida de posicion que indica a partir de que cantidad de tiempo un vehiculo esta
estacioNado mas que el 85% de los vehiculos es el percentil 85.
Y la primera frecuncia acumulada que lo supera es N3=5561, con lo que el P85 esta en el
intervalo (120,180):
Es decir, a partir de 153.176944 minutos un vehiculo esta estacionado mas que el 85% de
los vehiculos.
55. Los porcentajes de participacin de los alumnos en las actividades extraescolares
durante los trimestres lectivos de los dos ltimos cursos sufri el siguiente aumento: el
primer trimestre 8%, el segundo 12%, el tercero 18%, el primer trimestre del ultimo
curso 27%, el segundo 40,5% , el tercero 60,75%. Calcular la media geomtrica del
porcentaje de participacin de los alumnos en esas actividades.
SOLUCIN:
n
Mg =
x
i =1
ni
i
Tambien se puede utilizar para el calculo de la media geometrica la formula anterior tomando
cualquier tipo de logaritmos. Usando logaritmos en base 10:
n log(x )
n
Mg = antilog
= antilog (
i =1
= antilog(1,343318135) = 22,04540769.
Entonces la media geometrica de la participacin de los alumnos es 22,0454%.
56. La cajera de una tienda va anotando los precios y las cantidades de los productos que
ha adquirido un cliente. En el ticket de compra aparece esta relacin:
Producto
Azcar
Aceite girasol
Leche
semidesnatada
Zumo
lata de refrescos
botella de vino
n
unidades
Precio/unidad
5
156
10
115
15
6
12
2
64
75
50
139
Recordemos que para su clculo, los valores deben estar ordenados. La cajera, posiblemente por
comodidad o por falta de tiempo, no sigue esa estrategia. Va registrando segn llegan los
artculos. Colocando los precios de menor a mayor con el correspondiente numero de unidades
y hallamos las frecuencias absolutas acumuladas.
N
Producto
Precio
Ni
unidades
lata de refrescos
50
12
Leche semidesnatada
64
15
Zumo
75
6
aceite de girasol
115
10
botella de vino
169
2
Azcar
156
5
12
27
33
43
45
50
La mitad de los valores es N/2 = 50/2 =25. La primera frecuencia acumulada que lo supera es
N2 = 27. Esto significa que el precio correspondiente a la mediana es el de un litro de leche
semidesnatada: 64 pesetas
57. Completar la siguiente tabla para el estudio de la concentracin de una distribucin de
frecuencias y calcular el indice de gini. Comentar el resultado.
xi
ni
10
20
40
60
70
Ni
90
50
30
20
10
pi
si
90
140
170
190
200
Ai
900
1200
700
qi
900
1900
5000
0,86
1
SOLUCIN:
Los valores de pi se obtienen dividiendo las frecuencias acumuladas absolutas, Ni, entre el total
de datos, N:
Ni
90
140
170
190
200
pi = Ni/N
90/200 = 0,45
140/200 = 0,7
170/200 = 0,85
190/200 = 0,95
200/200 = 1
Los valores de si se calculan multiplicando los valores de la variable por las frecuencias
respectivas, si = xini , y los de Ai son los acumulados de la columna anterior, si:
i
Ai = s k
k =1
xi
ni
10
20
40
60
70
si = xi ni
90
900
900
50 20*50 = 1000
1900
30 40*30 = 1200
1900+1200 = 3100
20
1200 3100+1200 = 4300
10
700
5000
qi = Ai/An
900 900/5000 = 0,18
1900 1900/5000 = 0,32
3100 3100/5000 = 0,62
4300
5000
0,86
1
qi
0,45
0,7
0,85
0,95
0,18
0,38
0,62
0,86
pi -qi
0,45 - 0,18 = 0,27
0,70 - 0,38 = 0,32
0,85 - 0,62 = 0,23
0,95 - 0,86 = 0,09
2,95
0,91
Los valores de la ltima fila se han omitido, pues en la frmula del ndice de gini slo se suma
hasta el penltimo, n-1.
As, el ndice de Gini ser:
(p q )
n 1
IG =
i =1
n 1
p
i =1
0,91
= 0,30847458.
2,95
Precio
unitario
20
35
50
70
cantidad
300
225
150
50
725
Precio
unitario
18
33
46
63
cantidad
301
226
151
51
729
Cmo varia el ingreso total, teniendo en cuenta estos cambios? Y el ingreso medio?
Desde el punto de vista de la dispersin, hay cambios significativos?
SOLUCIN:
Realizamos los clculos para los primeros datos en la tabla:
Precio
unitario
Artculo
A
B
C
D
20
35
50
70
Cantidad
pi qi
300
225
150
50
725
6000
7875
7500
3500
24875
pi qi
120000
275625
375000
245000
1015625
p q = 24875,
i =1
Y el ingreso medio
n
X=
pq
i
i =1
24875
= 34,3103448 u.m.
725
Varianza:
n
S2 x =
p
i =1
2
i
1015625
- 34,31034482 = 223,662307,
725
Y la desviacin tpica
Sx =
223,662307 = 14,9553438.
Precio
unitario
18
33
46
63
Cantidad
pi qi
301
226
151
51
729
pi qi
5418
7458
6946
3213
23035
97524
246114
319516
202419
865573
p q = 23035,
i
i =1
Y el ingreso medio
n
Y =
pq
i
i =1
23035
= 31,59808.
729
La varianza
n
S2 y =
p q
2
i =1
Y =
865573
31,59808 2 = 188,904304
729
y la desviacin tpica
Sy =
188,904304 = 13,744246.
Vy =
14,9553438
= 0,435884392
34,3103448
13,744246
= 0,434971.
31,59808
S
Y
Que indica que no han cambiado mucho los resultados en relacion con la media.
59. Una fbrica de coches desea estudiar el consumo de un nuevo modelo de coche que
quiere lanzar al mercado. Para ello realiza cien pruebas echando diez litros de gasolina y
viendo que distancia en kilmetros recorre el coche. Los resultados de las pruebas fueron
los siguientes:
85
91
91
92
89
90
92
91
89
89
90
87
87
90
88
88
88
88
90
87
91
88
90
90
91
88
92
88
93
88
88
88
84
90
89
94
92
92
89
88
91
90
91
93
90
91
88
89
91
93
91
90
88
90
90
90
89
87
92
90
86
89
90
89
88
92
88
88
89
95
92
90
88
92
90
87
91
88
85
89
90
90
88
91
89
90
89
91
86
92
89
89
88
92
86
91
91
88
91
89
b) Agrupar estos valores en los intervalos [83.5-86.5), [86.5-89.5), [89.5-92.5) y [92.595.5). Obtener la correspondiente distribucin de frecuencias con las marcas de
clase, las amplitudes de los intervalos y las alturas. Representar grficamente la
distribucin.
SOLUCIN:
a) la distribucin de frecuencias es:
xi
84
85
86
87
88
89
90
91
92
93
94
95
ni
1
2
4
5
21
16
20
15
11
3
1
1
100
fi
0.01
0.02
0.04
0.05
0.21
0.16
0.20
0.15
0.11
0.03
0.01
0.01
1
Ni
1
3
7
12
33
49
69
84
95
98
99
100
Fi
0.01
0.03
0.07
0.12
0.33
0.49
0.69
0.84
0.95
0.98
0.99
1
25
20
ni
15
10
5
0
84
85
86
87 88
89
90 91
xi
92
93 94
95
xi
85
88
91
94
ni
7
42
46
5
100
fi
0.07
0.42
0.46
0.05
1
Ni
7
49
95
100
Fi
0.07
0.49
0.95
1
ci
3
3
3
3
hi
2.333
14
15.333
1.667
50
40
ni
30
20
10
0
85
88
xi
91
95
60. Los resultados en el anlisis del valor calrico (Kcal/racin) de 20m marcas de galletas
normales y 12 integrales, considerando como racin 5 o 6 galletas (30 gramos) son los
siguientes:
Normales
Kcal
integrales
kcal
Canente
Cura
Curra
Dan
Desa
Erus
Fomesa
Foleda
Fura
Gafin
Gelo
Hela
Hipu
Les
Mali
Neria
Pros
Riz
Suno
Veras
125
125
150
135
150
130
130
145
135
145
130
150
140
150
140
145
130
130
130
140
cura
fomesa
dan
desa
erus
gafin
les
mali
naria
sanli
suno
veras
135
135
130
135
125
140
150
135
135
145
150
130
150
6
32
32
0.1875
1
Donde Ni son las frecuencias absolutas acumuladas, fi son las frecuencias relativas y Fi son las
frecuencias relativas acumuladas.
8
7
6
5
ni 4
3
2
1
0
3
125
130
135
140
145
150
xi
ni
3
8
7
4
4
6
32
xi ni
375
1040
945
560
580
900
4400
Media: 137.5
Para la mediana veamos entre que valores de la columna de frecuencias acumuladas Ni esta
N/2= 16:
xi
125
130
135
1140
145
150
ni
3
8
7
4
4
6
32
Ni
3
11
18
22
26
32
N/2 =16 esta entre N2 y N3 como la distribucin es de datos sin agrupar, Me = x3 = 135.
La moda, por ser datos sin agrupar es el valor de la variable que ms se repite, es decir, el dato
que mas frecuencia absoluta tenga. Como la ni mxima es n2 = 8, la moda
Mo = x2 = 130.