Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Dis Perci On
Dis Perci On
de
TCNICAS CUANTITATIVAS 1
$&HOLD
12
16
27
33
35
40
66
68
71
77
87
104
111
114
117
118
138
143
4.5 Prediccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
155
5.- Probabilidad.
5.1 Definicin de probabilidad. Asignacin de probabilidades . . . . . . . . . . . . . . .
172
179
182
194
196
200
202
206
238
241
245
1. VARIABLES ESTADSTICAS
UNIDIMENSIONALES.
1.1 Variables estadsticas. Tablas estadsticas. Representaciones
grficas.
El trmino Estadstica procede del latn status debido a que sus primeras aplicaciones tuvieron
que ver con la recogida y cuantificacin de informacin referente al estado: censos de poblacin,
ejrcito, cosechas, impuestos, etc. El trmino estadstica o estadsticas en muchos casos hace
referencia a una cantidad de informacin, por ejemplo estadsticas de precios, estadsticas de
produccin, etc.
La descripcin de esta informacin es el objetivo de la Estadstica Descriptiva. Para llevar a cabo
esta tarea fundamentalmente nos apoyaremos en las representaciones grficas de dichos datos y en
su sntesis mediante medidas que resuman las caractersticas ms relevantes.
Podemos distinguir, fundamentalmente, dos tipos de fenmenos:
Fenmenos causales o determinsticos: Son aquellos que presentan los mismos resultados si
se realizan en idnticas condiciones (por ejemplo las reacciones qumicas).
Fenmenos aleatorios o estadsticos: Son los que no se puede predecir el resultado aunque
sean conocidas las condiciones de realizacin (por ejemplo el lanzamiento de una moneda).
Fenmenos de naturaleza social, econmica,... en los que la incertidumbre de su
comportamiento se debe tambin a la imposibilidad de repetirlos en las mismas condiciones,
son tratados como fenmenos estadsticos.
Se denomina poblacin al conjunto de elementos sobre los que se quiere realizar un estudio. En la
prctica se observa un subconjunto de la poblacin que debe ser representativo y al que llamamos
muestra.
Entre otras muchas razones para restringirnos al estudio de muestras destacamos:
Economa y precisin. El estudio de una poblacin completa puede llevar a cometer muchos
errores, mientras que en una muestra se puede dedicar ms atencin a la calidad de los datos.
Variables continuas: pueden tomar todos los valores de un intervalo (estatura, peso,...)
En la prctica toda variable es discreta debido a la precisin limitada de los aparatos de medida, por
ello distinguiremos entre variables con pocas modalidades (discretas) y variables que toman un
gran nmero de valores distintos (donde se incluyen las variables continuas y otras muchas
magnitudes sociales y econmicas como salarios, poblacin de ciudades,...)
Tablas estadsticas.
Una vez recogidos los datos se procede a su descripcin con la finalidad de obtener el mayor
conocimiento acerca del fenmeno.
El primer paso de esta descripcin consiste en la ordenacin, clasificacin, recuento y
representacin de los datos. Posteriormente se procede a resumirlos en cantidades que miden
caractersticas del fenmeno.
EJEMPLO 1.1
Un estudio sobre el tipo de vivienda en construccin en una gran urbe ha aportado los siguientes
datos
TIPO
Colectiva
Unifamiliar
total
Nmero de
dormitorios
1
2
3
4
5
total
56
14
70
7
14
21
21
7
70
EJEMPLO 1.2
Para conocer el salario/hora de los trabajadores de un sector se ha observado una muestra de 100.
Los datos se han recogido en la siguiente tabla
8
Salario/hora
0-10
10-20
20-40
40-50
total
25
40
20
15
100
=n
i =1
fi =
ni
n
A menudo las frecuencias relativas se multiplican por 100 para expresar en tanto por ciento la
medida en que se presenta cada modalidad o intervalo de valores.
La frecuencia absoluta acumulada de la modalidad o intervalo i, Ni , es el nmero de veces que se
han observado valores menores o iguales que dicha modalidad o intervalo.
i
Ni = n j
j =1
Li 1 Li
xi
ni
fi
Ni
Fi
L0 L1
L1 L2
...
Lk 1 Lk
x1
x2
...
xk
n1
n2
...
nk
f1
f2
...
fk
N1
N2
...
Nk
F1
F2
...
Fk
EJEMPLO 1.3
Usando los datos de los ejemplos 1.1 y 1.2.
xi
Colectiva
Unifamiliar
total
ni
56
14
70
fi
0,80
0,20
1
xi
1
2
3
4
5
total
ni
7
14
21
21
7
70
Ni
7
21
42
63
70
fi
0,10
0,20
0,30
0,30
0,10
1
Fi
0,10
0,30
0,60
0,90
1
Li 1 Li
xi
ni
fi
Ni
Fi
0,25
0-10
5
25
0,25
25
0,65
65
10-20
15
40
0,40
0,85
85
20-40
30
20
0,20
1
40-50
45
15
0,15 100
total
100
1
Nota: en variables de tipo continuo cada intervalo de valores o clase est representado por su punto
medio o marca de clase, xi .
Cada da ms, debido al uso de los ordenadores (hojas de clculo, programas de estadstica,...), la
representacin numrica de los datos se reduce a escribir en una columna los valores observados sin
ordenarlos, clasificarlos o contarlos (sin frecuencias), tal y como aparece en la siguiente imagen.
xi
x1
x2
...
xn
10
Representaciones grficas.
Aunque es cierto que una tabla estadstica contiene toda la informacin observada de un fenmeno,
es conveniente en ocasiones traducir toda esa informacin en un grfico que nos permita realizar
una rpida sntesis visual.
Entre las representaciones grficas ms utilizadas estn el diagrama de barras, histograma, y
diagrama de sectores.
DIAGRAMA DE BARRAS
La longitud de la barra nos informa de la frecuencia con que se ha observado cada valor de la
variable.
Nmero de
dormitorios
1
2
3
4
5
25
ni
20
7
14
21
21
7
15
10
5
0
1
HISTOGRAMA
En esta representacin y en la siguiente es el rea de las figuras utilizadas (rectngulos o sectores) la
que nos indica con qu frecuencia se observa cada clase o modalidad
Li 1 Li
0-10
10-20
20-40
40-50
ni
25
40
20
15
ai
10
10
20
10
hi
2,5
4
1
1,5
La pirmide de poblacin consiste en dos histogramas colindantes, uno para la edad de los
hombres y otro para la edad de las mujeres. La tpica forma triangular de este grfico le ha dado el
nombre de pirmide de poblacin.
11
DIAGRAMA DE SECTORES
xi
Colectiva
Unifamiliar
total
ni
56
14
70
fi
0,80
0,20
1
sector
0,80x360=288
0,20x360=72
360
Colectiva
Unifamiliar
12
Momentos no centrados.
Se definen los momentos no centrados (o respecto al origen) como:
ar =
k
1 k r
xi ni = xir f i
n i =1
i =1
ar =
1 n r
xi
n i =1
Propiedades:
El momento no centrado a1 se conoce tambin como media (aritmtica) y se suele notar como
x.
a0 = 1 .
Momentos centrados.
Se definen los momentos centrados (o respecto a la media) como:
mr =
k
r
1 k
x
x
n
=
xi x
i
i
n i =1
i =1
mr =
1 n
xi x
n i =1
fi
Propiedades:
m0 = 1, m1 = 0 .
k
m2 =
i =1
xi x ni
xi2ni
i =1
x ni
i =1
2 xxi ni
i =1
xi2ni
i =1
x
+
ni
i =1
2 x xi ni
i =1
13
xi
3
3
2
2
3
5
18
xi2
xi3
xi4
9
9
4
4
9
25
60
27
27
8
8
27
125
222
n
1
18
x = a1 = xi = = 3
n i =1
6
1 n
222
a3 = xi3 =
= 37
n i =1
6
81
81
16
16
81
625
900
1 n 2 60
xi = 6 = 10
n i =1
1 n
900
a4 = xi4 =
= 150
n i =1
6
a2 =
xi
ni
xi ni
1
2
3
4
5
total
xi2ni
xi3ni
7
7
7
14
28
56
21
63
189
21
84
336
7
35
175
n=70
217
763
k
1
217
x = a1 = xi ni =
= 3'1
70
n i =1
1 k
2905
= 41'5
a3 = xi3 ni =
n i =1
70
xi4ni
7
7
112
224
567
1701
1344
5376
875
4375
2905
11683
k
1
763
a2 = xi2 ni =
= 10 '9
70
n i =1
1 k
11683
= 166 '9
a4 = xi4 ni =
n i =1
70
Li 1 Li
0-10
10-20
20-40
40-50
total
xi
5
15
30
45
ni
xi2ni
xi ni
25
125
40
600
20
600
15
675
n=100
2000
1 k
2000
x = a1 = xi ni =
= 20
a2
n i =1
100
1 k
2045000
a3 = xi3 ni =
= 20450
a4
n i =1
100
xi3ni
xi4ni
625
3125
15625
9000 135000 2025000
18000 540000 16200000
30375 1366875 61509375
58000 2045000 79750000
1 k
58000
= xi2 ni =
= 580
n i =1
100
1 k
79750000
= xi4 ni =
= 797500
n i =1
100
14
xi
( x x) ( x x) ( x x)
2
xi x
3
3
2
2
3
5
total
1 n
m1 =
n i =1
1 n
m3 =
n i =1
0
0
-1
-1
0
2
0
(x
(x
0
0
1
1
0
4
6
0
0
-1
-1
0
8
6
0
0
1
1
0
16
18
1 n
xi x
n i =1
1 n
m4 = xi x
n i =1
0
=0
6
6
= =1
6
x =
x
m2 =
6
=1
6
18
= =3
6
=
Tambin podramos haberlos calculado en funcin de los momentos no centrados que hemos
obtenido en el ejemplo 1.4. El momento centrado de orden dos (varianza) se suele calcular as
1 n
2
S 2 = m2 = a2 a12 = xi2 x = 10 32 = 1
n i =1
Dado que los clculos para tablas con frecuencias son anlogos para variables discretas y continuas,
incluimos un solo ejemplo de momentos centrados con frecuencias.
Tabla con frecuencias. Variable continua.
Li 1 Li
xi
ni
( x x) ( x x) n ( x x)
i
0-10
5
25
10-20
15
40
20-40
30
20
40-50
45
15
total
n=100
k
1
0
m1 = xi x ni =
=0
100
n i =1
3
1 k
165000
m3 = xi x ni =
n i =1
100
-15
-5
10
25
ni
-375
-200
200
375
0
5625
1000
2000
9375
18000
1 k
n i =1
1 k
m4 =
n i =1
m2 =
= 1650
( x x) n ( x x)
3
ni
-84375
1265625
-5000
25000
20000
200000
234375
5859375
165000
7350000
2
18000
xi x ni =
= 180
100
4
7350000
xi x ni =
= 73500
100
Tambin podramos haberlos calculado en funcin de los momentos no centrados que hemos
obtenido en el ejemplo 1.4. El momento centrado de orden dos (varianza) se suele calcular as
1 k
2
S 2 = m2 = a2 a12 = xi2 ni x = 580 202 = 580 400 = 180
n i =1
15
Clculos como los anteriores, dispuestos en forma de tabla, son muy fciles de hacer con la ayuda
de una hoja de clculo.
1.3
Medidas de posicin.
Las distintas medias, la moda y la mediana tratan de representar mediante un solo valor a un
conjunto de datos y suelen tomar una posicin central respecto de los mismos, motivo por el que son
conocidas como medidas de posicin central.
Media aritmtica.
Es el promedio ms familiar y utilizado en los ms diversos mbitos, aunque no es el nico ni el
ms adecuado en todas las ocasiones. Se define como
x=
k
1 k
x
n
=
xi fi
i
n i =1 i
i =1
x=
1 n
x
n i =1 i
EJEMPLO 1.6.
xi
1
2
3
4
5
total
Li 1 Li
0-10
10-20
20-40
40-50
total
ni
7
14
21
21
7
70
xi
5
15
30
45
xi ni
7
28
63
84
35
217
ni
25
40
20
15
100
xi ni
125
600
600
675
2000
x=
1 k
217
xi ni =
= 3,1
n i =1
70
x=
1 k
2000
xi ni =
= 20
n i =1
100
16
x 1 n1 + ... + x s ns 1 s
= x i ni
n1 + ... + ns
n i =1
Con frecuencia se dividen o multiplican los valores de la variable por una constante, exi
(cambio de escala), por ejemplo cuando decidimos expresar los valores en millones en lugar
de en euros (en $ en lugar de ,). En otras ocasiones se suma o resta una constante a los
valores de la variable, xi + c (cambio de origen). Si realizamos una o ambas
transformaciones sobre la variable original obtenemos una nueva variable, yi = exi + c , cuya
media est relacionada con la media de la variable de partida segn:
y = ex + c
1 k
1 k
1 k
1 k
1 k
1 k
yi ni = exi + c ni = exi ni + cni = e xi ni + c ni = ex + c
n i =1
n i =1
n i =1
n i =1
n i =1
n i =1
y=
Media geomtrica.
G=
= n x1 1 ...xk k
= n x1 ...xn
i =1
G=
i =1
La media geomtrica se utiliza para promediar porcentajes, tasas, ndices de precios,... es decir, en
aquellos casos en los que la variable representa variaciones acumulativas. La media geomtrica es
menor que la media aritmtica calculada sobre los mismos datos.
EJEMPLO 1.7.
El valor de la vivienda ha sufrido en los ltimos 5 aos los siguientes incrementos
incremento
6%
5%
17%
20%
14%
Obtenga el incremento anual medio del valor de la vivienda en estos cinco aos.
17
Solucin:
Una vivienda cuyo valor fuese V0 al comienzo de estos cinco aos alcanzara un valor
V1 = V0 +
6
V0 = 1, 06V0
100
V2 = V1 +
5
V1 = 1, 05V1 = 1, 05 1, 06 V0
100
V5 = 1,14 1, 20 1,17 1, 05 1, 06 V0
V5
= 1, 7814
V0
V5 = 1,7814V0
Luego ha habido un incremento del precio de la vivienda en los ltimos cinco aos del 78,14%
(0,7814 por uno).
El incremento medio anual ser aquel valor r (en tanto por uno) tal que si se hubiera observado
durante todo el periodo (ltimos 5 aos) ese incremento constante, el resultado final habra sido el
mismo
1+ r =
V5
V0
1+ r =
Vn
V0
V5
, otra forma de expresar r es
V0
18
Utilizaremos esto ltimo cuando se desconozcan los incrementos anuales (6%, 5%,) pero se
conozcan los valores inicial ( V0 ) y final ( Vn ) del bien que se est analizando (como en el ejemplo
1.8)
La media aritmtica no es adecuada en este contexto como puede verse
0,06 + 0, 05 + 0,17 + 0, 20 + 0,14
= 0,124
5
6% + 5% + 17% + 20% + 14%
r=
= 12, 4%
5
r=
Segn la media aritmtica habra un incremento del valor de la vivienda en los 5 aos de
(1,124 )
= 1, 794 79, 4% ,
EJEMPLO 1.8.
Una vivienda que en el ao 2000 se compr por 125.000 se ha vendido en el ao 2007 por
500.000. Otra vivienda que se compr en 1995 por 100.000 se vendi en el 2006 por 700.000.
Cul de las viviendas increment ms su valor?
Solucin:
Responderemos apoyndonos en el incremento anual medio observado en el valor de cada vivienda.
7
V2007 7 500.000 7
=
= 4 = 1, 219 incremento anual medio del 21,9% (primera vivienda)
V2000
125.000
11
V2006 11 700.000 11
=
= 7 = 1,1935 incremento anual medio del 19,35% (segunda vivienda)
V1995
100.000
La primera vivienda experiment un incremento anual medio del 21,9% en su valor mientras que la
segunda experiment un incremento menor, 19,35%.
Media armnica.
H=
H=
n
ni
i =1 xi
k
n
n
i =1 xi
19
10 + 60
= 35 Km / h , que no es la solucin.
2
Entendiendo por velocidad media aquella velocidad constante a la que si se realizara el recorrido se
tardara lo mismo, claramente 35 Km/h no lo cumple.
30 + 30
30
30
= 1, 7143 h mientras que hemos tardado
= 3 h en subir y
= 0,5 h en bajar, en total 3
35
10
60
horas y media.
La solucin sera la media armnica H =
2
2
x
i =1
2
2
=
= 17,1429 km / h
1 1 0,10 + 0, 0167
+
10 60
30 + 30
= 3, 49999 h , es decir 3,5 h (la diferencia que se
17,1429
observa es debida a los errores de redondeo), lo que realmente se ha tardado en la subida y bajada.
Nota:
Utilizando el valor de las distancias recorridas, la media se hubiera calculado como
H=
2
2
x
i =1
2
60
=
1 1
30 30
+
+
10 60 10 60
y en general
H=
D
D
distancia total
=
=
d
di d1
+ ... + k tiempo total como suma de los tiempos parciales
v1
vk
i =1 vi
k
EJEMPLO 1.10.
Una agencia inmobiliaria ha vendido las siguientes viviendas
20
Precio
Superficie
precio / m2
4.000
240.000
60
2.000
180.000
90
100
4.200
420.000
Cual ha sido el precio medio al que ha vendido el metro cuadrado.
Solucin:
ni
240.000
180.000
420.000
840.000
ni
xi
60
90
100
250
xi
4.000
2.000
4.200
H=
n
840.000
Precio total
=
=
= 3.360 / m2
ni
250
Superficie total
i =1 xi
k
Todos aquellos datos que representen precios por unidad como cambio de divisas (p.e., $/, /$),
precios de alimentacin, combustibles,... (p.e., /Kg, /l), precio de la vivienda por m2 (/m2), etc.,
se promedian utilizando la media armnica.
Hay ms tipos de medias, como la media cuadrtica, , que no estudiaremos en esta asignatura.
Moda.
Es el valor que se presenta con ms frecuencia. Se nota Mo. Puede haber varias modas.
Para variables discretas y atributos su clculo es inmediato. En las variables continuas la mayor
o menor frecuencia de las observaciones en un intervalo depende en parte de su amplitud, por lo que
para calcular la moda consideraremos las frecuencias observadas en conjuntos de igual amplitud
(amplitud unidad).
Dentro del intervalo modal (el de mayor frecuencia por unidad de amplitud, mayor altura en el
histograma) hay que seleccionar un punto como moda, para lo cual no hay un nico criterio.
Sealaremos tres criterios diferentes que notaremos como Mo( I ), Mo( II ) y Mo( III ) .
Mo( I ) =
Li 1 + Li
= xi
2
Otro criterio sita la moda a una distancia de los extremos del intervalo proporcional a las alturas de
los intervalos anterior y posterior al intervalo modal:
Mo( II ) = Li 1 +
hi +1
ai
hi 1 + hi +1
21
Y el tercero tiene en cuenta un procedimiento grfico para situar la moda dentro del intervalo
modal:
Mo( III ) = Li 1 +
hi hi 1
a
( hi hi1 ) + ( hi hi +1 ) i
En las expresiones anteriores Li 1 es el extremo inferior del intervalo modal, ai la amplitud del
intervalo modal y hi la altura del intervalo modal ( hi 1 la altura del intervalo anterior, hi +1 la altura
del intervalo posterior).
EJEMPLO 1.11.
Mo=3
xi
1
2
ni
7
14
3
4
21
21
7
n = 70
Li 1 Li
0-10
ni
25
30
40
15
n = 100
10-20
20-40
40-50
Mo( I ) =
Mo=4
ai
10
10
20
10
hi
2,5
3
2
1,5
TIPO
ni
Colectiva
56
Unifamiliar
total
14
70
Mo=Colectiva
Li 1 + Li 10 + 20
=
= 15
2
2
Mo( II ) = Li 1 +
hi +1
2
ai = 10 +
10 = 14, 44
hi 1 + hi +1
2,5 + 2
Mo( III ) = Li 1 +
hi hi 1
3 2,5
ai = 10 +
10 = 13,33
( hi hi1 ) + ( hi hi+1 )
( 3 2,5) + ( 3 2 )
Mediana.
Es aquel valor, Me, que divide a la muestra ordenada en dos partes iguales, es decir, hay el mismo
nmero de datos menores que la mediana como mayores que ella.
Si hay un nmero impar de observaciones, la mediana es el nico valor central
5, 10, 30, 45, 50 Me=30
22
Si hay un nmero par de observaciones, la mediana es el punto medio de los dos valores centrales
5, 10, 30, 45
Me=(10+30)/2=40/2=20
Si tenemos los datos representados en una tabla estadstica la mediana se calcula buscando el valor
que deja por debajo de l una frecuencia acumulada igual a
n
2
EJEMPLO 1.12.
Para variables discretas buscamos en la columna de frecuencias absolutas acumuladas el valor
n
,
2
n 70
= 35
=
2 2
xi
1
2
3
4
5
xi
1
2
3
4
5
ni
7
14
14
28
7
n = 70
ni
7
14
21
21
7
n = 70
Ni
7
21
35
Me =
es:
63
70
Ni
7
21
42
63
70
n
, en cuyo caso la mediana
2
xi + xi +1 3 + 4
=
= 3,5 ,
2
2
n
. Entonces, se
2
n
, siendo la modalidad xi asociada a esa
2
Li 1 Li
0-10
10-20
20-40
40-50
Li 1 Li
100-110
110-120
120-140
140-150
ni
20
30
35
15
n = 100
ai
10
10
20
10
ni
25
40
20
15
n = 100
n
. La mediana es el extremo superior del intervalo
2
Ni
20
Ni =
50
85
100
Ni
25
65
85
100
Me = Li = 20
Todos los Ni
n
. La mediana est en el intervalo donde
2
n
y se calcula mediante:
2
23
n
Ni 1
50 25
Me = Li 1 + 2
ai = 110 +
10 = 116, 25
ni
40
que es el resultado de repartir homogneamente las 40 observaciones sobre la amplitud 10 del
intervalo. Segn la tabla, hasta 110 hay una frecuencia acumulada de 25, hasta 120 hay una
frecuencia acumulada de 65 (por tanto 40 observaciones entre 110 y 120), luego el valor Me hasta
el que hay una frecuencia acumulada de
n
= 50 estar entre 110 y 120. Si las observaciones se
2
120 110
40
=
Me 110 50 25
120 110
( 50 25) = Me 110
40
120 110
= Amplitud entre cada una de las 40 observaciones del intervalo 110-120.
40
10
40
=
Me 110 50 25
Me 110 50 25
50 25
50 25
=
Me 110 =
10 Me = 110 +
10
10
40
40
40
Percentiles.
Estas medidas ( P1 ,..., P99
nmero de observaciones,
n
n
, habiendo por tanto
observaciones menores que P . La
100
100
mediana coincide con P50 . Salvo este percentil, el resto de percentiles ocupan una posicin no
central respecto de los datos de la muestra, propiedad por la que reciben la denominacin de
medidas de posicin no central.
Otros
( Q1 = P25 ,
casos
particulares
de
percentiles
los
denominados
cuartiles
observaciones,
n
, y los deciles ( D1 = P10 , D2 = P20 , ..., D9 = P90 ) que dividen a la muestra en 10
4
24
son
n
.
10
n
n
n
= 50
por
2
100
100
xi
1
2
3
4
5
ni
7
14
14
28
7
n = 70
Li 1 Li
100-110
110-120
120-140
140-150
ai
10
10
20
10
n
= 30
100
Ni
7
21
35
63
70
30
n
x +x
2+3
= 21 P30 = i i +1 =
= 2,5
100
2
2
85
n
= 59,5 P85 = 4
100
ni
25
40
20
15
n = 100
Ni
25
65
85
100
85
n
= 85 P85 = 140
100
n
n
P est en el intervalo donde por primera vez Ni >
100
100
n
n
se calcula con una expresin similar a la de la mediana, sustituyendo
por
, que es el
2
100
resultado de repartir homogneamente las observaciones sobre la amplitud del intervalo
n
Ni 1
100
P = Li 1 +
ai
ni
n
30
Ni 1
30 25
100
10 = 111, 25
P30 = Li 1 +
ai = 110 +
40
ni
30
Ni
EJEMPLO 1.14.
Los saldos de las cuentas abiertas por los clientes de una sucursal bancaria se distribuyen de
acuerdo a la siguiente tabla
25
SALDOS
NUMERO DE CLIENTES
0-200
100
200-1.000
400
1.000-5.000
300
5.000-30.000
50
Se consideran clientes preferentes al 10% de los clientes con mayores saldos, cul ha de ser el
saldo para que un cliente sea considerado como tal?
Qu porcentaje de clientes tienen un saldo superior a 900?
Solucin:
SALDOS
NUMERO DE CLIENTES
0-200
200-1.000
1.000-5.000
5.000-30.000
100
400
300
50
n = 850 90
P90 = Li 1 +
90
Ni
100
500
800
850
850
= 765
100
n
Ni 1
765 500
100
4000 = 4533,33
ai = 1000 +
300
ni
P = Li 1 +
n
850
Ni 1
100
100
100
800 = 52,94
ai = 900 = 200 +
400
ni
El 52,94% de los clientes tienen un saldo inferior a 900, por tanto un 47,06% =(100-52.94)% de
clientes tienen un saldo superior a 900.
Considerando el reparto homogneo de las observaciones en cada intervalo, las anteriores
cuestiones se podran haber resuelto tambin de la siguiente manera
5000 1000 800 500
4000
300
4000 265
=
=
P90 1000 =
= 3533,33 P90 = 4533,33
P90 1000
765 500
P90 1000 265
300
1000 200 500 100
800
400
400 700
=
=
x 100 =
= 350 x = 450 . Hay 450 clientes
x 100
900 200
700 x 100
800
26
450
100 = 52,94% .
850
1.4
Medidas de dispersin.
Las medidas de dispersin cuantifican la variabilidad o esparcimiento de los datos. Cuando esta
dispersin se mide respecto de alguna medida de posicin central (por ejemplo, la media) nos indica
la mayor o menor representatividad de dicha medida.
Recorridos
El recorrido o rango R se define como la diferencia entre los valores extremos.
R=mximo-mnimo
Es la medida de dispersin ms fcil de calcular pero tiene el inconveniente de que slo utiliza dos
valores (estando sujeta a posibles datos errneos) por lo que no nos da una medida precisa de la
dispersin de todos los datos.
El recorrido intercuartlico RI se define como la diferencia entre el tercer y primer cuartil,
RI = Q3 Q1 = P75 P25
representa la amplitud del intervalo donde se encuentra el 50% de las observaciones centrales de la
muestra. Con esta medida se evita la fuerte influencia que tienen los valores extremos en el
recorrido R.
Con la misma idea se pueden definir distintos recorridos utilizando otros percentiles.
Varianza
S2 =
2
1 k
xi x ni
n i =1
S2 =
1 n
xi x
n i =1
27
Con frecuencia se dividen o multiplican los valores de la variable por una constante, exi (cambio de
escala), por ejemplo cuando decidimos expresar los valores en millones en lugar de en euros (en $
en lugar de en ,). En otras ocasiones se suma o resta una constante a los valores de la variable,
(los cambios de origen en los valores de la variable no afectan al valor de la varianza, pero s los
cambios de escala).
((
2
2
2
1 k
1 k
1 k
1 k
y
y
n
=
ex
+
c
ex
c
n
=
ex
ex
n
=
i
i
i
e xi x
i
i
i
n i =1
n i =1
n i =1
n i =1
2
2
1 k
1 k
= e 2 xi x ni = e2 xi x ni = e 2 S x2
n i =1
n i =1
S y2 =
))
ni =
mr ( y) = er mr ( x)
Desviacin tpica.
La medida de dispersin absoluta ms utilizada es la desviacin tpica, S.
S = S2
Las calculadoras cientficas nos permiten obtener fcilmente algunos valores estadsticos con la
opcin SD, entre ellos la desviacin tpica S = n y elevndola al cuadrado obtenemos la varianza
S2 .
Los cambios de origen en los valores de la variable no afectan al valor de la desviacin tpica, pero
s los cambios de escala segn la expresin S y = e S x .
EJEMPLO 1.15.
Calcule el rango, la varianza y la desviacin tpica para la siguiente distribucin de frecuencias.
Li 1 Li
0-10
10-20
20-30
30-40
28
ni
1
2
3
4
10
Solucin:
R=40-0=40
Li 1 Li
ni
0-10
10-20
20-30
30-40
xi
1
5
2 15
3 25
4 35
10
xi ni
5
30
75
140
250
( x x) ( x x)
2
ni
400
200
0
400
1000
400
100
0
100
x=
1 k
250
xi ni =
= 25
n i =1
10
S2 =
2
1 k
1000
xi x ni =
= 100
n i =1
10
S = S 2 = 100 = 10
Desigualdad de Tchebycheff
Esta desigualdad nos permite entender mejor el significado de la desviacin tpica como medida
de dispersin.
Dado un conjunto de datos con media x y desviacin tpica S , la proporcin de datos en el
1
(k>1).
k2
1
p xi x kS , x + kS 1 2
t
t2
k 2 = 2 , dice
S
S
S2
.
t2
Por ejemplo, para k=2, x 2 S , x + 2 S , tenemos que alejndonos de la media dos desviaciones
tpicas, a la derecha e izquierda, abarcaramos ms del 75% de las observaciones,
1
1
= 1 2 = 0, 75 .
2
k
2
EJEMPLO 1.16.
Se sabe que el nmero medio de unidades diarias de un determinado producto que vende un
supermercado es x = 100 y la desviacin tpica S = 40 . Si cada da el supermercado repone hasta
completar 200 unidades del producto en sus estanteras:
Cuntos das al ao la demanda ser mayor que su oferta?
Cunto habra que reponer para asegurar que no va a faltar producto en las estanteras el 95% de
los das?
29
Solucin:
x + t = 200 t = 100
la
proporcin
de
observaciones
dentro
del
intervalo
1600
S2
= 0,84 y por tanto fuera de dicho
x t , x + t = ( 0, 200 ) es mayor o igual que 1 2 = 1
t
10000
S2
1600
1600
= 1 2 = 0,95
= 32000 = t 2
2
t
t
0, 05
t = 178,9 x + t 279
Reponiendo hasta completar 279 unidades en las estanteras aseguramos que ms del 95% de los
das no faltar producto en el supermercado.
Variable tipificada
Se define la variable X tipificada como la nueva variable obtenida al realizar el siguiente cambio
Z=
X x
S
Esta nueva variable se caracteriza por tener media cero y desviacin tpica 1.
La tipificacin de variables se puede utilizar para establecer comparaciones entre valores de dos
variables (por ejemplo, las calificaciones de dos alumnos en dos centros diferentes).
EJEMPLO 1.17.
Se quiere comparar los precios de dos viviendas con las mismas caractersticas, una en Madrid y
otra en Granada. El precio medio de las viviendas del tipo considerado es 200.000 en Madrid y
140.000 en Granada, las desviaciones tpicas son respectivamente 20.000 y 15.000. Las dos
viviendas a comparar tienen unos precios de 260.000 (Madrid) y 190.000 (Granada). cul de las
dos viviendas est alcanzando un mayor valor en su mercado?
Solucin:
3,33 > 3
que la de Madrid.
Una vivienda con las caractersticas de la de Granada en Madrid tendra un precio de unos 266.600
x 200.000
= 3,33 x = ( 20.000 3,33) + 200.000 = 266.600
20.000
30
Los recorridos, la varianza y la desviacin tpica son medidas de dispersin absoluta que
dependen de la unidad de medida de la variable (y por tanto les afecta el cambio de escala), lo
anterior conlleva que no se puedan comparar estas medidas en dos variables con distinta unidad de
medida. En la prctica para evitar este problema se prefiere trabajar con otras medidas de
dispersin, obtenidas de las anteriores, que se denominan medidas de dispersin relativa. Las
medidas de dispersin relativa son adimensionales (no dependen de la unidad de medida de la
variable estadstica y por tanto no les afectan los cambios de escala)
Coeficiente de Variacin.
Es la medida de dispersin relativa ms utilizada. Se define como el cociente de la desviacin
tpica sobre la media aritmtica
CV =
S
x
Esta medida es invariante frente a cambios de escala pero le afecta los cambios de origen.
EJEMPLO 1.18.
La distribucin de los salarios mensuales de 10 trabajadores con igual cualificacin profesional es
Salarios en
cientos de
0-10
10-20
20-30
30-40
ni
1
2
3
4
10
El horario de trabajo no es nico para todos, siendo 6 el nmero medio de horas trabajadas cada da
y 1 hora la desviacin tpica. Es coherente la distribucin de los salarios con la de las horas
trabajadas?
Razonamiento:
Si todos los empleados trabajan las mismas horas, lo coherente es que reciban el mismo salario (la
variacin del salario sera cero y tambin la del nmero de horas). Quien trabaje ms debe recibir
ms salario y quien trabaje menos debe recibir menos, es decir, debe haber la misma variabilidad en
las horas trabajadas que en los salarios percibidos.
Solucin:
La media y desviacin tpica de los salarios segn hemos calculado en el ejemplo 1.15 sobre estos
mismos datos son:
31
x=
1 k
250
xi ni =
= 25
n i =1
10
S = S 2 = 100 = 10
CV ( salarios) =
10
= 0, 4
25
1
= 0,167 . La dispersin en los salarios es ms del doble que en las
6
horas trabajadas, luego no es coherente la distribucin de salarios en relacin con las horas de
trabajo.
y=salario
pero si CVx CV y
EJEMPLO 1.19.
Las subvenciones, en millones de euros, a las pequeas empresas en 2006 y 2007 segn
comunidades autonmicas se recogen en la siguiente tabla
ANDALUCIA
ARAGON
ASTURIAS
BALEARES
CANARIAS
CANTABRIA
CASTILLA LA MANCHA
CASTILLA LEON
CATALUA
COMUNIDAD VALENCIANA
EXTREMADURA
GALICIA
MADRID
MURCIA
NAVARRA
PAIS VASCO
LA RIOJA
2006
42,95
5,91
2,23
1,24
3,29
7,20
11,02
11,15
25,89
17,26
6,08
6,75
8,15
9,78
1,84
7,88
1,38
2007
69,15
19,25
28,5
12,5
25,8
16,25
19,5
26,05
58,2
58,35
41,5
29
13,55
25,35
15,5
34,35
17,2
Se han mantenido las diferencias entre las subvenciones recibidas en 2006 y 2007? Si han variado,
indique en qu sentido.
32
Solucin:
2006
( x x)
xi
ANDALUCIA
ARAGON
ASTURIAS
BALEARES
CANARIAS
CANTABRIA
CASTILLA LA MANCHA
CASTILLA LEON
CATALUA
COMUNIDAD VALENCIANA
EXTREMADURA
GALICIA
MADRID
MURCIA
NAVARRA
PAIS VASCO
LA RIOJA
TOTAL
n = 17
S x2 =
1 n
xi x
n i =1
x=
2
42,95
5,91
2,23
1,24
3,29
7,20
11,02
11,15
25,89
17,26
6,08
6,75
8,15
9,78
1,84
7,88
1,38
170,00
S x = S x2 = 10, 22
CV2006 =
S x 10, 22
=
= 1, 022
10
x
S y2 =
y=
( y y)
yi
1085,7025
16,7281
60,3729
76,7376
45,0241
7,84
1,0404
1,3225
252,4921
52,7076
15,3664
10,5625
3,4225
0,0484
66,5856
4,4944
74,3044
1774,75
1 n
170
xi =
= 10
n i =1
17
1774, 75
= 104, 40
17
2007
69,15
19,25
28,5
12,5
25,8
16,25
19,5
26,05
58,2
58,35
41,5
29
13,55
25,35
15,5
34,35
17,2
510,00
1532,7225
115,5625
2,25
306,25
17,64
189,0625
110,25
15,6025
795,24
803,7225
132,25
1
270,6025
21,6225
210,25
18,9225
163,84
4706,79
1 n
510
yi =
= 30
n i =1
17
1 n
yi y
n i =1
4706, 79
= 276,87
17
S y = S y2 = 16, 64
CV2007 =
Sy
y
16, 64
= 0,555
30
Las diferencias entre las subvenciones recibidas por las distintas comunidades autonmicas han
disminuido en 2007 en relacin al ao anterior.
33
m3
S3
Se basa en que en distribuciones simtricas por cada observacin a la derecha de la media hay otra a
igual distancia a la izquierda, por tanto la expresin
n
( x x)
i
=0
i =1
Si la distribucin es simtrica g1 = 0
El signo de g1 lo aporta m3 , se define dividiendo por S 3 para conseguir que el coeficiente sea una
medida adimensional que pueda compararse con la asimetra de otras distribuciones, adems
tambin se consigue as que sea independiente de cambios de origen y escala.
g2 =
m4
3
S4
origen y escala.
Los valores del coeficiente de curtosis de Fisher se interpretan de la siguiente manera:
34
1.6
Medidas de concentracin.
Las medidas de concentracin miden la mayor o menor igualdad en el reparto de una cantidad (por
ejemplo, la masa salarial total de una empresa, ). Ante este problema eminentemente econmico,
medidas estadsticas como la media, la varianza, , no son significativas, por lo que es necesario
construir unos indicadores especficos. Debido a la naturaleza de los fenmenos que aqu se
consideran, las variables tomarn slo valores positivos (por ste y otros motivos, no deben hacerse
cambios de origen).
La caracterstica que se va a estudiar puede presentar las siguientes situaciones lmite:
Mxima concentracin: Cuando un solo individuo recibe la cantidad total a repartir y el resto
nada.
Entre ambas situaciones extremas hay infinidad de situaciones intermedias que trataremos de
cuantificar con las siguientes medidas de concentracin:
Li 1 Li
ni
35
Li 1
Li
xi
ni
xi ni
k
n = 25
Ni
x n
j
= 73000
j =1
ui
pi
qi
Donde ni son los trabajadoress en cada intervalo, xi ni es la suma de los saalarios de los trabajadores
en cada intervalo, acumulandoo los anteriores valores obtenemos respectivam
mente Ni y ui .
i
Ni = n j
j =1
ui = x j n j
j =1
(representan el nmero de trabajadores y la suma de los salarios de todos los trabajadores hasta el
intervalo i)
Por ltimo, pi y qi son los vaalores Ni y ui expresados en porcentajes.
pi =
Ni
100
n
qi =
ui
100
x n
j
j =1
( pi , qi ) , i = 1, ..., k
, a los que se aade el punto (00, 0). Como puede verse en el grfico, la curvva de Lorenz siempre parte
del punto (0, 0) y termina en el
e punto (100, 100).
36
ndice de Gini.
El ndice de Gini cuantifica laa anterior propiedad de la curva de Lorenz baasndose en la distancia de
los puntos
( pi , qi ) ,
i = 1, ...., k 1 ,
( pk , qk ) = (100 , 100) ].
k 1
IG =
( pi qi )
i =1
k 1
k 1
= 1
i =1
i =1
k 1
i =1
pi = qi
i = 1, ..., k 1 IG = 0
qi = 0 i = 1, ..., k 1 , qk = 100 I G = 1
Luego el ndice de Gini es un valor entre 0 y 1 que mide la concenntracin, indicando mayor
concentracin cuanto mayor seea y mayor equidistribucin cuanto menor sea.
Apuntes de Tcnicas Cuantitativass 1. Jos Alberto Hermoso Gutirrez.
37
IG = 1
253,5
= 0,1769 .
308
(Obsrvese que a la suma de los pi y qi se ha restado 100 puesto que pk = 100 y qk = 100 no se
incluyen en el clculo del ndice de Gini)
Mediala.
La mediala o valor medial, Ml, es aquel valor tal que la suma de las observaciones menores que l
es igual a la suma de las observaciones mayores que l.
Se trata pues de una mediana sobre los valores xi ni en lugar de sobre las frecuencias ni . Su clculo
se realiza de forma anloga, buscando el valor de la variable asociado a la mitad de la cantidad total
k
x n
j
repartida,
j =1
Ml = Li 1 +
50 qi 1
50 qi 1
ai = Li 1 +
ai
qi qi 1
( ni xi ) %
Ml = 2500 +
50 23,3
1000 = 3311,55
56, 2 23,3
M = Ml Me
En el ejemplo anterior
38
Me = 2500 +
12,5 10
1000 = 2812,5
8
M = Ml Me = 499, 05
M
= 0, 0832
R
Familia B
xi
ni
xi ni
Ni
ui
pi
qi
k 1
I G ( A) = 1
i =1
k 1
= 1
99, 9
= 0,334
150
i =1
Para obtener la mediala, sencillamente buscamos en la columna de los qi dnde se supera por
primera vez el valor 50%,
39
(Si hay un qi = 50
Ml =
xi + xi +1
2
xi
ni
xi ni
mediana)
Familia B:
Ni
ui
pi
qi
k 1
I G ( B) = 1
i =1
k 1
= 1
73, 4
= 0, 266
100
i =1
Para obtener la mediala, sencillamente buscamos en la columna de los qi dnde se supera por
primera vez el valor 50%,
1.7
Ejercicios resueltos.
1. La compaa de telefona mvil Noteoigo est considerando cambiar sus tarifas. Para ello ha
observado la duracin en segundos de 1000 llamadas realizadas por sus abonados:
Duracin de las llamadas
0-20
20-60
60-90
90-180
180-300
Nmero de llamadas
15
180
195
405
205
Obtenga:
a) Duracin media de las llamadas.
b) Coste medio de las llamadas segn las siguientes tarifas:
b.1) 10 cntimos el establecimiento de llamada, ms 6 cntimos por minuto
(proporcionalmente las fracciones de minuto).
40
b.2) 8 cntimos por minuto (proporcionalmente las fracciones de minuto), sin coste
de establecimiento de llamada.
c) Porcentaje de llamadas que superan los 2 minutos de duracin.
Solucin:
Li 1
Li
0
20
60
90
180
a)
20
60
90
180
300
xi
ni
10
40
75
135
240
15
180
195
405
205
1000
xi ni
150
7200
14625
54675
49200
125850
Ni
15
195
390
795
1000
pi
1,5
19,5
39
79,5
100
1 k
125850
x = x i ni =
= 125,85 segundos
1000
n i =1
y = ex + c
Y=
1
X
60
y=
b.1) Z1 = 10 + 6Y
b.2) Z 2 = 8Y
1
125,85
x=
= 2,0975
60
60
39
x
79,5
180 90 120 90
=
2. Se dispone de la siguiente informacin sobre los salarios anuales brutos de los empleados de una
empresa (en miles de euros):
0-20 20-60 60-70
Salarios
10
45
30
n empleados
a) Obtenga el coeficiente de variacin de los salarios.
70-90
15
41
Solucin:
Li 1 Li
xi
0-20
20-60
60-70
70-90
ni
10
40
65
80
10
45
30
15
n=100
xi ni
xi2 ni
100
1800
1950
1200
5050
Ni
1000
72000
126750
96000
295750
pi
10
55
85
100
10
55
85
100
1 n
1
xi ni =
5050 = 50,5
n i =1
100
2
1 n
295750
S 2 = xi2 ni x =
50,52 = 407, 25
S = 407, 25 = 20,18
n i =1
100
S 20,18
CV = =
= 0,3996
x 50,5
x=
a)
b)
Li
pi
20
x
60
10
40
55
Li
pi
60
63
70
55
x
85
60 20 x 20
1200
x = 46, 6
=
+ 20 = x
55 10 40 10
45
46666 euros no son superados por el 40% de los empleados
46666 euros son superados por el 60% de los empleados
c)
70 60 63 60
3 30
=
x 55 =
x = 64
85 55 x 55
10
64% de los empleados tienen salario inferior a 63000 euros
100 x = 36% de los empleados tienen salario superior a 63000 euros
3. Se tienen datos sobre los beneficios en millones de euros (ya deflactados) obtenidos por las
empresas de tres sectores productivos en los aos 2008 y 2012:
Sector
A
B
C
2008
Beneficio medio
(millones de euros)
40
65
50
Nmero de
empresas
800
1200
1000
2012
Beneficio medio
(millones de euros)
35
60
35
Nmero de
empresas
735
1165
900
Solucin:
a) x 2008 =
x 2012 =
42
1 s
1
160000
x i ni =
= 53, 33
( 40 800 ) + ( 65 1200 ) + ( 50 1000 ) ) =
(
3000
3000
n i =1
1 s
1
127125
x i ni =
= 45, 4
( 35 735) + ( 60 1165 ) + ( 35 900 ) ) =
(
n i =1
2800
2800
b) 1 + r =
45, 4
= 0, 96
53,33
Salario medio
1365
1300
1560
Desviacin tpica
105
100
120
Nmero de empleados
100
300
170
Solucin:
a) Antes de la subida la homogeneidad de los salarios es la misma en las tres filiales
CVA =
105
100
120
= CVB =
= CVC =
= 0, 0769
1365
1300
1560
CVY =
y
ex
x
=
=
= CVX
S y eS x S x
Y=X+0,05X=1,05X
Filial B
Y=X+0,06X=1,06X
Filial C
Y=X+50
CVC =
120
120
=
= 0, 0745
1560 + 50 1610
43
Solucin:
1
(k>1).
k2
1
p xi x kS , x + kS 1 2
312=300+12= x + 2 S
Por tanto, la proporcin de observaciones en el intervalo (288, 312) es mayor o igual que
1
1 3
= 1 2 = = 0,75 , de modo que en el conjunto ( ,288] [312, ) habr menos de un
2
k
2
4
25
6. En un fenmeno se han observado 2000 individuos con media 1000 y varianza 100. Cuntas
observaciones, como mnimo, son mayores que 970 y menores que 1030?
Solucin:
De nuevo, de acuerdo a la desigualdad de Tchebycheff :
( x 3S , x + 3S )
970=1000-30= x 3S , 1030=1000+30= x + 3S ,
en el intervalo
1 8
= = 0,8889 . El 88,89% de las 2000
32 9
hay una
observaciones son 1777,8 , luego como mnimo hay 1778 observaciones entre 970 y 1030.
7. Para asignar los puestos de trabajo en una cadena de montaje se realiza un test a los 90 empleados;
12 de ellos realizarn un trabajo tipo A (los que obtengan mejor puntuacin), otros tantos un
trabajo tipo C (los que saquen puntuacin ms baja), y el resto realizarn labores tipo B. El
resultado del test fue:
Puntuacin
ni
0-30
10
30-50
15
50-70
20
70-100
20
100-120
20
120-150
5
Cul fue la puntuacin en el test para los que desempearn un trabajo tipo B?
44
Solucin:
Li1
Li
0
30
50
70
100
120
30
50
70
100
120
150
ni Ni
10
15
20
20
20
5
10
25
45
65
85
90
Si los 12 mejores harn el trabajo A, los 78=90-12 restantes con la puntuacin ms baja no lo harn.
Buscamos 78 en la columna de frecuencias acumuladas, como no aparece interpolaremos entre los
siguientes valores
100
x
120
65
78
85
x = 113
50 30 x 30
=
25 10 12 10
10
12
25
x = 32, 67
Nmero de empleados
Empresa A Empresa B
5
2
5
15
10
28
50
45
30
10
45
Solucin:
Empresa A
Li1
Li
5
15
25
35
45
x=
xi
15
25
35
45
55
ni
10
20
30
40
50
2
15
28
45
10
100
xi ni
xi2 ni
Ni
20
200
2
300
6000 17
840 25200 45
1800 72000 90
500 25000 100
3460 128400
ui
pi
qi
20
320
1160
2960
3460
2
17
45
90
100
254
0,58
9,25
33,53
85,55
100,00
228,90
1 k
3460
xi ni =
= 34, 6
n i =1
100
S
1 k
2 128400
S 2 = xi2 ni x =
34, 62 = 86,84 S = 86,84 = 9,3188 CV ( A) = = 0, 2693
100
x
n i =1
k 1
I G ( A) =
( pi qi )
i =1
k 1
k 1
= 1
i =1
k 1
= 1
118, 90
= 0,163
154
i =1
i =1
Empresa B
Li1
Li
5
15
25
35
45
xi
15
25
35
45
55
ni
10
20
30
40
50
5
5
10
50
30
100
xi ni
50
100
300
2000
1500
3950
xi2 ni
Ni
500
5
2000 10
9000 20
80000 70
75000 100
166500
ui
pi
50
150
450
2450
3950
5
10
20
70
100
205
qi
1,27
3,80
11,39
62,03
100,00
178,48
1 k
3950
x = xi ni =
= 39,5
100
n i =1
S
1 k
2 166500
S 2 = xi2 ni x =
39, 52 = 104, 75 S = 104, 75 = 10, 2347 CV ( B) = = 0, 2591
100
x
n i =1
k 1
IG ( B) =
( p q )
i
i =1
k 1
i =1
k 1
= 1
i =1
k 1
= 1
78, 48
= 0, 2526
105
i =1
a) Para ver donde son ms homogneos los salarios estudiamos la variabilidad o dispersin de
esta variable. Para poder comparar la dispersin necesitamos una medida de dispersin
relativa como el coeficiente de variacin. Se observa una dispersin similar en ambas
empresas, si bien algo mayor en la empresa A
46
Observe que si nos hubiramos apoyado en los valores de las varianzas o de las desviaciones
tpicas la conclusin hubiese sido la opuesta.
b) El ndice de Gini en la empresa A es menor que en la empresa B, luego hay menos
concentracin en los salarios de la empresa A.
0,58
x
9,25
25 15
22,5 15
=
9, 25 0,58 x 0,58
x = 7,08
25
30
35
9,25
x
33,53
35 25
30 25
=
33,53 9, 25 x 9, 25
x = 21,39
Los trabajadores con un salario inferior a 30000 euros reciben el 21,39% de la masa salarial.
Los que su salario es inferior a 22500 euros reciben el 7,08% de la masa salarial. Por tanto
los que su salario est comprendido entre 22500 y 30000 euros recibirn el 14,31% de la
masa salarial (21,39-7,08=14,31).
d) El salario que es superado por el 25% de los empleados de la empresa B mejor pagados es el
mismo salario que no es alcanzado por el 75% restante. Buscamos en la columna de los pi
el valor 75, como no aparece, interpolamos entre los valores ms prximos
45
x
55
70
75
100
55 45
x 45
=
100 70 75 70
9. El sueldo mensual, en euros, correspondiente a los empleados de dos factoras de una misma
empresa es
Sueldo
mensual
600-1000
1000-1400
1400-2000
2000-3000
Nmero de empleados.
Factora A
20
40
30
10
Nmero de empleados.
Factora B
16
20
32
32
47
f) En cul de las dos factoras los sueldos tienen una concentracin mayor?
g) Calcule la mediana y la mediala para todos los empleados de la empresa.
h) Qu porcentaje de empleados de la empresa tienen un sueldo superior a 2300 euros?
i) Qu sueldo corresponde al 30% de los empleados de la empresa con mayor sueldo?
j) Calcule el porcentaje de empleados de la empresa, con menor sueldo, que reciben el 43% de
la nmina.
k) Cuntos empleados de la empresa, con mayor sueldo, reciben el 25% de la nmina?
Solucin:
Sumando el nmero de empleados en las dos factoras de la empresa obtenemos la distribucin de
frecuencias para todos los empleados de la empresa.
Sueldo
mensual
600-1000
1000-1400
1400-2000
2000-3000
Nmero de empleados.
Factora A
20
40
30
10
Nmero de empleados.
Factora B
16
20
32
32
Nmero de empleados.
EMPRESA
36
60
62
42
En primer lugar realizamos en las siguientes tablas los clculos necesarios para responder a todos
los apartados:
Factora A
Li1
Li
xi
600
1000
1400
2000
1000
1400
2000
3000
800
1200
1700
2500
ni
20
40
30
10
100
xi ni
xi2 ni
ai
hi
Ni
ui
pi
20 16000
60 64000
90 115000
100 140000
qi
20
60
90
100
270
11,43
45,71
82,14
100,00
239,29
Factora B
Li1
Li
xi
600
1000
1400
2000
1000
1400
2000
3000
800
1200
1700
2500
ni
16
20
32
32
100
xi ni
xi2 ni
12800 10240000
24000 28800000
54400 92480000
80000 200000000
171200 331520000
Ni
ui
pi
16 12800
36 36800
68 91200
100 171200
qi
16
36
68
100
220
7,48
21,50
53,27
100,00
182,24
Empresa
Li1
Li
xi
600
1000
1400
2000
1000
1400
2000
3000
800
1200
1700
2500
48
ni
36
60
62
42
200
xi ni
xi2 ni
28800 23040000
72000 86400000
105400 179180000
105000 262500000
311200 551120000
Ni
ui
36 28800
96 100800
158 206200
200 311200
pi
qi
18
48
79
100
245
9,25
32,39
66,26
100,00
207,90
48
60
79
x = 1632, 26 euros
El 60% de los empleados con menores sueldos tienen un salario inferior a 1632,26 .
b) 25 no aparece en la columna de los pi de la tabla Factora B, por lo que interpolaremos
entre los valores ms prximos a 25 en la tabla.
1000
x
1400
16
25
36
x = 1180 euros
El 25% de los empleados de la factora B con menores salarios tienen un salario por debajo
de 1180 .
c) La moda es el valor ms frecuente de la variable. En variables continuas se sita en el
intervalo de mayor altura (que no siempre coincide con el de mayor frecuencia, aunque s en
este caso). Calculamos las alturas dividiendo la frecuencia absoluta, ni , entre la amplitud
del intervalo, ai . Dentro del intervalo de mayor altura
( hi = 0,1
, 1000-1400 ) hay
diferentes criterios para situar la moda, el ms sencillo es el del punto medio del intervalo.
Segn dicho criterio, 1200 euros puede considerarse la moda en la factora A.
d) x( A) =
140000
= 1400
100
x( B) =
171200
= 1712
100
x(empresa) =
311200
= 1556
200
1 k
2 219600000
14002 = 236000 S ( A) = 236000 = 485,8
e) S 2 ( A) = xi2 ni x =
100
n i =1
CV ( A) =
S ( A)
= 0,347
x( A)
1 k
2 331520000
S 2 ( B ) = xi2 ni x =
17122 = 384256 S ( B) = 384256 = 619,88
100
n i =1
S ( B)
CV ( B) =
= 0,362
x( B)
Hay menos dispersin, por tanto son ms homogneos los sueldos, en la factora A, aunque
como puede observarse las diferencias no son importantes.
49
k 1
f)
I G ( A) = 1
k 1
i =1
k 1
139, 29
= 1
= 0,181
170
I G ( B) = 1
i =1
k 1
= 1
82, 24
= 0,315
120
i =1
i =1
n
Ni 1
100 96
600 = 1438, 71
ai = 1400 +
g) Me = Li 1 + 2
62
ni
Ml = Li 1 +
50 qi 1
50 32, 39
ai = 1400 +
600 = 1711,96
qi qi 1
66, 26 32,39
h) En la tabla Empresa buscamos el valor 2300. ste no est, interpolamos entre los valores
ms prximos a 2300:
2000
2300
3000
79
x
100
48
70
79
x = 1825,8 euros
El 30% de los empleados de la empresa con mayor sueldo tienen un sueldo superior a
1825,8 .
j) Buscamos en la columna qi de la tabla Empresa el valor 43 e interpolamos:
48
x
79
32,39
43
66,26
79 48
x 48
=
66, 26 32,39 43 32,39
x = 57,71%
66,26
75
100
100 79
x 79
=
100 66, 26 75 66, 26
50
Filial
A
B
Sueldo medio ()
853,4
795
Desviacin tpica ()
60
52
Nmero de empleados
25
35
Se decide subir el sueldo un 5% a los empleados de la filial A y subir 138 euros a cada uno de los
de la filial B. Justifique en cul de las dos filiales los sueldos sern ms heterogneos despus de la
subida.
Solucin:
Llamemos X=sueldo antes de la subida
CVA =
63
= 0, 0702
897,12
CVB =
52
= 0, 0557
933
350-400
26,67
400-450
22,67
450-500
36
500-550
14,66
a) Calcule la varianza.
b) Calcule el nmero de cajas que con ms frecuencia hace un empleado.
c) Para incentivar la productividad se decide aumentar el salario 70 euros a la tercera parte de
los empleados que ms cajas hace. Cul ha de ser el nmero mnimo de cajas que debe
hacer un empleado para que le suban el sueldo?
51
Solucin:
Li1
350
400
450
500
Li
xi
fi
xi fi
400
450
500
550
xi2 fi
ai
hi
Fi
pi
26,67
49,34
85,34
100
261,35
a) En este ejemplo nos dan la distribucin de frecuencias en tantos por ciento. Estos tantos por
ciento son las frecuencias relativas multiplicadas por 100.
x=
k
1 k
x
n
=
xi f i = 444,325
i i
n i =1
i =1
1 k
2 1 k
2
S 2 = xi2 ni x = xi2 f i x = 200084 444,3252 = 2659, 29
n i =1
n i =1
b) Al ser todos los intervalos de igual amplitud, el intervalo de mayor altura coincide con el de
mayor frecuencia relativa (y absoluta), 450-500. Segn los distintos criterios de obtencin
de la moda obtenemos:
Mo( I ) =
Li 1 + Li 450 + 500
=
= 475
2
2
Mo( II ) = Li 1 +
Mo( III ) = Li 1 +
hi +1
0, 002932
ai = 450 +
50 = 469, 64
0, 004534 + 0, 002932
hi 1 + hi +1
hi hi 1
0, 0072 0, 004534
ai = 450 +
50 = 469, 22
( hi hi1 ) + ( hi hi+1 )
( 0, 0072 0, 004534 ) + ( 0, 0072 0, 002932 )
c) 1/3=0,3333, al 33,33% que ms paquetes hacen se le sube el salario, al 66,67% restante que
menos paquetes hacen no se le subir. Calcularemos el percentil 66,67 buscando este valor
en la columna pi de la anterior tabla. Los valores pi
49,34
66,67
85,34
500 450
x 450
=
85,34 49,34 66, 67 49,34
x = 474, 07 cajas
474 cajas no son superadas por dos tercios (66,67%) de los empleados, por tanto sern
superadas por el tercio de empleados restantes.
12. Se dispone de la siguiente informacin sobre una empresa:
52
Sueldos/ hora ()
0-6
6-20
20-30
30-50
qi
% de empleados
21,43
28,57
35,71
14,29
3,38
22,93
69,92
100
Li1
Li
0
6
20
30
6
20
30
50
xi
3
13
25
40
fi
xi fi
0,2143 0,6429
0,2857 3,7141
0,3571 8,9275
0,1429
5,716
1 19,0005
pi
21,43
50
85,71
100
257,14
qi
3,38
22,93
69,92
100,00
196,23
k 1
a) I G = 1
i =1
k 1
= 1
96, 23
= 0,3876
157,14
i =1
El ndice de Gini es un valor entre 0 y 1, cuanto ms prximo est a 1 indica una mayor
concentracin en el reparto. En este caso su valor nos indica una dbil concentracin.
b) x =
k
1 k
xi ni = xi fi = 19, 0005
n i =1
i =1
50
x
85,71
30 20
27 20
=
85, 71 50 x 50
13. Se sabe que una cuenta de ahorro ha producido anualmente, en los ltimos cinco aos, los
siguientes intereses: 4%, 7%, 6%, 5% y 8%. Calcule la rentabilidad anual media para el perodo en
cada uno de los siguientes casos:
a) Se mantienen en la cuenta los intereses.
b) Se retiran anualmente los intereses.
53
Solucin:
a) Si partimos de un capital C0 , al final del primer ao se habr transformado en
C1 = C0 +
4
C0 = 1, 04C0
100
C2 = C1 +
7
C1 = 1, 07C1 = 1, 07(1, 04C0 )
100
C5 = C4 +
8
C4 = 1, 08C4 = 1, 08 1, 05 1, 06 1, 07 1, 04 C0
100
La rentabilidad media sera aquella rentabilidad r (en tanto por uno) que puede sustituir a las
rentabilidades observadas (4%, 7%, 6%, 5% y 8%) obtenindose el mismo capital al final, es
decir
C5 = 1, 08 1, 05 1, 06 1, 07 1, 04 C0 = (1 + r ) (1 + r ) (1 + r ) (1 + r ) (1 + r ) C0 = (1 + r ) C0
5
1 + r = 5 1, 08 1, 05 1, 06 1, 07 1, 04 = 1, 0599
C5 = C0 +
4
7
6
5
8
C0 +
C0 +
C0 +
C0 +
C0
100
100
100
100
100
7
6
5
8
4
+
+
+
+
C0 = 5rC0
100 100 100 100 100
r=
0, 04 + 0, 07 + 0, 06 + 0, 05 + 0, 08
= 0, 06
5
Cuando los valores de la variable, como en el apartado a), representan incrementos acumulativos
el promedio adecuado es la media geomtrica. Si como en el apartado b) los incrementos no son
acumulativos se debe usar como promedio la media aritmtica.
14. Un inversor mantuvo el mismo tipo de inversin durante cuatro aos consecutivos. Si las
respectivas rentabilidades fueron del 11%, 8%, 7% y 9%, justifique cual es el promedio ms
adecuado para obtener el rendimiento medio anual y calclelo.
54
Solucin:
El promedio ms adecuado es la media geomtrica, tal y como se justifica en el apartado a) del
anterior ejercicio.
1 + r = 4 1,11 1, 08 1, 07 1, 09 = 1, 0874
ni
1,5
3
4,2
5
6
5
8
6
4
2
Estados Unidos
Beneficios en millones de $
ni
3
3,5
4
4,5
5
6
4
2
6
4
4
5
Solucin:
Europa
xi
ni
1,5
3
4,2
5
6
xi ni
5
8
6
4
2
25
7,5
24
25,2
20
12
88,7
xi2 ni
11,25
72
105,84
100
72
361,09
Ni
5
13
19
23
25
ui
pi
7,5
31,5
56,7
76,7
88,7
qi
20
52
76
92
100
340
8,46
35,51
63,92
86,47
100,00
294,36
Estados Unidos
xi
ni
3
3,5
4
4,5
5
6
xi ni
4
2
6
4
4
5
25
12
7
24
18
20
30
111
a) x( Europa ) =
xi2 ni
36
24,5
96
81
100
180
517,5
Ni
4
6
12
16
20
25
ui
12
19
43
61
81
111
pi
qi
16
24
48
64
80
100
332
10,81
17,12
38,74
54,95
72,97
100
294,59
1 k
88, 7
xi ni =
= 3,548
n i =1
25
1 k
2 361, 09
3,5482 = 1,855
S 2 ( Europa ) = xi2 ni x =
n
25
i =1
55
CV ( Europa) =
S ( Europa ) 1, 362
=
= 0, 3839
x( Europa ) 3, 548
x( Estados Unidos ) =
1 k
111
xi ni =
= 4, 44
25
n i =1
1 k
2 517,5
4, 44 2 = 0, 9864
S 2 ( Estados Unidos ) = xi2 ni x =
25
n i =1
Hay menos dispersin, por tanto son ms homogneos los beneficios, en las empresas de
Estados Unidos.
k 1
b) I G ( Europa ) = 1
i =1
k 1
= 1
194,36
= 0,19
240
i =1
k 1
I G ( Estados Unidos ) = 1
i =1
k 1
= 1
194,59
= 0,161
232
i =1
Nmero de clientes
175
500
300
25
Nota: llamaremos saldo total de la sucursal a la suma de los saldos de todas las cuentas abiertas en
la misma.
a) Qu porcentaje del saldo total de la sucursal pertenece a los clientes cuyo saldo est
comprendido entre 6000 y 10000 euros?
56
b) Si se consideran clientes preferentes al 10% de los clientes con mayores saldos, cul ha de
ser el saldo para que un cliente sea considerado como tal?
c) Qu porcentaje del saldo total de la sucursal pertenece al 30% de los clientes con mayor
saldo? Cunto dinero representa ese porcentaje?
d) Qu saldo mnimo tienen los clientes con mayores saldos que renen el 20% del saldo total
de la sucursal?
e) Qu porcentaje de clientes superan los 2000 euros de saldo?
f) Qu tanto por ciento de clientes con mayor saldo renen el 30% del saldo total de la
sucursal?
Solucin:
Li1
Li
xi
0
200
100
200 1000
600
1000 5000 3000
5000 30000 17500
ni
xi ni
Ni
ui
pi
175
17500 175
17500
500 300000 675 317500
300 900000 975 1217500
25 437500 1000 1655000
1000 1655000
17,5
67,5
97,5
100
282,5
qi
1,06
19,18
73,56
100
193,81
73,56
x
100
5000
10000
30000
73,56
x
100
x = 74, 62
x = 78,85
A los clientes con menos de 10000 euros de saldo les corresponde el 78,85% del saldo total
de la sucursal, a los clientes con menos de 6000 euros de saldo les corresponde el 74,62%
del saldo total de la sucursal, por tanto a los clientes con un saldo comprendido entre 6000 y
10000 euros les corresponde el 4,23% del saldo total de la sucursal (4,23=78,85-74,62).
b) Buscamos el saldo que no es superado por el 90% de los restantes clientes con menores
saldos:
1000
x
5000
67,5
90
97,5
x = 4000
c) Buscamos el porcentaje del saldo total de la sucursal que pertenece al 70% de los clientes
con menor saldo:
57
67,5
70
97,5
97,5 67,5
70 67,5
=
73,56 19,18 x 19,18
19,18
x
73,56
Al 70% de los clientes con menos saldo les pertenece el 23,7% del saldo total de la sucursal,
por tanto al 30% restante de clientes con ms saldo les pertenece el 76,3% del saldo total de
la sucursal.
Estimamos el saldo total de la sucursal por
i =1
76,3
1655000 = 1262765
100
sucursal es:
(Utilizamos la expresin estimamos para el valor del saldo total de la sucursal puesto que
hemos supuesto que todas las cuentas dentro de cada intervalo de la tabla tienen un saldo
igual al punto central de dicho intervalo)
d) Ese saldo mnimo ser igual al saldo mximo del resto de clientes que reunirn el 80% del
saldo total de la sucursal (80=100-20):
5000
x
30000
30000 5000
x 5000
=
100 73,56 80 73,56
73,56
80
100
x = 11089, 25
67,5
x
97,5
19,18
70
73,56
97,5 67,5
x 67,5
=
x = 95,5% 100 95,5 = 4,5%
73,56 19,18 70 19,18
Por tanto, el 4,5% de clientes con mayor saldo representan el 30% restante del saldo total de
la sucursal.
17. El montante de las plizas correspondientes a los agentes visitantes de una compaa de seguros de
vida se distribuye como sigue:
Montante de plizas
(millones de euros)
0-5
5-10
10-20
20-40
Nmero de agentes
8
10
16
16
Li1
Li
0
5
10
20
xi
5
10
20
40
ni
2,5
7,5
15
30
xi ni
8
10
16
16
50
20
75
240
480
815
Ni
ui
8
18
34
50
pi
20
95
335
815
qi
16
36
68
100
220
2,45
11,66
41,10
100
155,21
k 1
a) I G = 1
= 1
i =1
k 1
55, 21
= 0, 54
120
i =1
Este ndice toma valores entre 0 y 1, siendo la concentracin del reparto ms fuerte cuanto
ms prximo est a 1. En este caso el grado de concentracin es intermedio entre los casos
extremos como muestra el valor del ndice.
b) Estas medidas se pueden calcular mediante las expresiones:
n
Ni 1
2
Me = Li 1 +
ai
ni
Ml = Li 1 +
50 qi 1
ai
qi qi 1
36
50
68
20
x
40
41,1
50
100
20 10 x 10
=
68 36 50 36
40 20
x 20
=
100 41,1 50 41,1
x = Me = 14,375
x = Ml = 23,02
La mayor o menor diferencia entre ellas nos da una medida del grado de concentracin.
Cuanto mayor sea la concentracin mayor ser la distancia entre la mediana y la mediala.
Para tener una medida relativa de dicha distancia, sta se suele comparar por cociente con el
rango de la variable (diferencia entre el mayor y menor valor que toma la variable).
Ml Me 23, 02 14,375
=
= 0, 216
40 0
R
59
La anterior medida es un valor entre 0 y 1 que indica una mayor concentracin cuanto ms
prximo est de 1.
c) Interpolamos 40 entre los valores ms prximos de la tabla:
10
x
20
20 10 x 10
=
68 36 40 36
36
40
68
x = 11, 25
d) Calculamos el tanto por ciento de agentes que tienen un montante de plizas inferior a 30
millones de euros
20
30
40
40 20 30 20
=
100 68 x 68
68
x
100
x = 84%
100 84 = 16%
El 84% de los agentes tienen un montante de plizas inferior a 30 millones de euros, el 16%
restante de los agentes tendrn un montante de plizas superior a 30 millones de euros.
18. La siguiente tabla de frecuencias muestra los salarios mensuales de los empleados de una empresa
Salarios ()
600-1000
1000-1400
1400-2000
2000-3000
Nmero de empleados
30
110
40
20
Li1
Li
xi
600
1000
1400
2000
1000
1400
2000
3000
800
1200
1700
2500
ni
30
110
40
20
200
xi ni
Ni
24000
132000
68000
50000
274000
30
140
180
200
ui
24000
156000
224000
274000
pi
qi
15
70
90
100
275
8,76
56,93
81,75
100
247,45
60
n
200
Ni 1
30
Me = Li 1 + 2
ai = 1000 + 2
400 = 1254,545
ni
110
Ml = Li 1 +
50 qi 1
50 8, 76
ai = 1000 +
400 = 1342, 45
qi qi 1
56,93 8, 76
b) La mayor o menor diferencia entre ellas nos da una medida del grado de concentracin.
Cuanto mayor sea la concentracin mayor ser la distancia entre la mediana y la mediala.
Para tener una medida relativa de dicha distancia, sta se suele comparar por cociente con el
rango de la variable (diferencia entre el mayor y menor valor que toma la variable).
Ml Me 1342, 45 1254,545
=
= 0, 0366
R
3000 600
La anterior medida es un valor entre 0 y 1 que indica una mayor concentracin cuanto ms
prximo est de 1. Como puede observarse hay poca concentracin.
k 1
c) I G = 1
i =1
k 1
= 1
147, 45
= 0,157
175
i =1
90
x
100
x = 94% 100 94 = 6%
El 94% de los empleados tienen un salario inferior a 2400 , por tanto el 6% restante tendrn
un salario superior a 2400 .
e) Calculamos el tanto por ciento de masa salarial que perciben los empleados con un salario
inferior a 1200 y 1500 respectivamente:
1000
1200
1400
8,76
x
56,93
1400
1500
2000
56,93
x
81,75
x = 32,85%
x = 61, 07%
Los empleados con un salario inferior a 1500 reciben el 61,07% de la masa salarial, los
empleados con un salario inferior a 1200 reciben el 32,85% de la masa salarial, por tanto
los empleados con un salario comprendido entre 1200 y 1500 euros reciben el 28,22% de la
masa salarial (61,07-32,85=28,22).
61
f) El salario tal que los salarios que lo superan suponen en su conjunto el 30% de la masa
salarial es el mismo salario tal que los salarios que no lo superan suponen en su conjunto el
70% restante de la masa salarial.
1400
x
2000
56,93
70
81,75
2000 1400
x 1400
=
81, 75 56,93 70 56,93
x = 1715,9
g) Calculamos el salario por debajo del cual se encuentran el 70% de los empleados peor
pagados. Este valor se encuentra en la tabla, por lo que no es necesario interpolar. Si el 70%
de los empleados peor pagados tienen un salario por debajo de 1400 , el 30% restante de
empleados mejor pagados tendrn un salario por encima de 1400 , es decir entre 1400 y
3000 euros (donde 3000 es el mximo valor que puede tomar la variable segn la tabla).
h) Interpolamos el valor 40 en la columna de tantos por ciento acumulados de empleados:
15
40
70
8,76
x
56,93
70 15
40 15
=
56,93 8, 76 x 8, 76
x = 30, 66%
19. La siguiente tabla muestra intervalos de renta, porcentajes acumulados de poblacin y porcentajes
acumulados de renta
Intervalos de renta ()
0-800
800-1500
1500-2500
2500-3000
3000-5000
% de poblacin
10
40
60
80
100
% de renta
1,87
18,03
36,77
62,53
100
a) Calcule la mediana.
b) Calcule la mediala.
c) Calcule el porcentaje de renta que corresponde al 30% de la poblacin mejor pagada.
Solucin:
Li1
Li
0
800
1500
2500
3000
800
1500
2500
3000
5000
pi
qi
10
40
60
80
100
290
1,87
18,03
36,77
62,53
100
219,20
40
50
60
x = Me = 2000
62
2500
x
3000
3000 2500
x 2500
=
62,53 36,77 50 36,77
36,77
50
62,53
x = Ml = 2756,8
80 60
70 60
=
62,53 36,77 x 36,77
36,77
x
62,53
El 70% de la poblacin peor pagada recibe el 49,65% de toda la renta, por tanto el 30%
restante de la poblacin mejor pagada recibe el 50,35% restante de la renta.
20. Con los datos de la siguiente tabla:
Ingresos ()
Nmero de familias
0-600
15
600-800
30
800-1000
55
1000-1500
70
1500-2000
42
Li1
Li
xi
ni
0
600
800
1000
1500
600
800
1000
1500
2000
300
700
900
1250
1750
15
30
55
70
42
212
xi ni
Ni
4500
21000
49500
87500
73500
236000
15
45
100
170
212
ui
pi
4500
25500
75000
162500
236000
7,08
21,23
47,17
80,19
100
255,67
qi
1,91
10,81
31,78
68,86
100
213,36
k 1
a) I G = 1
i =1
k 1
= 1
113,36
= 0, 2718
155,67
i =1
47,17
50
80,19
1500 1000
x 1000
=
80,19 47,17 50 47,17
x = Me = 1042,9
31,78
50
68,86
1500 1000
x 1000
=
68,86 31,78 50 31,78
x = Ml = 1245,7
c) Calculamos en primer lugar el porcentaje de familias con menores ingresos que obtienen en
su conjunto el 67% de los ingresos totales (67=100-33):
63
47,17
x
80,19
31,78
67
68,86
El 78,5% de las familias con menos ingresos obtienen el 67% de los ingresos totales, por
tanto el 21,5% restante de familias con mayores ingresos obtienen el 33% restante de los
ingresos totales.
21. El servicio Central de Correos realiza una encuesta sobre el franqueo medio de las cartas que
diariamente tiene que distribuir. La informacin recibida sobre 500 cartas es la siguiente:
Franqueo
Cartas
0,30
145
0,40
132
0,50
84
0,70
50
1
48
1,20
22
1,80
10
2
8
2,50
1
xi
ni
0,30
0,40
0,50
0,70
1,00
1,20
1,80
2,00
2,50
145
132
84
50
48
22
10
8
1
500
xi ni
43,5
52,8
42
35
48
26,4
18
16
2,5
284,2
xi2 ni
13,05
21,12
21
24,5
48
31,68
32,4
32
6,25
230
1 k
284, 2
xi ni =
= 0,5684
500
n i =1
1 k
2 230
0,5684 2 = 0,1369
S 2 = xi2 ni x =
500
n i =1
CV =
64
S = 0,1369 = 0,37
S
0, 37
=
= 0, 651
x 0,5684
65
2.1
Dos columnas.
La tabla ms sencilla para representar los valores de una variable estadstica bidimensional consiste
en colocar en dos columnas los pares de valores observados. Es la forma habitual de representarlos
en hojas de clculo y programas de estadstica
xi
yi
x1
x2
...
xn
y1
y2
...
yn
Tablas de contingencia.
Tambin llamada tabla de correlacin, es una tabla de doble entrada en la que se recogen ordenadas
y clasificadas las observaciones presentadas por una variable estadstica bidimensional.
Para ilustrar su forma nos apoyamos en el ejemplo siguiente:
66
EJEMPLO 2.1.
La distribucin segn salarios (Y) y edades (X) de un grupo de 100 jvenes es
X Y
500-1000
10
5
2
0
17
20
21
22
23
n j
1000-1500
3
15
20
13
51
ni
1500-2000
2
5
15
10
32
15
25
37
23
n=100
B1
* L*0 L*1
X Y
...
Bp
L*j 1 L*j
y1
L*p 1 L*p
yj
L0 L1 x1
...
Ai Li 1 Li xi
...
Ak Lk 1 Lk xk
n11
...
ni1
...
nk1
...
...
...
...
...
n1 j
n j
n1
...
* A1
...
ni
yp
n1 p
...
nkj
...
...
...
...
...
...
nkp
n1
...
ni
...
nk
n j
...
n p
...
nij
...
nip
(x , y )
i
ij
=n.
i =1 j =1
ij
nij
n
, donde
=1.
i =1 j =1
Se
denomina
(( x , y ) , n ) ,
i
ij
distribucin
i = 1,..., k ,
bidimensional
de
frecuencias
al
conjunto
de
valores
67
2.2
Distribuciones marginales.
Otros valores importantes que aparecen en la tabla de contingencia son ni , i = 1,..., k
y n j ,
ni = nij
n j = nij
j =1
i =1
j =1
ni = n j = n
i =1
Las frecuencias relativas marginales se definen a partir de las frecuencias absolutas como
f i =
ni
n
f j =
n j
i =1
f i = f j = 1
j =1
Utilizaremos estas frecuencias que aparecen en la ltima fila y columna de la tabla de contingencia
para estudiar separadamente una variable de la otra. A estas distribuciones de frecuencias se les
denominan distribuciones marginales.
Para estudiar separadamente una variable de la otra cuando tenemos los datos en dos columnas
basta con quedarnos slo con la columna de datos de dicha variable.
EJEMPLO 2.2.
La distribucin marginal de las edades en el ejemplo 2.1 es
xi
20
21
22
23
ni
15
25
37
23
100
La distribucin marginal de los salarios en el ejemplo 2.1 es
yj
n j
500-1000
1000-1500
1500-2000
17
51
32
100
Sobre cada una de estas distribuciones marginales (unidimensionales) se puede estudiar todo lo que
sobre
distribuciones
unidimensionales
hemos
visto
(medias,
percentiles,
dispersin,...),
x=
1 k
xi ni
n i =1
S x2 =
2
1 k
xi x ni
n i =1
y=
1 p
y j n j
n j =1
S y2 =
2
1 p
y
y
n j
j
n j =1
pero si queremos conocer la relacin entre dichas variables hemos de analizar la distribucin
conjunta (bidimensional) de ambas variables X e Y (como se har en los apartados 2.3 y 2.4).
Distribuciones condicionadas.
A partir de la representacin conjunta de X e Y en la tabla de contingencia tambin se pueden
estudiar las denominadas distribuciones condicionadas cuyo significado se expone con el siguiente
ejemplo.
EJEMPLO 2.3.
Distribucin de los salarios condicionada a que el joven tiene 22 aos
yj
nj
2
20
15
37
Distribucin de las edades de los jvenes que tienen un salario mayor que 1000 pero menor que
500-1000
1000-1500
1500-2000
1500
xi
20
21
22
23
ni
3
15
20
13
51
69
X Y
500-1000
1000-1500
1500-2000
mujer
8
4
2
TOTAL
28
14
7
Solucin:
X Y
hombre
20
= 0,5714
500-1000
35
10
= 0, 2857
1000-1500
35
5
= 0,1429
1500-2000
35
Luego hay independencia, el salario no depende del
mujer
TOTAL
8
28
= 0,5714
= 0,5714
14
49
4
14
= 0, 2857
= 0, 2857
14
49
2
7
= 0,1429
= 0,1429
14
49
sexo, es decir, los salarios de los hombres no
Ms cmodo, pero equivalente a comprobar que las frecuencias relativas de las distintas
distribuciones condicionadas son iguales, es ver si se cumple
nij =
O equivalentemente
70
nij =
ni n j
ni n j
n
i, j
nij
n
ni n j
n n
f ij = f i f j
i, j
EJEMPLO 2.5.
X Y
hombre
28 35
49
14 35
10 =
1000-1500
49
7 35
5=
1500-2000
49
n j
35
Usando esta caracterizacin de independencia, al
20 =
500-1000
ni
mujer
28 14
28
49
14 14
4=
14
49
7 14
2=
7
49
14
n = 49
trabajar con nmero enteros,
8=
evitamos los
Y
1
2
1
3
3
3
2
1
0
0
0
La forma de la nube de puntos nos informa sobre la relacin entre X e Y. Esta informacin se
cuantifica con el clculo de la covarianza.
Covarianza
Se define para datos en tablas de contingencia como
S xy =
1 k p
xi x y j y nij
n i =1 j =1
)(
71
1 n
xi x
n i =1
)( y y )
i
La covarianza nos da una medida de la variabilidad conjunta y por tanto de la asociacin o relacin
entre las variables X e Y. El signo de la covarianza indica en qu sentido varan conjuntamente las
variables. Si la covarianza es positiva las dos variables cambian, en general, en el mismo sentido
(si una variable aumenta de valor la otra tambin aumenta, anlogamente si una disminuye la otra
har lo mismo, en este caso decimos que la relacin entre las variables es positiva o directa). Si la
covarianza es negativa las dos variables cambian, en general, en sentidos opuestos (si una aumenta
la otra disminuye, en este caso decimos que la relacin entre las variables es negativa o inversa).
EJEMPLO 2.7.
Calcule la covarianza para la siguiente tabla de datos e interprete su valor de acuerdo a la
representacin grfica.
X
3
5
4
6
7
5
4
2
1
5
6
Y
1
2
1
3
3
3
2
1
0
1
1
()
(2)
(1)
(+)
3
2
( x, y )
(3)
(4)
()
(+)
0
0
Solucin:
totales
72
xi
yi
xi x
yi y
3
5
4
6
7
5
4
2
1
5
6
48
1
2
1
3
3
3
2
1
0
1
1
18
-1,36
0,64
-0,36
1,64
2,64
0,64
-0,36
-2,36
-3,36
0,64
1,64
-0,64
0,36
-0,64
1,36
1,36
1,36
0,36
-0,64
-1,64
-0,64
-0,64
( x x )( y y )
i
0,87
0,23
0,23
2,23
3,60
0,87
-0,13
1,50
5,50
-0,40
-1,04
13,46
x=
1 n
48
xi =
= 4, 36
n i =1
11
y=
1 n
18
yi = = 1, 64
n i =1
11
S xy =
1 n
xi x
n i =1
)( y y ) = 13,1146 = 1, 22
i
yi > y ( 3 ) : xi < x ,
yi < y
( x x )( y y ) > 0 ,
i
debido a que ambas diferencias son de igual signo. Mientras que los puntos en los cuadrantes 2 y 4
(sombreados en gris en la tabla anterior) dan lugar a sumandos negativos al tener dichas diferencias
signos contrarios.
Cuando la relacin entre las variables es directa predominan los puntos en los cuadrantes 1 y 3,
por tanto pesan ms los sumandos positivos en la expresin de la covarianza, arrojando sta un
valor positivo (como el caso que nos ocupa). Cuando la relacin entre las variables es inversa
predominan los puntos en los cuadrantes 2 y 4 provocando un valor negativo de la covarianza.
Una forma ms cmoda para el clculo de la covarianza se obtiene al desarrollar la expresin que la
define
S xy =
1 n
xi x
n i =1
)(
yi y =
1 n
xi yi xi y xyi + x y =
n i =1
1 n
1 n 1 n 1 n 1 n
1 n
= xi yi y xi x yi + x y 1 = xi yi x y x y + x y = xi yi x y
n i =1
n i =1 n i =1 n i =1 n i =1
n i =1
1 n
S xy = xi yi x y
n i =1
1 k p
S xy = xi y j nij x y
n i =1 j =1
EJEMPLO 2.8.
Obtenga la covarianza utilizando esta ltima expresin
73
xi
yi
3
5
4
6
7
5
4
2
1
5
6
48
1
2
1
3
3
3
2
1
0
1
1
18
xi yi
48
= 4,36
11
n = 11 x =
3
10
4
18
21
15
8
2
0
5
6
92
S xy =
y=
18
= 1, 64
11
1 n
92
xi yi x y =
(4, 36 1, 64) = 1, 21
n i =1
11
X * = eX + c
Y * = hY + d
S x* y* = ehS xy
(al valor de la covarianza no le afecta los cambios de origen pero s los cambios de escala).
S x* y* =
=
1 k p
xi* x *
n i =1 j =1
)(
y *j y * nij =
1 k p
exi + c ex c hy j + d h y d nij =
n i =1 j =1
)(
1 k p
1 k p
1 k p
exi ex hy j h y nij = e xi x h y j y nij = eh xi x
n i =1 j =1
n i =1 j =1
n i =1 j =1
)(
) (
S xy = 0
)( y
y nij = ehS xy
nij =
ni n j
n
n n
1 k p
1 k p
S xy = xi y j nij x y = xi y j i j
n
n i =1 j =1
n i =1 j =1
1 k
1 p
= xi ni y j n j x y = x y x y = 0
n j =1
n i =1
p
n j
1 k
=
x
y
x
n
i i y j
x y =
n
j =1
n i =1
( )
La covarianza no est acotada de forma uniforme para todas las variables ni est expresada en las
mismas unidades, por lo que no es fcil interpretar su valor ni hacer comparaciones. Este problema
se soluciona con el coeficiente de correlacin lineal.
74
S xy
Sx S y
Su signo es el mismo que el de la covarianza, adems este coeficiente toma valores entre -1 y 1,
( 1 r
xy
Cuando las variables estn tipificadas el coeficiente de correlacin lineal coincide con la
covarianza.
El cambio de origen y escala no afecta al valor de este coeficiente. Sabemos que
X * = eX + c
Y * = hY + d
S x* y* = ehS xy
S x* = eS x
S y* = hS y
por tanto,
rx* y* =
S x* y*
S x* S y*
ehS xy
eS x hS y
S xy
Sx S y
= rxy
EJEMPLO 2.9.
Calcule el coeficiente de correlacin lineal con los datos del ejemplo 2.7.
Solucin:
n = 11 x =
48
= 4,364
11
1 n
S = xi x
n i =1
2
x
S y2 =
y=
1 n
yi y
n i =1
xi
yi
3
5
4
6
7
5
4
2
1
5
6
48
1
2
1
3
3
3
2
1
0
1
1
18
18
= 1,636
11
xi2
xi yi
3
10
4
18
21
15
8
2
0
5
6
92
S xy =
9
25
16
36
49
25
16
4
1
25
36
242
yi2
1
4
1
9
9
9
4
1
0
1
1
40
1 n
92
xi yi x y =
(4,364 1, 636) = 1, 22
n i =1
11
1 n 2 2 242
= xi x =
4,364 2 = 2, 9555 S x = 1, 72
11
n i =1
1 n
2 40
= yi2 y =
1, 636 2 = 0, 9599 S y = 0, 98
11
n i =1
rxy =
S xy
Sx S y
1, 22
= 0, 7238
1, 72 0,98
75
En el ejemplo anterior se recogen todos los clculos necesarios en el estudio de variables estadsticas
bidimensionales para datos en dos columnas. Veamos en el siguiente ejemplo como se llevan a cabo
dichos clculos cuando los datos estn en una tabla de contingencia.
EJEMPLO 2.10.
Calcule el coeficiente de correlacin lineal con los datos del ejemplo 2.1.
X Y
500-1000
10
5
2
0
17
20
21
22
23
n j
1000-1500
3
15
20
13
51
1500-2000
2
5
15
10
32
ni
15
25
37
23
n=100
Solucin:
Si alguna de las variables es continua (datos agrupados en intervalos), como en este caso los
salarios, tomaremos la marca de clase de cada intervalo, y j , como valor representativo para hacer
los clculos. Junto a cada frecuencia nij calcularemos los productos xi y j nij que incluiremos dentro
de un recuadro para no confundirlos con los valores de las frecuencias.
500-1000
750
150000
10
X Y
20
1000-1500
1250
75000
3
1500-2000
1750
70000
2
ni
xi ni
xi2 ni
15
300
6000
21
78750
15
393750
183750
25
525
11025
22
33000
20
550000
15
577500
37
814
17908
23
13
373750
10
402500
23
529
12167
2168
47100
n j
17
51
32
n=100
y j n j
12750
63750
56000
132500
y 2j n j
9562500
79687500
98000000
187250000
x=
1 k
2168
xi ni =
= 21, 68
100
n i =1
y=
1 p
132500
y j n j =
= 1325
n j =1
100
1 k p
S x2 =
S y2 =
76
2
2
1 k
1 k 2
47100
x
x
n
=
xi ni x =
21, 682 = 0,9776
i
i
n i =1
n i =1
100
2
2
1 p
1 p 2
187250000
y
y
n
=
y j n j y =
13252 = 116875
j
j
n j =1
n j =1
100
S x = 0,9887
S y = 341,87
rxy =
S xy
SxS y
154
= 0, 4556
0,9887 341,87
vt=500. Los datos observados son valores particulares que verifican dicha ecuacin.
Representando grficamente dicha funcin v =
500
y los puntos observados ( ti , vi ) , se tiene
t
600
500
400
300
200
100
0
0
10
11
Existen otro tipo de variables como el consumo y la renta, la oferta y la demanda,... donde no cabe
duda de que hay una relacin, pero donde es imposible definir sobre ellas una funcin matemtica
que verifiquen rigurosamente. A este tipo de dependencia entre variables la denominaremos
77
que no es posible encontrar una funcin tal que su grfica pase por todos los puntos del diagrama de
dispersin asociado a las variables observadas
EJEMPLO 2.11.
X
3
5
4
6
7
5
4
2
1
5
6
Y
1
2
1
3
3
3
2
1
0
1
1
4
3
2
1
0
-1
-1
Ante la imposibilidad de encontrar una grfica que pase por todos los puntos de la nube hay que
aceptar el razonamiento lgico de que la funcin cuya grfica ms se aproxime a los datos
observados expresar mejor la relacin entre los mismos.
Hacer regresin consiste en ajustar lo mejor posible una funcin a una serie de valores observados,
grficamente equivale a encontrar la curva que est lo ms prxima que se pueda a los puntos del
diagrama de dispersin.
4
3
2
yi f ( xi )
1
0
-1
-1
El procedimiento analtico para obtener dicha funcin se basa en hacer mnima la suma de las
distancias (al cuadrado) entre los puntos de la nube, ( xi , yi ) , y la grfica de la funcin, y i = f ( xi ) ,
78
( y f (x ))
i
i =1
mnimos cuadrados.
Una vez obtenida dicha funcin y = f ( x) , para un valor dado x = xi estimaramos el valor de y
mediante y i = f ( xi ) . Probablemente el verdadero valor de la variable Y asociado a xi no coincidir
con y i pero el ajuste por mnimos cuadrados nos garantiza que dicha diferencia
( y y )
i
ser
EJEMPLO 2.12.
La recta del ejemplo 2.11 se ha ajustado por mnimos cuadrado y su expresin es y = 0, 41x 0,17 ,
cuando xi = 3 ,
ejemplo 2.11, cuando xi = 3 la variable y toma el valor yi = 1 1, 06 , siendo en este caso el error de
la estimacin muy pequeo. En otros puntos como xi = 6 los errores que se cometen son mayores,
yi = 1 o yi = 3 , y i = ( 0, 41 6 ) 0,17 = 2, 29 .
explicativa.
Utilizaremos la expresin regresin simple cuando se usa una sola variable independiente y
b
, potencia y = axb ,... Esto depender de la
x
forma en que se relacionan las variables, forma que est reflejada en el diagrama de dispersin o
nube de puntos. Vamos a considerar el caso ms sencillo, adems de ser el ms utilizado, el de la
79
lnea recta, que se conoce como regresin lineal simple, recta de regresin, recta de mnimos
cuadrados o recta de regresin de mnimos cuadrados.
Regresin lineal.
Aplicando el ajuste por mnimos cuadrados a funciones de la forma y = a + bx obtenemos que la
recta que mejor se ajusta a un conjunto de datos, ( xi , yi ) i = 1,..., n ,
b=
S xy
S
a = y bx = y
2
x
S xy
S x2
S xy
S x2
( x x)
que se puede escribir tambin en funcin del coeficiente de correlacin lineal como
y y =r
Sy
Sx
( x x)
Segn las anteriores expresiones, la recta de regresin siempre pasa por el punto ( x, y ) .
La recta obtenida se denomina recta de regresin de Y/X, siendo una de sus aplicaciones predecir
la variable Y, conocido el valor de la variable X. Si queremos predecir el valor de X, conocido el
valor de Y, no se debe sustituir el valor conocido de Y en la anterior recta y despejar el valor de X.
Para ello debemos utilizar la recta de regresin de X/Y que en general no coincide con la anterior,
siendo su expresin
xx =
S xy
S
2
y
( y y)
xx = r
Sx
y y
Sy
80
EJEMPLO 2.13.
Se han observado precio y superficie de un conjunto de viviendas. Claramente esas variables estn
relacionadas. Se ha ajustado por mnimos cuadrados la siguiente recta
p = 50000 + 3000m
m = superficie en m2
p = precio
La ordenada en el origen nos dice lo que vale la variable dependiente cuando la independiente es
cero. Esta cantidad es difcil de interpretar intuitivamente en algunos casos.
La pendiente de la recta nos indica lo que aumenta la variable dependiente por cada unidad
que aumenta la independiente. En este caso lo que se encarece el valor de la vivienda por cada
metro ms de superficie.
La ordenada en el origen distinta de cero puede justificar situaciones como la siguiente: una
vivienda de 50 m2 tiene un precio de 200000 mientras que una vivienda con el doble de superficie,
100 m2, tiene un precio de 350000
200000 = 50000 + ( 3000 50 )
Analizando la forma punto-pendiente de las rectas de regresin observamos que ambas se cortan en
( )
el punto x, y y coincidirn dichas rectas si adems tienen la misma pendiente (tomamos como
referencia el eje X para la pendiente).
y y =
S xy
S x2
S xy
S
2
x
xx
S y2
S xy
xx =
S xy S xy
2
x
S S
2
y
=1
S xy
S y2
yy
S xy2
2
x
S S
2
y
=1
S y2
S xy
( x x) = y y
r2 = 1
Es decir, coinciden cuando r 2 = 1 (lo que significa, como veremos ms adelante, que la relacin
lineal entre las variables es perfecta y la recta pasa por todos los puntos del diagrama de dispersin).
EJEMPLO 2.14.
Obtenga para los datos del ejemplo 2.11 los coeficientes de la recta de regresin de Y/X.
Solucin:
Utilizaremos la expresin y y =
S xy
S x2
covarianza y la varianza de X.
En el ejemplo 2.9 se calcularon todas esas cantidades
x = 4,364
y = 1, 636
S xy = 1, 22
S x2 = 2,9555
y sustituyendo obtenemos
Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.
81
y 1, 636 =
1, 22
( x 4,364 )
2,9555
y = 0, 4128 x 0,1655
(Nota: la pequea diferencia que se observa con los coeficientes del ejemplo 2.12 es debida a errores de redondeo)
Correlacin lineal.
Tan importante es conocer la forma en que se relacionan las variables como su grado de relacin o
asociacin. De esto ltimo se ocupa la correlacin.
El grado de asociacin entre las variables indica en qu medida se puede encontrar una expresin
que explica una variable en funcin de otra. As en el ejemplo de la velocidad y el tiempo, donde el
grado de asociacin es completo, la expresin vt=500 explica perfectamente el valor de una variable
conociendo la otra. En otros casos la asociacin entre las variables no ser tan fuerte y la expresin
hallada no explicar exactamente a la variable dependiente en funcin de la independiente.
Todo esto equivale grficamente al hecho de que la grfica ajustada pase por los puntos observados
(caso de vt=500) o bien pase ms o menos prxima a ellos. Segn lo anterior, el estudio de la
correlacin equivale al estudio de la bondad del ajuste de una curva a un conjunto de puntos.
Para medir la bondad del ajuste nos fijaremos en la distancia entre la grfica de la funcin y los
puntos de la nube o diagrama de dispersin. Estas distancias se conocen como errores o residuos.
Cuando este anlisis se aplica sobre la recta de regresin hablamos de correlacin lineal.
1 n
( yi f ( xi ) )
n i =1
Esta medida tiene el inconveniente de no estar acotada entre unos valores fijos por lo que tenemos
el problema de no saber con precisin si est tomando valores significativamente grandes o
pequeos. Para superar dicho problema se define a partir de ella el coeficiente de determinacin
como
2
R = 1
Sry2
S
2
y
, siendo 0 R 2 1
En el caso de la recta, este coeficiente coincide con el coeficiente de correlacin lineal al cuadrado,
R2 = r 2 .
82
Sy
Sx
( x x) ,
r=0
y y =0
y=y
(anlogamente la recta de X/Y es
xx =0
x = x,
perpendiculares)
Al no relacionarse (linealmente) la variable independiente con la variable dependiente y por tanto
no aportar ninguna informacin, la variable independiente no aparece en la expresin de la recta de
regresin que se reduce a estimar los valores de la variable Y mediante y sea quien sea el valor de
X.
Si R 2 = 1 estamos ante un ajuste por mnimos cuadrados perfecto, la grfica de la funcin pasa por
todos los puntos de la nube (como en el ejemplo de vt=500). En el caso de la recta, como se dijo
anteriormente, ambas rectas de regresin coinciden y pasan por todos los puntos.
Para valores intermedios, 0 < R 2 < 1 , segn est R 2 ms prximo a un extremo u otro nos indicar
un peor o mejor ajuste. Adems, en el caso de la recta, cuanto ms se aproxime a 1 ms se cierra el
ngulo que forman las rectas de regresin y cuanto ms se aproxime a cero mayor ser dicho
ngulo.
Otra interpretacin de este coeficiente de determinacin, R 2 , es la proporcin de la varianza de Y
(comportamiento de la variable Y) que puede atribuirse a su relacin con X.
EJEMPLO 2.15.
D una medida de la bondad del ajuste de la recta del ejemplo 2.14. Obtenga la varianza residual.
Solucin:
En el ejemplo 2.9 se calcul el coeficiente de correlacin lineal para dichos datos
rxy =
S xy
Sx S y
1, 22
= 0, 7238 rxy2 = 0,5239
1, 72 0,98
Varianza residual:
r2 = 1
Sry2
S
2
y
83
Predicciones.
Predecir consiste en determinar a partir del modelo ajustado el valor de la variable dependiente
para un valor dado de la variable independiente. Cuando la estimacin se hace para un valor de la
variable independiente situado fuera de su rango de variacin se denomina extrapolacin, si este
valor se encuentra dentro del rango de valores analizados se denomina interpolacin.
Para la interpolacin la fiabilidad de los valores pronosticados ser tanto mayor cuanto mejor sea el
ajuste, sin embargo cuando hacemos predicciones para valores muy alejados del rango de variacin
de la variable independiente se corre el riesgo adicional de que el modelo ajustado no sea vlido
para dichos valores en la medida dada por R 2 . Este hecho es fcil de entender grficamente
7
6
5
Error de prediccin
cuando x=70
4
3
2
1
0
0
10
20
30
40
50
60
70
80
Se ha ajustado la recta para valores de x comprendidos entre 10 y 40, donde la recta refleja la
tendencia creciente de los valores de y en funcin de x. En este rango de valores las predicciones
que se hicieran no estaran sujetas a graves errores. Supongamos que desconocemos cmo se
comporta el fenmeno para valores de x mayores que 40 y decidiramos hacer una prediccin
(extrapolacin) para x=70, en tal caso cometeramos un grave error de prediccin.
EJEMPLO 2.16.
Se conoce que el consumo de pan en la dieta de los pases desarrollados est relacionado con la
renta per cpita. Ajuste una recta que explique dicha relacin sobre los siguientes datos, interprete
los coeficientes y halle la bondad del ajuste.
PAIS
Alemania
Blgica
Francia
Grecia
Holanda
Italia
Portugal
84
Kg./habitante
40
41
57
71
61
42
69
Solucin:
xi
yi
14,8
15,1
13,5
7,3
12
14
7,2
83,9
( x x)
xi yi
40
41
57
71
61
42
69
381
( y y)
592
619,1
769,5
518,3
732
588
496,8
4315,7
7,92
9,70
2,29
21,96
0,00
4,06
22,90
68,83
208,18
180,33
6,61
274,61
43,18
154,47
212,33
1079,71
1 n
2
S x2 = xi2 x
n i =1
S x2 =
1 n
xi x
n i =1
y 54, 4286 =
y y =
S xy
S x2
( x x ) , obtenemos
35,836
( x 11,9857 ) y 54, 4286 = 3, 64 ( x 11,9857 )
9,833
y = 3, 64 x + 98,1
La pendiente negativa (-3.64) indica que a mayor renta per cpita menor es el consumo de pan en la
dieta.
Para hallar la bondad del ajuste calculamos el coeficiente de correlacin lineal al cuadrado
rxy2 =
S xy2
S x2 S y2
( 35,836 )
= 0,85
EJEMPLO 2.17.
Una fbrica de cerveza ha tomado al azar 8 semanas del ao, observando la temperatura media en
cada una de ellas y los miles de litros de cerveza demandados
85
Temperatura
Cerveza
10
26
28
82
30
98
35
103
60
20
35
12
68
27
71
25
Puede la fbrica planificar la cantidad de produccin en funcin de la temperatura esperada? De
qu forma?
Solucin:
En primer lugar estudiaremos el grado de asociacin que hay entre las variables, si ste es
importante hallaremos la expresin segn la cual se relacionan.
xi
10
28
30
35
20
12
27
25
187
yi
26
82
98
103
60
35
68
71
543
( x x)
xi yi
( y y)
260
2296
2940
3605
1200
420
1836
1775
14332
178,89
21,39
43,89
135,14
11,39
129,39
13,14
2,64
535,88
1753,52
199,52
907,52
1233,77
62,02
1080,77
0,02
9,77
5246,88
187
543
= 23,375
y=
= 67,875
8
8
535,88
5246,88
S x2 =
S y2 =
= 66,98
= 655,86
8
8
14332
S xy =
x y = 204,92
8
x=
2
xy
r =
S xy2
S x2 S y2
( 204,92 )
66,98 655,86
= 0,956
Podemos decir que existe una fuerte relacin lineal entre las variables, rxy2 1 , de modo que la
fbrica podr planificar con mucha fiabilidad la cantidad de produccin en funcin de la
temperatura utilizando la recta de regresin de Y/X:
y 67,875 =
y y =
S xy
S x2
( x x)
204,92
( x 23,375) y 67,875 = 3, 06 ( x 23,375)
66,98
y = 3, 06 x 3, 65
Por ejemplo para una temperatura media de 330 se esperar una demanda de
86
y = ( 3, 06 33) 3, 65 = 97, 33
2.5
(97.330 litros)
Ejercicios resueltos.
1. Una fbrica de cerveza ha tomado al azar 10 semanas del ao, observando la temperatura media en
cada una de ellas y los miles de litros de cerveza demandados. Los datos recogidos se muestran en
la siguiente tabla:
Temperatura
Cerveza
12
25
10
28
30
35
20
12
27
25
224
33
66
26
82
98
103
60
35
68
71
642
Temperatura2 Cerveza 2
144
625
100
784
900
1225
400
144
729
625
5676
1089
4356
676
6724
9604
10609
3600
1225
4624
5041
47548
Temperatura Cerveza
TOTAL:
Utilizando los totales de la tabla anterior, responda a las siguientes cuestiones:
396
1650
260
2296
2940
3605
1200
420
1836
1775
16378
X=temperatura
n = 10
x=
S x2 =
1 n
xi x
n i =1
224
= 22, 4
10
Y=demanda de cerveza
y=
642
= 64, 2
10
1 n
2 5676
= xi2 x =
22, 42 = 65,84 S x = 65,84 = 8,1142
10
n i =1
1 n
2 47548
= yi2 y =
64, 2 2 = 633,16 S y = 633,16 = 25,1627
10
n i =1
n
1
16378
S xy = xi yi x y =
(22, 4 64, 2) = 199, 72
n i =1
10
S y2 =
b=
1 n
yi y
n i =1
S xy
S
2
x
199, 72
= 3, 0334
65,84
87
y y =b xx
a) r =
S xy
= 0,9782
SxS y
y = 3, 0334 x 3, 748
95, 68%
r 2 = 0,9568
Y=antigedad.
88
a)
Li1
Li
10
20
25
30
40
xi
20
25
30
40
50
ni
15
22,5
27,5
35
45
k 1
IG =
( pi qi )
i =1
k 1
xi ni
7
4
18
8
11
48
Ni
xi2ni
105
1575
90
2025
495 13612,5
280
9800
495
22275
1465 49287,5
7
11
29
37
48
ui
105
195
690
970
1465
pi
14,58
22,92
60,42
77,08
100,00
275,00
qi
7,17
13,31
47,10
66,21
100,00
233,79
k 1
= 1
= 1
i =1
k 1
133,79
= 0, 2355
175
i =1
i =1
b) Segn la anterior tabla hay un 60,42% de empleados con un salario inferior a 30000
euros/ao luego habr 100-60.42=39,58% de empleados con un salario superior a 30000
euros/ao.
c) El sueldo que es superado por el 30% de los empleados es el mismo que no es superado por
el 70% restante de empleados. Buscamos en la anterior tabla pi = 0,70 , al no aparecer
interpolamos entre los valores ms prximos
30
x
40
40 30
x 30
=
77,08 60,42 70 60, 42
60.42
70
77,08
x = 35,75
El 30% de los empleados mejor remunerados tienen un sueldo por encima de 35750
euros/ao.
d) Para la distribucin condicionada sobre la que nos preguntan su media, sumamos las dos
primeras columnas de frecuencias de la tabla.
Li1
10
20
25
30
40
Li
xi
20
25
30
40
50
ni
15
22,5
27,5
35
45
x=
xi ni
6
1
7
1
1
16
90
22,5
192,5
35
45
385
1 k
385
xi ni =
= 24, 0625
n i =1
16
e) Para comparar la homogeneidad de los trabajadores en las dos variables utilizamos una
medida de dispersin relativa, el coeficiente de variacin.
Con los datos de la tabla del apartado a) calculamos el coeficiente de variacin de los
salarios:
x=
1 k
1465
xi ni =
= 30,5208
48
n i =1
89
S x2 =
2
2
1 k
1 k
49287,5
xi x ni = xi2 ni x =
30,52082 = 95,3
n i =1
n i =1
48
CVx =
S x = 9,762
Sx
9,762
=
= 0,32
x 30,5208
Li1
0
10
20
30
y=
yj
Li
10
20
30
50
n j
5
15
25
40
y 2j n j
y j n j
10
6
11
21
48
50
90
275
840
1255
250
1350
6875
33600
42075
1 p
1255
y j n j =
= 26,1458
48
n j =1
2
2
1 p
1 p 2
42075
S = y j y n j = y j n j y =
26,14582 = 192,96
48
n j =1
n j =1
S
13,891
CV y = y =
= 0,53
y 26,1458
2
y
S y = 13,891
Luego los trabajadores son ms homogneos respecto del salario que de la antigedad.
f) En el apartado anterior se han calculado las medias y desviaciones tpicas marginales, slo
nos falta calcular la covarianza para lo cual construimos la siguiente tabla (representamos
cada intervalo por su punto medio o marca de clase):
x y n
i
j ij
xi y j nij
15
25
40
15
22,5
27,5
35
45
300
112,5
687,5
0
0
450
0
825
525
675
375
1687,5
687,5
1750
4500
0
0
11000
7000
10800
= 41375
i =1 j =1
1 k p
41375
( 30,5208 26,1458) = 63,99
S xy = xi y j nij x y =
48
n i =1 j =1
rxy =
S xy
63, 99
=
= 0, 472
S x S y 9,762 13,891
90
S xy
S
2
y
( y y)
xx =
x 30,5208 =
S xy
S y2
( y y) ,
sustituiremos y=12.
63, 99
( y 26,1458)
192, 96
x = 21,85 + 0, 3316 y
3. Una oficina donde se alquilan apartamentos ha observado que durante el mes de julio el nmero de
apartamentos alquilados vara segn el precio de los mismos. Del ao anterior se tiene la siguiente
informacin:
Precios por da ()
15
40
60
85
150
Calcule:
a) Precio medio por da de los apartamentos alquilados.
b) En qu medida podemos considerar que el nmero de apartamentos alquilados depende de
los precios?
Si se mantienen el comportamiento de los clientes y los precios:
c) Cuntos apartamentos se alquilaran con un precio de 90 por da?
d) Cul ser el precio mximo al que se podrn ofrecer apartamentos en alquiler?
Solucin:
a)
xi
15
40
60
85
150
x=
ni
xi ni
934
512
364
180
80
2070
14010
20480
21840
15300
12000
83630
1 k
83630
xi ni =
= 40, 4 euros por dia
n i =1
2070
91
xi
15
40
60
85
150
335
n=5
x=
S xy =
335
= 67
5
yi
xi yi
xi2
934
512
364
180
80
2070
14010
20480
21840
15300
12000
83630
225
1600
3600
7225
22500
35150
y=
yi2
872356
262144
132496
32400
6400
1305796
2070
= 414
5
1 n
83630
xi yi x y =
(67 414) = 11012
n i =1
5
S x2 =
1 n
xi x
n i =1
S y2 =
1 n
yi y
n i =1
S xy2 = 121264144
1 n
2 35150
= xi2 x =
67 2 = 2541
5
n i =1
1 n
2 1305796
= yi2 y =
4142 = 89763, 2
5
n
i =1
S xy2
121264144
r = 2 2 =
= 0,5317
S x S y 2541 89763, 2
2
xy
y 414 =
11012
( x 67 )
2541
y y=
S xy
S x2
( x x)
y 414 = 4,3337 ( x 67 )
y = 4,3337 x + 704,3579
d) El precio mximo al que se pueden ofrecer apartamentos es aquel para el que la demanda
sera nula. Cul ser el valor de X para el que estimamos que Y ser nulo?
0 = 4,3337 x + 704,3579
x=
704,3579
= 162,53 euros por dia
4,3337
X Y
0-1
1-3
3-4
ni
0-5
5-10
10-15
15-20
0
2
8
10
2
4
4
3
5
4
6
2
7
10
18
15
n j
20
n=50
a) De una estimacin del beneficio anual para un establecimiento con 12 aos de antigedad.
92
13
17
S xy
S x2
( x x)
0,5
3,5
ni
xi ni
xi2 ni
2,5
7,5
12,5
17,5
0
7,5
50
87,5
10
60
100
105
43,75
105
262,5
122,5
7
10
18
15
17,5
75
225
262,5
43,75
562,5
2812,5
4593,75
n j
20
13
17
n=50
580
8012,5
y j n j
10
26
59,5
95,5
y 2j n j
52
208,25
265,25
x=
1 k
580
xi ni =
= 11, 6
n i =1
50
y=
x y n
i
j ij
953,75
1 p
95,5
y j n j =
= 1,91
50
n j =1
1 k p
953, 75
(11, 6 1,91) = 3, 081
S xy = xi y j nij x y =
50
n i =1 j =1
S x2 =
2
2
1 k
1 k
8012,5
xi x ni = xi2 ni x =
11, 6 2 = 25, 69
50
n i =1
n i =1
S y2 =
2
2
1 p
1 p 2
265, 25
y
y
n
=
y j n j y =
1,912 = 1, 6569
j
j
n j =1
n j =1
50
y y =
S xy
S
2
x
( x x)
y 1, 91 =
3, 081
( x 11, 6 )
25, 69
y = 3, 3012 0,1199 x
y
x =12 = 3,3012 ( 0,1199 12 ) = 1,862 cientos de miles de euros
2
xy
b) r =
S xy2
S x2 S y2
r = 1
Sry2
S
2
y
( 3, 081)
25, 69 1, 6569
= 0, 223
2001
35
102
2002
40
101
2003
42
97
2004
43
98
2005
40
98
2006
53
100
2007
54
97
2008
49
91
2009
40
95
2010
55
95
93
xi
yi
35
40
42
43
40
53
54
49
40
55
451
n = 10 x =
102
101
97
98
98
100
97
91
95
95
974
451
974
= 45,1 y =
= 97, 4
10
10
S x2 =
S y2 =
1 n
xi x
n i =1
1 n
yi y
n i =1
xi2
yi2
xi yi
1225
1600
1764
1849
1600
2809
2916
2401
1600
3025
20789
10404
10201
9409
9604
9604
10000
9409
8281
9025
9025
94962
3570
4040
4074
4214
3920
5300
5238
4459
3800
5225
43840
S xy =
1 n
43840
xi yi x y =
(45,1 97, 4) = 8, 74
n i =1
10
1 n
2 20789
= xi2 x =
45,12 = 44,89 S x = 6, 7
10
n i =1
1 n
2 94962
= yi2 y =
97, 42 = 9, 44 S y = 3, 0725
10
n i =1
rxy =
S xy
Sx S y
8, 74
= 0, 4246
6, 7 3, 0725
es negativo como la covarianza, luego dicha expresin nos indica que al aumentar Y
disminuir el valor esperado para X . La anterior afirmacin es fiable en la medida en que la
recta de regresin exprese adecuadamente la relacin entre Y y X. El coeficiente de
correlacin lineal al cuadrado es quien determina si dicha recta se ajusta bien a los valores
de las variables. En este caso dicho coeficiente al cuadrado es 0,18 que no es un valor
prximo a 1 y por tanto la afirmacin hecha no ofrece grandes garantas.
94
X Y
0-4
4-8
8-14
ni
15-20
20-24
24-28
3
6
7
5
7
6
10
5
1
18
18
14
n j
16
n=50
a) Calcule la edad ms frecuente de aquellos jvenes que fuman ms de 4 cigarrillos al da.
18
16
Li1
15
20
24
Li
20
24
28
xi
17,5
22
26
ni
xi ni
15
12
7
34
xi2 ni
262,5 4593,75
264
5808
182
4732
708,5 15133,75
hi
3
3
1,75
Mo( I ) =
Li 1 + Li 15 + 20
=
= 17,5
2
2
Mo( II ) = Li 1 +
hi +1
3
ai = 15 +
5 = 20
hi 1 + hi +1
0+3
Mo( III ) = Li 1 +
Mo( I ) =
hi hi 1
30
ai = 15 +
5 = 20
( hi hi1 ) + ( hi hi+1 )
( 3 0 ) + ( 3 3)
Li 1 + Li 20 + 24
=
= 22
2
2
95
Mo( II ) = Li 1 +
hi +1
1, 75
ai = 20 +
4 = 21, 47
hi 1 + hi +1
3 + 1, 75
Mo( III ) = Li 1 +
hi hi 1
33
ai = 20 +
4 = 20
( hi hi1 ) + ( hi hi +1 )
( 3 3) + ( 3 1, 75)
Li1
15
20
24
Li
20
24
28
xi
17,5
22
26
ni
xi ni
18
18
14
50
xi2 ni
315 5512,5
396
8712
364
9464
1075 23688,5
1 n
1075
xi ni =
= 21,5
n i =1
50
2
1 n
23688, 5
S 2 = xi2 ni x =
21,52 = 11,52
n i =1
50
x=
c) Para estudiar lo representativa que es una medida de posicin central se utiliza una medida
de dispersin calculada sobre dicha medida, en este caso podramos utilizar la varianza. Si
se quiere comparar la representatividad de la media en dos variables utilizaremos una
medida de dispersin relativa calculada sobre la media, concretamente el coeficiente de
variacin.
A partir del apartado anterior es inmediato obtener el coeficiente de variacin para todos los
encuestados:
S = 11,52 = 3,3941
CV =
S 3,3941
=
= 0,1579
21,5
x
n i =1
34
2
1 n
15133, 75
S 2 = xi2 ni x =
23,83822 = 10,88
S = 10,88 = 3,30
n i =1
34
S
3,30
CV = =
= 0,158
x 20,8382
x=
Los coeficientes de variacin en ambos casos casi coinciden, luego son igualmente
representativas las medias de las dos distribuciones.
96
d)
Li1
Li
0
4
8
ni
4
8
14
Ni
16
18
16
50
pi
16
34
50
32
68
100
El nmero de cigarrillos que superan el 20% de jvenes que ms fuman es el mismo nmero
de cigarrillos que no alcanzan el 80% restante de fumadores. Interpolaremos el valor 80
entre los valores ms prximos de la columna pi .
8
x
14
14 8
x 8
=
100 68 80 68
68
80
100
7. Una empresa de importacin dispone de una cuota de mercado del 4% del sector. En los seis
ltimos aos el volumen de importacin y la produccin de los sectores que han absorbido dichas
importaciones son (en millones de euros):
Importacin
220
330
450
500
650
670
Produccin
1050
1200
1250
1300
1400
1540
X=Importaciones
Y=Produccin
S xy
S y2
( y y)
xi
yi
220
330
450
500
650
670
2820
1050
48400 1102500 231000
1200 108900 1440000 396000
1250 202500 1562500 562500
1300 250000 1690000 650000
1400 422500 1960000 910000
1540 448900 2371600 1031800
7740 1481200 10126600 3781300
xi2
yi2
xi yi
97
2820
= 470
6
x=
S y2 =
1 n
yi y
n i =1
S xy =
1 n
3781300
xi yi x y =
(470 1290) = 23916, 67
n i =1
6
xx =
S xy
2
y
y=
7740
= 1290
6
n=6
1 n
2 10126600
= yi2 y =
1290 2 = 23666, 67
6
n i =1
( y y)
x 470 =
23916, 67
( y 1290)
23666, 67
x = 833, 62 + 1, 01056 y
S y2 = 23666, 67
S x2 =
rxy =
1 n
xi x
n i =1
S xy
Sx S y
S y = 23666, 67 = 153,84
1 n
2 1481200
= xi2 x =
4702 = 25966, 67 S x = 161,14
6
n
i =1
23916, 67
= 0,965
161,14 153,84
rxy2 = 0,93
8. En ocho empresas los beneficios y los gastos en investigacin el ao pasado fueron los siguientes
(en miles de euros):
Beneficios
Gastos
550
400
600
400
400
350
500
500
300
400
400
450
500
350
500
550
98
Solucin:
a)
X=Beneficios
Y=Gastos
xi
yi
550
600
400
500
300
400
500
500
3750
400
302500 160000
400
360000 160000
350
160000 122500
500
250000 250000
400
90000 160000
450
160000 202500
350
250000 122500
550
250000 302500
3400 1822500 1480000
3750
= 468, 75
8
xi2
x=
S x2 =
1 n
xi x
n i =1
S y2 =
1 n
yi y
n i =1
S xy =
1 n
1600000
xi yi x y =
(468, 75 425) = 781, 25
8
n i =1
rxy =
S xy
Sx S y
220000
240000
140000
250000
120000
180000
175000
275000
1600000
3400
= 425
8
n =8
y=
xi yi
yi2
1 n
2 1822500
= xi2 x =
468, 752 = 8085,9375 S x = 89, 9218
n
8
i =1
1 n
2 1480000
= yi2 y =
4252 = 4375 S y = 66,1438
8
n i =1
781, 25
= 0,13135
89,9218 66,1438
rxy2 = 0, 01725
S xy
S
2
y
( y y)
x 468, 75 =
781, 25
( y 425)
4375
x = 392,86 + 0,17857 y
9. En la siguiente tabla se clasifican los trabajadores de una empresa segn su edad y antigedad en el
puesto de trabaja (ambas variables en aos)
99
Antigedad
0-3
3-6
6-10
10-15
Ms de 15
Edad
30-40
40-50
2
2
0
3
2
1
1
2
1
4
18-30
4
1
5
0
0
50-65
0
1
10
5
6
Li1
18
30
40
50
Li
30
40
50
65
xi
ni
24
35
45
57,5
xi ni
5
2
5
1
13
xi2 ni
120
2880
70
2450
225
10125
57,5 3306,25
472,5 18761,25
1 n
472, 5
xi ni =
= 36, 346
n i =1
13
2
1 n 2
18761, 25
2
S = xi ni x =
36,3462 = 122,1
S = 122,1 = 11, 05
13
n i =1
S 11, 05
CV = =
= 0,304
x 36,346
x=
Li1
18
30
40
50
Li
30
40
50
65
xi
24
35
45
57,5
ni
xi ni
5
4
7
21
37
xi2 ni
120
2880
140
4900
315
14175
1207,5 69431,25
1782,5 91386,25
1 n
1782,5
xi ni =
= 48,1757
n i =1
37
2
1 n
91386, 25
S 2 = xi2 ni x =
48,1757 2 = 149
S = 149 = 12, 2066
n i =1
37
S 12, 2066
CV = =
= 0, 2534
x 48,1757
x=
100
0-10
6
5
1
0
Gasto anual
10-20
20-30
0
0
2
1
3
0
1
1
Si el comportamiento del resto de las familias en la ciudad fuese similar al descrito en la tabla, cul
sera el gasto anual para una familia con dos hijos?
Solucin:
X=Nmero de hijos
Y=Gasto anual
y y=
S xy
S x2
( x x)
Representamos cada intervalo por su punto medio o marca de clase y efectuamos en la siguiente
tabla los clculos necesarios para obtener las medias, varianza de X y covarianza.
xi y j nij
15
25
ni
xi ni
xi2 ni
0
1
3
4
0
25
15
0
0
30
135
60
0
25
0
100
6
8
4
2
0
8
12
8
0
8
36
32
n j
12
n=20
28
76
y j n j
60
90
50
200
x y n
i
j ij
390
i =1 j =1
x=
1 k
28
xi ni =
= 1, 4
n i =1
20
S x2 =
y=
1 p
200
y j n j =
= 10
20
n j =1
2
2
1 k
1 k
76
xi x ni = xi2 ni x =
1, 42 = 1,84
n i =1
n i =1
20
1 k p
390
(1, 4 10 ) = 5,5
S xy = xi y j nij x y =
n
20
=
1
=
1
i
j
y y =
S xy
S
2
x
( x x)
y 10 =
5, 5
( x 1, 4 )
1,84
y = 5,815 + 2, 989 x
11. Los beneficios anuales (en miles de euros) y el nmero de empleados de las 50 empresas de un
determinado polgono industrial son:
101
N de empleados
0-10
10-20
20-40
8
2
0
10
4
2
4
6
4
0
0
10
Beneficios
0-20
20-40
40-60
60-100
X=Beneficios
Y=Nmero de empleados
En los tres apartados nos piden que calculemos medidas sobre la distribucin marginal de X.
a)
Li1
Li
0
20
40
60
xi
20
40
60
100
IG =
i =1
k 1
xi ni
10
30
50
80
k 1
( pi qi )
ni
10
16
14
10
50
Ni
100
480
700
800
2080
10
26
40
50
ui
pi
100
580
1280
2080
qi
20
52
80
100
252
4,81
27,88
61,54
100,00
194,23
k 1
= 1
i =1
k 1
= 1
94, 23
= 0, 38
152
i =1
i =1
b) El beneficio mnimo del 40% de las empresas ms rentables es igual al beneficio mximo
del 60% restante de empresas menos rentables. Interpolamos 60 en la columna de los pi
40
x
60
52
60
80
60 40 x 40
=
x = 45, 714 miles de euros 45714 euros
80 52 60 52
c) Calculamos las empresas menos rentables que obtienen el 75% restante del total de los
beneficios anuales de dicho polgono. Interpolamos 75 en la columna de los qi
80
x
100
61,54
75
100
100 80
x 80
=
x = 87% 100 87 = 13%
100 61,54 75 61,54
Si el 75% de las empresas menos rentables obtienen el 87% del total de los beneficios, el
25% restante de las empresas ms rentables obtienen el 13% restante de los beneficios.
12. En la siguiente tabla se han recogido los datos sobre ingresos y ahorro de una muestra de 5 familias
Ingresos
Ahorro
1630
250
2450
650
3210
700
3320
720
4250
980
Cul sera el ahorro de una familia con 3000 de ingresos? Es fiable la anterior estimacin?
Solucin:
102
X=Ingresos
Y=Ahorro
Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.
Ajustaremos la recta de regresin de Y/X y sustituiremos x=3000 para estimar el ahorro en funcin
de los ingresos. Calcularemos el coeficiente de determinacin asociado a la recta (coeficiente de
correlacin lineal al cuadrado) para valorar la fiabilidad de la estimacin.
xi
yi
1630
2450
3210
3320
4250
14860
14860
= 2972
5
xi2
250
650
700
720
980
3300
yi2
xi yi
2656900
62500
407500
6002500 422500 1592500
10304100 490000 2247000
11022400 518400 2390400
18062500 960400 4165000
48048400 2453800 10802400
x=
S x2 =
1 n
xi x
n i =1
S y2 =
1 n
yi y
n i =1
S xy =
1 n
10802400
xi yi x y =
(2972 660) = 198960 S xy2 = 39585081600
5
n i =1
y y =
S xy
S
2
x
( x x)
y=
3300
= 660
5
n=5
1 n
2 48048400
= xi2 x =
2972 2 = 776896
n
5
i =1
1 n
2 2453800
= yi2 y =
660 2 = 55160
5
n i =1
y 660 =
198960
( x 2972)
776896
y = 101,1 + 0, 2561x
y
x =3000 = 101,1 + ( 0, 2561 3000 ) = 667, 2
rxy2 =
S xy2
2
x
S S
2
y
39585081600
= 0,9237
776896 55160
Dado que el valor del coeficiente de determinacin es prximo a 1 y que la prediccin se est
haciendo para un valor de X dentro del rango de valores utilizados en el ajuste de la recta, podemos
decir que la anterior prediccin es bastante fiable.
103
3.
NMEROS NDICES.
Variacin absoluta.
Sea una serie de observaciones de una variable X ordenadas en el tiempo, obtenidas en perodos
temporales de la misma duracin:
x0 , x1 , x2 , ..., xt 1 , xt , xt +1 , ..., xn
(supondremos para simplificar la exposicin y por ser uno de los casos ms frecuentes, que
disponemos de observaciones mensuales. Lo mismo sera aplicable a otros perodos de tiempo).
Se define la variacin absoluta en el mes t respecto del mes anterior como la diferencia:
1 ( xt ) = xt xt 1
Su signo positivo o negativo nos indica una evolucin creciente o decreciente respectivamente. Estas
diferencias estn expresadas en las mismas unidades que la serie original, lo que dificulta hacer
comparaciones. Incluso cuando se usa la misma unidad de medida, el valor de la variacin absoluta
no es fcil de interpretar. Vemoslo en el siguiente ejemplo.
EJEMPLO 3.1.
Supongamos que el valor de una serie de datos, X, en el momento t es igual a 315 y en el momento
t-1 era igual a 300, la variacin absoluta sera
1 ( xt ) = xt xt 1 = 315 300 = 15
Consideremos otra serie, Y, que en momento t-1 era igual a 1000 y en el momento t igual a 1015,
su variacin absoluta sera de igual signo que la anterior (ambas series tienen una evolucin
creciente) y de igual cuanta
1 ( yt ) = yt yt 1 = 1015 1000 = 15
104
Sin embargo, es evidente que la evolucin en ambos casos no tiene la misma importancia.
Para medir de forma ms precisa estas variaciones, de forma que sean comparables, hay que
observarlas en relacin a los datos que las provocan, es decir, en trminos relativos.
1 ( xt ) xt xt 1
x
=
= t 1
xt 1
xt 1
xt 1
k ( xt ) xt xt k
x
=
= t 1
xt k
xt k
xt k
1 ( xt ) xt xt 1
x
315
=
= t 1 =
1 = 1, 05 1 = 0, 05
xt 1
xt 1
xt 1
300
5%
yt
1015
1 =
1 = 1, 015 1 = 0, 015
yt 1
1000
1, 5%
Lo que muestra que aunque en ambos casos la variacin absoluta es la misma, en la primera serie
supone un 5% sobre el valor inicial (300) y en la segunda serie slo un 1,5% sobre el valor inicial
(1000), sealando la mayor importancia de la variacin en la primera serie comparada con la
segunda.
105
La tasa de variacin toma el mismo valor cuando las cantidades que se comparan son
proporcionales. Por ejemplo: 315 5 = 1575 , 300 5 = 1500
T1 (t ) =
1 ( zt ) zt zt 1
z
1575
=
= t 1 =
1 = 1, 05 1 = 0, 05
zt 1
zt 1
zt 1
1500
5%
xt
x
1 = t
xt 1
xt 1
xt
x
1 = t
xt k
xt k
Donde como puede observarse, se comparan por cociente el valor actual de la serie, xt , con un
valor anterior, xt 1 (o xt k ).
Se denomina as porque expresa en lo que se transforma una unidad entre los perodos de tiempo
considerados.
EJEMPLO 3.3.
En nuestro ejemplo, el factor de variacin unitaria para la serie de valores, X, sera:
1 + T1 (t ) =
xt
315
=
= 1, 05
xt 1 300
Cada unidad en t-1 se transforma en 1,05 unidades en t, as las 300 unidades en t-1 se transforman
en 300x1,05=315 unidades en t, 500 unidades se transformaran en 500x1,05=525, etc.
Para la otra serie, Y, el factor de variacin unitaria valdra:
1 + T1 (t ) =
106
yt 1015
=
= 1, 015
yt 1 1000
una unidad en t-1 se transformara en 1,015 unidades en t, as las 1000 unidades en t-1 se
transforman en 1000x1,015=1015 unidades en t, 300 unidades se transformaran en
300x1,015=304,5 , etc.
x2 = (1 + T1 (t ) ) x1 = (1 + T1 (t ) )(1 + T1 (t ) ) x0 = (1 + T1 (t ) ) x0
2
y sucesivamente en
x12 = (1 + T1 (t ) ) x0
12
La tasa de variacin anual equivalente producira la misma variacin absoluta, pasando en un ao del
valor inicial x0 al valor final x12 , es decir
x12 = 1 + Tl 12 x0
Igualando las dos ltimas expresiones obtenemos
(1 + T1 (t ) )
12
= 1 + Tl 12
12
Tl 12 = (1 + T1 (t ) ) 1
La primera expresin indica que el producto del factor de variacin unitaria mensual por s mismo,
las doce veces que se repite, nos da el factor de variacin unitaria anual equivalente.
Nota: lo notamos Tl 12 (en lugar de T12 ) para indicar que es un valor estimado bajo el supuesto de
que la tasa de variacin mensual es la misma para todos los meses, T1 (t ) .
T12 se obtendra a partir de la tasa de variacin mensual de cada uno de los doce meses que forman
el ao como
107
La primera igualdad expresa que el producto de los factores de variacin unitaria de todos los
meses que componen el ao es igual al factor de variacin unitaria anual.
Para indicar que esta tasa anual equivalente se obtiene a partir de una tasa mensual, la notaremos
como
(1)
12
Tl 12 = (1 + T1 (t ) ) 1
Si la tasa anual equivalente se obtiene a partir del primer trimestre del ao, se nota
(3)
4
Tl 12 = (1 + T3 (t ) ) 1
Anlogamente si se ha obtenido a partir de otros perodos en los que se pueda dividir el ao.
(1)
(3)
Leeremos Tl 12 como tasa de variacin mensual elevada a anual, Tl 12 como tasa de variacin
2,354%
108
x0 , x1 , x2 , ..., x12
con las siguientes tasas mensuales de variacin asociadas
T1 (1) =
x1
1
x0
T1 (2) =
x2
1
x1
T1 (12) =
x12
1
x11
Cul sera el valor de la tasa mensual de variacin que aplicada repetidamente a lo largo de los doce
meses nos llevara al mismo valor final del perodo anual, x12 , partiendo del valor inicial, x0 ? Es
decir, cul sera la tasa mensual media de variacin TM 1 .
Con los factores de variacin unitaria observados se tiene que
x12 = x0 (1 + T1 (1) )(1 + T1 (2) ) ... (1 + T1 (12) )
Si se repite una tasa mensual TM 1 durante los doce meses, transformndose x0 en x12
x12 = x0 (1 + TM 1 )(1 + TM 1 ) ... (1 + TM 1 ) = x0 (1 + TM 1 )
12
12
12
Esta ltima expresin indica que el factor de variacin unitaria asociado a la tasa media de variacin
mensual es la media geomtrica de los factores de variacin unitaria asociados a las diferentes tasas
de variacin mensual. Despejando la tasa media de variacin mensual se obtiene
x12
= (1 + T1 (1) )(1 + T1 (2) ) ... (1 + T1 (12) )
x0
x12
1
x0
De forma similar se calculara la tasa media de variacin si en lugar de meses nos referimos a otros
perodos o si en lugar de 12 datos se dispone de un nmero diferente.
EJEMPLO 3.5.
El consumo de agua, en m 3 , de una comunidad de regantes fue de diciembre de 2010 a junio de
2011
109
t
2010 diciembre
2011 enero
2011 febrero
2011 marzo
2011 abril
2011 mayo
2011 junio
consumo
15400
17300
25600
30200
27000
26400
24800
Calcule:
a) La variacin absoluta trimestral.
b) Tasas mensuales de variacin.
c) Tasa semestral de variacin.
d) Tasa mensual media de variacin en todo el perodo.
Solucin:
a)
t
3 ( xt )
30200-15400=14800
27000-17300=9700
26400-25600=800
24800-30200=-5400
2011 marzo
2011 abril
2011 mayo
2011 junio
b)
t
T1 (t )
17300
1 = 0,1234
15400
25600
1 = 0, 4798
17300
30200
1 = 0,1797
25600
27000
1 = 0,1060
30200
26400
1 = 0,0222
27000
24800
1 = 0,0606
26400
2011 enero
2011 febrero
2011 marzo
2011 abril
2011 mayo
2011 junio
c) Dos formas:
T6 ( junio 11) =
24800
1 = 0,6104
15400
O bien como
1 + T6 ( junio 11) = (1 + T1 ( enero 11) ) (1 + T1 ( febrero 11) ) ... (1 + T1 ( junio 11) ) =
1,1234 1, 4798 1,1797 0,8940 0,9778 0,9394 = 1, 6104
d) Varias formas:
1 + TM 1 =
24800
=
15400
TM 1 % = 26,9%
It / 0 ( X ) =
xt
x0
Nota: observe la relacin del ndice elemental con la tasa de variacin y el factor de variacin
unitaria definidos anteriormente: 1 + T1 (t ) = 1 +
xt
x
1 = t ,
xt 1
xt 1
1 + Tt (t ) = 1 +
xt
x
1 = t
xt t
x0
, es
EJEMPLO 3.6.
El precio de la gasolina ha pasado de 1,125/litro a 1,328/litro. Calculando el correspondiente
ndice elemental podemos ver que
I1/ 0 ( X ) =
x1 1,328
=
= 1,18
x0 1,125
x0 1,125
=
= 0,847
x1 1,328
1 0,847 = 0,153
antes su valor era el 84,7% de su valor actual, es decir, un 15,3% ms barata que actualmente.
111
De la misma definicin de ndice elemental resulta la siguiente propiedad (propiedad circular) que
nos va a permitir referirnos a perodos base distintos del perodo 0
xt xt xt '
=
x0 xt ' x0
I t / 0 ( X ) = I t / t ' ( X ) I t '/ 0 ( X )
de donde
It / t ' ( X ) =
It / 0 ( X )
I t '/ 0 ( X )
EJEMPLO 3.7.
El ao pasado el precio de la gasolina ha experimentado entre los meses de enero y junio una
subida, segn el ndice elemental, de 1,185 y entre los meses de enero y diciembre una subida,
segn el mismo ndice, de 1,225. Qu subida ha experimentado el precio de la gasolina entre los
meses de junio y diciembre?
Solucin:
Etiquetamos por comodidad como 0, 1 y 2 a los tres meses de enero, junio y diciembre
respectivamente.
I 2 /1 ( X ) =
I 2 / 0 ( X ) 1, 225
=
= 1, 0338
I1/ 0 ( X ) 1,185
Observe que no sera vlido el siguiente razonamiento: de enero a junio ha aumentado un 18,5%,
de enero a diciembre ha aumentado un 22,5%, por tanto de junio a diciembre ha aumentado un
22,5-18,5=4%.
ndice sinttico.
Consideremos ahora un conjunto X de magnitudes simples, X1 , X 2 ,..., X i ,..., X n (por ejemplo,
precios de distintos artculos). Los ndices elementales de las magnitudes simples X i se definen
como
It / 0 ( X i ) =
xit
xi 0
Queremos resumir en un nico ndice (que llamaremos ndice sinttico, compuesto o complejo)
los ndices elementales de las magnitudes simples X i .
112
Hay distintas soluciones, todas ellas se basan en el clculo de medias sobre dichos ndices
elementales.
Distinguiremos entre ndices sintticos sin ponderar (a todas las magnitudes simples se le da la
misma importancia) e ndices sintticos ponderados (a cada magnitud simple se le asigna una
importancia diferente).
1 n xit
St / 0 ( X ) =
n i =1 xi 0
Dt / 0 ( X ) =
it
i =1
n
i0
i =1
uit = 1
i =1
ndice de Laspeyres.
Es la media aritmtica de los ndices elementales con ponderaciones del perodo base
n
Lt / 0 ( X ) =
i =1
xit
ui 0
xi 0
113
ndice de Paasche.
Es la media armnica de los ndices elementales con ponderaciones del perodo actual
Pt / 0 ( X ) =
1
xi 0
uit
i =1 xit
n
ndice de Fisher.
Es la media geomtrica de los ndices de Laspeyres y Paasche
Ft / 0 ( X ) = Lt / 0 ( X ) Pt / 0 ( X )
Perodo actual
precios cantidades
p1t
q1t
p20
q20
p2t
q2 t
.
pi 0
.
qi 0
.
pit
.
qit
.
qn 0
.
qnt
pn 0
pnt
Se puede obtener fcilmente el valor total de cada artculo para el perodo base, pi 0 qi 0 , y para el
perodo actual, pit qit . Por tanto el valor global de todos los artculos en el perodo base ser
n
p q
it it
i =1
Se suele tomar como factores de ponderacin el valor relativo de cada artculo en relacin al valor
global
ui 0 =
pi 0 qi 0
n
p
j =1
114
j0
q j0
uit =
pit qit
n
jt
q jt
j =1
ndices de precios.
Para hallar los ndices sintticos de precios utilizaremos como ndices elementales
pit
pi 0
p
t/0
=
i =1
n
pit
p
ui 0 = it
pi 0
i =1 pi 0
pi 0 qi 0
n
p j 0q j0
=
i =1
j =1
pit qi 0
n
j0
q j0
p q
it i 0
i =1
n
i0 i0
j =1
i =1
Es decir, el ndice de precios de Laspeyres consiste en calcular el valor de las cantidades del perodo
base a precios del perodo base y perodo actual y compararlos por cociente.
Mientras que en el ndice de precios de Paasche se consideran las cantidades del perodo actual, se
determina su valor a precios del perodo base y actual y se comparan por cociente.
n
p
t/0
P =
i =1
1
=
pi 0
uit
pit
1
n
i =1
pi 0
pit
pit qit
n
jt
i =1
q jt
1
pi 0 qit
j =1
jt
q jt
p q
it it
i =1
n
i 0 it
i =1
j =1
En el caso de que las cantidades del perodo base y actual coincidan tambin coincidirn los dos
ndices anteriores, Ltp/ 0 = Pt /p0 .
Se llama cesta de la compra a un conjunto de artculos (y cantidades), obtenidos a partir de la
encuesta de presupuestos familiares, representativos de un determinado nivel de vida. El ndice de
ndices de cantidades.
Ahora los ndices elementales son los cocientes
qit
qi 0
n
q
t/0
q
= it ui 0 =
i =1 qi 0
i 0 it
i =1
n
i0 i0
i =1
El ndice de cantidades de Laspeyres compara el valor de las cantidades de los perodos base y
actual con precios del perodo base. Mientras que el ndice de cantidades de Paasche compara el
valor de las cantidades de los perodos base y actual con precios del perodo actual.
115
q
t/0
P =
p q
it it
i =1
n
p q
it i 0
i =1
Tanto para precios como para cantidades se define el ndice de Fisher como la media geomtrica de
los ndices de Laspeyres y Paasche (por tanto su valor est comprendido entre ambos).
ndices de Marshall-Edgeworth.
Adopta una posicin (valor) intermedia entre los ndices de Laspeyres y Paasche considerando la
media de las cantidades en los perodos base y actual para hallar el ndice de precios
n
p
t /0
pit
( qi 0 + qit )
2
=
=
qi 0 + qit )
(
pi 0
2
i =1
i =1
n
p (q
it
i0
i =1
n
p (q
i0
i0
i =1
+ qit )
+ qit )
Para hallar el ndice de cantidades considera la media de los precios en los perodos base y actual
n
q
t /0
qit
( pi 0 + pit )
2
=
=
pi 0 + pit )
(
qi 0
2
i =1
i =1
n
q ( p
it
i0
i =1
n
q ( p
i0
i0
i =1
+ pit )
+ pit )
ndices de valor.
Supongamos un fenmeno caracterizado por un conjunto de cantidades y precios que varan a lo
largo del tiempo (p.e. la produccin). Nos planteamos estudiar la variacin en el valor agregado de
dicho fenmeno.
n
i =1
i =1
V
t/0
V
= t =
V0
p q
it it
i =1
n
i0 i0
i =1
Se puede demostrar fcilmente que el ndice anterior puede obtenerse como el producto de un
ndice de precios por un ndice de cantidades, segn:
116
I t / t2 =
I t / t1
I t2 / t1
Si se quiere expresar el ndice I t / t2 en la base t1 , haremos uso de la misma propiedad escrita como
I t / t1 = I t / t2 I t2 / t1 .
EJEMPLO 3.8.
Dadas las siguientes series de nmeros ndices de precios al consumo obtenga una sola serie para
todo el periodo con base 2001 y otra con base en 2003
Ao
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
100
103
107
113
IPC (base2004)
100
110
120
123
Solucin:
Para aplicar la propiedad circular y cambiar de base, los nmeros ndices deben estar expresados en
tanto por uno, para lo cual los dividimos primero por 100.
117
Ao
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
Ao
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
400 150
= 1, 6667 166, 67%
150
Para obtener los gastos en enseanza en trminos reales hemos de deflactar los valores corrientes,
transformando los euros corrientes de cada ao en euros constantes del ao base.
En este ejemplo los IPC son tales que si procedemos a deflactar directamente tendramos hasta el
2004 los gastos expresados en euros de 2001 y a partir de 2004 en euros de este ao, por lo que las
cantidades no seran comparables. Por ello en primer lugar vamos a expresar todos los ndices en la
misma base, usando I t / 2001 = I t / 2004 I 2004 / 2001 (ndices expresados en tanto por uno)
IPC (base 2001)
1,00
1,15
1,35
1,80
1,89=1,05x1,80
2,16=1,20x1,80
2,70=1,50x1,80
O bien, usando I t / 2004 =
I t / 2001
I 2004 / 2001
55,55
63,89
75
100
105
120
150
119
Obsrvese que se llega a la misma variacin relativa en trminos reales, tanto si se toma un ao
base como otro.
EJEMPLO 3.10.
El salario medio en los ltimos cinco aos en una empresa siderometalrgica y los ndices de precio
de consumo han sido
Aos
Salarios
IPC
2008
1760
107
2009
1830
113
124,3
2010
1950
135,6
2011
2100
139
2012
2200
Estudie el valor real de los salarios en euros constantes del 2012. Calcule la tasa de crecimiento
medio anual de los salarios en trminos reales.
120
Solucin:
Aos
2008
2009
2010
2011
2012
Salarios
corrientes
1760
1830
1950
2100
2200
IPC
(base 2012)
1,07/1,39=0,7698
1,13/1,39=0,8129
1,243/1,39=0,8942
1,356/1,39=0,9755
1,39/1,39=1,00
2200
S4
1 = 4
1 = 0,99 1 = 0, 01
S0
2286,3
EJEMPLO 3.11.
El propietario de una vivienda alquil esta en 500 mensuales a cuatro estudiantes de la Facultad de
CC. Econmicas y Empresariales en Octubre de 2010. Este haba pactado revisar el precio del
alquiler en Enero de cada ao de acuerdo al incremento de precios al consumo del ltimo ao. El
valor del IPC se recoge en la siguiente tabla
Aos
IPC
2009
113
2010
124,3
2011
135,6
2012
139
A cunto ascender el precio del alquiler a partir de Enero de 2013?
Solucin:
Aos
IPC %
IPCao t / ao t 1
Alquiler
2009
2010
2011
2012
2013
113
124,3
135,6
139
124,3/113=1,10
135,6/124,3=1,0909
139/135,6=1,0251
500
500 1,10=550
550 1,0909=599,99600
600 1,0251=615,06615
121
Muchos ndices, entre ellos el IPC espaol, estn basados en el ndice de Laspeyres.
Los ndices de Laspeyres y Paasche poseen la propiedad de agregacin: El ndice de Laspeyres
sobre un conjunto de productos es igual al ndice de Laspeyres calculado sobre los ndices de
Laspeyres de cada subconjunto de productos. Lo mismo ocurre con el ndice de Paasche.
Escribiremos la propiedad de agregacin con la siguiente notacin general (donde el ndice I t / 0
representa a Lt / 0 en el caso del IPC, X i representa al grupo i)
n
I t / 0 ( X ) = I t / 0 ( X i ) ui 0
i =1
i =1
i =1
I ( X ) = I t '/ 0 ( X ) I t / 0 ( X ) = ( I t '/ 0 ( X i ) I t / 0 ( X i ) ) ui 0 = I ( X i ) ui 0
EJEMPLO 3.12.
Las ponderaciones de los siguientes grupos en el IPC para el ao base son
Grupo
Ponderacin en %
35
Alimentos
9
Vestido
17
Vivienda
7
Menaje y hogar
3
Salud
12
Transporte
5
Ocio
8
Enseanza
4
Otros
Total
100
Si el IPC de este ao ha sido 115,96, calcule el IPC para el prximo ao en los siguientes casos:
a) El ndice de la vivienda se incrementa 15 puntos permaneciendo igual el resto de los ndices.
b) Los ndices de vivienda y transporte se incrementan 10 y 5 puntos respectivamente, los
ndices de vestido y enseanza disminuyen 2 y 1 punto respectivamente, no variando el resto
de los ndices.
Solucin:
n
122
3.7
Ejercicios resueltos.
1. La tabla muestra los beneficios anuales, en millones de euros, de una empresa y los ndices de
precios (IPC) para el perodo 2005-2010:
Ao
2005 2006 2007 2008 2009 2010
Beneficios 9,3 9,5
9
10 11,4 13
IPC
105 110 112
IPC
100 103 108 114
2006
9,5
110
98,21
86,15
11,027
-2,48
2007
9
112
100
87,72
10,26
-6,96
2008
10
115,36
103
90,35
11,068
7,88
2009
11,4
120,96
108
94,74
12,033
8,72
2010
13
127,68
114
100,00
13
8,04
a) Las dos series de nmeros ndices (IPC) pueden enlazarse de las dos formas que aparecen en
la tabla (dividiendo la primera serie por 1,12 o multiplicando la segunda serie por 1,12).
Posteriormente, haciendo que el IPC para el ao 2010 sea 100 (dividiendo por 1,2768 la
primera serie de IPC o por 1,14 la segunda serie de IPC) se obtiene la serie de nmeros
ndices (IPC) enlazada con base el ao 2010. Debido al redondeo puede haber en algn caso
una pequea diferencia entre ambos mtodos.
b) Dividiendo los beneficios corrientes entre los IPC (base 2010) se obtienen los beneficios a
precios del 2010 que aparecen en la tabla. Para estos clculos se expresan los IPC en tantos
por uno.
9,3
13
= 11,308
...
= 13
0,8224
1
c) A partir de los cocientes entre los beneficios reales (a precios del 2010) de aos
consecutivos se obtienen las tasas de variacin anual. Se multiplican por 100 para
expresarlas en %.
11, 027
1 = 0, 0248
11,308
d) Se puede calcular de dos formas:
...
13
1 = 0, 0804
12,033
123
Como media geomtrica sobre las tasas de variacin anual (sumndole 1) de los
beneficios reales
5
(1 0, 0248)(1 0, 0696 )(1 + 0, 0788 )(1 + 0, 0872 )(1 + 0, 0804 ) 1 = 1, 0283 1 = 0, 0283
13
1 = 0, 0283
11, 308
De ambas formas se obtiene que la tasa media de variacin anual de los beneficios reales es
5
del 2,83%.
2. Los beneficios, en millones de euros, obtenidos por una empresa y los valores del IPC se muestran
en la tabla siguiente:
Ao
2005 2006 2007 2008 2009 2010 2011
Beneficios 2,3 3,7 4,5 5,3
6
6,2 6,4
IPC
100 105 108 115
IPC
100 102 104 107
Solucin:
a) Multiplicando la segunda serie de IPC por 1,15 se enlaza con la primera serie de IPC.
Dividiendo la serie enlazada por 1,2305 se cambia de base a 2011. Dividiendo los beneficios
nominales o corrientes por esta ltima serie de IPC (en tanto por 1) se obtienen los
beneficios reales en euros de 2011.
Ao
Beneficio
IPC
IPC
IPC(2011)
Beneficio (2011)
2005
2,3
100
2006
3,7
105
2007
4,5
108
81,27
2,830
85,33
4,336
87,77
5,127
2008
5,3
115
100
93,46
5,671
2009
6
117,3
102
95,33
6,294
2010
6,2
119,6
104
97,20
6,379
2011
6,4
123,05
107
100,00
6,400
b)
6
6, 4
1 = 0,1457 incremento anual medio de los beneficios en trminos reales de un 14,57%
2,83
3. Los beneficios (en miles de euros) obtenidos en una pequea empresa y la evolucin del IPC se
muestran en la tabla siguiente:
Aos
2006 2007 2008 2009 2010 2011
Beneficios 25,8 28,3 30,1 33,9 39
42
IPC
125 128 130
IPC
100 104 107 109
124
2010 2011
39
42
139,1 141,7
107
109
98,17 100,00
39,73 42,00
b) Dividimos los beneficios reales (beneficios en miles de euros de 2011) de cada ao sobre los
del ao anterior y le restamos 1 para obtener las tasas de variacin anual. Si quisiramos
expresarlas en tantos por ciento se multiplicaran por 100.
Aos
Tasas de variacin anual real
Tasas de variacin anual real en %
2006
La tasa media anual de variacin de los beneficios reales se puede obtener de dos formas:
A partir de las tasas de variacin anual reales o a partir de los valores inicial y final de los
beneficios reales.
TM =
B2011
1
B2006
Segn la primera:
TM = 5 1, 0712 1, 0472 1, 0829 1,1182 1, 0572 1 = 5 1,436 1 = 0,075
Segn la segunda:
5
42
B2011
1 = 5
1 = 5 1, 436 1 = 0, 075
B2006
29, 25
Luego la tasa media anual de variacin de los beneficios reales ha sido del 7,5%.
4. El beneficio anual, en millones de euros corrientes, de una empresa y los ndices de precios al
consumo han sido:
125
Ao
2007
2008
2009
2010
2011
2012
IPC
110
115
118
-
IPC
110
105
107
110
a) Calcule el beneficio total, para el periodo 2007-2012, en euros constantes del 2012.
b) La tasa media de variacin anual del beneficio en trminos reales.
Solucin:
a) Para enlazar las dos series de IPC, dividimos la primera serie por 1,18 y la multiplicamos
por 1,10.
Ao
2007
2008
2009
2010
2011
2012
IPC
110
115
118
-
IPC
102,5424
107,2034
110
105
107
110
Dividimos los beneficios en euros corrientes entre los IPC con base 2012 (expresados en
tanto por 1), obteniendo los beneficios en euros constantes del 2012 que suman un total para
el perodo 2007-2012 de 9,6718 millones de euros.
Ao
2007
2008
2009
2010
2011
2012
Millones de euros
constantes (2012)
1,5018
1,4878
1,5200
1,6762
1,6860
1,8000
b) A partir de la tabla de los beneficios en euros constantes o trminos reales obtenemos la tasa
de variacin anual media como
5
126
1,8
B2012
1 = 5
1 = 5 1,19856 1 = 0, 0369 3, 69%
B2007
1,5018
5. El gasto en medicamentos de una clnica en euros corrientes del perodo 2008-2012 y el ndice de
precios al consumo han sido:
Ao
Gasto en miles de euros
2008
18
2009
21
Ao
IPC
IPC
2009
130
100
2010
2011
2012
105
120
124
2008
125
2010
20
2011
25
2012
27
2008
96,1538
2009
100
2010
105
2011
120
2012
124
Cambiamos los IPC a la base 2012 dividiendo la serie enlazada de IPC por 1,24.
Ao
IPC (base 2012)
2008
77,5434
2009
80,6452
2010
84,6774
2011
96,7742
2012
100
2008
23,213
2009
26,040
2010
23,619
2011
25,833
2012
27
Lo que nos da un gasto real total en medicamentos durante el perodo 2008-2012 de 125705
euros de 2012.
b) A partir de la tabla del gasto real obtenemos la tasa de crecimiento anual medio como
4
27
G2012
1 = 4
1 = 4 1,1631 1 = 0, 0385 3,85%
G2008
23, 213
6. Los beneficios distribuidos por una sociedad annima y los ndices de precios en el perodo 20082012 fueron:
Ao
Beneficio ()
IPC (2005)
IPC (2010)
2008
4875
132
2009
6742
135
2010
9524
137
100
2011
8635
2012
7421
103
108
127
Ao
IPC (2010)
IPC (2008)
2008
2009
2010
2011
2012
96,3504 98,5401
100
103
108
100
102,2727 103,7878 106,9015 112,0909
b) Obtenemos en primer lugar la serie de IPC con base en 2012 dividiendo la serie IPC (2010)
por 1,08. Posteriormente se dividen los beneficios nominales entre los valores de esta ltima
serie de IPC (2012), expresada en tantos por 1, y se obtienen los beneficios reales en euros
constantes de 2012.
Ao
IPC (2012)
Beneficio en euros
constantes de 2012
2008
89,2133
2009
91,2409
2010
92,5926
2011
95,3704
2012
100
5464,43
7389,23 10285,92
9054,17
7421
c) A partir de la tabla del enunciado, con los beneficios corrientes o nominales obtenemos
4
7421
BN 2012
1 = 4
1 = 4 1,5223 1 = 0,1108 11, 08%
BN 2008
4875
A partir de la tabla obtenida en el apartado b, con los beneficios reales en euros constantes
de 2012 obtenemos
4
7421
BR2012
1 = 4
1 = 4 1,3581 1 = 0, 0795 7,95%
BR2008
5464, 43
Aunque en valores nominales se observe un crecimiento medio anual de los beneficios del
11,08%, el crecimiento medio anual real ha sido del 7,95%.
7. Dadas las siguientes series de nmeros ndices y salario medio de una regin en miles de euros
corrientes
Ao
2008
2009
2010
2011
2012
IPC (2005)
107
113
IPC (2009)
110
120
123
Salario medio
1,1
1,7
1,9
2,1
2,2
Ao
2008
2009
2010
2011
2012
IPC (2005)
107
113
124,3
135,6
138,99
IPC (2009)
94,69
100
110
120
123
b) El valor real de los salarios medios en euros constantes de 2012 se obtiene dividiendo el
salario medio nominal del enunciado entre la serie de IPC con base en 2012 (que obtenemos
de la serie IPC con base en 2009 dividindola por 1,23), expresada en tantos por uno.
Ao
2008
2009
2010
2011
2012
IPC (2012)
76,9837
81,3008
89,4309
97,5610
100
c) A partir de la tabla de salarios medios reales obtenemos la tasa de crecimiento anual medio
como
4
2, 2
S2012
1 = 4
1 = 4 1,5385 1 = 0,1137 11,37%
S2008
1, 43
8. La recaudacin anual, en euros, de un ayuntamiento en el perodo 2008-2012 junto con los ndices
de precios correspondientes han sido:
Aos
Recaudacin
IPC
IPC
2008
20000
100
2009
21500
102,5
2010
22200
104
100
2011
21900
2012
22800
103
105
2008
96,1538
97,5610
2009
98,5577
100
2010
100
101,4634
2011
103
104,5073
2012
105
106,5366
b) Cambiamos la base de la ltima serie de IPC (2009) al ao 2012 dividindola por 1,065366.
Seguidamente dividimos la recaudacin nominal por esta serie de IPC (2012), expresada en
129
tantos por uno, obteniendo as la recaudacin en euros de 2012, siendo el total para el
perodo 2008-2012 de 113180,63 euros de 2012
Aos
IPC (2012)
Recaudacin en euros de 2012
2008
2009
91,5751 93,8644
21840
22905,37
2010
2011
95,2381 98,0952
23310,01 22325,25
2012
100
22800
22800
RN 2012
1 = 4
1 = 4 1,14 1 = 0, 0333 3,33%
RN 2008
20000
22800
RR2012
1 = 4
1 = 4 1, 043956 1 = 0, 0108 1, 08%
RR2008
21840
xt
1
xt 1
2008
20000
21840
-
2009
21500
7,50
22905,37
4,88
2010
2011
22200
21900
3,26
-1,35
23310,01 22325,25
1,77
-4,22
2012
22800
4,11
22800
2,13
Las tasas de variacin anual real no dependen del ao al que estn referidos los euros
constantes.
9. La siguiente tabla recoge el IPC de los seis ltimos meses del ao 2011 y las ventas nominales de
un establecimiento en miles de euros:
IPC enero 2005
IPC
Ventas
julio
113,9
agosto
114,2
septiembre
114,6
120
126
114
octubre
114,6
100
132
noviembre
diciembre
99,91
140
99,82
136
a) Obtenga una sola serie de nmeros ndices con base en el mes de agosto.
b) Calcule el total de ventas del perodo julio-diciembre en euros constantes del mes de
diciembre.
Solucin:
a) Enlazamos las dos series de IPC multiplicando la segunda por 1,146 y cambiamos a la base
agosto 2011 dividiendo la serie enlazada por 1,142.
130
julio
113,9
99,74
agosto
114,2
100
septiembre
114,6
100,35
octubre
114,6
100,35
noviembre
114,4969
100,26
diciembre
114,3937
100,17
b) Para expresar las ventas en euro constantes de diciembre 2011 hallamos el IPC con base en
diciembre de 2011 (dividiendo cualquiera de las dos series del apartado a por 1,143937 o
por 1,0017 respectivamente) y dividimos por dichos valores (expresados en tantos por uno)
las ventas nominales.
IPC diciembre 2011
Ventas en euros de
diciembre 2011
julio
99,57
agosto
99,83
septiembre
100,18
octubre
100,18
noviembre
100,09
diciembre
100,00
120,52
126,21
113,80
131,76
139,87
136
El total de ventas del perodo julio-diciembre en euros constantes del mes de diciembre es la
suma de esta ltima fila (768,16 miles de euros, 768160 ).
10. La siguiente tabla recoge el IPC y las ventas anuales de una panadera en miles de euros corrientes
Ao
2008
2009
2010
2011
2012
IPC (2007)
102,7
104,1
106,9
IPC (2010)
100
104,1
107,0
Ventas
120
145
160
165
210
a) Deflacte la serie de ventas anuales, tomando como base el ao 2008. Interprete el resultado.
b) Obtenga la tasa media de variacin anual de las ventas en euros constantes. Interprete el
resultado.
Solucin:
a) Enlazamos ambas series de IPC multiplicando la segunda por 1,069 y a continuacin
cambiamos a la base 2008 dividiendo todos sus valores por 1,027. Por ltimo se dividen las
ventas corrientes sobre la ltima serie (IPC 2008) expresada en tantos por uno.
Ao
IPC (2007)
IPC (2008)
2008
2009
2010
2011
2012
102,7
104,1
106,9
111,2829
114,383
100
101,3632
104,0896
108,3573
111,3759
Ventas deflactadas
(miles de euros constantes 2008)
120
143,050
153,714
152,274
188,551
Las ventas deflactadas nos indican el valor de estas en cada uno de los aos si los precios del
ao 2008 hubieran permanecido constantes el resto de los aos.
b) En este apartado no se especifica el ao al que se refieren los euros constantes, pero no
importa pues la tasa media de variacin anual de las ventas es la misma sea cual sea el ao al
que estn referidos dichos euros constantes. Usaremos los valores en euros constantes del
ao 2008 obtenidos en el apartado anterior.
131
V2012
188,551
1 = 4
1 = 4 1,57126 1 = 0,1196 11,96%
V2008
120
El valor real de las ventas ha pasado de 120000 a 188551 en el perodo 2008-2012, lo que
equivale a un aumento anual medio del 11,96% de su valor.
11. Los salarios medios de una empresa y los ndices de precios al consumo en los aos 2007-2012
fueron:
Aos
Salarios ()
ndices
2007
1520
140
2008
1580
162
2009
1600
175
2010
1630
190
2011
1640
200
2012
1840
205
2007
70
2171,43
2008
81
1950,62
2009
87,5
1828,57
2010
95
1715,79
2011
100
1640,00
2012
102,5
1795,12
b) Las tasas anuales de variacin se obtienen comparando por cociente un ao con el anterior y
restndole 1 (multiplicando por 100 se expresa en porcentaje):
T1 (t ) =
Aos
Salario nominal
Tasas de variacin anual nominal (%)
Salario real en euros de 2011
Tasas de variacin anual real (%)
2007
1520
2171,43
-
xt
1
xt 1
2008
1580
3,95
1950,62
-10,17
2009
1600
1,27
1828,57
-6,26
2010
1630
1,88
1715,79
-6,17
2011
1640
0,61
1640,00
-4,42
2012
1840
12,20
1795,12
9,46
Las tasas de variacin anual real no dependen del ao al que estn referidos los euros
constantes.
c) La tasa de variacin media anual real es la misma sea cual sea el ao al que estn referidos
los euros constantes. Consideraremos los valores en euros constantes del ao 2011 obtenidos
en el apartado a
5
132
1795,12
SR2012
1 = 5
1 = 5 0,8267 1 = 0, 0373 3,73%
SR2007
2171, 43
El valor real de los salarios (en euros de 2011) ha pasado de 2171,43 a 1795,12 en el
perodo 2007-2012, lo que equivale a una disminucin anual media del 3,73% de su valor.
12. La siguiente tabla recoge el IPC en los meses de enero y diciembre de 2011 para cada uno de los
grupos que constituyen la cesta de la compra.
Grupo
Alimentacin
Enero
175,4
Diciembre
181,1
Vestido
179,7
188,4
Vivienda
163
170,6
Menaje
160,4
167,3
Salud
167,9
178,2
Transporte
161,1
166,5
Cultura
161,1
171
Otros
192,7
205,3
El ndice global de precios se calcula como una media ponderada de los ndices de precios de cada
grupo, donde las ponderaciones en tantos por ciento son:
Grupo
Ponderacin (%)
Alimentacin
33
Vestido
8,7
Vivienda
18,6
Menaje
7,4
Salud
2,4
Transporte
14,4
Cultura
7
Otros
8,5
Obtenga la tasa de variacin del IPC global en el perodo enero 2011-diciembre 2011.
Solucin:
Calculamos el ndice global en enero:
1
( (175, 4 33) + (179, 7 8, 7 ) + (163 18, 6 ) + (160, 4 7, 4 ) + (167,9 2, 4 ) + (161,114, 4 ) + (161,1 7 ) + (192, 7 8,5 ) ) = 170, 59
100
177,94
1 = 0, 0431 4,31%
170,59
13. La siguiente tabla muestra informacin sobre precios y cantidades correspondientes a los artculos
que se indican
Leche
Pan
Carne
Pescado
Ao
pi
qi
pi
qi
pi
qi
pi
qi
2009
2010
2011
2012
0,60
0,68
0,70
0,75
1442
1818
1925
1980
0,27
0,32
0,35
0,40
21315
29997
22721
26346
7,50
8,25
9,50
10
19432
21013
27947
31084
5
5,58
5,63
6,19
8470
12220
10513
7758
133
p
t /0
P =
p q
it it
i =1
n
370885, 42
= 1,3235
280221, 42
i 0 it
i =1
2009
pi 0
Leche
Pan
Carne
Pescado
2012
qi 0
0,6
0,27
7,5
5
pit
1442
21315
19432
8470
qit
0,75
0,4
10
6,19
1980
26346
31084
7758
pi 0qit
1188
7113,42
233130
38790
280221,42
pit qit
1485
10538,4
310840
48022,02
370885,42
a) Con el ndice de precios de Paasche deflactamos las 7500 u.m. de 2012 a u.m. de 2009,
7500
= 5666,79 u.m. de 2009
1,3235
Ha habido un incremento real en dicho presupuesto de 666,79 u.m. de 2009 lo que
representa un incremento porcentual del 13,34%
5666,79
1 = 0,1334 13,34%
5000
b) Para la magnitud simple precio de la carne el ndice simple o elemental en el ao 2012
respecto del ao 2009 es
10
= 1,3333 , lo que indica que dicho precio ha aumentado su
7,5
valor un 33,33% en el citado perodo. Lo que costaba 17,50 u.m. en 2009 costara
17,50 1, 3333 = 23, 33 u.m. en 2012.
134
4.
4.1
Una serie cronolgica o temporal es una sucesin de observaciones de una variable Y, ordenadas en
el tiempo, habitualmente obtenidas en perodos de tiempo de la misma duracin.
Gran parte de los datos publicados sobre actividades econmicas tienen esta forma.
Es frecuente representar dichos datos en una tabla como la que sigue
Tiempo
t1
t2
ti
tn
Observaciones
y (t1 ) = y1
y (t2 ) = y2
y(ti ) = yi
y(tn ) = yn
( ti , y (ti ) )
y (ti )
ti
135
Si dentro de cada perodo de tiempo ti se tienen varias observaciones, los datos se representan en
una tabla como la siguiente (por ejemplo, observaciones mensuales, trimestrales, en cada ao)
Ao/estaciones
t1
ti
tn
1
y11
yi1
yn1
j
y1 j
yij
ynj
s
y1s
yis
yns
EJEMPLO 4.1
Las denuncias en las Oficinas de Informacin al Consumidor en los ltimos aos han sido
(expresadas en decenas de miles)
2007
2008
2009
2010
1 cuatrimestre
5
8
10
11,5
2 cuatrimestre
3,5
5
7
10
3 cuatrimestre
7
9
10,5
13
4.2
136
El primer problema que se nos plantea es la construccin de un modelo que reuniendo las anteriores
componentes explique el comportamiento de la serie cronolgica. Bsicamente consideramos dos
modelos.
Modelo aditivo: Supone que las observaciones se generan como suma de las cuatro
componentes
Y (t ) = (t ) + E (t ) + C (t ) + (t )
En este modelo cada componente se expresa en la misma unidad que las observaciones.
La variacin irregular es independiente de las dems componentes, es decir, la magnitud de
sus valores no depende de las otras componentes.
Y (t ) = (t ) E (t )C (t ) (t )
En este modelo la tendencia secular se expresa en la misma unidad que las observaciones y
las dems componentes en tantos por uno. Aqu no se cumple la hiptesis de independencia
de la variacin irregular respecto de las dems componentes sino que es proporcional al resto
de componentes.
En trminos generales es ms adecuado el modelo multiplicativo que el aditivo para la descripcin
de fenmenos econmicos (por ejemplo, los factores estacionales y cclicos no afectarn de la misma
manera, en trminos absolutos, a las ventas de un pequeo comercio y de un hipermercado, sino
proporcionalmente al volumen de ventas de cada uno)
Existen varios procedimientos para determinar el tipo de modelo al que responde una serie
cronolgica. La idea en todos consiste en poner de manifiesto si las fluctuaciones de la serie son
aproximadamente constantes o proporcionales al valor de la tendencia. Uno de ellos es:
Anlisis de la variabilidad de las diferencias y cocientes estacionales.
Calculamos las diferencias y cocientes estacionales: Para cada estacin j se comparan los datos en
aos consecutivos, (i-1), i, mediante la diferencia y cociente de ambos.
d ij = yij y( i 1) j
kij =
yij
y(i 1) j
A continuacin calculamos los coeficientes de variacin sobre las diferencias y sobre los cocientes.
Si CV (d ) < CV (k ) se elegir el modelo aditivo, en caso contrario se optar por el modelo
multiplicativo.
137
EJEMPLO 4.2
Estudiemos la conveniencia del modelo aditivo o multiplicativo sobre los datos del ejemplo 4.1.
1 cuatrimestre
5
8
10
11,5
2007
2008
2009
2010
2 cuatrimestre
3,5
5
7
10
3 cuatrimestre
7
9
10,5
13
Solucin:
d ij = yij y( i 1) j
2007
2008
2009
2010
kij =
yij
y(i 1) j
1 cuatrimestre
--8 5=3
2
1,5
2 cuatrimestre
--5 3,5=1,5
2
3
3 cuatrimestre
--9 7=2
1,5
2,5
1 cuatrimestre
2 cuatrimestre
3 cuatrimestre
---
---
---
2007
8
5
9
= 1, 6
= 1, 29
= 1, 43
3,5
5
7
2009
1,25
1,17
1,4
2010
1,15
1,24
1,43
Con los datos de cada tabla calculamos la media, varianza y desviacin tpica para finalmente hallar
2008
el coeficiente de variacin:
d = 2,111
Sd2 = 0,321
Sd = 0,567
CV ( d ) =
Sd
= 0, 268
d
k = 1,328
Sk2 = 0,019
Sk = 0,138
CV ( k ) =
Sk
= 0,104
k
4.3
El primer mtodo tiene un enfoque global, consiste en el ajuste de una recta de mnimos
cuadrados al conjunto de todas las observaciones (podra considerarse el ajuste de otra
funcin si las caractersticas de la serie as lo indicaran).
138
El segundo mtodo tiene un enfoque local, slo se utilizan algunas observaciones para el
clculo de la tendencia en cada perodo mediante la media de dichas observaciones (medias
mviles).
Es aconsejable utilizar mtodos locales en las previsiones a corto plazo porque se adaptan mejor y
ms rpidamente a las circunstancias cambiantes. Sin embargo, en las previsiones a largo plazo
donde nos apoyamos en aspectos permanentes de la evolucin del fenmeno es mejor usar mtodos
globales.
clculos.
Exactamente igual que en el tema 2, obtenemos la recta de regresin de Y/X:
n=4
x=
10
= 2,5
4
y=
33,17
= 8, 2917
4
139
1 n
2 30
S x2 = xi2 x =
2, 52 = 1, 25
n
4
i =1
S xy =
y y=
S xy
xx
S x2
1 n
93,334
xi yi x y =
(2,5 8, 2917) = 2,604
4
n i =1
y 8, 2917 =
2,604
( x 2,5)
1, 25
y = 3,08 + 2,083x
y como la tendencia
140
para lo que se volvern a calcular medias mviles de amplitud 2 sobre las medias mviles de
amplitud h (ejemplo 4.5).
EJEMPLO 4.4
Utilizamos de nuevo los datos del ejemplo 4.1 para obtener la tendencia secular mediante medias
mviles.
1 cuatrimestre
5
8
10
11,5
2007
2008
2009
2010
2 cuatrimestre
3,5
5
7
10
3 cuatrimestre
7
9
10,5
13
5 + 3,5 + 7
= 5,167
3
3,5 + 7 + 8
= 6,167
3
medias
1 cuatrimestre
mviles
--2007
6,667
2008
8,667
2009
10,667
2010
7+8+5
= 6,667
3
2 cuatrimestre
3 cuatrimestre
5,167
7,333
9,167
11,5
6,167
8
9,667
---
...
dK^
141
EJEMPLO 4.5
Obtenga la tendencia secular mediante medias mviles.
1 trimestre
7
10
13,5
17
18,1
2006
2007
2008
2009
2010
2 trimestre
5
7,1
8,9
11,2
12,7
3 trimestre
2,4
3,6
4,5
5,3
6,6
4 trimestre
1,1
1,4
1,6
2
2,4
Calculamos las medias mviles de amplitud 4 que estarn asociadas al punto central de los 4
trimestres sobre los que se calcula:
media mvil
amplitud 4
1 trimestre
2 trimestre
2006
3 trimestre
4 trimestre
1 trimestre
(ao siguiente)
3,875
4,625
5,15
2007
5,45
5,525
6,4
6,85
2008
7,075
7,125
8,0
8,575
2009
8,775
8,875
9,15
9,525
2010
9,85
9,95
donde las medias se han calculado de la siguiente forma:
3,875 =
7 + 5 + 2, 4 + 1,1
4
4, 625 =
5 + 2, 4 + 1,1 + 10
4
5,15 =
2, 4 + 1,1 + 10 + 1, 7
...
4
A continuacin procedemos a centrar las medias mviles en los mismos perodos que las
observaciones de la serie, tomando medias mviles de amplitud 2 sobre las anteriores medias
mviles de amplitud 4:
4, 25 =
3,875 + 4, 625
2
medias mviles
amplitud 2
2006
2007
2008
2009
2010
4,8875 =
4, 625 + 5,15
2
5,3 =
5,15 + 5, 45
...
2
1 trimestre
2 trimestre
3 trimestre
4 trimestre
--5,3
6,9625
8,675
9,6875
--5,4875
7,1
8,825
9,9
4,25
5,9625
7,5625
9,0125
---
4,8875
6,625
8,2875
9,3375
--
142
4.4
En el modelo multiplicativo la componente estacional de una serie cronolgica se mide con un ndice
adimensional denominado ndice de variacin estacional, ste se expresa en porcentajes e indica la
fluctuacin del valor de la serie en dicha estacin respecto del valor de la tendencia. Por ejemplo, un
ndice de variacin estacional del 90% indica que en esa estacin hay una disminucin del 10% en
relacin al valor de la tendencia.
En el modelo aditivo la componente estacional indica en trminos absolutos (expresada en las
mismas unidades que la variable observada) la cantidad en que se ha superado (si es positiva) o no se
ha alcanzado (si es negativa) la tendencia. Por ejemplo, un valor de la componente estacional de
-150 indica que a esa estacin le corresponde un valor 150 por debajo del valor de la tendencia.
Vamos a estudiar tres procedimientos para la obtencin de la variacin estacional:
2007
2008
2009
2010
1.
1 cuatrimestre
5
8
10
11,5
2 cuatrimestre
3,5
5
7
10
3 cuatrimestre
7
9
10,5
13
media anual
5,167
7,333
9,167
11,50
Sobre los valores medios anuales ajustamos la recta de regresin de mnimos cuadrados como se
hizo en el ejemplo 4.3.
y = 3, 08 + 2, 083x
La pendiente b de la recta estima lo que varia la tendencia por unidad de tiempo (un ao en
nuestro caso), por tanto la tendencia variar
b
por cada estacin que transcurra (s=nmero de
s
estaciones).
En este ejemplo la tendencia crece
2,083
= 0,694 cada cuatrimestre.
3
143
2.
5 + 8 + 10 + 11,5
= 8,625
4
2007
2008
2009
2010
media por
estacin
media
corregida
7 + 9 + 10,5 + 13
= 9,875
4
...
1 cuatrimestre
5
8
10
11,5
2 cuatrimestre
3,5
5
7
10
3 cuatrimestre
7
9
10,5
13
8,625
6,375
9,875
8,625
5,681
8,487
Seguidamente eliminamos la tendencia de los anteriores valores medios por estacin, restando
tantas veces
b 2,083
=
= 0,694 como estaciones del ao han pasado, obteniendo las medias
s
3
corregidas:
b
8, 625 0 = 8, 625
s
3.
b
6, 375 1 = 5,681
s
9,875 2 = 8, 487
s
7,5977 =
Comparando las medias corregidas con su promedio (por cociente o diferencia segn el modelo
sea multiplicativo o aditivo) obtenemos la variacin estacional.
Media global
corregida
I.V.E.
media
8,625
corregida
modelo
113,52%
multiplicativo
modelo
1,0273
aditivo
8,625
100 = 113,52
7,5977
5,681
8,487
74,77%
111,70%
-1,9167
0,8893
...
8, 487
100 = 111,70
7,5977
...
7,5977
estacional (IVE) que son valores adimensionales con la propiedad de que su media es 100 (1 si
los IVE estn expresados en tantos por uno). En el primer cuatrimestre el nmero de denuncias
es un 13,52% mayor que la tendencia, en el segundo cuatrimestre las denuncias no llegan a ser
el 100% de la tendencia sino que es un 25,23% menor (100-74,77=25,23),
144
En el modelo aditivo la variacin estacional est expresada en las mismas unidades que la
variable observada (decenas de miles de denuncias en este ejemplo) y su media es cero (
EJEMPLO 4.7
Con el mtodo de las medias simples obtenga la variacin estacional de los datos del ejemplo 4.5
1.
ti
2006
2007
2008
2009
2010
totales
xi = ti 2005
1
2
3
4
5
15
n=5
yi = media anual
xi2
1
3,875
4
5,525
9
7,125
16
8,875
25
9,950
35,35
55
15
35,35
x= =3
y=
= 7,07
5
5
xi yi
3,875
11,05
21,375
35,5
49,75
121,55
1 n
2 55 2
3 = 2
S x2 = xi2 x =
5
n i =1
S xy =
y y =
S xy
S
2
x
1 n
121,55
xi yi x y =
(3 7, 07) = 3,1
n i =1
5
( x x)
y 7, 07 =
3,1
( x 3)
2
y = 2, 42 + 1, 55 x
2.
Seguidamente eliminamos la tendencia de los valores medios por estacin, restando tantas
veces
b 1,55
=
= 0,3875 como estaciones del ao han pasado, obteniendo
s
4
las medias
corregidas:
b
13,12 0 = 13,12
s
3.
...
b
1, 7 3 = 0,5375
s
145
6, 48875 =
Comparando las medias corregidas con su promedio (por cociente o diferencia segn el modelo sea
multiplicativo o aditivo) obtenemos la variacin estacional.
13,12
100 = 202,196
6, 48875
0,5375
100 = 8, 284
6, 48875
...
...
1 trimestre
7
10
13,5
17
18,1
2 trimestre
5
7,1
8,9
11,2
12,7
3 trimestre
2,4
3,6
4,5
5,3
6,6
4 trimestre
1,1
1,4
1,6
2
2,4
13,12
8,98
4,48
1,7
13,12
8,5925
3,705
0,5375
202,196%
132,421%
57,099%
8,284%
6,631
2,104
2,784
5,951
media anual
3,875
5,525
7,125
8,875
9,950
media global
corregida
6,48875
En los dos mtodos siguientes la idea bsica es eliminar de las observaciones el valor de la tendencia
secular, para ello es fundamental conocer el modelo que se adapta a la serie cronolgica.
En el modelo multiplicativo eliminaremos la tendencia mediante cociente de las observaciones sobre
la tendencia
Y (t ) = (t ) E (t )C (t ) (t )
Y (t )
= E (t )C (t ) (t )
(t )
Y (t ) = (t ) + E (t ) + C (t ) + (t ) Y (t ) (t ) = E (t ) + C (t ) + (t )
Posteriormente se promedian estos valores ( E (t )C (t ) (t ) E (t ) + C (t ) + (t ) ) sobre cada una de las
estaciones, de esta forma los efectos unas veces positivos, otras negativos, de las componentes C (t )
y (t ) se anulan, recogindose en dicho promedio fundamentalmente el valor de la componente
estacional.
146
2007
2008
2009
2010
1.
1 cuatrimestre
5
8
10
11,5
2 cuatrimestre
3,5
5
7
10
3 cuatrimestre
7
9
10,5
13
media anual
5,167
7,333
9,167
11,50
Sobre los valores medios anuales ajustamos la recta de regresin de mnimos cuadrados como se
hizo en el ejemplo 4.3.
y = 3, 08 + 2, 083x
2.
Estimamos la tendencia secular para cada una de las estaciones de cada ao, teniendo presente
que la tendencia (t ) = 4175, 42 + 2,083t para un ao t se asigna al perodo central del ao (2
cuatrimestre en este ejemplo) y que la tendencia vara
b 2,083
=
= 0,694 cada estacin que
s
3
pasa.
5,161+0,694=5,855
En el 1 cuatrimestre de 2007 la tendencia ser
cuatrimestre:
b 2,083
=
= 0,694 menos que en el 2
s
3
5,161 0,694=4,467
147
3.
Y (t )
si suponemos el modelo multiplicativo y mediante las diferencias Y (t ) (t ) si el modelo
(t )
es aditivo.
En lo que sigue supondremos el modelo multiplicativo (ms adelante se repetir todo para el
modelo aditivo).
5
= 1,119
4, 467
4.
13
= 1, 074
12,104
...
Calculamos la media por estacin de los anteriores valores y la media de dichas medias (que es
igual a la media global de todos los cocientes
Y (t )
). Los ndices de variacin estacional (I.V.E.)
(t )
se obtienen como cociente de las medias por estacin sobre la media global (el resultado se
multiplica por 100 para expresarlo en tantos por ciento)
...
...
1,1130
100 = 111,13%
1, 001533
Y (t )
2007
2008
2009
2010
(t )
2007
2008
2009
2010
Y (t )
(t )
2007
2008
2009
2010
media por
estacin
I.V.E.
148
1 cuatrimestre
5
8
10
11,5
1 cuatrimestre
4,467
6,550
8,633
10,716
2 cuatrimestre
3,5
5
7
10
2 cuatrimestre
5,161
7,244
9,327
11,410
3 cuatrimestre
7
9
10,5
13
3 cuatrimestre
5,855
7,938
10,021
12,104
1 cuatrimestre
2 cuatrimestre
3 cuatrimestre
1,119
1,221
1,158
1,073
0,678
0,690
0,751
0,876
1,196
1,134
1,048
1,074
media global
1,1428
0,7488
1,1130
1,001533
114,11%
74,77%
111,13%
Y (t ) (t ) .
5 4, 467 = 0,533
4.
13 12,104 = 0,896
...
Calculamos la media por estacin de los anteriores valores y la media de dichas medias (que es
igual a la media global de todas las diferencias Y (t ) (t ) ). La variacin estacional (V.E.) se
obtiene como diferencia de la media por estacin menos la media global
...
...
Y (t )
2007
2008
2009
2010
(t )
2007
2008
2009
2010
Y (t ) (t )
2007
2008
2009
2010
media por
estacin
V.E.
1 cuatrimestre
5
8
10
11,5
1 cuatrimestre
4,467
6,550
8,633
10,716
1 cuatrimestre
0,533
1,450
1,367
0,784
2 cuatrimestre
3,5
5
7
10
2 cuatrimestre
5,161
7,244
9,327
11,410
2 cuatrimestre
1,661
2,244
2,327
1,410
3 cuatrimestre
7
9
10,5
13
3 cuatrimestre
5,855
7,938
10,021
12,104
3 cuatrimestre
1,145
1,062
0,479
0,896
media global
1,0335
1,9105
0,8955
0,0062
1,0273
1,9167
0,8893
Repetimos este mtodo tanto para el modelo multiplicativo como aditivo en un ejemplo con un
nmero par de estaciones. La nica diferencia con el ejemplo anterior est en la etapa 2 donde el
valor de la tendencia en un ao t estar asignada al punto medio del ao, es decir, entre las dos
estaciones centrales. Para referir los valores de la tendencia a los mismos perodos que las
149
observaciones habr que centrar las estimaciones de la tendencia en dichos perodos como se
expone en el siguiente ejemplo.
EJEMPLO 4.9.
Utilizamos los datos del ejemplo 4.5.
1.
Sobre los valores medios anuales ajustamos la recta de regresin de mnimos cuadrados como se
hizo en el ejemplo 4.7
y = 2, 42 + 1,55 x (t ) = 2, 42 + 1, 55 ( t 2005 ) (t ) = 3105, 33 + 1, 55t
2.
Estimamos la tendencia secular para cada una de las estaciones de cada ao, teniendo presente
que la tendencia (t ) = 3105,33 + 1,55t para un ao t se asigna al punto central del ao (punto
entre el 2 y 3 trimestre, en este ejemplo), que la tendencia vara
b 1,55
=
= 0,3875 cada
s
4
0,3875
3,97+0,19375=4,16375
10,17+0,19375=10,36375
b 1,55
=
= 0,3875 ms que en el 3 trimestre:
s
4
4,16375+0,3875=4,55125
En el 2 trimestre de 2006 la tendencia ser
b 1,55
=
= 0,3875 menos que en el 3 trimestre:
s
4
4,163750,3875=3,77625
Y en el 1 trimestre de 2006 la tendencia ser
b 1,55
=
= 0,3875 menos que en el 2 trimestre:
s
4
3,776250,3875=3,38875
Anlogamente en el resto de los aos.
Las etapas 3 y 4 son idnticas a las del ejemplo anterior.
150
Y (t )
2006
2007
2008
2009
2010
(t )
2006
2007
2008
2009
2010
Y (t )
(t )
2006
2007
2008
2009
2010
media por
estacin
I.V.E.
1 trimestre
7
10
13,5
17
18,1
1 trimestre
3,38875
4,93875
6,48875
8,03875
9,58875
2 trimestre
5
7,1
8,9
11,2
12,7
2 trimestre
3,77625
5,32625
6,87625
8,42625
9,97625
3 trimestre
2,4
3,6
4,5
5,3
6,6
3 trimestre
4,16375
5,71375
7,26375
8,81375
10,36375
4 trimestre
1,1
1,4
1,6
2
2,4
4 trimestre
4,55125
6,10125
7,65125
9,20125
10,75125
media anual
3,875
5,525
7,125
8,875
9,950
1 trimestre
2 trimestre
3 trimestre
4 trimestre
2,06566
2,02480
2,08052
2,11476
1,88763
1,32406
1,33302
1,29431
1,32918
1,27302
0,57640
0,63006
0,61951
0,60133
0,63684
0,24169
0,22946
0,20912
0,21736
0,22323
media global
2,03467
1,31072
0,61283
0,22417
1,0456
194,59%
125,36%
58,61%
21,44%
Y (t )
2006
2007
2008
2009
2010
(t )
2006
2007
2008
2009
2010
Y (t ) (t )
2006
2007
2008
2009
2010
media por
estacin
V.E.
1 trimestre
7
10
13,5
17
18,1
1 trimestre
3,38875
4,93875
6,48875
8,03875
9,58875
1 trimestre
3,61125
5,06125
7,01125
8,96125
8,51125
2 trimestre
5
7,1
8,9
11,2
12,7
2 trimestre
3,77625
5,32625
6,87625
8,42625
9,97625
2 trimestre
1,22375
1,77375
2,02375
2,77375
2,72375
3 trimestre
2,4
3,6
4,5
5,3
6,6
3 trimestre
4,16375
5,71375
7,26375
8,81375
10,36375
3 trimestre
1,76375
2,11375
2,76375
3,51375
3,76375
4 trimestre
1,1
1,4
1,6
2
2,4
4 trimestre
4,55125
6,10125
7,65125
9,20125
10,75125
4 trimestre
3,45125
4,70125
6,05125
7,20125
8,35125
media anual
3,875
5,525
7,125
8,875
9,950
media global
6,63125
2,10375
2,78375
5,95125
6,63125
2,10375
2,78375
5,95125
151
Y (t )
2007
2008
2009
2010
(t )
2007
2008
2009
2010
Y (t )
(t )
2007
2008
2009
2010
media por
estacin
I.V.E.
152
1 cuatrimestre
5
8
10
11,5
1 cuatrimestre
--6,667
8,667
10,667
2 cuatrimestre
3,5
5
7
10
2 cuatrimestre
5,167
7,333
9,167
11,5
3 cuatrimestre
7
9
10,5
13
3 cuatrimestre
6,167
8
9,667
---
1 cuatrimestre
2 cuatrimestre
3 cuatrimestre
--1,19994
1,15380
1,07809
0,67738
0,68185
0,76361
0,86957
1,13507
1,12500
1,08617
---
media global
1,14394
0,74810
1,11541
1,0025
114,11%
74,62%
111,26%
Modelo aditivo:
Y (t )
2007
2008
2009
2010
(t )
2007
2008
2009
2010
Y (t ) (t )
2007
2008
2009
2010
media por
estacin
V.E.
1 cuatrimestre
5
8
10
11,5
1 cuatrimestre
--6,667
8,667
10,667
1 cuatrimestre
--1,333
1,333
0,833
2 cuatrimestre
3,5
5
7
10
2 cuatrimestre
5,167
7,333
9,167
11,5
2 cuatrimestre
1,667
2,333
2,167
1,5
3 cuatrimestre
7
9
10,5
13
3 cuatrimestre
6,167
8
9,667
--3 cuatrimestre
0,833
1
0,833
---
media global
1,1663
1,9168
0,8887
0,0461
1,1202
1,9629
0,8426
EJEMPLO 4.11.
Usamos los datos del ejemplo 4.5 donde se calcularon las medias mviles centradas en cada
estacin.
Modelo multiplicativo:
1 trimestre
Y (t )
2006
7
2007
10
13,5
2008
17
2009
18,1
2010
1 trimestre
(t )
--2006
5,3
2007
6,9625
2008
8,675
2009
9,6875
2010
Y (t )
1 trimestre
(t )
2006
--2007
1,88679
2008
1,93896
2009
1,95965
2010
1,86839
media por
1,91345
estacin
I.V.E.
191,96%
2 trimestre
5
7,1
8,9
11,2
12,7
2 trimestre
--5,4875
7,1
8,825
9,9
3 trimestre
2,4
3,6
4,5
5,3
6,6
3 trimestre
4,25
5,9625
7,5625
9,0125
---
4 trimestre
1,1
1,4
1,6
2
2,4
4 trimestre
4,8875
6,625
8,2875
9,3375
---
2 trimestre
3 trimestre
4 trimestre
--1,29385
1,25352
1,26912
1,28283
0,56471
0,60377
0,59504
0,58807
---
0,22506
0,21132
0,19306
0,21419
---
media global
1,27483
0,58790
0,21091
0,99677
127,90%
58,98%
21,16%
153
Modelo aditivo:
1 trimestre
Y (t )
2006
7
2007
10
2008
13,5
17
2009
18,1
2010
1
trimestre
(t )
2006
--2007
5,3
6,9625
2008
8,675
2009
9,6875
2010
Y (t ) (t )
1 trimestre
2006
--2007
4,7
2008
6,5375
8,325
2009
8,4125
2010
media por
6,99375
estacin
V.E.
6,83516
2 trimestre
5
7,1
8,9
11,2
12,7
2 trimestre
--5,4875
7,1
8,825
9,9
2 trimestre
--1,6125
1,8
2,375
2,8
3 trimestre
2,4
3,6
4,5
5,3
6,6
3 trimestre
4,25
5,9625
7,5625
9,0125
--3 trimestre
1,85
2,3625
3,0625
3,7125
---
4 trimestre
1,1
1,4
1,6
2
2,4
4 trimestre
4,8875
6,625
8,2875
9,3375
--4 trimestre
3,7875
5,225
6,6875
7,3375
---
media global
2,14688
2,74688
5,75938
0,15859
1,98828
2,90547
5,91797
Desestacionalizacin.
En ocasiones interesa conocer las variaciones estacionales y eliminarlas de las observaciones de la
serie para poder ver mejor el comportamiento de sta ajeno a causas estacionales. La eliminacin de
la componente estacional se conoce como desestacionalizacin de la serie y permite entre otras
cosas comparar valores observados en estaciones distintas que estn influidos, con toda seguridad,
por este hecho. As, si las ventas de juguetes presentan una variacin estacional segn un modelo
multiplicativo del 48% en el mes de marzo y del 156% en el mes de diciembre no podremos
comparar directamente las ventas de 13500 y 41500 respectivamente en los meses de marzo y
diciembre del ao pasado. Suponiendo el modelo multiplicativo, como se ha indicado, y eliminando
el efecto estacional mediante cociente (mediante diferencia si el modelo es aditivo), obtendramos el
valor de la serie si sta no se hubiera visto afectada por factores estacionales
Y (t ) = (t ) E (t )C (t ) (t )
marzo :
154
13500
= 28125
0, 48
Y (t )
= (t )C (t ) (t )
E (t )
diciembre :
41500
= 26602,56
1,56
Donde se observa que el mes de marzo tuvo relativamente un mejor comportamiento que diciembre
en cuanto a las ventas (aunque en trminos absolutos stas fueron claramente inferiores,
13500<41500).
EJEMPLO 4.12.
Desestacionalice la serie cronolgica del ejemplo 4.5, considerando el modelo multiplicativo y los
I.V.E. obtenidos con el mtodo de la razn a las medias mviles.
Solucin:
Desestacionalizar una serie consiste en eliminar los altibajos observados en la misma debidos
a factores estacionales. Para ello, en el modelo multiplicativo, dividiremos las observaciones de
cada estacin por su I.V.E., expresado este ltimo en tantos por uno (en el modelo aditivo
restaremos a las observaciones de cada estacin el valor de su variacin estacional).
7
= 3, 6466
1,9196
5
= 3,9093
1, 279
...
1 trimestre
2 trimestre
3 trimestre
4 trimestre
Y (t )
1,1
5
2,4
2006
7
1,4
3,6
7,1
2007
10
1,6
4,5
13,5
8,9
2008
2
5,3
17
11,2
2009
2,4
6,6
18,1
12,7
2010
I.V.E.
191,96%
127,90%
58,98%
21,16%
Y (t )
1 trimestre
2 trimestre
3 trimestre
4 trimestre
E (t )
2006
3,6466
3,9093
4,0692
5,1985
2007
5,2094
5,5512
6,1038
6,6163
2008
7,0327
6,9586
7,6297
7,5614
2009
8,8560
8,7568
8,9861
9,4518
2010
9,4290
9,9296
11,1902
11,3422
En la serie desestacionalizada se aprecia un aumento casi continuo de la variable observada sin las
fluctuaciones causadas por los factores estacionales.
4.5
Prediccin.
Conociendo las cuatro componentes de una serie cronolgica as como el modelo segn el cual se
relacionan podramos conocer el valor de la serie en cualquier perodo. La variacin irregular es por
naturaleza desconocida, del resto de componentes podemos tener a lo sumo una estimacin de las
mismas y el modelo es sencillamente un esquema artificial impuesto para facilitar el estudio de la
155
serie. Por tanto, no se podr conocer el valor de la serie para un perodo futuro, a lo sumo se podr
hacer una prediccin.
En este curso no se ha estudiado la variacin cclica por lo que la prediccin se har en base a la
tendencia secular y variacin estacional.
Si el modelo es aditivo, Y (t ) = (t ) + E (t ) + C (t ) + (t ) , la estimacin del valor de la serie, Yl (t ) , para
Yl (t ) = (t ) + E (t ) .
Yl (t ) = (t ) E (t ) .
En ambos casos se est suponiendo que la variacin cclica no tiene una influencia fuerte en los
valores de la serie.
EJEMPLO 4.13.
Cul sera el valor estimado de la serie del ejemplo 4.1 en el primer cuatrimestre de 2012?. Utilice
los diferentes mtodos y modelos.
Solucin:
Segn la recta de tendencia ajustada, (t ) = 4175, 42 + 2,083t , el valor de la tendencia en el punto
medio del ao 2012 (punto medio del 2 cuatrimestre) se estima por:
2,083
= 0,694 , por tanto el valor de la tendencia en el
3
Como se indic anteriormente, estos dos mtodos coinciden sobre el modelo aditivo (si se observa
alguna diferencia es debida a errores de redondeo).
Modelo multiplicativo
Mtodo de las media simples
Mtodo de la razn a la tendencia
113,52
114,11
= 16,894
= 16,982
Yl (t ) = (t ) E (t ) = 14,882
Yl (t ) = (t ) E (t ) = 14,882
100
100
En el mtodo de la razn (diferencia) a las medias mviles la tendencia no se estima mediante el
ajuste de una recta por mnimos cuadrados sobre las medias anuales sino mediante medias mviles,
156
por lo que tendramos que calcular el valor de la tendencia a partir de ellas. Hara falta ajustar una
recta a las medias mviles, esta recta no suele diferir mucho de la anterior recta de mnimos
cuadrados sobre las medias anuales. Por este motivo, en la prctica, tambin para este ltimo mtodo
se procede como en los dos anteriores: hallamos el valor estimado de la tendencia para las estaciones
del ao utilizando la recta de mnimos cuadrados sobre las media anuales y posteriormente se
modifica de acuerdo al modelo y a la variacin estacional estimada con el mtodo de la razn
(diferencia) a las medias mviles.
Mtodo de la razn a las medias mviles
114,11
= 16,982
Yl (t ) = (t ) E (t ) = 14,882
100
4.6
Ejercicios resueltos.
1
trimestre
6,4
8,8
9,6
12
14,4
10,24
2
trimestre
7,2
9,6
10,4
12,8
14,4
10,88
3
trimestre
5,6
6,4
8,8
9,6
11,2
8,32
4
trimestre
8
8,8
11,2
13,6
16
11,52
Total anual
Media anual
27,2
33,6
40
48
56
6,8
8,4
10
12
14
Obtenga:
a) Tasa de variacin media anual en el perodo 2008-2012 para el total de llamadas anuales.
b) ndices de variacin estacional (mtodo de las medias simples, modelo multiplicativo).
Nota: ( t ) = 4,84 + 1,8 ( t 2007 ) = 3607,76 + 1,8t
c) Estimacin del nmero de llamadas para el 2 trimestre de 2013.
Solucin:
a)
b)
T2012
56
1 = 4
1 = 0,1979
T2008
27, 2
19,79%
Eliminamos la tendencia de los valores medios por estacin, restando tantas veces
b 1,8
=
= 0,45 como estaciones del ao han pasado, obteniendo las medias corregidas:
s
4
157
10, 24 0 = 10, 24
s
b
10,88 1 = 10, 43
s
8, 32 2 = 7, 42
s
b
11,52 3 = 10,17
s
9,565 =
Comparando las medias corregidas con su promedio (por cociente) y multiplicando por 100
obtenemos los ndices de variacin estacional expresados en porcentajes.
10, 24
100 = 107,057
9,565
...
10,17
100 = 106,325
9,565
IVE (%)
1 trimestre
6,4
8,8
9,6
12
14,4
10,24
10,24
107,057%
2 trimestre
7,2
9,6
10,4
12,8
14,4
10,88
10,43
109,043%
3 trimestre
5,6
6,4
8,8
9,6
11,2
8,32
7,42
77,574%
4 trimestre
8
8,8
11,2
13,6
16
11,52
10,17
106,325%
9,565
c)
1,8
= 0,45 , por tanto en medio trimestre aumenta
4
0, 45
= 0, 225 .
2
El valor de la tendencia en el segundo trimestre del ao 2013 se estima en 15,64-0,225=15,415.
El valor estimado de la serie para el segundo trimestre de 2013 diferir de este valor segn la
variacin estacional para dicho trimestre: 15,415 1,09043=16,81 millones de llamadas.
2. La tendencia de la serie cronolgica de ventas trimestrales de automviles en una provincia (en
miles) es:
158
Solucin:
a) El valor de la tendencia en el punto central del ao 2012 se estima mediante
16
= 4 cada trimestre y aumenta
4
4
= 2 cada medio trimestre. Segn lo anterior:
2
Calcule los ndices de variacin estacional segn el mtodo de las medias simples.
Solucin:
Al mencionar el trmino ndice de variacin estacional nos estn indicando que debemos utilizar el
modelo multiplicativo.
En primer lugar ajustamos la recta de tendencia sobre las medias anuales
26 + 52 + 22
= 33,3333
3
"
24 + 51 + 24
= 33
3
ti
xi = ti 2001
yi = media anual
xi2
xi yi
2002
2003
2004
2005
2006
totales
1
2
3
4
5
15
33,3333
34
33,6667
33,3333
33
167,3333
1
4
9
16
25
55
33,3333
68
101,0001
133,3332
165
500,6666
159
n=5
x=
15
=3
5
y=
167,3333
= 33, 4667
5
1 n
2 55 2
3 = 2
S x2 = xi2 x =
5
n i =1
S xy =
y y =
S xy
S
2
x
( x x)
1 n
500, 6666
xi yi x y =
(3 33, 4667) = 0, 26678
n i =1
5
y 33, 4667 =
0, 26678
( x 3)
2
y = 33,86687 0,13339 x
b
23 2 = 23, 08892
s
Y comparando las medias corregidas con su promedio, por cociente, obtenemos los ndices de
variacin estacional.
25, 2
100 = 75, 2
33,51113
2002
2003
2004
2005
2006
media por
estacin
media
corregida
I.V.E. (%)
52, 24446
100 = 155,9
33,51113
23, 08892
100 = 68,9
33,51113
1 cuatrimestre
26
26
25
25
24
2 cuatrimestre
52
53
53
52
51
3 cuatrimestre
22
23
23
23
24
25,2
52,2
23
25,2
52,24446
23,08892
75,2
155,9
68,9
media anual
33,3333
34
33,6667
33,3333
33
media global
corregida
33,51113
(t ) = 12 + 6(t 2010)
160
1
5
5
4
2
3
2
2
3
7
6
7
4
5
6
4
Ajustando una recta de mnimos cuadrados para la tendencia secular y usando el mtodo de la
razn a la tendencia para los ndices de variacin estacional, haga una prediccin de los beneficios
para el tercer trimestre de 2013.
Solucin:
En primer lugar ajustamos la recta de tendencia sobre las medias anuales
5+3+ 7 +5
=5
4
5+ 2+6+6
= 4, 75
4
4+2+7+4
= 4, 25
4
ti
xi = ti 2009
yi = media anual
xi2
xi yi
2010
2011
2012
totales
1
2
3
6
5
4,75
4,25
14
1
4
9
14
5
9,5
12,75
27,25
n=3
x=
6
=2
3
y=
14
= 4, 6667
3
1 n
2 14
S x2 = xi2 x = 22 = 0, 6667
3
n i =1
S xy =
1 n
27, 25
xi yi x y =
(2 4, 6667) = 0, 25
n i =1
3
161
y y =
S xy
S
2
x
( x x)
y 4, 6667 =
0, 25
( x 2)
0, 6667
y = 5, 4167 0,375 x
(t ) = 758, 7917 0,375t para 2010 se asigna al punto central del ao (punto entre el 2 y 3
trimestre), que la tendencia vara
b 0,375
=
= 0, 09375 cada trimestre que pasa y la mitad
4
s
0, 09375
As:
5,0417-0,046875=4,994825
A partir del anterior dato restaremos 0,09375 para obtener el valor de la tendencia en el siguiente
trimestre (4 trimestre de 2010) y as sucesivamente hasta llegar al ltimo trimestre de 2012.
Anlogamente, para obtener el valor de la tendencia en el trimestre anterior (2 trimestre de 2010) le
sumaremos 0,09375 a 4,994825 y as sucesivamente hasta llegar al primer trimestre de 2010. Los
valores estimados de la tendencia se recogen en la siguiente tabla
(t )
2010
2011
2012
5,182325
4,807325
4,432325
5,088575
4,713575
4,338575
4,994825
4,619825
4,244825
4
4,901075
4,526075
4,151075
5
= 0,9648
5,182325
...
Y (t )
(t )
4
= 0,9636
4,151075
Calculamos la media por estacin de los anteriores valores y la media de dichas medias (que es igual
a la media global de todos los cocientes
Y (t )
). Los ndices de variacin estacional (I.V.E.) se
(t )
obtienen como cociente de las medias por estacin sobre la media global (el resultado se multiplica
por 100 para expresarlo en tantos por ciento)
0,9648 + 1, 0401 + 0, 9025
= 0,9691
3
0,9691
100 = 96,58%
1, 003425
...
1,1032
100 = 109,94%
1, 003425
(t )
2010
2011
2012
Y (t )
(t )
2010
2011
2012
media por
estacin
I.V.E.
1 trimestre
5
5
4
1 trimestre
5,182325
4,807325
4,432325
2 trimestre
3
2
2
2 trimestre
5,088575
4,713575
4,338575
3 trimestre
7
6
7
3 trimestre
4,994825
4,619825
4,244825
4 trimestre
5
6
4
4 trimestre
4,901075
4,526075
4,151075
1 trimestre
2 trimestre
3 trimestre
4 trimestre
0,9648
1,0401
0,9025
0,5896
0,4243
0,4610
1,4015
1,2988
1,6491
1,0202
1,3257
0,9636
media global
0,9691
0,4916
1,4498
1,1032
1,003425
96,58
48,99
144,49
109,94
Para estimar los beneficios del tercer trimestre de 2013, estimamos en primer lugar la tendencia
para dicho trimestre:
1 trimestre
2
3
4
5,3
2 trimestre
2,7
3,3
4,4
5,7
3 trimestre
2
3
3,9
4,9
4 trimestre
5
6,1
7,3
7,8
163
Solucin:
En primer lugar estimaremos la tendencia por el procedimiento de las medias mviles. Para ello
comenzamos calculando las medias mviles de amplitud 4 que estarn asociadas al punto central
de los 4 trimestres sobre los que se calcula:
2,925 =
2 + 2, 7 + 2 + 5
4
media mvil
amplitud 4
3,175 =
2, 7 + 2 + 5 + 3
4
1 trimestre
2 trimestre
3,325 =
2 + 5 + 3 + 3,3
...
4
3 trimestre
1 trimestre
(ao siguiente)
4 trimestre
2009
2,925
3,175
2010
3,575
3,85
4,1
4,375
2011
4,6
4,9
5,225
5,55
2012
5,8
5,925
3,325
A continuacin procedemos a centrar las medias mviles en los mismos perodos que las
observaciones de la serie, tomando medias mviles de amplitud 2 sobre las anteriores medias
mviles de amplitud 4:
3, 05 =
2,925 + 3,175
2
medias mviles
amplitud 2
2009
2010
2011
2012
3, 25 =
3,175 + 3,325
2
3, 45 =
3,325 + 3,575
...
2
1 trimestre
2 trimestre
3 trimestre
4 trimestre
3,45
4,4875
5,675
3,7125
4,75
5,8625
3,05
3,975
5,0625
-
3,25
4,2375
5,3875
-
Y (t )
en
(t )
2
= 0,6557
3, 05
...
5, 7
= 0,9723
5,8625
Calculamos la media por estacin de los anteriores valores y la media de dichas medias (media
global). Los ndices de variacin estacional (I.V.E.) se obtienen como cociente de las medias por
estacin sobre la media global (el resultado se multiplica por 100 para expresarlo en tantos por
ciento)
0,8696 + 0,8914 + 0,9339
= 0,8983
3
164
0,8983
100 = 89,86%
0,999675
1, 4443
100 = 144, 48%
0,999675
...
Y (t )
1 trimestre
2 trimestre
3 trimestre
4 trimestre
2009
2010
2011
2012
2
3
4
5,3
2,7
3,3
4,4
5,7
2
3
3,9
4,9
5
6,1
7,3
7,8
(t )
1 trimestre
2 trimestre
3 trimestre
4 trimestre
2009
2010
2011
2012
3,45
4,4875
5,675
3,7125
4,75
5,8625
3,05
3,975
5,0625
-
3,25
4,2375
5,3875
-
Y (t )
(t )
1 trimestre
2 trimestre
3 trimestre
4 trimestre
2009
2010
2011
2012
0,8696
0,8914
0,9339
0,8889
0,9263
0,9723
0,6557
0,7547
0,7704
-
1,5385
1,4395
1,3550
-
media global
media por
0,8983
0,9292
0,7269
1,4443
0,999675
estacin
89,86
92,95
72,72
144,48
I.V.E. (%)
Desestacionalizar una serie consiste en eliminar los altibajos observados en la misma debidos a
factores estacionales. Para ello dividiremos las observaciones de cada estacin por su I.V.E.,
expresado este ltimo en tantos por uno:
2
= 2, 2257
0,8986
SERIE
DESESTACIONALIZADA
2009
2010
2011
2012
"
7,8
= 5,3987
1, 4448
1 trimestre
2 trimestre
3 trimestre
4 trimestre
2,2257
3,3385
4,4514
5,8981
2,9048
3,5503
4,7337
6,1323
2,7503
4,1254
5,3630
6,7382
3,4607
4,2220
5,0526
5,3987
7. Con los datos mensuales de una serie cronolgica en el perodo 2007-2012 se ha estimado la
tendencia:
165
MES
Enero
Febrero
Marzo
Abril
Mayo
Junio
I.V.E.
97,38
97,49
96,89
98,9
98,75
97,91
MES
Julio
Agosto
Septiembre
Octubre
Noviembre
Diciembre
I.V.E.
103,44
101,74
100,03
103,67
102,35
101,64
25,958
cada medio mes. Segn lo anterior, se estima un valor de la
24
126,18
= 130, 23
0,9689
El valor desestacionalizado de octubre es:
145, 64
= 140, 48
1, 0367
Aunque el mes de octubre no tuviera una componente estacional ms favorable que la de
marzo el valor de la serie en octubre hubiera sido mayor que en marzo (140,48>130,23).
8. En una provincia se ha analizado la serie cuatrimestral de las inversiones realizadas. Result
estimada la tendencia por (t ) = 3,8667 + 1, 2(t 2006)
Cuatrimestre
I.V.E.
Primero
106,79
Tercero
74,81
Haga una prediccin de las inversiones en la provincia para cada uno de los cuatrimestres de 2013.
Solucin:
Comenzamos estimando la tendencia en el punto central del ao 2013, que coincide con el punto
central de su segundo cuatrimestre
1, 2
= 0, 4 cada cuatrimestre. Por tanto la tendencia en el tercer
3
Primero
11,8667
Segundo
12,2667
Tercero
12,4667
Multiplicando los valores de la tendencia por los I.V.E. (en tantos por 1) se obtienen las
estimaciones de las inversiones en cada cuatrimestre de 2013:
Cuatrimestres de 2013
Estimaciones de las inversiones
Primero
12,67245
Tercero
9,32634
I
12
14
17
21
II
15
18
23
27
III
10
13
18
21
IV
9
10
13
15
Obtenga una prediccin para las ventas del cuarto trimestre del ao 2013 y desestacionalice la serie.
Utilice el mtodo de las medias simples, modelo aditivo.
Solucin:
Comenzamos ajustando la recta de tendencia sobre las medias anuales
12 + 15 + 10 + 9
= 11,5
4
"
21 + 27 + 21 + 15
= 21
4
ti
xi = ti 2008
yi = media anual
xi2
xi yi
2009
2010
2011
2012
totales
1
2
3
4
10
11,5
13,75
17,75
21
64
1
4
9
16
30
11,5
27,5
53,25
84
176,25
n=4
x=
10
= 2,5
4
y=
64
= 16
4
1 n 2 2 30
2,52 = 1, 25
S = xi x =
4
n i =1
2
x
S xy =
y y =
S xy
S
2
x
( x x)
1 n
176, 25
xi yi x y =
(2,5 16) = 4, 0625
n i =1
4
y 16 =
4, 0625
( x 2, 5)
1, 25
y = 7,875 + 3, 25 x
167
b 3, 25
=
= 0,8125 como estaciones del ao han transcurrido desde el comienzo del mismo,
s
4
Y comparando las medias corregidas con su promedio, por diferencia, obtenemos la variacin
estacional para el modelo aditivo.
"
1 trimestre
12
14
17
21
2 trimestre
15
18
23
27
3 trimestre
10
13
18
21
4 trimestre
9
10
13
15
16
20,75
15,5
11,75
16
19,9375
13,875
9,3125
1,21875
5,15625
-0,90625
-5,46875
media anual
11,5
13,75
17,75
21
media global
corregida
14,78125
3, 25
0,8125
= 0,8125 cada trimestre,
= 0, 40625 cada medio
4
2
trimestre. Por tanto la tendencia estimada para el punto central del cuarto trimestre es:
24,125+0,8125+0,40625=25,34375
Valor que tenemos que corregir segn la variacin estacional de dicho trimestre para obtener la
prediccin pedida:
25,34375-5,46875=19,875
14-1,21875=12,78125
I
10,78125
12,78125
15,78125
19,78125
15+5,46875=20,46875
II
9,84375
12,84375
17,84375
21,84375
III
10,90625
13,90625
18,90625
21,90625
IV
14,46875
15,46875
18,46875
20,46875
10. Una empresa de bebidas carbnicas ha vendido, en millones de litros, las siguientes cifras:
168
Estacin / Ao
primavera
verano
otoo
invierno
2009
2,2
3,5
4,3
2,1
2010
2,4
3,6
4,5
2,2
2011
2,5
3,6
4,8
2,5
Estime las ventas para el invierno de 2012, utilizando el mtodo de las medias mviles y el modelo
aditivo.
Solucin:
Consideramos que el ao comienza el primer da de la primavera y termina el ltimo da del
invierno.
En primer lugar estimaremos la tendencia por el procedimiento de las medias mviles. Para ello
comenzamos calculando las medias mviles de amplitud 4 que estarn asociadas al punto central
de las 4 estaciones sobre las que se calcula:
3, 025 =
media mvil
amplitud 4
3, 075 =
primavera
verano
3,1 =
otoo
4,3 + 2,1 + 2, 4 + 3, 6
...
4
primavera
(ao siguiente)
invierno
2009
3,025
3,075
3,1
2010
3,15
3,175
3,2
3,2
3,275
3,35
A continuacin procedemos a centrar las medias mviles en los mismos perodos que las
2012
observaciones de la serie, tomando medias mviles de amplitud 2 sobre las anteriores medias
mviles de amplitud 4:
3, 05 =
3, 025 + 3, 075
2
medias mviles
amplitud 2
2009
2010
2011
3, 0875 =
3, 075 + 3,1
2
3,125 =
3,1 + 3,15
...
2
primavera
verano
otoo
invierno
3,125
3,2375
3,1625
3,3125
3,05
3,1875
-
3,0875
3,2
-
4,3 3, 05 = 1, 25
...
3, 6 3,3125 = 0, 2875
Calculamos la media por estacin de los anteriores valores y la media de dichas medias (media
global). La variacin estacional (V.E.) se obtiene como diferencia entre las medias por estacin y la
media global.
169
0, 725 0, 7375
= 0, 73125
2
0, 4375 + 0, 2875
= 0,3625
2
1, 25 + 1,3125
= 1, 28125
2
0,9875 1
= 0,99375
2
0, 73125 ( 0, 0203125) =
...
Y (t )
2009
2010
2011
(t )
2009
2010
2011
Y (t ) (t )
2009
2010
2011
media por
estacin
V.E.
primavera
2,2
2,4
2,5
primavera
3,125
3,2375
primavera
-0,725
-0,7375
verano
3,5
3,6
3,6
verano
3,1625
3,3125
verano
0,4375
0,2875
otoo
4,3
4,5
4,8
otoo
3,05
3,1875
otoo
1,25
1,3125
-
invierno
2,1
2,2
2,5
invierno
3,0875
3,2
invierno
-0,9875
-1
-
media global
-0,73125
0,3625
1,28125
-0,99375
-0,0203125
-0,7109375
0,3828125
1,3015625
-0,9734375
Para estimar las ventas del invierno de 2012 necesitamos una estimacin de la tendencia en dicho
momento y sumarle el valor de la variacin estacional en invierno.
El mtodo de obtencin de la tendencia mediante medias mviles no permite estimar sta para
perodos futuros. Para estimar el valor de la tendencia en un futuro a partir de las medias mviles
hara falta ajustar una recta sobre las medias mviles, esta recta no suele diferir mucho de la que se
ajusta en los mtodos de las medias simples y de la razn (diferencia) a la tendencia. Por este
motivo, en la prctica, se procede a ajustar dicha recta para estimar la tendencia
ti
xi = ti 2008
yi = media anual
xi2
xi yi
2009
2010
2011
totales
1
2
3
6
3,025
3,175
3,35
9,55
1
4
9
14
3,025
6,35
10,05
19,425
n=3
x=
6
=2
3
y=
9,55
= 3,1833
3
1 n
2 14
S x2 = xi2 x = 2 2 = 0, 6667
3
n i =1
170
S xy =
y y =
S xy
S
2
x
( x x)
1 n
19, 425
xi yi x y =
(2 3,1833) = 0,1084
n i =1
3
y 3,1833 =
0,1084
( x 2)
0, 6667
y = 2,8581 + 0,1626 x
0,1626
0, 04065
= 0, 04065 cada estacin,
= 0, 020325 cada
4
2
media estacin. Por tanto la tendencia estimada para el punto central del invierno de 2012 es:
3,5085+0,04065+0,020325=3,569475
Valor que tenemos que corregir segn la variacin estacional del invierno para obtener la prediccin
pedida:
171
5 . PROBABILIDAD.
xi
1
2
3
4
5
6
total
ni
45
57
51
48
54
45
n=300
fi
0,15
0,19
0,17
0,16
0,18
0,15
1
0 fi 1 .
2.- La frecuencia relativa de dos o ms modalidades es la suma de las frecuencias relativas de cada
una de las modalidades. Por ejemplo, la frecuencia relativa de obtener un nmero par es
f ( par ) = f ( x2 * x4 * x6 ) = f 2 + f 4 + f 6 = 0,19 + 0,16 + 0,15 = 0,50
3.- La frecuencia relativa de todas las modalidades (suma de todas las frecuencias relativas) es 1,
6
=1
i =1
Llamaremos suceso a cada uno de los posibles resultados de un experimento o fenmeno aleatorio.
Utilizaremos letras maysculas para referirnos a ellos.
En el experimento de lanzar el dado, son ejemplos de sucesos: A={obtener par}, B={obtener
impar}, C={obtener un 3}, D={obtener un nmero mayor o igual que 4}, E={obtener un nmero
menor que 4} Utilizaremos estos sucesos como ejemplos para ilustrar las siguientes definiciones y
operaciones sobre sucesos.
172
Al suceso formado por un nico resultado se denomina suceso elemental. Para estos sucesos,
adems de la notacin general con letras maysculas, utilizaremos la notacin i . Un ejemplo de
suceso elemental sera C={obtener un 3}, 3 segn esta ltima notacin (notacin anloga a la
utilizada en variables estadsticas, xi ).
Se llama suceso seguro al suceso que siempre ocurre, est formado por todos los sucesos
elementales, se nota . En el ejemplo del dado = {1, 2, 3, 4,5, 6} .
Al conjunto vaco, que se nota , se denomina suceso imposible.
B = {impar} ,
B * D = {1,3, 4, 5, 6} .
A* A = A
Se define la interseccin de dos sucesos A y B, A B , como el suceso que ocurre cuando ocurre el
suceso A y el suceso B. En el ejemplo del dado: B = {impar} ,
B D = {5} .
A A = A
y de absorcin:
A * ( A B) = A
173
A ( A * B) = A
Se define la diferencia de dos sucesos, A B , como el suceso formado por los sucesos elementales
que son de A pero no de B. Para poder definir correctamente esta operacin se ha de cumplir que
B A . En el ejemplo del dado: B = {impar} , C = {3} , B C = {1,5} .
A= A
A B B A
=
A A =
=
A* A =
A1 * ... * An = A1 ... An
A1 ... An = A1 * ... * An
Definicin de probabilidad.
Definimos una medida de probabilidad sobre ( , $ ) como una aplicacin:
( , $ )
A $
P( A)
174
A $
n
2.- Sean A1 , ..., An sucesos incompatibles, P * Ai = P ( Ai )
i =1 i =1
3.- P ( ) = 1
Obsrvese la analoga entre estas tres condiciones y las propiedades de las frecuencias relativas que
destacbamos al comienzo de la leccin.
Propiedades:
1.-
P( A) = 1 P( A)
( )
( )
Demostracin: 1 = P() = P A * A = P ( A ) + P A
1 P ( A) = P A
P( A B) = P( A) P( B)
Demostracin: A = ( A B ) * B
4.- Si B A
P( A) = P( A B ) + P( B )
P( A B) = P( A) P( B)
P( B) P( A)
Demostracin:
5.-
( A B) B =
P( B) = P( A) P( A B)
P( B) P( A)
Un caso particular de la anterior propiedad nos conduce a que la probabilidad de todo suceso es
menor o igual a 1. A
P( A) 1
( )
B = ( B A) * ( B A)
P( A * B ) = P ( A ) + P ( B ) P ( A B )
( )
P( B ) = P ( B A ) + P ( B A )
P( A) + P( B ) = 2P ( A B ) + P ( A B ) + P ( B A )
Demostracin: A = ( A B ) * A B
) (
A * B = ( A B) * A B * B A
P( A) = P ( A B ) + P A B
) (
P( A * B) = P( A B) + P A B + P B A
) (
P( A) + P( B ) = 2P ( A B ) + P A B + P B A = P ( A * B ) + P ( A B )
P( A) + P( B ) P ( A B ) = P ( A * B )
n
n
7.- Consecuencia de la anterior propiedad es la subaditividad de P: P * Ai P ( Ai )
i =1 i =1
Demostracin:
P( A1 * A2 ) = P ( A1 ) + P ( A2 ) P ( A1 A2 ) P ( A1 ) + P ( A2 )
175
Asignacin de probabilidades.
Estas son las propiedades que tiene la medida de la probabilidad pero la teora no especifica nada
ms sobre los valores numricos concretos que toma la funcin P( A) .
Si el nmero de sucesos elementales, i , es finito, es suficiente asignar probabilidades a los sucesos
elementales, P (i ) , y definir la probabilidad de un suceso A como
P ( A) =
P ( )
i
i A
Si adems de ser finito el conjunto de sucesos elementales, = {1 , ..., i , ..., n } , suponemos que
los sucesos elementales son equiprobables,
P (i ) =
1
i , obtenemos la conocida regla de
n
Laplace
P ( A) =
P ( ) = n = n =
i A
i A
casos favorables
casos posibles
P (i ) =
1
= 0,16
6
176
xi
ni
fi
xi
ni
fi
45
0,15
456
0,152
1
1
57
0,19
561
0,187
2
2
51
0,17
516
0,172
3
3
48
0,16
483
0,161
4
4
54
0,18
534
0,178
5
5
0,15
0,150
6
45
6
450
total n=300
1
total n=3000
1
Cada una de estas concepciones tiene sus ventajas e inconvenientes. Por ejemplo, la concepcin
clsica no nos valdra para modelar el comportamiento de un dado, moneda, que estuviesen
trucados para conseguir con mayor probabilidad determinados resultados o sencillamente mal
construidos. En contra de la concepcin frecuentista se podra esgrimir el argumento de que multitud
de fenmenos aleatorios no pueden repetirse de forma indefinida, especialmente fenmenos de tipo
social y econmico (elecciones, valores burstiles, competiciones deportivas, ). Esta y otras
dificultades han llevado a considerar interpretaciones alternativas de la probabilidad como la
concepcin subjetiva en la que se considera un grado de creencia o confianza en la ocurrencia de un
hecho (la probabilidad de que la seleccin espaola gane el prximo mundial de ftbol es de 4/5).
EJEMPLO 5.1
Calcule las probabilidades de los siguientes sucesos en el lanzamiento de un dado segn la
concepcin clsica de Laplace y segn la concepcin frecuentista (tomando para este ltimo caso
como valores estables de las frecuencias los observados en los 3000 lanzamientos). Exprselo de
distintas formas donde se pueda.
A={obtener par}, B={obtener impar}, C={obtener un 3}, D={obtener un nmero mayor o igual
que 4}, E={obtener un nmero menor que 4}.
Solucin:
Concepcin clsica:
1 1
casos favorables 3 1
= = = 0,5
casos posibles
6 2
P ( A) =
P ( ) = 6 = 6 + 6 + 6 =
P( B) =
casos favorables 3 1
= = = P A = 1 P ( A ) = 1 0, 5 = 0,5
casos posibles
6 2
P (C ) =
casos favorables 1
= = 0,16
casos posibles
6
P( D) =
casos favorables 3 1
= = = 0,5
casos posibles
6 2
P(E) =
casos favorables 3 1
= = = P D = 1 P ( D ) = 1 0, 5 = 0,5
casos posibles
6 2
i A
i A
( )
( )
177
Concepcin frecuentista:
P ( A) =
i A
P( B) =
i B
P ( C ) = 0,172
P ( D) =
P( E) =
i D
i E
EJEMPLO 5.2
En una ciudad se publican tres peridicos (A, B y C). Se sabe que un 60% de la poblacin est
suscrito al peridico A, un 40% al B, un 30% al C, un 20% a A y B, un 15% a A y C, un 25% a B y
C, y un 10% a los tres peridicos. Qu parte de la poblacin est suscrita al menos a un peridico?
Solucin:
En este ejemplo se hace una interpretacin de la probabilidad segn la concepcin frecuentista.
Sean A, B y C los sucesos comprar el peridico A, B y C respectivamente.
La pregunta se puede interpretar como qu parte de la poblacin est suscrita a A o a B o a C. Lo
que en la notacin de sucesos equivale a la unin de los tres sucesos.
Utilizaremos la frmula de la probabilidad de la unin de dos sucesos compatibles,
P( A * B ) = P ( A ) + P ( B ) P ( A B ) , y la propiedad asociativa de la unin de sucesos.
P ( A * B * C ) = P ( A * ( B * C ) ) = P ( A) + P ( B * C ) P ( A ( B * C ) ) =
= P ( A) + P ( B ) + P ( C ) P ( B C ) P ( A ( B * C ) ) =
= P ( A) + P ( B ) + P ( C ) P ( B C ) P ( ( A B ) * ( A C ) ) =
= P ( A ) + P ( B ) + P ( C ) P ( B C ) (P ( A B ) + P ( A C ) P ( A B C ) ) =
= P ( A) + P ( B ) + P ( C ) P ( B C ) P ( A B ) P ( A C ) + P ( A B C ) =
=
60 40 30 25 20 15 10
80
+
+
+
=
100 100 100 100 100 100 100 100
178
5.2
Probabilidad condicionada.
En determinadas situaciones es necesario calcular la probabilidad de sucesos dada la condicin
adicional de que cierto suceso ha ocurrido. A este tipo de probabilidad se denomina condicionada.
ocurra B supuesto que ha ocurrido A. Dicha probabilidad condicionada del suceso B al suceso A es
igual a:
( A) = P (PB( A)A)
P ( A) > 0
P B
Como en la probabilidad no condicionada, aqu se sigue tomando como modelo las frecuencias
relativas. Supongamos el siguiente ejemplo sobre datos de los estudios completados por una
poblacin de 1000 habitantes
Enseanza obligatoria Bachillerato
Universitarios
TOTAL
hombres
250
160
40
450
mujeres
350
140
60
550
TOTAL
600
300
100
1000
Entre los hombres (H sera el suceso conocido o que ha ocurrido) la frecuencia relativa de los que
completaron los estudios universitarios (U sera el suceso sobre el que se quiere calcular la
probabilidad, en este caso la frecuencia) es:
40
f (U H )
40
f U
=
= 1000 =
H
450 450
f (H )
1000
Mientras que la frecuencia relativa de los que completaron los estudios universitarios (sin imponer
ninguna condicin sobre el sexo) es:
f (U ) =
100
1000
probabilidad:
( A) 0
1.- P B
B $
179
n
n
i*=1 Bi
Bi
2.- Sean B1 , ..., Bn sucesos incompatibles, P
= P A
A i =1
( A) = 1
3.- P
Demostracin:
( A) = P (PB( A)A)
P ( A) > 0
y P ( B A) 0
1.-
P B
2.-
n
n
n
P * Bi A P * ( Bi A )
* Bi
i =1
= i =1
=
P i =1
=
P ( A)
P ( A)
A
3.-
P ( B A)
0
P ( A)
P ( B A)
i
i =1
P ( A)
P ( Bi A ) n Bi
= P
A
P ( A)
i =1
i =1
n
Por tanto las propiedades de la probabilidad (no condicionada) tambin se cumplen para la
probabilidad condicionada.
( A) se define P ( A B ) como:
( B ) = P (PA( B )B )
P( B) > 0
P A
De las definiciones de P B
( A) = P ( B ) P ( A B )
P ( A B ) = P ( A) P B
Para tres sucesos el anterior resultado se puede enunciar de 3!=6 formas alternativas, una de ellas es:
( A) P ( C A B )
P ( A B C ) = P ( A) P B
y para n sucesos una de sus posibles formas es:
P ( A1 A2 ... An ) = P ( A1 ) P
180
( A A )P A A A ...P A A A ... A
3
n 1
( A) P ( B )
P B
( A) = P ( B )
P B
( A) = P (PB( A)A) = P ( B )
P B
P ( A B ) = P ( A) P ( B )
( B ) = P (PA( B )B ) = P ( PA)( PB )( B ) = P ( A)
P A
1 1 1
P ( A B ) = 0 P ( A) P ( B ) = =
2 2 4
1 1 1
P ( A C ) = 0 P ( A) P ( C ) = =
2 6 12
2
1 1 1
P ( A D ) = P ( A) P ( D ) = =
6
2 2 4
1
1 1 1
P ( A E ) = P ( A) P ( E ) = =
6
2 2 4
1
1 1 1
P ( B C ) = P ( B)P (C ) = =
6
2 6 12
1
1 1 1
P ( B)P ( D ) = =
6
2 2 4
2
1 1 1
P ( B E ) = P ( B)P ( E ) = =
6
2 2 4
1 1 1
P (C D ) = 0 P (C )P ( D ) = =
6 2 12
1
1 1 1
P (C E ) = P (C )P ( E ) = =
6
6 2 12
1 1 1
P ( D E ) = 0 P ( D)P ( E ) = =
2 2 4
P( B D) =
181
EJEMPLO 5.4
En el bar de la Facultad de CC. EE. y EE. el 90% de los clientes son estudiantes. Se sabe que el
45% de los clientes toman caf y que el 30% de los estudiantes toman caf.
a) Cul es la probabilidad de que un cliente elegido al azar sea estudiante y tome caf?
b) Se elige al azar un cliente que toma caf, cul es la probabilidad de que sea estudiante?
c) Son independientes los sucesos tomar caf y ser estudiante?
Solucin:
Definimos los sucesos: E={el cliente es estudiante}, C={el cliente toma caf}
a) Utilizamos la frmula de la probabilidad compuesta:
90 30
= 0, 27
( E ) = 100
100
P (C E ) = P ( E )P C
P E
c)
5.3
i j
* Ai =
i =1
P ( B ) = P B P ( Ai )
Ai
i =1
Demostracin:
n
n
n
n
P ( B ) =P ( B ) = P B * Ai = P * ( B Ai ) = P ( B Ai ) = P B P ( Ai )
Ai
i =1
i =1
i =1
i =1
Las probabilidades condicionadas de un suceso cualquiera B sobre cada uno de los elementos de la
A
particin, P B , son normalmente conocidas. No es as con las probabilidades P i .
Ai
B
A
P ( Ak B ) = P ( B ) P k = P ( Ak ) P B
B
Ak
P ( B ) = P B P ( Ai )
Ai
i =1
P ( Ak B )
A
=
P k =
B
P(B)
P ( Ak ) P B
Ak
n
P B P ( Ai )
Ai
i =1
M1
M2
M4
M3
4%
3,5% 4,6%
2%
a) Si las piezas se almacenan conjuntamente, cul es la probabilidad de que al seleccionar
una pieza al azar sta sea defectuosa?
b) Se ha seleccionado una pieza defectuosa, cul es la probabilidad de que haya sido
producida en la mquina M 2 ?
Solucin:
Sean M1 , M 2 , M 3 y M 4 los sucesos
respectivamente.
Sea D el suceso la pieza es defectuosa.
Los sucesos M1 , M 2 , M 3 y M 4 constituyen una particin de la produccin total de la factora.
a) Segn la frmula de la probabilidad total
4
( )
P( D) = P D
i =1
Mi
P(Mi ) =
183
b)
( M )P ( M )
3,5 500
1750
= 4
= 100 1700 =
= 0, 27955
D
6260
6260
D P M
P
M ( i)
170000
i
i =1
( )
P M2
P D
EJEMPLO 5.6
En una empresa el 8% de los hombres y el 4,3% de las mujeres ganan ms de 25000 al ao. Se
sabe que el porcentaje de mujeres en la empresa es del 47%. Se selecciona al azar un empleado que
gana menos de 25000, cul es la probabilidad de que sea mujer?
Solucin:
Definimos los sucesos, H={el empleado es hombre}, M={el empleado es mujer} y S={el empleado
supera los 25000}. Consecuentemente S ={el empleado gana menos de 25000}.
Sabemos:
8
( H ) = 100
P S
P S
4,3
) = 100
P(M ) =
47
100
Por tanto:
92
( H ) = 1 P ( S H ) = 1 1008 = 100
P S
4,3 95,7
=
( M ) = 1 P ( S M ) = 1 100
100
P S
( )
P( H ) = P M = 1 P( M ) = 1
47
53
=
100 100
Teniendo en cuenta que los sucesos H y M son una particin de los empleados de la empresa y
aplicando la frmula de Bayes, la probabilidad pedida es:
95, 7 47
P(M )
(
)
M
4497,9
100 100
=
=
= 0, 4798323
P(M ) =
S P S
95,
7
47
92
53
9373,9
S
( M )P ( M ) + P ( H )P ( H ) 100 100 + 100 100
P S
5.4
Ejercicios resueltos.
1. Una empresa compra bombillas a dos proveedores (A y B). Al primero le compra el 30% de las
bombillas, siendo defectuosas el 3% de las mismas. Tambin son defectuosas el 2% de las
bombillas compradas al segundo proveedor.
184
a) Calcule la probabilidad de que una bombilla comprada por la empresa no sea defectuosa.
b) En un control se ha seleccionado una bombilla defectuosa. Calcule la probabilidad de que se
haya comprado al segundo proveedor.
Solucin:
A=bombilla comprada al proveedor A
D=bombilla defectuosa
( A) = 0, 03 P ( D A) = 1 0, 03 = 0, 97
P ( B ) = 1 0, 30 = 0, 70
P ( D ) = 0, 02 P ( D ) = 1 0, 02 = 0,98
B
B
P ( A ) = 0,30
P D
( )
a) P D = P D
( )
=
b) P B
D
97, 7%
( B ) P ( B ) = 0, 02 0, 70 = 0, 014 = 0, 6087
P D
P ( D)
1 0,977
0, 023
2. El servicio municipal de recaudacin de la tasa de basura en una ciudad establece dicha tasa en
funcin de la categora de la calle. En concreto, en este municipio hay 3 categoras: un 25% de las
calles son de categora I y un 40% son de categora II. Adems, el 4% de los propietarios de
viviendas en calles de categora I deben al menos un recibo. El 98% de los propietarios en calles de
categora II estn al da en sus recibos de basura y este porcentaje es del 97% en las viviendas en
calles de categora III.
a) Cul es la probabilidad de que una vivienda est al da en el pago de sus recibos.
b) Se selecciona al azar una vivienda y est al da en el pago de sus recibos, cul ser la
categora de la calle en la que se encuentra con mayor probabilidad?
Solucin:
Con los datos del problema y segn la siguiente notacin obtenemos las probabilidades
condicionadas y no condicionadas que aparecen ms abajo:
I= calle de categora I
II= calle de categora II
III= calle de categora III
D= el propietario debe al menos un recibo
( I ) = 0, 04
P D
P( II ) = 0, 40
P( III ) = 1 0, 25 0, 40 = 0,35
( I ) = 1 0, 04 = 0,96
P D
185
( II ) = 0,98 P ( D II ) = 1 0, 98 = 0, 02
P ( D ) = 0,97 P ( D ) = 1 0,97 = 0, 03
III
III
P D
a)
( )
P D =P D
P( I )
(
0, 25
I)
= 0, 247
( D ) P ( D ) = 0,960,9715
P I
P D
P( II )
(
0, 40
II )
= 0, 4035
( D ) = P ( D ) = 0,980,9715
P II
P D
P( III )
(
0,35
III )
= 0,349
( D ) P ( D ) = 0,970, 9715
P III
P D
Lo ms probable es que pertenezca a una calle de categora II (la mayor de las tres
probabilidades es 0,4035).
3. Un inversionista est pensando comprar un nmero grande de acciones de una compaa. Se sabe
que la cotizacin de las acciones se relaciona con el PNB. Si el PNB aumenta, la probabilidad de
que suba el valor de las acciones es 0,8. Si el PNB no cambia, la probabilidad de que suban las
acciones es de 0,2. Si el PNB disminuye, la probabilidad de subir las acciones es slo de 0,1.
Si para los siguientes seis meses se asignan las probabilidades 0,4 , 0,3 y 0,3 a los eventos: el
PNB aumenta, no cambia y disminuye, respectivamente. Determine la probabilidad de que las
acciones suban de valor en los prximos seis meses.
Solucin:
S=subir las acciones.
( A) = 0,8
P S
P( A) = 0, 4
A=aumentar el PNB.
( N ) = 0, 2
P S
P( N ) = 0,3
D=disminuir el PNB.
( D ) = 0,1
P S
P( D) = 0,3
( A) P( A) + P ( S N ) P( N ) + P ( S D ) P(D) = 0,32 + 0, 06 + 0, 03 = 0, 41
P( S ) = P S
186
( N ) = 0, 002
P A
18
= 0,6
30
P( N ) =
12
= 0, 4
30
( N ) P( N )
P A
0, 6
= 0, 23077
( A) P ( A )P( N ) + P ( A )P( N ) = ( 0, 002 0,0,002
6 ) + ( 0, 01 0, 4 )
N
N
P ( N ) = 1 P ( N ) = 1 0, 2377 = 0, 76923
A
A
a) P N
b)
( N ) = 0, 01
P A
P( N ) =
P( A) =
10
= 0, 2
50
( A) = 0,80
P E
A=pieza de A.
P( B) =
15
= 0,3
50
( B ) = 0,90
P E
B=pieza de B.
P(C ) =
C=pieza de C.
25
= 0,5
50
( C ) = 0, 70
P E
a)
( A) P( A) + P ( E B ) P( B) + P ( E C ) P(C ) =
P( E ) = P E
187
P( B) P ( E ) P( B) (1 0,9 ) 0,3
)
(
B
B
=
=
= 0,13636
P( B ) =
E
1 0, 78
1-P( E )
P( E )
P E
b)
6. En segundo curso de GECO en la Facultad de Econmicas hay cuatro grupos. El grupo A tiene 50
alumnos matriculados de la provincia de Granada y otros 50 de fuera, en el grupo B hay 90
matriculados, de los que 40 son de la provincia de Granada, en el grupo C hay 80 matriculados,
siendo 30 de fuera de la provincia y el grupo D tiene 30 matriculados de la provincia de Granada y
40 de fuera.
Se escoge al azar un alumno de dicho curso de GECO:
a) Calcule la probabilidad de que el alumno sea de la provincia de Granada.
b) El alumno responde que no es de la provincia de Granada, calcule la probabilidad de que no
sea del grupo B.
Solucin:
G=alumno de la provincia de Granada.
A=alumno del grupo A
P( A) =
100
100
=
100 + 90 + 80 + 70 340
50
( A) = 100
P G
40
( B ) = 90
P G
P( B) =
90
340
50
( C ) = 80
P G
P(C ) =
80
340
P( D) =
70
340
30
( D ) = 70
P G
a) P(G) = P G
50 100 40 90 50 80 30 70 50 + 40 + 50 + 30 170 1
=
=
= = 0,5
+
+
+
=
340
340 2
100 340 90 340 80 340 70 340
( G ) = 1 P ( B G ) = 1 0, 2941 = 0, 7059
b) P B
40 90
P( B ) (1 P ( G ) ) P( B) 1
(
)
B
90 340 50
B
P(B ) =
=
=
=
= 0, 2941
1
G
1 P(G )
170
P(G )
1
P G
7. En una comunidad autonmica, el 18% de los hombres y el 15% de las mujeres presentaron una
declaracin sobre el IRPF con rentas superiores a 35000 al ao. El 45% de todas las declaraciones
recibidas corresponden a mujeres. Se pide:
a) Qu porcentaje de declaraciones no han superado los 35000?
188
( H ) = 0,18
H=hombre.
M=mujer.
( M ) = 0,15
P S
P S
P( H ) = 1 P( M ) = 0,55
P( M ) = 0, 45
P( S ) = P S
( S)
b) P M
P( S )
0,1665
B=pieza producida en B.
D=pieza producida en D.
F=pieza defectuosa.
P( A) =
150
150
=
150 + 250 + 275 + 325 1000
( A) = 0, 05
P F
( )
a) P B F
( B ) = 0, 04
P ( F ) P( B)
B
=
=
P F
P( F )
P( B) =
250
1000
( C ) = 0, 03
C=pieza producida en C.
P(C ) =
275
1000
P( D ) =
325
1000
( D ) = 0, 06
P ( F ) P( B )
B
=
P ( F ) P( A) + P ( F ) P( B) + P ( F ) P(C ) + P ( F ) P( D)
A
B
C
D
P F
P F
0, 04 0, 25
0, 01
=
= 0, 22099
( 0, 05 0,15) + ( 0, 04 0, 25) + ( 0, 03 0, 275) + ( 0, 06 0,325) 0, 04525
b) P( F ) = 1 P( F ) = 1 0,04525 = 0,95475
189
9. Una empresa de electrnica recibe suministros de tres mayoristas distintos. El 25% de los paquetes
se los enva el mayorista A, el 40% el mayorista B y el resto el mayorista C. Cinco de cada mil
envos hechos por el mayorista A salen defectuosos, as como dos de cada mil envos del mayorista
B y uno de cada mil del mayorista C. Se ha recibido un envo defectuoso, calcule la probabilidad de
que haya sido remitido por el mayorista A.
Solucin:
A=suministro del mayorista A.
D= suministro defectuoso.
P( A) = 0, 25
P( B) = 0, 40
5
= 0, 005
( A) = 1000
P D
P(C ) = 1 0, 25 0, 40 = 0,35
2
= 0, 002
( B ) = 1000
P D
1
= 0, 001
( C ) = 1000
P D
( A) P( A)
( D ) P D P( A) + P D P(B) + P D P(C) =
( A)
( B)
( C)
P A
=
P D
0, 005 0, 25
0, 00125
=
= 0,52083
( 0, 005 0, 25) + ( 0, 002 0, 40 ) + ( 0, 001 0,35) 0, 0024
10. Cada uno de los envos que una empresa realiza a sus clientes est formado por 100 piezas. De
ellas, 60 son fabricadas en la factora A y las restantes proceden de diversas factoras. El 3% de las
piezas fabricadas en la factora A son defectuosas, tambin son defectuosas el 5% de las piezas que
no han sido fabricadas en la factora A. En uno de los envos se elige una pieza al azar y resulta ser
defectuosa, calcule la probabilidad de que no haya sido fabricada en la factora A.
Solucin:
A=pieza de la factora A.
P( A) =
60
= 0, 6
100
P( A) =
3
= 0, 03
( A) = 100
P D
D=pieza defectuosa.
40
= 0, 4
100
( A) = 1005 = 0, 05
P D
P( A)
)
(
02
A
= 0,5263
( D ) = P ( D )P( A) + P D )P( A) = ( 0, 03 0,60, 05) +(0,0,405 0, 4) = 0,0,038
( A
A
P A
P D
11. Una compaa de autobuses atiende tres lneas perifricas de una ciudad. El 60% de los autobuses
cubren el servicio de la primera lnea, el 30% la segunda y el resto de autobuses la tercera. Se sabe
190
que la probabilidad de que un autobs se avere durante un mes es del 2% en la primera lnea, del
4% en la segunda y del 1% en la tercera.
a) Determine la probabilidad de que en un mes se avere un autobs.
b) Sabiendo que un autobs ha sufrido una avera, calcule la probabilidad de que no sea de la
primera lnea.
c) Se elige al azar un autobs y se comprueba que durante el mes en estudio no ha sufrido
avera, calcule la probabilidad de que el autobs elegido cubra el servicio en la segunda
lnea.
Solucin:
I=autobs cubre servicio de la primera lnea.
II= autobs cubre servicio de la segunda lnea.
III= autobs cubre servicio de la tercera lnea.
A=autobs sufre avera en un mes.
P( I ) = 0, 60
P( II ) = 0,30
( I ) = 0, 02
P A
a)
( II ) = 0, 04 P ( A III ) = 0, 01
P( A) = P ( A ) P( I ) + P ( A ) P( II ) + P ( A ) P( III ) =
I
II
III
P A
( A) = 1 P ( II A) = 1 0, 48 = 0,52
b) P II
( A)
P II
( II ) P(II ) = 0, 04 0,3 = 0, 48
P A
P( A)
0, 025
P( II ) (1 P ( A ) ) P( II ) (1 0, 04 ) 0,3
)
(
II
0, 288
II
P ( II ) =
=
=
=
= 0, 29358
A
1 P( A)
P( A)
(1 0, 025) 0,975
P A
c)
12. La probabilidad de que ocurra un suceso A es 0,6. La probabilidad de que ocurra otro suceso B es p.
La probabilidad de la unin de ambos sucesos es 0,8.
a) Pueden ser los sucesos A y B independientes? En caso afirmativo, calcule el valor de p para
que los sucesos A y B sean independientes.
b) Pueden ser los sucesos A y B incompatibles? En caso afirmativo, calcule el valor p para que
los sucesos A y B sean incompatibles.
c) Pueden ser los sucesos A y B complementarios? En caso afirmativo, calcule el valor p para
que los sucesos A y B sean complementarios.
191
Solucin:
P( A) = 0, 6
P( B) = p
P( A * B) = 0,8
P( A * B) = P( A) + P( B) P( A B) = 0, 6 + p ( 0,6 p ) = 0,8
0, 6 + p ( 0, 6 p ) = 0,8 0, 6 + ( 0, 4 p ) = 0,8
( 0, 4 p ) = 0, 2
p=
0, 2
= 0,5
0, 4
P( A * B) = P( A) + P( B) P( A B) = 0, 6 + p = 0,8
p = 0, 2
0, 6 = 1 p
p = 0, 4
13. Con base en varios estudios, una compaa ha clasificado, de acuerdo con la probabilidad de
descubrir petrleo, las formaciones geolgicas en tres tipos. La compaa pretende perforar un pozo
en un determinado sitio al que se le asignan las probabilidades 0,35 , 0,4 y 0,25 para los tres
tipos de formaciones geolgicas, respectivamente. De acuerdo con la experiencia se sabe que el
petrleo se encuentra en el 40% de las formaciones tipo I, en el 20% de las formaciones tipo II y en
el 30% de las formaciones tipo III.
a) Calcule la probabilidad de que al realizar una perforacin no se encuentre petrleo.
b) Si se realiza la perforacin y no se encuentra petrleo, determine la probabilidad de que en
el sitio haya una formacin de tipo II.
Solucin:
I=formacin geolgica tipo I.
II= formacin geolgica tipo II.
III=formacin geolgica tipo III.
E=encuentre petrleo.
P( I ) = 0,35
P( II ) = 0, 40
( I ) = 0, 40
P E
P( III ) = 0, 25
( II ) = 0, 20
P E
P E
III
) = 0,30
a) P( E ) = 1 P ( E ) = 1 0, 295 = 0, 705
P( E ) = P E
192
P ( II ) (1 P ( E ) ) P ( II ) 1 0, 20 0, 40
)
(
(
)
II
II
P ( II ) =
=
=
= 0, 4539
E
0, 705
0, 705
P(E)
P E
b)
193
6 . VARIABLES ALEATORIAS Y
DISTRIBUCIONES DE PROBABILIDAD.
i X (i ) = xi
Es decir, mediante una variable aleatoria transformamos los resultados de un fenmeno aleatorio en
valores numricos que miden aquella caracterstica del fenmeno que nos interesa destacar (en el
siguiente ejemplo la caracterstica es el nmero de cruces en tres lanzamientos de una moneda).
Las probabilidades de que la variable aleatoria X tome los distintos valores dependen de las
probabilidades, P (i ) , asociadas al fenmeno aleatorio sobre el que se ha definido.
Se denomina distribucin de probabilidad de la variable aleatoria X a las probabilidades asociadas
a los distintos valores que puede tomar la variable aleatoria, pi = P [ X = xi ] .
Toda distribucin de probabilidad ha de cumplir:
pi 0 i
=1
(Esta definicin es vlida para variables que toman un conjunto discreto de valores, como el
siguiente ejemplo. Sin embargo, cuando la variable aleatoria puede tomar un conjunto continuo de
valores, la distribucin de probabilidad no est caracterizada por probabilidades de valores
aislados como veremos en el epgrafe 6.2).
EJEMPLO 6.1
Represente la variable aleatoria X=nmero de cruces en tres lanzamientos de una moneda y
obtenga la distribucin de probabilidad asociada.
194
Solucin:
C=cara, +=cruz
X
CCC
+CC
C+C
CC+
++C
+C+
C++
+++
X (CCC ) = 0
X (+CC ) = 1
1
1
2
2
2
3
1
. Por tanto la probabilidad de cada
2
1 1
uno de los sucesos elementales de es = dado que son independientes los resultados de
2 8
los tres lanzamientos de la moneda
111 1
P ( CCC ) = P ( C C C ) = P ( C ) P ( C ) P ( C ) =
=
222 8
3
1 1
P ( + + + ) = P ( + )P ( + )P ( + ) = =
2 8
1
p0 = P [ X = 0] = P ( CCC ) =
8
1 1 1 3
p1 = P [ X = 1] = P ( +CC ) * ( C + C ) * ( CC + ) = + + =
8 8 8 8
1 1 1 3
p2 = P [ X = 2] = P ( + + C ) * ( +C + ) * ( C + + ) = + + =
8 8 8 8
1
p3 = P [ X = 3] = P ( + + + ) =
8
La distribucin de probabilidad se representa en una tabla como la que sigue
xi
pi
0
1/8
1
3/8
2
3/8
3
1/8
3
=1.
i =0
195
6.2
x
Propiedades:
F ( xi ) F ( x j )
Si xi < x j
F ( ) = 0
P [ X > x ] = 1 F ( x)
P [ x1 < X x2 ] = F ( x2 ) F ( x1 )
F ( + ) = 1
EJEMPLO 6.2
Calcule la funcin de distribucin asociada a la variable aleatoria X del ejemplo 6.1. Represente su
grfica.
Solucin:
La distribucin de probabilidad del ejemplo 6.1 est dada por:
xi
0
1
2
3
pi
1/8
3/8
3/8
1/8
0
1
8
4
F ( x) = P [ X x ] = pi =
xi x
8
7
8
196
si x < 0
si 0 x < 1
si 1 x < 2
si 2 x < 3
si 3 x
y su representacin grfica:
xi x
pi
densidad
F '( x ) = f ( x)
Como consecuencia de las propiedades de la funcin de distribucin, toda funcin de densidad
cumple que:
f ( x) 0
+
x
f ( x) dx = 1
197
P [ X = a ] = f ( x) d x = 0
a
P [ a < X < b ] = f ( x) dx
a
P[a < X ] =
f ( x) dx
P[ X < a] =
f ( x) dx
F ( x) = P [ X x ] =
f (t ) dt
Como puede verse, en variabbles aleatorias continuas la probabilidad dee un valor aislado es cero
por lo que no tiene sentido deffinir para ellas el concepto de distribucin de
d probabilidad tal y como
apareci en el epgrafe 6.1. En
E variables aleatorias continuas su distribu
ucin de probabilidad est
definida por su funcin de den
nsidad.
EJEMPLO 6.3
Sea la funcin de distribucinn de la variable aleatoria X:
3x x3
F ( x) =
2
1
,x<0
, 0 x 1
,1 < x
198
3 3x 2 3
f ( x) =
= (1 x 2 )
2
2
0
, 0 x 1
,1< x
Comprobemos que f ( x ) cumple las dos propiedades que caracterizan a toda funcin de densidad:
x
f ( x) 0
f ( x) dx = 1
3
f ( x) dx = 0 dx + (1 x 2 ) dx +
0 2
3
x3
3 1 3 2
0 dx =0 + x
+ 0 = 1 =
=1
2
3 0
2 3 2 3
F ( x) = P [ X x ] =
f (t ) dt =
0 dt = 0
Si 0 x 1
F ( x) = P [ X x ] =
3
3 t3
3
x3 3x x 3
f (t ) dt = 0 dt + (1 t 2 ) dt =0 + t = x =
2 3 0 2
3
2
0 2
Si 1<x
F ( x) = P [ X x ] =
x
3
3 t3
f (t ) dt = 0 dt + (1 t 2 ) dt + 0 dt =0 + t + 0 =
2 3 0
0 2
1
0
3 1 3 2
=1
1 =
2 3 2 3
199
1
1
<x<
3
2
y de que
1
<x.
2
1
1
P < X < =
2
3
3
3 t 3 2 3 1 1 1 1 3 11 26
2
1
t
dt
=
t
= = = 0, 206
(
)
2 3 1
2 2 24 3 81 2 24 81
1 2
3
3
2
1
3
3 t3
3 1 1 1 5
1
2
P < X = (1 t ) dt = t = 1 = = 0,3125
2 3 1
2 3 2 24 16
2
1 2
2
2
1
3 1
1
1
1
1
1 2 8 27 11 26
P < X < = F F =
= 0, 206
=
2
3
2
3 2 2 16 54
3 1
1
11 5
1
1
P < X = 1 P X = 1 F = 1 2 8 = 1 = = 0, 3125
2
16 16
2
2
2
6.3
Se define el valor esperado, esperanza matemtica o media de una variable aleatoria discreta X
como:
E [ X ] = xi pi
i =1
r = E X r = xir pi
i =1
r
r
r = E ( X E [ X ]) = ( xi E [ X ]) pi
200
i =1
2 = 2 = 2 12
3 = 3 31 2 + 213
4 = 4 41 3 + 612 2 314
De forma anloga, se definen los momentos no centrados y centrados para una variable aleatoria
continua X como:
r = E X r =
r
r = E ( X E [ X ] ) =
x f ( x ) dx
r
( x E [ X ] ) f ( x ) dx
r
E [ aX + b ] = aE [ X ] + b
Demostracin: (se hace para variables continuas, de forma anloga se hara para variables
discretas)
E [ aX + b ] =
( ax + b ) f ( x) dx = ax f ( x) dx + b f ( x) dx = a x f ( x) dx + b
f ( x) dx = aE [ X ] + b
2 [ aX + b ] = a 2 2 [ X ]
En particular (a=0), la varianza de una constante es cero, 2 [ b ] = 0 .
Las propiedades anteriores muestran como le afecta al valor de la media y de la varianza un cambio
de origen y escala sobre la variable aleatoria.
Desigualdad de Tchebycheff:
1
k2
EJEMPLO 6.4
Calcule la media y la varianza de las distribuciones de probabilidad de los ejemplos 6.2 y 6.3
201
Solucin:
Distribucin de probabilidad del ejemplo 6.2:
xi
0
1
2
3
total
pi
1/8
3/8
3/8
1/8
xi pi
0
0,375
0,750
0,375
1,500
xi2 pi
0
0,375
1,500
1,125
3
E [ X ] = xi pi = 1, 5
i=0
2 = 2 12 = xi2 pi xi pi = 3 1,52 = 0, 75
i=0
i=0
3 3x 2 3
f ( x) =
= (1 x 2 )
2
2
0
+
,x<0
, 0 x 1
,1< x
1
1
3
3
3 x2 x4
3 1 1 3
2
3
1 = E [ X ] = x f ( x ) dx = x (1 x ) dx = ( x x )dx = = = = 0,375
2
20
2 2 4 0 2 2 4 8
0
1 3
= 2 = = 0, 059375
5 8
2
2
1
1
3
3 x 3 x5
3 1 1 1
Donde 2 = E X = x f ( x) dx = ( x 2 x 4 ) dx = = = = 0, 2
20
2 3 5 0 2 3 5 5
6.4
Moda.
Se define la moda, Mo, como aquel valor de la variable aleatoria donde la funcin de densidad o
distribucin de probabilidad alcanza su mximo (segn se trate de una variable aleatoria continua o
discreta)
f ( Mo) f ( x)
P [ X = Mo ] pi
202
x
i
La variable aleatoria puede tener una o varias modas segn se alcance el mximo en uno o ms
puntos.
F ( Me) = P [ X Me] =
1
2
De forma anloga, se definen los cuartiles Qi y los percentiles Pi como aquellos valores de la
variable aleatoria que verifican:
F (Qi ) = P [ X Qi ] =
F ( Pi ) = P [ X Pi ] =
i
4
i
100
(Estas definiciones valen para variables aleatorias continuas con funcin de distribucin continua.
En variables aleatorias discretas con funcin de distribucin escalonada, aunque el concepto es el
mismo, la forma de calcularlas vara).
Coeficiente de variacin.
Se define el coeficiente de variacin, CV, como
CV =
E[X ]
Coeficiente de asimetra.
A partir de los momentos se define el coeficiente de asimetra de Fisher
1 =
3
3
2 =
4
3
4
203
y si es ms apuntada
(leptocrtica) 2 > 0 .
EJEMPLO 6.5
Calcule la moda, mediana, percentil 75 y coeficiente de variacin de las distribuciones de
probabilidad de los ejemplos 6.2 y 6.3
Solucin:
Distribucin de probabilidad del ejemplo 6.2:
xi
pi
pi acumulados
0,125
1/8
0
0,500
3/8
1
0,875
3/8
2
1
1/8
3
Como puede observarse se trata de una distribucin de probabilidad bimodal, la distribucin de
probabilidad pi = P [ X = xi ] alcanza el mximo en dos puntos
Mo=1
y Mo=2
Para el clculo de la mediana y percentil 75 (tercer cuartil) procedemos de forma anloga a variables
estadsticas en Estadstica Descriptiva.
En el caso de la mediana, buscamos donde se alcanza o supera por primera vez la mitad de la
1
probabilidad total =0,5 , para xi = 1 la probabilidad acumulada es igual a 0,5 por lo tanto se
2
Me=
xi + xi 1 1+2
=
= 1,5
2
2
En el caso del percentil 75, buscamos donde se alcanza o supera por primera vez el 75% de la
probabilidad total (0,75), para xi = 2 la probabilidad acumulada es 0,875>0,75 por lo tanto
P75 = 2
Para calcular el coeficiente de variacin utilizamos los valores de la media y varianza calculados en
el ejemplo 6.4
CV =
204
E[X ]
0,75
= 0,577
1,5
3 3x 2 3
f ( x) =
= (1 x 2 )
2
2
0
, 0 x 1
,1< x
Como puede observarse en la grfica de la funcin de densidad, sta alcanzza su mximo en Mo=0.
Para obtener la mediana y el percentil
p
75 utilizaremos la funcin de distribuucin
F ( Me) = P [ X Me] =
3x x3
F ( x) =
2
1
1
2
F ( P75 ) = P [ X P75 ] = 0, 75
,x<0
, 0 x 1
,1< x
3x x3 1
=
0 = x 3 3x + 1 x 0,34733
2
2
3x x3
3
0 75 =
0 = 2 x3 6 x + 3 x 0,5557875
= 0,
2
4
(Las anteriores ecuaciones noo son fciles de resolver a mano, se han reesuelto con la ayuda del
ordenador).
Para calcular el coeficiente dee variacin utilizamos los valores de la mediaa y varianza calculados en
el ejemplo 6.4
CV
V=
E[X ]
0, 059375 0, 24367
=
= 0, 6498
0,375
0,375
205
6.5
( X ,Y )
( X (i ), Y (i ) )
( X ,Y )
pij 0 i, j
ij
=1
(Esta definicin es vlida cuando ambas variables son discretas, sin embargo cuando las variables
aleatorias son continuas la distribucin de probabilidad bidimensional est caracterizada por la
funcin de densidad bidimensional como se ver ms adelante).
EJEMPLO 6.6
Veamos un sencillo ejemplo de variable aleatoria bidimensional discreta.
X=nmero de cruces en tres lanzamientos de una moneda.
Y=nmero de caras en los dos primeros lanzamientos de la moneda.
206
C=cara,
+=cruz.
( X ,Y )
aplicacin:
( X ,Y )
CCC
+CC
C+C
CC+
++C
+C+
C++
+++
( X (CCC ), Y (CCC ) ) = ( 0, 2 )
( X (+CC ), Y (+CC ) ) = (1,1)
(1,1)
(1,2)
(2,0)
(2,1)
(2,1)
(3,0)
1
. Dado que son independientes los
2
resultados de los tres lanzamientos de la moneda, la probabilidad de cada uno de los sucesos
1 1
elementales de es = .
2 8
P ( CCC ) = P ( C C C ) = P ( C ) P ( C ) P ( C ) =
111 1
=
222 8
1 1
P ( + + + ) = P ( + )P ( + )P ( + ) = =
2 8
p02 = P [ X = 0, Y = 2] = P ( CCC ) =
1
8
1 1 2 1
p11 = P [ X = 1, Y = 1] = P ( +CC ) * ( C + C ) = + = =
8 8 8 4
1
p12 = P [ X = 1, Y = 2] = P ( CC + ) =
8
1
p20 = P [ X = 2, Y = 0] = P ( + + C ) =
8
1 1 2 1
p21 = P [ X = 2, Y = 1] = P ( C + + ) * ( +C + ) = + = =
8 8 8 4
1
p30 = P [ X = 3, Y = 0] = P ( + + + ) =
8
Las anteriores probabilidades se suelen recoger en una tabla de doble entrada (como las variables
207
Y
0
ij
8
8
8
8
= 1.
i =0 j = 0
( x, y ) 2
Si las variables aleatorias son discretas la funcin de distribucin es escalonada (discontinua). Si las
variables aleatorias son continuas la siguiente derivada de la funcin de distribucin conjunta es la
= f ( x, y )
Toda funcin de densidad bidimensional cumple las siguientes propiedades que la caracterizan:
f ( x, y ) 0
+ +
( x, y ) 2
f ( x, y ) dx dy = 1
208
f (u , v) du dv
EJEMPLO 6.7
Sea la variable aleatoria bidimensional de tipo continuo con funcin de distribucin conjunta
3xy 2 x3 y 2
F ( x, y ) =
2
, 0 x 1 0 y 1
,
en otro caso
Calcule la funcin de densidad conjunta y compruebe que cumple las dos propiedades que
caracterizan a toda funcin de densidad.
Solucin:
Derivamos primero respecto de x
3 y 2 3x 2 y 2
F ( x, y )
=
2
x
, 0 x 1 0 y 1
,
en otro caso
6 y 6 x2 y
2 F ( x, y )
= 3(1 x 2 ) y
f ( x, y ) =
=
2
x y
, 0 x 1 0 y 1
,
en otro caso
( x, y ) 2
f ( x, y ) 0
0 x 1 0 (1 x 2 )
2
0 (1 x ) y
0 y 1 0 y
+ +
f ( x, y ) dx dy = 1
1
1
y2
x3
1
1
3
y
1
x
dx
dy
=
3
y
x
dy
=
3
y
1
dy
=
2
y
dy
=
2
(
)
2 = 22 =1
0 0
0 3
0 3
0
0
0
1 1
209
f1 ( x) = f X ( x) =
f ( x, y ) dy
f 2 ( y ) = fY ( y ) =
f ( x, y ) dx
EJEMPLO 6.8
Calcule las distribuciones de probabilidad marginales para las distribuciones de probabilidad
bidimensionales de los ejemplos 6.6 y 6.7.
Solucin:
Distribucin de probabilidad bidimensional del ejemplo 6.6:
Sumando en los mrgenes de la tabla de la distribucin de probabilidad bidimensional (de forma
anloga a como se hizo en Estadstica Descriptiva) se obtienen la distribucin de probabilidad
marginal de X ( pi ) y la distribucin de probabilidad marginal de Y ( p j ).
Como puede comprobarse, la distribucin de probabilidad marginal de X coincide con la
distribucin de probabilidad unidimensional de X=nmero de cruces en tres lanzamientos de una
moneda que se obtuvo en el ejemplo 6.1
pi
p j
8
8
8
8
8
8
8
8
8
6 y 6 x2 y
= 3(1 x 2 ) y
f ( x, y ) =
2
210
, 0 x 1 0 y 1
,
en otro caso
y2
3
f1 ( x) = f ( x, y ) dy = 3 (1 x ) y dy = 3 (1 x ) = (1 x 2 )
2 0 2
0
f1 ( x) = 0
en otro caso
1
si 0 x 1
x3
1
f 2 ( y ) = f ( x, y ) dx = 3 (1 x ) y dx = 3 y x = 3 y 1 = 2 y
3 0
3
0
f2 ( y) = 0
en otro caso
1
si 0 y 1
xi , y j
o lo que es lo mismo
pij = pi p j
i, j
i, j )
x, y
EJEMPLO 6.9
Estudiar la independencia de las variables aleatorias de los ejemplos 6.6 y 6.7
211
Solucin:
Distribucin de probabilidad bidimensional del ejemplo 6.6:
0
pi
p j
8
8
8
8
8
8
1
8
12 1
= , luego no se cumple la condicin
Como puede comprobarse fcilmente, p00 = 0 p0 p0 =
8 8 32
de independencia, pij = pi p j
dependientes.
Distribucin de probabilidad bidimensional del ejemplo 6.7:
6 y 6x2 y
= 3(1 x 2 ) y
f ( x, y ) =
2
f1 ( x) =
3
(1 x 2 )
2
0
, 0 x 1 0 y 1
, en otro caso
f2 ( y) =
, 0 x 1
, en otro caso
2y
0
, 0 y 1
, en otro caso
E [ X ] = xi pi
i =1
Variables continuas:
212
E[X ] =
x f ( x ) dx
1
Media (marginal) de Y:
Variables discretas:
E [Y ] = y j p j
j =1
Variables continuas:
E [Y ] =
y f ( y ) dy
2
Propiedades:
E [ X + Y ] = E [ X ] + E [Y ]
Esta propiedad es igualmente vlida si la suma se refiere a ms de dos variables aleatorias.
Varianza (marginal) de X:
Variables discretas:
Var [ X ] = 2 [ X ] = x2 = ( xi E [ X ]) pi = E X 2 E [ X ]
2
i =1
Variables continuas:
Var [ X ] =
[X ] =
2
x
( x E [ X ]) f ( x ) dx = E X
2
E [ X ]
Varianza (marginal) de Y:
Variables discretas:
Var [Y ] = 2 [Y ] = y2 = ( y j E [Y ]) p j = E Y 2 E [Y ]
2
j =1
Variables continuas:
Var [Y ] = 2 [Y ] = y2 =
( y E [Y ])
f 2 ( y ) dy = E Y 2 E [Y ]
Propiedades:
Var [ X + Y ] = Var [ X ] + Var [Y ] + 2Cov [ X , Y ]
Var [ X Y ] = Var [ X ] + Var [Y ] 2Cov [ X , Y ]
Cov [ X , Y ] = [ X , Y ] = xy = E ( X E [ X ]) (Y E [Y ]) = ( xi E [ X ]) ( y j E [Y ]) pij
i =1 j =1
Variables continuas:
Cov [ X , Y ] = [ X , Y ] = xy = E ( X E [ X ]) (Y E [Y ]) =
( x E [ X ]) ( y E [Y ]) f ( x, y ) dx dy
Propiedades:
Cov [ X , Y ] = E [ XY ] E [ X ] E [Y ] .
213
Si X e Y son independientes E [ XY ] = E [ X ] E [Y ]
Demostracin: (se hace para variables continuas, de forma anloga se hara para variables
discretas)
E [ XY ] =
xy f ( x, y ) dx dy = xy f ( x) f ( y) dx dy = y f ( y) x f ( x) dx dy =
1
y f 2 ( y ) E [ X ] dy = E [ X ] y f 2 ( y ) dy = E [ X ] E [Y ]
Cov [ X , Y ] = 0
6.6
Ejercicios resueltos.
0< x<6
en otro caso
Obtenga:
a) k.
b) Duracin media de las llamadas.
c) Probabilidad de que una llamada supere los 2 minutos de duracin.
Solucin:
6
x3
2
a) 1 = f ( x ) dx = k (4 + x )(6 x ) dx = k (24 + 2 x x )dx = k 24 x + x =
0
0
3 0
1
= k [144 + 36 72] = k 108
k=
108
b) E [ X ] = x f ( x ) dx =
1
1 6
1 x2
x3 x 4
2
3
x
(4 + x )(6 x ) dx =
(24 x + 2 x x )dx =
24 + 2 =
108
108 0
108 2
3 4 0
1
252 7
= = 2,3
[ 432 + 144 324] =
108
108 3
c) P [ X > 2] =
214
1
1 6
1
x3
2
2
f ( x ) dx =
(4 + x )(6 x ) dx =
(24
2
x
x
)
dx
24
x
x
+
=
+
=
2 108
108 2
108
3 2
6
1
8
1
148
1 176
(108) 48 + 4 = 108 = = 0,5432
108
3 108
3 108 3
2. Sea X el nmero de llantas defectuosas en un lote de cuatro llantas modeladas al mismo tiempo. La
funcin de distribucin de probabilidad viene dada por
xi
0,8
0,9
0,95
F ( xi )
a) Obtenga el valor esperado y la varianza de X.
0,98
b) Cada una de las llantas defectuosas representa una prdida de 120, estime el coste esperado
y la desviacin tpica de las prdidas.
Solucin:
A partir de la funcin de distribucin F ( xi ) = P [ X xi ] obtenemos la distribucin de probabilidad
pi = P [ X = xi ] = F ( xi ) F ( xi 1 )
y a partir de sta responderemos ambos apartados.
xi
pi
xi pi
xi2 pi
0
1
2
3
4
0,8
0,1
0,05
0,03
0,02
1
0
0,1
0,1
0,09
0,08
0,37
0
0,1
0,2
0,27
0,32
0,89
E [ X ] = xi pi = 0, 37
a)
i =1
b) Y=prdidas=120X
[Y ] = 10844, 64 = 104,1376
P [ X = 2] =
1
3
P [ X = 1] =
1
6
P [ X = 3] =
1
2
Se pide:
a) El valor esperado de la variable Y=2X+5.
b) La varianza de la variable Y=2X+5.
215
Solucin:
a)
1 1 1 2 1 3 4 + 1 + 9
E [ X ] = xi P [ X = xi ] = 2 + 1 + 3 =
+ + =
=1
3 6 2 3 6 2
6
E [Y ] = 2 E [ X ] + 5 = ( 2 1) + 5 = 7
1 1 1 8 + 1 + 27 36
b) E X 2 = xi2 P [ X = xi ] = 4 + 1 + 9 =
=
=6
6
6
3 6 2
i
2 [ X ] = E X 2 E 2 [ X ] = 6 12 = 5
2 [Y ] = 22 2 [ X ] = 4 5 = 20
4. Dada la siguiente funcin de distribucin:
0
1
8
1
F ( x) =
2
7
8
x<0
0 x <1
1 x < 2
2 x<3
3 x
P [ 0 X 1]
P [1 < X 2]
P [ 2 < X < 4] .
c) Calcule la varianza.
d) Calcule la mediana.
e) Calcule la moda.
Solucin:
a) Es una funcin de distribucin escalonada que corresponde a una variable aleatoria discreta
donde P [ X = xi ] es igual a los saltos de dicha funcin en cada escaln.
216
xi
F ( xi )
pi = P [ X = xi ]
1
8
1
8
4 1 3
=
8 8 8
7 4 3
=
8 8 8
7 1
1 =
8 8
1 4
=
2 8
7
8
1
2
b) P [ 0 X 1] = P [ X = 0] + P [ X = 1] =
c)
P [1 < X 2] = P [ X = 2] =
3
= 0,375
8
P [ 2 < X < 4] = P [ X = 3] =
1
= 0,125
8
E [ X ] = xi pi =
i
xi2 pi
3
8
6
8
3
8
12
8
3
8
12
8
9
8
24
8
4 1
= = 0,5
8 2
12 3
= = 1, 5
8 2
E X 2 = xi2 pi =
i
xi pi
24
=3
8
2 [ X ] = E X 2 E 2 [ X ] = 3 = 3 = = 0, 75
4 4
2
d) Buscamos
Me =
1
1
en las probabilidades acumuladas F ( xi ) . Encontramos que F (1) = . Por tanto
2
2
1+ 2
= 1,5 .
2
0< x<2
resto
a) k.
b) P [1 < X < 4] .
c) El valor M tal que P [ X < M ] =
1
.
2
d) La media.
217
e) La varianza.
Solucin:
a) 1 =
f ( x) dx = k ( 5 2 x ) dx = k 5 x x 2 = k 6 k =
0
1
= 0,1667
6
2
1
1
1
2 1
( 5 2 x ) dx = 5 x x 2 1 = ( 6 4 ) = = = 0,3333
6
6
6
6 3
b) P [1 < X < 4] = f ( x) dx =
M
M
1
1
1
1
c) = P [ X < M ] = f ( x) dx = ( 5 2 x ) dx = 5 x x 2 = ( 5M M 2 )
0
2
6
6
6
1 1
5 25 12 5 3, 606
= ( 5M M 2 ) M 2 5M + 3 = 0 M =
=
2 6
2
2
M = 0, 697
P[ X < M ] = 1
2
2
1
1
1 x2
x3
2
d) E [ X ] = x f ( x) dx = x ( 5 2 x ) dx = ( 5 x 2 x ) dx = 5 2 =
6
60
6 2
3 0
1
16 1 14 14 7
10
=
= = = 0, 7778
6
3 6 3 18 9
2
8 7
23
e) Var [ X ] = E X E [ X ] = =
= 0, 284
9 9
81
2
2
1
1
1 x3
x4
E X = x f ( x) dx = x ( 5 2 x ) dx = ( 5 x 2 2 x3 ) dx = 5 2 =
6
60
6 3
4 0
0
2
1 40 16 8
8 =
= = 0,8889
6 3
18 9
f ( x) =
k x
0
x 1
1< x 2
2< x3
3< x
Calcule:
a) El valor de k.
b) P [ 0 < X < 2] .
c) El tercer cuartil.
d) E[X].
218
Solucin:
a) 1 =
x2
x2
f ( x) dx = ( x 1) dx + ( k x ) dx = x + kx =
1
2
2 2
2
1
2
9
1
5
1
= ( 2 2 ) 1 + 3k ( 2k 2 ) = + k = 1 k = 1 + 2 = 3
2
2
2
2
1
b) P [ 0 < X < 2] = 0 dx +
0
c) Por el apartado b)
x2
1 1
x
1
dx
=
( )
2 x = ( 2 2 ) 2 1 = 2
P [ X < 2] =
1
2
intervalo (2,3].
Q
3
2
Q3
Q32
3
1
1
x2
0, 75 = = P[ X < Q3 ] = ( x 1) dx + ( 3 x ) dx = + 3x = + 3Q3
( 6 2 )
1
2
4
2
2 2
2
2
3 1 1
Q2
= = 3Q3 3 4 1 = 12Q3 2Q32 16 2Q32 12Q3 + 17 = 0
4 2 4
2
Q3 =
12 144 136 12 8
=
4
4
Q3 =
12 + 8
= 3, 707 > 3
4
Q3 =
12 8
= 2, 293
4
es la solucin correcta.
d) E [ X ] =
x f ( x ) dx = x ( x 1) dx + x ( 3 x ) dx =
1
(x
x ) dx + ( 3 x x 2 ) dx =
3
x 3 x 2 3 x 2 x3 8 4 1 1 27 27 12 8 5 7
= +
= + = + = 2
3 2 3 2 3 2 2
3 2 3 6 6
3 2 1 2
7. En el presupuesto familiar, la parte que se dedica a la compra de productos alimenticios sigue una
distribucin con funcin de densidad f ( x) = 6 x(1 x)
Solucin:
X=proporcin del presupuesto dedicada a productos alimenticios.
a) P[ X > 0, 5] =
0,5
x2 x3
f ( x) dx = 6 x (1 x ) dx = 6 ( x x ) dx = 6 =
0,5
0,5
2 3 0,5
1
219
1 1 0,52 0,53
= 6
= 0,5
2
3
2
3
x3 x 4
=
=
=
E
[
X
]
x
f
(
x
)
dx
x
6
x
1
x
dx
6
x
x
dx
6
b)
)
3 4 =
0 ( )
0 (
1
1 1
= 6 = 6 = 0,50 50%
12
3 4
8. La demanda mensual de un artculo, en miles de unidades, viene dada por:
1 kx 0 x 2
f ( x) =
en el resto
0
Calcule:
a) La probabilidad de que en un mes la demanda sea inferior a 3500 unidades.
b) La probabilidad de que en un mes se demande ms de 635 y menos de 1870 unidades.
c) El nmero medio de artculos que esperamos que se demanden el mes prximo.
Solucin:
1=
x2
f ( x) dx = (1 kx ) dx = x k = 2 2k
0
2 0
a) P[ X < 3,5] =
3,5
1 = 2k
1
=k
2
f ( x) dx = (1 kx ) dx = 1
0
1,87
0,635
1,87
x2
x
f ( x) dx = 1 dx = x
=
0,635
4 0,635
2
1,87
1,87 2
0, 6352
= 1,87
0, 635
= 0, 46158
4
4
c) E [ X ] = x f ( x) dx =
2
x 2 x3
x2
4 8 2
x
x 1 dx = x dx = = = = 0, 6667
0
2
2
2 6 0 2 6 3
10 x
f ( x) =
25
0
220
0 x<5
5 x 10
en el resto
10
f ( x) dx = kx dx +
10
x2
10 x
1
x2
dx = k + 10 x =
25
2 5
2 0 25
=k
25 1
100
25 25k 1 25 25k + 1
+ 100
+
50 =
=
2 25
2
2
2 25 2
2
1=
25k + 1
2
2 1 = 25k
b) E [ X ] = x f ( x) dx = x
1
=k
25
10 10 x
1
1 5
1 10
x dx + x
dx = x 2 dx + (10 x x 2 ) dx =
5
25
25
25 0
25 5
10
1 x3
1 10 x 2 x 3
1 125 1 1000 1000 250 125
=
+
=
+
25 3 0 25 2
3 5 25 3 25 2
3 2
3
5 1 1000 500 5 10
= +
= + =5
3 25 6
6 3 3
6
c) P [3 < X < 6] = f ( x) dx =
1 25 9 1
36
25 1
1 9 1 16 9 1
+ 60 50 = 8 +
= + = = 0,5
25 2 2 25
2
2 25
25 2 25 2 2 2
10
d) P [ X > 8] = f ( x) dx =
6 10 x
1
1 x2
1
x2
x dx +
dx = + 10 x =
5
25
25
25 2 3 25
2 5
10
10 x
1
x2
dx = 10 x =
25
25
2 8
1
100
64 1 100 96 1
= 2 = 0, 08
100
80 =
25
2
2 25 2
2 25
e) 0,90 = P [ X < m ] =
f ( x) dx =
m 10 x
1
1 x2
1
x2
x dx +
dx = + 10 x =
5
25
25
25 2 0 25
2 5
1 25 1
m2
25 1 1
m 2 1 75
=
+ 10m
=
50 = + 10m
25 2 25
2
2 2 25
2 25 2
221
0,90 =
1
m2
2
10
m
1 1,90 25 2 = 20m m
25
2
m=
m 2 20m + 95 = 0
20 400 380 20 20
=
2
2
m=
20 + 20
= 12, 236 > 10
2
m=
20 20
= 7, 7639
2
es la solucin correcta.
Con un mnimo de 7764 unidades podremos atender la demanda mensual con una
probabilidad mayor al 90%.
10. La longitud en centmetros de un tornillo fabricado por una mquina se distribuye segn una variable
aleatoria con funcin de densidad:
k ( x 1)(4 x ) 1 x 4
f ( x) =
en el resto
0
El tornillo slo es vlido si su longitud est comprendida entre 2 y 3 cm.
a) Cul es la probabilidad de que el tornillo sea til?
b) Calcule la longitud media de los tornillos fabricados por dicha mquina.
Solucin:
1 = f ( x) dx = k ( x 1)(4 x) dx = k ( 4 x x 2 4 + x ) dx = k ( 5 x x 2 4 ) dx =
x 2 x3
27
16 64
16 11
1 1
= k 5 4 x = k 5 16 5 4 = k
= k
6
2 3
2 3
6 6
2 3
1
1= k
a) P [ 2 < X < 3] =
27
6
6
= 0, 2222 = k
27
3
6 3
6 x 2 x3
2
f ( x) dx =
5
x
4
dx
=
5 4x =
(
)
27 2
27 2 3
2
6 9 27
4 8 6 9 4 13
= 0, 48148
5 12 5 8 =
=
27 2 3
2 3 27 6 6 27
b) E [ X ] = x f ( x) dx = x
6
6 4
5 x x 2 4 ) dx =
5 x 2 x3 4 x ) dx =
(
(
1
27
27
6 x3 x 4
x2
6 64
1 1
6 32 7
=
=
5
4
5 64 32 5 2 =
=
27 3 4
2 1 27 3
3 4
27 3 12
222
6 135 5
= = 2,5
27 12 2
11. La demanda diaria de un artculo sigue una ley de probabilidad dada por la funcin de densidad
1
1 x 0 x a
f ( x) = 2
0
en el resto
Solucin:
a) 1 =
1= a
1 x2
a2
1
f ( x) dx = 1 x dx = x
=a
0
2 2 0
4
2
a2
4
a 2 4a + 4 = 0
b) F ( x) = P [ X x ] =
a=
4 16 16
=2
2
f (u ) du
(Nota: se utiliza la variable u para la funcin de densidad porque se usa la variable x como
lmite de integracin, variable de la funcin de distribucin)
Para hallar la funcin de distribucin distinguimos si x<0, 0 x 2 o 2<x.
x<0,
0 x 2,
F ( x) = P [ X x ] =
2<x,
F ( x) = P [ X x ] = f (u) du = 0 du = 0
1 u2
x2
1
f (u ) du = 0 du + 1 u du = 0 + u
x
=
2 2 0
4
2
F ( x) = P [ X x ] =
0
2
x
1
f (u ) du = 0 du + 1 u du + 0 du = 0 + 1 + 0 = 1
0
2
c.1) P [ X 3] = F (3) = 1
c.2) P [ X = 1,5] = 0 , la probabilidad de todo valor aislado en una distribucin de probabilidad
continua es igual a cero.
223
1,87 2
0, 6352
c.3) P [ 0, 635 X 1,87 ] = F (1,87) F (0, 635) = 1,87
0,
635
= 0, 46158
4
4
Solucin:
1=
x2
9
9
f ( x) dx = k ( 3 x ) dx = k 3x = k 9 = k
0
2 0
2
2
a) E [ X ] = x f ( x) dx =
k=
2
9
3
2
2 3
2 x 2 x3
x ( 3 x ) dx = ( 3x x 2 ) dx = 3 =
9
9 0
9 2 3 0
2 27 27 2 27
=
=1
9 2
3 9 6
1
1
b) CV [ X ] =
= 2 =
= 0, 7071
E[X ]
1
2
[X ]
3
2
2 [ X ] = E X 2 E 2 [ X ] = 12 =
E X = x f ( x) dx =
0
2
2 3 2 3
2 x3 x 4
x ( 3 x ) dx = ( 3x x ) dx = 3 =
9
9 0
9 3 4 0
2
2
81 2 27 3
27 =
= = 1, 5
9
4 9 4 2
c) P [ X > 2] = f ( x) dx =
2
2
x2
2
9
1
( 3 x ) dx = 3x = 9 ( 6 2 ) = = 0,1111
9
9
2 2 9
2
9
d) 0, 20 = P [ X > a ] = f ( x) dx =
224
1
2
2
2
x2
2
9
a2
3
x
dx
3
x
9
3
a
( )
9
9
2 a 9
2
2
2 9
a2
9 9
a2
3
a
+
0,
20
3
a
+
9 2
2
2 2
2
1,8 = 9 6a + a 2
a 2 6a + 7, 2 = 0
a=
6 + 36 28,8
= 4,34 , no vale pues X slo toma valores entre 0 y 3.
2
a=
6 36 28,8
= 1, 66 es el valor de la variable superado por un 20% de las
2
observaciones.
13. Una variable aleatoria de tipo continuo tiene por funcin de densidad:
kx
f ( x) =
0
0 x2
en el resto
Se pide:
a) El valor de k.
b) La funcin de distribucin.
c) La mediana.
d) La probabilidad de que la variable sea mayor que 1.
e) La media.
f) La varianza.
Solucin:
a) 1 =
x2
f ( x ) dx = kx dx = k = k 2
0
2 0
2
k=
1
2
x<0,
c)
F ( x) = P [ X x ] = f (u) du = 0 du = 0
0 x 2,
F ( x) = P[ X x] =
2<x,
F ( x) = P[ X x] =
1
Me 2
= P [ X Me ] = F ( Me) =
2
4
f (u ) du = 0 du +
f (u ) du = 0 du +
2 = Me 2
1
1 u2
x2
u du = 0 + =
2
2 2 0 4
x
1
u du + 0 du = 0 + 1 + 0 = 1
2
2
Me = + 2
(Nota: la raz cuadrada con signo negativo no es solucin pues la variable slo toma valores
entre 0 y 2)
Este apartado se podra haber resuelto tambin con la funcin de densidad:
225
Me
Me 1
1
= f ( x )dx =
x dx = ...
0 2
2
d) P [ X > 1] = 1 P [ X 1] = 1 F (1) = 1
1 3
= = 0,75
4 4
P [ X > 1] = f ( x )dx =
1
1
x dx = ...
2
2
1 2 2
1 x3
18 4
= = 1,3333
e) E [ X ] = x f ( x )dx = x dx = =
0
2
2 3 0 2 3 3
f)
1 2
1 x4
1
E X = x f ( x )dx = x 3dx = = 4 = 2
2 0
2 4 0 2
2
4
16 2
[ X ] = E X 2 E 2 [ X ] = 2 = 2 = = 0, 2222
9 9
3
2
14. El precio de un determinado artculo flucta, segn sus caractersticas, pudiendo llegar a costar dos
mil euros la unidad. Sea X la variable aleatoria que representa el precio por unidad, en miles de
euros. Supongamos que la funcin de distribucin de la variable X viene dada por
0
2
4x x
F ( x) =
4
1
x<0
0x<2
2 x
Se pide:
a) La probabilidad de que una unidad cueste ms de 1500 euros.
b) El tanto por ciento de unidades que tienen su precio comprendido entre 500 y 1000 euros.
c) Qu precio tienen el 25% de las unidades ms caras? (Nota: tercer cuartil)
d) El precio medio.
e) La varianza de los precios.
Solucin:
a) P [ X > 1,5] = 1 P [ X 1,5] = 1 F (1, 5) = 1
( 4 1, 5) 1, 52
4
= 0, 0625
=
=
= 0, 3125
4
4
4
4
4
2
226
c) 0, 75 = P [ X Q3 ] = F ( Q3 ) =
Q3 =
( 4 Q3 ) Q32
4
4 16 12 4 2
=
=3 y1
2
2
4 0, 75 = 4Q3 Q32
0 = Q3 4Q3 + 3
P [ X 3] = F (3) = 1 0,75
Luego la solucin vlida es 1 (Las unidades ms caras tienen un precio por encima de
1000).
d) En primer lugar obtenemos la funcin de densidad derivando la funcin de distribucin:
4 2x 2 x
=
2
f ( x) = F '( x) = 4
E [ X ] = x f ( x)dx =
2 x
1 2
1
x3
1 8 1 4 2
x
dx = ( 2 x x 2 )dx = x 2 = 4 =
= = 0, 6667
0
2
2
2
3 0 2 3 2 3 3
2
e) E X = x f ( x)dx =
0
2
0 x<2
2 x
1 2
1 x3 x4
x
dx = ( 2 x 2 x3 )dx = 2 =
2
2 0
2 3 4 0
2
1 16 16 1 16 2
=
= = 0, 6667
2 3 4 2 12 3
2
2 2
2 4 2
[ X ] = E X E [ X ] = = = = 0, 2222
3 3
3 9 9
2
x3 9
F ( x) = + x
17 34
1
x<0
0 x2
2< x
Solucin:
a)
3x 2 9 6 x 2 + 9
+
=
34
f ( x) = F '( x) = 17 34
b) E [ X ] = x f ( x)dx =
0 x2
x < 0 o 2 < x (en otro caso)
2
6 x2 + 9
1 2
1 x4
x2
3
x
dx = ( 6 x + 9 x )dx = 6 + 9 =
34
34 0
34 4
2 0
227
1
42 21
[ 24 + 18] = = = 1, 2353
34
34 17
c) Para la moda buscamos el mximo valor que toma la funcin de densidad. ste se encuentra
entre los mximos relativos dentro del intervalo (0,2) y los valores de la funcin de densidad
en los extremos de dicho intervalo.
Mximos relativos:
f '( x) = 0 =
12 x
34
f (0) =
9
34
Por tanto,
f (2) =
24 + 9 33
=
34
34
Mo=2.
f ( x) = 2
0
1 x < 1
en el resto
Solucin:
a) Para hallar la funcin de distribucin distinguimos si x<-1, 1 x < 1 o 1 x .
x
F ( x) = P [ X x ] = f (u) du = 0 du = 0
x<-1,
1 x < 1 ,
F ( x) = P [ X x ] =
u +1
1 x
du = ( u + 1) du =
1 2
2 1
f (u ) du = 0 du +
1 x2 + 2 x + 1
1 u2
1 x 2
= + u = + x 1 =
2 2
4
1 2 2
2
1 x,
b)
x
u +1
du + 0 du = 0 + 1 + 0 = 1
1 2
1
f (u ) du = 0 du +
1
Me 2 + 2Me + 1
= P [ X Me] = F ( Me) =
0 = Me2 + 2Me 1
2
4
Me =
228
F ( x) = P [ X x ] =
2 4 + 4
= 4,8284
2
y 0,8284
4,8284 [1,1)
luego
Me=0,8284.
= = = 0,5
4
4
4
4
4 2
2
x +1
1 1
1 x3 x2
dx = ( x 2 + x )dx = + =
d) E [ X ] = x f ( x) dx = x
1
2
2 1
2 3 2 1
1 1 1 1 1 1 2 1
= = 0,3333
+ + =
2 3 2 3 2 2 3 3
17. La variable aleatoria X expresa los miles de artculos que mensualmente se solicitan a un proveedor.
Su funcin de densidad es:
kx( x + 1)
f ( x) =
0
0 x<2
en el resto
Se pide:
a) La constante k.
b) El nmero de artculos que el proveedor espera que le soliciten a lo largo de un ao.
c) La funcin de distribucin.
d) En un determinado mes, el proveedor slo dispone de 1200 artculos, cul es la
probabilidad de poder atender todas las peticiones que se produzcan en dicho mes?
Solucin:
a) 1 =
k=
x3 x 2
14
8
f ( x) dx = kx ( x + 1)dx = k ( x + x )dx = k + = k + 2 = k
0
0
3
3
3 2 0
2
3
14
E [ X ] = x f ( x) dx =
=
3
3 2
3 x 4 x3
x x ( x + 1)dx = ( x3 + x 2 )dx = + =
14
14 0
14 4 3 0
3 8 3 20 10
4+ =
=
= 1, 429
14 3 14 3
7
E [Y ] = 12 E [ X ] = 12
10 120
=
= 17,143
7
7
229
x<0,
F ( x) = P [ X x ] = f (u) du = 0 du = 0
0 x < 2,
F ( x) = P [ X x ] =
x 3
3
u ( u + 1) du =
( u 2 + u ) du =
0 14
0 14
f (u ) du = 0 du +
3 u3 u 2
3 x3 x 2 3 2 x 3 + 3x 2 2 x3 + 3 x 2
= + = + =
=
14 3 2 0 14 3 2 14
6
28
F ( x) = P [ X x ] =
2 x,
d) P [ X 1, 2]
x
3
u ( u + 1) du + 0 du = 0 + 1 + 0 = 1
0 14
2
f (u ) du = 0 du +
( 2 1, 2 ) + ( 3 1, 2 ) = 0, 2777
= F (1, 2) =
3
28
P [ X 1, 2] =
1,2
f ( x) dx =
1,2
3
x ( x + 1) dx = ...
14
18. La cantidad de pan, en cientos de unidades, vendida diariamente en la panadera de un pueblo puede
representarse mediante una variable aleatoria con la siguiente funcin de densidad:
0 x<4
kx
f ( x) = k (7 x)
4 x<7
en el resto
a) Calcule k.
b) Calcule la mediana.
c) Calcule la media.
Solucin:
a) 1 =
x2
x2
f ( x) dx = kx dx + k ( 7 x ) dx = k + k 7 x =
0
4
2 4
2 0
49
25
2
49
= k [8] + k 49 ( 28 8 ) = k 8 + 20 = k
k=
2
2
2
25
P [ X 4] =
f ( x) dx =
2
2 x2
2
1
x dx =
= 8 = 0, 64 >
25
25 2 0 25
2
230
Me
Me 2
1
2 x2
Me 2
= P [ X Me ] =
x dx =
=
0 25
2
25 2 0
25
25
= Me 2
2
25
= 3,5355
2
Me = +
La solucin negativa no vale puesto que la variable aleatoria X no toma valores negativos.
c) E [ X ] = x f ( x) dx = x
7
2
2
2
x dx + x ( 7 x ) dx =
4
25
25
25
( x dx + ( 7x x ) dx ) =
4
4
7
2 x 3 x 2 x 3 2 64 343 343
64 2 263 263
= + 7 = +
56 =
=
= 3,5067
25 3 0 2 3 4 25 3 2
3
3 25 6
75
19. Se sabe que la funcin de distribucin de la variable aleatoria X=horas de duracin de un tipo de
bombillas es:
0
F ( x) =
x
1 e 100
si x < 0
si x 0
Obtenga:
a) Funcin de densidad y compruebe sus propiedades.
b) Probabilidad de que una bombilla dure entre 100 y 200 horas.
c) Probabilidad de que una bombilla dure ms de 200 horas.
d) Media.
e) Varianza.
f) Moda.
g) Mediana.
h) Percentil 75.
i) Coeficiente de variacin.
Solucin:
a) Derivando la funcin de distribucin obtenemos la funcin de densidad:
F '( x) = f ( x ) = 1 x
e 100
100
si x < 0
si x 0
Comprobemos que f ( x ) cumple las dos propiedades que caracterizan a toda funcin de
densidad:
f ( x) 0
+
x
f ( x) dx = 1
231
x
x
1 100
f ( x) dx = 0 dx +
e
dx =0 + e 100 = e + e0 = 0 + 1 = 1
100
0
0
x
x
100
1 100
2
1
P [100 < X < 200] =
e
dx = e
= e + e = 0,135 + 0,368 = 0, 233
100
100
100
200
200
100
x
x
1 100
c) P [ 200 < X ] =
e
dx = e 100 = e + e2 = 0 + 0,135 = 0,135
100
200
200
+
200
2
100
P [ 200 < X ] = 1 P [ X 200] = 1 F (200) = 1 1 e
= e = 0,135
d) E [ X ] =
x f ( x ) dx =
u=x
x
1 100
x
x
e
dx =
1 100
100
e
dx
dv =
100
du = dx
v = e
100
+
x
x
x
x
0
0
0
= 0 (0 e0 ) (100 e ) (100 e0 ) =
= [ 0 (0 1) ] (100 0 ) (100 1) = 100
Hemos utilizado que:
e+ = +, e- =
1
= 0, e0 = 1,
lim xe
x +
x
100
= lim
x +
x
e
x
100
1
1
= lim
=
=0
x
x
+
1 100
e
100
2
2
2
e) [ X ] = E X E [ X ] = 20000 10000 = 10000
E X =
2
1
x
e
100
2
x
100
u = x2
x
dx =
1 100
dv
e
dx
=
100
du = 2 xdx
x
=
100
v = e
+
+
x
x
x
1 100
= x 2 e 100 2 x e 100 dx = 0 ( 0 e0 ) + ( 2 100 ) x
e
dx =
100
0
0
0
= 2 100 100 = 20000
232
e+ = +, e- =
lim x 2 e
x
100
x +
1
= 0, e0 = 1
= lim
x2
x +
x
1
100
2 x
= lim
=
= lim
x
x
+
x +
1 100
e
100
2
2
e
100
x
100
2
=0
f) Para hallar la moda enn distribuciones de probabilidad continuas haay que calcular el punto o
puntos donde la funcin de densidad alcanza su mximo.
f ( x) = 1 x
e 100
100
si x < 0
si x 0
f '( x) =
1 100
e
1002
si x > 0
F ( Me) = P [ X Me] =
0
F ( x) =
x
1 e 100
x
100
1
2
s x<0
si
ssi x 0
x
1
x
1
= e 100 ln =
1 e
2
100
2
x
0, 693 =
Me = 69,3
x = 69,3
100
1
=
2
h) F ( P75 ) = P [ X P75 ] = 0, 75
233
1 e
x
100
= 0, 75
1,386 =
0, 25 = e
x
100
ln ( 0, 25 ) =
x
100
x
P75 = 138,6
100
CV =
E[X ]
10000
=1
100
20. Una variable aleatoria bidimensional tiene la siguiente funcin de densidad conjunta:
2 xy
k x + 3 0 x 1 0 y 2
f ( x, y ) =
en el resto
0
Se pide:
a) El valor esperado de X.
b) El valor esperado de Y.
c) La varianza de X.
d) Son independientes X e Y?
e) La covarianza.
Solucin:
En primer lugar vamos a calcular el valor de la constante k y las funciones de distribucin
marginales de X e Y.
1=
y =2
y =0
Donde
f ( x, y ) dx dy =
y =0
y = 2 x =1
xy
2 xy
k
x
dx
dy
k x 2 + dx dy =
+
=
x=0
y
=
0
x
=
0
3
3
x =1
k y =2
k
y2
k
2+ y
=
+
=
+
= ( 4 + 2) = k
k
dy
2
y
dy
2
y
(
)
6 y =0
6
2 0 6
6
1= k
x3 y x 2
2 xy
1 y
2+ y
x=0 k x + 3 dx = k 3 + 3 2 = k 3 + 6 = k 6
0
x =1
234
y =2
f1 ( x) =
f1 ( x) =
xy
x y2
2
f ( x, y ) dy = x 2 + dy = x 2 y +
= 2 x2 + x
y =0
3
3 2 0
3
y =2
f ( x, y ) dy = 0 dy = 0
Si 0 y 2 ,
f2 ( y) =
Si y<0 o 2<y,
x3 y x 2 1 y 2 + y
2 xy
f ( x, y ) dx = x + dx = +
= + =
x =0
3
6
3 3 2 0 3 6
x =1
f ( x, y ) dx = 0 dx = 0
1
x4 2 x3
2 2
2 2
2 2
3
E [ X ] = x f1 ( x)dx = x 2 x + x dx = 2 x + x dx = 2 +
= + =
0
0
3
3
4 3 3 0 4 9
a)
26 13
= = 0, 7222
36 18
b) E [Y ] = y f 2 ( y )dy =
1 2
1 2 y3
1 8
2+ y
2
=
+
=
y
dx
2
y
y
dy
y + = 4 + =
(
)
6 0
6
3 0 6 3
6
20 10
= = 1,1111
18 9
c) 2 [ X ] = E X 2 ( E [ X ]) = E X 2 E 2 [ X ]
2
1
x5 2 x4
2
2
2 2 17
= + =
E X = x f1 ( x)dx = x 2 x 2 + x dx = 2 x 4 + x3 dx = 2 +
0
0
3
3
5 3 4 0 5 12 30
17 13
[ X ] = = 0, 04506
30 18
2
f1 ( x) f 2 ( y ) = 2 x 2 + x
x + = f ( x, y )
3 6
3
e) Si las variables fuesen independientes la covarianza es cero (no sera necesario ningn
clculo).
Cov [ X , Y ] = E [ XY ] ( E [ X ] E [Y ]) =
E [ XY ] =
xy f ( x, y ) dx dy =
y=2
y =0
43 13 10
= 0, 006173
54 18 9
y = 2 x =1
x2 y2
2 xy
3
xy
x
dx
dy
x
y
+
=
+
dx dy =
x=0
y=0 x=0
3
3
x =1
y y2
1 y2 1 y3
1 8 43
= + dy =
+
= +
=
= 0, 7963
y =0
4 9
4 2 9 3 0 2 27 54
y =2
x 4 y 2 x3
x2 y2
y y2
=
+
=
+
dx
y
Donde x3 y +
x=0
3
3 3 0 4 9
4
x =1
235
x+ y
f ( x, y ) = 3
0
0 x 1 0 < y < 2
en el resto
f1 ( x) =
Si 0 x 1 ,
Si x<0 o 1<x,
f ( x, y ) dy =
y =2
y =0
1
1
y2 1
2
( x + y ) dy = xy + = [ 2 x + 2] = ( x + 1)
3
3
2 0 3
3
f1 ( x) = f ( x, y ) dy = 0 dy = 0
f2 ( y) =
Si y<0 o 2<y,
f2 ( y) =
11
1
1 x2
f ( x, y ) dx =
x + y ) dx = + yx = + y
(
x =0 3
3 2
0 3 2
x =1
f ( x, y ) dx = 0 dx = 0
b)
2
1 1
x+ y
= f ( x, y )
( x + 1) + y
3
3 2
3
2
2 1
2 x3 x 2
E [ X ] = x f1 ( x) dx = x ( x + 1) dx = ( x 2 + x ) dx = + =
0
3
3 0
3 3
2 0
2 1 1 2 5 5
+
=
= = 0,5556
3 3 2 3 6 9
1
2
2 1
2 x4 x3
E X = x f1 ( x) dx = x ( x + 1) dx = ( x 3 + x 2 ) dx = + =
0
3
3 0
3 4
3 0
2
2 1 1 2 7
7
+ =
= = 0, 3889
3 4 3 3 12 18
2
7 5
7 25
[ X ] = E X 2 E 2 [ X ] = = = 0, 080247
18 9 18 81
2
236
22. Dada la variable aleatoria bidimensional (X, Y) con funcin de densidad conjunta
kxy 2
f ( x, y ) =
0
0 x<4
0< y<2
en el resto
a) Calcule k.
b) Son independientes las variables?
Solucin:
a)
y =2 x =4
y =2
y =2
x2
y3
8 64
1 = kxy dx dy = ky dy = ky 2 [8 0] dy = 8k = 8k 0 = k
3 3
2 0
3 0
y =0 x =0
y =0
y =0
k=
3
64
b)
2
3
3 y3
3 8 1
f1 ( x) = xy 2 dy =
x =
x 0 = x
64 3 0 64 3 8
0 64
2
f1 ( x) = 0
en otro caso
3
3 2 x2
3 2
3
f 2 ( y ) = xy 2 dx =
y =
y [8 0 ] = y 2
64 2 0 64
8
0 64
4
f2 ( y) = 0
f1 ( x) f 2 ( y ) =
0 x<4
0< y<2
en otro caso
3 2
xy = f ( x, y )
64
f1 ( x) f 2 ( y ) = 0 = f ( x, y )
f1 ( x) f 2 ( y ) = f ( x, y )
en otro caso
x, y Las variables son independientes.
237
pk = P [ X = xk ] =
1
n
k = 1, ..., n
1
para cada uno de los seis posibles valores.
6
xk
1
k =1
E [ X ] = xk pk = xk =
n
n
k =1
k =1
n
Varianza:
n
1
E X = x pk = x =
n
k =1
k =1
2
2
k
2
k
2
k
k =1
n
x
xk
k =1
Var [ X ] =
k =1
n
n
2
k
( )
1
X =
0
238
si ocurre A
si ocurre A
P [ X = 1] = p
P [ X = 0] = q = 1 p
La anterior distribucin de probabilidad se conoce como distribucin Binomial de parmetros 1 y
p. Se nota como X (1, p) , 1 es el nmero de veces que se observa o realiza el experimento y p
es la probabilidad de obtener xito.
Media:
1
E [ X ] = xk pk = ( 0 q ) + (1 p ) = p
k =0
Varianza:
1
E X 2 = xk2 pk = ( 02 q ) + (12 p ) = p
k =0
2 [ X ] = E X 2 E 2 [ X ] = p p 2 = p (1 p ) = pq
X = X 1 + X 2 + ... + X n
La variable aleatoria X puede tomar todos los valores enteros comprendidos entre 0 y n, ambos
inclusive, y representa el nmero de xitos que se obtienen en n pruebas o experimentos
idnticos e independientes.
A la distribucin de esta variable aleatoria se le llama distribucin Binomial de parmetros n y p.
Se nota X (n, p ) , n es el nmero de pruebas idnticas e independientes que se realizan u
observan y p la probabilidad de obtener xito en cada prueba.
Vamos a calcular la distribucin de probabilidad asociada a esta variable aleatoria X, es decir:
px = P [ X = x ]
x = 0, ..., n
X toma el valor x si por ejemplo se observa en las n realizaciones del experimento una secuencia de
xitos y fracasos como la que sigue:
AA
...
A
AA... A
x
n x
239
AA
...
A
AA... A = pp... p qq
...q = p x q n x
P
N
n x
x
n x
x
Adems, cualquier otra reordenacin de la anterior secuencia de resultados tiene tambin x xitos.
n
n!
Dado que el nmero total de distintas reordenaciones es =
, se sigue que
x x !( n x ) !
n
px = P [ X = x ] = p x q n x
x
x = 0, ..., n
Se puede comprobar que los valores px verifican las dos condiciones que toda distribucin de
probabilidad ha de cumplir:
px 0 x
n
=1
x =0
x
x p q = ( p + q)
x=0
x =0
n
Media:
E [ X ] = E [ X 1 + X 2 + ... + X n ] = E [ X 1 ] + E [ X 2 ] + ... + E [ X n ] = p + p + ... + p = np
Varianza:
Dado que X 1 , X 2 , ..., X n son independientes la varianza de la suma de dichas variables es igual a la
suma de las varianzas de cada variable
EJEMPLO 7.1
En un almacn hay 6000 piezas de las cuales 900 son defectuosas. Se seleccionan aleatoriamente
(con reemplazamiento) 10 piezas. Calcular la probabilidad de que todas estn en buen estado.
240
Solucin:
X = n de piezas defectuosas en las 10 seleccionadas (10,
p=
900
= 0,15
6000
900
)
6000
10
10!
P [ X = 0] = 0,150 0,8510 =
1 0,1969 = 0,1969
0!10!
0
O bien:
Y = n de piezas en buen estado de las 10 seleccionadas (10,
p=
5100
= 0,85
6000
5100
)
6000
10
10!
0,1969 1 = 0,1969
P [Y = 10] = 0,8510 0,150 =
10!0!
10
EJEMPLO 7.2
Un proceso de fabricacin produce un 1% de piezas defectuosas. Las piezas se empaquetan en cajas
de 20 unidades. Cul es la probabilidad de que si se seleccionan 5 cajas al azar, ninguna de ellas
tenga piezas defectuosas?
Solucin:
X=n de piezas defectuosas en una caja de 20 unidades (20,
1
)
100
20
20!
P [ X = 0] = 0, 010 0,9920 =
1 0,8179 = 0,8179
0!20!
0
px = P [ X = x ] =
e x
x!
x = 0, 1, 2, ...
241
Media:
E[X ] =
Varianza:
2 [X ] =
Propiedad de aditividad o reproductividad.
Sean X e Y dos variables aleatorias independientes con distribuciones de probabilidad X ( (1 )
e Y ( (2 ) . Entonces X + Y ( (1 + 2 ) .
EJEMPLO 7.3
El nmero de fallos por hora en un determinado mecanismo sigue una distribucin de Poisson de
media 1,5.
a) Cul es la probabilidad de que haya algn fallo durante una hora?
b) Cul es la probabilidad de que haya algn fallo durante tres horas?
Solucin:
a)
e 1,51, 50
P [ X 1 1] = 1 P [ X 1 < 1] = 1 P [ X 1 = 0] = 1
= 1 0, 2231 = 0, 7769
0!
b)
e 4,5 4, 50
= 1 0, 0111 = 0,9889
0!
aproximar por la distribucin de Poisson ( (np) para el clculo de las probabilidades asociadas.
Esta propiedad sirve para caracterizar a una gran cantidad de fenmenos que siguen una distribucin
de Poisson, son fenmenos con una pequea probabilidad de xito que son observados en un nmero
elevado de ocasiones.
242
EJEMPLO 7.4
La probabilidad de que aparezca una pieza defectuosa en un proceso es 0,0001. La produccin de
un ao es de 36000 piezas. Calcular la probabilidad de que en la produccin anual el nmero de
piezas defectuosas sea por lo menos dos.
Solucin:
X = nmero de piezas defectuosas en la produccin anual
X (36000 , 0, 0001) ( ( 36000 0, 0001) = ( ( 3, 6 )
P [ X 2] = 1 P [ X < 2] = 1 P [ X = 0] P [ X = 1] = 1
= 0,874323663
0, 0001 0,9999
0, 0001 0, 9999
0
1
Pero es ms complicado e incluso a veces imposible realizar los clculos debido a la magnitud de n
y p.
Muestreo sin reemplazamiento: los individuos extrados se dejan fuera de la poblacin con lo
que la composicin de la poblacin va cambiando con cada extraccin (es equivalente extraer
de uno en uno o en conjunto). Para calcular la probabilidad de que cierto nmero de
individuos de la muestra presentan la caracterstica xito se utiliza la distribucin
Hipergeomtrica que vamos a estudiar a continuacin.
Sea una poblacin finita con N individuos de los cuales Np individuos presentan la caracterstica
xito y N(1-p)=Nq individuos no la presentan. La probabilidad de obtener xito en la primera
243
extraccin es
Np
= p y la de no obtenerlo (u obtener fracaso) es q. En las sucesivas extracciones
N
( N , n, p ) ,
cuyas
x n x
px = P [ X = x ] =
N
n
La variable aleatoria X puede tomar todos los valores enteros comprendidos entre max{0, n-Nq} y
min{n, Np}.
Cuando N es infinito (en la prctica un valor muy elevado) las distribuciones Hipergeomtrica y
Binomial coinciden.
Media:
E [ X ] = np
Varianza:
2 [X ] =
N n
npq
N 1
EJEMPLO 7.5
Una urna contiene 15 bolas blancas y 5 bolas negras. Se extraen 5 bolas, cul es la probabilidad de
que 2 sean negras?
a) Se extraen las bolas una a una, se observa el color y se devuelven a la urna antes de la
siguiente extraccin.
b) Se extraen las 5 bolas de una vez.
Solucin:
X = nmero de bolas negras entre las 5 extradas
a) n = 5
p=
5
20
X (5 ,
5
) = (5 , 0, 25)
20
5
3
P [ X = 2 ] = 0, 252 (1 0, 25 ) = 0, 26367
2
244
b) N = 20
n=5
p=
Np = 20 0, 25 = 5
5
= 0, 25
20
X
(20, 5, 0, 25)
Nq = 20 (1 0, 25) = 15
5 15
2 3
P [ X = 2] = = 0, 29347
20
5
EJEMPLO 7.6
Si jugamos una combinacin de la lotera primitiva. Cul es la probabilidad de que acertemos 4
nmeros o ms?
Solucin:
En el sorteo de la lotera primitiva las extracciones se hacen sin reemplazamiento.
X = nmero de bolas extradas iguales a alguno de nuestros 6 nmeros.
N = 49
Np = 49
n=6
6
=6
49
p=
6
49
X
(49, 6,
6
)
49
Nq = N (1 p) = N Np = 49 6 = 43
6 43 6 43 6 43
4 2
5 1
6 0
P [ X 4] = P [ X = 4] +P [ X = 5] + P [ X = 6] = + + =
49
49
49
6
6
6
= 0,00096862+0,00001845+0,000000071 = 0, 000987141
x = 0, 1, 2, ...
245
px = P [ X = x ] = P N
A... A A = P A ...P A P [ A] = qN
...q p = q x p
x
x
Dado que p y q son positivos lo sern las probabilidades px = P [ X = x ] . Y la suma de todas ellas es
1:
P [ X = 0] +P [ X = 1] + P [ X = 2] + ... + P [ X = x ] + ... =
= p + pq + pq 2 + ... + pq x + ... = p(1 + q + q 2 + ...) = p
1
1
= p =1
1 q
p
Donde se ha utilizado que la suma de una progresin geomtrica de razn r<1 es igual a
a1
( a1
1 r
E[X ] =
1 p q
=
p
p
Varianza:
2 [X ] =
1 p q
= 2
p2
p
EJEMPLO 7.7
En una Facultad suelen aprobar el 70% de los alumnos. Hallar la probabilidad de que un alumno
apruebe en alguna de las 6 convocatorias de examen que dispone.
Solucin:
X=nmero de suspensos antes de aprobar sigue una distribucin Geomtrica de parmetro p=0,70.
p=0,70
q=1-0,70=0,30
P [ X 5] = P [ X = 0] +P [ X = 1] + P [ X = 2] + P [ X = 3] +P [ X = 4] + P [ X = 5] =
= (0, 30 0, 7) + (0, 3 0, 7) + (0,32 0, 7) + (0, 33 0, 7) + (0,34 0, 7) + (0, 35 0, 7) =
= 0, 7 + 0, 21 + 0, 063 + 0, 0189 + 0, 00567 + 0, 001701 = 0,999271
246
7.6
Ejercicios resueltos.
1. Una ciudad est dividida en dos barrios (A y B). El nmero de apagones que se producen en el
barrio A sigue una distribucin de Poisson con media dos apagones por mes. Siendo en el barrio B
la media de un apagn por mes. Calcule la probabilidad de que en un mes:
a) Haya algn apagn en el barrio A.
b) Hayan, a lo sumo, dos apagones en la ciudad.
Solucin:
e 2 2 0
= 1 e 2 = 1 0,1353 = 0,8647
0!
b) P [ Z 2] = P [ Z = 0] + P [ Z = 1] + P [ Z = 2] =
e 3 30 e 3 31 e 3 32
+
+
=
0!
1!
2!
2. Una compaa de seguros tiene contratadas anualmente 10000 plizas contra incendios:
a) Sabiendo que hay un probabilidad 1/5000 de que se produzca un incendio en una vivienda,
calcule la probabilidad de que tenga que pagar a alguno de sus asegurados.
b) Cuntos incendios, por trmino medio, hay que atender en un ao?
c) La compaa, en una campaa de publicidad, decide cobrar slo la mitad a 1000 de sus
asegurados. En un edificio en el que 20 de las viviendas tienen contratada una pliza con
esta compaa, calclese la probabilidad de que alguno de los asegurados de este edificio se
vea agraciado con el descuento. Calclese tambin la probabilidad de que todos los
asegurados en ese edificio se vean agraciados por la reduccin en el precio de la pliza.
Solucin:
1
10000
a) X=nmero de incendios 10000,
(
= ( ( 2)
5000
5000
Cuando en una distribucin Binomial n es muy grande y p muy pequeo, sta se puede
aproximar por una distribucin de Poisson con = np .
Vamos a resolverlo con ambas distribuciones y de paso comprobaremos la aproximacin de
una por otra.
247
10000
10000 1 4999
P [ X 1] = 1 P [ X = 0] = 1
0 5000 5000
P [ X 1] = 1 P [ X = 0] = 1
b) E [ X ] = np = 10000
= 1 0,135308 = 0,864692
e 2 20
= 1 0,135335 = 0,864665
0!
1
=2
5000
1000
= 0,1 .
10000
20
P [Y 1] = 1 P [Y = 0] = 1 0,10 0,920 = 1 0,121577 = 0,878423
0
20
1
P [Y = 20] = 0,120 0,90 = 1020 = 20 0
10
20
3. La produccin de una factora se realiza en dos mquinas A y B. La probabilidad de que la mquina
A produzca x piezas defectuosas al da viene dada por la expresin
e 1
1x
x!
e 3
3y
y!
P [ Z = 0] =
e 4 40
= e 4 = 0, 018316
4!
248
5
5!
5 2
P [V = 2] = 0, 0183162 (1 0, 018316 ) =
0, 0183162 0,9816843 = 0,003174
2
2!3!
4. Un concesionario de automviles vende a sus clientes vehculos de la misma marca. Sabiendo que
la probabilidad de que este tipo de vehculos est en servicio cinco aos despus es de 0,9 ,
determinar la probabilidad de que:
a) De los cinco vehculos comprados por una empresa, al menos cuatro de ellos estn en
servicio dentro de cinco aos.
b) De los cuarenta vehculos comprados por una empresa, al menos 38 de ellos estn en
servicio dentro de cinco aos.
Solucin:
p=probabilidad de que un vehculo est en servicio cinco aos despus=0,9
a) X=nmero de vehculos en servicio (de los cinco) (5; 0,9)
5
5
5 4
55
P [ X 4] = P [ X = 4] + P [ X = 5] = 0,94 (1 0,9 ) + 0,95 (1 0,9 ) =
4
5
1
a) X=nmero de individuos, entre los 8, con la caracterstica econmica 8,
20
3
8 1 19
P [ X = 3] =
3 20 20
8 3
= 0, 005416
249
P [Y 2] = P [Y = 0] + P [Y = 1] + P [Y = 2] =
0
120
120 1 19
=
0 20 20
119
120 1 19
+
1 20 20
118
120 1 19
+
2 20 20
P [ X > 2] = 1 P [ X 2] = 1 P [ X = 0] P [ X = 1] P [ X = 2] =
3000
3000
3000
2
2998
= 1
0, 0020 0,9983000
0, 0021 0,9982999
0, 002 0,998 =
0
1
2
P [ X > 2] = 1 P [ X 2] = 1 P [ X = 0] P [ X = 1] P [ X = 2] =
e6 60 e6 61 e6 62
= 1
3
31
P [Y = 1] = 0, 0024641 (1 0, 002464 ) = 0, 007356
1
c) X i = nmero de impagos en el ao i ( 3000; 0, 002 ) ( ( 6 )
250
O bien:
Z = X 1 + X 2 + X 3 + X 4 + X 5 ( ( 6 ) + ( ( 6 ) + ( ( 6 ) + ( ( 6 ) + ( ( 6 ) = ( ( 5 6 ) = ( ( 30 )
P [ X > 2] = 1 P [ X 2] = 1 P [ X = 0] P [ X = 1] P [ X = 2] =
2500
2500
2500
2
2498
= 1
0, 0010 0,9992500
0, 0011 0,9992499
0, 001 0,999 =
0
1
2
P [ X > 2] = 1 P [ X 2] = 1 P [ X = 0] P [ X = 1] P [ X = 2] =
e 2,5 2,50 e 2,5 2,51 e 2,5 2,52
= 1
O bien:
Y = X 1 + ... + X 10 ( ( 2,5) + ... + ( ( 2,5 ) = ( (10 2,5 ) = ( ( 25 )
Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.
251
1
k2
1
P [ 2 < X < 10] = P X 6 < 4 1 2 = 0, 625
k
4 = k = k 6
k=
4
6
k2 =
16
6
1
6 10
= 1 =
= 0, 625
2
k
16 16
P [ 2 X 10] = P [ X = 2] + P [ X = 3] + P [ X = 4] + P [ X = 5] + P [ X = 6] + P [ X = 7 ] +
+P [ X = 8] + P [ X = 9] + P [ X = 10] = e 6
62
63
64
65
66
67
+ e 6 + e 6 + e 6 + e 6 + e 6 +
2!
3!
4!
5!
6!
7!
9
10
68
6 6
6 6
+e
+e
+e
= 0, 044618 + 0, 089235 + 0,133853 + 0,160623 + 0,160623 +
8!
9!
10!
6
1000
P [ X 3] = 1 P [ X = 0] P [ X = 1] P [ X = 2] =
9
9
9
= 1 0, 0020 0,9989 0, 0021 0,9988 0, 0022 0,9987 =
0
1
2
P [ X > 4] = 1 P [ X 4] = 1 P [ X = 0] P [ X = 1] P [ X = 2] P [ X = 3] P [ X = 4] =
1500
1500
1500
= 1
0, 0020 0,9981500
0, 0021 0,9981499
0, 0022 0,9981498
0
1
2
1500
1500
4
1496
0, 0023 0,9981497
0, 002 0,998 =
3
4
P [ X > 4] = 1 P [ X 4] = 1 P [ X = 0] P [ X = 1] P [ X = 2] P [ X = 3] P [ X = 4] =
e 3 30 e3 31 e3 32 e 3 33 e 3 34
= 1
=
0!
1!
2!
3!
4!
Solucin:
P[pieza defectuosa]=400/5000=0,08
253
Con reemplazamiento:
X (10 ; 0, 08)
10
P [ X = 0] = 0, 080 0,9210 = 0,9210 = 0, 434388
0
Sin reemplazamiento:
X
( 5000;10; 0, 08)
400 4600
400! 4600!
0
10
= 0!400! 10!4590! =
P [ X = 0] =
5000!
5000
10!4990!
10
4600 4599 4598 4597 4596 4595 4594 4593 4592 4591
10 9 8 7 6 5 4 3 2 1
= 0, 434048
=
5000 4999 4998 4997 4996 4995 4994 4993 4992 4991
10 9 8 7 6 5 4 3 2 1
Como puede observarse, cuando el tamao de la poblacin es grande (N=5000), no hay mucha
diferencia entre hacer la seleccin de la muestra con o sin reemplazamiento.
11. Una empresa recibe piezas de un proveedor en lotes de 2000 que se someten al siguiente control de
calidad: se toman 20 piezas al azar y si hay ms de una defectuosa se rechaza el lote, en caso
contrario se acepta. La calidad garantizada por el proveedor es de un 0,8% de piezas defectuosas.
Calcule la probabilidad de:
a) Aceptar un lote que contenga un 2% de defectuosas.
b) Rechazar un lote que debiera ser aceptado por tener slo un 0,8% de defectuosas.
Solucin:
X=nmero de piezas defectuosas entre las 20 seleccionadas.
a) P[pieza defectuosa]=0,02
X (20 ; 0, 02)
20
20
P [ aceptar el lote] = P [ X 1] = 0, 020 0,9820 + 0, 021 0,9819 =
0
1
= 0, 667608 + 0, 272493 = 0,940101
b) P[pieza defectuosa]=0,008
X (20 ; 0, 008)
20
20
P [ rechazar el lote ] = P [ X > 1] = 1 P [ X 1] = 1 0, 0080 0,99220 0, 0081 0,99219 =
0
1
= 1 0,851596 0,137354 = 0, 01105
254
12. Un tirador dispara contra una diana circular. La distancia, en centmetros, de los impactos al centro
de la diana es una variable aleatoria con funcin de densidad
10 x
f ( x) = 50
0
0 x 10
en otro caso
Obtiene premio cuando la distancia del impacto al centro no es superior a 2,5 cm. Cul es la
probabilidad de a lo sumo 2 premios en cuatro disparos?
Solucin:
2,5
2,5
10 x
1
x2
1
f ( x ) dx =
dx = 10 x = ( 25 3,125) = 0, 4375
50
50
2 0
50
0
2,5
4
4
4
P [Y 2] = 0, 43750 0,562520 + 0, 43751 0,562519 + 0, 43752 0,562518 =
0
1
2
= 0,100113 + 0,311462 + 0,363373 = 0, 774948
13. El nmero de personas que esperan ser atendidas en una oficina sigue una distribucin de Poisson
con media 5. Qu nmero de sillas debe haber en la sala de espera para que todas puedan estar
sentadas con un probabilidad del 95%?
Solucin:
X=nmero de personas que esperan ser atendidas. X ( ( 5) .
Sea s el nmero de sillas en la sala de espera.
P [ X s ] = 0,95
Utilizando las tablas de la distribucin de Poisson o con Excel, obtenemos que:
P [ X 8] = 0,9319
P [ X 9] = 0,9682
Para que estn sentados todos con una probabilidad mayor del 95%, el nmero de sillas debe ser 9
como mnimo.
14. Un proceso de fabricacin produce por trmino medio 3 piezas defectuosas por cada 1000. Las
piezas se empaquetan en cajas de 2500. Cul es la probabilidad de que entre 5 cajas, elegidas al
azar, en dos de ellas no haya piezas defectuosas?
Solucin:
255
2500
P [ X = 0] =
0, 0030 0.997 2500 = 0, 000547
P [ X = 0] =
e 7,5 7,50
= 0, 000553
0!
q = 1 0, 000547 = 0,999453
5
P [Y = 2] = 0, 000547 2 0,9994533 = 0, 000002987
2
256