Está en la página 1de 44

RELACIONES LABORALES PRIMER0.

CURSO 2022-23
ESTADISTICA
MODELOS DE DISTRIBUCIONES DE PROBABILIDAD. INFERENCIA

En este capítulo vamos a abordar algunas distribuciones de probabilidad que son


especialmente útiles porque responden a situaciones en las que nos veremos inmersos
con frecuencia.

Algunos conocimientos matemáticos son necesarios, en esta ocasión para este


tema es todo lo referente a números combinatorios.

Para ello comenzaremos con el concepto de factorial de un número natural.

𝑛! = 𝑛 ∙ (𝑛 − 1) ∙ (𝑛 − 2) ∙ ⋯ ∙ 3 ∙ 2 ∙ 1

Es decir, es un producto decreciente desde el número que nos interesa hasta la


unidad. Por ejemplo

5! = 5 ∙ 4 ∙ 3 ∙ 2 ∙ 1 = 120

Se toma como convenio que 0! = 1 para poder efectuar determinadas operaciones.

Es inmediato que

𝑛! = 𝑛 ∙ (𝑛 − 1) ∙ (𝑛 − 2) ∙ ⋯ ∙ 3 ∙ 2 ∙ 1 = 𝑛 ∙ (𝑛 − 1)!

Lo cual también será muy útil.

Una vez recordado el concepto de factorial de un número pasamos al de


número combinatorio. Su nomenclatura es simplemente 2 números naturales puestos
uno sobre otro y entre paréntesis, de forma que el de arriba sea mayor o igual que el
de abajo.
𝑚
( ); 𝑚≥𝑛
𝑛
Su cálculo se expresa en función de factoriales según la siguiente expresión:

𝑚 𝑚!
( )=
𝑛 𝑛! ∙ (𝑚 − 𝑛)!

Por ejemplo

6 6! 6! 6 ∙ 5 ∙ 4! 30
( )= = = = = 15
4 4! ∙ (6 − 4)! 4! ∙ 2! 4! ∙ 2! 2

Hay varias propiedades importantes de los números combinatorios:

1
RELACIONES LABORALES PRIMER0. CURSO 2022-23
ESTADISTICA
MODELOS DE DISTRIBUCIONES DE PROBABILIDAD. INFERENCIA

𝑚 𝑚! 𝑚!
( )= = =1
0 0! ∙ (𝑚 − 0)! 0! ∙ 𝑚!

𝑚 𝑚! 𝑚 ∙ (𝑚 − 1)!
( )= = =𝑚
1 1! ∙ (𝑚 − 1)! 1! ∙ (𝑚 − 1)!

𝑚 𝑚! 𝑚! 𝑚! 𝑚
( )= = = =( )
𝑛 𝑛! ∙ (𝑚 − 𝑛)! (𝑚 − 𝑛)! ∙ 𝑛! (𝑚 − 𝑛)! ∙ (𝑚 − (𝑚 − 𝑛))! 𝑚 −𝑛

Y como consecuencia
𝑚 𝑚
( )=( )=1
𝑚 0
𝑚 𝑚
( )=( )=𝑚
𝑚−1 1
Una última propiedad será:

𝑚 𝑚 𝑚! 𝑚!
( )+( )= + =
𝑛 𝑛+1 𝑛! ∙ (𝑚 − 𝑛)! (𝑛 + 1)! ∙ (𝑚 − (𝑛 + 1))!

(𝑛 + 1) ∙ 𝑚! (𝑚 − 𝑛) ∙ 𝑚! (𝑛 + 1 + 𝑚 − 𝑛) ∙ 𝑚!
= + = =
(𝑛 + 1)! ∙ (𝑚 − 𝑛)! (𝑛 + 1)! ∙ (𝑚 − 𝑛)! (𝑛 + 1)! ∙ (𝑚 − 𝑛)!

(1 + 𝑚) ∙ 𝑚! (𝑚 + 1)! 𝑚+1
= = =( )
(𝑛 + 1)! ∙ (𝑚 − 𝑛)! (𝑛 + 1)! ∙ (𝑚 − 𝑛)! 𝑛+1

Una técnica para la obtención de los números combinatorios sin necesidad de realizar
tanto producto es el denominado Triángulo de Tartaglia. Consiste en disponer de
forma piramidal ordenada los números combinatorios, de forma que en cada fila estén
todos los que tienen la misma parte superior:

0
( )
0
1 1
( ) ( )
0 1
2 2 2
( ) ( ) ( )
0 1 2
3 3 3 3
( ) ( ) ( ) ( )
0 1 2 3
Etc.

2
RELACIONES LABORALES PRIMER0. CURSO 2022-23
ESTADISTICA
MODELOS DE DISTRIBUCIONES DE PROBABILIDAD. INFERENCIA

Si observamos los dos lados de este triangulo están formados por unos y en base a la
última propiedad, cualquier número combinatorio se podrá obtener como suma de los
dos que tiene encima de él. Así:

1 1

1 2 1

1 3 3 1

Por lo que podremos obtener fácilmente números combinatorios que no


correspondan a valores grandes.

Un resultado importante en el que intervienen los números combinatorios es


en la fórmula del Binomio de Newton que nos da la potencia de un binomio. Así pues:
𝑛 𝑛 𝑛 𝑛 𝑛 𝑛
(𝑥 + 𝑦)𝑛 = ( ) 𝑥 𝑛 + ( ) 𝑥 𝑛−1 𝑦 + ( ) 𝑥 𝑛−2 𝑦 2 + ⋯ + ( ) 𝑥 2 𝑦 𝑛−2 + ( ) 𝑥𝑦 𝑛−1 + ( ) 𝑦 𝑛
0 1 2 𝑛−2 𝑛−1 𝑛

Y para la diferencia
𝑛 𝑛 𝑛 𝑛 𝑛 𝑛
(𝑥 − 𝑦)𝑛 = ( ) 𝑥 𝑛 − ( ) 𝑥 𝑛−1 𝑦 + ( ) 𝑥 𝑛−2 𝑦 2 + ⋯ + (−1)𝑛−2 ( ) 𝑥 2 𝑦 𝑛−2 + (−1)𝑛−1 ( ) 𝑥𝑦 𝑛−1 + (−1)𝑛 ( ) 𝑦 𝑛
0 1 2 𝑛−2 𝑛−1 𝑛

Por ejemplo:

(𝑥 + 𝑦)3 = (3) 𝑥 3 + (3) 𝑥 2 𝑦 + (3) 𝑥𝑦 2 + (3) 𝑦 3 = 𝑥 3 + 3𝑥 2 𝑦 + 3𝑥𝑦 2 + 𝑦 3


0 1 2 3
4 4 4 4 4
(𝑥 − 𝑦)4 = ( ) 𝑥 4 − ( ) 𝑥 3 𝑦 + ( ) 𝑥 2 𝑦 2 − ( ) 𝑥𝑦 3 + ( ) 𝑦 4 = 𝑥 4 − 4𝑥 3 𝑦 + 6𝑥 2 𝑦 2 − 4𝑥𝑦 3 + 𝑦 4
0 1 2 3 4

3
RELACIONES LABORALES PRIMER0. CURSO 2022-23
ESTADISTICA
MODELOS DE DISTRIBUCIONES DE PROBABILIDAD. INFERENCIA

MODELOS DISCRETOS.-

Por cuestiones de tiempo vamos a ver solo tres distribuciones discretas, las de
mayor uso. La Distribución Binomial, la Distribución de Poisson y la Distribución
Geométrica.

BINOMIAL.-

Esta distribución se utiliza cuando se está realizando un experimento aleatorio,


la ocurrencia de un suceso dado será un éxito. Este experimento lo estamos
repitiendo, en idénticas condiciones, un determinado número de veces decidido a
priori. Finalmente, estaremos interesados en el número de éxitos que hayamos
obtenido.

Por ejemplo si realizamos el lanzamiento de un dado 10 veces y estamos


interesados en cuantas veces sale un cinco.

En esta distribución, si denotamos por 𝑝 la probabilidad de éxito, 𝑞 la de fracaso


(obviamente 𝑝 + 𝑞 = 1) y 𝑛 el número de realizaciones del experimento aleatorio,
entonces se dice que la variable aleatoria que cuenta el número de éxitos seguirá una
distribución binomial con 𝑛 realizaciones y con probabilidad de éxito 𝑝. Se denotará
como

𝑋~ℬ(𝑛, 𝑝)

Su función de cuantía será:


𝑛
𝑓(𝑟) = ( ) 𝑝𝑟 𝑞 𝑛−𝑟 ; 𝑟 = 0, 1, 2, ⋯ , 𝑛
𝑟
Por ejemplo si consideramos el experimento de lanzar 5 veces un dado y ver cuantos
número mayores que cuatro ocurren será:
𝑟
2 1 1 5 1 2 5−𝑟
𝑝= = ; 𝑛 = 5; 𝑋~ℬ (5, ) ; 𝑓(𝑟) = ( ) ( ) ( ) ; 𝑟 = 0, 1, 2, ⋯ , 5
6 3 3 𝑟 3 3

Por lo que si nos piden la probabilidad de que esto ocurra en tres ocasiones,
tendremos:
3
5 1 2 5−3 1 4 40
𝑃(𝑋 = 3) = 𝑓(3) = ( ) ( ) ( ) = 10 ∙ ∙ =
3 3 3 27 9 243

Se demuestra que para esta distribución se verifica que:

4
RELACIONES LABORALES PRIMER0. CURSO 2022-23
ESTADISTICA
MODELOS DE DISTRIBUCIONES DE PROBABILIDAD. INFERENCIA

𝐸[𝑋] = 𝑛 ∙ 𝑝; 𝑉𝑎𝑟(𝑋) = 𝜎𝑥2 = 𝑛 ∙ 𝑝 ∙ 𝑞

Así, en el ejemplo anterior

1 5 1 2 10
𝐸[𝑋] = 5 ∙ = ; 𝑉𝑎𝑟(𝑋) = 𝜎𝑥2 = 5 ∙ ∙ =
3 3 3 3 9

Ejercicio 1. Halla la probabilidad de que en 5 lanzamientos de un dado, el tres


aparezca dos veces.

Vemos como el experimento lanzamiento de un dado y ver los puntos de la cara


superior se realiza 5 veces y el suceso que nos interesa es que salga un tres cuya
1
probabilidad obviamente es 6. Así pues, si la variable aleatoria 𝑋 cuenta el número
1
de éxitos, entonces 𝑋 ~ ℬ (5, 6). Su función de cuantía será: 𝑓(𝑥) =
1 𝑥 5 5−𝑥
(𝑥5) (6) (6) 𝑥 = 0,1,2,3,4,5

Luego como nos piden la probabilidad de dos éxitos entonces

5 1 2 5 3 1 125 625
𝑃(𝑋 = 2) = 𝑓(2) = ( ) ( ) ( ) = 10 =
2 6 6 36 216 3888

Ejercicio 2. Se lanzan 𝟒 monedas 𝟒𝟖 veces. Calcula el número esperado de veces


que saldrán las cuatro caras.

En este caso tenemos dos fases en el ejercicio. En primer lugar necesitamos hallar la
probabilidad de que al lanzar 4 monedas, salgan las 4 caras. Para esto tenemos dos
opciones:
1
a) 𝑃(4 𝑐𝑎𝑟𝑎𝑠) = 𝑃(𝐶1 ∩ 𝐶2 ∩ 𝐶3 ∩ 𝐶4 ) = 𝑃(𝐶1 )𝑃(𝐶2 )𝑃(𝐶3 )𝑃(𝐶4 ) = 16

Llamando 𝐶𝑖 a sacar cara en la moneda 𝑖 − 𝑒𝑠𝑖𝑚𝑎 y suponiendo la independencia de


unas monedas con otras.

b) Otra opción consiste en plantearlo a su vez como un ejercicio de la binomial


donde el experimento es lanzar una moneda, se efectúa 4 veces (se lanzan
cuatro monedas), el éxito es obtener cara y nos interesa la probabilidad de
obtener 4 éxitos.

1 4 1 0 1 4 1
𝑋 ~ ℬ (4, ) ; 𝑃(𝑋 = 4) = ( ) ( ) ( ) =
2 4 2 2 16

5
RELACIONES LABORALES PRIMER0. CURSO 2022-23
ESTADISTICA
MODELOS DE DISTRIBUCIONES DE PROBABILIDAD. INFERENCIA

En definitiva, por cualquier camino obtenemos que la probabilidad de obtener las 4


1
caras es .
16

Así pues, habrá que considerar ahora que el experimento es el lanzamiento (no de
una) de las 4 monedas. Ese experimento lo realizaremos 48 veces y el éxito es que
salgan las cuatro caras. Por lo tanto, la variable 𝑌 que mide el número de éxitos
1
verifica que 𝑌 ~ ℬ (48, 16) y como lo que nos piden es que hallemos su esperanza

1
𝐸[𝑌] = 𝑛. 𝑝 = 48. =3
16
Es decir, esperamos que salgan 3 veces las cuatro caras.

Ejercicio 3. De un total de 𝟐𝟎𝟎𝟎 familias con 𝟒 hijos, ¿en cuántas de ellas cabe
esperar que tengan:

a) Dos varones y dos mujeres?


b) Uno o dos varones?
c) Ninguna mujer?
d) Al menos un varón?

Está claro que el experimento se va a realizar 2000 veces, luego 𝑛 = 2000. Sin
embargo, lo que no está tan claro es el valor de la probabilidad de éxito, porque en
cada apartado se considera como éxito una cosa diferente. Por lo tanto en cada
apartado trabajaremos con una binomial diferente.

Por otra parte como cada experimento afecta a familias con 4 hijos, si
consideramos que es equiprobable varón y mujer y consideramos por ejemplo que nos
interesa que sea varón, la variable 𝑋 que mide el número de varones en cada familia
1
de 4 hijos verifica 𝑋 ~ ℬ (4, 2). (De forma dual se podría hacer considerando como
éxito ser mujer. Hágase como ejercicio).

a) En este caso nos interesa que tenga 2 varones, es decir la probabilidad de


1 2 1 2 1 3
éxito será 𝑃(𝑋 = 2) = (42) (2) (2) = 6 16 = 8. Por tanto la variable 𝑌1 que
mide el número de familias que tienen 2 varones verifica que
3
𝑌1 ~ ℬ (2000, 8) y en consecuencia, el número de familias que esperamos
cumplan esta condición será

3
𝐸[𝑌1 ] = 2000. = 750
8

6
RELACIONES LABORALES PRIMER0. CURSO 2022-23
ESTADISTICA
MODELOS DE DISTRIBUCIONES DE PROBABILIDAD. INFERENCIA

b) En este caso nos interesa que tenga 1 o 2 varones, es decir la probabilidad


1 1 1 3 3 1 3 5
de éxito será 𝑃(𝑋 = 1) + 𝑃(𝑋 = 2) = (41) (2) (2) + 8 = 4 16 + 8 = 8. Por
tanto la variable 𝑌2 que mide el número de familias que tienen 1 o 2 varones
5
verifica que 𝑌2 ~ ℬ (2000, 8) y en consecuencia, el número de familias que
esperamos cumplan esta condición será

5
𝐸[𝑌2 ] = 2000. = 1250
8
c) En este caso nos interesa que no tenga ninguna mujer, es decir 4 varones,
1 4 1 0 1
luego la probabilidad de éxito será 𝑃(𝑋 = 4) = (44) (2) (2) = 16. Por tanto
la variable 𝑌3 que mide el número de familias que no tienen ninguna mujer
1
verifica que 𝑌3 ~ ℬ (2000, 16) y en consecuencia, el número de familias que
esperamos cumplan esta condición será

1
𝐸[𝑌3 ] = 2000. = 125
16
d) En este caso nos interesa que haya al menos 1 varón, luego la probabilidad
de éxito será

4 1 0 1 4 1 15
𝑃(𝑋 ≥ 1) = 1 − 𝑃(𝑋 < 1) = 1 − 𝑃(𝑋 = 0) = 1 − ( ) ( ) ( ) = 1 − =
0 2 2 16 16

Por tanto la variable 𝑌4 que mide el número de familias que no tienen ninguna
15
mujer verifica que 𝑌4 ~ ℬ (2000, 16) y en consecuencia, el número de familias
que esperamos cumplan esta condición será

15
𝐸[𝑌4 ] = 2000. = 1875
16
Ejercicio 4.- Sea 𝑿 una variable aleatoria con distribución binomial de
parámetros 𝒏 = 𝟓 y 𝒑 = 𝟎. 𝟒 Calcular:

a) 𝑷(𝑿 = 𝟐)
b) 𝑷(𝑿 > 3)
c) 𝑷(𝑿 ≤ 𝟑)
d) 𝑷(𝟐 < 𝑋 ≤ 4)
e) 𝑷(𝟐 ≤ 𝑿 < 4)
2
Nos están diciendo que 𝑋 ~ ℬ (5, 5) luego

7
RELACIONES LABORALES PRIMER0. CURSO 2022-23
ESTADISTICA
MODELOS DE DISTRIBUCIONES DE PROBABILIDAD. INFERENCIA
2 2 3 3 4 27 216
a) 𝑃(𝑋 = 2) = (52) (5) (5) = 10. 25 . 125 = 625
b) 𝑃(𝑋 > 3) = 𝑃(𝑋 > 3) = 𝑃(𝑋 = 4) + 𝑃(𝑋 = 5) =

5 2 4 3 1 5 2 5 3 0 16 3 32 272
( ) ( ) ( ) + ( ) ( ) ( ) = 5. . + =
4 5 5 5 5 5 625 5 3125 3125
272 2853
c) 𝑃(𝑋 ≤ 3) = 1 − 𝑃(𝑋 > 3) = 1 − 3125 = 3125
2 3 3 2 2 4 3 1
d) 𝑃(2 < 𝑋 ≤ 4) = 𝑃(𝑋 = 3) + 𝑃(𝑋 = 4) = (53) ( ) ( ) + (54) ( ) ( ) =
5 5 5 5

8 9 16 3 720 240 960 192


10. . + 5. . = + = =
125 25 625 5 3125 3125 3125 625
2 2 3 3 2 3 3 2
e) 𝑃(2 ≤ 𝑋 < 4) = 𝑃(𝑋 = 2) + 𝑃(𝑋 = 3) = (52) (5) (5) + (53) (5) (5) =

4 27 8 9 72
10. . + 10. . =
25 125 125 25 125
Ejercicio 5.- En un estudio de mercado una empresa ha determinado que el 𝟑𝟎%
de los consumidores son clientes habituales de sus productos. Si se toman al azar
𝟏𝟎 consumidores, calcular:

a) La probabilidad de que se encuentren como máximo 𝟐 de tales clientes.


b) La probabilidad de que se encuentren como mínimo 𝟓 clientes.
c) La probabilidad de que se encuentren entre 4 y 𝟕 clientes.
d) El número esperado de clientes.
e) La desviación típica de la distribución.

Como se consideran 10 consumidores, quiere decir que el experimento de


seleccionar un consumidor y ver si es o no cliente nuestro se realiza 10 veces y por
supuesto que un consumidor sea o no cliente nuestro no influye en ningún otro, por lo
que asumimos la independencia. Por otra parte, nuestro éxito (ser cliente nuestro)
tiene una probabilidad de 0.3 por lo que la variable 𝑋 que cuenta el número de
3
clientes que hay entre los diez consumidores elegidos verifica 𝑋 ~ ℬ (10, 10) y por lo
tanto

a) 𝑃(𝑋 ≤ 2) = 𝑃(𝑋 = 0) + 𝑃(𝑋 = 1) + 𝑃(𝑋 = 2) =

10 3 0 7 10 10 3 1 7 9 10 3 2 7 8
( ) ( ) ( ) + ( ) ( ) ( ) + ( ) ( ) ( ) = 0.3828
0 10 10 1 10 10 2 10 10

b) 𝑃(𝑋 ≥ 5) = 1 − 𝑃(𝑋 < 5) = 1 − (𝑃(𝑋 ≤ 2) + 𝑃(𝑋 = 3) + 𝑃(𝑋 = 4)) =

8
RELACIONES LABORALES PRIMER0. CURSO 2022-23
ESTADISTICA
MODELOS DE DISTRIBUCIONES DE PROBABILIDAD. INFERENCIA

10 3 3 7 7 10 3 4 7 6
1 − (0.3828 + ( ) ( ) ( ) + ( ) ( ) ( ) ) = 1 − 0.8497 = 0.1503
3 10 10 4 10 10

aprovechamos el resultado del apartado anterior para hacer menos cálculos.

c) 𝑃(4 ≤ 𝑋 ≤ 7) = 𝑃(𝑋 = 4) + 𝑃(𝑋 = 5) + 𝑃(𝑋 = 6) + 𝑃(𝑋 = 7) =

10 3 4 7 6 10 3 5 7 5 10 3 6 7 4 10 3 7 7 3
( )( ) ( ) + ( )( ) ( ) + ( )( ) ( ) + ( )( ) ( )
4 10 10 5 10 10 6 10 10 7 10 10
3
d) 𝐸[𝑋] = 𝑛. 𝑝 = 10. 10 = 3
e) Obtengamos primero la varianza y a continuación la desviación típica

3 7 21 21
𝜎 2 = 𝑛𝑝𝑞 = 10. . = ; 𝜎=√
10 10 10 10

9
RELACIONES LABORALES PRIMER0. CURSO 2022-23
ESTADISTICA
MODELOS DE DISTRIBUCIONES DE PROBABILIDAD. INFERENCIA

POISSON.-

La distribución de Poisson es la encargada de contar el número de veces que


ocurre un determinado suceso si se ha fijado una determinada unidad (casi siempre de
tiempo). Así pues, nos servirá para contar el nº de nacimientos en Torrecárdenas en un
día, el nº de accidentes de tráfico mortales en un fin de semana en España, etc.

Esta distribución depende de un solo parámetro que habitualmente se denota


como 𝜆.

Se dice que una variable aleatoria sigue una distribución de Poisson con
parámetro 𝜆

𝑋~℘(𝜆)

Cuando su función de cuantía viene dada por:

𝑒 −𝜆 ∙ 𝜆𝑟
𝑓(𝑟) = ; 𝑟 = 0,1,2, ⋯
𝑟!
Obsérvese que no hay un valor máximo para la variable.

Por ejemplo, si nos dicen que el número de nacimientos diarios en Torrecardenas sigue
una Poisson con parámetro 3.5 entonces que obtengamos la probabilidad de que en
un determinado día nazcan 2 niños será:

𝑒 −3.5 ∙ 3.5𝑟
𝑋~℘(3.5); 𝑓(𝑟) = ; 𝑟 = 0,1,2, ⋯
𝑟!
𝑒 −3.5 ∙ 3.52
𝑃(𝑋 = 2) = 𝑓(2) =
2!
Se demuestra que

𝐸[𝑋] = 𝜆; 𝑉𝑎𝑟(𝑋) = 𝜎𝑥2 = 𝜆

Finalmente, un importante resultado es que si modificamos la unidad de medida, por


ejemplo los días los pasamos a semanas, entonces el parámetro se verá modificado
por la misma razón, es decir si la variable que cuenta el nº de enfermos que acuden a
urgencias en una hora sigue una Poisson ℘(9) entonces el número de enfermos que
acuden a esa consulta de urgencias durante un turno (supongamos que los turnos son
de 4 horas) seguirá una Poisson ℘(36) y así la probabilidad de que en una hora vayan
10 enfermos será:

10
RELACIONES LABORALES PRIMER0. CURSO 2022-23
ESTADISTICA
MODELOS DE DISTRIBUCIONES DE PROBABILIDAD. INFERENCIA

𝑒 −9 ∙ 910
𝑃(𝑋 = 10) = 𝑓(10) =
10!
Mientras que la probabilidad de que en un turno vayan 30 enfermos será:

𝑒 −36 ∙ 3630
𝑃(𝑌 = 30) = 𝑓(30) =
30!

Ejercicio 1. Sea 𝑿~℘(𝟑) calcular:

a) 𝑷(𝑿 = 𝟐)
b) 𝑷(𝑿 ≤ 𝟐)
c) 𝑷(𝑿 > 2)
d) 𝑷(𝟐 ≤ 𝑿 < 5)

Basta con aplicar la fórmula que nos da la función de cuantía

𝑒 −𝜆 . 𝜆𝑥
𝑃(𝑋 = 𝑥) = 𝑓(𝑥) = 𝑥 = 0,1,2,3, …,
𝑥!
Y que en nuestro caso será

𝑒 −3 . 3𝑥
𝑃(𝑋 = 𝑥) = 𝑓(𝑥) = 𝑥 = 0,1,2,3, …,
𝑥!
𝑒 −3 .32 9
a) 𝑃(𝑋 = 2) = = 2𝑒 3
2!
30 31 32 17
b) 𝑃(𝑋 ≤ 2) = 𝑃(𝑋 = 0) + 𝑃(𝑋 = 1) + 𝑃(𝑋 = 2) = 𝑒 −3 ( 0! + + ) = 2𝑒 3
1! 2!
17 2𝑒 3 −17
c) 𝑃(𝑋 > 2) = 1 − 𝑃(𝑋 ≤ 2) = 1 − 2𝑒 3 = 2𝑒 3
32 33 34
d) 𝑃(2 ≤ 𝑋 < 5) = 𝑃(𝑋 = 2) + 𝑃(𝑋 = 3) + 𝑃(𝑋 = 4) = 𝑒 −3 ( 2! + + )=
3! 4!

9.12 + 4.27 + 81 108 + 108 + 81 297


= 𝑒 −3 = 3
=
24 24𝑒 24𝑒 3
Ejercicio 2. El número medio de solicitudes de préstamos que recibe una entidad
bancaria es de 𝟓 por día. Suponiendo que las solicitudes de préstamo sigan una
distribución de Poisson, calcular la probabilidad de que:

a) En un día se reciban más de 𝟔 solicitudes.


b) En una hora se reciban exactamente 𝟐 solicitudes, si el horario del banco es
de 𝟗 de la mañana hasta las 𝟐 de la tarde.

11
RELACIONES LABORALES PRIMER0. CURSO 2022-23
ESTADISTICA
MODELOS DE DISTRIBUCIONES DE PROBABILIDAD. INFERENCIA

Nos están diciendo que la variable 𝑋 que cuenta el número de solicitudes diarias
sigue una Poisson con parámetro 𝜆 = 5, luego

50 51 52 53 54 55 56
c) 𝑃(𝑋 > 6) = 1 − 𝑃(𝑋 ≤ 6) = 1 − 𝑒 −5 ( 0! + + + + + + )=
1! 2! 3! 4! 5! 6!

25 125 625 3125 15625


= 1 − 𝑒 −5 (1 + 5 + + + + + )=
2 6 24 120 720
6.720 + 25.360 + 125.120 + 30.625 + 6.625 + 3125
1 − 𝑒 −5 =
720
4320 + 9000 + 15000 + 18750 + 3750 + 3125 53945
1− = 1 −
720𝑒 5 720𝑒 5
5
720𝑒 − 53945
=
720𝑒 5
d) En este caso se está cambiando la unidad de medida del día a la hora. Pero lo
que nos interesa no son las 24 horas del día sino el total de horas que el banco
está abierto, es decir desde las 9 hasta las 14 horas son un total de 5 horas.
Luego la variable 𝑌 que mide el número de solicitudes de préstamo por hora
5
será una Poisson con parámetro 𝜆∗ = = 1 por lo que
5

𝑒 −1 . 12 1
𝑃(𝑌 = 2) = =
2! 2𝑒
Ejercicio 3. Los accidentes de trabajo, 𝑿, que se producen en una fábrica por
semana siguen una Ley de Poisson de forma que

𝟏𝟔
𝑷(𝑿 = 𝟓) = 𝑷(𝑿 = 𝟐)
𝟏𝟓
Se supone que hay independencia entre los accidentes ocurridos en dos semanas
distintas cualesquiera. Calcular:

e) La media y la varianza de la distribución.


f) Número máximo de accidentes en el 𝟗𝟎% de las semanas.
g) Probabilidad de que no haya ningún accidente en 𝟒 semanas.
h) Probabilidad de que en una semana haya dos accidentes y en la siguiente
otros dos.
i) Si se sabe que en una semana ha habido al menos un accidente, probabilidad
de que en ella no haya habido más de tres.
e) Si aplicamos la fórmula de la función de cuantía a los valores 2 y 5
obtenemos:

12
RELACIONES LABORALES PRIMER0. CURSO 2022-23
ESTADISTICA
MODELOS DE DISTRIBUCIONES DE PROBABILIDAD. INFERENCIA

𝑒 −𝜆 . 𝜆5 16 𝑒 −𝜆 . 𝜆2
= .
5! 15 2!
de donde

16 5! 16
𝜆3 = . = . 60 = 64 = 43 ; 𝜆=4
15 2! 15
Luego ya sabemos que 𝑋 ~ ℘(4) por lo que tanto la media como la varianza de
esta distribución será 4. (Recordemos que en una Poisson el parámetro coincide
con la media y con la varianza).

f) Tenemos que hallar un valor 𝛼 de forma que 𝑃(𝑋 ≤ 𝛼) ≤ 0.9 y sin embargo
𝑃(𝑋 ≤ 𝛼 + 1) > 0.9 Para esto vamos a probar con diferentes posibilidades
hasta que encontremos el valor apropiado. Empecemos por ejemplo con 𝛼 =
5

40 41 42 43 44 45
−4
𝑃(𝑋 ≤ 5) = 𝑒 ( + + + + + )
0! 1! 2! 3! 4! 5!
32 32 128
= 𝑒 −4 (1 + 4 + 8 + + + )=
3 3 15
13.15 + 64.5 + 128 195 + 320 + 128 643
= 4
= 4
= ≈ 0.785
15𝑒 15𝑒 15𝑒 4
que satisface la primera condición. Veamos la segunda

643 −4
46 643 256
𝑃(𝑋 ≤ 6) = 𝑃(𝑋 ≤ 5) + 𝑃(𝑋 = 6) = 4
+𝑒 = 4
+ =
15𝑒 6! 15𝑒 45𝑒 4
1929 + 256 2185
= = ≈ 0.889
45𝑒 4 45𝑒 4
que no supera 0.9 por lo que habrá que probar con el siguiente

2185 −4
47 2185 1024
𝑃(𝑋 ≤ 7) = 𝑃(𝑋 ≤ 6) + 𝑃(𝑋 = 7) = +𝑒 = + =
45𝑒 4 7! 45𝑒 4 315𝑒 4
2185.7 + 1024 16319
= = ≈ 0.948
315𝑒 4 315𝑒 4
Que ya si supera 0.9 por lo que el valor pedido será 𝛼 = 6

g) En este caso nos interesa un periodo de cuatro semanas, por lo que la variable
𝑌 que mide el número de accidentes en cuatro semanas sigue una distribución
de Poisson con parámetro 𝜆∗ = 4.4 = 16 y en consecuencia

13
RELACIONES LABORALES PRIMER0. CURSO 2022-23
ESTADISTICA
MODELOS DE DISTRIBUCIONES DE PROBABILIDAD. INFERENCIA

160 1
𝑃(𝑌 = 0) = 𝑒 −16 = 16
0! 𝑒
h) Como partimos del hecho de que lo que ocurra en una semana es
independiente de lo que ocurra en cualquier otra, entonces la probabilidad de
que haya dos accidentes en una semana y otros dos en la siguiente será el
producto de la probabilidad de que haya dos accidentes en una semana por la
probabilidad de que haya otros dos en la siguiente, que como son iguales será
su cuadrado
2
−4
42 64
𝑃(𝑋1 = 2; 𝑋2 = 2) = 𝑃(𝑋1 = 2). 𝑃(𝑋2 = 2) = (𝑒 ) = 8
2! 𝑒

i) En este caso nos piden una probabilidad condicionada (las dos cosas afetan a la
misma semana.

𝑃(𝑋 ≤ 3; 𝑋 ≥ 1) 𝑃(1 ≤ 𝑋 ≤ 3)
𝑃(𝑋 ≤ 3⁄𝑋 ≥ 1) = = =
𝑃(𝑋 ≥ 1) 1 − 𝑃(𝑋 = 0)

41 42 43 32 36 + 32
𝑒 −4 ( 1! + 2! + 3! ) 4+8+ 3 68
= = = 3 =
40 𝑒4 − 1 𝑒4 − 1 𝑒4 − 1
1 − 𝑒 −4 0!

1. Ejercicio 4.- Entre los 100 aspirantes a unas plazas de técnicos superiores en la
Administración Pública, 40 son mujeres. Si seleccionamos una muestra aleatoria,
con reemplazamiento, de 40 aspirantes. Obtener la probabilidad de que como
mucho 5 sean mujeres.
En este caso el experimento aleatorio es la elección de un opositor para ver si es
hombre o mujer. Este experimento se realiza 40 veces y por ser con reemplazamiento,
se hace en condiciones de independencia. Estamos interesados en el suceso ser
mujer. Como la composición de los aspirantes es de 40 mujeres y 60 hombre, entonces
2
la probabilidad de éxito será de por lo que la variable 𝑋 que cuenta el número de
5
2
mujeres elegidas sigue una binomial 𝑋 ~ ℬ (40, 5) y nos están pidiendo

40 2 0 3 40 40 2 1 3 39 40 2 2 3 38
𝑃(𝑋 ≤ 5) = ( ) ( ) ( ) + ( ) ( ) ( ) + ( ) ( ) ( ) +
0 5 5 1 5 5 2 5 5

40 2 3 3 37 40 2 4 3 36 40 2 5 3 35
+( )( ) ( ) + ( )( ) ( ) + ( )( ) ( )
3 5 5 4 5 5 5 5 5

que bastante engorroso para su cálculo.

14
RELACIONES LABORALES PRIMER0. CURSO 2022-23
ESTADISTICA
MODELOS DE DISTRIBUCIONES DE PROBABILIDAD. INFERENCIA
2
Podemos calcularlo mediante una aproximación a través de la variable 𝑌~ ℘ (40. 5) y
por lo tanto

160 161 162 163 164 165


𝑃(𝑌 ≤ 5) = 𝑒 −16 ( + + + + + )
0! 1! 2! 3! 4! 5!

Que también es una lata pero mucho más manejable que el anterior.

15
RELACIONES LABORALES PRIMER0. CURSO 2022-23
ESTADISTICA
MODELOS DE DISTRIBUCIONES DE PROBABILIDAD. INFERENCIA

DISTRIBUCION GEOMETRICA.-

El planteamiento en una geométrica, va a ser similar al realizado en la binomial,


en el sentido de que estaremos interesados en la ocurrencia de un determinado
suceso

𝐴; 𝑝 = 𝑃(𝐴)

y que en caso de ocurrencia diremos que ha sido un éxito. En cambio si no ocurre será
un fracaso

𝑞 = 𝑃(𝐴𝑐 ); 𝑝+𝑞 =1

En esta distribución vamos a realizar el experimento, en condiciones de


independencia, tantas veces como sea necesario hasta la consecución de 1 éxito,
entonces se dice que la variable aleatoria que cuenta el número de experimentos
realizados seguirá una distribución geométrica con probabilidad de éxito 𝑝. Se
denotará como

𝑋~𝒢(𝑝)

Su función de cuantía será:

𝑓(𝑘) = 𝑝𝑞 𝑘−1 ; 𝑘 = 1, 2, ⋯

Tengamos en cuenta que estamos realizando el experimento hasta que se produzca


un éxito. Así pues, si esto ocurre en el 𝑘 −ésimo experimento, es porque en los 𝑘 − 1
primeros experimentos ha habido fracasos y por independencia, la probabilidad será
𝑞 𝑘−1. Si a esto añadimos que la probabilidad de que en el 𝑘 −ésimo experimento
tengamos un éxito es 𝑝 obtenemos la expresión anteriormente descrita, donde ahora
los experimentos pueden ser desde uno en adelante (no hay tope superior).

Por ejemplo si consideramos el experimento de lanzar un dado hasta que salga un


número mayor que cuatro. La variable que mide el número de lanzamientos será:

2 1 1
𝑝= = ; 𝑋~𝒢 ( )
6 3 3

1 2 𝑘−1
𝑓(𝑘) = ( ) ( ) ; 𝑘 = 1, 2, 3, ⋯
3 3

16
RELACIONES LABORALES PRIMER0. CURSO 2022-23
ESTADISTICA
MODELOS DE DISTRIBUCIONES DE PROBABILIDAD. INFERENCIA

Por lo que si nos piden la probabilidad de que sean necesarias 3 realizaciones,


tendremos:

1 2 2 1 4 4
𝑃(𝑋 = 3) = 𝑓(3) = ( ) ( ) = ∙ =
3 3 3 9 27

Veamos cuales son las principales características de esta distribución, es decir su media
y su varianza

1
𝐸[𝑋] =
𝑝
𝑞
𝑉𝑎𝑟(𝑋) = 𝜎𝑥2 =
𝑝2

Si bajo el mismo planteamiento realizado para esta distribución, en lugar de


preocuparnos por el número de realizaciones del experimento nos preocupamos por el
número de fracasos necesarios para la consecución del éxito tendremos entonces otra
variable aleatoria 𝑌 que obviamente está relacionada con la variable 𝑋 que cuenta el
número de experimentos necesarios

𝐸𝑥𝑝𝑒𝑟𝑖𝑚𝑒𝑛𝑡𝑜𝑠 = 𝐸𝑥𝑖𝑡𝑜𝑠 + 𝐹𝑟𝑎𝑐𝑎𝑠𝑜𝑠

𝑋 = 1 + 𝑌; 𝑌 =𝑋−1

por lo tanto todo lo visto para la variable 𝑋 es útil para el conocimiento de la variable
𝑌 aunque lógicamente no es idéntico, hay una translación.

Así

𝑓𝑌 (𝑘) = 𝑃(𝑌 = 𝑘) = 𝑃(𝑋 = 𝑘 + 1) = 𝑓𝑋 (𝑘 + 1) = 𝑝 𝑞 𝑘 ; 𝑘 = 0, 1, 2, ⋯

1 1−𝑝 𝑞
𝐸[𝑌] = 𝐸[𝑋 − 1] = 𝐸[𝑋] − 1 = −1= =
𝑝 𝑝 𝑝

pero la varianza es invariante a translaciones


𝑞
𝑉𝑎𝑟(𝑌) = 𝑉𝑎𝑟(𝑋) =
𝑝2

17
RELACIONES LABORALES PRIMER0. CURSO 2022-23
ESTADISTICA
MODELOS DE DISTRIBUCIONES DE PROBABILIDAD. INFERENCIA

Veamos algunos ejemplos de la distribución Geométrica. Recordemos que


𝑋 ~ 𝒢(𝑝) quiere decir que 𝑋 cuenta el número de veces que hay que realizar un
experimento aleatorio (en condiciones de independencia), para que un determinado
suceso 𝐴 (que denominaremos éxito) ocurra, siendo 𝑝 la probabilidad de éxito.
𝟏
Ejercicio 1. Sea 𝑿 ~ 𝓖 (𝟑) calcular:

a) 𝑷(𝑿 = 𝟐)
b) 𝑷(𝑿 ≤ 𝟑)
c) 𝑷(𝑿 > 2)
d) 𝑬[𝑿]

Basta con aplicar la fórmula que nos da la función de cuantía

𝑃(𝑋 = 𝑥) = 𝑓(𝑥) = 𝑝𝑞 𝑥−1 𝑥 = 1, 2, …,

Y que en nuestro caso será

1 2 𝑥−1
𝑃(𝑋 = 𝑥) = 𝑓(𝑥) = ( ) ( ) 𝑥 = 1, 2, …,
3 3
1 2 2
a) 𝑃(𝑋 = 2) = 3 ∙ 3 = 9
1 1 2 1 4 19
b) 𝑃(𝑋 ≤ 3) = 𝑃(𝑋 = 1) + 𝑃(𝑋 = 2) + 𝑃(𝑋 = 3) = 3 + 3 ∙ 3 + 3 ∙ 9 = 27
1 2 4
c) 𝑃(𝑋 > 2) = 1 − 𝑃(𝑋 ≤ 2) = 1 − 𝑃(𝑋 = 1) − 𝑃(𝑋 = 2) = 1 − 3 − 9 = 9
1 1
d) 𝐸[𝑋] = 𝑝 = 1 =3
3

Ejercicio 2.- En un laboratorio que contiene 100 productos químicos, de los que 25
son derivados del carbono, se van introduciendo alumnos para que elijan un
producto al azar, se toma nota y se reintegra el producto a su sitio. Hallar la
probabilidad de que sean necesarios 10 alumnos para la obtención de un producto
que sea derivado del carbono.

En este caso el experimento aleatorio es la elección de un producto químico de


entre los 100 que hay. Como esta elección se realiza al azar, suponemos que todos son
1
equiprobables, por lo que cada producto tiene 100 como probabilidad de ser elegido y
por lo tanto como hay 25 productos derivados del carbono, la probabilidad de que se
25 1
elija un producto derivado del carbono será de = 4 por lo que si realizamos este
100
experimento varias veces en condiciones de independencia (el producto químico es
reintegrado por lo que la situación para cada alumno es la misma) hasta la obtención

18
RELACIONES LABORALES PRIMER0. CURSO 2022-23
ESTADISTICA
MODELOS DE DISTRIBUCIONES DE PROBABILIDAD. INFERENCIA

de un éxito entonces la variable 𝑋 que cuenta el número de alumnos que pasan a


1
elegir un producto sigue una geométrica 𝑋 ~ 𝒢 (4) y nos están pidiendo

1 3 9 39
𝑃(𝑋 = 10) = ( ) = 10
4 4 4

Ejercicio 3.- Pepe y Luis van a practicar lanzamientos a puerta. Pepe es portero y Luis
𝟏
lanza los penaltis. Se sabe que la probabilidad de que Luis marque gol es de 𝟒. Hallar
la probabilidad de que Pepe pare 5 penaltis antes de que por fin Luis marque su gol.

En este caso el experimento es lanzamiento del penalti cuya probabilidad de éxito es


1
de y lo realizamos hasta que se produzca dicho éxito. Nos piden la probabilidad de
4
que le paren 5 penaltis, es decir, que se produzcan 5 fracasos. Para poder utilizar lo
que sabemos de la geométrica, debemos transformar la pregunta en número de
experimentos, es decir número de lanzamientos, que serán los 5 que para Pepe más el
1
que marca Luis, o sea 6 lanzamientos. Estamos pues ante una geométrica 𝑋 ~ 𝒢 (4) y
nos piden

1 3 5 35
𝑃(𝑋 = 6) = ( ) = 6
4 4 4

19
RELACIONES LABORALES PRIMER0. CURSO 2022-23
ESTADISTICA
MODELOS DE DISTRIBUCIONES DE PROBABILIDAD. INFERENCIA

DISTRIBUCION UNIFORME.

La distribución uniforme es aquella cuya función de densidad es constante a lo


largo de un intervalo y que eso conlleva que su definición sea

𝑋 ~ 𝔘(𝑎, 𝑏) ⇒ 𝑓(𝑥) = 𝑘; 𝑎<𝑥<𝑏

pero
𝑏
1
∫ 𝑘 𝑑𝑥 = 𝑘𝑥|𝑏𝑎 = 𝑘(𝑏 − 𝑎) = 1; 𝑘=
𝑎 𝑏−𝑎

1
𝑋 ~ 𝔘(𝑎, 𝑏) ⇒ 𝑓(𝑥) = ; 𝑎<𝑥<𝑏
𝑏−𝑎
Por tanto su función de distribución será
𝑥
∫ 0 𝑑𝑡 𝑥≤𝑎
−∞
𝑥 𝑎 𝑥
1
𝐹(𝑥) = ∫ 𝑓(𝑡) 𝑑𝑡 = ∫ 0 𝑑𝑡 + ∫ 𝑑𝑡 𝑎 < 𝑥 < 𝑏
−∞ −∞ 𝑎 𝑏−𝑎
𝑎 𝑏 𝑥
1
∫ 0 𝑑𝑡 + ∫ 𝑑𝑡 + ∫ 0 𝑑𝑡 𝑥 ≥ 𝑏
{ −∞ 𝑎 𝑏−𝑎 𝑏
0 𝑥≤𝑎
𝑥−𝑎
={ 𝑎<𝑥<𝑏
𝑏−𝑎
1 𝑥≥𝑏

Obsérvese que si un intervalo está contenido en el principal [𝑐, 𝑑] ⊂ [𝑎, 𝑏] entonces

𝑑−𝑎 𝑐−𝑎 𝑑−𝑐


𝑃(𝑐 < 𝑋 < 𝑑) = 𝐹(𝑑) − 𝐹(𝑐) = − =
𝑏−𝑎 𝑏−𝑎 𝑏−𝑎
es decir, la probabilidad de que la variable se mueva en un intervalo dado es el
cociente entre la longitud de este intervalo y la longitud del intervalo de definición de
la variable.

Si el intervalo no está contenido en el intervalo de definición, entonces primero lo


restringiremos a su intersección con el intervalo de definición y ya estamos en el caso
anterior.

Por otra parte

20
RELACIONES LABORALES PRIMER0. CURSO 2022-23
ESTADISTICA
MODELOS DE DISTRIBUCIONES DE PROBABILIDAD. INFERENCIA

𝑎+𝑏 (𝑏 − 𝑎)2
𝐸[𝑋] = ; 𝜎𝑋2 =
2 12
En cuanto a la mediana

1 𝑥−𝑎 1 𝑎+𝑏
𝐹(𝑥) = ; = ; 2𝑥 − 2𝑎 = 𝑏 − 𝑎; 2𝑥 = 𝑎 + 𝑏; 𝑀𝑒 =
2 𝑏−𝑎 2 2

Ejercicio 1. La cantidad (en kg) demandada a una empresa textil durante un cierto
periodo de tiempo se distribuye uniformemente entre 𝟎 y 𝟐𝟎𝟎𝟎 𝒌𝒈. Determina
para dicho periodo de tiempo:

a) La probabilidad de que la cantidad demandada no supere los 𝟗𝟎𝟎 𝒌𝒈.


b) La probabilidad de que la cantidad demandada esté comprendida entre 𝟏𝟎𝟎
y 𝟏𝟗𝟎𝟎 𝒌𝒈.
c) La demanda esperada

En este caso

1
𝑋 ~ 𝔘(0,2000) ⇒ 𝑓(𝑥) = ; 0 < 𝑥 < 2000
2000

900 9
e) 𝑃(𝑋 ≤ 900) = 𝐹(900) = 2000 = 20
1900−100 1800 9
a) 𝑃(100 ≤ 𝑋 ≤ 1900) = = 2000 = 10
2000
𝑎+𝑏 2000
b) 𝐸[𝑋] = = = 1000
2 2

Ejercicio 2. Una variable aleatoria 𝑿 ~ 𝖀(𝒂, 𝒃) verifica que su media es 𝟏𝟐 y su


desviación típica es √𝟑. Hallar

a) Los valores de 𝒂 y 𝒃.
b) 𝑷(𝑿 > 10).
𝑎+𝑏 (𝑏−𝑎)2
a) Sabemos que en una uniforme 𝐸[𝑋] = y 𝑉𝑎𝑟[𝑋] = . Como nos
2 12
dicen la media y la desviación típica, elevando al cuadrado la desviación típica
obtenemos la varianza y por consiguiente

𝑎+𝑏 (𝑏 − 𝑎)2 2
𝐸[𝑋] = = 12; 𝑉𝑎𝑟[𝑋] = = (√3) = 3
2 12

21
RELACIONES LABORALES PRIMER0. CURSO 2022-23
ESTADISTICA
MODELOS DE DISTRIBUCIONES DE PROBABILIDAD. INFERENCIA

𝑎+𝑏 (𝑏 − 𝑎)2
= 12; = 3; ⇒ 𝑎 + 𝑏 = 24; (𝑏 − 𝑎)2 = 36; ⇒ 𝑏−𝑎
2 12
=6

luego 𝑏 = 15 y 𝑎 = 9
1
b) Si 𝑋 ~ 𝔘(9,15) entonces 𝑓(𝑥) = 6 9 < 𝑥 < 15 luego

10 − 9 5
𝑃(𝑋 > 10) = 1 − 𝑃(𝑋 ≤ 10) = 1 − 𝐹(10) = 1 − =
6 6
Ejercicio 3.- El tiempo, en minutos, que tarda una persona para ir de su casa al
trabajo oscila entre 𝟑𝟎 y 𝟒𝟎 minutos. Si debe llegar al trabajo a las 𝟗 de la
mañana, ¿A qué hora debe salir de casa para tener una probabilidad de 𝟎. 𝟗 de no
llegar tarde?

Si la variable aleatoria 𝑋 mide el tiempo que tarda en llegar al trabajo entonces

1
𝑋 ~ 𝔘(30,40) ⇒ 𝑓(𝑥) = ; 30 < 𝑥 < 40
10

por lo tanto nos están pidiendo que valor verifica que

𝑥 − 30
𝑃(𝑋 ≤ 𝑥) = 0.9 ⇒ 𝐹(𝑥) = = 0.9 ⇒ 𝑥 = 39
10
Si el tiempo máximo a tardar son 39 minutos, entonces la hora máxima de salida será
8: 21

22
RELACIONES LABORALES PRIMER0. CURSO 2022-23
ESTADISTICA
MODELOS DE DISTRIBUCIONES DE PROBABILIDAD. INFERENCIA
Distribución exponencial negativa.

Ya hemos visto que una distribución exponencial negativa es aquella cuya función de
densidad viene dada por

𝑋 ~ ℰ(𝜆) ⇒ 𝑓(𝑥) = 𝜆𝑒 −𝜆𝑥 ; 𝑥>0 (𝜆 > 0)

y se utiliza para medir el tiempo de espera hasta la ocurrencia de algún suceso.

Está relacionada con la Poisson de la siguiente forma. Si 𝑋 mide el nº de veces que ocurre un
suceso en una determinada unidad temporal y 𝑋~℘(𝜆) entonces la variable aleatoria 𝑌 que
mide el tiempo (en la misma unidad temporal elegida para la Poisson) de espera hasta que
ocurra por primera vez el suceso objeto de nuestro interés sigue una exponencial negativa con
el mismo parámetro, 𝑌 ~ ℰ(𝜆).

Sabemos que su función de distribución es


𝑥
𝑥 ∫ 0 𝑑𝑡 𝑥≤0
−∞ 0 𝑥≤0
𝐹(𝑥) = ∫ 𝑓(𝑡) 𝑑𝑡 = 0 𝑥 ={
−∞ 1 − 𝑒 −𝜆𝑥 𝑥>0
∫ 0 𝑑𝑡 + ∫ 𝜆𝑒 −𝜆𝑥 𝑑𝑡 𝑥>0
{ −∞ 0

1 1
y su esperanza y varianza: 𝐸[𝑋] = 𝜆 y 𝜎𝑋2 = 𝜆2

Ejercicio 1.- Se sabe que la variable 𝑿 que mide el tiempo que tarda en fundirse una
bombilla (en horas de funcionamiento) sigue una exponencial negativa 𝑿 ~ 𝓔(𝟎. 𝟎𝟎𝟎𝟓).

a) Hallar la probabilidad de que una bombilla dure como mucho 𝟐𝟓𝟎𝟎 horas.
b) Hallar la probabilidad de que una bombilla dure más de 𝟏𝟓𝟎𝟎 horas.
c) Hallar la probabilidad de que dure entre 𝟐𝟎𝟎𝟎 y 𝟑𝟎𝟎𝟎 horas.
d) Hallar su media y su varianza.

Su función de distribución será 𝐹(𝑥) = 1 − 𝑒 −0.0005𝑥 𝑥 > 0 luego


5
a) 𝑃(𝑋 ≤ 2500) = 𝐹(2500) = 1 − 𝑒 −0.0005 ∙2500 = 1 − 𝑒 −4
3
b) 𝑃(𝑋 > 1500) = 1 − 𝐹(1500) = 1 − (1 − 𝑒 −0.0005 ∙1500 ) = 𝑒 −4
c) 𝑃(2000 ≤ 𝑋 ≤ 3000) = 𝐹(3000) − 𝐹(2000) = 𝑒 −0.0005 ∙2000 − 𝑒 −0.0005 ∙3000 =
3
𝑒 −1 − 𝑒 −2
1 1
d) 𝐸[𝑋] = 0.0005 = 2000; 𝜎𝑋2 = 0.00052 = 4.000.000

23
RELACIONES LABORALES PRIMER0. CURSO 2022-23
ESTADISTICA
MODELOS DE DISTRIBUCIONES DE PROBABILIDAD. INFERENCIA
Ejercicio 2.- Se sabe que 𝑿 ~ 𝓔(𝝀). Hallar el valor de 𝝀 sabiendo que 𝑷(𝑿 > 3) = 𝟎. 𝟏

𝑃(𝑋 > 3) = 1 − 𝑃(𝑋 ≤ 3) = 1 − 𝐹(3) = 1 − (1 − 𝑒 −3𝜆 ) = 𝑒 −3𝜆 = 0.1

tomando logaritmos neperianos

1 3
−3𝜆 = −𝑙𝑛10 ⇒ 𝜆 = 𝑙𝑛10 = 𝑙𝑛 √10
3

Ejercicio 3.- Se sabe que el número de llamadas que recibe un departamento de


reparaciones sigue una ley de Poisson de promedio 𝟓 llamadas por hora. Comenzando en
un momento aleatoriamente seleccionado, calcula la probabilidad de que la primera llamada
no se reciba antes de media hora.

Si denotamos 𝑋 a la variable que cuenta el número de llamadas por hora entonces 𝑋~℘(5)
luego la variable 𝑌 que mide el tiempo de espera (en horas) hasta la primera llamada sigue
una exponencial negativa 𝑌 ~ ℰ(5). Por tanto nos piden

1 1 1 1
𝑃 (𝑌 > ) = 1 − 𝐹 ( ) = 𝑒 −5∙2 =
2 2 √𝑒 5

24
RELACIONES LABORALES PRIMER0. CURSO 2022-23
ESTADISTICA
MODELOS DE DISTRIBUCIONES DE PROBABILIDAD. INFERENCIA

DISTRIBUCION NORMAL.-

Es el único ejemplo de modelo continuo que vamos a ver.

Es una distribución muy importante porque hay muchos fenómenos de la vida real que
se adaptan a este esquema y porque es una distribución límite que nos permite su
utilización para efectuar aproximaciones.

En principio veremos la distribución normal (𝑁(0,1)) es aquella cuya función


de densidad está definida como

1 𝑥2
𝑓(𝑥) = 𝑒− 2; 𝑥∈ℝ
√2𝜋

cuya gráfica será

Se demuestra que 𝐸[𝑋] = 0 y 𝜎𝑋2 = 1 y para la obtención de la función de


distribución necesitamos unas tablas. Hallar 𝐹(𝑥) es hallar el area delimitada por la
densidad con el eje de abscisas hasta el punto 𝑥

25
RELACIONES LABORALES PRIMER0. CURSO 2022-23
ESTADISTICA
MODELOS DE DISTRIBUCIONES DE PROBABILIDAD. INFERENCIA

Y por simetría se ve claramente que 𝐹(−𝑥) = 𝑃(𝑋 ≤ −𝑥) = 𝑃(𝑋 ≥ 𝑥) = 1 − 𝐹(𝑥)

Pasemos a realizar algunos ejercicios

Ejercicio 1. Sea 𝑿 ≈ 𝑵(𝟎, 𝟏). Hallar:

e) 𝑭(𝟎. 𝟓𝟒).
f) 𝑭(−𝟎. 𝟔𝟑).
g) 𝑭(𝟒. 𝟏𝟒).
h) 𝑭(−𝟓. 𝟑𝟖)
i) 𝑭(𝟏. 𝟔𝟐𝟑)
j) 𝑭(−𝟏. 𝟑𝟓𝟕)
f) Basta con mirar en la tabla en la fila del 0.5 y en la columna del 0.04 y
obtenemos que 𝐹(0.54) = 0.7054
g) Como es un valor negativo habrá que utilizar la fórmula 𝐹(−𝑥) = 1 − 𝐹(𝑥),
es decir 𝐹(−0.63) = 1 − 𝐹(0.63) = 1 − 0.7357 = 0.2643
h) Como es un valor mayor que 4 le asignamos imagen 1; 𝐹(4.14) = 1

26
RELACIONES LABORALES PRIMER0. CURSO 2022-23
ESTADISTICA
MODELOS DE DISTRIBUCIONES DE PROBABILIDAD. INFERENCIA

i) Como es negativo 𝐹(−5.38) = 1 − 𝐹(5.38) pero como 𝐹(5.38) = 1


entonces 𝐹(−5.38) = 0
j) En este caso nos piden la imagen en un punto con más de dos decimales, luego
habrá que interpolar. Los valores más próximos que si están en las tablas son
𝐹(1.62) = 0.9474 y 𝐹(1.63) = 0.9484 por lo que para un incremento en
abscisas de 1.63 − 1.62 = 0.01 le corresponde un incremento en ordenadas
de 0.9484 − 0.9474 = 0.001 Para el incremento que buscamos 1.623 −
1.62 = 0.003 le corresponderá en ordenadas un incremento 𝛼 y por una
𝛼 0.003 0.003
regla de tres tenemos que = luego 𝛼 = 0.001 = 0.0003 y en
0.001 0.01 0.01
consecuencia la imagen que buscamos será 𝐹(1.623) = 𝐹(1.62) + 𝛼 =
0.9474 + 0.0003 = 0.9477
Esto dijimos que lo podemos hacer por un procedimiento más burdo pero más
rápido. Si el incremento en abscisas es aproximadamente la tercera parte del
incremento de unidades entonces debe ocurrir lo mismo en ordenadas. Para un
incremento en ordenadas de 0.001 entonces su tercera parte es el valor de 𝛼
que buscamos y esto aproximadamente nos da 𝛼 = 0.0003 que en este caso
ha coincidido pero que en general habrá una pequeña diferencia que no nos va
a importar.
k) 𝐹(−1.357) = 1 − 𝐹(1.357) Para esto buscamos 𝐹(1.35) = 0.9115 y
𝐹(1.36) = 0.9131. Así pues el incremento en abscisas 0.07 se puede
2 3
aproximar por o por y como el incremento en ordenadas es de 0.9131 −
3 4
0.9115 = 0.0016 entonces el incremento buscado será aproximadamente de
0.0011 por lo que diremos que 𝐹(1.357) = 𝐹(1.35) + 0.0011 = 0.9115 +
0.0011 = 0.9126 y por tanto 𝐹(−1.357) = 1 − 𝐹(1.357) = 1 − 0.9126 =
0.0874

Ejercicio 2. Sea 𝑿 ~ 𝑵(𝟎, 𝟏). Hallar

c) 𝑷(𝑿 < 1.79)


d) 𝑷(𝑿 > 𝟐. 𝟏𝟒)
e) 𝑷(𝑿 ≥ −𝟏. 𝟐𝟑)
f) 𝑷(𝟏. 𝟓 < 𝑋 < 𝟐)
g) 𝑷(−𝟏. 𝟐 < 𝑋 ≤ 𝟎. 𝟔𝟒)
h) 𝑷(−𝟏. 𝟖 < 𝑋 ≤ −𝟎. 𝟔)

Estamos con una distribución continua por lo que las probabilidades sobre puntos
son 0 y por lo tanto es lo mismo que nos pregunten 𝑃(𝑋 < 𝑎) o 𝑃(𝑋 ≤ 𝑎). Así
pues

e) 𝑃(𝑋 < 1.79) = 𝐹(1.79) = 0.9633


27
RELACIONES LABORALES PRIMER0. CURSO 2022-23
ESTADISTICA
MODELOS DE DISTRIBUCIONES DE PROBABILIDAD. INFERENCIA

f) 𝑃(𝑋 > 2.14) = 1 − 𝐹(2.14) = 1 − 0.9838 = 0.


g) 𝑃(𝑋 ≥ −1.23) = 1 − 𝐹(−1.23) = 1 − (1 − 𝐹(1.23)) = 𝐹(1.23) = 0.8907
h) 𝑃(1.5 < 𝑋 < 2) = 𝐹(2) − 𝐹(1.5) = 0.9772 − 0.9332 = 0.044
i) 𝑃(−1.2 < 𝑋 ≤ 0.64) = 𝐹(0.64) − 𝐹(−1.2) = 𝐹(0.64) − (1 − 𝐹(1.2)) =
𝐹(0.64) + 𝐹(1.2) − 1 = 0.7389 + 0.8849 − 1 = 0.6238
j) 𝑃(−1.8 < 𝑋 ≤ −0.6) = 𝐹(−0.6) − 𝐹(−1.8) = 1 − 𝐹(0.6) − (1 − 𝐹(1.8)) =
𝐹(1.8) − 𝐹(0.6) = 0.9641 − 0.7257 = 0.2384

Ejercicio 3.- Sea 𝑿 ~ 𝑵(𝟎, 𝟏). Hallar

a) 𝑷(|𝑿| < 2)
b) 𝑷(|𝑿| > 1.2)
c) 𝑷(|𝑿 − 𝟏| < 1.5)
d) 𝑷(|𝑿 − 𝟎. 𝟓| > 1)
e) 𝑷(𝟐𝑿 − 𝟏 < 𝑋 + 2)
f) 𝑷(𝑿𝟐 < 4)

a) 𝑃(|𝑋| < 2) = 𝑃(−2 < 𝑋 < 2) = 𝐹(2) − 𝐹(−2) = 𝐹(2) − (1 − 𝐹(2)) =


2𝐹(2) − 1 = 2 ∙ 0.9772 − 1 = 0.9544
b) 𝑃(|𝑋| > 1.2) = 1 − 𝑃(|𝑋| ≤ 1.2) = 1 − (2𝐹(1.2) − 1) = 2(1 − 𝐹(1.2)) =
2(1 − 0.8849) = 2 ∙ 0.1151 = 0.2302
c) 𝑃(|𝑋 − 1| < 1.5) = 𝑃(−1.5 < 𝑋 − 1 < 1.5) = 𝑃(−0.5 < 𝑋 < 2.5) =
𝐹(2.5) − 𝐹(−0.5) = 𝐹(2.5) − (1 − 𝐹(0.5)) = 𝐹(2.5) + 𝐹(0.5) − 1 =
0.9938 + 0.6915 − 1 = 0.6853
d) 𝑃(|𝑋 − 0.5| > 1) = 1 − 𝑃(|𝑋 − 0.5| ≤ 1) = 1 − 𝑃(−1 ≤ 𝑋 − 0.5 ≤ 1) = 1 −
𝑃(−0.5 ≤ 𝑋 ≤ 1.5) = 1 − (𝐹(1.5) − 𝐹(−0.5)) = 1 − (𝐹(1.5) −
(1 − 𝐹(0.5))) = 2 − 𝐹(1.5) − 𝐹(0.5) = 2 − 0.9332 − 0.6915 = 0.3753
e) 𝑃(2𝑋 − 1 < 𝑋 + 2) = 𝑃(𝑋 < 3) = 𝐹(3) = 0.9986
f) 𝑃(𝑋 2 < 4) = 𝑃(−2 < 𝑋 < 2) = 𝐹(2) − 𝐹(−2) = 2𝐹(2) − 1 = 2 ∙ 0.9772 −
1 = 0.9544

La tabla también se puede utilizar en sentido contrario, es decir resolver la ecuación


𝐹(𝑥) = 𝑎 siendo 𝑎 el valor conocido. En este caso se trata de buscar el valor de 𝑎 en
el interior de la tabla la variable tomará el valor 𝑥 definido por la fila y columna a la
que pertenece 𝑎.

Ejercicio 1.- Sea 𝑿 ≈ 𝑵(𝟎, 𝟏). Hallar

28
RELACIONES LABORALES PRIMER0. CURSO 2022-23
ESTADISTICA
MODELOS DE DISTRIBUCIONES DE PROBABILIDAD. INFERENCIA

a) Valor de 𝒙 para que 𝑭(𝒙) = 𝟎. 𝟖𝟕𝟐𝟗


b) Valor de 𝒙 para que 𝑭(𝒙) = 𝟎. 𝟐𝟑𝟓𝟖
c) Valor de 𝒙 para que 𝑷(𝑿 > 𝑥) = 𝟎. 𝟏𝟖𝟒𝟏
d) Valor de 𝒙 para que 𝑷(𝑿 > 𝑥) = 𝟎. 𝟗𝟔𝟕𝟖
e) Valor de 𝒙 para que 𝑭(𝒙) = 𝟎. 𝟕𝟎𝟔𝟓
f) Valor de 𝒙 para que 𝑭(𝒙) = 𝟎. 𝟑𝟖

a) 𝐹(𝑥) = 0.8729 buscamos en el interior de la tabla y encontramos este valor


que está en la fila correspondiente al 1.1 y la columna del 0.04 por lo que
será 𝑥 = 1.14
b) 𝐹(𝑥) = 0.2358. Como la imagen es menor que 0.5 entonces no se puede
buscar directamente en la tabla por lo que habrá qu aplicar la propiedad que
nos dice que 𝐹(−𝑥) = 1 − 𝐹(𝑥) luego 𝐹(−𝑥) = 1 − 0.2358 = 0.7642 y
buscando en el interior de la tabla obtenemos que −𝑥 = 0.72 de donde 𝑥 =
−0.72
c) 𝑃(𝑋 > 𝑥) = 0.1841 ⟹ 𝐹(𝑥) = 1 − 0.1841 = 0.8159 y la tabla nos dice
que 𝑥 = 0.9
d) 𝑃(𝑋 > 𝑥) = 0.9678 ⟹ 𝐹(𝑥) = 1 − 0.9678 = 0.322 que es menor que
0.5 por lo que 𝐹(−𝑥) = 1 − 0.322 =0.9678 y la tabla nos dice −𝑥 =
1.85 ⟹ 𝑥 = −1.85
e) 𝐹(𝑥) = 0.7065. Buscando en el interior de la tabla, no hay ningún valor que
nos de 0.7065 por lo que buscamos los que lo encierran, obteniendose que
𝐹(0.54) = 0.7054 y 𝐹(0.55) = 0.7088 por lo que a un incremento en
abscisas de 0.01 le corresponde un incremento en ordenadas de 0.0034 por
lo que, a un incremento en ordenadas de 0.7065 − 0.7054 = 0.0011 le
corresponderá un incremento en abscisas 𝛼 y por una regla de tres, 𝛼 =
0.01∙0.0011 0.11
= ≅ 0.003 y en definitiva 𝑥 = 0.54 + 0.003 = 0.543. El cálculo
0.0034 34
de 𝛼 lo podíamos haber hecho de una forma más comoda aunque menos
precisa, redondeando, diciendo que el incremento en ordenadas para el valor
buscado 0.0011 es aproximadamente la tercera parte del incremento entre
los valores de la tabla 0.0034 por lo que 𝛼 lo podemos aproximar por la
tercera parte de 0.01.
f) 𝐹(𝑥) = 0.38. Por ser menor que 0.5 entonces 𝐹(−𝑥) = 0.62 y en las tablas
encontramos 𝐹(0.30) = 0.6179 y 𝐹(0.31) = 0.6217. Como 0.62 está
aproximadamente en el centro entre 0.6179 y 0.6217 entonces
consideraremos −𝑥 = 0.305 en el centro entre 0.30 y 0.31. Y en definitiva
𝑥 = −0.305

29
RELACIONES LABORALES PRIMER0. CURSO 2022-23
ESTADISTICA
MODELOS DE DISTRIBUCIONES DE PROBABILIDAD. INFERENCIA

Ejercicio2 Sea 𝑿 ≈ 𝑵(𝟎, 𝟏). Hallar

a) Mediana
b) 𝑸𝟑
c) 𝑸𝟏
d) Valor de 𝒙 para que 𝑷(|𝑿| ≤ 𝒙) = 𝟎. 𝟖
e) Valor de 𝒙 para que 𝑷(|𝑿| > 𝑥) = 𝟎. 𝟔

a) La mediana es aquel valor que divide a la población en dos partes iguales, es


1
decir 𝐹(𝑥) = 2 = 0.5 y en nuestro caso este valor es el primero que aparece
en la tabla y corresponde al origen, 𝑀𝑒 = 0
3
b) En este caso 𝐹(𝑥) = 4 = 0.75, mirando en la tabla tenemos 𝐹(0.67) =
0.7486 y 𝐹(0.68) = 0.7517 por lo que tomaremos 𝑄3 = 0.675
1
c) 𝐹(𝑥) = 4 = 0.25 de donde 𝐹(−𝑥) = 0.75 y por el apartado anterior, −𝑥 =
0.675 de donde 𝑄1 = −0.675
d) 𝑃(|𝑋| ≤ 𝑥) = 𝑃(−𝑥 ≤ 𝑋 ≤ 𝑥) = 𝐹(𝑥) − 𝐹(−𝑥) = 𝐹(𝑥) − (1 − 𝐹(𝑥)) =
2𝐹(𝑥) − 1 luego la información que nos dan es 2𝐹(𝑥) − 1 = 0.8 de donde
𝐹(𝑥) = 0.9 y mirando en las tablas y aproximando obtenemos 𝑥 = 1.282
e) 𝑃(|𝑋| > 𝑥) = 𝑃(𝑋 > 𝑥) + 𝑃(𝑋 < −𝑥) = 1 − 𝐹(𝑥) + 𝐹(−𝑥) = 2(1 − 𝐹(𝑥))
luego la información que nos dan es 2(1 − 𝐹(𝑥)) = 0.6 de donde 𝐹(𝑥) = 0.7
y mirando en las tablas y aproximando obtenemos 𝑥 = 0.525

Pasemos ahora a definir una normal general. Si una variable 𝑋 ≈ 𝑁(𝜇, 𝜎); 𝜎 > 0 es
porque su densidad viene dada por

1 (𝑥−𝜇)2

𝑓(𝑥) = 𝑒 2𝜎2 𝑥∈ℝ
√2𝜋𝜎

y sabemos que 𝐸[𝑋] = 𝜇 y 𝑉𝑎𝑟(𝑋) = 𝜎 2


𝑋−𝜇
Finalmente sabemos que si 𝑋 ≈ 𝑁(𝜇, 𝜎) entonces la variable 𝑍 = sigue una
𝜎
distribución normal tipificada, es decir 𝑍 ≈ 𝑁(0,1)

Lo que nos permite utilizar la tabla de la normal tipificada para hallar probabilidades
con cualquier otra distribución normal, sin más que tipificar la variable.

30
RELACIONES LABORALES PRIMER0. CURSO 2022-23
ESTADISTICA
MODELOS DE DISTRIBUCIONES DE PROBABILIDAD. INFERENCIA

Ejercicio 3. Sea 𝑿 ≈ 𝑵(𝟏, 𝟐). Hallar

a) 𝑭𝑿 (𝟑)
b) 𝑷(𝑿 ≤ 𝟐. 𝟓)
c) 𝑷(𝑿 > 3.5)
d) 𝑷(|𝑿| < 1.5)
e) 𝑷(|𝑿| > 1)
a) Como la variable es una normal que no es la estándar, entonces para poder
𝑋−1
utilizar las tablas habrá que tipificar la variable, mediante la expresión 𝑍 =
2
puesto que en nuestro caso 𝜇 = 1 y 𝜎 = 2 sabiendo que 𝑍 ≈ 𝑁(0,1) luego
3−1
𝐹𝑋 (3) = 𝐹𝑍 ( ) = 𝐹𝑍 (1) = 0.8413 sin más que mirar en las tablas.
2
𝑋−1 2.5−1
b) Análogamente, 𝑃(𝑋 ≤ 2.5) = 𝑃 ( ≤ ) = 𝑃(𝑍 ≤ 0.75) = 0.7734
2 2
c) 𝑃(𝑋 > 3.5) = 1 − 𝑃(𝑋 ≤ 3.5) = 1 − 𝑃(𝑍 ≤ 1.25) = 1 − 0.8944 = 0.1056
−1.5−1 1.5−1
d) 𝑃(|𝑋| < 1.5) = 𝑃(−1.5 < 𝑋 < 1.5) = 𝑃 ( <𝑍< )=
2 2
𝑃(−1.25 < 𝑍 < 0.25) = 𝐹𝑍 (0.25) − 𝐹𝑍 (−1.25) = 𝐹𝑍 (0.25) − (1 − 𝐹𝑍 (1.25))
=
= 𝐹𝑍 (0.25) + 𝐹𝑍 (1.25) − 1 = 0.5987 + 0.8944 − 1 = 0.4931
e) P(|𝑋| > 1) = 𝑃(𝑋 < −1) + 𝑃(𝑋 > 1) = 𝑃(𝑋 < −1) + 1 − 𝑃(𝑋 ≤ 1) =

−1 − 1 1−1
𝑃 (𝑍 < ) + 1 − 𝑃 (𝑍 ≤ ) = 𝐹𝑍 (−1) + 1 − 𝐹𝑍 (0) =
2 2

= 1 − 𝐹𝑍 (1) + 1 − 𝐹𝑍 (0) = 2 − 0.8413 − 0.5 = 0.6587

Ejercicio 4 Sea 𝑿 ≈ 𝑵(𝟓, 𝟐). Hallar

a) Mediana
b) 𝑸𝟑
c) 𝑸𝟏

𝑥−5 𝑥−5
a) 𝐹𝑋 (𝑥) = 0.5 luego 𝐹𝑍 ( ) = 0.5 y por lo tanto = 0 obteniéndose que
2 2
𝑀𝑒 = 5
𝑥−5 𝑥−5
b) 𝐹𝑋 (𝑥) = 0.75 luego 𝐹𝑍 ( ) = 0.75 y por lo tanto = 0.675
2 2
obteniéndose que 𝑄3 = 6.35
𝑥−5 𝑥−5
c) 𝐹𝑋 (𝑥) = 0.25 luego 𝐹𝑍 ( ) = 0.25 y por lo tanto = −0.675
2 2
obteniéndose que 𝑄1 = 3.65

31
RELACIONES LABORALES PRIMER0. CURSO 2022-23
ESTADISTICA
MODELOS DE DISTRIBUCIONES DE PROBABILIDAD. INFERENCIA

Ejercicio 5. Se sabe que la temperatura 𝑻 durante mayo está distribuida


normalmente con media 𝝁 = 𝟐𝟓𝒐 y desviación típica 𝝈 = 𝟓𝒐 . Hallar la
probabilidad de que la temperatura durante mayo esté

1) entre 𝟐𝟔𝒐 y 𝟐𝟖𝒐


2) por debajo de 𝟐𝟐𝒐
3) Que temperatura verifica que el 𝟑𝟎% de los días hace una temperatura
inferior a ella.
4) Que temperatura verifica que el 𝟐𝟎% de los días hace una temperatura
superior a ella.

Nos están diciendo que 𝑇 ≈ 𝑁(25,5)


26−25 28−25
1) 𝑃(26 ≤ 𝑇 ≤ 28) = 𝑃 ( ≤𝑍≤ ) = 𝐹𝑍 (0.6) − 𝐹𝑍 (0.2) = 0.7257 −
5 5
0.5793 = 0.1464
2) 𝑃(𝑇 ≤ 22) = 𝑃(𝑍 ≤ −0.6) = 1 − 𝑃(𝑍 ≤ 0.6) = 1 − 0.7257 = 0.2743
𝑡−25 25−𝑡
3) 𝑃(𝑇 ≤ 𝑡) = 0.3; 𝑃 (𝑍 ≤ ) = 0.3; 𝑃 (𝑍 ≤ ) = 0.7 luego por las
5 5
25−𝑡
tablas, = 0.525; 25 − 𝑡 = 2.625; 𝑡 = 22.375
5
𝑡−25
4) 𝑃(𝑇 > 𝑡) = 0.2; 𝑃(𝑇 ≤ 𝑡) = 0.8; 𝑃 (𝑍 ≤ ) = 0.8 luego por las tablas,
5
𝑡−25
= 0.842; 𝑡 − 25 = 4.21; 𝑡 = 29.21
5

Ejercicio 6.- Un especialista en ictiología tropical estudia la supervivencia de un


cierto tipo de pez en aguas contaminadas. Después de una serie de experimentos,
estima que la vida media de este tipo de pez, después de ser colocado en aguas
contaminadas, es de 90 días con una desviación típica de 20 días. En apariencia, la
distribución de los días sobrevividos es normal. ¿Cuál es la probabilidad de que un
pez que está vivo al cabo de 110 días sobreviva más de 120 días?
Sea 𝑋 la variable que mide los días de vida de este pez. Entonces 𝑋 ≈ 𝑁(90,20).
Nos piden

𝑃(𝑋 ≥ 120; 𝑋 ≥ 110) 𝑃(𝑋 ≥ 120) 1 − 𝑃(𝑋 < 120)


𝑃(𝑋 ≥ 120⁄𝑋 ≥ 110) = = =
𝑃(𝑋 ≥ 110) 𝑃(𝑋 ≥ 110) 1 − 𝑃(𝑋 < 110)
=

120 − 90
1 − 𝑃 (𝑍 <
= 20 ) = 1 − 𝑃(𝑍 < 1.5) = 1 − 0.9332 = 0.0668
110 − 90 1 − 𝑃(𝑋 < 1) 1 − 0.8413 0.1587
1 − 𝑃 (𝑋 < 20 )

Ejercicio 7.- La anchura en milímetros de una población de coleópteros sigue una


distribución normal. Se estima que el 69.15% de la población mide menos de 12 mm.

32
RELACIONES LABORALES PRIMER0. CURSO 2022-23
ESTADISTICA
MODELOS DE DISTRIBUCIONES DE PROBABILIDAD. INFERENCIA

y que el 84.13% mide más de 7 mm. ¿Cuál es la probabilidad de que un coleóptero


dado mida más de 10 mm?
La variable 𝑋 que mide la longitud de estos coleópteros sigue una distribución normal
con parámetros desconocidos, es decir 𝑋 ≈ 𝑁(𝜇, 𝜎) pero sabemos que 𝑃(𝑋 ≤ 12) =
0.6915 y que 𝑃(𝑋 ≥ 7) = 0.8413 por lo tanto

12 − 𝜇 12 − 𝜇
𝑃(𝑋 ≤ 12) = 0.6915; 𝑃 (𝑍 ≤ ) = 0.6915; = 0.5
𝜎 𝜎
7−𝜇 7−𝜇
𝑃(𝑋 ≥ 7) = 0.8413; 𝑃 (𝑍 ≥ ) = 0.8413; 𝑃 (𝑍 < ) = 0.1587;
𝜎 𝜎
𝜇−7 𝜇−7
𝑃 (𝑍 < ) = 0.8413; =1
𝜎 𝜎
12 − 𝜇 = 0.5𝜎 5
Habrá que resolver el sistema { sumando 1.5𝜎 = 5; 𝜎 = 1.5 ≅ 3.33
𝜇−7=𝜎
por lo que 𝜇 ≅ 10.33 Si aceptamos que 𝑋 ≈ 𝑁(10.33, 3.33) entonces

10 − 10.33
𝑃(𝑋 > 10) = 𝑃 (𝑍 > ) = 𝑃(𝑍 > −0.1) = 𝑃(𝑍 ≤ 0.1) = 0.5398
3.33

33
RELACIONES LABORALES PRIMER0. CURSO 2022-23
ESTADISTICA
MODELOS DE DISTRIBUCIONES DE PROBABILIDAD. INFERENCIA

INFERENCIA.-

En este último epígrafe vamos a abordar algunos métodos que nos permitan
emitir opinión sobre un parámetro desconocido en una distribución dada. Para ello
supondremos que una variable aleatoria responde a un modelo de probabilidad
conocido del que sin embargo desconocemos algún parámetro. Esto lo aplicaremos
para la distribución normal.

CONTRASTES DE HIPOTESIS.

Este procedimiento consiste en la emisión de una opinión, a la que


someteremos a un chequeo probabilístico que nos permitirá darla por buena o
rechazarla.

Para formalizar esto diremos que existe una hipótesis que creemos que es
cierta y que denominaremos HIPOTESIS NULA denotándola como 𝐻0 frente a la
opinión de que esto no es cierto y que denominaremos como HIPOTESIS ALTERNATIVA
denotándola como 𝐻1 por ejemplo:

Consideramos un experimento consistente en el lanzamiento de un dado un número


determinado de veces, podemos conjeturar si el dado está equilibrado o no, y plantear
las hipótesis excluyentes:

𝐻0 𝐸𝑙 𝑑𝑎𝑑𝑜 𝑒𝑠𝑡á 𝑒𝑞𝑢𝑖𝑙𝑖𝑏𝑟𝑎𝑑𝑜


𝐻1 𝐸𝑙 𝑑𝑎𝑑𝑜 𝑒𝑠𝑡á 𝑡𝑟𝑢𝑐𝑎𝑑𝑜

Si el dado es <<legal>>, la probabilidad de obtener cada una de las caras no debe


1
desviarse demasiado de 6, por lo que podemos plantear estas hipótesis de la forma

1
𝐻0 𝑝𝑖 = ∀𝑖 = 1, 2, ⋯ , 6
6
6
1
𝐻1 𝑝𝑖 ≠ 𝑝𝑎𝑟𝑎 𝑎𝑙𝑔ú𝑛 𝑖 = 1, 2, ⋯ , 6 𝑦 ∑ 𝑝𝑖 = 1
6
𝑖=1

donde 𝑝𝑖 denota la probabilidad de obtener la cara i-ésima del dado.

Otro ejemplo podría ser el siguente:

Suponemos que la estatura de los alumnos de Relaciones Laborales de la Universidad


de Almería sigue una distribución normal cuya media desconocemos y con varianza
𝜎 2 = 25𝑐𝑚2. Por algún motivo creemos que el parámetro media es 𝜇 ≤ 174𝑐𝑚. Esto
se formaliza como
34
RELACIONES LABORALES PRIMER0. CURSO 2022-23
ESTADISTICA
MODELOS DE DISTRIBUCIONES DE PROBABILIDAD. INFERENCIA

𝐻0 : 𝜇 ≤ 174 𝑓𝑟𝑒𝑛𝑡𝑒 𝑎 𝐻1 : 𝜇 > 174

Para chequear si la hipótesis nula es correcta o no necesitamos obtener una


muestra (resultados de aplicar la variable que estamos estudiando a un número
determinado de individuos) que denotaremos como 𝒙(𝑥1 , 𝑥2 , ⋯ , 𝑥𝑛 ).

Es a partir de estos resultados, cuando podremos emitir una opinión sobre si


creemos que es correcta la hipótesis nula o no. Para ello, dentro del conjunto de todos
los resultados experimentales posibles en la muestra escogeremos un subconjunto que
denominaremos Región Crítica y que denotaremos como 𝐶 de forma que si la
muestra pertenece a dicha región crítica rechazaremos 𝐻0 y en caso contrario la
aceptaríamos. A la región complementaria de la región crítica se le llama Región de
Aceptación. Es decir, el hecho de rechazar o admitir la hipótesis nula depende de la
muestra que escojamos, y en consecuencia podría ocurrir que una determinada
muestra nos condujese a emitir una opinión errónea.

Así pues, como todo en Estadística, esta afirmación de que creemos o no en la


hipótesis nula está sometida a un margen de error. Podemos rechazar 𝐻0 siendo esta
cierta y también podemos aceptarla siendo falsa.

𝛼 (𝑜 𝑒𝑟𝑟𝑜𝑟 𝑑𝑒 𝑡𝑖𝑝𝑜 𝐼) = 𝑃(𝑅𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 ⁄𝐻0 𝑐𝑖𝑒𝑟𝑡𝑎)

𝛽 (𝑜 𝑒𝑟𝑟𝑜𝑟 𝑑𝑒 𝑡𝑖𝑝𝑜 𝐼𝐼) = 𝑃(𝐴𝑐𝑒𝑝𝑡𝑎𝑟 𝐻0 ⁄𝐻0 𝑓𝑎𝑙𝑠𝑎)

Al error 𝛼 se le suele llamar como tamaño del test o nivel de significación del
test.

Lo ideal sería encontrar una región crítica para la cual ambos errores tuviesen
probabilidad cero, pero desafortunadamente esta situación no se da (salvo situaciones
triviales), pues, usualmente al reducir la probabilidad de un tipo de error, aumenta la
probabilidad del otro. El procedimiento que se utiliza es limitar la probabilidad del
error tipo I y entonces buscar una región crítica tal que la probabilidad del error tipo II
sea lo más pequeña posible.

Ejemplo.-

Supongamos que un individuo es acusado de un delito y puede elegir ser


juzgado por dos jueces diferentes, los cuales plantean su decisión como un contraste
de hipótesis de la forma que aparece en la siguiente tabla:

JUEZ A JUEZ B
𝐻0 : 𝐸𝑠 𝑖𝑛𝑜𝑐𝑒𝑛𝑡𝑒 𝐻0 : 𝐸𝑠 𝑐𝑢𝑙𝑝𝑎𝑏𝑙𝑒
𝐻1 : 𝐸𝑠 𝑐𝑢𝑙𝑝𝑎𝑏𝑙𝑒 𝐻1 : 𝐸𝑠 𝑖𝑛𝑜𝑐𝑒𝑛𝑡𝑒

35
RELACIONES LABORALES PRIMER0. CURSO 2022-23
ESTADISTICA
MODELOS DE DISTRIBUCIONES DE PROBABILIDAD. INFERENCIA

Si las hipótesis fuesen simétricas, sería indiferente ser juzgado por cualquiera
de ellos.

Analicemos esta situación considerando la filosofía de los errores que hemos


propuesto anteriormente

La hipótesis nula del Juez A consiste en que el acusado es inocente, por lo que
los errores que puede cometer son los siguientes:

𝛼 = 𝑃(𝑅𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 ⁄𝐻0 𝑐𝑖𝑒𝑟𝑡𝑎) = 𝑃(𝐷𝑒𝑐𝑙𝑎𝑟𝑎𝑟𝑙𝑜 𝑐𝑢𝑙𝑝𝑎𝑏𝑙𝑒 𝑠𝑖𝑒𝑛𝑑𝑜 𝑖𝑛𝑜𝑐𝑒𝑛𝑡𝑒)

que fijaremos pequeño

𝛽 = 𝑃(𝐴𝑐𝑒𝑝𝑡𝑎𝑟 𝐻0 ⁄𝐻0 𝑓𝑎𝑙𝑠𝑎) = 𝑃(𝐷𝑒𝑐𝑙𝑎𝑟𝑎𝑟𝑙𝑜 𝑖𝑛𝑜𝑐𝑒𝑛𝑡𝑒 𝑠𝑖𝑒𝑛𝑑𝑜 𝑐𝑢𝑙𝑝𝑎𝑏𝑙𝑒)

que es el mínimo posible

Para este juez, lo importante es que la proporción de inocentes que vayan a la


cárcel sea muy pequeña y controlada por él: Para ello tiene que hacer la concesión de
que la proporción de culpables que queden libres no esté controlada por él aunque
pretenderá que sea lo más pequeña posible pero, aún así, es posible que sea
relativamente grande.

Por ello, la filosofía de este juez consiste en que todo el mundo es inocente
mientras no se demuestre lo contrario, por lo que su hipótesis nula o de partida es que
el individuo que tiene delante es inocente y, si no tiene una evidencia clara en contra
de esta afirmación, no lo declarará culpable.

Para el Juez B , su hipótesis nula es que el acusado es culpable y los errores


que puede cometer son:

𝛼 = 𝑃(𝑅𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 ⁄𝐻0 𝑐𝑖𝑒𝑟𝑡𝑎) = 𝑃(𝐷𝑒𝑐𝑙𝑎𝑟𝑎𝑟𝑙𝑜 𝑖𝑛𝑜𝑐𝑒𝑛𝑡𝑒 𝑠𝑖𝑒𝑛𝑑𝑜 𝑐𝑢𝑙𝑝𝑎𝑏𝑙𝑒)

que fijaremos pequeño

𝛽 = 𝑃(𝐴𝑐𝑒𝑝𝑡𝑎𝑟 𝐻0 ⁄𝐻0 𝑓𝑎𝑙𝑠𝑎) = 𝑃(𝐷𝑒𝑐𝑙𝑎𝑟𝑎𝑟𝑙𝑜 𝑐𝑢𝑙𝑝𝑎𝑏𝑙𝑒 𝑠𝑖𝑒𝑛𝑑𝑜 𝑖𝑛𝑜𝑐𝑒𝑛𝑡𝑒 )

que es el mínimo posible

36
RELACIONES LABORALES PRIMER0. CURSO 2022-23
ESTADISTICA
MODELOS DE DISTRIBUCIONES DE PROBABILIDAD. INFERENCIA

Este juez pretende que la proporción de culpables que queden libres sea muy
pequeña y controlada por él, mientras que la proporción de inocentes que vayan a la
cárcel sea mínima pero incontrolada, por lo que podría ser elevada

Por lo tanto, es evidente que este juez tiene como hipótesis de partida que el
acusado es culpable y a no ser que demuestre fehacientemente que es inocente será
declarado como tal.

Como podemos observar claramente en este ejemplo, en el que hay involucrado un


claro componente ético, ambas hipótesis no son simétricas puesto que parece
bastante claro que no es indiferente la elección del juez a la hora de la obtención un
veredicto de culpabilidad o inocencia.

Como el trabajo con toda la muestra suele ser engorroso, se utilizan algunas
funciones aplicadas a la muestra que nos permitirán ver con más facilidad si el
resultado muestral está en la región crítica o no.

Aquí solo vamos a estudiar el caso de distribuciones normales de las que


conocemos su varianza y queremos emitir alguna opinión sobre su media. Más en
concreto

Sea una variable que sigue una distribución normal 𝒩(𝜇, 𝜎 2 ) donde 𝜎 es
conocida. Entonces, exigiendo que el nivel de significación sea 𝛼 vamos a considerar
3 situaciones y en cada una indicaremos cual sería la región de aceptación

En todos los casos utilizaremos la función

𝑋 − 𝜇0
𝑍 = √𝑛
𝜎
donde

𝑋 𝑒𝑠 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙; 𝑛: 𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎

que sabemos que sigue una distribución normal tipificada 𝒩(0, 1)

1) El contraste

𝐻0 : 𝜇 ≤ 𝜇0 𝑓𝑟𝑒𝑛𝑡𝑒 𝑎 𝐻1 : 𝜇 > 𝜇0

37
RELACIONES LABORALES PRIMER0. CURSO 2022-23
ESTADISTICA
MODELOS DE DISTRIBUCIONES DE PROBABILIDAD. INFERENCIA

con región crítica

𝑍 > 𝑧1−𝛼

2) El contraste

𝐻0 : 𝜇 ≥ 𝜇0 𝑓𝑟𝑒𝑛𝑡𝑒 𝑎 𝐻1 : 𝜇 < 𝜇0

con región crítica

𝑍 < 𝑧𝛼

3) El contraste

𝐻0 : 𝜇 = 𝜇0 𝑓𝑟𝑒𝑛𝑡𝑒 𝑎 𝐻1 : 𝜇 ≠ 𝜇0

con región crítica

|𝑍| > 𝑧1−𝛼⁄2

Ejemplo.-

Una empresa está interesada en que la demanda mensual de un cierto producto sea al
menos de 200 unidades en promedio, y desea contrastarlo, con un nivel de
significación del 5%, a partir de una muestra de tamaño 36 que reflejó una media
muestral de 210 unidades, suponiendo que dicha demanda sigue una distribución
Normal de varianza igual a 121.

El contraste es

𝐻0 : 𝜇 ≥ 200 𝑓𝑟𝑒𝑛𝑡𝑒 𝑎 𝐻1 : 𝜇 < 200

La función será:

𝑋 − 𝜇0 𝑋 − 200
𝑍 = √𝑛 = √36
𝜎 11
Región crítica:

𝐶 = {𝑍 < 𝑧0.05 } = {𝑍 < −1.645}

210 − 200
𝑍𝑒𝑥𝑝 = 6 = 5.45 ∉ 𝐶
11
Por tanto, aceptaría 𝐻0 .

38
RELACIONES LABORALES PRIMER0. CURSO 2022-23
ESTADISTICA
MODELOS DE DISTRIBUCIONES DE PROBABILIDAD. INFERENCIA

Ejemplo.-

Se supone que la puntuación obtenida por un opositor en una prueba es una variable
aleatoria que sigue una distribución normal con desviación típica 6 puntos. Se toma
una muestra aleatoria de 36 opositores que arroja una media de 35 puntos en dicha
prueba. ¿Se puede afirmar, con un nivel de significación del 5%, que la calificación
media del total de opositores en la citada prueba es de 37 puntos?

1 − 𝛼⁄2 = 0.975; 𝑧0.975 = 1.96 luego la región crítica será


|𝑍| > 1.96

35 − 37
𝑍𝑒𝑥𝑝 = √36 = −2; |−2| > 1.96
6
Por lo que rechazaríamos la hipótesis nula de que la media es de 37 puntos.
Obsérvese que si modificamos el nivel de significación puede cambiar el resultado. Por
ejemplo si exigimos 𝛼 = 0.01 entonces la región crítica viene dada por
1 − 𝛼 ⁄2 = 0.995; 𝑧0.995 = 2.575; |𝑍| > 2.575
Como |−2| ≤ 2.575 entonces sí aceptaríamos la hipótesis nula de que la media es 37
puntos.

39
RELACIONES LABORALES PRIMER0. CURSO 2022-23
ESTADISTICA
MODELOS DE DISTRIBUCIONES DE PROBABILIDAD. INFERENCIA

INTERVALOS DE CONFIANZA.

En muchas situaciones podemos considerar insuficiente la asignación de un


valor concreto a un parámetro desconocido:

 Quizás una afirmación del tipo <<la estatura media de los españoles es de 170
cm.>> es demasiado categórica.
 Parece más razonable establecer sentencias del tipo <<la estatura media de los
españoles está comprendida entre 168 y 173 cm.>>

Ejemplo.-
Supongamos que una empresa empaquetadora de café, imprime en los
paquetes que contienen 1 Kgr., y esta empresa decide revisar la maquinaria si tiene
evidencia que realmente se pone en los paquetes menos de 980 gr. o más de 1010 gr.
Si la cantidad (en gramos) de café que se deposita en cada paquete sigue una
determinada distribución de parámetro media 𝜇, la empresa no tendría motivos
evidentes para revisar la maquinaria si a partir de una muestra se detectase que el
intervalo [985, 1005] contiene al verdadero valor de 𝜇 con una probabilidad muy
alta.

Definiremos como 1 − 𝛼 la probabilidad de cobertura del intervalo en


cuestión, es decir, 1 − 𝛼 es la probabilidad de que el intervalo dado contenga al
verdadero parámero que estamos buscando. También se le llama nivel de confianza.
Así pues 𝛼 será la probabilidad de que nos equivoquemos y el verdadero valor del
parámetro esté fuera del intervalo construido.

Puesto que estamos en un planteamiento frecuentista de la estadística, la


interpretación de esta metodología también lo es: "Si construimos una secuencia de
intervalos de confianza a nivel 1 − 𝛼, cada vez con distintas realizaciones de la
muestra, esperamos que al menos el 100(1 − 𝛼)% de ellos contendrán al verdadero
valor del parámetro". O bien, podemos afirmar que si construimos un intervalo de
confianza al nivel 1 − 𝛼, cuando realizamos el experimento un número grande de
veces en las mismas condiciones, esperamos que de cada 100 intervalos que
construyamos, a lo sumo 𝛼 no contendrán al parámetro desconocido 𝜃.

40
RELACIONES LABORALES PRIMER0. CURSO 2022-23
ESTADISTICA
MODELOS DE DISTRIBUCIONES DE PROBABILIDAD. INFERENCIA

Al igual que hicimos en el caso de los contrastes ce hipótesis, solo veremos


intervalos de confianza para obtener la media en poblaciones que sigan una
distribución normal con varianza conocida.

También en este caso podemos distinguir tres casos, según que se quiera el
intervalo centrado o desplazado hacia izquierda o derecha.

Cuando disponemos de una muestra aleatoria de tamaño 𝑛 extraída de una


población modelada por una variable aleatoria normalmente distribuida, podemos
estar interesados en la construcción de intervalos para 𝜇.

Para obtener un intervalo de confianza al nivel 1 − 𝛼 para 𝜇 en el caso de


que la varianza poblacional 𝜎 2 sea conocida vamos a utilizar los siguientes intervalos

Intervalos para 𝝁 con 𝝈 conocida.


𝐵𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙 𝜎 𝜎
[𝑥̅ − 𝑧1−𝛼⁄2 , 𝑥̅ + 𝑧1−𝛼⁄2 ]
√𝑛 √𝑛
𝐴𝑐𝑜𝑡𝑎𝑑𝑜 𝐼𝑛𝑓𝑒𝑟𝑖𝑜𝑟𝑚𝑒𝑛𝑡𝑒 𝜎
[𝑥̅ − 𝑧1−𝛼 , ∞[
√𝑛
𝐴𝑐𝑜𝑡𝑎𝑑𝑜 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑚𝑒𝑛𝑡𝑒 𝜎
]−∞, 𝑥̅ + 𝑧1−𝛼 ]
√𝑛
𝑧𝛼 es el valor tal que 𝑃{𝑍 ≤ 𝑧𝛼 } = 𝛼 con 𝑍 ≈ 𝒩(0, 1)

Ejemplo.-

La demanda mensual de un cierto producto sigue una distribución normal con varianza
3600. A partir de una muestra de tamaño 36 se calculó que 𝑥̅ = 200. Vamos a
construir un intervalo de confianza al 95% para la media 𝜇 de la distribución.

En este ejercicio nos encontramos en la situación en la que disponemos de una


muestra aleatoria normal en la que la desviación típica es conocida. Por lo tanto, el
intervalo de confianza al nivel 0.95 viene dado por la expresión
𝜎 𝜎
[𝑥̅ − 𝑧0.975 , 𝑥̅ + 𝑧0.975 ]
√𝑛 √𝑛

Puesto que el cuantil 𝑧0.975 = 1.96, sustituyendo en la expresión anterior tenemos


que

41
RELACIONES LABORALES PRIMER0. CURSO 2022-23
ESTADISTICA
MODELOS DE DISTRIBUCIONES DE PROBABILIDAD. INFERENCIA
60 60
[200 − 1.96 , 200 + 1.96 ] = [180.4 , 219.6]
√36 √36

Si estuviésemos interesados en los intervalos unilaterales:

𝜎 60
[𝑥̅ − 𝑧0.95 , ∞[ = [200 − 1.645 , ∞[ = [183.55, ∞[
√𝑛 √36

𝜎 60
]−∞, 𝑥̅ + 𝑧0.95 ] = ]−∞, 200 + 1.645 ] = ]−∞, 216.45]
√𝑛 √36

En el caso de trabajar con intervalos bilatelares (centrados) se habla de la


longitud del intervalo como la diferencia entre el extremo superior y el extremo
incferior

𝜎 𝜎 𝜎 𝜎
𝑙 = 𝑥̅ + 𝑧1−𝛼⁄2 − (𝑥̅ − 𝑧1−𝛼⁄2 ) = 𝑥̅ + 𝑧1−𝛼⁄2 − 𝑥̅ + 𝑧1−𝛼⁄2 =
√𝑛 √𝑛 √𝑛 √𝑛
𝜎
= 2𝑧1−𝛼⁄2
√𝑛

Asimismo, se define el radio de dicho intervalo como la mitad de su longitud, es decir


𝜎
𝑟 = 𝑧1−𝛼⁄2
√𝑛

frecuentemente se trabaja con el radio como error máximo cometido en el intervalo


(se está suponiendo que el verdadero valor está dentro del intervalo y que
consideramos como tal el centro del mismo, por lo que el error máximo será la
distancia entre el centro y cualquiera de sus extremos, es decir el radio).

Es fácil observar que al aumentar el tamaño muestral (𝑛) se disminuye el


radio del intervalo y en definitiva su tamaño. Estamos consiguiendo con la misma
probabilidad de cobertura, construir un intervalo más pequeño para la media
poblacional.

42
RELACIONES LABORALES PRIMER0. CURSO 2022-23
ESTADISTICA
MODELOS DE DISTRIBUCIONES DE PROBABILIDAD. INFERENCIA

Esto hace que en algunos ejercicios nos pidan que busquemos cual debe ser el
tamaño muestral para que el intervalo que construyamos tenga un determinado
tamaño.

Ejemplo.-

Se sabe que el peso de los tarros de paté que fabrica una empresa sigue una
distribución normal con desviación típica 25 g. Una muestra aleatoria de 100 tarros
de esa fábrica tiene un peso medio de 230 g.

a) Calcule un intervalo de confianza para la media de la población con un nivel de


confianza del 96%.

b) ¿Qué error máximo se ha cometido en el intervalo anterior?

c) Determine el tamaño muestral mínimo para que el error máximo cometido al


construir un intervalo de confianza, con el mismo nivel, sea 2 g.

a) Sabemos que 𝑛 = 100, 𝜎 = 25, 𝑥̅ = 230 y 𝛼 = 0.96 por lo que el intervalo de


confianza cuya fórmula es
𝜎 𝜎
[𝑥̅ − 𝑧1−𝛼⁄2 , 𝑥̅ + 𝑧1−𝛼⁄2 ]
√𝑛 √𝑛

en este caso,

1 − 𝛼 = 0.96; 𝛼 = 0.04; 1 − 𝛼 ⁄2 = 0.98

mirando en las tablas 𝑧0.98 = 2.05 por lo que será

25 25
[230 − 2.05 , 230 + 2.05 ] = [224.875, 235.125]
10 10

b) Aplicando la fórmula vista

𝜎 25
𝐸 = 𝑟 = 𝑧1−𝛼⁄2 = 2.05 = 5.125
√𝑛 10

c) Imponiendo la condición que nos dan

𝜎 25 2.05 ∙ 25
𝐸 = 𝑟 = 𝑧1−𝛼⁄2 ≤ 2; 2.05 ≤ 2; √𝑛 ≥ = 25.625
√𝑛 √𝑛 2

Finalmente, elevando al cuadrado en ambos miembros tenemos

43
RELACIONES LABORALES PRIMER0. CURSO 2022-23
ESTADISTICA
MODELOS DE DISTRIBUCIONES DE PROBABILIDAD. INFERENCIA

𝑛 ≥ 656.64

Pero como el tamaño muestral obviamente debe ser un número natural, tomaremos el
siguiente a este, es decir

𝑛 ≥ 657

Ejemplo.-

El peso de los paquetes de sacarina de una determinada marca sigue una ley
normal de media desconocida y desviación típica 0.3 g. Se desea construir un
intervalos de confianza para estimar dicha media, con un nivel de confianza del 98%,
y para ello se toma una muestra aleatoria de 9 paquetes.

a) ¿Que amplitud tendrá dicho intervalo?

b) Obtenga el intervalo sabiendo que los pesos en gramos de los paquetes son: 10,
9.9, 10.04, 9.5, 10.1, 9.8, 10.2, 10, 10.3

Sabemos que 𝑛 = 9, 𝜎 = 0.3, y 𝛼 = 0.96. En este caso

1 − 𝛼 = 0.98; 𝛼 = 0.02; 1 − 𝛼 ⁄2 = 0.99

mirando en las tablas 𝑧0.99 = 2.33 por lo que será

a) Desconocemos la media muestral, pero para la amplitud (es la longitud) del


intervalo no nos hace falta:

𝜎 0.3
𝑙 = 2𝑧1−𝛼⁄2 = 2 ∙ 2.33 = 0.466
√𝑛 3

b) A partir de la muestra obtendremos la media muestral

10 + 9.9 + 10.04 + 9.5 + 10.1 + 9.8 + 10.2 + 10 + 10.3 90.84


𝑥̅ = = ≅ 9.982
9 9
Como hemos visto que la amplitud es 0.466 entonces el radio será 0.233, por lo que
el intervalo pedido será

[9.982 − 0.233, 9.982 + 0.233] = [9.749, 10.215]

44

También podría gustarte