Está en la página 1de 51

Bloque III.

Inferencia estadı́stica
Tema 6. Inferencia. Parte I: estimación

Asignatura: MATEMÁTICAS III

Bloque III/Tema 6) Matematicas III 1 / 47


Contenidos

1 Estimación puntual

2 Estimación por intervalos de confianza


Intervalo de confianza para la media de la población normal con varianza conoc
Mı́nimo tamaño muestral
Intervalo de confianza para la media de la población en muestras grandes
Intervalos de confianza para la media de la población normal con σ 2 desconocid
Intervalo de confianza para la varianza

Bloque III/Tema 6) Matematicas III 2 / 47


Estimación puntual

Contenidos

1 Estimación puntual

2 Estimación por intervalos de confianza


Intervalo de confianza para la media de la población normal con varianza conoc
Mı́nimo tamaño muestral
Intervalo de confianza para la media de la población en muestras grandes
Intervalos de confianza para la media de la población normal con σ 2 desconocid
Intervalo de confianza para la varianza

Bloque III/Tema 6) Matematicas III 3 / 47


Estimación puntual

Estimadores puntuales: introducción

Un estimador puntual de un parámetro de una población es una función, por


ejemplo T , de la información muestral X n = (X1 , . . . , Xn ) que toma un valor
numérico.
Ejemplos de parámetros de poblaciones, estimadores y estimaciones:
Parámetro Estimador: Estimación:
población T (X n ) notación notación
X1 +...+Xn
Media pobl. µ media muestral n X = µ̂ x

Prop. pobl. p prop. muestral p̂ p̂


P 2 2
i Xi −n(X̄ )
Var. pobl. σ2 var. muestral n σ̂2 σ̂2
P 2 2
i Xi −n(X̄ )
Var. pobl. σ2 quasi var. muestral n−1 = n
n−1 σ̂
2
s2 s2

... ... ... ...

En general, θ ... θ̂ θ̂

Bloque III/Tema 6) Matematicas III 4 / 47


Estimación puntual

Estimadores puntuales: propiedades

Insesgado o ausencia de sesgo (sesgo igual a cero).


El sesgo es la diferencia entre el valor esperado del estimador y el valor del
parámetro de interés.
Sesgo[θ̂] = E[θ̂] − θ
Población Estimador Estimador insesgado
parámetro T (X n ) Sesgo Insesgado? de mı́nima varianza?
Media pobl. µ X E[X̄ ] − µ = 0 Sı́ Sı́, si X normal
Prop. pobl. p p̂ E[p̂] − p = 0 Sı́ Sı́
Var. pobl. σ2 σ̂2 E[σ̂2 ] − σ2 6= 0 No No
Var. pobl. σ2 s2 E[s 2 ] − σ2 = 0 Sı́ Sı́, si X normal
En general, θ θ̂ E[θ̂] − θ A menudo Rara vez

Eficiencia. Se mide por la varianza del estimador:


menor varianza ⇒ más eficiencia

Bloque III/Tema 6) Matematicas III 5 / 47


Estimación puntual

Estimadores puntuales: propiedades (cont.)

Un criterio más general para seleccionar estimadores (incluyendo estimadores


insesgados y sesgados) es el error cuadrático medio, definido como

ECM[θ̂] = E[(θ̂ − θ)2 ] = Var[θ̂] + (Sesgo[θ̂])2

Nota:
El error cuadrático medio de un estimador insesgado es igual a su varianza.
Un estimador con menor ECM es mejor.
El estimador insesgado de mı́nima varianza tiene la menor varianza/ECM entre
todos los estimadores.
¿Cómo encontrar una buena definición para un estimador T ?
En algunos casos se conoce un estimador óptimo: estimador insesgado de
mı́nima varianza.
Si no es ası́, existen distintos métodos de construcción de estimadores que
proporcionan resultados razonables, por ejemplo:
Estimación máximo verosı́mil
Método de momentos

Bloque III/Tema 6) Matematicas III 6 / 47


Estimación puntual

Estimación puntual: ejemplo

Las ratios precio-beneficio para una muestra aleatoria de diez acciones negociadas
en la bolsa de NY en un dı́a concreto fueron

10 16 5 10 12 8 4 6 5 4

Emplee un procedimiento de estimación insesgado para obtener estimaciones


puntuales para los siguientes parámetros de la población: media, varianza,
proporción de valores que exceden 8.5.

80
x̄ = =8
10
782 − 10(8)2
s2 = = 15,78
10 − 1
1+1+0+1+1+0+0+0+0+0
p̂ = = 0,4
10

Bloque III/Tema 6) Matematicas III 7 / 47


Estimación puntual

Estimación puntual: ejemplo


2
Sea µ̂ = n(n+1)
(X1 + 2X2 + . . . + nXn ) un estimador de la media de la población basado
en una MAS X n . ¿Es mejor este estimador que la media muestral, X ?.
2
X es un estimador insesgado de µ, con varianza σn .
µ̂ también es insesgado: Y su varianza/ECM es:

" # " #
2 2
E[µ̂] = E (X1 + 2X2 + . . . + nXn ) V[µ̂] = V (X1 + 2X2 + . . . + nXn )
n(n + 1) n(n + 1)
2 !2
2 2 2
= (E[X1 ] + 2E[X2 ] + . . . + nE[Xn ]) =indep. (V[X1 ] + 2 V[X2 ] + . . . + n V[Xn ])
n(n + 1) n(n + 1)
2
=id (µ + 2µ + . . . + nµ) n(n+1)(2n+1)/6
n(n + 1) z }| {
4 22 2 2
n(n+1)/2 =id σ (1 + 2 + . . . + n )
z }| { n 2 (n + 1)2

= (1 + 2 + . . . + n) = µ 2(2n + 1) 2
n(n + 1) = σ
3n(n + 1)
⇒ Sesgo[µ̂] = 0
2 2(2n + 1) 2
ECM[µ̂] = V[µ̂] + 0 = σ
3n(n + 1)

σ 2 /n 3(n + 1)
Eficiencia relativa(X , µ̂) = 2(2n+1) 2
=
σ 2(2n + 1)
3n(n+1)

Para n ≥ 2 este cociente es menor que 1: X es un estimador más eficiente para µ.

Bloque III/Tema 6) Matematicas III 8 / 47


Estimación puntual

Limitaciones de los estimaciones puntuales

La estimación puntual de un parámetro desconocido de una población,


partiendo de una MAS de n observaciones de X , proporciona una
aproximación razonable para el parámetro.

Una estimación puntual no tiene en cuenta la variabilidad del proceso de


estimación, debida entre otras causas a:
El tamaño muestral - una muestra mayor debiera proporcionar una información
más precisa sobre el parámetro de la población.
Variabilidad en la población - una muestra de una población con menos
varianza debiera proporcionar estimaciones más precisas
Que se conozcan otros parámetros de la población.
etc
Estas limitaciones pueden tratarse mediante el uso de estimaciones por intervalos
de confianza, esto es, un método que proporciona un intervalo de valores al que es
probable que pertenezca el valor del parámetro.

Bloque III/Tema 6) Matematicas III 9 / 47


Estimación por intervalos de confianza

Contenidos

1 Estimación puntual

2 Estimación por intervalos de confianza


Intervalo de confianza para la media de la población normal con varianza conoc
Mı́nimo tamaño muestral
Intervalo de confianza para la media de la población en muestras grandes
Intervalos de confianza para la media de la población normal con σ 2 desconocid
Intervalo de confianza para la varianza

Bloque III/Tema 6) Matematicas III 10 / 47


Estimación por intervalos de confianza

Estimación por intervalos de confianza

Sea X n = (X1 , X2 , . . . , Xn ) una MAS de una población X con función de


distribución F que depende de un parámetro desconocido θ.
Un estimador por intervalos de confianza de θ con un nivel  de confianza
(1 − α) = 100(1 − α) % es un intervalo T1 (X n ), T2 (X n ) que satisface

P θ ∈ (T1 (X n ), T2 (X n ) = 1 − α

Interpretación: tenemos una probabilidad (1 − α)  de que el parámetro desconocido


de la población pertenecerá a T1 (X n ), T2 (X n ) .

Niveles de confianza habituales


α 0.01 0.05 0.10
100(1 − α) % 99 % 95 % 90 %

Bloque III/Tema 6) Matematicas III 11 / 47


Estimación por intervalos de confianza

Intervalos de confianza

Un intervalo de confianza para θ con un nivel de confianza 1 − α es el valor


observado del estimador por intervalos de confianza,

T1 (x n ), T2 (x n )

Interpretación: podemos tener una confianza de (1 − α) de que el valor del


parámetro desconocido de la población estará en T1 (x n ), T2 (x n ) .

Bloque III/Tema 6) Matematicas III 12 / 47


Estimación por intervalos de confianza

Obtención de un estimador por intervalos de confianza

1 Se busca una cantidad (aleatoria) relacionada con el parámetro desconocido


θ y con la muestra X n , C (X n , θ), cuya distribución sea conocida y no
dependa del valor del parámetro.
Esta cantidad se conoce como la cantidad pivotal o el pivote para θ

2 Se pueden usar los cuantiles 1 − α/2 y α/2 de esa distribución, y la definición


del estimador por intervalos de confianza, para plantear la ecuación

doble desigualdad
z }| {
P(1 − α/2 cuantil<C (X n , θ)<α/2 cuantil) = 1 − α.

3 Para obtener los extremos del estimador por intervalo de confianza, T1 (X n ) y


T2 (X n ), se resuelve la doble desigualdad en θ.

4 El intervalo de confianza al 100(1 − α) % para θ es (T1 (x n ), T2 (x n )).

Bloque III/Tema 6) Matematicas III 13 / 47


Estimación por intervalos de confianza Intervalo de confianza para la media de la población normal con varianza conoci

Contenidos

1 Estimación puntual

2 Estimación por intervalos de confianza


Intervalo de confianza para la media de la población normal con varianza conoc
Mı́nimo tamaño muestral
Intervalo de confianza para la media de la población en muestras grandes
Intervalos de confianza para la media de la población normal con σ 2 desconocid
Intervalo de confianza para la varianza

Bloque III/Tema 6) Matematicas III 14 / 47


Estimación por intervalos de confianza Intervalo de confianza para la media de la población normal con varianza conoci

Aplicación a la media de la población normal con varianza


conocida
1 Sea X n una MAS de tamaño n obtenida de X .
Bajo los supuestos:
X sigue una distribución normal con parámetros µ y σ 2
σ 2 es conocida (muy poco realista)

2 El estadı́tico X tiene una distribución normal:


 σ 
X ∼ N µ, σX = √
n

3 La cantidad pivotal para µ es:

X̄ − µ
√ ∼ N(0, 1)
σ/ n

4 La desviación tı́pica de X (o de cualquier otro estadı́stico) se conoce como su


error estándar.
Bloque III/Tema 6) Matematicas III 15 / 47
Estimación por intervalos de confianza Intervalo de confianza para la media de la población normal con varianza conoci

Aplicación a la media de la población normal (σ 2 conocida)

3 Si z1−α/2 y zα/2 son los cuantiles


superiores (1 − α/2) y (α/2) de
la distribución N(0, 1), tenemos

P(z1−α/2 < Z < zα/2 ) = 1 − α


" "
1!"
2 2
Densidad normal estándar
Si Z ∼ N(0, 1) entonces
E[Z ] = 0, V[Z ] = 1
! !

z1!"2 = ! z"2 z"2

Z
−zα/2 z }| {
z }| { X̄ − µ
4 Se tiene que P(z1−α/2 < √ < zα/2 ) = 1 − α
σ/ n
Bloque III/Tema 6) Matematicas III 16 / 47
Estimación por intervalos de confianza Intervalo de confianza para la media de la población normal con varianza conoci

Aplicación a la media de la población normal (σ 2 conocida)


5 Resolvemos la doble desigualdad para µ:
X̄ −µ
−zα/2 < √
σ/ n
< zα/2
σ σ
−zα/2 √ <X −µ< zα/2 √
n n
σ σ
−zα/2 √ − X < −µ < −X + zα/2 √
n n
σ σ
zα/2 √ +X >µ> X − zα/2 √
n n
para obtener el estimador por intervalos de confianza
T1 (X n ) T2 (X n )
z }|
σ
{ z }| {
σ 
X − zα/2 √ , X + zα/2 √
n n
6 El intervalo de confianza es:
   
σ σ σ
IC1−α (µ) = x − zα/2 √ , x − zα/2 √ = x ∓ zα/2 √
n n n

Bloque III/Tema 6) Matematicas III 17 / 47


Estimación por intervalos de confianza Intervalo de confianza para la media de la población normal con varianza conoci

Ejemplo 1: cálculo de un intervalo de confianza para µ


Se ha comprobado que el contenido de plomo en el agua, obtenido con un método
determinado, se puede aproximar mediante una variable aleatoria con distribución
normal con desviación tı́pica σ = 3,5 µg /L pero la media (µ) es desconocida.
Un estudio de 49 muestras de agua produce una media de 24.75 µg /L. ¿Cómo
podemos construir un intervalo de confianza al 95 % para µ?
Llamamos X al contenido de plomo en el agua, y sabemos que

X1 , X2 , . . . , X49 ∼i .i .d. N(µ, σ 2 = 3,52 )

Como
σ2 3,52
= = 0,25,
n 49
sabemos que
X̄ ∼ N(µ, 0,25),
y por tanto,
X̄ − µ
∼ N(0, 1).
0,5
Bloque III/Tema 6) Matematicas III 18 / 47
Estimación por intervalos de confianza Intervalo de confianza para la media de la población normal con varianza conoci

Ejemplo 1 (cont.)
Utilizando R o las tablas de la normal, sabemos que, si Z ∼ N(0, 1),

P (−1,96 < Z < 1,96) = 0,95.

Tenemos por tanto que


 
X̄ − µ
P −1,96 < < 1,96 = 0,95.
0,5

Bloque III/Tema 6) Matematicas III 19 / 47


Estimación por intervalos de confianza Intervalo de confianza para la media de la población normal con varianza conoci

Ejemplo 1 (cont.)
Despejando µ en esta expresión obtenemos que

P X̄ − 1,96 × 0,5 < µ < X̄ + 1,96 × 0,5 = 0,95,

es decir, que hay una probabilidad del 95 % de que el intervalo


 
X̄ − 1,96 × 0,5, X̄ + 1,96 × 0,5 ,

contenga el verdadero (y desconocido) valor de µ.


Por ello, si x̄ es la realización particular de X̄ en la muestra observada, nuestro
intervalo de confianza al 95 % va a ser

IC0,95 (µ) = x̄ ± 1,96 × 0,5


= x̄ ± 0,98

En este caso, como x̄ = 24,75 kg,

IC0,95 (µ) = 24,75 ± 0,98


= (23,77, 25,73)

Bloque III/Tema 6) Matematicas III 20 / 47


Estimación por intervalos de confianza Intervalo de confianza para la media de la población normal con varianza conoci

Ejemplo 2: cálculo de un intervalo de confianza para µ


Un proceso industrial produce bolsas de azúcar refinado. Se ha comprobado que los
pesos de las bolsas se pueden aproximar mediante una v.a. con distribución normal con
desviación tı́pica igual a 12 g. Se desea construir un intervalo de confianza al 95 % para el
peso promedio en la población de las bolsas de azúcar fabricadas con este proceso. Para
ello, se toma una muestra aleatoria de 25 bolsas y resulta un peso promedio de 198 g.
Población: X = ”peso de una bolsa (en g)” con X ∼ N(µ, σ 2 = 122 )
 
Objetivo: IC0,95 (µ) = x ∓ zα/2 √σn

Datos:
σ = 12, n = 25, x = 198, 1 − α = 0,95( α2 = 0,025),

zα/2 = z0,025 = 1,96

Por tanto, el intervalo de confianza resulta:


 
12
IC0,95 (µ) = 198 ∓ 1,96 √ = (198 ∓ 4,7) = (193,3, 202,7)
25
Interpretación: Podemos tener una confianza del 95 % de que µ está en (193,3, 202,7)
Bloque III/Tema 6) Matematicas III 21 / 47
Estimación por intervalos de confianza Intervalo de confianza para la media de la población normal con varianza conoci

Interpretación frecuentista del IC: nivel de confianza


En este ejemplo simulado se han generado 150 muestras de tamaño n = 50, de una
distribución X ∼ N(µ = −5, σ 2 = 12 ) y se construyeron 150 IC1−α (µ) con α = 0,1 y
otros 150 intervalos con α = 0,01.
µ está en aprox. 150(0,9) = 135 interv. µ está en aprox. 150(0,99) = 148,5 interv.
(pero no en 150(0,1) = 15) (pero no en 150(0,01) = 1,5)
(1 − α) = 0,9, n = 50 (1 − α) = 0,99, n = 50
150

150
| | | |
| | |
| | | | | |
| | |
|| | || |
| | | |
| | | |
| | | | | |
| | | | | |
| | | |
| | | |
|| | || |
| | | |
| |
| | | | | |
| | | | | |
| | | |
| || | ||
|| ||
| | | | | |
| | | |
100

100
| | | | | |
| || | ||
|| ||
| |
| || | ||
| | | |
| | | |
| |
Indice

Indice
|
| | | | | |
| | | |
| | | |
| | | | | |
| | | |
| | | |
| | | |
| || | ||
|| ||
| | | | | |
| | | |
| |
| | | | | |
| | | | | |
50

50
| |
|| | || |
| | | |
| | | |
| |
|| | || |
| |
| || | ||
| | | |
| |
| || | ||
| | | |
| | | |
| |
| | | | | |
| | | |
|| ||
| | | |
| | | |
| | | |
| |
| | | | | |
| | | |
| | | |
| | | |
0

0
!6.0 !5.5 !5.0 !4.5 !4.0 !6.0 !5.5 !5.0 !4.5 !4.0

Intervalo de confianza Intervalo de confianza

zα/2 σ
 zα/2 σ
 zα/2 σ
La longitud del intervalo, L = x + √
n
− x− √
n
=2 √
n
, aumenta con el nivel
de confianza. ¿Por qué?
Bloque III/Tema 6) Matematicas III 22 / 47
Estimación por intervalos de confianza Intervalo de confianza para la media de la población normal con varianza conoci

Interpretación frecuentista del IC: tamaño muestral


Construimos ahora 150 muestras de tamaño n = 50 y otras 150 de tamaño n = 200, de
una distribución X ∼ N(µ = −5, σ 2 = 12 ) .
µ en aprox. 150(0,9) = 135 interv. µ en aprox. 150(0,9) = 135 interv.
(pero no en 150(0,1) = 15) (pero no en 150(0,1) = 15)
(1 − α) = 0,9, n = 50 (1 − −
α) = 0,9, n = 200

150
150

|
| | || |
| | | |
| | | |
| | |
|| | || |
| | | |
| | |
| | | || |
| | | | | |
| |
| | | || |
|| |
| | | ||
| | ||
| | | || |
| | | | |
| | |
| |
| || | | |
|| | | |
| | | ||
| || | | |

100
100

| | | ||
| | || |
||| || |
|
| || | |
|
| | | |
| | ||
|

Indice
|
Indice

| | |
| | | | |
| | | |
| | | |
| | | ||
|
| | || |
| |
| | || |
| || ||
||
| |||
| | ||
|
| | | | |
| | | |
| |
| | | | ||

50
50

| |
|| | | ||
| | | |
| | | | | |
|| | | | |
| ||
| || | |
| |
| | | |
| || | | |
| | | |
| |
| | |||
| | | ||
|
| | ||
|| | ||
| | |
| | |
|
| | || |
| | | |
||
|
| | | ||
| |
| | | |

0
0

!6.0 !5.5 !5.0 !4.5 !4.0 −6.0 −5.5 −5.0 −4.5 −4.0

Intervalo de confianza Intervalo de confianza

La longitud de los intervalos decrece con el tamaño muestral aumenta. ¿Por qué?

Pregunta: ¿Cuál es el efecto del valor de σ sobre la longitud?

Bloque III/Tema 6) Matematicas III 23 / 47


Estimación por intervalos de confianza Mı́nimo tamaño muestral

Contenidos

1 Estimación puntual

2 Estimación por intervalos de confianza


Intervalo de confianza para la media de la población normal con varianza conoc
Mı́nimo tamaño muestral
Intervalo de confianza para la media de la población en muestras grandes
Intervalos de confianza para la media de la población normal con σ 2 desconocid
Intervalo de confianza para la varianza

Bloque III/Tema 6) Matematicas III 24 / 47


Estimación por intervalos de confianza Mı́nimo tamaño muestral

Mı́nimo tamaño muestral

Un problema muy relacionado con los IC es el de determinar el mı́nimo tamaño


muestral para que nuestra estimación tenga una determinada precisión, o en otras
palabras, para que el error cometido no supere cierta cantidad.
Error de un Intervalo de confianza
El error de una estimación por intervalos de confianza (al nivel 1 − α) es la
semi-amplitud del intervalo obtenido

Bloque III/Tema 6) Matematicas III 25 / 47


Estimación por intervalos de confianza Mı́nimo tamaño muestral

Ejemplo: estimación del tamaño muestral


La longitud de las barras de acero fabricadas en un proceso industrial se pueden
aproximar mediante una v.a. con distribución normal con desviación tı́pica 1.8 mm. El
encargado del proceso desea obtener un intervalo de confianza al 99 % para dicha
longitud, con un tamaño menor o igual a 0.5 mm a cada lado de la media muestral.
¿Qué tamaño muestral serı́a necesario para tener esta propiedad?
Población: X = “longitud de la barra (en mm)” con X ∼ N(µ, σ 2 = 1,82 )
Objetivo: n tal que longitud IC ≤ 1
longitud
z }| {
zα σ
La amplitud del intervalo de confianza es: IC0,99 (µ): 2 √2 ≤ 2(0,5)
z }|= {1
n ≤
Por tanto: n

zα/2 σ
2 √ ≤ 1
n Area=

n ≥ 2zα/2 σ 0.005

n ≥ 22 zα/2
2
σ 2 = (22 )(2,5752 )(1,82 ) = 85,93 ●

z0.005 = 2.575

Se necesitarı́a una muestra de tamaño de al menos 86 observaciones.


Bloque III/Tema 6) Matematicas III 26 / 47
Estimación por intervalos de confianza Mı́nimo tamaño muestral

Mı́nimo tamaño muestral. Ejemplo


¿Cual debe ser el mı́nimo tamaño de una muestra aleatoria de una población
N(µ, σ 2 = 25) para que el error de la estimación de µ (con un nivel de confianza
del 95 %) no sea superior a 0,5?
En este caso, el IC es
σ
x̄ ± zα/2 √
n
Por lo tanto, se pide el mı́nimo valor de n tal que
σ
zα/2 √ ≤ 0,5
n
donde zα/2 = z0,025 = 1,96 y σ = 5.
Despejando n, obtenemos n ≥ 384,16: se necesitan 385 observaciones para
conseguir la precisión deseada.
Observación
Con cálculos similares, podemos obtener los tamaños requeridos para alcanzar cierta
precisión en otros intervalos de confianza.
El valor mı́nimo deberá entenderse siempre como aproximado, especialmente en
aquellos casos en los que el cálculo depende de una muestra previamente obtenida.
Bloque III/Tema 6) Matematicas III 27 / 47
Estimación por intervalos de confianza Intervalo de confianza para la media de la población en muestras grandes

Contenidos

1 Estimación puntual

2 Estimación por intervalos de confianza


Intervalo de confianza para la media de la población normal con varianza conoc
Mı́nimo tamaño muestral
Intervalo de confianza para la media de la población en muestras grandes
Intervalos de confianza para la media de la población normal con σ 2 desconocid
Intervalo de confianza para la varianza

Bloque III/Tema 6) Matematicas III 28 / 47


Estimación por intervalos de confianza Intervalo de confianza para la media de la población en muestras grandes

Intervalo de confianza para la media de la población en


muestras grandes

1 Sea X n una MAS de tamaño n de X .

2 Bajo las hipótesis:


X sigue una distribución (no necesariamente normal) con parámetros µ y σ 2
el tamaño muestral n es grande (n ≥ 30)

3 La cantidad pivotal para µ basada en el Teorema Central del Lı́mite es

X̄ − µ
√ ∼approx. N(0, 1)
σ̂/ n

Bloque III/Tema 6) Matematicas III 29 / 47


Estimación por intervalos de confianza Intervalo de confianza para la media de la población en muestras grandes

Intervalo de confianza para la media de la población en


muestras grandes
Densidad normal estándar
3 Por tanto, si z1−α/2 y zα/2 son los cuantiles
superiores (1 − α/2) y (α/2) de N(0, 1),
tenemos

P(z1−α/2 < Z < zα/2 ) = 1 − α " "


1!"
2 2
! !

z 1!"2 = !z "
2
z"2

Z
−zα/2 z }| {
z }| { X̄ − µ 
4 Imponemos la condición P z1−α/2 < √ < zα/2 = 1 − α
σ̂/ n

Bloque III/Tema 6) Matematicas III 30 / 47


Estimación por intervalos de confianza Intervalo de confianza para la media de la población en muestras grandes

Intervalo de confianza para la media de la población en


muestras grandes

5 Resolvemos la doble desigualdad para µ:

X̄ − µ
−zα/2 < √ < zα/2
σ̂/ n

para obtener el estimador por intervalos de confianza

T1 (X n ) T2 (X n )
z }| { z }| {
 σ̂ σ̂ 
X − zα/2 √ , X + zα/2 √
n n
6 El intervalo de confianza es:
 σ̂ σ̂ 
IC1−α (µ) = x − zα/2 √ , x + zα/2 √
n n

Bloque III/Tema 6) Matematicas III 31 / 47


Estimación por intervalos de confianza Intervalo de confianza para la media de la población en muestras grandes

Intervalo de confianza para la proporción en la población


en muestras grandes
Aplicación de ICs para la media en muestras grandes
Sea X np
, n ≥ 30, una MAS de una distr. Bernoulli con parámetro p (µ = E[X ] = p
y σ = p(1 − p)). La proporción muestral p̂ es un caso especial de media
muestral con observaciones cero-uno, p̂ = X .
Por tanto, del TCL, Este resultado sigue siendo válido si la
desviación tı́pica de la población se
p̂ − p estima (no se conoce)
p ∼approx. N(0, 1)
p(1 − p)/n
| {z } p̂ − p
√ p √ ∼approx. N(0, 1)
σ/ n p̂(1 − p̂)/ n
| {z }

σ̂/ n

En muestras grandes, el intervalo de confianza para p es:


r r !
p̂(1 − p̂) p̂(1 − p̂)
IC1−α (p) = p̂ − zα/2 , p̂ + zα/2
n n
Bloque III/Tema 6) Matematicas III 32 / 47
Estimación por intervalos de confianza Intervalo de confianza para la media de la población en muestras grandes

Ejemplo: cálculo de un intervalo de confianza para p

A una muestra aleatoria de 344 ejecutivos de compras se les realizó la pregunta “¿Cuál es la
polı́tica de su empresa en relación con los regalos que su personal de compras pueda recibir de
sus proveedores?” 83 de estos ejecutivos respondieron que cada empleado podı́a tomar su propia
decisión. Calcule un intervalo de confianza al 90 % para la proporción en la población de los
ejecutivos que dan libertad sobre estos regalos a sus empleados.
Población: X = 1 si un ejecutivo permite tomar decisiones a su personal y 0 en otro caso, con
X ∼ Bernoulli(p).  
q
p̂(1−p̂)
Objetivo: IC0,9 (p) = p̂ ∓ zα/2 n
83
Muestra: n = 384 (grande, > 30) y p̂ = 344
= 0,241
alpha
Nivel de confianza: 90 % ⇒ α = 0,10 ⇒ 2
= 0,05 ⇒ z α = 1,645.
2
Por tanto:
r !
0,241(1 − 0,241)
IC0,9 (p) = 0,241 ∓ 1,645 = (0,241 ∓ 0,038) = (0,203, 0,279)
344

Interpretación: Podemos tener una confianza del 90 % de que la proporción de ejecutivos que
permiten tomar sus propias decisiones a sus empleados, p, está en (0,203, 0,279)

Bloque III/Tema 6) Matematicas III 33 / 47


Estimación por intervalos de confianza Intervalo de confianza para la media de la población en muestras grandes

Ejemplo

En un estudio sobre seguridad de explosivos usados en ciertas minas, se observa


que los explosivos que contenı́an nitrato de potasio se utilizaron en 95 de 250
casos estudiados.
Construir un intervalo de confianza del 90 % sobre la proporción de empresas que
utilizan nitrato de potasio en los explosivos.
Solución:
Sea p =la proporción de empresas que utilizan nitrato de potasio.
95
Calculamos p̂ = 250 = 0,38. El intervalo pedido es
r
p̂(1 − p̂)
p̂ ± zα/2
n
r
0,38(1 − 0,38)
0,38 ± z0,05
250
p
0,38 ± 1,64 0,05

Luego el intervalo IC0,90 para p resulta [0,33, 0,43].

Bloque III/Tema 6) Matematicas III 34 / 47


Estimación por intervalos de confianza Intervalos de confianza para la media de la población normal con σ2 desconocid

Contenidos

1 Estimación puntual

2 Estimación por intervalos de confianza


Intervalo de confianza para la media de la población normal con varianza conoc
Mı́nimo tamaño muestral
Intervalo de confianza para la media de la población en muestras grandes
Intervalos de confianza para la media de la población normal con σ 2 desconocid
Intervalo de confianza para la varianza

Bloque III/Tema 6) Matematicas III 35 / 47


Estimación por intervalos de confianza Intervalos de confianza para la media de la población normal con σ2 desconocid

Intervalo de confianza para la media de la población


normal con σ 2 desconocida

1 Sea X n una MAS de tamaño n de X .

2 Bajo las hipótesis:


X sigue una distribución normal con parámetros µ y σ 2
σ 2 es desconocida (muy realista)

3 La cantidad pivotal para µ es

X̄ − µ
√ ∼ tn−1
s/ n

4 tn es la distribución t de student con n grados de libertad:


n
Nota: si T ∼ tn , E[T ] = 0, V[T ] = n−2

Bloque III/Tema 6) Matematicas III 36 / 47


Estimación por intervalos de confianza Intervalos de confianza para la media de la población normal con σ2 desconocid

Intervalo de confianza para la media de la población


normal con σ 2 desconocida

3 Si tn−1;1−α/2 y tn−1;α/2 son los cuantiles


Densidad t de Student
superiores (1 − α/2) y (α/2) de una
distribución t de Student con n − 1 grados
de libertad (gl):

∼ tn−1
z}|{ α α
P(tn−1;1−α/2 < T < tn−1;α/2 ) = 1 − α 1−α
2 2

−tn−1;α/2
T ∼ tn−1
z }| {
 ●

tn−1 ; 1−α2 = − tn−1 ; α2


tn−1 ; α2

z }| { X̄ − µ
4 Por tanto: P(tn−1;1−α/2 < √ < tn−1;α/2 ) = 1 − α
s/ n

Bloque III/Tema 6) Matematicas III 37 / 47


Estimación por intervalos de confianza Intervalos de confianza para la media de la población normal con σ2 desconocid

Intervalo de confianza para la media de la población


normal con σ 2 desconocida

5 Se resuelve la doble desigualdad para µ:


X̄ −µ
−tn−1;α/2 < √
s/ n
< tn−1;α/2

y se obtiene el estimador por intervalos de confianza

T1 (X n ) T2 (X n )
z }|
s
{ z }| {
s 
X − tn−1;α/2 √ , X + tn−1;α/2 √
n n
6 El intervalo de confianza es:
 s s 
IC1−α (µ) = x − tn−1;α/2 √ , x − tn−1;α/2 √
n n

Bloque III/Tema 6) Matematicas III 38 / 47


Estimación por intervalos de confianza Intervalos de confianza para la media de la población normal con σ2 desconocid

Ejemplo 1: calcular un intervalo de confianza para µ


Se ha medido el consumo de combustible en una muestra aleatoria de seis coches del
mismo modelo, obteniendo en mpg: 18.6, 18.4, 19.2, 20.8, 19.4, 20.5. Calcular un
intervalo de confianza al 90 % para el consumo medio, suponiendo que el consumo de
combustible se puede aproximar mediante una v.a. con distribución normal.
 
Población: X = ”mpg de un coche Objetivo: IC0,9 (µ) = x ∓ tn−1;α/2 √s n
de este modelo”X ∼ N(µ, σ 2 )
p
σ 2 desconocida s = 0,96 = 0,98
Muestra: n = 6 (pequeña):
n=6 x = 19,48
116,9 1 − α = 0,9 ⇒ α/2 = 0,05
x= = 19,4833
6 tn−1;α/2 = t5;0,05 = 2,015
2282,41 − 6(19,4833)2  
s2 = = 0,96 0,98
6−1 IC0,9 (µ) = 19,48 ∓ 2,105 √
6−1 6
= (19,48 ∓ 0,81)
= (18,67, 20,29)
Area=
0.05
Interpretación: Tenemos una confianza del

90 % de que el consumo promedio de este
t5 ; 0.05 = 2.015
modelo, µ, estará entre 18.67 y 20.29 mpg
Bloque III/Tema 6) Matematicas III 39 / 47
Estimación por intervalos de confianza Intervalos de confianza para la media de la población normal con σ2 desconocid

Ejemplo 1: calcular un intervalo de confianza para µ


Resolución con Excel
Ir al menú: Datos, submenú: Análisis de Datos, escoger la función: Estadı́stica
Descriptiva.
Columna A datos en amarillo (media muestral, semilongitud tn−1;α/2 √sn , extremo
inferior (celda: D3-D16), extremo superior (celda: D3+D16)).

Media muestral

Semilongitud IC
Datos

Bloque III/Tema 6) Matematicas III 40 / 47


Estimación por intervalos de confianza Intervalos de confianza para la media de la población normal con σ2 desconocid

Ejemplo 2: calcular un intervalo de confianza para µ

El nivel de pH de una solución reguladora se puede aproximar mediante una


variable aleatoria con distribución normal (de la que no se conoce ni la media ni la
desviación tı́pica).
Se desea obtener un intervalo confianza para el verdadero valor del pH con un
nivel e confianza del 99 % y para ello se toma una muestra de 7 mediciones:

5,12 5,26 5,13 5,06 5,08 5,15 5,16

A partir de la muestra obtenemos la media y la cuasivarianza muestral: x̄ = 5,137


y s = 0,065.
Como asumimos que X =pH de la solución reguladora, X ∼ (µ, σ), el intervalo
pedido es
s 0,065 0,065
x̄ ± tn−1,α/2 √ ⇒ 5,137 ± t6,0,005 √ ⇒ 5,137 ± 3,70 √ ⇒ 5,137 ± 0,0910
n 7 7
Luego el IC0,99 para µ es [5,046, 5,228]

Bloque III/Tema 6) Matematicas III 41 / 47


Estimación por intervalos de confianza Intervalos de confianza para la media de la población normal con σ2 desconocid

Distribuciones t de Student y χ2 (chi-cuadrado)


Sabemos que T ∼ tn si T = √ Z2 , donde Z ∼ N(0, 1) y χ2n sigue una distribución
χn /n
chi-cuadrado con gl = n, y ambas son independientes.
También, χ2n es la distribución de la suma de los cuadrados de n variables aleatorias
N(0, 1) independientes.
Por ejemplo, la cuasi varianza muestral reescalada sigue una distribución chi
cuadrado con n − 1 grados de libertad.
Pn 2 n  2
(n − 1)s 2 i =1 (Xi − X )
X Xi − X
= = ∼ χ2n−1
σ2 σ2 i =1
σ

¿Por qué n − 1 y no n?
Si conociesemos el valor de µ, el Si tenemos que estimar µ mediante
número de grados de libertad serı́a X , los gl son n − 1, porque solo
n, porque tendrı́amos n variables tenemos n − 1 variables aleatorias iid
aleatorias iid Xi σ−µ Xi −X
σ
(si se conocen los valores de
n − 1 de ellas, se puede deducir
fácilmente el valor de la restante)
Decimos que empleamos un grado de libertad en el cálculo de µ
Bloque III/Tema 6) Matematicas III 42 / 47
Estimación por intervalos de confianza Intervalos de confianza para la media de la población normal con σ2 desconocid

Distribuciones t de Student y χ2 (chi-cuadrado)

Densidades de t y N(0, 1)  Densidades de χ2 


0.4

0.15
gl=20
0.3

gl=15
N(0,1)
gl=10
gl=10

0.10
gl=5
gl=5
0.2

gl=3

0.05
0.1

0.00
0.0

−4 −2 0 2 4 0 10 20 30 40

Bloque III/Tema 6) Matematicas III 43 / 47


Estimación por intervalos de confianza Intervalo de confianza para la varianza

Contenidos

1 Estimación puntual

2 Estimación por intervalos de confianza


Intervalo de confianza para la media de la población normal con varianza conoc
Mı́nimo tamaño muestral
Intervalo de confianza para la media de la población en muestras grandes
Intervalos de confianza para la media de la población normal con σ 2 desconocid
Intervalo de confianza para la varianza

Bloque III/Tema 6) Matematicas III 44 / 47


Estimación por intervalos de confianza Intervalo de confianza para la varianza

Intervalo de confianza para la varianza (población normal)

1 Sea X n una MAS de tamaño n de X .

2 Bajo las hipótesis:


X sigue una distribución normal con varianza σ 2

3 La cantidad pivotal para σ 2 es

(n − 1)s 2
∼ χ2n−1
σ2

4 χ2n es una distribución chi-cuadrado con n grados de libertad.


Nota: E[χ2n ] = n, V[χ2n ] = 2n

Bloque III/Tema 6) Matematicas III 45 / 47


Estimación por intervalos de confianza Intervalo de confianza para la varianza

Intervalo de confianza para la varianza (población normal)

3 Si χ2n−1;1−α/2 y χ2n−1;α/2 son los cuantiles Densidad chi-cuadrado


superiores (1 − α/2) y (α/2) de una
distribución chi-cuadrado con n − 1 grados de
libertad, resulta
P(χ2n−1;1−α/2 < χ2n−1 < χ2n−1;α/2 ) = 1 − α

α α
1−α
2 2
● ●
2 2
χn−1 ; 1−α χn−1 ;α
2 2

χ2n−1
z }| {
 (n − 1)s 2 
4 Imponemos la condición P χ2n−1;1−α/2 < 2
< χ2n−1;α/2 = 1 − α
σ

Bloque III/Tema 6) Matematicas III 46 / 47


Estimación por intervalos de confianza Intervalo de confianza para la varianza

Intervalo de confianza para la varianza de la población,


población normal
5 Resolvemos la doble desigualdad para σ 2 :
(n−1)s 2
χ2n−1;1−α/2 < σ2 < χ2n−1;α/2
1 σ2 1
> (n−1)s 2 >
χ2n−1;1−α/2 χ2n−1;α/2
(n − 1)s 2 (n − 1)s 2
> σ2 >
χ2n−1;1−α/2 χ2n−1;α/2
y obtenemos el estimador por intervalos de confianza
!
(n − 1)s 2 (n − 1)s 2
,
χ2n−1;α/2 χ2n−1;1−α/2
6 El intervalo de confianza es:
!
2 (n − 1)s 2 (n − 1)s 2
IC1−α (σ ) = ,
χ2n−1;α/2 χ2n−1;1−α/2
Bloque III/Tema 6) Matematicas III 47 / 47
Estimación por intervalos de confianza Intervalo de confianza para la varianza

Ejemplo: calcular un intervalo de confianza para σ 2 y σ


Una muestra aleatoria de quince pastillas para el dolor de cabeza tiene una cuasi
desviación tı́pica de 0.8 % en la concentración del ingrediente activo. Calcule un IC al
90 % para la varianza de la población para estas pastillas. Obtenga también un IC para la
desviación tı́pica de la población.
 
(n−1)s 2 (n−1)s 2
Población: Objetivo: IC0,9 (σ2 ) =  2
χ
, 2
χ

n−1;α/2 n−1;1−α/2
X = “concentración del
ingrediente activo en una pastilla
s 2 = 0,82 = 0,64 n = 15

'
(in %)” X ∼ N(µ, σ 2 )

'
1 − α = 0,9 ⇒ α/2 = 0,05
MAS: n = 15 χ2n−1;1−α/2 = χ214;0,95 = 6,57
Muestra:
Muestra: ssx==0,8
0,8 χ2n−1;α/2 = χ214;0,05 = 23,68
 
14(0,64) 14(0,64)
IC0,9 (σ 2 ) = ,
23,68 6,57
Area= Area= = (0,378, 1,364) ⇒
0.05 0.05 p p
IC0,9 (σ) = ( 0,378, 1,364)
● ●
= (0,61, 1,17)
χ214 ; 0.95 χ14
2
; 0.05

=6.57 =23.68 Para obtener IC(σ) aplicamos a los extremos de IC(σ2 )
Bloque III/Tema 6) Matematicas III 48 / 47
Estimación por intervalos de confianza Intervalo de confianza para la varianza

Ejemplo 2: calcular un intervalo de confianza para σ 2


El nivel de pH de una solución reguladora se puede aproximar mediante una
variable aleatoria con distribución normal (de la que no se conoce ni la media ni la
desviación tı́pica).
Se desea obtener un intervalo confianza para el verdadero valor de la varianza del
pH con un nivel de confianza del 95 % y para ello se toma una muestra de 7
mediciones:
5,12 5,26 5,13 5,06 5,08 5,15 5,16
Solución:
A partir de la muestra obtenemos la media y la cuasivarianza muestral: x̄ = 5,137
y s = 0,065.
De las tablas se obtienen los valores χ2n−1,α/2 = 14,449 y χ2n−1,1−α/2 = 1,237.
El intervalo pedido es
" #  
(n − 1)s 2 (n − 1)s 2 6 × 0,0042 6 × 0,0042
, = , = (0,0017, 0,0204)
χ2n−1,α/2 χ2n−1,1−α/2 14,449 1,237

Luego el IC0,95 para σ 2 es [0,0017, 0,0204]


Bloque III/Tema 6) Matematicas III 49 / 47
Estimación por intervalos de confianza Intervalo de confianza para la varianza

Fórmulas para intervalos de confianza

Resumen para una población


Sea X n una muestra aleatoria simple de una población X con media µ y varianza σ 2
Parámetro Hipótesis Cantidad pivotal (1 − α) Intervalo Conf.

 
Datos normales X̄ −µ
√ ∼ N(0, 1) σ , x̄ + z σ
µ ∈ x̄ − zα/2 √ α/2 √n
Varianza conocida σ/ n n
 
Datos no normales X̄ −µ σ̂ , x̄ + z σ̂
Media √ ∼approx. N(0, 1) µ ∈ x̄ − zα/2 √ α/2 √n
Muestra grande σ̂/ n n
r #
Datos Bernoulli p p̂−p p̂(1−p̂)
∼approx. N(0, 1) p ∈ p̂ ∓ zα/2
Muestra grande p̂(1−p̂)/n n

 
Datos normales X̄ −µ s , x̄ + t s
Varianza descono- √ ∼ tn−1 µ ∈ x̄ − tn−1,α/2 √ n−1,α/2 √n
s/ n n
cida  
(n−1)s 2 (n−1)s 2 (n−1)s 2
Varianza Datos normales ∼ χ2 σ2 ∈  , 
σ2 n−1 χ2 χ2
n−1;α/2 n−1;1−α/2
 
v v
(n−1)s 2 u (n−1)s 2 (n−1)s 2
u u
∼ χ2
u 
Desv. tı́pica Datos normales σ ∈ t 2 ,t 2 
σ2 n−1 χ χ
n−1;α/2 n−1;1−α/2

Bloque III/Tema 6) Matematicas III 50 / 47


Estimación por intervalos de confianza Intervalo de confianza para la varianza

Intervalos de confianza para la media de la población:


¿Qué usar cuándo?

X ∼ distribución con media µ y desviación tı́pica σ

X ∼ normal
ւ ց X ≁ normal

ւց
σ conocida σ desconocida n pequeña
ւց n grande


basada en z

basada en t

otros

basada en z
(exacta) (exacta) (TCL)

Bloque III/Tema 6) Matematicas III 51 / 47

También podría gustarte