Está en la página 1de 40

Tema 1.

Inferencia estadı́stica para una población

Contenidos
I Inferencia estadı́stica
I Estimadores puntuales
I Estimación de la media y la varianza de una población
I Estimación de la media de la población mediante intervalos de
confianza
I Intervalos de confianza para la media de una población normal con
varianza conocida
I Intervalos de confianza para la media en muestras grandes
I Intervalos de confianza para la proporción en una población
I Intervalos de confianza para la media de una población normal con
varianza desconocida
I Estimación de la varianza de la población mediante intervalos de
confianza
I Intervalos de confianza para la varianza de una población normal
Tema 1. Inferencia estadı́stica para una población

Objetivos de aprendizaje
Al final de este tema debieras ser capaz de:
I Estimar parámetros de la población desconocidos a partir de datos
muestrales
I Construir intervalos de confianza para los parámetros de la población
desconocidos a partir de datos muestrales:
I En el caso de una distribución normal: intervalos de confianza para la
media y la varianza de la población
I En muestras grandes: intervalos de confianza para la media de la
población y la proporción
I Interpretar el significado de un intervalo de confianza
I Entender el efecto del tamaño muestral, el nivel de confianza, etc
sobre la longitud del intervalo de confianza
I Calcular un tamaño muestral necesario para controlar la longitud de
un intervalo de confianza
Tema 1. Inferencia estadı́stica para una población

Referencias
I Newbold, P. “Estadı́stica para Administración y Economı́a”
I Capı́tulos 7 y 8 (8.1-8.6)
I Ross, S. “Introducción a la Estadı́stica”
I Capı́tulo 8
Inferencia Estadı́stica: palabras clave (i)

I Población: el conjunto de toda la información numérica relativa a


una cantidad de interés.
I Identificaremos el concepto de población con el de una variable
aleatoria X .
I La ley o distribución de la población es la distribución de X , FX .
I Muestra: un subconjunto observado (por ejemplo, de tamaño n) de
valores de la población.
I Representada como una colección de n variables aleatorias
X1 , X2 , . . . , Xn , tı́picamente
iid (independientes e idénticamente distribuidas) .
I Parámetro: una constante que caracteriza a X o FX .
Inferencia Estadı́stica: palabras clave (ii)

I Inferencia estadı́stica: el proceso mediante el que se llega a


conclusiones sobre una población a partir de las medidas o las
observaciones realizadas sobre una muestra de individuos de la
población.
I Estadı́stico: una variable aleatoria definida como una función de una
muestra aleatoria, Y = f (X1 , X2 , . . . , Xn )
I Estimador de un parámetro: una variable aleatoria, por ejemplo T ,
función de una muestra aleatoria, T = T (X1 , X2 , . . . , Xn ), que se
emplea para aproximar (estimar) el valor de un parámetro de la
población desconocido.
I Estimación: una realización concreta del estimador, por ejemplo T ,
correspondiente a una muestra observada, x1 , x2 , . . . , xn , y que
proporciona una aproximación al valor del parámetro de interés.
Inferencia estadı́stica: ejemplo

Queremos conocer Tenemos n copias Tenemos n


µX = E[X ] de X valores observados de
X1 , X2 , . . . , Xn

X ∼ F ⇒ X1 , X2 , . . . , Xn ∼ F
Muestra ⇒ x1 , x2 , . . . , xn
Muestra observada

⇓ ⇓ ⇓
µX = E[X ]
Valor esperado de X
⇐ Estimador de µX (variable aleatoria)

Media muestral
⇐ Estimación de µX (un número)

Media muestral
Estimadores puntuales: introducción

I Un estimador puntual de un parámetro de una población es una


función, por ejemplo T , de la información muestral
X n = (X1 , . . . , Xn ) que toma un valor numérico.
I Ejemplos de parámetros de poblaciones, estimadores y estimaciones:
Parámetro Estimador: Estimación:
población T (X n ) notación notación
X1 +...+Xn
Media pobl. µX media muestral n X̄ = µ̂X x̄
Prop. pobl. pX prop. muestral p̂X p̂x
P 2 2
i Xi −n(X̄ )
Var. pobl. σX2 var. muestral nP σ̂X2 σ̂x2
Xi −n(X̄ )2
2
Var. pobl. σX2 quasi var. muestral i n−1 = n 2
n−1 σ̂X sX2 sx2
... ... ... ...
En general, θX ... θ̂X θ̂x
Estimadores puntuales: propiedades (i)

¿Qué caracterı́sticas querrı́amos que tuviese un estimador?


I Ausencia de sesgo. Esta propiedad se da cuando un estimador tiene
sesgo igual a cero. ¿Qué es el sesgo? El sesgo es la diferencia entre
el valor esperado del estimador y el valor del parámetro de interés.

Sesgo[θ̂X ] = E[θ̂X ] − θX

Población Estimador Estimador insesgado


parámetro T (X n ) Sesgo Insesgado? de mı́nima varianza?
Media pobl. µX X E[X̄ ] − µX = 0 Sı́ Sı́, si X normal
Prop. pobl. pX p̂X E[p̂X ] − pX = 0 Sı́ Sı́
Var. pobl. σX2 σ̂X2 E[σ̂X2 ] − σX2 6= 0 No No
Var. pobl. σX2 sX2 E[sX2 ] − σX2 = 0 Sı́ Sı́, si X normal
En general, θX θ̂X E[θ̂X ] − θX A menudo Rara vez
Estimadores puntuales: propiedades (ii)

I Eficiencia. Se mide por la varianza del estimador. Un estimador con


menos varianza es más eficiente.
I La eficiencia relativa de dos estimadores insesgados θ̂X ,1 y θ̂X ,2 para
un parámetro θX se define como

Var[θ̂X ,1 ]
Eficiencia relativa(θ̂X ,1 , θ̂X ,2 ) =
Var[θ̂X ,2 ]

Nota:
I En algunos casos se emplea la definición inversa.
I En todo caso, un estimador con menor varianza es más eficiente.
Estimadores puntuales: propiedades (iii)
I Un criterio más general para seleccionar estimadores (incluyendo
estimadores insesgados y sesgados) es el error cuadrático medio,
definido como

ECM[θ̂X ] = E[(θ̂X − θX )2 ] = Var[θ̂X ] + (Sesgo[θ̂X ])2

Nota:
I El error cuadrático medio de un estimador insesgado es igual a su
varianza.
I Un estimador con menor ECM es mejor.
I El estimador insesgado de mı́nima varianza tiene la menor
varianza/ECM entre todos los estimadores.
I Como encontrar una buena definición para un estimador T ?
I En algunos casos se conoce un estimador óptimo: estimador
insesgado de mı́nima varianza
I Si no es ası́, existen distintos métodos de construcción de
estimadores que proporcionan resultados razonables, por ejemplo:
I Estimación máximo verosı́mil
I Método de momentos
Estimación puntual: ejemplo
Ejemplo: 7.1 (Newbold) Las ratios precio-beneficio para una muestra
aleatoria de diez acciones negociadas en la bolsa de NY en un dı́a
concreto fueron

10 16 5 10 12 8 4 6 5 4

Emplee un procedimiento de estimación insesgado para obtener


estimaciones puntuales para los siguientes parámetros de la población:
media, varianza, proporción de valores que exceden 8.5.

80
x̄ = =8
10
782 − 10(8)2
sx2 = = 15,78
10 − 1
1+1+0+1+1+0+0+0+0+0
p̂x =
10
= 0,4
Estimación puntual: ejemplo
2
Ejemplo: Sea µ̂X = n(n+1) (X1 + 2X2 + . . . + nXn ) un estimador de la media de
la población basado en una MAS X n . Compare este estimador con la media
muestral, X̄ .
σ2
Sabemos que X̄ es un estimador insesgado de µX , con varianza nX .
µ̂X también es insesgado: Y su varianza/ECM es:

" # " #
2 2
E[µ̂X ] = E (X1 + 2X2 + . . . + nXn ) V[µ̂X ] = V (X1 + 2X2 + . . . + nXn )
n(n + 1) n(n + 1)
!2
2 2
= (E[X1 ] + 2E[X2 ] + . . . + nE[Xn ]) 2 2
=indep. (V[X1 ] + 2 V[X2 ] + . . . + n V[Xn ])
n(n + 1) n(n + 1)
2 n(n+1)(2n+1)/6
=id (µX + 2µX + . . . + nµX )
n(n + 1) 4
z }| {
2 2 2 2
=id σX (1 + 2 + . . . + n )
n(n+1)/2 n2 (n + 1)2
2µX z }| {
= (1 + 2 + . . . + n) = µX 2(2n + 1) 2
n(n + 1) = σX
3n(n + 1)
⇒ Sesgo[µ̂X ] = 0
2 2(2n + 1) 2
ECM[µ̂X ] = V[µ̂X ] + 0 = σX
3n(n + 1)

σX2 /n 3(n + 1)
Eficiencia relativa(X̄ , µ̂X ) = 2(2n+1) 2
=
σ 2(2n + 1)
3n(n+1) X

Puede verse que para n ≥ 2 este cociente es menor que 1, y por tanto X̄ es un
estimador más eficiente para µX .
De estimaciones puntuales a estimación por intervalos de
confianza

I Hasta ahora hemos considerado la estimación puntual de un


parámetro desconocido de una población que, partiendo de una
MAS de n observaciones de X , proporciona una aproximación
razonable para ese parámetro desconocido.
I Una estimación puntual no tiene en cuenta la variabilidad del
proceso de estimación, debida entre otras causas a:
I El tamaño muestral - una muestra mayor debiera proporcionar una
información más precisa sobre el parámetro de la población.
I Variabilidad en la población - una muestra de una población con
menos varianza debiera proporcionar estimaciones más precisas
I Que se conozcan otros parámetros de la población.
I etc
Estas limitaciones pueden tratarse mediante el uso de estimaciones por
intervalos de confianza, esto es, un método que proporciona un intervalo
de valores al que es probable que pertenezca el valor del parámetro.
Estimadores por intervalos de confianza e intervalos de
confianza
Sea X n = (X1 , X2 , . . . , Xn ) una MAS de una población X con función de
distribución FX que depende de un parámetro desconocido θ.
Un estimador por intervalos de confianza de θ con un nivel de confianza
(1 − α) = 100(1 − α) % es un intervalo (T1 (X n ), T2 (X n )) que satisface

P (θ ∈ (T1 (X n ), T2 (X n )) = 1 − α

Interpretación: tenemos una probabilidad (1 − α) de que el parámetro


desconocido de la población pertenecerá a (T1 (X n ), T2 (X n )).
Un intervalo de confianza para θ con un nivel de confianza 1 − α es el
valor observado del estimador por intervalos de confianza,

(T1 (x n ), T2 (x n ))

Interpretación: podemos tener una confianza de (1 − α) de que el valor


del parámetro desconocido de la población estará en (T1 (x n ), T2 (x n )).
Niveles de confianza habituales
α 0.01 0.05 0.10
100(1 − α) % 99 % 95 % 90 %
Obteniendo un estimador por intervalos de confianza:
procedimiento

1. Se busca una cantidad (aleatoria) relacionada con el parámetro


desconocido θ y con la muestra X n , C (X n , θ), cuya distribución sea
conocida y no dependa del valor del parámetro - esta cantidad se
conoce como la cantidad pivotal o el pivote para θ
2. Se pueden usar los cuantiles 1 − α/2 y α/2 de esa distribución, y la
definición del estimador por intervalos de confianza, para plantear la
ecuación
doble desigualdad
z }| {
P(1 − α/2 cuantil<C (X n , θ)<α/2 cuantil) = 1 − α.

3. Para obtener los extremos del estimador por intervalo de confianza,


T1 (X n ) y T2 (X n ), se resuelve la doble desigualdad en θ.
4. El intervalo de confianza al 100(1 − α) % para θ es (T1 (x n ), T2 (x n )).
Intervalo de confianza para la media de la población,
población normal con varianza conocida

1. Sea X n una MAS de tamaño n obtenida de X . Bajo los supuestos:


I X sigue una distribución normal con parámetros µX y σX2
I σX2 es conocida (muy poco realista)
2. La cantidad pivotal para µX es:

X̄ − µX
√ ∼ N(0, 1)
σ/ n

Nota: la desviación tı́pica de X̄ , σX / n, (o de cualquier otro
estadı́stico) se conoce como su error estándar
Intervalo de confianza para la media de la población,
población normal con varianza conocida

3. Si z1−α/2 y zα/2 son los cuantiles


superiores (1 − α/2) y (α/2) de
la distribución N(0, 1), tenemos

P(z1−α/2 < Z < zα/2 ) = 1 − α α α


1−α
2 2

Densidad normal estándar

Si Z ∼ N(0, 1) entonces
E[Z ] = 0, V[Z ] = 1

z1−α2 = − zα2

zα2

Z
−zα/2 z }| {
z }| { X̄ − µX
4. Se tiene que P(z1−α/2 < √ < zα/2 ) = 1 − α
σX / n
Intervalo de confianza para la media de la población,
población normal con varianza conocida
5. Resolvemos la doble desigualdad para µX :
X̄ −µX
−zα/2 < √
σX / n
< zα/2
σX σX
−zα/2 √ < X̄ − µX < zα/2 √
n n
σX σX
−zα/2 √ − X̄ < −µX < −X̄ + zα/2 √
n n
σX σX
zα/2 √ + X̄ > µX > X̄ − zα/2 √
n n
para obtener el estimador por intervalos de confianza

T1 (X n ) T2 (X n )
z }| { z }| {
σX σX
(X̄ − zα/2 √ , X̄ + zα/2 √ )
n n

6. El intervalo de confianza es:


„ « „ «
σX σX σX
IC1−α (µX ) = x̄ − zα/2 √ , x̄ − zα/2 √ = x̄ ∓ zα/2 √
n n n
Ejemplo: cálculo de un intervalo de confianza para µX
Ejemplo: 8.2 (Newbold) Un proceso industrial produce bolsas de azucar
refinado. Los pesos de las bolsas siguen una distribución normal con desviación
tı́pica igual a 12 g. Una muestra aleatoria de venticinco bolsas tiene un peso
promedio de 198 g. Encuentre un intervalo de confianza al 95 % para el peso
promedio en la población de las bolsas de azucar fabricadas con este proceso.
“ ”
σX
Población: Objetivo: IC0,95 (µX ) = x̄ ∓ zα/2 √ n
X = ”peso de una bolsa (en g)”
2 2
X ∼ N(µX , σX = 12 ) σX = 12

' MAS: n = 25

Muestra: x̄ = 198
n = 25
1 − α = 0,95
zα/2

=
x̄ = 198
α/2 = 0,025
z0,025 = 1,96

12
«
IC0,95 (µX ) = 198 ∓ 1,96 √
25
= (198 ∓ 4,7)
Area= = (193,3, 202,7)
0.025
Interpretación: Podemos tener una

confianza del 95 % de que µX
está en (193,3, 202,7)
z0.025 = 1.96
Interpretación frecuentista del IC: nivel de confianza
En este ejemplo simulado se han generado 150 muestras de tamaño n = 50, de
una distribución X ∼ N(µX = −5, σX2 = 12 ) y se construyeron 150 IC1−α (µX )
con α = 0,1 y otros 150 intervalos con α = 0,01.
µX está en aprox. 150(0,9) = 135 interv. µX está en aprox. 150(0,99) = 148,5 interv.
(pero no en 150(0,1) = 15) (pero no en 150(0,01) = 1,5)
(1 − α) = 0,9, n = 50 (1 − α) = 0,99, n = 50
150

150
| | | |
| |
| | | | | |
| | | |
|| | || |
| | | |
| | | |
| | | | | |
| | | | | |
| | | |
| | | |
|| | || |
| | | |
| |
| | | | | |
| | | | | |
| | | |
| || | ||
| || | ||
| | | |
| | | |
100

100
| | | | | |
| || | ||
|| ||
| |
| || | ||
| | | |
| | | |
| |
Indice

Indice
| |
| | | | | |
| | | |
| | | |
| | | | | |
| | | |
| | | |
| | | |
| || | ||
|| ||
| | | | | |
| | | |
| |
| | | | | |
| | | | | |
50

50
| |
|| | || |
| | | |
| | | |
| |
|| | || |
| |
| || | ||
| | | |
| | | |
| | | |
| | | |
| | | |
| | | |
| | | |
| | | |
|| ||
| | | |
| | | |
| | | |
| |
| | | | | |
| | | |
| | | |
| | | |
0

0
−6.0 −5.5 −5.0 −4.5 −4.0 −6.0 −5.5 −5.0 −4.5 −4.0

Intervalo de confianza Intervalo de confianza


zα/2 σ
“ zα/2 σX
” zα/2 σX
La longitud del intervalo, L = x̄ + √
n
− x̄ − √
n
=2 √
n
, aumenta
al aumentar el nivel de confianza (a igualdad de otros valores). ¿Por qué?
Interpretación frecuentista del IC: tamaño muestral
Construimos ahora 150 muestras de tamaño n = 50 y otras 150 de tamaño
n = 200, de una distribución X ∼ N(µX = −5, σX2 = 12 ) .
µX en aprox. 150(0,9) = 135 interv. µX en aprox. 150(0,9) = 135 interv.
(pero no en 150(0,1) = 15) (pero no en 150(0,1) = 15)
(1 − α) = 0,9, n = 50 (1 − α) = 0,9, n = 200
150

150
| | || |
|
| | | |
| |
| | | |
|| | || |
|
| |
| | | | |
| | | || |
| | | | | |
| | |
| | || |
| | ||
| | | |
| | ||
| | | || |
| | | | |
| | |
| |
| || | | |
| || | | |
| | ||
| | | | |
100

100
| | | | ||
| || ||
|| |
| || |
| || |
| | | |
| | | ||
| |
Indice

Indice
| |
| | | | | |
| | | |
| | | ||
| | | |
| | ||
| | || |
| | || |
| || ||
|| |||
| | | ||
| | | |
| |
| | | | |
|
| | | ||
|
50

50
| |
|| | | ||
| | | |
| | | | |
|
|| | | | |
| ||
| || | |
| | | | |
| |
| | | | |
| | | |
| | |
| | |||
| | |
| | || |
|| |
| | | ||
| | | |
| | || |
|
| | | |
||
| | | ||
| |
| | | | |
0

0
−6.0 −5.5 −5.0 −4.5 −4.0 −6.0 −5.5 −5.0 −4.5 −4.0

Intervalo de confianza Intervalo de confianza

La longitud de los intervalos decrece cuando el tamaño muestral aumenta


(suponiendo que los demás valores no cambien). ¿Por qué?

Pregunta: ¿Cuál es el efecto del valor de σ sobre la longitud?


Ejemplo: estimación del tamaño muestral
Ejemplo: 8.14 (Newbold) La longitud de las barras de acero fabricadas en un
proceso industrial siguen una distribución normal con desviación tı́pica 1.8 mm.
El encargado del proceso desea obtener un intervalo de confianza al 99 % para
dicha longitud, con un tamaño menor o igual a 0.5 mm a cada lado de la media
muestral. ¿Qué tamaño muestral serı́a necesario para tener esta propiedad?
Población: Objetivo: n tal que longitud IC ≤ 1
X = “longitud de la barra (en mm)”
X ∼ N(µX , σX2 = 1,82 ) zα/2 σ
2 √ ≤ 1

'
n

MAS: n =? n ≥ 2zα/2 σ
n ≥ 22 zα/2
2
σ2
longitud
z }| { n ≥ (22 )(2,5752 )(1,82 )
zα/2 σ
IC0,99 (µX ): 2 √ ≤ 2(0,5) = 1 = 85,93
n
Para satisfacer la petición del
encargado se necesitarı́a una
Area= muestra de tamaño al menos
0.005 igual a 86 observaciones.

z0.005 = 2.575
Intervalo de confianza para la media de la población en
muestras grandes

1. Sea X n una MAS de tamaño n de X . Bajo las hipótesis:


I X sigue una distribución (no necesariamente normal) con parámetros
µX y σX2
I el tamaño muestral n es grande (n ≥ 30)
2. La cantidad pivotal para µX basada en el Teorema Central del
Lı́mite es
X̄ − µX
√ ∼approx. N(0, 1)
σ̂X / n
Intervalo de confianza para la media de la población en
muestras grandes

3. Por tanto, si z1−α/2 y zα/2 son


los cuantiles superiores (1 − α/2)
y (α/2) de N(0, 1), tenemos

P(z1−α/2 < Z < zα/2 ) = 1 − α α α


1−α
2 2

Densidad normal estándar


z1−α2 = − zα2

Z

zα2

−zα/2 z }| {
z }| { X̄ − µX
4. Imponemos la condición P(z1−α/2 < √ < zα/2 ) = 1 − α
σ̂X / n
Intervalo de confianza para la media de la población en
muestras grandes

5. Resolvemos la doble desigualdad para µX :

X̄ − µX
−zα/2 < √ < zα/2
σ̂X / n

para obtener el estimador por intervalos de confianza

T1 (X n ) T2 (X n )
z }| { z }| {
σ̂X σ̂X
(X̄ − zα/2 √ , X̄ + zα/2 √ )
n n

6. El intervalo de confianza es:


σ̂x σ̂x
IC1−α (µX ) = (x̄ − zα/2 √ , x̄ + zα/2 √ )
n n
Intervalo de confianza para la proporción en la población
en muestras grandes
Aplicación de ICs para la media en muestras grandes
Sea X n , n ≥ 30, una MASpde una distr. Bernoulli con parámetro pX
(µX = E[X ] = pX y σX = pX (1 − pX )). La proporción muestral p̂X es
un caso especial de media muestral con observaciones cero-uno, p̂X = X̄ .

Por tanto, del TCL,


p̂ − pX
p X
p(1 − p)/n
∼approx. N(0, 1)
Este resultado sigue siendo

válido si la desviación tı́pica de la


población se estima (no se conoce)

| {z }
σX / n p̂X − pX
p √ ∼approx. N(0, 1)
p̂(1 − p̂)/ n

| {z }
σ̂X / n

En muestras grandes, el intervalo de confianza para pX es:


r r !
p̂x (1 − p̂x ) p̂x (1 − p̂x )
IC1−α (pX ) = p̂x − zα/2 , p̂x + zα/2
n n
Ejemplo: cálculo de un intervalo de confianza para pX
Ejemplo: 8.6 (Newbold) A una muestra aleatoria de 344 ejecutivos de compras se les realizó la
pregunta “¿Cuál es la polı́tica de su empresa en relación con los regalos que su personal de
compras pueda recibir de sus proveedores?” 83 de estos ejecutivos respondieron que cada
empleado podı́a tomar su propia decisión. Calcule un intervalo de confianza al 90 % para la
proporción en la población de los ejecutivos que dan libertad sobre estos regalos a sus empleados.
r !
p̂x (1−p̂x )
Población: Objetivo: IC0,9 (pX ) = p̂x ∓ zα/2
n
X = 1 si un ejecutivo permite tomar
decisiones a su personal y 0 en otro caso
X ∼ Bernoulli(pX ) p̂x = 0,241 n = 344

'
1 − α = 0,9 ⇒ α/2 = 0,05
zα/2 = z0,05 = 1,645
MAS: n = 344 grande 0 1
s
0,241(1 − 0,241)
IC0,9 (pX ) = @0,241 ∓ 1,645 A
83 344
Muestra: p̂x = 344 = 0,241
= (0,241 ∓ 0,038)
= (0,203, 0,279)

Interpretación: Podemos tener una confianza


del 90 % de que la proporción de ejecutivos
Area=
que permiten tomar sus propias decisiones a
0.05 sus empleados, pX , está en (0,203, 0,279)

z0.05 = 1.645
Intervalo de confianza para la media de la población:
población normal con varianza desconocida

1. Sea X n una MAS de tamaño n de X . Bajo las hipótesis:


I X sigue una distribución normal con parámetros µX y σX2
I σX2 es desconocida (muy realista)
2. La cantidad pivotal para µX es

X̄ − µX
√ ∼ tn−1
sX / n
Intervalo de confianza para la media de la población:
población normal con varianza desconocida
3. Si tn−1;1−α/2 y tn−1;α/2 son los cuantiles
superiores (1 − α/2) y (α/2) de una
distribución t de Student con n − 1 grados
de libertad (gl), tenemos

∼ tn−1 α α
z}|{ 1−α
P(tn−1;1−α/2 < T < tn−1;α/2 ) = 1 − α 2 2

Densidad t de Student

Recuerda: si T ∼ tn , E[T ] = 0, V[T ] = n
n−2

tn−1 ; 1−α2 = − tn−1 ; α2


tn−1 ; α2

4. Imponemos la condición
T ∼ tn−1
−tn−1;α/2 z }| {
z }| { X̄ − µX
P(tn−1;1−α/2 < √ < tn−1;α/2 ) = 1 − α
sX / n
Intervalo de confianza para la media de la población:
población normal con varianza desconocida

5. Resolvemos la doble desigualdad para µX :


X̄ −µ
−tn−1;α/2 < √X
sX / n
< tn−1;α/2

y obtenemos el estimador por intervalos de confianza

T1 (X n ) T2 (X n )
z }| { z }| {
sX sX
(X̄ − tn−1;α/2 √ , X̄ + tn−1;α/2 √ )
n n

6. El intervalo de confianza es:


sx sx
IC1−α (µ) = (x̄ − tn−1;α/2 √ , x̄ − tn−1;α/2 √ )
n n
Ejemplo: calcular un intervalo de confianza para µX
Ejemplo: 8.4 (Newbold) Se ha medido el consumo de combustible en una
muestra aleatoria de seis coches del mismo modelo, obteniendo en mpg: 18.6,
18.4, 19.2, 20.8, 19.4, 20.5. Calcule un intervalo de confianza al 90 % para el
consumo medio, suponiendo que la población sigue una distribución normal.
“ ”
Población: X = ”mpg de un coche Objetivo: IC0,9 (µX ) = x̄ ∓ tn−1;α/2 √sxn
de este modelo”X ∼ N(µX , σX2 )
σX2 desconocida
p
sx = 0,96 = 0,98

'
n=6 x̄ = 19,48
MAS: n = 6 pequeña 1 − α = 0,9 ⇒ α/2 = 0,05
116,9 tn−1;α/2 = t5;0,05 = 2,015
Muestra: x̄ = 6
= 19,4833 „ «
0,98
IC0,9 (µX ) = 19,48 ∓ 2,105 √
2282,41 − 6(19,4833)2 6
sx2 = = 0,96
6−1 = (19,48 ∓ 0,81)
= (18,67, 20,29)

Interpretación: Tenemos una


Area=
0.05 confianza del 90 % de que el
consumo promedio de este modelo,
● µX , estará entre 18.67 y 20.29 mpg
t5 ; 0.05 = 2.015
Ejemplo: calcular un intervalo de confianza para µX
Ejemplo: 8.4 (cont.) en Excel: Ir al menú: Datos, submenú: Análisis de
Datos, escoger la función: Estadı́stica Descriptiva.
Columna A datos en amarillo (media muestral, semilongitud tn−1;α/2 √sxn ,
extremo inferior (celda: D3-D16), extremo superior (celda: D3+D16)).

Media muestral

Semilongitud IC
Datos
Distribuciones t de Student y χ2 (chi-cuadrado)
I Sabemos que T ∼ tn si T = √ Z2 , donde Z ∼ N(0, 1) y χ2n sigue una
χn /n
distribución chi-cuadrado con gl = n, y ambas son independientes.
I También, χ2n es la distribución de la suma de los cuadrados de n variables
aleatorias N(0, 1) independientes.
I Por ejemplo, la cuasi varianza muestral reescalada sigue una distribución
chi cuadrado con n − 1 grados de libertad.
Pn 2 n „ «2
(n − 1)sX2 i=1 (Xi − X̄ )
X Xi − X̄
= = ∼ χ2n−1
σX2 σX2 i=1
σ X

¿Por qué n − 1 y no n?

Si conociesemos el valor de µX , el Si tenemos que estimar µX mediante


número de grados de libertad serı́a X̄ , los gl son n − 1, porque solo
n, porque tendrı́amos n variables tenemos n − 1 variables aleatorias iid
aleatorias iid Xi σ−µ
X
X Xi −X̄
σX
(si se conocen los valores de
n − 1 de ellas, se puede deducir
fácilmente el valor de la restante)

Decimos que empleamos un grado de libertad en el cálculo de µX


Distribuciones t de Student y χ2 (chi-cuadrado)

Densidades de t y N(0, 1)
Densidades de χ2

0.4

0.15
gl=20
0.3

N(0,1) gl=15
gl=10 gl=10

0.10
gl=5 gl=5
0.2

gl=3
0.05
0.1

0.00
0.0

−4 −2 0 2 4 0 10 20 30 40
Intervalo de confianza para la varianza de la población,
población normal

1. Sea X n una MAS de tamaño n de X . Bajo las hipótesis:


I X sigue una distribución normal con varianza σX2
2. La cantidad pivotal para σX2 es

(n − 1)sX2
∼ χ2n−1
σX2
Intervalo de confianza para la varianza de la población,
población normal

3. Por tanto, si χ2n−1;1−α/2 y χ2n−1;α/2 son


los cuantiles superiores (1 − α/2) y
(α/2) de una distribución chi-cuadrado
con n − 1 grados de libertad, tenemos
P(χ2n−1;1−α/2 < χ2n−1 < χ2n−1;α/2 ) = 1 − α
α α
1−α


2 2
Densidad chi-cuadrado ● ●

χ2n−1 ; 1−α χ2n−1 ; α


Recuerda: E[χ2n ] = n, V[χ2n ] = 2n 2 2

χ2n−1
z }| {
(n − 1)sX2
4. Imponemos la condición P(χ2n−1;1−α/2 < < χ2n−1;α/2 ) = 1 − α
σ2
Intervalo de confianza para la varianza de la población,
población normal
5. Resolvemos la doble desigualdad para σX2 :
(n−1)sX2
χ2n−1;1−α/2 < σX2
< χ2n−1;α/2
1 σX2 1
> (n−1)sX2
>
χ2n−1;1−α/2 χ2n−1;α/2
(n − 1)sX2 (n − 1)sX2
> σX2 >
χ2n−1;1−α/2 χ2n−1;α/2

y obtenemos el estimador por intervalos de confianza


!
(n − 1)sX2 (n − 1)sX2
,
χ2n−1;α/2 χ2n−1;1−α/2

6. El intervalo de confianza es:


!
(n − 1)sx2 (n − 1)sx2
IC1−α (σX2 ) = ,
χ2n−1;α/2 χ2n−1;1−α/2
Ejemplo: calcular un intervalo de confianza para σX2 y σX
Ejemplo: 8.8 (Newbold) Una muestra aleatoria de quince pastillas para el dolor
de cabeza tiene una cuasi desviación tı́pica de 0.8 % en la concentración del
ingrediente activo. Calcule un IC al 90 % para la varianza de la población para
estas pastillas. Obtenga también un IC para la desviación tı́pica de la población.
0 1
(n−1)sx2 (n−1)sx2
Población: 2) = @
Objetivo: IC0,9 (σX
χ2
, 2
χ
A
n−1;α/2 n−1;1−α/2
X = çoncentración del
ingrediente activo en una pastilla
(in %)”X ∼ N(µX , σX2 ) sx2 = 0,82 = 0,64 n = 15

'
1 − α = 0,9 ⇒ α/2 = 0,05
MAS: n = 15 χ2n−1;1−α/2 = χ214;0,95 = 6,57
χ2n−1;α/2 = χ214;0,05 = 23,68
Muestra: sx = 0,8 „ «
14(0,64) 14(0,64)
IC0,9 (σX2 ) = ,
23,68 6,57
Area= Area=
= (0,378, 1,364) ⇒
p p
0.05 0.05 IC0,9 (σX ) = ( 0,378, 1,364)
● ● = (0,61, 1,17)
χ214 ; 0.95 χ214 ; 0.05 √
=6.57 =23.68
Para obtener IC(σX ) aplicamos a los
extremos de IC(σX2 )
Fórmulas para intervalos de confianza

Resumen para una población


I Sea X n una muestra aleatoria simple de una población X con media µX y
varianza σX2

Parámetro Hipótesis Cantidad pivotal (1 − α) Intervalo Conf.

„ «
X̄ −µX σ σ
Datos normales √ ∼ N(0, 1) µX ∈ x̄ − zα/2 √X , x̄ + zα/2 √X
Varianza conocida σX / n n n
„ –
X̄ −µX σ̂ σ̂
Media Datos no normales √ ∼approx. N(0, 1) µX ∈ x̄ − zα/2 √x , x̄ + zα/2 √x
Muestra grande σ̂X / n n n
r #
Datos Bernoulli p̂X −pX p̂x (1−p̂x )
∼approx. N(0, 1) pX ∈ p̂x ∓ zα/2
n
q
Muestra grande p̂X (1−p̂X )/n

Datos normales
„ «
X̄ −µX s s
Varianza descono- √ ∼ tn−1 µX ∈ x̄ − tn−1,α/2 √x , x̄ + tn−1,α/2 √x
sX / n n n
cida 0 1
2
(n−1)sX (n−1)sx2 (n−1)sx2
Varianza Datos normales ∼ χ2
n−1
2
σX ∈ @ 2 , 2 A
σ2 χ χ
X n−1;α/2 n−1;1−α/2
0v 1
2
v
(n−1)sX u (n−1)sx2 (n−1)sx2
u u
∼ χ2 σX ∈ @t 2
u
Desv. tı́pica Datos normales n−1 ,t 2 A
σ2 χ χ
X n−1;α/2 n−1;1−α/2
Intervalos de confianza para la media de la población:
¿Qué usar cuándo?

X ∼ distribución con media µX y desviación tı́pica σX

.X ∼ normal
&X  normal

.
σ conocida
&
σ desconocida
.
n pequeña
&
n grande


basada en z

basada en t
↓ ↓
métodos más basada en z
(exacta) (exacta) allá de Est II (aprox. TCL)

También podría gustarte