Está en la página 1de 23

ESTADISTICA INFERENCIAL

INTERVALOS DE CONFIANZA
INFERENCIA

Es el proceso a través del cual se describe la población a partir del análisis


de la muestra.

La inferencia exige que la muestra tenga un tamaño adecuado y los


elementos independientes unos de otros para garantizar su
representatividad.
POBLACIÓN VS MUESTRA
DISTRIBUCIÓN MUESTRAL DE LA MEDIA
Teorema de Limite Central Casos especiales de Características en la
aplicación del distribución de la
Teorema media
Si 𝑋ത es el promedio de una muestra
𝜎2
aleatoria seleccionada de una Muestra pequeña, 𝑋ത ≈ 𝑁 𝜇, ,
distribución poblacional 𝑛
población con media µ y varianza σ², 𝜎
normal y  conocida 𝜎𝑥ҧ =
la distribución de la media en el 𝑛

muestreo se aproxima a la 𝑆2
distribución normal a medida que va Muestra grande con  𝑋ത ≈ 𝑁 𝜇, ,
desconocida, sin 𝑛
creciendo el tamaño de la muestra. importar la distribución 𝑆
𝜎2 𝜎𝑥ҧ =
Esto es, 𝑋ത ≈ 𝑁 𝜇, , 𝑛→∞ poblacional 𝑛
𝑛
Parámetro Estadístico Media Varianza

µ 𝑥ҧ µ 𝜎2
𝑛

𝑃(1 − 𝑃)
P 𝑝Ƹ P
𝑛
DISTRIBUCIÓN MUESTRAL
Es la distribución de probabilidad de una variable
cuyos valores provienen de la muestra, lo que
equivale a la distribución de un estadístico.
Las mas conocidas son las distribuciones
Normal
Chi cuadrada
T-student
F
EJERCICIO
Se toma una muestra aleatoria de 25 pastelitos de la planta X donde el peso
se distribuye normal con media 80gr y desviación estándar 5gr. De la planta Y,
se toma otra muestra aleatoria de 36 pastelitos producidos con peso
promedio de 75gr, desviación estándar 3gr y distribución normal.
Que tan probable es que
a. La muestra de pastelitos de la planta X tenga media mayor a 78gr
b. La muestra de pastelitos en X pese más de 2075gr
c. El promedio de los pastelitos de la planta X exceda el promedio de los
pastelitos Y en mas de 3.4gr, pero menos de 5.9gr
DISTRIBUCIÓN DE LA PROPORCIÓN MUESTRAL
Ejercicio
El director de una empresa piensa que 30% de los pedidos provienen de nuevos
compradores. Para verificar esto, usará una muestra aleatoria simple de 100 pedidos.
Suponiendo que el director está en lo cierto y que p =0,30,
a. ¿Cuál es la distribución muestral de la proporción en este estudio?
b. ¿Cuál es la probabilidad de que la proporción muestral esté entre 0.20 y 0.40?
c. ¿Cuál es la probabilidad que la proporción muestral esté por encima de 0.35?
2/24/2020

Rango de valores llamado límites dentro del cual se espera


encontrar el parámetro  con una confianza especifica 1 - 

P( ˆ    ˆ )  1  
I S
Llamado intervalo bilateral

El intervalo de confianza también puede ser

P( ˆ   )  1  
I
intervalo unilateral inferior

P(   ˆ )  1   intervalo unilateral superior


S
2/24/2020

COMPONENTES DEL INTERVALO

Límites del Confianza.


ˆ y ˆ
I S Dependen del estimador puntual y su
distribución muestral

Coeficiente, nivel o grado de confianza.


1   100% Lo determina el investigador. Afecta de
manera directa la amplitud del Intervalo.
2/24/2020

1

ˆI  ˆS
X I  X S

Un buen intervalo debería ser lo más angosto


con el mayor nivel de confianza posible.
2/24/2020

INTERVALO DE CONFIANZA PARA 

P(  z  Z  z )  1  
/2 /2

X 
P(  z   z )  1 
/ n
/2 /2

Requiere conocer la varianza poblacional.


2/24/2020

INTERVALO DE CONFIANZA PARA 

P( x  z  / n    x  z  / n )  1  
/2  /2

Siendo e  z  / n
 /2

P( x  e    x  e)  1  
2/24/2020

EJERCICIOS
Una empresa fabrica bombillas de luz que tienen una duración con
distribución aproximada a la normal con desviación estándar de 40
horas.

a. Si una muestra de 30 bombillas tiene una duración promedio


de 780 horas, encuentre un intervalo de confianza de 96% para
la media de la población de bombillas que produce esta
empresa
b. De qué tamaño debe ser la muestra si se desea una confianza
del 96% de que la media muestral esté dentro de 10 horas de la
media real?
2/24/2020

Comparación gráfica de intervalos


Interval Plot of distributions means about exponential(10) size 5, 10, 30, 50
95% CI for the Mean
10.5

10.4

10.3

10.2

10.1
Data

10.0 10

9.9

9.8

9.7

9.6
expn5 expn10 expn30 expn50

Intervalos del 95% para μ en la distribución de medias en muestras de 5, 10, 30 y 50 de


una exponencial (10)
2/24/2020

TAMAÑO DE MUESTRA

¿Si se desea la estimación de la media poblacional a través de


un intervalo de confianza del (1-α)100% con un error máximo
e, qué valor debe tomar n?

¿Si se desea la estimación de la proporción poblacional a


través de un intervalo de confianza del (1-α)100% con un
error máximo e, qué valor debe tomar n?
2/24/2020

17
ESTADÍSTICOS PARA CONSTRUIR INTERVALOS
DE CONFIANZA

Si el parámetro a estimar es μ, el estadístico de prueba podría ser:

𝑥ҧ − 𝜇 𝑥ҧ − 𝜇 𝑥ҧ − 𝜇 𝑝−𝑃
𝑍=𝜎 𝑍=𝑠 𝑇=𝑠 𝑍=
ൗ 𝑛 ൗ 𝑛 ൗ 𝑛 𝑃 1−𝑃
𝑛
Si el parámetro a estimar es ² o la razón de varianazas en la población, el estadístico de
prueba podría ser:

(n 1)S 2
𝑆12 𝜎22
 2
F= 2 2
 2
𝑆2 𝜎1
DISTRIBUCIÓN T-STUDENT

Propuesta por William Goset en 1939 a


𝑘+1 𝑘+1
partir del análisis de muestras Γ 2 𝑡2

2
pequeñas. ℎ𝑘 𝑡 = 𝑘
1+ 𝑘 −∞<𝑡 <∞
Γ 2
𝜋𝑘
La distribución T guarda similitud con la
distribución normal estándar, pero a
diferencia de esta, tiene varianza mayor Γ 𝛼 representa la función gamma, donde
que 1. 𝑥

Γ 𝛼 = න 𝑒 −𝑥 𝑥 𝛼−1 𝑑𝑥
Depende de los grados de libertad k
asociados a la estimación y una función 0

de densidad h(t):
DISTRIBUCIÓN T-STUDENT

Para valores de k por encima de 3, esta distribución tiene


media cero y varianza k/(k-2)

𝑋−𝜇
En inferencia, se tiene la variable 𝑇 = 𝑆 conocida
ൗ√𝑛
como una distribución T-Student con k=n-1 grados de
libertad, usada para las inferencias sobre la media de
una población cuando la muestra es pequeña y proviene
de una población normal de varianza desconocida.
Existe una tabla de valores críticos T que permite el
cálculo de probabilidades y percentiles.
Realizada bajo simulación en MiniTab
2/24/2020

INTERVALO DE CONFIANZA PARA 


Si se desconoce la varianza en la población y se toma la muestra de una
población con distribución normal, el intervalo de confianza del (1-α)100% para
 tiene la forma
𝑆
𝑥ҧ ∓ 𝑡 𝛼ൗ ;𝑛−1
2 𝑛

Cuando el tamaño de la muestra es mayor que 30 se puede usar la


aproximación normal en la media muestral sin que afecte de manera significativa
el desconocimiento de la varianza, obteniéndose el intervalo:

P( x  Z  / 2 s / n    x  Z  / 2 s / n )  1  
DISTRIBUCIÓN JI CUADRADA

Formulada por Karl Person, es la distribución continua del


(𝑛−1)𝑆 2
estadístico𝜒2 = que depende de los grados de
𝜎2
libertad k=n-1.

Esta la distribución continua, asimétrica positiva con límite


en la distribución normal cuando el tamaño de muestra n
se va incrementando.

1 𝑘
𝑥 2 −1 𝑒 −𝑥/2 𝑠𝑖 𝑥 > 0
2 𝑘 Τ2 Γ 𝑘
𝑓 𝑥, 𝑘 = 2 Realizada bajo simulación en MiniTab

0 𝑠𝑖 𝑥0
DISTRIBUCIÓN JI CUADRADA

Al igual que la distribución T, la 𝜒 2 goza de un amplio sustento teórico, tiene función de


probabilidad dependiente de la función gamma (α), usada en inferencia para múltiples
propósitos como:

• Intervalos y pruebas de sobre la varianza de una población cuando la muestra es


pequeña y proviene de una población normal

• Prueba de independencia entre variables aleatorias principalmente categóricas

• Pruebas de bondad de ajuste de una muestra a una población.

Similar a la distribución T, existe una tabla de valores críticos 𝜒 2 que permite los
cálculos de algunos valores probabilísticos y porcentuales.
2/24/2020

INTERVALO DE CONFIANZA PARA σ²


Si se desconoce la varianza en la población y se toma la muestra de una población con
distribución normal, el intervalo de confianza del (1-α)100% para la varianza es:

𝑛−1 𝑆 2 𝑛−1 𝑆 2
2 < 𝜎2 <
𝜒𝛼 𝜒2 𝛼
2 1− 2

También podría gustarte