Está en la página 1de 33

UNIVERSIDAD NACIONAL JORGE BASADRE GROHMANN

Dpto. de Matemática y Estadística

Capítulo X

Inferencia Estadística

Bioestadística Docente: Ing. César Meléndez


Objetivos del capítulo

Entender el proceso de inferencia


estadística para la estimación
(estimación puntual y por
intervalos) y de prueba de
hipótesis de los parámetros de una
población.

2
Contenido
Estimación puntual de Parámetros

Estimación de parámetros por intervalos de confianza

Intervalo de confianza para la media

Intervalo de confianza para la proporción

Intervalo de confianza para la varianza

Determinación del tamaño de muestra


.

Inferencia Estadística
Definición
La inferencia estadística se ocupa de la estimación y prueba
de hipótesis de los parámetros de una población, en base de
una muestra aleatoria extraída de dicha población.

La inferencia estadística comprende:

1. La estimación de parámetros (estimación puntual y por


intervalos de confianza).
2. Las pruebas de hipótesis de parámetros.

4
.

Inferencia Estadística
Estimación puntual de parámetros
Sea X 1 , , X n una muestra de tamaño n de una población
con parámetro . Se denomina estimador puntual de  a
cualquier estadístico ˆ = h ( X 1 , , X n ) cuyo valor dará una
estimación puntual de . En este caso ̂ es una variable
aleatoria y ̂ es un número. Los estimadores puntuales para
la media, varianza y proporción serán: n

X i

Para la media poblacional (µ): ̂ = X = i =1

n
n
(X i − X )2
Para la varianza poblacional (2): ˆ 2 = S 2 = i =1
n −1
Número de éxitos
Para la proporción poblacional (): ˆ = p =
n 5
.

Inferencia Estadística
Ejemplo 1
De una población de tallas (mt) en madres adolescentes con
media µ y varianza 2, se extrae una muestra aleatoria de 8
madres adolescentes, cuyos valores observados son: 1.50,
1.60, 1.58, 1.45, 1.52, 1.68, 1.62, 1.55. Halle un estimador
puntual para la media, la varianza y la desviación estándar
poblacionales: 8

X i
12.5
X = i =1
= = 1.56 mt.
8 8
n ( n
Xi )2
n

X i
2
− i =1
n
X i
2
− nX
19.569 − (12.5) 2 19.569 − 8 x1.562
S =
2 i=
= i=
= = = 0.0053
n −1 n −1 7 7

S = 0.0053 = 0.073
6
.

Inferencia Estadística
Estimación de parámetros por intervalos
Sea X 1 , , X n una muestra aleatoria de tamaño n de una
población con parámetro , cuyos valores observados o datos
respectivos son x1 , , xn .
Sea además, la v.a. ˆ = h ( X 1 , , X n ) un valor estadístico, con
función de probabilidad conocida, que estima a .
Si P ( A    B ) = 1 −  donde A = h1 ( X 1 , , X n ) y B = h2 ( X 1 , , X n )
son v.a. halladas a partir de la distribución de ˆ = h ( X 1 , , X n )
entonces se dice que el intervalo aleatorio  A, B  es el
intervalo estimador del parámetro , o que    A, B  con
probabilidad 1 - α

7
.

Inferencia Estadística
Estimación de parámetros por intervalos
Si a = h1 ( x1 , , xn ) y b = h2 ( x1 , , xn ) son los valores numéricos
que resultan al reemplazar los valores de la muestra en las v.a.
A y B respectivamente, entonces, se dice que el intervalo
numérico a, b es el intervalo de confianza del (1 −  ) 100 % para
, o que   A, B con un nivel o grado de confianza de (1 −  ) 100 %

8
.

Inferencia Estadística
Intepretación
Si con los datos de una muestra aleatoria de tamaño n se
construyó el intervalo a    b con nivel de confianza, por
ejemplo, 98% para el parámetro , esto quiere decir que si se
seleccionan repetidamente 100 muestras de tamaño n, se
tendrá 100 intervalos de la forma  a, b y se confía que 98 de
estos 100 intervalos contengan al parámetro .

9
.

Inferencia Estadística
Intervalo de confianza para la media poblac
Intervalo de confianza para una media poblacional µ con
varianza  desconocida.
2

Si X 1 , , X n es una muestra aleatoria de una población normal


con media µ y varianza 
2
desconocida. Para cualquier
tamaño de muestra se tienen que la v.a. t = X −  ~ t n -1
S
n
entonces para definir el intervalo de confianza del (1 −  ) 100 %
se cumple:
 
   X − 
P − t(1− ; n −1)  t(1− n )  t(1− ; n −1)  = P − t(1− ; n −1)   t(1− ; n −1)  = 1 − 
 2 2   2 S 2

 n 
10
.

Inferencia Estadística
Intervalo de confianza para la media poblac
Entonces, despejando la expresión anterior, el intervalo con un
nivel de confianza del (1 −  ) 100 % para la media µ será hallado
por:
 
 s S 
 X − t (1− ;n −1)    X + t (1− ;n −1) 

 
2 n 
2 n

 a b 

donde a y b son valores numéricos que representan el Límite


inferior y Límite superior del intervalo.

11
.

Inferencia Estadística
Intervalo de confianza para la media poblac
s
Límite inferior: LI (  ) = X − t 
(1− , n −1) n
2

s
Límite superior: LS (  ) = X + t 
(1− , n −1) n
2

s
Margen de error: E = t  
 1− , n −1 n
 2 

Longitud o amplitud del intervalo: LS (  ) − LI (  ) = 2 E

12
.

Inferencia Estadística
Intervalo de confianza para una proporción
p −
Se usa la v.a. ~N(0,1) y n>30
 (1 −  )
n

entonces para definir el intervalo de confianza del (1 −  ) 100 %


para la proporción se cumple:

 
   
p −
P − Z     Z  Z     = P − Z      Z    = 1 − 
  1−   1−     1−   (1 −  )  1−  
  2  2
  2  2

 n 

13
.

Inferencia Estadística
Intervalo de confianza para una proporción
Entonces, despejando la expresión anterior, el intervalo con un
nivel de confianza del (1 −  ) 100 % para la proporción (π) será
hallado por:
p (1 − p ) p (1 − p )
p − Z     p + Z  
1−  n 1−  n
 2  2
a b

donde a y b son valores numéricos que representan el Límite


inferior y Límite superior del intervalo.

14
.

Inferencia Estadística
Intervalo de confianza para la varianza
Sea X 1 , , X n es una muestra aleatoria de una población
normal con varianza  desconocida. Se usa:
2

(n − 1) S 2  (X i − X )2
= ~  (2n -1)
 2
 2

entonces para definir el intervalo de confianza del (1 −  ) 100 %


para la varianza se cumple:

( )
P  (2 2,n−1)   (2n−1)   (21− 2,n−1) = 1 − 

 2
P   ( 2,n−1) 
( n − 1) S 2 
  (1− 2,n−1)  = 1 − 
2

  2

15
.

Inferencia Estadística
Intervalo de confianza para la varianza
Entonces, despejando la expresión anterior, el intervalo con un
nivel de confianza del (1 −  ) 100 % para la varianza 2 será
hallado por:
( n − 1) s
2

 
(2
n − 1) s
2

 2  
2
  
1− , n −1  , n −1
 2  2 
a b

donde a y b son valores numéricos que representan el Límite


inferior y Límite superior del intervalo.

16
.

Inferencia Estadística
Intervalo de confianza para la Desv. Estand.
Si se desea obtener los limites de confianza para la desviación
estándar, se obtiene la raíz cuadrada en la expresión anterior
obteniéndose:
( n − 1) s 2  
( n − 1) s 2
 2
  
 2 
 1− , n −1  , n −1
 2   2 
a b

donde a y b son valores numéricos que representan el Límite


inferior y Límite superior del intervalo.

17
.

Inferencia Estadística
Intervalo de confianza
Ejemplo 2.- En 2011, se tomó una muestra de 35 casas en la
Ciudad 1, y se hizo el estudio de las siguientes variables: X=
Peso total de basura producida en una casa durante un día
(Kg), Y= Peso de residuos orgánicos producidos (Kg) en una
casa durante un día y Z= Hábito de reciclaje, obteniéndose los
siguientes resultados:
Peso Peso residual
Total Orgánico

3.160 1.997
x
s 0.884 0.818
n 35 35

Del total de casas, sólo 6 tienen hábitos de reciclaje.


18
.

Inferencia Estadística
Intervalo de confianza
Del total de casas, sólo 6 tienen hábitos de reciclaje.
a.- Halle e interprete un intervalo de confianza del 95% para el
peso total promedio de basura producida en una casa durante
un día.
Solución:

1 −  = 0.95 →  = 0.05 → 1 − = 0.975  t( 0.975,34) = 2.032
2
0.884 0.884
3.160 − 2.032    3.160 + 2.032  2.856    3.464
35 35

Interpretación: se tiene un nivel de confianza del 95% que el


peso total promedio de basura producida por una casa durante
un dia esta en el intervalo
 2.856,3.464 19
.

Inferencia Estadística
Intervalo de confianza
b.- Halle un intervalo de confianza de 95% para la verdadera
proporción de casas que tienen el hábito de reciclaje en esa
ciudad.
Solución:
  = =
6
= 0.1714
1 −  = 0.95 →  = 0.05 → 1 − = 0.975 , Z (0.975 ) 1.96 y p
2 35
0.1714x(1 − 0.1714) 0.1714 x(1 − 0.1714)
0.1714 − 1.96    0.1714 − 1.96
35 35
 0.0465    0.2963

Interpretación: Se tiene una confianza de 95% que la verdadera


proporción de casas que tienen el hábito de reciclaje, está en el
intervalo 0.0465, 0.2963
20
.

Inferencia Estadística
Intervalo de confianza
c.- Halle e interprete un intervalo de confianza del 95% para la
varianza y desviación estándar del peso de los residuos
orgánico.
Solución:
 ,
1 −  = 0.95 →  = 0.05 → 1 − 2
= 0.975   (0.975,34 ) = 51.966 y  (0.025,34 ) = 19.806
2

2
(n − 1) S 2 (n − 1) S 2 (35 − 1)0.8182 (35 − 1)0.8182
 
2
  
2
 0.438   2  1.149
 21− ;n−1  2 ;n−1 51.966 19.806
( 2 ) ( 2 )
Interpretación: Se tiene una confianza de 95% que la verdadera
varianza estándar del peso de los residuos orgánico se
encuentra en el intervalo  0.438, 1.149
21
.

Inferencia Estadística
Intervalo de confianza
Para la desviación estándar:

0.438    1.149 , 0.662    1.072

Interpretación: Se tiene una confianza de 95% que la verdadera


desviación estándar del peso de los residuos orgánico se
encuentra en el intervalo  0.662, 1.072

22
.

Inferencia Estadística
Intervalo de confianza
Ejercicio 1
Un inspector de calidad está evaluando si el contenido de fruta
por lata es el adecuado. Se supone que el contenido de fruta se
distribuye como una normal. El inspector escoge al azar 35
latas y encuentra que el peso promedio es de 29.2 onzas, la
varianza es de 4 onzas2 y que 5 no tienen un peso adecuado.

a.- Halle e interprete un intervalo de confianza del 95% para el


peso promedio poblacional.

23
.

Inferencia Estadística
Intervalo de confianza
Ejercicio 1.-
b.- Halle e interprete un intervalo de confianza del 95% para la
variancia y desviación estándar poblacional del contenido de
fruta en las latas.

c.- Halle e interprete un intervalo de confianza del 99% para la


proporción poblacional de latas que presentan un peso
adecuado.

24
.

Inferencia Estadística
Determinación del tamaño de muestra
A continuación se presenta la manera de hallar el tamaño de
muestra cuando se estima a la media poblacional μ o cuando
se estima a la proporción poblacional π .

Determinación del tamaño de muestra para estimar a la


media poblacional µ.
x −
Se sabe que t = despejando se obtiene el tamaño de
s/ n
muestra:
2 2
t s
n= 2
e 25
.

Inferencia Estadística
Determinación del tamaño de muestra
Donde:

e : es el margen de error que se quiere aceptar.

El valor de t = t(1− ) depende del nivel de confianza requerido


2

y se trabaja con gl → 

La variancia s2 se obtiene de una muestra piloto.

26
.

Inferencia Estadística
Determinación del tamaño de muestra
Determinación del tamaño de la muestra para estimar a la
proporción poblacional π.

p −
Se sabe que Z= despejando se obtiene el tamaño de
 (1 −  )
muestra: n

Z  (1 −  )
2

n=
e2

27
.

Inferencia Estadística
Determinación del tamaño de muestra
Donde:

e : es el margen de error permisible.

El valor de Z = Z (1− ) depende del nivel de confianza requerido.


2

π es el parámetro que se desea estimar y como es


desconocido, entonces se puede tomar una muestra piloto
para obtener un valor estimado. Se puede utilizar el valor
conservador igual a 0.5.

28
.

Inferencia Estadística
Determinación del tamaño de muestra
Ejemplo 4.- Una famosa cadena de hoteles desea desarrollar
un intervalo de confianza del 99% para estimar el número
promedio de habitaciones ocupadas cada noche en sus
sucursales de toda la nación. ¿Cuántas noches deben incluirse
en la muestra si se puede tolerar un error de 10 habitaciones y
una muestra piloto revela una desviación estándar de 60
habitaciones?
Solución:
t 2 s 2 2.582 x602
 = 0.01  t 1− , = t( 0.995, ) = 2.58  n = 2 = = 239.63  240
( 2 ) e 10 2

29
.

Inferencia Estadística
Determinación del tamaño de muestra
Ejemplo 5.- ¿Cuántos estudiantes debe tener una muestra, con
el fin de estimar la proporción de estudiantes que tienen correo
electrónico? En un estudio previo, se halló que de 150
estudiantes, 120 tenían correo electrónico. Se desea tener un
nivel de confianza del 95% y un error del 3% en las
estimaciones.
Solución:
1.96 2
 0.8  0.2
p=
120
= 0.8 , Z 0.975 = 1.96 entoncesn = 2
= 682.95 = 683
150 0.03

30
.

Inferencia Estadística
Determinación del tamaño de muestra
En el siguiente cuadro se presenta las estimaciones de
tamaños de muestra para diferentes valores de márgenes de
error:
Margen de error n0

0,01 6146,560

0,02 1536,640

0,03 682,951

0,04 384,160

0,05 245,862

Se observa un incremento exponencial de tamaño de muestra


al disminuir el margen de error.
31
.

Inferencia Estadística
Determinación del tamaño de muestra
Ejercicio 3.-
¿Cuál debe ser el tamaño de muestra para estimar el nivel
medio del consumo de proteínas de los adultos de una zona
minera, si se desea tener un margen de error de 0.45 g/dl y un
nivel de confianza del 95%?. De una muestra piloto se obtuvo
que el consumo de proteínas tiene una desviación estándar de
2.5 g/dl.

32
.

Inferencia Estadística
Determinación del tamaño de muestra
Ejercicio 4
a. El director comercial de cierta compañía que realiza ventas
por correo electrónico, desea precisar con mucho cuidado su
política de crédito. Si el director desea tener un intervalo de
confianza del 99% para la proporción de clientes que están al
día en sus pagos. ¿Qué tamaño de muestra debe usar si se
desea tener un margen de error del 4.5%?. Suponga que en
una muestra piloto de 35 clientes se halló que 8 clientes están
al día en sus pagos.

33

También podría gustarte