Documentos de Académico
Documentos de Profesional
Documentos de Cultura
01/09/2008
Mg. SEMS
Inferencia Estadstica
Inferencia Estadstica Una declaracin de probabilidad exacta, acerca del parmetro de la poblacin, basada en la data muestral. Intervalo de Confianza Calculado de la informacin Tiene una probabilidad conocida de incluir el parmetro desconocido de la poblacin que est siendo estimada Nivel de Confianza La probabilidad de incluir el parmetro de la poblacin dentro del intervalo de confianza 95% es usualmente aceptado. Tambin se usa: 99%, 99.9%, 90%
01/09/2008 Mg. SEMS 2
p 2S p
Debido a que un estimado (si est normalmente distribuido) tiene un 95% posibilidad de estar entre dos de sus desviaciones standard de su media
01/09/2008
Mg. SEMS
Cmo trabaja?
X est entre 2SX de su media , cerca del 95% del tiempo Debido a que SX es un estimado de X (la desviacin standard de la distribucin de la muestra de X )
X
SX
Esto tambin dice que est entre 2SX y X cerca del 95% del tiempo
01/09/2008 Mg. SEMS 4
P(x t (/2)
sx sx x + t (1/2) )= n n
%
Donde :
: Es la media
-3
-2 -t1
-1
2 t2
poblacional
%
LS
t
X
5
X zSX
X + zSX
donde z es de la tabla z Para muestras pequeas usamos t (n = 40 o menos) t es ms grande que 1.96 (aproximadamente 2) SX Debido a que usamos el Error Standard ( ) como un X estimado en lugar de la Desviacin Standard de la Poblacin ( ) del promedio de la muestra
01/09/2008
Mg. SEMS
=95%
-3
-1.96
-2
-1
=95%
21.66 23.91 26.16
t=DISTR.T.INV(0,05;9) t=2.262
-3
-2.26
=95%
-2 -1 0
0
2.26
= 95%
78.74
LI
LS
10
=99% o = 1%
Usando el 99 % de nivel de confianza t = 3.250 para 2-lados, 99 % confianza con n = 10 De A
70
80
01/09/2008
Supuestos
Supuestos necesitados para la validez del Intervalo de Confianza 1. Datos son una MUESTRA ALEATORIA de la poblacin de inters (De tal manera que la muestra te diga algo de la poblacin) 2. El promedio de la muestra es aproximdamente NORMAL Puede que la data sea normal (check el histograma) O se aplica el teorema de lmite central: Muestras lo suficientemente grandes de tamao n, distribucin no demasiada sesgada (De tal manera que la tabla z es tcnicamente apropiadada)
01/09/2008 Mg. SEMS 13
Interpretacin
X
57.86 y 78.74 Promedio de vida: cerca del 95% de los intervalos de confianza incluye . Podramos nunca saber cuales!
01/09/2008 Mg. SEMS 14
qu
Fuera! Fuera!
24
15
Ejemplo:
El administrador de una negocio tom una muestra de 25 cuentas vencidas, a partir de las cuales calcul una media de $ 380 y una desviacin estndar de $ 75. Suponiendo que las cantidades de todas las cuentas por cobrar presentan una distribucin normal, construya e interprete el intervalo de confianza para la al 0,99 de confianza.
01/09/2008
Mg. SEMS
16
Z1
01/09/2008 Mg. SEMS
Z2
17
Z1
01/09/2008 Mg. SEMS
Z2
18
a)
Sx =
Datos :
45 25
X = 380 Sx = 45 n = 25
b)
= 99%
-2.58 0 258
=9
c ) LI = X z1Sx LS = X + z 2Sx
LI = 380 2.58(9) = 356.8 LS = 380 + 2.58(9) = 403.2
Z1
Z2
= 99%
356.8 403.2
LI
LS
IDF.T(prob,gl). Numrico. Devuelve el valor de la distribucin t de Student, con los grados de libertad gl especificados, para el cual la probabilidad acumulada es prob.
t1
t2
01/09/2008
Mg. SEMS
20
DISTR.T.INV( p, gl ). Numrico. Devuelve el valor del recorrido de la distribucin normal, con la media y desviacin tpica especificadas, para el cual la probabilidad acumulada es p. DISTR.T.INV devuelve dicho valor t, tal que P(|X| > t) = probabilidad cuando X es una variable aleatoria que sigue la distribucin t y P(|X| > t) = P(X < -t o X > t).
= 99%
0 2.797
t1
01/09/2008 Mg. SEMS
t2
21
a)
Sx =
Datos :
45 25
X = 380 Sx = 45 n = 25
b)
-2.797
=9
= 99%
0 2.797
c ) LI = X t1Sx
LS = X + t 2Sx
LI = 380 2.797(9) = 354.83 LS = 380 + 2.797(9) = 405.17
t1
t2
= 99%
354.8 405.2
LI
LS
22
Ejemplo:
El administrador de un proceso de produccin tomo una muestra de 36 gaseosas de 500 cc con el propsito de verificar si el proceso de produccin de estas gaseosas estn dentro del estndar de produccin. A partir de dicha muestra calcular la media y desviacin estndar. Si el envasado de las gaseosas siguen una distribucin normal, calcular los intervalos de estimacin del parmetro poblacional, para un nivel de confianza del 90, 95 y 99 por ciento para . Los datos de la muestra estn en el siguiente cuadro.
01/09/2008
Mg. SEMS
23
Muestra A obs 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 X 517 506 502 487 488 496 499 503 496 508 501 491 516 496 487 499 524 509 obs 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 X 491 506 499 492 505 512 498 518 472 492 481 488 488 506 508 486 499 501
Datos :
Clculo de Z o de t se tiene :
01/09/2008
Mg. SEMS
24
Estadsticos de la razn para x / aux Media Intervalo de confianza Lmite inferior para la media al 90% Lmite superior Desviacin tpica 499.083 495.936 502.231 11.177
= 90%
495.9 502.2
LI
LS
Los intervalos de confianza se crean con el supuesto de una distribucin normal para las razones.
p=
x n
Sp =
p(1 p) n
%
z1 0 z2
LI = p z1Sp
LS = p + z1Sp
LI
%
LS
01/09/2008
Mg. SEMS
26
Sp =
p(1 p) n
z1
%
0 z2
A = Np
SA = NSp
LI = A z1SA LS = A + z1SA
01/09/2008 Mg. SEMS
%
LI LS
27
= 95 %
0 z2
1.96
= 95 %
LS
0.254
01/09/2008 Mg. SEMS
0.365
29
Ejemplo:
El marco muestral de un asentamiento humano se haya en un archivo del SPSS ( *.SAV ) que tiene una poblacin de 7,500 habitantes adultos. A partir de este marco de muestra seleccionamos una muestra completamente aleatoria de tamao 65. Cuyos datos se muestran en el cuadro adjunto. Estimar: a. La proporcin poblacional del porcentaje de analfabetos, b. El total de analfabetos en el asentamiento humano; c. En forma intervlica la proporcin poblacional y el total de analfabetos con un nivel de confianza del 96%.
01/09/2008 Mg. SEMS 30
Datos :
n 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 N A 178 181 336 337 431 499 601 657 671 878 895 1433 1441 1449 1605 2136 2302 2344 X 1 0 0 1 0 0 1 0 0 1 1 0 0 1 0 0 1 0 n 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 N A 2408 2423 2791 2799 2937 3016 3077 3104 3120 3264 3324 3643 3649 3664 3855 3927 4025 4266 X 0 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 n 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 N A 4304 4547 4552 4603 4634 5322 5389 5472 5740 5753 5771 6028 6090 6421 6433 6439 6551 6649 X 0 1 1 0 0 0 0 0 0 0 0 0 0 1 0 1 1 0 n 55 56 57 58 59 60 61 62 63 64 65 N A 6651 6673 6745 6813 6987 7170 7171 7182 7216 7251 7275 X 0 0 1 0 1 0 0 0 0 1 0
X : Analfabeto ? 0 No 1 Si
01/09/2008
Mg. SEMS
Estimacin puntual
a.b.-
Interpretacin:
Se espera que la proporcin de analfabetos en el rea urbana es del 26% y el total de analfabetos 1950 ciudadanos.
01/09/2008
Mg. SEMS
32
Intervalo de Proporcin: P
c1.- Intervalo de p:
t1 = IDF.T(0. 02,64) = -2.0965 t2 = IDF.T(0.98, 64) = 2.0965
= 96%
0.26 0.37
LI
LS
= 96%
1950 2813.8
LI
LS
95% un-lado
95% un-lado 90% dos-lados 95% dos-lados Error Standard Promedio muestra
01/09/2008
Mg. SEMS
35
n = 10
X = 68.7
= 95 %
0 t
2.821
SX = S / n = 14.6 / 10 = 4.617
L = X tun lado S X
L = 68.3 2.821 4.617 = 55.28
LI
= 95 %
LS
55.28
37
LA DISTRIBUCION t Student
Para muestras de tamao menor a 30 llamadas pequeas muestras, la aproximacin normal no es tan buena y va siendo peor a medida que n disminuye, por lo que hay necesitad de hacer uso de otra distribucin, esta es la distribucin t de Student cuya aplicacin son validas para muestras grandes y pequeas.
x x = t= s / n 1 s / n
S
2
anlogo a
Donde :
z=
x / n
(x x ) =
n
01/09/2008
^ 2
(x x ) =
n 1
Mg. SEMS
EJEMPLOS
1.-A nueve pacientes que sufren la misma incapacidad fsica, y por lo tanto son comparables, se les pidi que llevaran a cabo cierta tarea como parte de un experimento. El tiempo promedio necesario para realizar la tarea fue de siete minutos con una desviacin estndar de dos minutos. Suponiendo que la distribucin de los datos es normal, construir intervalos de confianza del 90, 95 y 99 por ciento para el tiempo medio real necesario para que este tipo de pacientes efectu la tarea. 2.-El administrador de un hospital tomo una muestra de 25 cuentas vencidas con el propsito de estimar el monto medio de la deuda. A partir de dicha muestra, calculo con una media de $250 y una desviacin estndar de $75. Si todas las cuentas vencidas siguen una distribucin normal, calcular los intervalos de confianza del 90, 95 y 99 por ciento para .
01/09/2008 Mg. SEMS 39
01/09/2008
Mg. SEMS
40
TAMAO DE MUESTRA Para determinar el tamao de la muestra depende de los parmetros que se
desea estimar, es decir podemos estar interesados en conocer una media aritmtica, una proporcin, diferencia de medias o una diferencia de proporciones, de una o dos poblaciones. Para cada uno de los casos mencionados anteriormente existe una determinada frmula.
a) Estimacin de la media
z =
_
x / n
( x ) = d = z1 / 2
z=
_
x / n
N n N 1
n=
2 1 / 2 2
( x ) = d = z1 / 2
N n N 1
=
01/09/2008
Vmax Vmin 6
Nz 12 / 2 2 n= 2 d ( N 1) + z12 / 2 2
Mg. SEMS 41
z =
( pe p) = d = z1 / 2 z12 / 2 p (1 p ) n= d2
p(1 p) n
Nz12 / 2 pq n= 2 d ( N 1) + z12 / 2 pq
NOTA : En caso que no existiera estudio similares y no pudiera hacerse un estudio piloto, se recomienda considerar la xima varianza cuando p= 0.5 con un error de 0.05 ( d = 0.05) Si la fraccin de muestreo n/N es menor 1% se puede hacer uso de la 01/09/2008 formila 1 Mg. SEMS 42
Ejemplo :
Un nutrilogo del departamento de salud, al efectuar una encuesta entre una poblacin de muchachas adolescentes con el fin de determinar su ingestin diaria promedio de protenas, busc el consejo de un bioestadstica con respecto al tamao de la muestra que debe tomar. Antes de que el estadstico pueda ayudar al nutrilogo, ste debe proporcionar tres elementos de informacin: la dimensin deseada del intervalo de confianza, el nivel de confianza deseado y la magnitud de la varianza de la poblacin,2 d = 5 z =1.96 S =20 . 2
n=
= 61.47
n = 62 adolescentes
01/09/2008
Mg. SEMS
43
Ejemplo :
Se planea realizar una encuesta para determinar qu proporcin de familias en cierta rea carece de servicios mdicos. Se cree que la proporcin no puede ser mayor que 0.35 Se desea un intervalo de confianza del 95 % con d = 0.05 de qu tamao se debe seleccionar la muestra de familias?
n=
= 349.6
n = 350 familias
01/09/2008 Mg. SEMS 44