Está en la página 1de 44

INFERENCIA

01/09/2008

Mg. SEMS

Inferencia Estadstica
Inferencia Estadstica Una declaracin de probabilidad exacta, acerca del parmetro de la poblacin, basada en la data muestral. Intervalo de Confianza Calculado de la informacin Tiene una probabilidad conocida de incluir el parmetro desconocido de la poblacin que est siendo estimada Nivel de Confianza La probabilidad de incluir el parmetro de la poblacin dentro del intervalo de confianza 95% es usualmente aceptado. Tambin se usa: 99%, 99.9%, 90%
01/09/2008 Mg. SEMS 2

Intervalo de Confianza Aproximado


De co ben inc idi Estamos 95% seguros que el parmetro de la poblacin estr en este intervalo Para la media de la poblacin: 2 S X X

Estimador 2(Error Standard del estimado)

Para el porcentaje de la poblacin (binomial):

p 2S p

Debido a que un estimado (si est normalmente distribuido) tiene un 95% posibilidad de estar entre dos de sus desviaciones standard de su media

01/09/2008

Mg. SEMS

Cmo trabaja?
X est entre 2SX de su media , cerca del 95% del tiempo Debido a que SX es un estimado de X (la desviacin standard de la distribucin de la muestra de X )
X

X est aqu el 95% del tiempo

SX

est aqu cerca del


95% del tiempo

Esto tambin dice que est entre 2SX y X cerca del 95% del tiempo
01/09/2008 Mg. SEMS 4

INTERVALO DE CONFIANZA PARA LA MEDIA

P(x t (/2)

sx sx x + t (1/2) )= n n
%

Donde :
: Es la media

-3

-2 -t1

-1

2 t2

poblacional

: Nivel de confianza : Nivel de significancia


LI
01/09/2008 Mg. SEMS

%
LS

t
X
5

Intervalo de Confianza para la Media


Estamos 95% seguros que la media desconocida de la poblacin est entre

X zSX

X + zSX

donde z es de la tabla z Para muestras pequeas usamos t (n = 40 o menos) t es ms grande que 1.96 (aproximadamente 2) SX Debido a que usamos el Error Standard ( ) como un X estimado en lugar de la Desviacin Standard de la Poblacin ( ) del promedio de la muestra

01/09/2008

Mg. SEMS

Ejemplo: Encuesta en Restaurant


n = 100 residentes X = $23.91 gastos promedio S = $11.49 variabilidad de cada individuo SX = $1.149 variabilidad del promedio muestral z = 1.960 para 2-lados 95% confianza, de la tabla z X zSX = 23.91 1.9601.149 = $21.66 De X + zS = 23.91+ 1.9601.149 = $26.16 X A Estamos 95% seguros que la media desconocida del gasto de la poblacin est entre $21.66 y $26.16 para todos los N = 77,386 residentes de la poblacin
01/09/2008 Mg. SEMS 7

=95%
-3
-1.96

P(-1.96 < Z < 1.96 ) = 0.95


1 2
1.96

-2

-1

=95%
21.66 23.91 26.16

P(21.66 < X < 26.16) = 0.95

P(-1.96< Z < 1.96)= P(21.66<<26.16) = 0.95


01/09/2008 Mg. SEMS 8

Ejemplo: Produccin Medica


Produccin de una nueva droga para el tratamiento del ataque al corazn n = 10 corridas de produccin X = 68.3 gramos producidos S = 14.6 gramos Presupuesto Anual necesita conocer acerca de = tasa media de produccin del proceso Calculo del intervalo de confianza al 95% SX = S / n = 14.6 / 10 = 4.617 t = 2.262 dos 2-lados 95% confianza con n = 10 De X tS X = 68.3 2.262 4.617 = 57.86 A
01/09/2008

X + tS X = 68.3 + 2.262 4.617 = 78.74


Mg. SEMS 9

El t es hallado haciendo uso la tabla o la funcin del Excel T9gl

t=DISTR.T.INV(0,05;9) t=2.262
-3
-2.26

=95%
-2 -1 0
0

2.26

X tS X = 68.3 2.262 4.617 = 57.86


57.86

= 95%
78.74

X + tS X = 68.3 + 2.262 4.617 = 78.74


01/09/2008 Mg. SEMS

LI

LS

10

Declaracin del Intervalo de Confianza


Estamos 95% seguros que la media de la tasa de produccin desconocida est entre 57.86 y 78.74 gramos por serie produccin Si es que hay ms corridas de produccin en el futuro esto dice que es lo que puede suceder en el futuro con la informacin que proporciona el muestreo El intervalo de confianza refleja la incertidumbre debido a la variabilidad de una corrida de produccin respecto de otra El intervalo no refleja la incertidumbre debido a otras causa (p.e., mejoras futuras en el proceso )
01/09/2008 Mg. SEMS 11

=99% o = 1%
Usando el 99 % de nivel de confianza t = 3.250 para 2-lados, 99 % confianza con n = 10 De A

X tS X = 68.3 3.250 4.617 = 53.29 X + tS X = 68.3 + 3.250 4.617 = 83.31


99% confianza 95% confianza 50 60 Gramos producidos 90 rd S = 14.6 da stan or l err S X = 4 . 617 se za amo orque s fian U n S) p o de c o (no rval X = 68 . 3 te dia el in ra la me a es p
Mg. SEMS 12

70

80

01/09/2008

Supuestos
Supuestos necesitados para la validez del Intervalo de Confianza 1. Datos son una MUESTRA ALEATORIA de la poblacin de inters (De tal manera que la muestra te diga algo de la poblacin) 2. El promedio de la muestra es aproximdamente NORMAL Puede que la data sea normal (check el histograma) O se aplica el teorema de lmite central: Muestras lo suficientemente grandes de tamao n, distribucin no demasiada sesgada (De tal manera que la tabla z es tcnicamente apropiadada)
01/09/2008 Mg. SEMS 13

Interpretacin
X

Interpretando un Intervalo de Confianza


X tS X Media de la Poblacin es fija y desconocida Intervalo de Confianza es aleatorio y conocido les ariab La probabilidad es 0.95 que est entre Para v rias o aleat X zS X y X + zS X

Estamos 95% seguros que (por ejemplo) est entre


s mero n Para

57.86 y 78.74 Promedio de vida: cerca del 95% de los intervalos de confianza incluye . Podramos nunca saber cuales!
01/09/2008 Mg. SEMS 14

Imagnese Muchas Muestras


o os culad l rva r cal e int abe s tro en h O d e pu e es

qu

Fuera! Fuera!

Intervalo calculado 22 23 Media de la poblacin = 23.29


01/09/2008 Mg. SEMS

24

15

Ejemplo:
El administrador de una negocio tom una muestra de 25 cuentas vencidas, a partir de las cuales calcul una media de $ 380 y una desviacin estndar de $ 75. Suponiendo que las cantidades de todas las cuentas por cobrar presentan una distribucin normal, construya e interprete el intervalo de confianza para la al 0,99 de confianza.

01/09/2008

Mg. SEMS

16

EN SPSS: Uso de la funcin IDF.NORMAL(p, 0, 1)


IDF.NORMAL(p, media, desv_tp). Numrico. Devuelve el valor de la distribucin normal, con la media y desviacin tpica especificadas, para el cual la probabilidad acumulada es p.

Z1 = IDF.NORMAL(0.005,0,1)= -2.5758 Z2 = IDF.NORMAL(0.995,0,1)= 2.5758 = 99%


-2.58 0 258

Z1
01/09/2008 Mg. SEMS

Z2
17

En Excel: Uso de la funcin = DISTR.NORM.ESTAND.INV( p )


DISTR.NORM.ESTAND.INV( p ). Numrico. Devuelve el valor del recorrido de la distribucin normal, con la media y desviacin tpica especificadas, para el cual la probabilidad acumulada es p.

Z1 = DISTR.NORM.ESTAND.INV( 0.005 ) = -2.5758 Z2 = DISTR.NORM.ESTAND.INV( 0.995) = 2.5758 = 99%


-2.58 0 258

Z1
01/09/2008 Mg. SEMS

Z2
18

a)

Sx =

Datos :
45 25

X = 380 Sx = 45 n = 25
b)
= 99%
-2.58 0 258

=9

c ) LI = X z1Sx LS = X + z 2Sx
LI = 380 2.58(9) = 356.8 LS = 380 + 2.58(9) = 403.2

Z1

Z2

= 99%
356.8 403.2

Interpretacin: Se espera que sea un punto del segmento


356.8 , 403.2 con una seguridad del 99%
01/09/2008 Mg. SEMS 19

LI

LS

EN SPSS: Uso de la funcin IDF.T(p, gl)

IDF.T(prob,gl). Numrico. Devuelve el valor de la distribucin t de Student, con los grados de libertad gl especificados, para el cual la probabilidad acumulada es prob.

t1 = IDF.T(0.005,24) = -2.7969 t2 = IDF.T(0.995,24) = 2.7969 = 99%


-2.797 0 2.797

t1

t2

01/09/2008

Mg. SEMS

20

En Excel: Uso de la funcin = DISTR.T.INV( p, gl )

DISTR.T.INV( p, gl ). Numrico. Devuelve el valor del recorrido de la distribucin normal, con la media y desviacin tpica especificadas, para el cual la probabilidad acumulada es p. DISTR.T.INV devuelve dicho valor t, tal que P(|X| > t) = probabilidad cuando X es una variable aleatoria que sigue la distribucin t y P(|X| > t) = P(X < -t o X > t).

t2 = DISTR.T.INV( 0.01, 24) = 2.797 t1 = Por simetria de la funcion = -2.797


-2.797

= 99%
0 2.797

t1
01/09/2008 Mg. SEMS

t2
21

a)

Sx =

Datos :
45 25

X = 380 Sx = 45 n = 25
b)
-2.797

=9

= 99%
0 2.797

c ) LI = X t1Sx

LS = X + t 2Sx
LI = 380 2.797(9) = 354.83 LS = 380 + 2.797(9) = 405.17

t1

t2

= 99%
354.8 405.2

Interpretacin: Se espera que sea un punto del


segmento 354.8 , 405.2 con una seguridad del 99%
01/09/2008 Mg. SEMS

LI

LS

22

Ejemplo:
El administrador de un proceso de produccin tomo una muestra de 36 gaseosas de 500 cc con el propsito de verificar si el proceso de produccin de estas gaseosas estn dentro del estndar de produccin. A partir de dicha muestra calcular la media y desviacin estndar. Si el envasado de las gaseosas siguen una distribucin normal, calcular los intervalos de estimacin del parmetro poblacional, para un nivel de confianza del 90, 95 y 99 por ciento para . Los datos de la muestra estn en el siguiente cuadro.

01/09/2008

Mg. SEMS

23

Muestra A obs 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 X 517 506 502 487 488 496 499 503 496 508 501 491 516 496 487 499 524 509 obs 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 X 491 506 499 492 505 512 498 518 472 492 481 488 488 506 508 486 499 501

Datos :
Clculo de Z o de t se tiene :

z = -1.64 z = 1.64 LI = 496.02 LS = 502.15 t = 1.69 LI = 495.94 LS = 502.23

01/09/2008

Mg. SEMS

24

EN SPSS: Uso de la opcin anlisis-estadsticos descriptivos-razn


Estadsticos x n Media Error tp. de la media Desv. tp. Varianza Vlidos Perdidos 36 0 499.08 1.863 11.177 124.936

Estadsticos de la razn para x / aux Media Intervalo de confianza Lmite inferior para la media al 90% Lmite superior Desviacin tpica 499.083 495.936 502.231 11.177

= 90%
495.9 502.2

LI

LS

Los intervalos de confianza se crean con el supuesto de una distribucin normal para las razones.

Interpretacin: Se espera que sea un punto del segmento


495.9 , 502.2 con una seguridad del 90%
01/09/2008 Mg. SEMS 25

Intervalo de Confianza Binomial (Proporcin

p=

x n

Sp =

p(1 p) n

%
z1 0 z2

LI = p z1Sp

LS = p + z1Sp
LI

%
LS

01/09/2008

Mg. SEMS

26

Intervalo de Confianza Total


p=
x n

Sp =

p(1 p) n
z1

%
0 z2

A = Np

SA = NSp

LI = A z1SA LS = A + z1SA
01/09/2008 Mg. SEMS

%
LI LS

27

Intervalo de Confianza Binomial (Proporcin)


De p zS p a p + zS p para un n grande Ejemplo: X = 83 de n = 268 encuestados dicen que ellos van a comprar el producto = ? = porcentaje de la poblacin quienes podran decir que ellos van a comprar el producto p = 83/268 = 0.3097, o 31.0%, es la muestra proporcional Un estimado de Indica la incertidumbre en p Intervalo de Confianza: p tSp = 0.3097 1.960 0.0282 Estamos 95% seguros que est entre 25.4% y 36.5%
01/09/2008 Mg. SEMS 28

S p = p(1 p) / n = 0.3097 (1 0.3097) / 268 = 0.0282

P( -1.96 < p < 1.96 ) = 0.95


z1
-1.96

= 95 %
0 z2
1.96

P( 0.254 < p < 0.365 ) = 0.95


LI

= 95 %
LS

0.254
01/09/2008 Mg. SEMS

0.365
29

Ejemplo:
El marco muestral de un asentamiento humano se haya en un archivo del SPSS ( *.SAV ) que tiene una poblacin de 7,500 habitantes adultos. A partir de este marco de muestra seleccionamos una muestra completamente aleatoria de tamao 65. Cuyos datos se muestran en el cuadro adjunto. Estimar: a. La proporcin poblacional del porcentaje de analfabetos, b. El total de analfabetos en el asentamiento humano; c. En forma intervlica la proporcin poblacional y el total de analfabetos con un nivel de confianza del 96%.
01/09/2008 Mg. SEMS 30

Datos :
n 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 N A 178 181 336 337 431 499 601 657 671 878 895 1433 1441 1449 1605 2136 2302 2344 X 1 0 0 1 0 0 1 0 0 1 1 0 0 1 0 0 1 0 n 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 N A 2408 2423 2791 2799 2937 3016 3077 3104 3120 3264 3324 3643 3649 3664 3855 3927 4025 4266 X 0 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 n 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 N A 4304 4547 4552 4603 4634 5322 5389 5472 5740 5753 5771 6028 6090 6421 6433 6439 6551 6649 X 0 1 1 0 0 0 0 0 0 0 0 0 0 1 0 1 1 0 n 55 56 57 58 59 60 61 62 63 64 65 N A 6651 6673 6745 6813 6987 7170 7171 7182 7216 7251 7275 X 0 0 1 0 1 0 0 0 0 1 0

X : Analfabeto ? 0 No 1 Si

n: Tamao de la muestra NA: Numero aleatorio X : Variable


31

01/09/2008

Mg. SEMS

Estimacin puntual

a.b.-

p = 0.26 A = 7500*0.26 = 1950

Interpretacin:
Se espera que la proporcin de analfabetos en el rea urbana es del 26% y el total de analfabetos 1950 ciudadanos.

01/09/2008

Mg. SEMS

32

Intervalo de Proporcin: P
c1.- Intervalo de p:
t1 = IDF.T(0. 02,64) = -2.0965 t2 = IDF.T(0.98, 64) = 2.0965

t2 = DISTR.T.INV( 0.04, 64) = 2.0965

t1 = Por simetra de la funcin = -2.0965

LI = 0.26 2.0965(0.05493) = 0.14


LS = 0.26 + 2.0965 (0.05493 ) = 0.37
0.14

= 96%
0.26 0.37

LI

LS

Interpretacin: Se espera que P sea un punto del segmento


0.14 , 0.37 con una seguridad del 96%
01/09/2008 Mg. SEMS 33

Intervalo del Total A


c2.Intervalo de A A = 1950 SA = 412.01

LI = 1950 2 .0965 ( 412 .01) = 1086 .2


LS = 1950 + 2.0965 ( 412 .01) = 2813 .8
1086.2

= 96%
1950 2813.8

LI

LS

Interpretacin: Se espera que A sea un punto del segmento


1086.2 , 2813.8 con una seguridad del 96%
01/09/2008 Mg. SEMS 34

Intervalo de Confianza Un-Lado


Escoja 1: Estamos 95% seguros que la media de la poblacin es al menos tan grande como X tone sided S X O: Estamos 95% seguros que la media de la poblacin no es mas grande que X +t S
one sided X

Donde t proviene de la tabla t de un-lado

95% un-lado

95% un-lado 90% dos-lados 95% dos-lados Error Standard Promedio muestra

01/09/2008

Mg. SEMS

35

Ejemplo: Produccin Mdica


Produccin de una nueva droga para el ataque al corazn n = 10 corridas de produccin X = 68.3 gramos producidos SX = S / n = 14.6 / 10 = 4.617 S = 14.6 gramos Presupuesto anual necesita saber acerca de = tasa media del proceso de produccin 99% un-lado clculo del intervalo de confianza t = 2.821 para 1-lado 99% confianza con n = 10 X t unlado S X = 68.3 2.821 4.617 = 55.28 Estamos 99% seguros que la tasa media de produccin es al menos 55.28
01/09/2008 Mg. SEMS 36

n = 10
X = 68.7

= 95 %
0 t
2.821

SX = S / n = 14.6 / 10 = 4.617
L = X tun lado S X
L = 68.3 2.821 4.617 = 55.28
LI

= 95 %
LS

P( < 55.28) = 0.95


01/09/2008 Mg. SEMS

55.28
37

LA DISTRIBUCION t Student
Para muestras de tamao menor a 30 llamadas pequeas muestras, la aproximacin normal no es tan buena y va siendo peor a medida que n disminuye, por lo que hay necesitad de hacer uso de otra distribucin, esta es la distribucin t de Student cuya aplicacin son validas para muestras grandes y pequeas.

x x = t= s / n 1 s / n
S
2

anlogo a
Donde :

z=

x / n

(x x ) =
n
01/09/2008

^ 2

(x x ) =
n 1

n : Tamao de la muestra n-1 Nmeros de grados de libertad.


38

Mg. SEMS

EJEMPLOS
1.-A nueve pacientes que sufren la misma incapacidad fsica, y por lo tanto son comparables, se les pidi que llevaran a cabo cierta tarea como parte de un experimento. El tiempo promedio necesario para realizar la tarea fue de siete minutos con una desviacin estndar de dos minutos. Suponiendo que la distribucin de los datos es normal, construir intervalos de confianza del 90, 95 y 99 por ciento para el tiempo medio real necesario para que este tipo de pacientes efectu la tarea. 2.-El administrador de un hospital tomo una muestra de 25 cuentas vencidas con el propsito de estimar el monto medio de la deuda. A partir de dicha muestra, calculo con una media de $250 y una desviacin estndar de $75. Si todas las cuentas vencidas siguen una distribucin normal, calcular los intervalos de confianza del 90, 95 y 99 por ciento para .
01/09/2008 Mg. SEMS 39

01/09/2008

Mg. SEMS

40

TAMAO DE MUESTRA Para determinar el tamao de la muestra depende de los parmetros que se
desea estimar, es decir podemos estar interesados en conocer una media aritmtica, una proporcin, diferencia de medias o una diferencia de proporciones, de una o dos poblaciones. Para cada uno de los casos mencionados anteriormente existe una determinada frmula.

a) Estimacin de la media
z =
_

x / n

( x ) = d = z1 / 2

z=
_

x / n

N n N 1

n=

2 1 / 2 2

( x ) = d = z1 / 2

NOTA: estimar ES con la relacin siguiente

N n N 1

=
01/09/2008

Vmax Vmin 6

Nz 12 / 2 2 n= 2 d ( N 1) + z12 / 2 2
Mg. SEMS 41

b) Estimacin de una proporcin


pe p p (1 p ) n

z =

( pe p) = d = z1 / 2 z12 / 2 p (1 p ) n= d2

p(1 p) n

Nz12 / 2 pq n= 2 d ( N 1) + z12 / 2 pq

NOTA : En caso que no existiera estudio similares y no pudiera hacerse un estudio piloto, se recomienda considerar la xima varianza cuando p= 0.5 con un error de 0.05 ( d = 0.05) Si la fraccin de muestreo n/N es menor 1% se puede hacer uso de la 01/09/2008 formila 1 Mg. SEMS 42

Ejemplo :
Un nutrilogo del departamento de salud, al efectuar una encuesta entre una poblacin de muchachas adolescentes con el fin de determinar su ingestin diaria promedio de protenas, busc el consejo de un bioestadstica con respecto al tamao de la muestra que debe tomar. Antes de que el estadstico pueda ayudar al nutrilogo, ste debe proporcionar tres elementos de informacin: la dimensin deseada del intervalo de confianza, el nivel de confianza deseado y la magnitud de la varianza de la poblacin,2 d = 5 z =1.96 S =20 . 2

n=

1.96 (20) (5)


2

= 61.47
n = 62 adolescentes

01/09/2008

Mg. SEMS

43

Ejemplo :
Se planea realizar una encuesta para determinar qu proporcin de familias en cierta rea carece de servicios mdicos. Se cree que la proporcin no puede ser mayor que 0.35 Se desea un intervalo de confianza del 95 % con d = 0.05 de qu tamao se debe seleccionar la muestra de familias?

n=

1.96 (0.35)(0.65) (0.05)


2

= 349.6

n = 350 familias
01/09/2008 Mg. SEMS 44

También podría gustarte