P. 1
Muestreo Probabilístico

Muestreo Probabilístico

|Views: 38|Likes:
Publicado porjroldán_245278
Estas diapositivas fueron hechas y actualmente editadas por el Ing. Daniel Mavila Hinojoza, que desempeña como docente de la Facultad de Ingeniería Industrial de la Universidad Nacional Mayor de San Marcos, Decana de América.

Subido por su alumno: Juan Patricio Roldán
Estas diapositivas fueron hechas y actualmente editadas por el Ing. Daniel Mavila Hinojoza, que desempeña como docente de la Facultad de Ingeniería Industrial de la Universidad Nacional Mayor de San Marcos, Decana de América.

Subido por su alumno: Juan Patricio Roldán

More info:

Published by: jroldán_245278 on Jul 14, 2012
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

01/02/2013

pdf

text

original

INFERENCIA ESTAOisTICA

Proceso y resultado de extraer conclusiones .respecto a una poblaCi6n a partir de una 0 mas muestras.

INFERENCIA ESTADisTICA
Estadistica Descriptiva e Inferencial, Cordova. (2003). 5ta ed. Capitulo: 9 Manuel

_....

obtenci6n de la muestra

--+ conclusiones


danielmavila@yahoo.es
2

LEYES DEL MUESTREO
1. Ley de los grandes numeros: Si el numero de pruebas es suficientemente grande aumenta la probabilidad de que Ia muestra represente ala poblacion a la que pertenece. 2. Ley de la.r.e~lap<4d"estadistica: un conjunto de "n" unidades tomadas al azarde'unc'onjunto "N", es casi seguro 'que tenga las caracteristicas del grupo mas grande. 3. Ley de la mercia de los grandes numercs: Bn muchos fenomenos, cuando una parte varia en una direccion, es probable que una parte igual del mismo grupo, varieen .direccion opuesta, 4. Ley de la permanencia de l'OS mimeros: Si una muestra suficientemente .grande es representativa de la poblacion, una segunda muestra de .igualrnagnitud debera sersemejante a la pnmera,
3

Problemas de interes de la iaferencia estadistica a) Problema de estimaci6n: i,Porqu:e.una encuesta de 1 500 personas permite .predecir bastante bien el resultado de una eleccion can 1-0 millones de votantes? ),Como se coasigue? i,C6mo se mide la precision del resultado?

de test de hip6tesis (contraste de hiootesis). test .de significac.i6n (contraste de significaci6n):
b)Pr:oulema Las normas de calidad exigen que, en un lote de 5 000 bombiHas, a lo sUII1oe13% pueden durar menos de 1 000 horas,
En unestudio decontrol de calidad de una fabrica de bombillas seria muy costoso examiner cada una. Se decide usar una muestra de 50,0

bombillas. Si obtenemos el 3,2% de bombillas defectuosas l,deberiamos
dec1arar el lote complete defectuoso?
4

Problema de estimacion
Se busca precisar una caracteristica totalmente desconocida de la poblacion a partir de los datos obtenidos sabre una muestra, Estimar el porcentaje de la poblacion (10 millones) que votara a favor del candidato Falopio a partir de una muestra de 1 sao votantes.

Problema de test de hipotesis
Se busca comprobar alguna informacion sabre la poblacion a partir de los datos obtenidos de una muestra. El candidato Falopio obtendra mas del 65% de los votos. Menos del 3 % de las bombillas del lote de 5 000 duran menos de 1 000 horas. Las bombillas duran mas de 1 000 horas en promedio,

o estimar

la duracion promedio de las bombillas del lote de 5000 a partir de una muestra de 500.
5

6

Ejemplo de Prueba de hipotesis

! Ejernplo

de Prueba de hipotesis

Lospaquet~s de harina marca Maca de la Pirinaca de medio kilogramo afinnan contener en su etiqueta un contenido neto de 500 gr. Supongamos que deseamos evaluar dicha afirmacion a partir de nuestra creencia de que los paquetes contienen menor cantidad de harina, Para ello, se eligen al azar 50 paquetes y se los pesa con una balanza de precision, obteniendo los siguientes datos muestrales: 492 gr. S = 34,4 gr.

Aunque desconocemos como se distribuye el peso de los paquetes, por tratarse de una mnestra grande en> 30) usaremos la distribucion normal esrandar a fin de hallar nuestro valor critico. Para un nivel de significacion de 0,05 la tabla correspondiente arroja un valor de z" = -1,645.

x=

Planteamos entonces la hipotesis aula y alternativa: Ho: {m 2: 500 gr} H[ : {m < 500 gr}. Para Larealizacion del test, usaremos un nivel de significaci-on del Q; = 0,05.
7

a la inferencia estadistica parametrica le corresponde hacer inferencias acerca de los parametres poblacionales.644 Dado que -1..6444 el valor calculado del estadistico de prueba no alcanza a caer en zona de rechazo.500) 1(34.07) = -1.Tn Reemplazando en el mismo por los datos del ejercicio se obtiene . 9 a Segun la distribucion de probabilidad de la poblacion de origen. al nivel de significacion del 5% no se puede rechazar la hipotesis nula. b) No Parametrica (la poblacion de origen . E8 decir.645 < -1. la inferencia estadistica se c1asifica en: a) Parametrica (la poblacion de origen tiene una distribucion de probabilidad normal).Igualdad de varianzas .4/7.Ejemplo de Prueba de hipotesis INFERENCIA ESTADISTICA x-m El estadistico que utilizaremos -es: . no existen argumentos para afirmar que los paquetes de harina Maca de la Pirinaca contienen (en promedio) menos que 10 anunciado en sus etiquetas.Prueba para la varianza de una poblacion normal .de ·la naturaleza de las' poblaciones de las cuales se derivan las observaciones. Par 10 tanto. Considerando que las poblaciones vestan caracterizadas porparametros.Prueba para la igualdad de dos distribucioncs normales independientes . tiene una distribucion de probabilidad distinta a la normal) 10 Inferencia Estadistica Parametrica Hacesuposiciones acerca.que: z ~ (492 . 11 Test parametricos mas usados .Prueba para la media de una poblacion can distribucion de probabilidad normal con varianza desconocida .

Inferencia Estadistica No Parametrica Coneste tipo de inferencia el conjunto de suposiciones de partida se reduce. j " de bondad del Smirnof de una i· 13 Sea () una caracteristica. -Consistencia . .~ . El valorconcreto de e es la estlmacion. .. :"_" .Prueba de aleatoriedad • Test de rachas . 0 insesgado) que utllizamospara estimar el valor de e. Las pruebas estadisticas no parametricas estan basadas en un modelo que especifica solo condiciones muy generales y ninguna aeerea de Ia 'forma especifica de la distribuei6n de la cual fue obtenida la muestra.Prueba de bondad del ajuste: • TestChi-Cuadrado ajuste (Pearson) • Test de Kolmogorov muestra . 0 incluso desaparecen. un pararnetro poblacional cuyo valor se desea conocer a partir de .. Sea un estadlstlco (funci6n de la muestra) . o.X2. Eficiencia .Pruebas de independencia • Test Ji-Cuadrado para independencia 14 ~"'" . Suficiencia 5. (Coherencia) ~ Observa que el estadistico: 3.· Xn) 4. Error 15 cuadrattco media 16 . . Ausencia de sesgo (Centrado 2. (Precision) B = T(X1. . ~:\. Robustez es una funci6n que depende de ia muestra y I~ lIamaremosestimador.' Test no parametricos mas usados (1) '. Estimaci6n Propiedades deseables en los estimadores B 1. • '. una muestra.-.

la varianza. Solo el dato 0 los datos del centro son los que van a representar la muestra..para todo valor posible de En otras palabras. se tiene casi la certeza . r Es decir se pretende que al extraer Larnuestra elestadfstico calculado contenga toda la informacion de esa muestra... unestimador insesgado es aquel para el cual Ia media de la distribucion muestral es el parametro estimado.Un estimadores suficiente si utiliza una cantidad de la informacion coatenida de Lamuestra y ql. e.• Insesgad. viacion estandar. e B Eficiente 0 con varianza minima. EI resultante recibe el nombre ·de estimador insesgado con varianza mnuma (MVUE." seleocione al que tenga varianza minima.. 0 Ia rnenor ~ desviacion estandar de la distribucion de muestreo. Si comparamos dos estadisticas de una muestra del mismo tamado y tratamos de decidir cual de ellas es un estimador mas -eiiciente..le ningun otro estimador podria extraer informacion adicional de la muestra sobre -el parametro de la poblacionque ae esta estimando. si al aumentar el tamafio de la muestra.Entre todos los estimadores que son insesgados. etc. Con esto se deduce que si utilizamos a todos los datos de la muestra como es enel caso de la media. 19 20 . _< •• .Una estadistica Les un estimador coherente de un parametro vde poblacion.es coherente se vuelve mas confiable si tenemos tamafios de muestras mas grandes.o. Suficiencta..Se dice que un estimador puntual es un estimador iasesgado dee si E(9) = . cuando se calcula la media de la muestra. La eficiencia . Par ejemplo. " •• . minimum variance unbiased estimator).:~~ • . d . Si un estimador ..de que el valor de la estadistica se aproximabastante al valor del parametro de la poblacion._~-~ ~ -. 18 17 • Coherencia. -setendrli un estimador suficiente. Si se usa lamedia muestral para estimar lame-dia poblacional. Cuando se calcula Ia mediana de una muestra solo se utiiizaa un datoo a des.escogeriamos la estadistiea que tuvierael menor error estandar. se necesitan todos los datos.se refiere al tamafio del error estandar de laestadistica.. _. se sabe que la mediaes un estimador insesgado.

~C6moestimar el parametro 6? . cuando obtenemos una media aritmetlca a partir de una muestra. a) puntual b) por intervalo de conflanza. ..:_.. e>0 ~ . varianza poblacional. limites de confianza.) que se emplea para estirnar parametres (media poblacional. Ie.:~<. estima . etc. Un estimador puntual es simplemente un estadistlco (media aritmetica.. tal valor puede ser empleado como un estimador para el valor de la media poblacional.. • 21 22 Metodos de estimacion puntual Supongamos la siguiente distribucion: () I(x) = (1+ X)l+B x~ 0. . Hay dos tipos basicos de estimaci6n: . . etcetera). un valor concreto para la estimaci6n. do de intervalo.Estimaci6n puntual (Estima de punto del parametro) Provee un solo valor. Porejemplo. varianza. Se tienen los siguientes metodos: a) de los momentos b) de maxima verosimilitud c) de minimos cuadrados 23 DISTRIBUCIONES MUESTRALES 24 . Algunos autores comparan losestimadores con los lanzamientos en una diana: el circulo central serta el valor real del para metro .

-r can reemplazo de ~~'I<.6 12.. .1-0' 12 6. no aleatorios.· .. 12 y 14 cm.fiiI\~_.·~'.. a. dependientes... equiparadas. I -dt ~"'~~:"". datos apareados. 8.10 14. A partir de esta vvarledad" de val 0 res distintos obtenldos parala media rnuestral.14 10.8 10 6.. .. Si tomamos una muestra de tamafio n y calculamos la media de esta rnuestra ootenemos . en general.·d. resultados distintos).experimento un gran nurnero de veoes obtendremos una gran cantidad de valores distintos para x. 27 6 6 Primer elemento de la muestra 8 6. estandar Se tienen muestras pareadas (m.8 10... Pueden ser observaciones tomadas al mismo tiempo. correlacionadas) cuando sabemos de antemano que una observaciorresta relacionada con la otra.. _~ .14. • 26 Como los estadisticos son v.14 8. entonces hablar de sus distribuciones..8 14... observadas se denomina estadistico: Los dos estadisticos mas conocidos son la media -muestral varianza muestral S ~ La raiz cuadrada de la varianza muestral es la desviacion tnuestral S.1 -.6 14.. En el esquema independiente se compara las respuestas de un grupo con Ias respuestas del otro grupo .6 8 12 10 10i6 12.10 12. ...14 6. X y la Los parametres poblacionales valoresfijos.' 10. podemos obtenerIa distrlbucion de probahilidadde la rnlsma: la dtstrlbuclcn de lamedia muestral. EI tamaiio de los grupos puede ser igual 0 diferente y el tamafio de la muestra total es Lasuma de los dos grupos (numero total de individuos).. m..12 14 6.14 n 1 . a... Calculamos comparan las diferencias medidas de resumen de uno y otro grupo y se 25 Mientras que los estadisticos son variables aleatorlas (su valor depende de la muestra seleccionada: loaestadfsticos calculados para distintas muestras daran. El numero de observaciones es el numero de pares... (Otro caso talla minima de oeces comercia/ss). son . un va or x eenJilt~ig~. a medidas tomadas en un mismo sujeto 0 unidad en dos oportunidades 0 tiempo distintos (disefio pareado 2). disefio pareado 1.10 10.12 10. Las posibfes mueetres ·aleatorias temeito 2 seren en total: 52 = 25.c·....8 12.J I" Segundo~elemento de la muestra Si repetimos este rnismo .10 8. podemos Ejemplo: Sea una poblaci6n compuesta par 5 unicomics con las siguientes longitudes de cuemo: 6.v~.'j~· : .....6 5.Estadisticos Cualquier funci6n de las v.12 12.· .8 8. .12 8...7~~'''1F~ .14 1--· -- 14 14.

a. Una muestra consta de n 2 observaciones de esa v. y ya conocemos su distribucion. cada una de elias tiene la misma distribuci6n de probabilidad que la v.. De heche. X.5 1J25 E(x) 5/25 412.t 6 Segundo elemento dela muestra 8 7 10 8 9 12 9 14 10 11 8 10 12 14 7 8 9 8 10 11 I 1 9 10 11 12 13 . Es decir la v. podemos calcular suesperanza (la media de medias rnuestrales): . X tiene una densidad de probabilidad dlsoreta uniforme. eX1' X.En el ejernplo la v. 12 Y 14. X de la pablaci6n puede tamar los valores 6. a. a. clonal: 1125 E(x)=J. a..J. 25 es ahorael indice de las posibles rnuestras. Calculemas para el ejemplo anterior todas \as medias muestrales pasibles de tamano n = 2: _ Xi =2 1( Xl + X2 6 6 ) donde i = 1. cada uno can probabiHdad1/S. . Podemos interpretarla como una v. = Medias ·muestrales Primer elemento dela muestra 29 x. . 10 11 12 13 10 12 14 30 La dlstribuci6n de medias rnuestrales es: Como x es una v.8 3125 2125 o = _!_ 25 ~>= i=l I 250 = 10 25 Observa que colncide con la media po bl a. a. p r·· 4/25 3125 212.. 10. X.. 8. bidimensional .i= x 31 6+8+1~+12+14 =10 32 6 7 8 9 10 iI 12 13· 14 . a.. donde X1 Y X2 son independientes y estan identicamente distribuidas (iid).

. (i=I..muestrales Primer elemento dela rnuestra ~=1 33 s· l 2..J j:o:l X. 2 S'l todas 2 ( las .Dada una muestra de tamafio n.n) sera uno de los posibles valores que puede tomar la v. ~. a.andose eumple la igua1dad~ se diee que el esti. . el valorx. GCwiles su valoresperado? Calculemos posibles: . de la muestra Xj:2 6 0 8 1 10 4 1 12 9 14 16 9 6 8 10 1 4 a 1 4 1 0 1 4 4 1 0 34 12 14 • 9 4 9 0 1 16 Graficamos la distribuci6n muestrales: p de varianzas Como 82 es una v. . 0'2 = ~ L(Xi -10)2 = 40/5 = 8 1 5 5 i=l ·0 1 2 :3 4 5 6 7 8 9 10 11. "0' 25 es el indice d 1 posimes muestras. mador x de pes insesgado. ibl as Warianzas . .le donde i = 1..)2 vananzas muestrales 2: x ' =2 1 .12 13 14 15 16 35 I I 2125 Observa que ahora: E(S2) * o? S2 I Deeimes ntoaces que el estimador es ses--do. y ya conocemos su distribucion. esperanza (la media de las varianzas muestrales): E(8 ) La varianza poblacional es: -8125 5125 6/25 4/25 2 1 25 = -Ls~. a. Begundoelemento E(x) = jL Cu. podemos calcular I~U. de 02 38 .~ .lOO/25 = 4 25 i=l '.

21n .y. I Var(x)=- _ (72 n 39 Observa que la distribuci6n de Ia media muestral tiene una dispersi6n menor alrededor de la media poblacional y cuanto mas grande es el tamano de la muestra. .'J xn se toma a partir de u. probabilidad normal Distribucion muestral de la media Sea X una v. La varianza de la distribucion de Iamedia muestral sera: Si la muestra aleatoria x1' x2' '.edia muestral tendra distribuci6nJ normal'c~h' -'m-edia . que se distribuyeen una poblacion como una distribucion de probabilidad normal con media. es decir Nfl-!.na poblaci6n normal con media ~ vananza q:t/1dil ~m. 0): Tomemos una muestra aleatoria de tamafio It de esta poblaci6n normal.11 y varianza r:.r Definamos el estimador cuasivarianza muestral: Solo se distingue de la varianza muestral en dividir entre (n-I) -envez de n.1 1 6 0 2 8 2 0 10 8 2 0 2 12 18 8 2 0 2 14 32 18 De modo que la cuasivarianza muestral es un estimador insesgado para la varianza poblacional: 8 10 8 2 8 8 2 0 37 38 12 14 18 32 18 8 Muestreo desde una poblaci6n con distribuci6n de .••. N(-u 1 /"" ... 2) = -::.LS~ =200/25 = 8 25 i. 40 . 0 seudovarianza s: = n -1L(X n j=l 1 Tendremos ahora que: j - Xi)2 E(s.$111ianza (52.J) . y cr/\Jn).. . ..) ~uasivarianzas muestrales Primer elemento dela muestra I' I' s: 6 Segundo elemento de 'fa muestra .u. menor ·es la varianza. a.

La forma de la distribuci6n muestral de la media TAMBIEN tlende a ser normal. los 'objetos' que resumen la informacion de una muestra. 41 42 Veamos aparecer la distribuci6n normal a partir de una poblaclon de distribuci6n de probabilidad unitorme so.. .b1e'Original que era 170. si bien sabemas que lamedia es fJ..~ . la media muestral. • Observa que las nuevas cantidades estan mas -0 menos cerca de la media dela varia. . • Para cada grupo de 10 obtsnemos una nueva medici6n. .:::::> .. a. posib lemente tengan distribuci6n normal.. EI histograma no se pareee •A continuacion elegimos aleatoriarnente tresqrupos/muestras de tamafio 10 observaciones de la pob1aci6n unltorrne . Como-es de esperar la media es cercanaa 170. la media de la distribucion muestral de medias sera u y la"varianza de la distribucion muestral de medias sera (j2 / n Distribuci6n muestral de la media (cant.:::::·1:~j:':::::.73 J} 1~9··. ~ 40 -en nada a unadistribucion y desviacion tlpica.n 1. Para el caso en que la distribuci6n subyacente sea arb.Astribuci6n muestral de la media (cant.. Como ilustracion veamos . ) . Ver siguiente diapositiva. tengan las distribuci6n que tengan nuestros datos. o' . una variable que presenta valores distribuidos mas 0 rnenos unitormernente .) Aunque una v.. a.~ ~ r. • Repitamos 91 proceso un nurnero elevado de veces y pmtarnos la distribuci6n de la nueva v. y la varianza es (Y2 . Es decir.traria.----------. no posea distribucion normal. sobre el intervalo 150 -190. normal conla misma media .de la diapositiva anteriory calculamos el prornedio. En concreto.. {a distribuci6n muestral se acercara mas y mas ala distribuci6n normal (media f1 y varianza a2ln) a medida que se aumente el tamano de cada muestra. ciertosestadisticos estimadores calculados sobre muestras -elegidas al azar poseen una distribuci6n normal.

• La media de esta nueva variable (promedio rnuestral) es muy parecida a la de la variable original (170.encuentre dentro del intervalo. dar una medida de bonsac de la estimaclon. si decimos que el intervale de confianza va de menos infinitoa mas infinito. Ademas la desvia. nivel) de confianza Nivel de significaci6n (NS) 48 . • Las observaciones de "la nueva vartaole vestan menos dispersas. valorde8{) _ e < < () + e e lntervalo daconflanza: Es 91 Intervale de las estimaciones (probablss) sabre el pararnetro. 47 P( I). Lfmltes de los intervalos de confianza: Sen les dos v lor xtremos del intervalo de conflanza. el sesgo puede depender del tamafio de la muestra. Coeficiente . Siel sesgo tiende a cero cuando el tamafio de la muestra cre~e hasta infinito decimos que el estimador es aslntoticamente insesgado. la probabllldad de que 61 valor reals sa .<II cion tipica es aproximada·"~ mente 'ralz de~'10' veces mas peque-ria. EI caso extrema contrarlo es la estimaci6n puntual.~~.- . ~cuangrande debe de ser el intervalo de confianza? Evidentemente. limites de confianza.• La distribuci6n de las medias muestrales tiene una dlstrlbucion aproximadarnente normal. estima de interval 0 del parametro. 10 que .:: 3. limites fiduciales En este caso. 46 45 Estimacion . La idea es crear unos lntervalos de· oonfianza de manera que separnos en que porcentajsd€ cases e! valor del pararnetro poblaclonalestara dentro del lntervalo crltico. Propiedades en muestras grandes ao 70 so 50 40 30 20 Muchos estimadores no tienen buenas propiedades para muestras pequefias. pero cuando el tamafio muestral aumenta. tolerancia.Peroeso no es muy util. donde la amplltud del intervale es nula.e < a < I) + e) 'Y ~ (grado.5).. muchas de las propiedades deseables pueden cumplirse. segura que acertamos . Amplitud del Int rv I 0 margen de error.haremos _as efrecer un intervale de valores en el que se tiene cierta probabilidad (confianza) de que seencuentre el verdadero Ahara bien. llama mas error: estandar a la desviacion tfpica de esta nueva variable. vamos aexpresarlo utilizandoel simboloe' "n lip...50 g 10 0 Por ejemplo. En esta situacion se habla de propiedades asint6ticasde los estimadores.. en lugar de indlcar simplemente un unico valor como estimacl6n del parametro poblacional S. Como el estimador va a depender del tamafio de la muestra. Es deolr. nor intervalos de confianza..

.. EI 95% significa que de cada 100 intervalos que calcule.5% 49 (1) Conocemos la desviacion tipica poblacional a (2) No conocemos la desviaekin tipica poblacional 0' (3) Distribucidn de la poblaci6n distinta a Ia normal y n > jo Calculo de intervalos de confianza .Jn X-f. .Y cierta desviacion tipica cr. (b) La varianza de la distribucion muestral de medias es (j2/n. 51 52 l .. :.J1' 0': 1 n . la desviacion tipica de la distribucion muestral de medias es a /~n. _. Tipificamos la variable: Z Sin distribuc. AI calcular un intervalo de confianzaal 95%...>. Con distribuci6n Grande(n>=30) Normal X±ZO'-x X±ZO'-x X±ZO'-x XzzsX±tsX±zs- • x x Sabemos como se distribuye ta v.i :~"'a:·. L. Utilizaremos como estimador puntual para la media poblacionalla media muestral X .. Otros casos usuales son: a) confianza b) confianza significativa: 99%. con cierta media 11... Veremos tres casos para calcular interval os de confianza: muy significativa: • 99. s610 5 como maximo no contendran al parametro !l. Por ejemplo: Suponiendo que ct = 5%. "'J . J ntervalos de confianza para la media poblacional Supongamos que la poblaci6n sigue una distribucion normal.. el intervalo contendri a Il con un 95% de confiabilidad (no probabilidad). a.:&GONO~E .. A ese usual nivel de significaci6n se Ie denomina confianza casi significativa. ·0 10 que es 10 mismo. .1. muestral y a partir de esa distribuci6n podemos determinar el intervale de confianza. ~Y como fijamos tal probabilidad? Usualmente se asume un porcentaje del 95%. el va-lor del pararnetro poblacional estara dentro de' tal intervalo.i6n Normal Se utilizan pr-ocedimientos no parametricos basados en ta mediana = a/. I Sabemos que: (a) La media de la distribucion muestral de medias es la media poblacional fJ. == NO 1) ( . ) (1} La poblacion es normal y conocemos x=. . etlo quiere decir que el 95% de tas veces que repitamos el proceso de muestreo (y calculemos elestadlstico). i . POBLAG-ION TAMAnO DE LA MUESTRA Pequefia(n<30) Grande(n>=30) Pequena(n<30) SE CONOCE cr SEOi.n •• 1 i::::1.Intervalos de confianza para la media poblacional (cont .-.~ x.

96o-x X+196cr. Error probable de la media. Valores criticos (~c) • U x = Errorestandar ZaJ2 P -ZCC/2<a/Fn<ZCC12 ( x-j1 - J =l-a 53 e= de la media.2. Es la distancia 0 separacion entre unextremo del intervalo y el centro del mismo: e= Z ax • 54 LLWTES DE CONFIANZA PARA l\fUESTRA.96 x -1.x ' '001 2.58vx X+2.58 x.05 1.645 J a Za - Lie X-128cr. Error de la estima.01 233 55 56 .05 1. Error al estimar lamedia poblacional (Tolerancia).Supongamos que deseamos tener un nivel de siqnlflcaclon a: .645ax X+2. que depende del nivel de confianza asumido. LIe l - LSC NC 99% 0.33crx 99 % 0. Es la desviaci6n estandar de la distribucion muestral de la media. . GRANDES: BILATERALES LDtllTES DE CONFIAl'lZAPARA.58crx .28 95% 0.645crx 0. x X-l.L6450'-X X+ 1. M"lJESTRAS GRAl~ES: UNILATERALES NC 90% 95% a z.33crx LSC X +lj28cr:x X+l.10 1.S . 90-% 0.645 x. N(O.10 1.l) Donde: X = Media de la variable = Z Coeficiente de confianza.6450"x X-2.

• muestra 59 10. Evidentemente.80 y S/.'annal en zapatos de las familias de Chongos Bajosestara entre S/.que el tamafio muestral aumenta.l • E (700. 5 4. ~ t---+-l---"--+---I---.779. esto es en general. se realize una encuesta a una muestra compuesta por 400 familias para calcular el gas to poblacional promedio anual en zapatos.u < 10+ 1.95: 4.95 400' p{ 700. Media muestral tamano rnuestral = 12. En unestudio de mercado efectuado en Chongos Bajos.400.96). .-I- I' Caso 2.20 J. P(1O+C-1.---. varlenza 12345'678 ••• .80 < fJ < 779.20) 58 Intervalos de corfianza r cant..certeza "del 95% A rnedlda . no solo para la media. Construire interpretar un tntervalode confianza al 0. (1.740 par familia.Ejemplo.96) ~400 400 s u < 740+ } = 0. Interpretacicn: Hay 95% de seguridad que el 'intervalo hallado se encuentre dentro del grupo de intervalos que contienen a la verdadera media poblacional (u).95 de la estimacion del gasto media anual en zapatos por familia en el indicado distrito.700. Media rnuestral tarnario muestral = 20. 57 .95 400} J400 (1.96) = 0.779.96·lz) = = P(8.87 < u < ILl) pobl olon I 0. La desviacion estandarpoblacional es de S/.Supcnqarnos que desearnos. varianza poblacional "h <. Con UJ. P{740-~..t ':' a 'Gasa 1. la amplitud del intervalo disminuye. Se encontr6 en la muestra una media de S/. = 10. el gasto medic>.20 = 0.80.1a .

48) =0.96· Ju J v12 = P(8. tendremos mas seguridad de que el pararnetro de interes se halle en los llmites del intervalo..}. Media muestral = 10. sino una distribuci6n t de Student can n . varianza poblacional 95% = 4. cant.95 as una distribuci6n normal. Supongamas ahara que deseamos que 1 .istribuci6n delestadistico x- Fn za/2 (J' < Ji < x + rn a- za/2 Z(e/ caso Pero si no conocemos la varianza poblacional realista). Media muestral muestral = 12.. El intervalo de oonfianza sera: _ x -Tn 0" _ ZaI2 a- < f..99 01 p(x .52 ~ f-l < 11. Ju '\112 <u < 10+ 1.96)· PlIO+C-2. tenemos como intervale: x-p .87 <u < 11. la distribuci6n muestral del estadlstico: = 10. para la media (cuando conocemos la varianza poblacional).tqrados de fibertad. Intervalo al 99% ~ « u <10+2.Intervalos de canfianza.57· ~J _ P (-tal2 < x-p < tall ) = I-a I s/~n 12) . Caso 2. 64 .1). Intervaloal Cuando el tamafio dela muestra es < 30 Y la poblaci6n no es distribuci6n normal. tarnario muestral = 12..= x-p slFn p( 10 +(-1. tamario 11'0 t = ----.si-ln _----=-= sera practicarnente una distri-buci6n normal N(0. EI problemaes que incrementar la Calculo de intervalos de confianza (2) Poblaci6n normal V desconocemos 0' confianza a.a = 0.t. tenemos: _ Calculo de intervalos de confianza (3) Distribucion de poblaci6n desconocida y n > 30 Si n es grande la d.13) = 0./012 <u < x + }. =P(8.99. = I-a " En definitiva.. varianza poblacional = 4. En tal case.. Caso 1..umentala amplitud del intervalo .57).L < X+TnZaI2 63 Nota: Para n > 30 la distribud6n t de Student es practlcamente una normal..

. margen de error. 0 la inversa: rechazar la hipotesis verdadera por considerarla falsa.Tamafio de la muestra (n) para una distribuci6n muestral de media Depende de: 1. - 0' ·-.a)% El nivel de confianza de que el error en la estimacion no exceda del maximo error permisible. de error que se pretende aceptar al momenta de la generalizacion (tratandose de proporciones) y 2. entonces se busca un porcentaje de confianza menor.. ~tr-ihll('11m norm!:t 1 p. Porcentaje de confianza con el eual se quiere generalizar los datos desde la muestra bacia la poblacion total. si se quiere eliminar el riesgo del error y considerarlo como 0%. pero tambien implica estudiar a la totalidad de los casos de la poblacion. Para -evitar un costo muy alto para el -estudio 0 debido a que en ocasiones Uega a ·ser practicamente imposible el estudio de todos los casos.. 95% y 99%.~t~nrbr· 7 . 0/0. El error 0 porcentaje de error equivale a elegir una probabilidad de aceptar una hipotesis que sea falsa como si fuera verdadera. precision. Usualmente se aceptan entre e14% y el 6% como error.} = I-a e=-Error e= e Zer fn x . por 10 que conviene correr un cierto riesgo de -equivocarse. 100(1 . x_+z .. Se obtiene a partir de la i1.INVO .. Esto quiere decir que un porcentaje del 100% equivale a decir que no existe ninguna duda para generalizar tales resultados. entonces la muestra es del mismo tamaiio que la poblacion. (e) La ma_gnitud del maximo error permisible.l\1INAR EL TAMANO DE LA MUESTRA I 65 La confianza 0 el porcentaje de confianzaes el porcentaje de .ESTAND../n . I-l:::. tomandq&en cuenta de que no son complementarios la confianza y el error Formula del tamano de la muestra ~' P{x-Z - 0" e -a n f:::. igual que en el caso de fa confianza. seguridad que existe para generalizar los resultados obtenidos.NORM.Za·X x + Zerx err6nea por meaosde e 0 Z (jx Z pued hallar mediante la funcion del Excel 68 67 Existe una probabilidad de (1 -a) de que una media muestral sea DISTR. AI..MARGEN DE ERROR (e) PARA DETER:. Corminmense en las investigaciones se utiliza 90%.

EjempJo A fin 'de conocer el gasto mensual en lJebidas espirituosas por familia. Si no se tiene el valor de p.30 e = 5/.CP =xJn en donde xes el numero de exitos u observaciones de interes y n el tamafio de la muestra)en lugar del estadistico media. El gerente busca un tamafio de muestra que le permita estimar el nivel de gasto con un error de estimaci6n de ± 8/.10. Esta distribucion se genera de igual manera que 1a distribucion muestral de medias.5 72 71 .10 n n- (1 .95 (Z = 1. Se conoce por estudios anteriores la poblacion en estudio tiene un desvio estandar poblacional de 8/. = O~95 Z = 1.96 cr = 5/. articulos defectuosos 0 la proporci6n (P) de a1umnos desaprobados a partir de la muestra.) Existen ocasiones en las cuales no estamos interesados en 1a media de 1a muestra. La distribucion muestral de proporciones es la adecuada para dar respuesta aestas situaciones. entonces se puede usar el valor maximo p= q= 0.96 )2 ( 30 )2 (10 )2 n = 35 70 • 69 Distribucion muestral de Proporciones Distribuci6n muestral de Proporciones (cont. sino que queremos investigar Ia proporci6n (11) de . de la muestra que le proporcione un nivel de confianza de' 0. el gerente de la vitivinfcola Santiago Querida SA desea determinarel tamafio. Soluci6n Datos: 1 . a excepcion de que al extraer las muestras de la poblacion se calcula el estadistico proporcion .30.96). ~ .a.

74 Propuesta de soluci6n: n=500 p = 15/500 = 0..03} <P< 0.03~~0. Todos los reproductores de discos compactos deben pasar todas las pruebas antes de venderse._ e<".U3~~OO.0237 y 0. Co Ejemplo: y • .a p p 73 - - Un fabricante de reproductores de discos compactos utiliza un conjunto de pruebas amp lias para eva1uar la funci6n electrica de su producto.0376 Respuesta: Se sabe con un nivel de confianza del 90% que la proporcion de .Intervalos de confianza para la proporcion pob lacional Pero: p-" z=-0'p C Ejemplo 1 donde 0'P = ~ p(l- n p) P{-z ~--~Z}=l-a 0':p P-Jr P{p ...90)_= 1.'03) ) }= 0.~ 7Z" ~ P + Za-} = 1.03 + 1. Si se utiliza un nivel de confianza de 0. Una muestra aleatoria de 500 reproductores tiene como resultado que 15 de estes fallan en una 0 mas pruebas..0237 < P < 0. .Za.645 .64500.03 z(0..discos defectuosos que no pasan la prueba en esa poblacion esta entre 0.' • P{0.0376 75 Sup6n que 1 600 de 2 000 trabajadores sindiealizados que se muestrearon de la constructora Nerviosos de Acero SA dijeron que planean votar por unirse a la F ederacion de Construccion Civil... Encuentra un intervale de confianza de 90% para la proporcion de los reproductores de discos compactos de la produccion que no pasan todas la~ pruebas.03-1..95 Lcwil es la estimaci6n de intervalo para la proporcion de 1apoblaci6n de trabajadores siadicalizados que planean votar por federarse? 76 . :.90 0. ~ .645( ) 0.

E1 porcentaje con que se acepto tal hip6tesis se denomina variabilidad positiva ysedenota por p.96 P {O.96(0.-00894) ~ P{O.existir antecedentes sobre la investigaci6n (no hay otras 0 no se pudo aplicar 'una prueba previa).95.00894) }= 0. Susy establece que la proporci6n de electores que 1a apoyaran debe calcularse dentro del 2% -de 1aproporcion de la poblacion de dicho sector.Soluci6n: p -= 20. Hay que considerar que p y q son complementarios.:: (0. y el porcentaje con' el vque se rechazo la hipotesis es la varlabilidad negativa. ~De cuantos electores debe ser la muestra? 80 79 . cuaado sehabla de la maxima variabilidad. desea tener un grado de confianza de 0. (j .894 p 0.95 donde: Z : Valor tabular para un nivel de confianza 100(1- =0.818} 1t~ a. en el caso de no . La excongresista Susy Diaz desea determinar su popularidad enel Cofio Norte. 00. denotada por q. entonces los valores soup = q = 0.0.00 1600 = 0. es deck.5. se duda queeste porcentaje haya variado significativamente.782:S1t~0. que su suma es igual ala unidad: p + q = 1.= 0 .80)(1.80 . Se sabe que en las elecciones congresales del afio 2011 recibio 40% de los votos en el indicado sector.80) Tamafio de la muestra para proporciones p 2000 Z =1. ademas.95 a)% Interpretacion: p : Probabilidad deexito p(l-p) : Variancia e : error (%) Hay 0.80 +1. Ademas. " 78 Ejemp/o La variabilidad (P) es la probabilidad (0 porcentaje) conelque se acepto y se rechazo la hipotesis que se quiere investigar en alguna investigaci6n anterior 0 en un ensayo previa a la investigacion actual.96(0.80-1.95 de confianza que el intervalo calculado pertenece al grupo de intervalos que contienen a la verdadera proporcion poblacion~.

' El error estandar de La estimacion sufre un ajuste..02 Ficha tecnica de una encuesta realizada por El Logo Feroz • Muestra: 1 515 personas • Margen de e.:--. poblacion moscas.Solucion Datos: 1 .. hojas -en un bosque.. aplicacion: Entre el 25 y ~O de JunIO... ._. multiplies por el' factor correcci6n para poblaciones finitas: de 2) Poblacion infinita cuando en el momento del estudio no podemos determinar sus elementos que aun no existen. de la poblaci6n.--'-~___... Nose puede tomar cantidad limite con precasion.02)2 • Nivel de cobertura: 118 distritos de 36 provincias pertenecientes a 9 departamentos. ejemplos: estrellas. se.05 (5%) se omite el ajuste.. .' .40)(0. ' " . • Representatividad: 94% • -Fecha de. cuando se trata de una poblaci6n finite.40 e = 0.96 f5= 0... ij4 .2.95 Z = 1. rror +/.79% • Nivel de confianza: 95% n = .a = 0.. _ _--" N-""":... • Supervisiore 30%-de entrevistas • Financiamiento: PUCP Ajuste para poblaciones fmitas n = 2305 81 82 Clases estadisticas de poblacion 1) Poblacion finita cuando en el momeato estudio podemos determinar exactamente elementos..~~~" ">'" .__~ II I (1. Si la proporcion nINes menor a 0. Si se quiere calcularel error estandar de la media. ya la las de a N-n 83 N es el tamafio de Ia poblacion.60) (0.96)2 (0.~' ~ del los "t-:''::'.

INTERPRETACION. Hay 0.05 se omite el ajuste..95 pam la proporcion de trabajadores conexperieacia en otra empress. S6 Como la muestra es mayor a 5% de N procede el ajuste.66 ~.34} = 0.Ajuste para poblaciones finitas . con una desviaci6n estandar de Sf.u ~ 471. Una muestra de 50 trabajadores revelo que 18 cuentan con una experiencia previa en otra empresa similar." P { 428. Una encuesta a 40 familias revel6 que la contribuci6n media anual a obras cornunitarias es de Sf. 87 N-n N-l . Solucion. procede el ajuste .450.95 Como la muestra es mayor a 5%.95 para detenninar la contribucion media anual. Establece un intervalo de confianza al 0.95 de confianza que el intervale elaborado pertenezca al gT'JPO de intervalos que contieaea a la verdadera media poblacional. Ejemplo 2 Hay 300 rrabajadores en la empresa periodistica La Hora de la Beldad. Establece un intervale de confianza de 0. (Yp = p(l-p) n N-n N-l 85 • Si la proporcion n!N es menor a 0. Ejemplo 1 Si se desea calcular el error estandar de la proportion se multiplica par el factor de correccion para poblaciones finitas: Hay 250 familias en el caserio de Chaparra.. 75.

para. respectivamente. El rendimiento promed!o de gasolina paraelmotor A es de 36 km por galon y el promedio para el motor B es 42 km por galen. Se mideel rendirniento en km por galen de gasolina. unestimador puntual de la diferencia entre III Y 112 esta dado por el estadistico Xl .06788 Estimaci6n de la diferencia entre dos medias poblacionales Si se tienen dos poblaciones con medias III YIl2 Y varianzas 0/ Y (3/..95 de confianza que el intervalo construido pertenezca al grupo de intervalos que contienen a ala verdadera proporcion poblacional.. 91 Se lleva a cabo un experimento en que se comparan dos tipos de motores. Por 10 tanto. 90 P{P-Z""p( J:-_n. Sup6n qu las desviaciones estandar poblacionale s n 6 y 8 p' los motores A y B respectivamente. ~ I p=-=O. Ejemplo Distribuclen muestral de diferencia de medias n . 0.)""" p'+Z""p( J:-_n. Se realizan50 experimentos con el motor tipo A Y 75 con ~l otor tipo B.. "< 0"- p =0.36-(1. de tamaiio nl Y n2' Y se calcula 1a diferencia x: ~ X2 . una de cada poblacion. La gasolina que se utiliza y m las de mas condiciones se mantienen constantes.48165} == 0.95 I INTERPRETACION: Hay 0. de las medias muestrales.96)(0.x:2 . ..36 18 50 1(036)(1-0. :2 Despejando En el caseen que se desconozcan las varianzas de la poblacion y los tarnafiosde muestra sean mayores a 3D se podra utilizar la varianza de la muestra como una estimacion puntual.36) O"p =~ 50.06788)( 300-50J . Encuentra un intervale de confianza de 96% sobre la difereocia promedio real para los motores A Y B.06788\ 300-1 } == 0..' tr S 0. A Y B.' P{0. IT::.23835::.36(1..96)(0.. 300-1 .95 P{O.112 ' se seleccionan dos muestras aleatorias independientes. obtener una estimacion par intervalo de III .} = l-a 300-50)::.

43 y 8.. debido a que los dos valores del intervalo son positivos (~B .43 < J. Can un nivel de confianza del 96% la diferencia del rendimiento promedio esta entre 3.JlA siempre es mayor que cero) 3.~. .)7 km par galen a favor del motor B. del motor B menos la media del motor A..' • 94 Tamafio de la muestra para estimar la diferencia de medias Jloblacionales El error esta dado por: ".57 93 . Se eleva al cuadrado la ecuacion y se despeja n ya que nj es igual a n2' En esta ecuacion se pueden presentar dos casos: 95 96 . menor. El valor de z para un nivel de confianza del 96% es de 2.IlA < 8.1B . Esto quiere decir que el motor B da mas rendimiento promedio que el motor A..Propuesta de solucion: Es deseable que la diferencia de medias sea positiva por 10 que se recomienda restar la media mayor menos la media .05._". ----<'_ Tamafio de la muestra para 'estimar la diferencia de medias poblacionales Ie + a) Lostamafios de muestra son izuales. Respuesta. En este caso sera la media .

Cada grupo realizara la operacion de montaje y se registrarael tiempo de trabajo. l. Solucion Distribuci6n·muestral de ·Gifer.~2~ 2 ) '__ 97 El gerente de J 00 Lee Loo SA quiere comparar 13.i.es K veoes mayor que la otra '1n =kn 2.Es mayor la proporcion de los estudiantes que aprueban Etgonomia que 1a de los qu. el metodo 2.enciadeproporciones Muchas aplicaciones involucran poblaciones de datos cualitativos que deben compararse uti1izando prop orcioneso porcentajes. efectividad de dos metodos de entrenamiento para sus trabajadores a fin de efectuar cierta operacion de montaje. Cada grupo debe teller aproximadamente 31 personas..95.? 98 grupo d deentrenamieato'._2_· z2(a2 + k( ~lk~e~2~. y el segundo.•. ese tipo? 99 100 .. Se espera GIuelas mediciones para ambos grupos tengan una desviacion estandar aproximada de dos minutos . Se utilizacuando las poblaciones sort de diferente tamaiio y se sabe que una poblaci6n . Se divide el mimero de operarios en dos grupos iguales:el primero recibe e1 metodo de entrenamiento 1.Ejemplo b) Los tamafios de muestra son diferentes En este caso se pondra una n en funci6n de 1a otra. Ejemplos: • Educaci6n.con una probabilidad igual a 0. ~.cuantos trabajadoresse tienen que incluir en cada ...e aprueban Finanzas? • MedicinaLEs menor el porcentaje de los usuarios del medicamento A que presentan una reaccion adversa que el de los usuarios del farmaco B que tambien presentan una reaccion de . . Se desea que la estimacion de la diferencia en tiempo medio de montaje sea correcta hasta por un minuto.

.> 5.~Existe diferencia entre la proporcion de articulos defectuosos que genera la maquina A de los que genera la maquina B? 101 Cuando el muestreo procede de dos poblaciones binomiales y se trabaja con dos proporciones muestrales.p. la distribucion muestral de diferencia de proporciones es aproximadamente normal para tamafios de muestra grande (n.. n1ql > 5.I i Se considera cierto cambia en un proceso de fabricacion de partes componentes. .Ejemplos • Administraci6n. 102 II Estimaci6n de la diferencia de dos proporciones poblacionales Ejemplo I. 90% para la diferencia real en la fraccion de 104 . Si se encuentra que 75 de 1 500 articulos del procedimiento actual son defectuosos y 80 de 2 000 articulos del procedimiento nuevo tambien 10 SOR. encuentra un intervale de confianza de defectuosos entre el proceso actual y elnuevo. P2) (~ \J n1 PI * ql + pz * q2 nz ~)I .' P2 tambien tiene una distribucion muestral aproximadamente nojmal.. Se taman muestras del procedimiento existente y del nuevo para determinar si este tiene como resultado una mejeria. n2P2> 5 y n2qz > 5). as! que su diferencia PI'. Z =~ (PI . Entonces Pl Y P2 tienen distribuciones muestrales aproximadamente nonnales.~Hay diferencia entre los porcentajes de hombres y mujeresen posiciones gerenciales? • Ingenieria.

95 l.Propuesta de solucion: Sean PlY P2 las proporciones reales de defectuosos para los procesos actual y nuevo. No hay informacion previa acerca de la magnitud de las proporciones PlY P 2' Se quiere estimar la diferencia con un error maximo de 0.creer que el nuevo procedimiento producira una disminucion significativa en la proporcion de artieulos .0.05 Y pz = 80/2000 = 0.0017 < PI . I y II..04. Z para un nivel de confianza del 90% es de 1. (P 1 . muestrear dosrp:~rg~~os.0217 0.defectuosos comparado con el metodo existente. PI = 75/1500 = .. respectivamente. no hay razon para ..1 Tamaiio de muestra para diferencia de proporciones Solucion: La compafiia de productos alimenticios La Buena Muerte contrat6 a una empresa de investigacion de mercadoteGniapar. 108 .a~. can una probabilidad de 0. a fin de comparar las proporciones de consumidores que prefieren la comida coagelada de la compafiia can los productos de sU'S competidores.P 2 puede ser mayor 0 menor que cer'QJ' • j .04.cuantos consumidores habra que muestrear en cada mercado? 107 Se tendra que realizarencuestas a 1 201 consumidores de cada mere ado para tener una estimacion can una confianza del 95% y un error maximo de 0. . 105 Respuesta: Como el intervale contiene el valor de cera.P2 < 0.04.645.

. . 2 %n-l. .90 INTERPRETACION: Hay 0.90.(x n -1 1=1 2 0/ A._l_f.O-) Estimador: Se sabe EjempJo: El mimero de ventas realizadas durante 10 dias presenta una varianza de 9.1-aI2 109 P{4.919 s 9(9)} = 0. Establecer un intervale de confianza para la vananza poblacional (J2) al-O.10 9(9) :S.90 3. ~ Xn-l.. (J'2 S.(j2 1-6. 24. Datos: S2 s.n-l i _X)2 (n -1)s2 02 * = =9 p{ Intervalo de confianza: n a = 10 = 0...7875 S.3609}= 0.aI2 <0"< 2 (n-l)s.325 (n-l)s.Intervalo de confianza para las varianzas Poblacion = N(f-L.90 de confianza que el intervale hallado se encuentre dentro del grupo de intervalos que contienen a la verdadera varianza poblacional..

You're Reading a Free Preview

Descarga
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->