P. 1
MUESTREO CON Y SIN REEMPLAZO esta.

MUESTREO CON Y SIN REEMPLAZO esta.

|Views: 33.597|Likes:
Publicado porAndrés Arrazola

More info:

Published by: Andrés Arrazola on Mar 16, 2011
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as DOC, PDF, TXT or read online from Scribd
See more
See less

10/13/2015

pdf

text

original

MUESTREO SIN REEMPLAZO Considere una población de N elementos x1, x2, …, xN a partir de la cual se seleccionan muestras de tamaño n.

¿Cuál es la media de las medias de las muestras, en términos de la media de la población; esto es, cómo se puede expresar µ x en términos de µx? Considere primero, el número de muestras de tamaño n que se forman a partir de la población de N elementos. Para una población de N elementos x1, x2, … , xN a partir de la cual se escogen muestras de tamaño n, la media de las medias de todas las muestras posibles de tamaño n es igual a la media de la población original. Esto es, µx = µx. Para la población de N elementos ..., a partir de la cual se seleccionan muestras de tamaño n, la relación entre la desviación estándar σx , de las medias de todas las muestras posibles de tamaño n y la desviación estándar, σx, de la población original es σx = σx 1. Supongamos que la probabilidad de tener una unidad defectuosa en una línea de ensamblaje es de 0.05. Si el conjunto de unidades terminadas constituye un conjunto de ensayos independientes: 1. ¿cuál es la probabilidad de que entre diez unidades dos se encuentren defectuosas? 2. ¿y de que a lo sumo dos se encuentren defectuosas? 3. ¿cual es la probabilidad de que por lo menos una se encuentre defectuosa? SOLUCIÓN: Seaδ i una variable aleatoria que representa el estado de una unidad terminada en la línea de ensamblaje en el momento i, siendo δ i= 1 si la unidad es defectuosa y δ =0 en caso contrario. La variable δ sigue una distribución Bernoulli con parámetro p=0’05, de acuerdo con el dato inicial del problema. Además, nótese que un conjunto de unidades terminadas constituye un conjunto de ensayos independientes, por lo que el número de unidades defectuosas de un total de n unidades terminadas (δ 1……….δ n), esto es, i n i n p Σ= = 1 , η δ , sigue una distribución

Se tiene que: * * 0. Procedamos a calcular: * * 0. ¿cuál es la probabilidad de que a todas las personas que asistan al restaurante se les asigne una mesa? SOLUCIÓN: Representemos por la variable aleatoria δ la decisión de asistir (δ = 0) o no (δ = 1) finalmente al restaurante por parte de una persona que ha hecho una reserva. procedemos a resolver el problema: 1.binomial de parámetros n y p=0. que el 20% de las personas que reservan una mesa no asistirán.05)2 8 10.05) 0 10 0 10. Esta variable sigue .0476 2 10 ( 2) 0'05 (1 0.0'05 =        Pη==− 2.9984 10 ( 2) 0'05 (1 0. El gerente de un restaurante que sólo da servicio mediante reservas sabe. Hechas estas consideraciones iniciales.0'05 =        ≤ = − i −i i Pη 3. Por último: * * 1 0.4013 0 10 ( 1) 1 ( 0) 1 0. por experiencia.05 (1 0.05)10 10.0'05 = − =        ≥=−==−−−PηPη 2.0'005 10.5987 0. Si el restaurante acepta 25 reservas pero sólo dispone de 20 mesas.05.

el número de ellas que acuden finalmente al restaurante es una variable aleatoria Yn =Σ= n i1 δ 1. Supongamos que se desea hacer varias mediciones de la longitud de un tablero para tomar el promedio de ellas como una mejor estimación de la medida.2 *(1 0. El mismo resultado se puede obtener si se sacaran bolas marcadas con los números del 1 al 6 de una bolsa y se reemplazaran antes de sacar otra. 2. de un total de n reservas (δ 1…. Después que se obtuviera una medición 1. Así se tiene que: *0. 3. se tiene que. para aquellas personas que asistan al restaurante de las 25 que han hecho la reserva puedan disponer de una mesa. No se podría pensar en que si el resultado fue 1 la primera vez. es menos probable que aparezca la segunda. Por ejemplo. Suponiendo que las distintas reservas son independientes entre sí. .δ n). n=25.2. De estos ejemplos se puede ver que esta clase de muestreo se puede considerar cuando se trata de poblaciones indefinidamente grandes. un muestreo de mediciones es una clase de muestreo con reemplazo. En el caso particular del problema. Si el dado se tira por segunda vez. hay 6 resultados posibles (digamos 1. Entonces.5799 25 ( 20) 25 20 0 =−      ≤=− =Σ ii ii PY MUESTREO CON REEMPLAZO En muchos problemas de muestreo. 5 y 6).una distribución de Bernoulli de parámetro p = 0.80 m en el segundo intento? Así. ¿se podría pensar que esto reduce la probabilidad de obtener 1. si un dado se tira. el proceso tiene lugar como si una unidad fuera reemplazada una vez que se ha sacado. debe ocurrir que acudan 20 o menos. de acuerdo con el enunciado del ejercicio.2.2) 0. hay también 6 resultados posibles. con distribución binomial de parámetros n y p=0.80 m. 4.

NORM.96 (con una aproximación a dos decimales). N para el segundo. Esto quiere decir que P(-1. hasta que los n elementos se hayan seleccionado. Ahora. se aplicará la primera fórmula. y así sucesivamente. x2. para lo cual se aplicará un cuestionario de manera aleatoria a una muestra. En las n diferentes muestras. De esta manera hay N posibilidades de escoger el primer elemento de la muestra. se desea realizar una investigación sobre los alumnos inscritos en primer y segundo años. xN a partir de la cual se seleccionan muestras de tamaño n. Si se quiere un porcentaje de confianza del 95%. Un resultado semejante se cumple para la muestras con reemplazo. o la función DISTR. con la condición de que después de que cada elemento de la muestra se escoja. Utilizando las tablas. pero con la seguridad de que ésta se encuentra cerca a los diez millares.INV() del Excel. pues los recursos económicos y el tiempo para procesar la información resultaría insuficiente en el caso de aplicársele a la población estudiantil completa. Se considerará una confianza del 95%.96<z<1. una institución de nivel medio superior.ESTAND. y la media de las medias de las muestras. se puede calcular el valor de Z. que es 0.96)=0. que sería 1. Lo que se buscaría en seguida es el valor Z para la variable aleatoria z tal que el área simétrica bajo la curva normal desde -Z hasta Z sea igual a 0. cada elemento de la población original aparece veces. µx. es decir.En el teorema 6-1 hemos demostrado que en el caso de muestras sin reemplazo.95. En primera instancia. un porcentaje de error del 5% y la máxima variabilidad por no existir antecedentes en la institución sobre la investigación y porque no se puede aplicar una prueba previa. …. suponiendo que no se conoce el tamaño exacto de la población. Por definición.95.95. la media de las medias de todas las muestras posibles es igual a la media de la población original. . En el Colegio de Bachilleres. Consideremos una población de N elementos x1. P(-Z<z<Z)=0. entonces hay que considerar la proporción correspondiente. vamos a deducir la relación entre la media de la población original. cuando el remplazo es permitido. se pueden formar muestras diferentes de tamaño n a partir de una población de tamaño N. el elemento se reintegre a la población. Por tanto. µx.95.

25 cms3 .05 (5%) Za/2= 1.408. resulta que Z=1. 1.= 238 frascos Nd² + Z²a/2S² 8000(0.= --------------------------. En un lote de frascos para medicina. es decir. pero con la seguridad de que las condiciones aceptadas para la generalización (confiabilidad. Supongamos ahora que sí se conoce el tamaño de la población estudiantil y es de 9. variabilidad y error) se mantienen. entonces se aplicará la segunda fórmula. Utilizando los mismos parámetros la sustitución queda como: Con lo que se tiene una cota mínima de 370 alumnos para la muestra y así poder realizar la investigación sin más costo del necesario. se desea estimar la media de la capacidad en centímetros cúbicos de los mismos. Utilizando las tablas o las funciones de Excel se pueden obtener. Si queremos tener una precisión 0. d = 0. a = 0.96)²(2)² .95.25)² + (1. A través de un premuestreo de tamaño 35 se ha estimado que la desviación estándar es de 2 centímetros cúbicos. ¿De que tamaño debe de ser la muestra? DATOS: S = 2 cms3 . buscar un valor de Z tal que P(-Z<z<Z)=0.96 N Z²a/2S² 8000(1.Primero habrá que obtener el valor de Z de tal forma que la confianza sea del 95%. y un nivel de significancia del 5% .96. De esta manera se realiza la sustitución y se obtiene: Esto quiere decir que el tamaño de la muestra es de 385 alumnos. con una población de 8000 unidades.25 cms3. o viendo (en este caso) el ejemplo anterior.96)²(2)² n = -------------. N = 8000 .

Solución: 3. de interés para una clínica es el porcentaje de pacientes retrasados para su vacunación. Cullen realizo una muestra aleatoria simple con reemplazo de tamaño 120. en una clínica grande. Una cantidad. Algunas clínicas examinan cada registro para determinar el porcentaje. Que tamaño de muestra seria necesario con una muestra aleatoria simple (sin reemplazo) para estimar la proporción con el 95% de confianza y un margen de error de 0.500 niños y deseamos tener una precisión del 10 porciento. de los cuales 27 resultaron como no retrasados para la vacuna. pues los datos de los 35 frascos del premuestreo siguen siendo válidos. De un intervalo de confianza al 95% para la proporción de niños no retrasados. DATOS: N = 580 Niños En realidad.Solo faltaría muestrear 203 frascos. Sin embargo. Si se sabe que existen 1. 2. la realización de un censo de los registros puede llevar mucho tiempo. De que tamaño debe de ser la muestra? DATOS: . En un estudio.10 . Cullen (1994) realizo una muestra de los 580 niños a los que da servicio una clínica familiar. se desea determinar en que proporción los niños de una región toman incaparina en el desayuno. con frecuencia. en Auckland para estimar la proporción de interés. con un nivel de significancia del 5%.

si a una empresa le puede interesar el número promedio de piezas defectuosas producidas por una cierta máquina. s. la desviación estándar de la distribución de las medias de la muestra. para determinar la media de cada una de ellas y. numerosos problemas están relacionados con la estimación de la media o la desviación estándar de una población dada.= ------------------------------d² + Z²a/2 pq 1500(0. por la ecuación σx = . Za/2= 1. Si en una aplicación particular fuera practico seleccionar todas las posibles muestras de tamaño n. σx.5)(0.1)² + (1.5)(0. d = 10 % = 0.5 y q = 0.96 Z²a/2 pq n= 1500 (1. a = 5 % p = 0.5 (asumiendo varianza máxima).96)²(0.5) Se deben de muestrear 91 niños.N = 1500 .1 . Lo que comúnmente se hace es no estudiar todas las muestras de tamaño n. de esa muestra únicamente se toman como estimaciones de µx y σx. La media. Por ejemplo. la media y la . después.96)²(0. sino únicamente una de ellas. y la desviación estándar. para poblaciones suficientemente grandes. apartir del estudio de una muestra de tamaño n. calcular la media y la desviación estándar de la distribución de las medias de las muestras. µx = µx. está relacionada con la desviación estándar de la población σx. Aún más. x.5) = 91 ----------------. entonces la media de la distribución de las medias de la muestra es la misma que la de la población original. este procedimiento no es práctico. a un ingeniero especialista en cohetes le puede interesar la variabilidad en el funcionamiento de un tipo dado de proyectil. las fórmulas anteriores permitirían calcular µx y σx directamente. DISTRIBUCION MUESTRAL DE MEDIA En estadística. Por lo general. En las secciones anteriores se vio que si se supone que cada muestra de tamaño n tiene la misma probabilidad de ser seleccionada. o para muestreo con reemplazo.

5 .5. (al cm más próximo). S up o ni e n do q u e l o s pe so s se d i strib u ye n no rmal me n te . Aún más. aproximadamente. 2 . Puesto que µx = µx y σx = las estimaciones para µx y σx son x y respectivamente. En seguida se ilustra el procedimiento de estimación con un ejemplo.desviación estándar que corresponden a la población original. 4 . Utilizando x y s como estimaciones de µx y σx. Las alturas (en cm) de los niños que constituyen la muestra son: 63 66 67 69 71 73 64 66 68 69 72 74 64 67 68 69 72 74 65 67 68 70 72 76 65 67 69 70 72 76 66 67 69 70 73 77 La media de la muestra x es 69. 6 4 kg . 3. y la desviación estándar s. Má s d e 9 0 kg . Me n o s de 64 kg . es 3. 1 La me di a y lo s qu e d e l o s pe so s de 5 00 e stu di a n te s de un co l eg i o e s 7 0 kg y l a d e svi a ci ón típ i ca 3 kg . La me d i a y l o s qu e de l o s p e so s de 50 0 e stu di a n te s d e un co le g io e s 70 kg y la de svi a ci ó n típ i ca 3 kg . podemos afirmar que la altura media de todos los niños de esa guardería es alrededor de 69 cm. podemos decir que la desviación estándar de las alturas respecto a la media es. Se escoge una muestra aleatoria de 36 niños de una guardería infantil. ha l la r cu á n to s e stu d ia n te s pe sa n : 1 . E n tre 6 0 kg y 65 kg . 6 4 kg o me n o s.5 cm. S up o n ie n d o . 3 .

64 kg o men o s. 3 .Men o s d e 6 4 kg . 2 .qu e lo s p e so s se di stri b u ye n n o rma l men te . 5 . E n tre 6 0 kg y 65 kg . ha l la r cu án to s e s tud i a n te s pe sa n : 1 .Má s de 90 kg . 4 . .64 kg .

TEOREMA DEL LIMITE CENTRAL La aproximación anterior representa sólo un caso especial de un resultado general. A fin de verificar esto. C al cu l a r e l nú me ro de d ía s de l me s e n l o s qu e se e sp e r a a l ca n za r má xi ma s en tre 21 ° y 27 ° . co n med i a 2 3 ° y d e svia ci ón típ i c a 5 ° . = 0 si la falla ocurre en la i-ésima repetición. recordemos que la variable aleatoria X distribuida binomialmente se puede representar como la suma de las siguientes variables aleatorias independientes: Xi = 1 si el éxito ocurre en la i-ésima repetición. . C a l cu l a r el nú me ro de d ía s de l m e s en lo s q u e se e spe ra a l can za r má xi ma s en tre 21 ° y 27 ° . E n un a ci u da d se esti ma q u e la te mpe ra tu ra má xi ma en e l me s de j un i o si u na d i strib u ci ón n o rma l .2 E n un a ci u da d se esti ma q u e la te mpe ra tu ra má xi ma en el me s de ju ni o si un a d i strib u ció n no rmal . co n me d i a 23 ° y de svi a ció n típ i ca 5° .

i = 1. . X2. Si una variable aleatoria X puede representarse como una suma de n variables aleatorias independientes cualesquiera (satisfaciendo ciertas condiciones que son validas en la mayor parte de las aplicaciones). por tanto. y V(Xi) = . Sea X1. entonces esta suma para un n suficientemente grande está distribuida aproximadamente normal. V(X) = np(1 .p) y. (X – np)/ tiene la distribución aproximada N(0. . puede ser representada como la suma de n variables aleatorias independientes y. + Xn puede ser aproximada por una variable aleatoria distribuida normalmente. . . + Xn. una sucesión de variables aleatorias independientes con E(Xi) = µi. además. El hecho de que las Xi pueden tener (evidentemente) cualquier clase de distribución y aún así la suma X = X1 + . . Este resultado notable se conoce como el teorema del límite central. . Zn = Tiene aproximadamente la distribución N (0. representa la razón básica para la importancia de la distribución normal en la teoría de probabilidades. Para esta variable aleatoria hemos demostrado que E(X) = np. . .1). . si es la fda dela variable aleatoria Zn tenemos limn ∞ Gn (z) = Φ(z). 2. . Sea X = Xi + X2 + . Las variables aleatorias independientes Xi que toman sólo los valores 1 y 0 han sido sustituidas por variables aleatorias que poseen cualquier clase de distribución (mientras tengan esperanzas y varianzas finitas). 1 . C al cu la r la p ro ba b i li d ad de qu e l a med i a d e l os pe s o s d e l a s bo l sa s d e u n pa q u e te se a men o r q u e 4 95 g .Luego X = X1 + X2 + … + Xn. Resulta que en muchos problemas. . 1). . Este teorema representa una generalización obvia de la aproximación de DeMoivre-Laplace. Que para un n grande. Luego bajo ciertas condiciones generales (que no se indicarán explícitamente aquí). . su distribución puede aproximarse por la distribución normal. Xn . Es decir. la variable aleatoria que se considera. .

gt/estadistica/estadistica3/muestreosimplealeatorio.2 .pdf http://www. Impresora Gutenberg Probabilidad y aplicaciones estadísticas.uaq.com/pro/5/a_a.html http://www.uda.mx/matematicas/estadisticas/xu5. Sexta reimpresión 1978 México. Autor Stephen S.html http://sitios. Editorial Impresora Azteca. 1989 México.html . NOMBRE: CRISTIAN DE JESUS GALINDO LOPEZ Bibliografía: Probabilidad y estadística. http://www.edu. Meyer.cl/hsalinas/cursos/2009/estadistica/resueltosprobabilidades.ingenieriausac.mat. Ca l cu l a r la p ro b a bi l id a d de q ue u na ca ja 1 0 0 d e bo l sa s p e se má s de 51 kg . Autor Paul L. Willoughby.vitutor. Editorial CIA.

You're Reading a Free Preview

Descarga
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->