Está en la página 1de 89

UNIDAD 1

Teoría Clásica del Muestreo
Población

Muestra

Diseños de Muestreo y Distribuciones
Muestrales

1

Diseños de Muestreo

Una Población es el conjunto de todos los
elementos de interés en un determinado
estudio, es decir, el conjunto completo de la
información numérica sobre una característica
particular en el que el investigador esta
interesado.
En un estudio empírico, este grupo puede
consistir de gente, animales u otros objetos

Una Muestra es un Subconjunto de la
población

Tenemos dos tipos de poblaciones a considerar:
2
Infinitas y Finitas.

Inferencia Estadística

El objetivo de la inferencia estadística es
recolectar información de una Población,
partiendo de la información que contiene una
muestra.

Es importante darse cuenta que los resultados
de una muestra son estimados de los valores
de las características de una población.

Sin embargo, con los métodos adecuados de
muestreo podemos obtener buenos resultados.

3

Diseños de Muestreo
• Muestreo es el proceso de recolección de
información de sólo una parte de un agregado
o conjunto de la Población . A la parte
seleccionada la llamamos muestra.
• Podemos clasificar el Muestreo como:
Probabilístico y No probabilística

4

Estratificado y Por conglomerados • Muestreo No probabilística es cualquier método de muestreo para el cual NO se puede calcular la probabilidad de cada muestra posible.Diseños de Muestreo • Muestreo Probabilístico es cualquier método de muestreo para el cual se puede calcular la probabilidad de cada muestra posible. Ejemplos: Aleatorio Simple. Sistemático. Ejemplos: Muestreo de juicio y Muestreo por conveniencia 5 .

Diseños de Muestreo Muestreo Probabilístico Muestreo Aleatorio Simple • El muestreo aleatorio puede poblaciones Finitas o Infinitas aplicarse a 6 .

Muestreo Aleatorio Simple Para Poblaciones Finitas Es una Muestra de tamaño n extraída de una población de tamaño N de tal forma que cada muestra posible tenga la misma probabilidad de ser seleccionada Por ejemplo. Es muy importante resaltar que lo aleatorio de una muestra está en el proceso de selección y no en el resultado. si se conoce un listado de los elementos de la población (Finita) lo que se hace es seleccionarlos mediante el uso de números aleatorios. 7 .

Diseños de Muestreo Muestreo Probabilístico Muestreo Aleatorio Simple • El muestreo aleatorio se puede plantear bajo dos puntos de vista: Sin reposición y Con reposición • El numero de muestras posibles de tamaño n que se puede obtener de una población de tamaño N viene dada por: – Sin reposición o reemplazo N! NCn  n!( N  n)! N Pn N! ( N  n)! – Con reposición o reemplazo: Nn 8 .

Cada elemento se selecciona de forma independiente. 9 . En poblaciones infinitas un procedimiento para la selección de una muestra debe ser concebido especialmente para cada situación .Muestreo Aleatorio Simple  Para Poblaciones Infinitas Es aquella que se selecciona de tal forma que cumple con las siguientes condiciones: 1. Cada elemento seleccionado proviene de la misma población. de manera que cumpla con la condición 2 y evitar el sesgo en la selección que dé mayores probabilidades de selección a cierto tipo de elementos. 2.

147. 229 y 147 Población Infinita 10 .Ejemplos Población Finita Solución: Muestra sin reemplazo: 022. 229 y 289 Muestra con reemplazo: 022. 147.

11 Ejercicios .

Otros tipos de muestreos probabilísticos .

Muestreo Aleatorio Sistemático Similar al muestro simple salvo que:  1. sucesivamente el coeficiente de elevación. Solo la primera unidad de la muestra se elige al azar siempre que el número seleccionado sea mayor que el coeficiente de elevación. Donde  N: Tamaño de la población  n : Tamaño de la muestra Los restantes elementos de la muestra se hayan sumando. .  Coeficiente de Elevación = N/ n  2.

la primera muestra es el sintonizador con código 40102 La muestra sería: 40102. El gerente de dicho centro está preocupado por la calidad de dichos sintonizadores y decide obtener una muestra sistemática de 7 aparatos y someterlos a varias pruebas. de izquierda a derecha.2857 ≈ 1334 Si iniciamos con el 1er número aleatorio que se encuentre a partir de la fila y columna 1. 45438. Dichos sintonizadores vienen numerados con códigos desde el 39456 al 48795. en la tabla de números aleatorios. Ayúdale a obtener la muestra. 41436. Tamaño de la población de Sintonizadores (N)= 48795-39455= 9340 Coeficiente de Elevación = N/ n = 9340/7= 1334.Ejemplo • Un centro comercial acaba de recibir un pedido de sintonizadores TDT para ponerlos a la venta entre sus clientes. 42770. 46772 y 48106 14 . 44104.

relación y costos. Las variables comúnmente utilizadas incluyen características demográficas. por lo general muestreo aleatorio simple. Después. tamaño de la empresa o tipo de industria. Afijación Optima: Se tiene en cuenta la previsible dispersión de los resultados. .  Un objetivo principal de este muestreo es incrementar la precisión sin aumentar el coste  El criterio para la selección de las variables de estratificación consiste en homogeneidad. tipo de cliente (con o sin tarjeta). los elementos se seleccionan para cada estrato mediante un procedimiento aleatorio.Muestreo Aleatorio Estratificado  Es un proceso en dos fases en el que la población se divide en estratos.  Metodologías: Afijación Simple: A cada estrato le corresponde igual número de elementos muestrales. Afijación Proporcional: La distribución se hace de acuerdo con el peso (tamaño) de la población en cada estrato. de modo que se considera la proporción y la desviación típica.

Muestreo Aleatorio Estratificado: Una población es primero divida en subgrupos llamados estratos y una muestra es seleccionada de cada estrato. Métodos de muestreo probabilístico .

Ejemplo: Muestro por Estratos .

Afiliación Simple 2500 nestratos  3 .Ejemplo Muestro por Estratos.

39 x 2500  975 nestrato3  0.45 x 2500  1125 nestrato2  0. Afiliación Proporcional nestrato1  0.16 x 2500  400 .Ejemplo Muestro por Estratos.

460 x 2500  1150 0.152 x 2500  380  970.1150.Ejemplo de Muestreo por Estratos.388 x 2500  970 0. Pr oporciónestrato1  85500 / 220500  0.388 Pr oporciónestrato2 101400 / 220500  0.380  2500 .152 Paso 4 : Se calcula el tamaño de la muestra de cada estrato multiplicando su proporción por el tamaño de la muestra global ( 2500) 0.460 Pr oporciónestrato3 33600 / 220500  0. Afiliación Óptima Paso 1 : Multiplicar el porcentaje de la población correspondiente al estrato por la varianza del estrato 45 x1900  85500 39 x 2600  101400 16 x 2100  33600 Paso 2: Se suman todos los valores obtenidos en el paso 1 (85500+101400+33600=220500) Paso 3: Se calcula a proporción de cada valor obtenido en el paso 1 dentro del paso 2.

a la que llamamos conglomerado. • El conglomerado más utilizado en la investigación es un conglomerado geográfico. • A diferencia de un estrato.Muestreo Aleatorio por conglomerados • La unidad muestral es un grupo de elementos de la población que forman una unidad. • Lo más importante sobre esta técnica de muestreo es dar a todos los conglomerados iguales posibilidades de ser seleccionados. un conglomerado es una unidad de elementos que contienen representantes de toda la población. .

.Muestreo por Conglomerados: Una población es dividida primero en unidades primarias y entonces una muestra es seleccionada de la unidades primarias.

• Puede dividir a toda la población (población de El Salvador) en diferentes conglomerados (ciudades o departamentos). • Luego. a través de un muestreo aleatorio simple o sistemático.Muestreo Aleatorio por conglomerados Ejemplo: un investigador desea estudiar el rendimiento académico de los estudiantes de bachillerato en El Salvador. • Luego. de los conglomerados seleccionados (ciudades o departamentos seleccionadas al azar) el investigador puede incluir a todos los estudiantes como sujetos o seleccionar un número de sujetos de cada conglomerado a través de un muestreo aleatorio simple o sistemático. . el investigador selecciona una serie de conglomerados en función de su investigación.

Ejercicios

Se acercan las Navidades y cierta empresa de turrones cree que no va a poder
entregar todos los pedidos a tiempo, a no ser que aumente la plantilla. La empresa
dispone de un listado ordenado alfabéticamente de 20 personas con las mismas
características para el puesto y que actualmente están en paro. Puesto que el
tiempo apremia y no es posible hacer una entrevista para seleccionar al personal,
se decide elegir cinco trabajadores de forma aleatoria usando el muestreo
sistemático.
a. Determine la muestra que debe tomarse.
b. Supongamos que se desea extraer una muestra de 6 trabajadores, cual es la
muestra a tomarse.
Supongamos que estamos interesados en estudiar el grado de aceptación que la
implantación de la reforma educativa ha tenido entre los padres de una
determinado municipio. A tal efecto seleccionamos una muestra de 600 niños.
Conocemos por los datos del ministerio que de los 10000 niños escolarizados en
las edades que nos interesan, 6000 acuden a colegios públicos, 3000 a colegios
privados católicos y 1000 a colegios privados no católicos. Como estamos
interesados en que en nuestra muestra estén representados todos los tipos de
colegio, realizamos un muestreo estratificado empleando como variable de
estratificación el tipo de centro.
24

Solución

Nivel de elevación=20/5= 4
Si iniciamos con el 1er número
aleatorio que se encuentre a partir
de la fila y columna 1, de izquierda a
derecha y utilizando los últimos
dígitos de cada número en la tabla de
números aleatorios, la primera
muestra es la persona número 02,
luego sumamos el nivel de elevación
para calcular las demás muestras.
Muestra: 02, 06, 10, 14 y 18.

Si empleamos una afijación simple
elegiríamos 200 niños de cada tipo de
centro, pero en este caso parece más
razonable utilizar una afijación
proporcional pues hay bastante diferencia
en el tamaño de los estratos. Por
consiguiente, calculamos que proporción
supone cada uno de los estratos respecto
de la población para poder reflejarlo en la
muestra.
Colegios públicos: 6000/10000=0.60
Colegios privados concertados:
3000/10000=0.30
Colegios privados no concertados:
1000/10000=0.10
Colegios públicos: 0.60x600=360 sujetos
Colegios privados concertados:
0.30x600=180 sujetos
Colegios privados no concertados:
0.10x600= 60 sujetos
25

Distribuciones Muestrales
26

Introducción
• Uno de los puntos claves de la Estadística es extraer
conclusiones a través de un conjunto de datos
observados. Por lo general estos datos observados
provienen de una muestra, con el objetivo de sacar
conclusiones de la población total.
• La Distribución Muestral de un Estadístico es la
distribución de probabilidades con que constan todos
los posibles valores de un estadístico muestral.
27

• Propiedades que definen una Distribución Muestral de Medias 1. El valor esperado La Varianza y Desviación Estándar Tipo de Distribución. con o sin reemplazo. Se refiere a la forma de la distribución de probabilidad. 3. 28 . 2.Distribuciones Muestral de Medias • Distribución Muestral de Medias Es la distribución de probabilidad de todas las media posibles que se pueden extraer de una muestra de tamaño “n”.

E(x) Es la media de todas las medias muestrales Demostración: 29 .Distribuciones Muestrales de 1. El valor esperado.

Distribuciones Muestrales de 1. mide la variabilidad entre medias muestrales.  x  V (x )   n 30 . La varianza V(x) y el Error estándar  x  V (x )   n El error estándar de la media.

debe de introducirse un factor de corrección para población finitas para calcular el error estándar de la media.  x  0 Así. cuanto mayor es la muestra. Además.Distribuciones Muestrales de 2. La varianza V(x) y el Error estándar  x  V (x )   n Lo que revela  x que es menor que .05. Si se toman muestras de una población finita sin reposición. indica que cuando: n   . tanto menor es la fluctuación entre medias muestrales extraídas de la misma población. En general si la relación n / N > 0. se usa: x   n N n N 1 Factor de corrección 31 .

8.49 σ= 0.70 i 32 .8.8.7.9} N=7 Parámetros: x   i N  2 (x       )2 N i  (x   )2 N μ=7.Ejemplo • Población de salarios por hora: {7.71 σ2=0.7.

Número de muestras posibles • # de muestras con reemplazo= N n • # de muestras sin reemplazo – Si el orden no es importante= – Si el orden es importante= Cn  N N N! n!( N  n)! Pn N! ( N  n)! .

Número de muestras posibles de tamaño n=2 • # de muestras con reemplazo=7 2  49 • # de muestras sin reemplazo – Si el orden no es importante= C 7 – Si el orden es importante= 7  7!  21 2!(7  2)! P2 7!  42 (7  2)! 2 .

8) (7.9) 9 (9.8) (8.9) 7 (7.7) (8.7) (7.9) 7 (7.7) (7.8) (9.Muestras posibles con reemplazo de tamaño n=2 7 7 8 8 7 8 9 7 (7.7) (8.7) (9.7) (8.7) (8.9) 8 (8.7) (9.7) (8.7) (7.8) (8.8) (8.7) (7.8) (8.8) (7.8) (7.7) (7.7) (7.7) (7.7) (8.7) (9.8) (9.8) (8.7) (8.8) (7.8) (8.9) .7) (8.8) (8.8) (7.8) (9.7) (8.8) (7.9) 8 (8.9) 8 (8.7) (7.8) (7.7) (7.8) (8.8) (8.8) (7.8) (7.

7) (8.9) 8 (8.7) (7.7) (8.8) (8.7) (8.8) (7.8) (7.9) 8 (8.8) (9.7) (7.7) (7.8) (9.8) (8.7) (7.8) (7.7) (8.8) (8.8) (7.8) (8.8) (7.9) 8 (8.7) (8.8) (9.8) (8.7) (8.8) (8.7) (7.9) 7 (7.7) (7.7) (9.8) (7.7) (8.7) (9.Muestras posibles sin reemplazo y el orden no es importante 7 7 8 8 7 8 9 7 (7.8) (8.7) (7.8) (8.8) (7.9) .9) 7 (7.7) (7.7) (8.8) (7.8) (7.9) 9 (9.7) (8.8) (8.7) (9.7) (7.

7) (8.Muestras posibles sin reemplazo y el orden es importante 7 7 8 8 7 8 9 7 (7.7) (7.8) (7.8) (7.7) (7.8) (8.9) .7) (7.7) (8.7) (8.8) (8.8) (7.7) (8.8) (8.8) (9.8) (7.7) (8.8) (8.7) (9.7) (7.8) (8.8) (7.7) (8.7) (8.9) 8 (8.8) (9.7) (7.7) (8.8) (8.8) (7.7) (9.7) (7.9) 7 (7.7) (7.8) (7.8) (9.7) (9.8) (7.8) (7.9) 9 (9.8) (8.9) 8 (8.7) (8.7) (7.8) (8.8) (8.7) (7.9) 7 (7.9) 8 (8.

5 7.5 8 8.Medias de todas las muestras posibles de tamaño n=2 7 7 8 8 7 8 9 7 7 7 7.5 8 8 7.5 7.5 8 8.5 7.5 8 8 7.5 7 7.5 8 8.5 7 7 7 7.5 9 8 8 8.5 8.5 8 8.5 7.5 7 7.5 8 7.5 7 7.5 8 8 7.5 8 7 7 7 7.5 8 8 7.5 9 Valor esperado de medias .5 8 8 7.5 7.5 7.

5 6 12.73% 8 15 30.37% 7.5 18 36.Distribución muestral de medias Medias (x) Frecuencia Probabilidad 7 9 18.24% 9 Total 1 49 2.04% 100% .61% 8.

00 σ 2x = σx = 0.4949 σ 2= 0.2855 1.2449 0.65302449 12.59202041 7.5 18 36.70394694 9 Total 1 49 2.82664082 8 15 30.7143 -6.2857 1.4287 4.2857 0.7142 3.22436735 8.04% 100% 1.00 1.37% -0.2143 -3.24% 0.73% -0.25  x2 ( x  E ( x))  i # datos 2 .61% 0.7857 4.8574 0.Distribución muestral de medias Medias (x) Error muestral por Error muestral Error Frecuencia Probabilidad media total muestral ^2 7 9 18.5 6 12.2857 4.

Distribución muestral de probabilidad de 120% Probabilidad 100% 80% 60% 40% 20% 0% 5 6 Medias .

Distribución poblacional de probabilidad 20% 00% Probabilidad 80% 60% 40% 20% 0% 0 1 2 3 Medias 4 5 6 .

El error estándar de la DMM será: σx= σ2 / √n 43 . La dispersión de la DMM es menor a la distribución poblacional 3.Conclusiones 1. El valor esperado de la DMM es igual a μ 2.

se pide a cada uno de ellos que digite una carta.Ejercicio 3 Sea la siguiente población de 4 asistentes administrativos. el número de errores cometidos se presenta a continuación: 44 .

R. El valor esperado de la distribución muestral de medias del literal 2 y 3.79057. 1. La media.16 3. 45 . Transformar la serie de medias de n=2 con reposición en una Distribución Muestral de medias. Transformar la serie de medias de n=2 sin reposición en una Distribución Muestral de medias. Las medias de todas las muestras de n=3 que se puedan extraer de esa población sin reposición sin importar el orden. 1. 2. R(2.Ejercicio 3 Calcular : 1. 9.5 6. 12 4.64550 7. R 0.41667 y 0. Las medias de todas las muestras de n=2 que se puedan extraer de esa población sin reposición y si el orden importa. varianza y desviación poblacional. 0.1180) 2. R. Grafique la Distribución Muestral de medias del literal 2. 0. 8.5. Las medias de todas las muestras de n=2 que se puedan extraer de esa población con reposición .25. R 2.62500.5. La varianza y desviación estándar de las distibución muestral de medias del literal 2 y 3. R 4 5.

4) (4.4) Muestras Sin Reemplazo A R C (3.4) (4.5 2 1.3) (4.2) R (2.3) (4.5 A 2 R 2.2) (1.3) Medias de cada muestra A R 3 2.4) (2.5 3 2.4) (2.1) R (2.3) (2.1) A (3.3) (1.5 C 3.5 3 D D (3.Ejercicio 2.1) C (1.2) D (4.3) (2.1) (4. Con reposición o reemplazo Nn = 16 Sin reposición o reemplazo y el orden importa { N! / (N-n)! } =12 Muestras Con Reemplazo A R A (3. Las medias de todas las muestras de n=2 que se puedan extraer de esa población con reposición y sin reposición.5 D 3.3) (3.1) D (3.2) (2.4) (1.5 1 2.4) C 2 1.1) (2.1) D (4.1) (1.3) (1.2) C (1.5 4 46 .4) (1.2) C (3.2) (4.2) (3.

Sin reposición o reemplazo y el orden no importa { N! /n (N-n)! } = 4 47 .Ejercicio 4. Las medias de todas las muestras de n=3 que se puedan extraer de esa población .

5 2 A 2.5 C 3.5 R 2 1.5 1.5 3 2.5 D 3.5 R 2 1.Ejercicio 5.5 1 C 3.5 48 . El valor esperado de todas las medias Medias de cada muestra con reemplazo A R C 3 2.5 D Suma= N° de medias µx = D 3.5 Medias de cada muestra sin reemplazo A R C 2.5 2 1.5 D Suma= N° de medias µx = 40 16 2.5 3 2.5 4 30 12 2.5 2 A 2.5 3 2.5 3 2.

25 1 2.25 1 0 0.5 2.25 0.5 0 1 0.5 0 1 0.5 ∑ N° de muestras= σ2x= σx= (Medias muestral Valor esperado)^2 0.64550 0.41667 0.Valor esperado esperado)^2 RyA CyA DyA AyR CyR DyR AyC RyC 2. Varianza y desviación estándar de todas las medias Muestras con reemplazo AyA RyA CyA DyA AyR RyR CyR DyR AyC RyC CyC DyC AyD RyD CyD DyD Medias muestral Media muestral Valor esperado 3 2.5 2 3.62500 0.5 4 0.5 1 2.5 2 1.5 -0.25 1 0 1 0.25 1 0.25 0 2.25 1 DyC AyD RyD CyD 2.81650 ∑ N° de muestras= σ2x= σx= FC= 49 .25 0 0.5 0 1.5 3 2 1.5 2.25 0 5 12 0.5 0 0 1 0.5 -1 -1.5 0 -0.25 0.5 3.5 3 2 1.5 -1 0 0.5 0 -0.79057 Muestras sin Media reemplazo muestral (Medias muestral Medias muestral Valor .5 3 2.Ejercicio 6.5 1 0 -0.5 3.5 -0.5 1.25 10 16 0.5 -1 0.25 0 1 0.5 3 2.5 1 0 -1 0.5 2 3.

Ejercicio 7.5 2 0.16667 2.125 0.1875 0. 8.5 3 3.0625 0.33333 3 2 0.5 4 Total 1 2 3 4 3 2 1 16 0.16667 3. (Considere factor de corrección) Medias X Frecuencia P(x) 1 1.5 4 0.1875 0.25 0.16667 2 2 0.0625 1 Medias X Frecuencia P(x) 1. Transformar la serie de medias con reposición en una Distribución Muestral de medias Transformar la serie de medias de n=2 sin reposición en una Distribución Muestral de medias.5 2 2.16667 Total 12 1 50 .125 0.5 2 0.

5 2 2. 0.Ejercicio Grafique la Distribución Muestral de medias Distribucion Muestral de x 0.05 0 1 1.25 0.5 4 51 .15 0.2 P(x) 9.5 3 Numero de errores (x) 3.3 0.1 0.

Distribuciones Muestrales de 3. Tipo de distribución Normal Distribución de x Desconocida 52 .

Si la distribución es Normal 53 .

Si la distribución es desconocida 54 .

55 .

56 .

la mediana y la moda tienen el mismo valor.CARACTERISTICAS DE LA DISTRIBUCION NORMAL  Es una campana simétrica con respecto a su centro  La curva tiene un solo pico. es unimodal. la media.  La media de una población distribuida normalmente cae en el centro de su curva normal. en consecuencia. por tanto. para una curva normal.  Los dos extremos de la distribución normal de probabilidad se extienden indefinidamente y nunca tocan el eje horizontal 57 . la mediana y la moda de la distribución se encuentran también en el centro.  Debido a la simetría de la distribución normal de probabilidad.

46 % de todos los valores de una población normalmente distribuida se encuentra dentro de 2 desviación estándar de la media.AREAS BAJO LA CURVA NORMAL Teorema de Chebyshev: -3s -2s -1s +1s +2s +3s 68.73% de todos los valores de una población normalmente distribuida se encuentra dentro de 3 desviación estándar de la media.26% 95. Aproximadamente 99. 2. 3.73% La desviación estándar sigma representa la distancia de la media al punto de inflexión de la curva normal 1. Aproximadamente 95.46% 99. X x-3 x-2 x- x x+ x+2 x+3 z -3 -2 -1 0 1 2 3 58 .26% de todos los valores de una población normalmente distribuida se encuentra dentro de 1 desviación estándar de la media. Aproximadamente 68.

Si Z es el número de desviaciones estándar que hay desde x a la media de la distribución (margen de error) y σ = σ/√n entonces.Valor práctico de la distribución muestral de medias • Si sabemos que la distribución muestral es normal podemos usar la Distribución Normal Estándar para calcular la probabilidad. así : 59 . podemos definir que Z σ/√n= (X-µ). por lo tanto la formula de estandarización será: • Donde el valor absoluto de la diferencia entre el estimador y el parámetro . se llama Error muestral o Margen de error (e).

explique para cada situacion si debiera de sancionarse a la empresa o no por pagar menos del promedio establecido: a) b) c) d) e) f) g) h) Si la muestra da como resultado un salario promedio mensual de $550 ó menos? Si la muestra da como resultado un salario promedio mensual de al menos $625? Si la muestra da como resultado un salario promedio mensual de $ 630 ó menos? Si la muestra da como resultado un salario promedio mensual de por lo menos $575? Si la muestra da como resultado un salario promedio mensual que se encuentre entre $575 y $625? Si la muestra da como resultado un salario promedio mensual se encuentre entre $570 y $615? Si la muestra da como resultado un salario promedio mensual se encuentre entre $625 y $650? Cual seria el salario promedio limite que se aceptaria como resultado de la muestra para no sancionar a la empresa. segun la ley.Ejercicio – El salario básico inicial promedio de los obreros no calificados (sin antigüedad). 10% de probabilidad. si se establece como maximo un 5%. 60 . es de $600 mensuales. Si se toma una muestra aleatoria simple de 25 obreros. Suponga que en una empresa la distribución de los salarios sigue una distribucion Normal y tiene una desv estandar de $100.

Ejercicio 61 .

1167 ( 2 25 62 ) .5 )   0.5   0.5 2 10 )  x2  0.2917 ( 2 x n  25  x  3.Relacion entre el tamaño de muestra y distribucion muestral de Medias n5  x  3.5833 ( 2 x 2 5 n  10  x  3.

1167 ( 2 25 ) Notar que  x2 es menor que . x tiende a ubicarse cerca de  . ¿Qué pasa con la probabilidad? 63 .1).5   0. va a ser 2 menor .5 2 10 )  x2  0.2917 ( n  25  x  3. a medida que el tamaño de la muestra aumenta Usando la N(0. Cuanto mayor es el tamaño de muestra.Distribución de la Media Muestral n  10  x  3.5 de la media poblacional.5 n5  x  3. Entonces. x. calcule para cada caso la probabilidad que la media muestral este a mas o menos 0.5833 ( 2 x  2 5 )  x2  0.

Distribución Muestral de Proporciones ^p • El parámetro de interés para datos nominales es la proporción de veces que se presenta un determinado resultado(suceso). 64 n: tamaño de la muestra . • Para estimar la proporción poblacional ‘π’ se usa la proporción muestral. ^ = El estimador de π es = p X n Donde x: número de elementos de la muestra que poseen la característica de interés.

para inferencia acerca de p^ se prefiere usar la normal como aproximación a la binomial. las probabilidades se pueden calcular con la distribución binomial. (muestras grandes) 65 .^ p Distribución Muestral de Proporciones • Se define como la distribución de probabilidad de todos los valores posible de ^p que se pueden extraer. • Pero. con o sin reemplazo • Si X es binomial.

– Para que la aproximación dé buenos resultados se deben cumplir dos condiciones: nπ  5 . n(1 .5. y la probabilidad del suceso. π.π)  5 66 .Aproximación Normal a la Binomial – La aproximación normal de la binomial es mejor cuando : • La cantidad de experimentos (tamaño de la muestra) es grande. es próxima a 0.

entonces: • Z se distribuye como una normal estándar. si la relación n/N>0. se cumple: • E( pˆ ) = π y V ( pˆ ) = π(1. z p ˆ   (1   ) n 67 .Aproximación Normal a la Binomial • De las propiedades del valor esperado y la varianza. entonces se utiliza :  ppˆ   (1   ) n N n N 1 Factor de corrección • Si ambos n π > 5 y np(1.05.π) > 5.π)/n • La desviacion estandar o error estandar se representa como σ pˆ Se calcula como la raiz cuadrada de v( pˆ ) . asi: p  (1   ) n • Al igual que las x.

cuál es la probabilidad de que gane el FM.• Ejemplo – Un partido FM recibió en promedio el 52% de los votos en la última elección. – Si la elección próxima se gana con la mitad más uno. si se toma una muestra de 300 personas? – Cuál es la probabilidad de que 200 o menos de la muestra de 300 electores voten por el FM? – ¿Qué proporción de votantes necesitaría el partido para tener una probabilidad 80 % en la muestra? ¿Cuántos votos representa esto? 68 . Si p representa la proporción de votantes que votan por el FM. – Un año después el partido quiere estudiar su popularidad.

52 ˆ   0.• Ejemplo – Solución El número de electores que prefieren el representante es binomial con n = 300 y π = 0.52) = 156 y n(1. Se tiene n π = 300(0. 52 )( 1  0 .85 c) P( pˆ  %)  P    ( 1   ) n ( 0 .52 pˆ      0.50)  P    (1   ) n  ( 0 .9859   p   p  0 .52)(1  0.π) = 300(1-0. 52 ) 300     p  0 . x  p * n  0.03  (0.7549 a) P( pˆ  0. 52   0.5499 * 300  165vo tan tes 69 . 52 )( 1  0 .5499  54.85 P( pˆ  x)  P1.52) 300     p  0.52) = 144 (ambos mayores de 5)   0.99%.58)  P( z  2. 52 ) 300   b) P( pˆ  0.2)  0.52.50  0.

Ejercicio 70 .

Distribución Muestral de la Diferencia entre dos Medias • Se extraen dos muestras independientes de dos poblaciones con distribución normal. x1  x 2 71 . • Interesa la distribución muestral de la diferencia entre las dos medias muestrales.

1 2 72 . la distribucion de x  x es aproximadamente normal (TCL). y – Las distribuciones poblacionales se distribuyen normalmente. pero los tamaños de muestra son 30 o más.Distribución Muestral de la Diferencia entre dos Medias • La distribución de x1  x 2 es normal si: – Las dos muestras son independientes.  Si cada una de las poblaciones no tiene distribución normal.

Distribución Muestral de la Diferencia entre dos Medias • Aplicando las propiedades de valor esperado y varianza se tiene: E( x 1  x 2 )  E( x 1 )  E( x 2 )  1   2   V( x 1  x 2 )  V( x 1 )  V( x 2 )   n n 2 1 2 2  Se puede definir: Z ( x1  x 2 )  (1   2 ) 12 22  n1 n2 73 .

500). estándar = $18. estándar = $14.000 (d.Distribución Muestral de la Diferencia entre dos Medias Ejemplo – Los ingresos promedios de los funcionarios de dos empresas. WLU y UWO son de $62. nUWO = 60) 74 .300).000 (d. (Valores anuales) – Cuál es la probabilidad de que una media muestral de la WLU sea mayor que la media muestral de UWO (nWLU = 50. y $60.

7389 75 .128 50 60 P( x1  x2  0)  P( x1  x2  ( 1 .64)  0. 2 )  2 1 n1   2 2 0  2000  ) 3128 n2  P( z  0.000 .60.2389  0.2 = 62.500 2 18.000 = $2.300 2   $3.Distribución Muestral de la Diferencia entre dos Medias • Ejemplo 9.4 – Solución Hay que determinar : P( x1  x 2  0) 1 .000  12 n   22 n  14.5  0.

8 años.0 años y una desviación estándar de 0. mientras que los del fabricante B tienen una duración media de 6.Ejercicio • Los cinescopios para la televisión del fabricante A tiene una duración media de 6.5 años y una desviación estándar de 0. ¿Cuál es la probabilidad de que una muestra aleatoria de 36 cinescopios del fabricante A tenga una duración media que sea al menos de un año más que la duración media de una muestra de 49 cinescopios del fabricante B? 76 .9 años.

77 .

Distribución muestral de la diferencia de Proporciones normales  Aplicando las propiedades de valor esperado y varianza se tiene: E ( p1  p 2 )   1   2 V ( p1  p 2 )   1 (1   1) n   1  Se puede definir: Z  (  p 1 1  (1  n 1 p  2 2 (1   2) n    )  ( ) 1 2 1 2  ) (1    n 2 2 2 ) 78 .

Ejemplo Se sabe que en una población el 28% de las mujeres y el 25% de los hombres son fumadores. 79 . Determinar la probabilidad de que las mujeres fumadoras superen a los hombres fumadores en al menos el 4%. Se extraen muestras de 42 mujeres y 40 hombres.

Otras Distribuciones muestrales para poblaciones Normales 80 .

DISTRIBUCION "t DE STUDENT" • La apariencia general de la distribución t es similar a la de la distribución normal estándar: ambas son simétricas y unimodales. • v es el numero de grados de libertad (n-1) . y el valor máximo de la ordenada se alcanza en la media.

82 . Xi y S² son la media y la varianza de una muestra aleatoria de tamaño n tomada de una población normal con media µ y varianza σ². para muestreo pequeño.DISTRIBUCION "t DE STUDENT" • Se utiliza la Distribucion “ t de student “ en lugar de la distribución Z estándar. • Teorema. entonces la variable • tiene la distribución t con n-1 grados de libertad.

c) La varianza de t es ligeramente mayor de 1. E(t)= 0 b) Distribución simétrica con respecto a cero. la dispersión de la curva t disminuye. la secuencia de curvas t se aproxima a la curva normal estándar. 4. A medida que γ aumenta. Cada curva t. 3. es decir. d) Para n ≥ 30 la distribución t tiende hacia la distribución normal. .0.Propiedades de la distribución t • 1. Cada curva t tiene forma de campana con centro en 0. 2. es ligeramente mayor que la de la distribución normal estándar. A medida que γ aumenta. está más dispersa que la curva normal estándar z. • Propiedades generales a) El valor esperado es cero.

si el fabricante afirma que "el consumo promedio de gasolina es 12 galones/hora".4 galones. con una desviación estándar de 3. s= 2.4? c) Si en la muestra obtuviéramos X=16. Nota: Para aquellos valores que no se encuentren en la tabla t ó x2. cual es la probabilidad de que el consumo sea mayor a 16 gal/h. a) Se quiere saber la probabilidad de que el consumo sea mayor a 12. mediante la siguiente fórmula: 84 . b) Cual es la probabilidad que una media tenga un consumo entre 11. En un recorrido de prueba de una hora cada uno. el consumo promedio de gasolina de 16 motores fue 12.6 y 12.1.1 galones.4 galones/hora. se puede usar interpolación lineal.• Ejemplo.

o simplemente "grados de libertad". V(X) = 2 V donde: V es el número de grados de libertad.DISTRIBUCIÓN CHI CUADRADO X 2 El valor esperado y la varianza de la distribución Chi cuadrado están dados por: E(X) = V. .

están sesgadas a la derecha. • El área bajo una curva Chi-cuadrada y sobre el eje horizontal es 1.Propiedades de las distribuciones Chi-cuadrada • Los valores de X2 son mayores o iguales que 0. Teorema. b) La variable aleatoria X2 tiene una distribución Chi Cuadrado con n-1 grados de libertad. esto es. entonces: a) y S2 son independientes. Si x y S2 son la media y la varianza de una muestra aleatoria (n) tomada de una población normal con media μ y varianza σ2. Tienen colas estrechas que se extienden a la derecha. • Las distribuciones X2 no son simétricas. • La forma de una distribución X2 depende de los V =n-1. x X2= .

en promedio 2. c) Que garantía debe ofrecer el fabricante en cuanto a la duración de las baterías si desea un probabilidad de cumplimiento del 95% • Nota: Para aquellos valores que no se encuentren en la tabla t ó x2.36. se puede usar interpolación lineal. Si la distribución de las duraciones sigue una distribución normal y se toma una muestra de 12 baterías: a) Cual es la probabilidad que la media de la muestra sea mayor a 3 años? b) Cual es la probabilidad que las baterías tengan una desviación estándar de 1 años o más. mediante la siguiente fórmula: .5 años con una varianza de 0.Ejercicio Un fabricante de baterías para automóviles garantiza que sus baterías duran.

Fórmulas Importantes 88 .

Fórmulas Importantes E( x 1  x 2 )  E( x 1 )  E( x 2 )  1   2 12  22 V( x 1  x 2 )  V( x 1 )  V( x 2 )   n n Z ( x1  x 2 )  (1   2 ) 12 22  n1 n2 89 .