Está en la página 1de 114

Tema : METODOS Y

DISTRIBUCIONES DE MUESTREO
2009 - Ing. José Manuel García
I calidadtotal@hotmail.com
Pantigozo
Objetivos de aprendizaje
Explicar porque en muchas situaciones una muestra es la
única forma posible para tener conocimiento de una
población.
Explicar los diversos métodos para seleccionar una muestra
Diferenciar entre muestreo probabilístico y no
probabilístico.
Definir y elaborar una distribución de muestreo de medias
muestrales.
Explicar el “teorema de limite central y su importancia en
la inferencia estadística.
Calcular los intervalos de confianza para medias y
proporciones.
Determinar que tan grande debe ser una muestra para
medias y proporciones.
Distribuciones muestrales
• En estudios pasados centramos nuestra atención en
técnicas que describen los datos, tales como
organizar datos en distribuciones de frecuencias y
calcular diferentes promedios y medidas de
variabilidad. Estábamos concentrados en describir
algo que ya ocurrió.
• También comenzamos a establecer los fundamentos
de la estadística inferencial, con el estudio de los
conceptos básicos de la probabilidad, las
distribuciones de probabilidad discretas y continuas.
Distribuciones que son principalmente generadas para
evaluar algo que podría ocurrir. Ahora veremos otro
tipo de distribución de probabilidad, que se llaman
distribuciones muestrales.
¿Por qué muestrear?
• Muestrear es una forma de evaluar la calidad de un
producto, la opinión de los consumidores, la eficacia
de un medicamento o de un tratamiento. Muestra es
una parte de la población. Población es el total de
resultados de un experimento. Hacer una conclusión
sobre el grupo entero (población) basados en
información estadística obtenida de un pequeño grupo
(muestra) es hacer una inferencia estadística.
• A menudo no es factible estudiar la población entera.
Algunas de las razones por lo que es necesario
muestrear son:
¿Por qué muestrear?
(continuación)

1. La naturaleza destructiva de algunas pruebas


2. La imposibilidad física de chequear todos los
elementos de la población.
3. El costo de estudiar a toda la población es muy
alto.
4. El resultado de la muestra es muy similar al
resultado de la población.
5. El tiempo para contactar a toda la población es
inviable.
MUESTRA
PROBABILISTICA
¿Qué es una muestra probabilistica?
En general, hay dos tipos de muestras: la muestra
probabilística y la muestra no probabilística. ¿Qué es
una muestra de esta clase?

Muestra Probabilística
Muestra que se selecciona
de modo que cada
integrante de la población
en estudio tengan una
probabilidad conocida (no
igual a cero) de ser incluido
en la muestra.
MÉTODOS DE MUESTREO
PROBABILISTICO
Métodos de Muestreo
Muestra Aleatoria. Es una muestra seleccionada de
tal forma que cada integrante de una población que
está siendo estudiada tiene la misma probabilidad de
ser incluida en la muestra

• No hay un mejor método para seleccionar una


muestra aleatoria de una población de interés. El
método utilizado dependerá de las características
de la población. Sin embargo, todos los métodos de
muestreo aleatorios tienen una meta similar, dar la
misma oportunidad a todos los elementos de la
población de ser incluidos en la muestra.
Muestreo Aleatorio Simple
Muestro aleatorio simple es cuando una muestra es
formulada de tal manera que cada elemento en la
población tiene la misma oportunidad de ser incluido.
• Una forma podría ser escribir en tarjetas los nombres de los
elementos de la población y ponerlos en una caja, si la
muestra fuera de 10 elementos, entonces sacamos diez
tarjetas.
• Otra forma es usar un número que identifique a cada uno de
los integrantes de la población y seleccionar la muestra
mediante una tabla de números aleatorios. Para cada dígito
de un número la probabilidad es la misma. Entonces la
probabilidad de que el elemento 22 sea seleccionado es igual
a la del elemento 382.
Muestreo Aleatorio Simple
• Ejemplo
• En una compañía con 750 trabajadores se quiere
obtener una muestra aleatoria de 15 elementos para
un chequeo médico. Los trabajadores fueron
numerados del 1 al 750 y mediante una
tabla de números aleatorios se procedió a
seleccionarlos. El punto de arranque en la tabla se
fijó mediante la hora en ese momento, 3:04, por lo
tanto se inició en la columna 3, renglón 4. Como los
números de los trabajadores van desde 1 hasta 750
solo se toman en cuenta las primeras 3 cifras de
cada número que se encuentren en ese rango. En
seguida se muestra una parte de la tabla, con el
primer y segundo seleccionado:
Muestreo Aleatorio Simple
Tabla de números aleatorios
18893 07211 23634 75296 86155 65832 27568 31727 90756 14268 65051 52438
69553 48743 06254 73002 34432 55737 88808 11755 42537 02294 68261 73891
74762 13168 32235 57554 35551 98909 65424 11892 20410 16332 82346 30389
: 86729 67167 24091 67155 17880 31659 02868 62563 53144 17494 79513 55413
43788 87547 16648 88536 77678 37739 95434 15078 80473 71844 02765 93879
83382 59617 20074 22002 35536 98298 63522 31818 84784 39280 64191 39429

• De tal forma fueron seleccionados que la muestra


quedó integrada por los trabajadores con los
números:
240 671 178 316 28
625 531 174 554 437
166 377 150 718 27
Muestreo Aleatorio Sistemático
Muestreo aleatorio sistemático. Los elementos de la
población están ordenados de alguna forma
(alfabéticamente, fecha, o algún otro método). Un
primer artículo es seleccionado en forma aleatoria y
entonces cada n miembros de la población son
tomados para la muestra.
• Suponga que la población de interés
consiste de 2000 expedientes de un
archivo. En este método se selecciona el
primer expediente de acuerdo al método
aleatorio simple, luego como se quiere
una muestra de 100, se divide 2000 / 100
= 20, y se selecciona un expediente cada
20.
Muestreo Aleatorio Estratificado
Muestro aleatorio estratificado. Una población es
primero dividida en subgrupos llamados estratos y una
muestra es seleccionada aleatoriamente de cada estrato.
• Puede haber dos tipos de
muestreo estratificado,
proporcional y no proporcional.
Como su nombre lo indica, en
un muestreo aleatorio
estratificado proporcional, el
número de elementos de la
muestra de cada estrato tiene
la misma proporción de lo
encontrado en la población.
Muestreo Aleatorio Estratificado
• Ejemplo: Suponga que se quiere obtener una muestra
de 50 compañías para hacer un estudio sobre los
gastos en publicidad de las 352 compañías más
grandes del país. Se dividió a las compañías en 5
estratos de acuerdo a su rentabilidad.
Estrato Rentabilidad Número de firmas Porcentaje Muestra

A 30% o más 8 2 1
B 20 – 30% 35 10 5
C 10 – 20% 189 54 27
D 0 – 10% 115 33 16
E Con pérdida 5 1 1
Total 352 100 50
Muestreo Aleatorio Estratificado
• En un muestreo estratificado no proporcional, el
número de elementos estudiado en cada estrato es
desproporcionado con respecto a su número en la
población. Por ejemplo, si un muestreo no
proporcional fuese utilizado en el caso anterior, se
deberán pesar los resultados de cada estrato
multiplicándose por .02 en el estrato 1, por .10 en el
estrato 2, por .54 en el tres, etc.
• El muestro estratificado tiene la ventaja de reflejar
con más exactitud las características de la población.
Muestreo por Conglomerados
• Este método de muestro es empleado para reducir el
costo de muestrear una población cuando está
dispersa sobre una gran área geográfica. El
muestreo por bloque consiste en dividir el área
geográfica en sectores, seleccionar una muestra
aleatoria de esos sectores, y finalmente obtener una
muestra aleatoria de cada uno de los sectores
seleccionados.
Error de muestreo
• Si seleccionamos una muestra por el método de
muestreo aleatorio simple, por muestreo sistemático,
por muestreo estratificado, por muestreo por bloques
o por una combinación de estos métodos, es poco
probable que la media de la muestra sea idéntica a la
media de la población de donde fue obtenida. De la
misma forma, es probable que la desviación estándar
de la muestra no sea exactamente igual al valor
correspondiente de la población. Por lo tanto
podemos esperar alguna diferencia entre un
estadístico muestral y el correspondiente parámetro
poblacional. Esta diferencia es llamada error de
muestreo.
Error de muestreo
Error de muestreo es la diferencia entre un estadístico
muestral y su correspondiente parámetro poblacional

• Ejemplo: Una población de 5 empleados de


producción que tienen ratings de eficiencia de 97, 103,
96, 99 y 105. Una muestra de 2 ratings (97 y 105) fue
seleccionada de esa población para estimar la media
poblacional. La media de esa muestra sería 101. Otra
muestra de 2 es seleccionada (103 y 96) con una
media de 99.5. La media de todos los ratings (la media
poblacional) es igual a 100. El error de muestreo para
la primera muestra es 1 y para la segunda es -.5.
Distribución muestral de las medias
El ejemplo de los ratings de eficiencia muestra como las
medias de muestras de un tamaño específico varían de
muestra a muestra. La media de la primera muestra fue
101 y la media de la segunda fue 99.5. En una tercera
muestra probablemente resultaría una media diferente.
Si organizamos las medias de todas las posibles
muestras de tamaño 2 en una distribución de
probabilidad, obtendremos la distribución muestral de las
medias.
Distribución muestral de las medias. Es una
distribución de probabilidad de todas las posibles
medias muestrales, de un tamaño de muestra dado,
seleccionadas de una población.
Distribución muestral de las medias
• El siguiente ejemplo ilustra la construcción de una
distribución muestral de medias.
• Ejemplo: Parrilladas “Don Pepe” tiene 5 parrilleros
(población), a los cuales se les paga por hora según
su trabajo. Las percepciones de los parrilleros son
las siguientes:
Parrillero Salario por hora
Adrián $ 9.00
Bitia $ 8.00
Carmen $ 8.00
Diana $ 8.00
Enrique $ 7.00
Distribución muestral de las medias
1. ¿Cuál es la media poblacional?
2. ¿Cuál es la distribución muestral de las medias
para una muestra de tamaño 2?
3. ¿Cuál es la media de la distribución muestral?
4. ¿Qué observaciones se pueden hacer con
respecto a la población y a la distribución
muestral?
Solución.
1. La media poblacional es:
µ = (9 + 8 + 8 + 8 + 7)/5 = 8.0
Distribución muestral de las medias
1. Para construir la distribución muestral de las
medias, Las medias de todas las posibles muestras
de tamaño 2 son calculadas y son las siguientes:
Muestra Parrilleros percepciones Media de la muestra
1 A–B 9.00 8.00 8.50
2 A–C 9.00 8.00 8.50
3 A–D 9.00 8.00 8.50
4 A–E 9.00 7.00 8.00
5 B–C 8.00 8.00 8.00
6 B–D 8.00 8.00 8.00
7 B–E 8.00 7.00 7.50
8 C–D 8.00 8.00 8.00
9 C–E 8.00 7.00 7.50
10 D-E 8.00 7.00 7.50
Distribución muestral de las medias
DISTRIBUCIÓN MUESTRAL DE LAS MEDIAS
para n = 2
Media Número de Probabilidad
muestral medias
7.50 3 0.3
8.00 4 0.4
8.50 3 0.3
Σ 10 1.0
Distribución muestral de las medias
1. La media de la distribución muestral de medias es:

Los histogramas de la distribución de probabilidad


de la población y de la distribución muestral de
medias son:
Distribución muestral de las medias
Los histogramas de la distribución de probabilidad de la
población y de la distribución muestral de medias son:
Distribución muestral de las medias
1. Se pueden hacer las siguientes observaciones:
– La media de las medias muestrales es igual a la
media de la población.
– La dispersión de las medias muestrales es menor
que la dispersión en la población
– La forma de la distribución muestral presenta un
cambio respecto a la forma de la población.
Distribución muestral de las medias
Ejercicios
1.- La Señora López da a sus seis hijos “domingo”
para que se lo gasten en dulces. Las cantidades son
las siguientes:
Niño Domingo
Javier 10.00
Antonio 9.00
José 10.00
Ignacio 8.00
Adolfo 8.00
Andrés 9.00
Distribución Muestral de las Medias
1. ¿Cuántas muestras diferentes de tamaño 3 se
pueden seleccionar de esta población?
2. Construya la distribución muestral de las medias de
muestras tamaño 3.
3. Compare la media de la población con la media de
la distribución muestral
4. Compare la desviación estándar de la población con
la desviación estándar de la distribución muestral de
las medias.
5. Compare los histogramas de la población y de la
distribución muestral de las medias.
TEOREMA
DE LIMITE
CENTRAL
Teorema del Límite Central
• El tamaño de la población y el tamaño de la muestra
en los problemas anteriores son intencionalmente
pequeños para enfatizar dos conceptos: (1) La media
de las medias muestrales es exactamente la misma
que la media de la población y (2) que la forma de la
distribución de las medias muestrales no es
necesariamente igual que la forma de la distribución.
• Las siguientes gráficas corresponden al ejemplo
anterior, note como la forma de la distribución de la
población no es igual a la forma de la distribución
muestral. La distribución muestral de las medias se
aproxima mucho a una distribución normal.
Teorema del Límite Central
Teorema del Límite Central
Teorema del Límite Central
• Si la población está normalmente distribuida, la
distribución muestral de las medias también estará
normalmente distribuida. En el primer problema
(ingresos de los parrilleros) la forma de la distribución
de la población es aproximadamente normal y la
forma de la distribución muestral también es
aproximadamente normal. Estas son las bases del
teorema del límite central, uno de los más
importantes teoremas en estadísticas.
Teorema del Límite Central. Para una población con una media µ y una
varianza σ², la distribución de las medias de todas las muestras posibles de
tamaño n generadas de la población estarán distribuidas de forma
aproximadamente normal asumiendo que el tamaño de la muestra es
suficientemente grande.
Teorema del Límite Central
• Con relación al teorema del límite central debemos
enfatizar en:
• Si el tamaño de la muestra n es suficientemente
grande (n > 30) la distribución normal de las medias
será aproximadamente normal. No importa si la
población es normal, sesgada u uniforme, si la muestra
es grande el teorema se aplicará.
• La media de la población y la media de todas las
posibles muestras son iguales. Si la población es
grande y un gran número de muestras son
seleccionadas de esa población entonces la media de
las medias muestrales se aproximará a la media
poblacional.
Teorema del Límite Central
1. La desviación estándar de la distribución muestral de
las medias, a la que llamaremos error estándar, es
determinado por
Estimación Puntual

• Cuando no se conoce alguna característica de la


población, como podría ser la media, el estadístico
correspondiente de la muestra, en este caso la media
de la muestra, puede ser utilizado como estimador del
parámetro poblacional. Esta técnica estadística se
llama estimación puntual.

Estimación puntual es cuando un estadístico de la


muestra es usado para estimar un parámetro
poblacional.
Ejemplo 01:
• Se realizará un estudio sobre la
26 27 26 20 21 42 30 22
potencia de arranque en frío de
baterías o acumuladores de 12 22 21 26 9 21 22 28 26
voltios para estimar el numero
de veces que un motor con 19 16 20 32 18 23 32 28
desplazamiento de 440 plg3 21 41 19 31 21 22 16 23
arrancara antes de que falle la
batería. Una muestra de 40 30 21 37 28 39 30 21 23
dispositivos seleccionados al
azar dió los siguientes números
de arranque:
Solución:

x = ΣX = 1000 = 25 arreglos
n 40
Ejemplo 01: (sigue)
• La variancia muestral s2 y la desviacion estandar
muestral ,s se utilizan para estimar la variancia
poblacional σ2 y la desviacion estandar
poblacional , σ s Se realizará un estudio sobre la
potencia de arranque en frío de baterías o
acumuladores de 12 voltios para estimar el numero
de veces que un motor con desplazamiento de 440
plg3 arrancara antes de que falle la batería. Una
muestra de 40 dispositivos seleccionados al azar dió
los siguientes números de arranque:
Variancia de la muestra:
s =
2 Σ(xi – x) 2

n-1
Variancia de la muestra:
s= Σ(xi – x)2
n-1
En donde X representa el valor de una elemento
seleccionado para la muestra, X es la media de la
muestra , y n es el numero en la muestra.
De igual manera, la proporción de la población que está a favor
de medidas mas estrictas para la protección ambiental puede
estimarse utilizando una proporción muestral. Si p es la
proporción poblacional desconocida y p es la proporción
muestral, la estimación puntual para la proporción de la
población es:
Número de éxitos de la muestran
p= Número muestrado

X
p= n
Ejemplo: De 2000 personas muestreadas, 1600 están a favor
de medidas mas estrictas de protección ambiental. ¿Cuál es la
proporción poblacional estimada?
Solucion:

Número de éxitos de la muestran


p= Número muestrado
1600 El 80% de la población
p= = 0.80 esta a favor de
2000 medidas mas
• Ejemplo: Los siguientes datos corresponden a una
muestra aleatoria de los pesos, en kilogramos, del
equipaje personal que lleva en un vuelo un jugador de
un equipo de baloncesto:
15.4 17.7 18.6 12.7 15.0 15.9 16.3 18.1 16.8 14.1 13.6 16.3

Hacer una estimación puntual de la media poblacional


del peso promedio del equipaje de un basquetbolista.
Solución: La media de la muestra de los pesos del
equipaje de un basketbolista en un vuelo es:

La estimación puntual consiste en considerar que la


media poblacional es el valor que se obtuvo como
media de la muestra. µ = 15.87
Estimación por Intervalo
• El intervalo dentro del cual se espera que se encuentre
un parámetro poblacional usualmente es conocido como
intervalo de confianza. Por ejemplo, el intervalo de
confianza para la media poblacional es el intervalo de
valores que tiene una alta probabilidad de contener a la
media de la población.
Estimación por Intervalo. Establece el rango de valores dentro
del cual se espera que se encuentre un parámetro poblacional.
El nivel de confianza es la probabilidad de que el
parámetro poblacional se encuentre dentro del
intervalo. Los niveles de confianza más ampliamente
usados son 0.95 y 0.99, sin embargo puede usarse
cualquier probabilidad cercana a 1.
Estimación por Intervalo
Estimación por Intervalo
• Para entender mejor el concepto de intervalo de confianza
vamos a suponer que seleccionamos 100 muestras de una
población y calculamos la media de las muestras e intervalos
de confianza del 95% para cada muestra. Descubriremos que
cerca de 95 de los 100 intervalos de confianza contienen la
media poblacional.
Pasos para construir un intervalo de confianza (n>30)
• Establecer el nivel de confianza
• Determinar el valor de la variable aleatoria estándar
• Calcular los estadísticos de la muestra
• Calcular el error estándar
• Calcular el error máximo de estimación
• Determinar los límites del intervalo de confianza e
interpretar.
Estimación por Intervalo
• Ejemplo: Los resultados siguientes representan las
calificaciones de una muestra aleatoria de
calificaciones de estudiantes en estadística elemental.

23 60 79 32 57 74 52 70 82 36
80 77 81 95 41 65 92 85 55 76
52 10 64 75 78 25 80 98 81 67
41 71 83 54 64 72 88 62 74 43
60 78 89 76 84 48 84 90 15 79
34 67 17 82 69 74 63 80 85 61
Estimación por Intervalo
a) Haga un intervalo de confianza del 95% para
estimar la media poblacional
b) Haga un intervalo de confianza del 99% para
estimar la media poblacional
c) Compare los anteriores resultados
Solución del inciso (a)
Haga un intervalo de confianza del 95% para
estimar la media poblacional
1.- El nivel de confianza ya está establecido como
95%, se simboliza de la siguiente forma:
1 – α = 0.95
Estimación por Intervalo
2.- Cuando se trata de estimar la media poblacional la
variable aleatoria estándar es el valor Z de la
distribución normal, siempre y cuando la muestra sea
grande (n > 30). Como 1 – α es la probabilidad de que
la media poblacional se encuentre dentro del intervalo
(centro de la curva), α es la probabilidad de que no se
encuentre en el intervalo (extremos de la curva), y
cada extremo de la curva o cola corresponde a α/2.
En la tabla de la distribución normal se busca el valor
Z que corresponde al área de α/2 de la siguiente
manera:
Estimación por Intervalo
Estimación por Intervalo
1 – α = .95
α = 1 - .95 = .05
α/2 = .025
Se busca en la tabla nornal:

Entonces Z = 1.96 es el valor que corresponde a la


cola positiva de la curva, y Z = - 1.96 es el valor que
corresponde a la cola negativa.
Estimación por Intervalo
3.- Para estimar la media poblacional necesitamos
calcular la media y la desviación estándar de la
muestra:
Estimación por Intervalo
4.- Se calcula el error estándar, como no conocemos
el tamaño de la población se elimina la segunda parte
de la fórmula. Hacemos lo mismo si la población es
20 o más veces más grande que la muestra. Si no se
conoce σ, como en este caso, se utiliza S.

5.- Se calcula el error máximo de estimación


Estimación por Intervalo
6.- Se calculan los límites del intervalo de confianza,
restando a la media de la muestra el error maximo de
estimación se obtiene el límite inferior. Sumando a la
media de la muestra el error máximo de estimación se
obtiene el límite superior.

Este resultado se interpreta de la siguiente manera:


“Hay una probabilidad de .95 de que la calificación
media de todos los estudiantes de estadísticas, se
encuentre entre 60.13 y 70.83”.
Estimación por Intervalo
Solución del inciso (b)
Haga un intervalo de confianza del 99% para estimar
la media poblacional
1.- El nivel de confianza ya está establecido como
99%, se simboliza de la siguiente forma:
1 – α = 0.99
Estimación por Intervalo
2.- Cuando se trata de estimar la media poblacional la
variable aleatoria estándar es el valor Z de la
distribución normal, siempre y cuando la muestra sea
grande (n > 30). Como 1 – α es la probabilidad de que
la media poblacional se encuentre dentro del intervalo
(centro de la curva), α es la probabilidad de que no se
encuentre en el intervalo (extremos de la curva), y
cada extremo de la curva o cola corresponde a α/2.
En la tabla de la distribución normal se busca el valor
Z que corresponde al área de α/2 de la siguiente
manera:
Estimación por Intervalo

0.005 0.005

Z = -2.58 Z = 2.58
Estimación por Intervalo

1 – α = .99
α = 1 - .99 = .01
α/2 = .005
Se busca en la tabla nornal:

Entonces Z = 2.575 es el valor que corresponde a la


cola positiva de la curva, y Z = - 2.575 es el valor que
corresponde a la cola negativa.
Estimación por Intervalo
3.- Para estimar la media poblacional necesitamos
calcular la media y la desviación estándar de la
muestra:
Estimación por Intervalo
4.- Se calcula el error estándar, como no conocemos
el tamaño de la población se elimina la segunda
parte de la fórmula. Hacemos lo mismo si la
población es 20 o más veces más grande que la
muestra. Si no se conoce σ, como en este caso, se
utiliza S.

5.- Se calcula el error máximo de estimación


2.575 7.025
Estimación por Intervalo
6.- Se calculan los límites del intervalo de confianza,
restando a la media de la muestra el error máximo de
estimación se obtiene el límite inferior. Sumando a la
media de la muestra el error máximo de estimación se
obtiene el límite superior.

7.025 7.025 0.99

58.45 72.51 0.99


Este resultado se interpreta de la siguiente manera:
“Hay una probabilidad de 0.99 de que la
calificación media de todos los estudiantes de
estadísticas, se encuentre entre 58.45 y 72.51”.
Error estándar de la media
Error estándar de la media: Desviación estándar de la
distribución muestral de las medias muestrales

σ
σ =
x n
En donde:

σ : es el error estándar de la media


x
σ : es la desviación estándar de la población
n : es el tamaño de la muestra
Error estándar de la media
En la formula del error estándar de la media se supone
que conocida la desviación estándar de la población, σ.
Si no se conoce, y n = 30 o mayor (se considera una
muestra grande), la desviación estándar de la media,
denotada por s, sirve para aproximar la desviación
estándar de la población, σ. Entonces la formula para el
error estándar queda así:

s
s =
x n
Elaboración de los intervalos de confianza de
95% y 99% (n≥ 30)

INTERVALO DE S
CONFIANZA DE 95% = X ± 1.96
n

INTERVALO DE
S
CONFIANZA DE 99% = X ± 2.58
n
Intervalo de confianza para una
proporción de la población

INTERVALO DE p (1 - p )
CONFIANZA DE 95% = p ± 1.96
n

p (1 - p )
INTERVALO DE
= p ± 2.58
CONFIANZA DE 99%
n
Estimación por Intervalo con
muestras pequeñas (n ≤ 30)
• Para poder utilizar la distribución normal es necesario
que las muestras sean grandes (n > 30) y conocer σ.
Si no se conoce σ se utiliza S, pero si además la
muestra es chica los resultados no serán
satisfactorios. En estos casos se utiliza la
distribución t de student.
Estimación por Intervalo -
Características de t de Student

• Esta distribución fue desarrollada por William Gosset,


un trabajador de la cervecería Guinness en Irlanda,
quien la publicó utilizando el seudónimo de “Student”.
Gossett se interesó en el comportamiento del valor z
cuando se utilizaba S en vez de σ, y particularmente
en la discrepancia entre S y σ cuando S se calcula de
muestras muy pequeñas.
• En la siguiente gráfica se muestra como la
distribución t extendida que la distribución normal Z.
Estimación por Intervalo -
Características de t de Student
Estimación por Intervalo -
Características de t de Student
Las características de la distribución t son:
b) Es una distribución continua.
c) Tiene forma de campana y es simétrica.
d) Es una familia de curvas. Todas tienen la misma
media de cero, pero sus desviaciones estándar
difieren de acuerdo al tamaño de la muestra.
e) La distribución t es más baja y dispersa que la
distribución normal. Cuando el tamaño de la muestra
se incrementa, la distribución t se aproxima a la
normal.
Pasos para construir intervalos de
confianza para muestras pequeñas
Se siguen los mismos pasos de los intervalos de
confianza para muestras grandes.
Ejemplo.
Una muestra aleatoria de 12 secretarias escriben a
máquina un promedio 85.2 palabras por minuto con
una desviación estándar de 9.3 palabras por minuto.
Encuentre un intervalo de confianza de 95% para el
número promedio de palabras por minuto escritas por
todas las secretarias.
Pasos para construir intervalos de
confianza para muestras pequeñas
Solución.
1.- El nivel de confianza es 1 – α = 0.95
2.-Como la muestra es pequeña (n ≤ 30) se
determina el valor de t, para lo cual, antes se
determinan los grados de libertad Φ. El valor de α de
la tabla corresponde al área que se encuentra a la
derecha del valor positivo de t que buscamos, por lo
tanto en los intervalos de confianza sería α/2
Φ = n – 1 = 12 – 1 = 11 α/2 = 0.025
Pasos para construir intervalos de
confianza para muestras pequeñas
Φ α 0.025
11 2.20099
t = 2.20099
3.- Los estadísticos de la muestra son:
X = 85.2 S = 9.3
4.- Se calcula el error estándar
Pasos para construir intervalos de
confianza para muestras pequeñas
5.- Se calcula el error máximo de estimación

6.- El intervalo de confianza resultante es:


P( X - E ≤ µ ≤ X + E ) = 1 – α
P( 85.2 – 5.68 ≤ µ ≤ 85.2 + 5.68) = 0.95
P( 79.52 ≤ µ ≤ 90.88 ) = 0.95
Lo que quiere decir que hay una probabilidad de .95
de que la cantidad promedio de palabras por minuto
que escriben todas las secretarias se encuentre
entre 79.52 y 90.88
Intervalo de confianza para estimar una
proporción
Un intervalo de confianza para estimar una
proporción poblacional se construye de manera
similar al procedimiento usado anteriormente.
Ejemplo.
En un estudio de mercado para estimar la proporción
de amas de casa que pueden reconocer la marca de
un limpiador basándose en la forma y color del
envase. De 1400 amas de casa, solo 420 pudieron
identificar la marca. Hacer un intervalo de confianza
del 99% para estimar la proporción poblacional.
Intervalo de confianza para estimar una
proporción
1.- El nivel de confianza ya está establecido:
1 – α = 00.99
2.- Como n > 30 entonces se determina Z:
1 – α = .99
α = 1 - .99 = .01
α/2 = .005

El valor .005 no está en la tabla normal, pero debería


encontrarse entre estas dos cantidades.
Intervalo de confianza para estimar una
proporción
Z 7 ? 8
2.5 0.0051 0.005 0.0049
se procede entonces con un procedimiento
llamado interpolación, identificando la primer z
como z1 y la segunda como z2. Las áreas como
A1 y A2 respectivamente.
Z1 Z Z2
Z 7 ? 8
2.5 0.0051 0.005 0.0049
Α1 A Α2
Intervalo de confianza para estimar una
proporción

Luego se aplica la siguiente fórmula


Z=Z1 +( Z2 – Z1)(A1 - A)/ (A1 – A2)
= 2.57 +(2.58-2.57)(.00508-.005)/(.00508-.00494)
=2.5757
3.- Los estadísticos de la muestra es la proporción de
éxitos en la muestra (p) y la proporción de fracasos (q)
p =x/n =420/1400 = .3
q = 1 – p = 1 - .3 = .7
4.- Se calcula el error estándar de la proporción con la
siguiente fórmula

5.- Se calcula el error máximo de estimación


E = Z σp = (2.5757)(.0122) = .0314
6.- El intervalo que resulta es:
P( p – E ≤ p ≤ p + E) = 1 – α
P(.3 - .0314 ≤ p ≤ .3 + .0314) = .99
P(.2686 ≤ p ≤ .3314) = .99
Hay una probabilidad de .99 de que la proporción de
amas de casa que pueden identificar la marca del
limpiador se encuentre entre .2686 y .3314
Problemas
1.- Se realizó una investigación de mercado para conocer la
cantidad promedio que gasta a la semana en cigarros un
fumador. Los resultados fueron los siguientes:
131 146 71 192 159 60 158 166 155 150
177 137 99 96 296 179 171 172 177 33

a) Haga un intervalo de confianza del 96% para estimar la


cantidad promedio que gastan los fumadores (en general)
en una semana.
b) Haga un intervalo de confianza del 97% para estimar la
proporción de fumadores que gastan más de 150 pesos a la
semana
Problemas
2.- El propietario de una estación de gasolina quiere estimar
el número promedio de litros de gasolina vendida a sus
clientes. De sus registros seleccionó una muestra de 60
ventas y encontró lo siguiente:
39 32 30 22 54 27 24 29 23 42 35 21
26 35 36 39 20 25 43 34 29 21 21 30
41 27 44 45 27 33 33 36 11 33 38 24
39 28 33 27 28 31 35 37 40 32 46 37
34 40 29 32 28 25 36 23 26 24 30 34

a) Haga un intervalo de confianza del 94% para estimar el


número promedio de litros de gasolina vendida a sus
clientes
b) Haga un intervalo de confianza del 98% para estimar la
proporción de clientes que compraron más de 30 litros de
gasolina vendida.
Problemas
3.- Un maestro de español enseña en cinco diferentes grupos
de secundaria. Encargó recientemente un ensayo y contó
los errores ortográficos de cada uno de ellos:
GRUPO A
HOMBRES MUJERES

4 10 7 8 7 5 3 7 12 4 6 8 4 7 7 7 6 8 4 6

6 8 8 8 6 6 9 10 5 8 2 6 7 2 6 9 5 6 6 8

7 7 13 8 4 5 4 5 5 7
GRUPO B
HOMBRES MUJERES

2 0 3 6 9 10 9 6 5 10 8 5 4 9 7 8 8 10 6 7

8 9 5 5 8 6 10 8 5 4 6 6 5 9 4 9 3 7 5 8

9 1 11 5 3 7 8 15 8 6 7 4
Problemas
GRUPO C
HOMBRES MUJERES
8 2 6 1 5 8 9 2 7 6 6 3 11 6 7 7 1 9 6 4
4 7 10 8 5 2 7 7 6 6 6 8 6 8 4 9 2 8 1 6
7 4 9 2 8 11 2
GRUPO D
HOMBRES MUJERES
8 0 7 7 8 7 6 11 4 8 0 2 11 7 8 4 4 5 5 4
12 7 5 9 6 5 5 8 9 3 5 8 8 9 5 10 7 9 9 7
10 9 4 7 10 7
GRUPO E
HOMBRES MUJERES
4 8 11 9 4 7 8 9 8 9 2 14 1 8 6 2 7 5 9 4
4 6 4 8 6 6 5 4 7 7 9 8 7 5 6 5 8 5 9 6
7 4 7 4 7 5 6 6 8 8 8 7 6 2 6 6 7
Problemas
a) Obtenga una muestra de tamaño 15 por muestreo aleatorio
simple y haga una estimación de la media poblacional con una
confianza de 99%
b) Obtenga una muestra de tamaño 40 por muestreo aleatorio
sistemático y haga una estimación de la proporción poblacional
de estudiantes que tuvieron menos de 5 errores, con un nivel
de confianza de 93%
c) Obtenga una muestra de 50 estudiantes por muestreo aleatorio
estratificado y haga una estimación de la media poblacional
con nivel de confianza de 90%
d) ¿Cuál método de muestreo es el más apropiado para este
caso?
e) ¿De que tamaño debería ser la muestra si queremos que el
error máximo de estimación sea igual a 1?
Problemas
4.- Cierto banco encuentra que el uso de cajeros automáticos
reduce el costo de las transacciones bancarias de rutina. Este
banco instaló un cajero automático en las instalaciones de Fun
Toy Company. Este cajero es para uso exclusivo de los 500
empleados de Fun Toy Company. Después de algunos meses
de operación, se realizó un estudio sobre el uso del cajero y se
encontró lo siguiente:
NÚMERO DE VECES QUE USÓ EL CAJERO EL ÚLTIMO MES

4 2 2 3 3 3 2 1 3 5 2 3 3 1 4 1 3 4 2 2
1 4 5 1 3 3 4 2 4 3 2 1 3 3 2 3 2 1 4 5
2 2 1 3 3 3 4 2 1 3 2 1 2 2 1 3 2 2 2 1
0 2 2 0 2 1 3 1 2 1 3 2 5 2 1 3 1 0 2 2
1 4 2 3 2 1 2 2 2 4 2 2 4 1 1 1 2 1 4 2
4 2 5 2 3 1 2 4 2 1 4 1 3 1 3 1 1 4 2 5
2 3 3 1 4 3 1 2 0 4 1 1 2 2 2 1 1 2 3 3
2 3 2 3 4 2 3 3 4 3 1 2 0 3 1 3 1 2 3 2
4 3 4 1 3 4 2 2 4 2 2 1 2 2 3 3 2 4 3 4
2 2 2 2 3 2 2 3 2 2 2 0 3 2 1 2 1 2 2 2
1 4 2 3 0 3 2 1 1 2 2 3 1 2 2 5 1 1 4 2
2 2 2 3 2 3 3 2 4 1 1 2 2 2 2 3 1 2 2 2
5 0 1 2 3 1 0 2 2 1 2 3 1 2 3 0 3 5 0 1
4 2 3 0 3 0 2 1 2 2 1 2 2 4 3 2 2 4 2 3
2 2 2 4 0 2 0 2 2 4 2 3 3 1 2 0 3 2 2 2
2 3 2 2 1 3 2 1 3 2 2 3 2 1 2 2 3 2 3 2
2 0 2 2 2 2 3 3 2 3 2 2 2 2 1 2 1 2 0 2
3 1 3 3 2 2 3 2 4 1 2 3 2 2 4 3 3 3 1 3
4 2 2 1 3 2 1 1 2 4 1 3 0 3 2 2 2 4 2 2
3 3 4 1 1 2 1 1 3 2 3 4 2 1 3 3 1 3 3 4
2 2 3 3 3 3 2 3 3 2 3 3 2 2 3 3 3 2 2 3
3 3 1 1 2 0 1 0 3 4 2 2 2 2 1 2 1 3 3 1
2 3 2 2 1 3 0 2 3 2 3 1 2 2 2 2 2 2 3 2
2 2 2 2 3 2 1 1 0 3 4 3 0 2 2 3 1 2 2 2
0 2 2 2 3 1 2 0 2 2 3 2 3 5 1 1 2 0 2 2
Problemas
a) ¿Cuál es el método de muestro más apropiado para este
caso?
b) Obtenga una muestra aleatoria de 40 empleados de Fun Toy
Company y haga un intervalo de confianza del 98% para
estimar la media poblacional de las veces que usó el cajero en
el mes.
c) Obtenga una muestra de 25 empleados de Fun Toy Company y
estime la proporción poblacional de empleados que no
utilizaron el cajero en el mes con un intervalo de confianza de
96%
d) ¿De que tamaño deberá ser la muestra si el error máximo de
estimación es igual a 1?
Problemas
5.- Las estaturas en centímetros de una muestra aleatoria de 50
estudiantes universitarios son las siguientes:
179 168 163 175 173 175 176 180 175 172
168 181 173 162 174 168 178 165 175 181
180 160 166 178 175 163 163 160 181 180
168 175 171 178 182 188 171 184 170 177
175 169 185 171 168 173 177 169 181 164

a) Haga un intervalo de confianza del 98% para estimar la


media poblacional
b) Haga un intervalo de confianza del 97% para estimar la
proporción de estudiantes que miden menos de 170 cm.
c) ¿De que tamaño deberá ser la muestra si queremos que
el error máximo de estimación sea 5cm?
6.- Los siguientes datos son las calificaciones dadas a una línea
aérea, por los 250 pasajeros del vuelo Nueva York – Los
Angeles. Las calificaciones pueden ir de 0 a 10.
4 5 3 6 6 6 7 5 4 6 7
6 4 6 6 7 5 3 6 5 6 5
4 6 5 6 6 6 4 9 4 8 5
6 2 7 6 6 5 5 5 6 6 6
5 5 7 3 6 7 5 7 6 6 5
6 7 7 4 7 2 9 2 8 4 6
6 5 6 6 8 4 2 5 5 8 5
5 2 9 4 3 6 6 6 4 4 6

a) Obtenga una muestra aleatoria de 35 pasajeros y haga un intervalo de


confianza del 95% para estimar la media poblacional de las
calificaciones otorgadas por los pasajeros.
b) Obtenga una muestra de 10 pasajeros y estime con un intervalo de
confianza de 90% la proporción poblacional de pasajeros que otorgaron
una calificación reprobatoria
c) ¿De que tamaño deberá ser la muestra si el error máximo de estimación
es igual a .5?
Problemas - media poblacional
1. Una muestra de 10 hombres de una gran ciudad dio para sus
estaturas (distribución normal) una media de 1,72 m. y una
varianza de 0,13 m. Se trata de estimar un intervalo de
confianza para la media de las alturas de todos los habitantes
varones de dicha ciudad, con un coeficiente de riesgo de 5%.
2. La resistencia a la rotura, expresada en Kg., de 5 ejemplares de
cuerda, cuyos diámetros son de 0,60 cm. es de 280, 240, 270,
285, 270. Siendo el desvío poblacional igual a 23 cm, construir
un intervalo de confianza del 99%, para la resistencia media ( )
a la rotura.
3. En una muestra de 35 caballos de carrera, por estudios previos
se conoce las pulsaciones del corazón, siendo la media de 85
pulsac/min y la desviación típica de 15 pulsac/min. Hallar los
límites de confianza del 95 % y del 99 % para el aumento medio
verdadero de las pulsaciones del corazón.
Problemas - media poblacional
1. Una empresa mayorista solicita al fabricante torres de molinos
que puedan soportar vientos de 80 km./h. La empresa quiere
determinar si las torres se ajustan a esta especificación, para
ello selecciona una muestra aleatoria de 3 molinos, los que en
promedio soportan vientos de 76 km./h con un S de 2 km./h.
Estime si el valor está o no incluido en la especificación del
fabricante, con un coeficiente de riesgo del 5 %.
2. En una plantación de mandarinas se eligieron al azar 50
plantas, contándose la producción por planta, resultó en
promedio 1512 mandarinas, siendo el desvío de la población de
108 mandarinas. Se desea conocer entre que valores estará el
verdadero valor m pensando que la probabilidad de
equivocarnos es 1 cada 100 y 5 cada 100.
Problemas - media poblacional
1. La media y la desviación típica de las cargas máximas
soportadas por 60 cables son 11,09 y 0,73 toneladas,
respectivamente. Hallar los límites de confianza a) 95 % y b) 99
% para la media de las cargas máximas soportadas por los
cables de ese tipo.
2. La media y la desviación típica de los diámetros de una muestra
de 250 remaches manufacturados por una empresa, son 0,72642
y 0,00058 in, respectivamente. Hallar los límites de confianza a)
95 % y b) 99 % para el diámetro medio de los remaches allí
producidos.
3. Un nutricionista animal desea estimar el contenido vitamínico de
cierto alimento. Toma una muestra de n = 49 y se encuentra que
el contenido promedio de vitaminas por cada 100 gramos es de
12 mg y que el desvío poblacional es de 2 mg. Encontrar los
límites de confianza del 95 % para el promedio poblacional. Se
supone que la distribución del contenido vitamínico es normal.
Nº Nº
1. Las siguientes observaciones plantas parcelas
corresponden al número de plantas 12 2
nacidas en 20 parcelas en un ensayo de
13 5
sorgo llevado a cabo en un
establecimiento. En base a estos datos 14 6
hallar los límites de confianza a) de 99 % 15 4
y b) 95 % para el promedio del número 16 2
de plantas de sorgo que crecerán en
17 1
todo el establecimiento.

• Las edades al morir, para una muestra de 9 individuos


fallecidos de tuberculosis, dan una media de 49 años y una
desviación estándar de 5 años. Suponiendo normal la
distribución, hallar límites de confianza del 95 % para la media.
• Los rendimientos de 10 plantas de frutillas en un ensayo de
uniformidad fueron: 239, 176, 235, 217, 234, 216, 318, 190,
181 y 225 gr. Calcule los límites de confianza para la media
poblacional, al 95% y 99%.
1. Las larvas de algunas mariposas monarcas concentran
glucósidos cardíacos a partir de plantas de algodón, que las
hacen repugnantes para los pájaros, los cuales las evitan
después de un primer encuentro. Supóngase que las
mariposas han sido recolectadas en una localidad y que se han
medido las concentraciones de glucósidos en relación a sus
pesos. Los datos resultantes son; la media= 0,200 g. y S2=
0,012 para n= 75. Construir un intervalo de confianza del 95%
para la verdadera media de la población.
2. Supóngase que un fabricante de llantas mide en miles de
millas el período de vida de 10 llantas. Determina que = 26,68
y S2= 12. Construir un intervalo de confianza del 95% para m .
DIFERENCIA DE MEDIAS POBLACIONALES
• En un programa de salud, muchos participantes miden su progreso
mediante el tiempo que les toma correr determinada distancia. Un
predictor de este tipo lo constituye la tasa de recuperación cardíaco
(TRC). Los siguientes datos son tiempos (minutos y segundos), para
una carrera de 1,5 millas para hombres en el mes de setiembre. Los
TRC1 son los de 40 - 49 años; los TRC2 de 50 - 59 años. TRC1
Tiempos : 12,24- 12,45- 11,04- 11,22- 11,58- 8,34- 11,16- 11,52-
8,28- 12,01- 11,03- 12,01- 11,31. TRC2 Tiempos : 14,33- 10,35-
12,51- 11,28- 11,48- 14,05- 10,51- 18,50- 18,11. Construir un
intervalo del 95% para las diferencias entre las medias de las dos
poblaciones.
• Los tiempos fueron registrados de nuevo en mayo. Para el grupo
TRC1 en el mismo orden los tiempos fueron: 11,16- 12,30- 11,30-
11,06- 11,28- 8,18- 11,44- 12,02- 8,28- 11,55- 11,27- 11,31 y 11,46.
Construir un intervalo del 95% para las diferencias entre las medias
de las dos poblaciones, la del mes de setiembre y la del mes de
VARIANZA POBLACIONAL
• Se saca una muestra de 50 conejos resultando la desviación
de los pesos igual a 208 gramos.¿Entre qué valores estará la
desviación típica de la población de conejos para un nivel de
confianza del 95 % y 99 %?
• Cuatrocientas plantas de cierto híbrido de cebada, produjeron
sus primeras flores en promedio a los 70 días de plantadas,
siendo la desviación de la muestra de 6,9 días. Haga una
estimación del desvío estándar poblacional. Adoptar un
coeficiente de riesgo del 1% y del 5%.
• La desviación típica de las tensiones de ruptura de 100 cables
probados por una empresa era de 180 lb. Hallar los límites de
confianza a) 95 % y b) 99 % para la desviación típica de todos
los cables de ese tipo.
PROPORCIÓN POBLACIONAL
• Una urna contiene una proporción desconocida de fichas
rojas y blancas. Una muestra aleatoria de 60 fichas,
seleccionada con reposición indicó que el 70 % de ellas
eran rojas. Hallar los límites de confianza a) 95 % y b) 99 %
para la proporción real de fichas rojas en la urna.
• Se arroja una moneda al aire 200 veces, obteniéndose 90
veces caras. Construir un intervalo de confianza del 90%
para la verdadera probabilidad "P" de obtener cara.
Factor de corrección de población finita
• Se dice que una población con una cota superior fija es finita.
Para una población finita, donde el número total de objetos es
N y el tamaño de la muestra es n, se hace el siguiente ajuste a
los errores estándar de las medias muestrales y a las
proporciones:
• Error estándar de las medias muestrales:
Factor de corrección de población finita
• Error estándar de las proporciones de las muestras:

–Este adjuste se llama factor de corrección de población finita.


Nota: si n/N < .05, el factor de corrección de población finita se ignora.
Ejemplo:
Hay 250 familias en un pueblo. Una encuesta con 40 familias
reveló que la contribución media anual a la iglesia era de $ 450
con una desviación estándar de $ 75.00. Establecer un intervalo
de confianza de 95% para la contribución media anual.
• Solución:
• La población es finita. Se nota que la muestra
constituye mas del 5% de la población, por lo tanto se
aplica el factor de corrección finita. El intervalo de
confianza de 95% se establece de la siguiente forma.

X ±z s
n
( N - n
N - 1 )
Selección del Tamaño de la Muestra
• Para determinar el tamaño de la muestra,
necesitamos tomar en cuenta tres factores:
• Grado de Confianza: Probabilidad de que la
estimación efectuada se ajuste a la realidad. Cualquier
información que queremos recoger está distribuida
según una ley de probabilidad (Gauss o Student), así
llamamos nivel de confianza a la probabilidad de que
el intervalo construido en torno a un estadístico capte
el verdadero valor del parámetro. Es una convención
que se utilice un nivel de confianza del 95% (z=1.96),
o bien del 99% (z=2.58). Mientras más alto sea el nivel
de confianza, mayor será el tamaño de la muestra.
Selección del Tamaño de la Muestra

• Error Máximo Permisible: El error máximo


permisible, que se designa como E, es la cantidad que
se suma y/o resta de la media de la muestra, para
determinar los puntos extremos del intervalo de
confianza correspondiente. Es la cantidad de error que
tú como investigador deseas tolerar. También es la
mitad de la amplitud del intervalo de confianza
correspondiente. Un error permisible pequeño
requerirá una muestra grande, mientras uno grande
requerirá una muestra pequeña.
Selección del Tamaño de la Muestra

σx = E = 200 = 102.04
z 1.96
• El tamaño de la muestra se calcula despejando el
valor de n en la formula:

sx = s
n
Selección del Tamaño de la Muestra
• Donde:
sx es el error estándar de la muestra
s es la desviación estándar muestral
n es el tamaño de la muestra
Hasta ahora:

sx = s
n
Error total permisible Desviacion estandar de la muestra
Z desviaciones estandares Tamaño de la muestra
Selección del Tamaño de la Muestra
• Donde:
Si E representa el error total permisible.

E s
=
z n
200 s
=
1.96 n
s
102.04 =
n
Selección del Tamaño de la Muestra
• Variación de la Población: Si la población tiene una
dispersión amplia, se requiere una muestra grande. Por
otra parte si la población está concentrada (es
homogénea), el tamaño requerido de la muestra será
pequeño.
• Cuando no se conoce la desviación estándar de la
población es necesario hacer una estimación de ella.
Algunos métodos para hacer esta estimación son los
siguientes:
Selección del Tamaño de la Muestra
 El enfoque del estudio comparativo. Este se utiliza
cuando con anterioridad se ha realizado estudios
estadísticos sobre la misma población. Si los datos
obtenidos por estos estudios se consideran confiables
se puede utilizar la desviación estándar encontrada por
ellos.
 Estudio piloto. Consiste en aplicar un estudio previo a
una pequeña muestra de la población y en tomar como
DE la que se obtenga de esta pequeña muestra.
 El error estándar de la media o de la proporción.
Consiste en aplicar el procedimiento visto en el tema
anterior.
 La aproximación basada en rango. Para utilizar
este método es necesario conocer o tener una
estimación de los valores máximos y establece que,
suponiendo que la distribución es normal, dentro del
rango de + – 3 DE de la media se encuentran
prácticamente la totalidad de las observaciones de
una distribución (99.7%). De esta manera la distacia
entre el valor menor y el mayor debe ser, en teoría,
algo muy cercano a 6 DE. Se podría entonces
estimar la DE como una sexta parte del rango. Por
ejemplo supón que quieres estimar la DE de la
cantidad de cheques que expiden al mes los alumnos
de la universidad, supón que el mínimo de cheques
expedidos es de 2 y el máximo de 50, de esta
manera el rango sería de 48 (50-2). En este ejemplo
la estimación de la DE sería de 8 cheques, que se
obtiene de 48/6.
 Supóngase que se realiza un estudio piloto y se
calcula que la desviación de la s es 3000:

E s
=
z n
200 3000
=
1.96 n

n = 864.36
 Una formula de calculo mas adecuada para
determinar n es:

n= ( Z*s
E
)
 Donde:
 E es el error permisible
 Z es el desvió formal asociado al grado de
confianza seleccionado
 S es la desviación estándar de la muestra del
estudio.
 Ejemplo:
 Un estudiante de administración desea determinar la
cantidad media que perciben los empleados del
Municipio del Rimac. El error para estimar la media
es de $1,000, con un nivel de confianza del 95%. El
estudiante encuentra un informe en INEI que estima
la desviación estándar en $10,000. ¿Cuál es tamaño
requerido de la muestra?
 Solución:
• n = ((1.96*$10,000)/$1,000)2
• n = 384.16, es decir 385
• Si se desea un nivel mayor de confianza, por ejemplo
del 99%, la muestra deberá ser mayor.
• n = ((2.58*$10,000)/$1,000)2
• n = 665.64, es decir 666 (el numero de la bestia)
Selección del Tamaño de la Muestra
para Proporciones
• El procedimiento que se describe arriba se puede
adaptar para el cálculo del tamaño dela muestra para
el cálculo de una proporción. También es necesario
identificar tres criterios:
• El nivel de confianza deseado.
• El margen de error que se puede tolerar.
• Un estimado de la proporción de la población. Esta
estimación se puede obtener por los mismo métodos
de la estimación de la media, aunque cuando no se
cuenta con información es común que se utilice 0.50
Selección del Tamaño de la Muestra
para Proporciones
• La fórmula que se utiliza en este caso es la siguiente:

Donde:
n = es el tamaño de la muestra
z = es el valor estándar normal que corresponde al
nivel deseado de confianza
P = es una estimación de la proporción de la población
E = es el máximo error permisible
Selección del Tamaño de la Muestra
para Proporciones

Un ejemplo puede ser el siguiente: El estudio del


ejemplo anterior también estima la proporción de
colonias del Municipio que cuentan con servicio de
recolección de basura. El estudiante desea que la
estimación esté dentro del 10% de la proporción de la
población, el nivel deseado de confianza es de 90% y
no se dispone de una estimación para la proporción de
la población. ¿Cuál es el tamaño de la muestra
requerido?
Selección del Tamaño de la Muestra
para Proporciones
• n = (0.50)*(0.50) (1.65/0.10)2
• n = 68.06
• El estudiante necesita entonces una muestra de 69
colonias.

También podría gustarte