Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tamano de La Muestra y Disenos Muestrale
Tamano de La Muestra y Disenos Muestrale
DISEÑOS
EJERCICIOS DE
CONCEPTO TIPOS MUESTRALES DE
APLICACIÓN
USO FRECUENTE
ALEATORIO POR
SISTEMATICO ESTRATIFICADO CONGLOMERADO
SIMPLE
CALCULO DEL
TAMAÑO
MUESTRAL
ESTIMAR LA ESTIMAR LA
MEDIA PROPORCION
POBLACIONAL POBLACIONAL
1
Estadística II
3. MUESTREO
3.1. CONCEPTO
En toda investigación estadística existe un conjunto de elementos sobre los que se toma información. Este
conjunto de elementos es lo que se denota con el nombre de población (N). Cuando el investigador toma
información de todos los elementos de la población se dice que está realizando un censo. Sin embargo, esto
no es muchas veces posible. Este problema lleva al investigador a tomar la información sólo de una parte de
los elementos de la población, proceso que recibe el nombre de muestreo. El conjunto de elementos de los
que se toma información en el proceso de muestreo se llama muestra (n) y el número de elementos que la
compone tamaño muestral. Por lo tanto:
El muestreo es el proceso de selección de una parte representativa de la población que permita estimar los
parámetros de la población.
UNIDAD DE OBSERVACION.
Es el objeto sobre el cual se realiza una medición. Ésta es la unidad básica de la observación, a veces llamada
elemento. En estudios de poblaciones humanas, con frecuencia ocurre que las unidades de observación son
los individuos.
UNIDAD DE MUESTREO
Es la unidad donde realizamos la muestra.
Por ejemplo, podríamos querer estudiar a las personas, pero no tenemos una lista de todos los individuos
que pertenecen a la población. En vez de esto, las familias sirven como las unidades de muestreo y las
unidades de observación son los individuos que viven en una familia.
MARCO DE MUESTREO.
Es la lista de las unidades de muestreo.
Para las encuestas telefónicas, el marco de muestreo podría ser una lista de todos los números telefónicos
residenciales de la ciudad; para las entrevistas personales, una lista de direcciones de todas las calles; para
una encuesta de agricultura, una lista de todas las granjas o un mapa de las áreas que contienen granjas.
Hay muchas razones por las cuales el estudio de una muestra es preferible al de la totalidad de la población.
VENTAJAS DESVENTAJAS
Proporciona información confiable con Siempre conlleva a un margen de error de muestreo.
costos mucho menores que las de un Por el hecho de partir de la observación de sólo una
censo. parte de la población.
Los datos se pueden reunir más rápidos, Hacer conclusiones hacia una población mucho más
de modo que las estimaciones se pueden grande de la que originalmente se tomo la muestra.
publicar de manera programada
Las estimaciones con frecuencia son Otros errores que no son de muestreo son la Sub
mucho más precisas que las basadas en un cobertura, la carencia de respuesta y los descuidos en
censo. la recolección de datos.
Permiten inferir la realidad sin necesidad
de estar examinando a toda la población.
Estadística II
En las encuestas en que hayan de proporcionarse resultados importantes se exige la utilización del muestreo
probabilístico que permita una evaluación objetiva de los resultados. Aunque el precio de una encuesta de
este tipo es grande, siempre será menor que el que habría que pagar como consecuencia de una decisión
equivocada basada en resultados sesgados. En consecuencia a partir de esta sección solo hablaremos del
muestreo probabilístico:
Concepto.- Es Cuando todos los elementos de la población tienen la misma probabilidad de ser
seleccionados en la muestra y esta probabilidad es conocida. Este tipo de muestreo es más recomendable,
pero resulta mucho más difícil de llevarse a cabo y, por lo tanto, es más costoso.
Calculo del Tamaño de la muestra.- Con frecuencia, un investigador mide distintas variables y tiene varios
objetivos pero solo debe centrarse en una respuesta que sea de interés fundamental y utilizarlas para
estimar el tamaño muestral. Para diseñar una muestra aleatoria simple se deberá tomar en cuenta varios
aspectos relacionados con el parámetro y estimador, el error muestral, el nivel de confianza y la varianza
poblacional:
Parámetro: se refiere a la característica de la población que es objeto de estudio.
Estadística II
Nivel de Confianza 99.73% 99% 98% 96% 95.45% 95% 90% 80% 68.27%
Valores de Z 3.00 2.58 2.33 2.05 2.00 1.96 1.645 1.28 1.00
Para determinar el tamaño de la muestra depende de los parámetros que se desean estimar, es decir que
podemos estar interesados en conocer una media aritmética ( ), una proporción poblacional (p) , diferencias
de medias ( 1- 2) o una diferencia de proporciones (p1-p2). Para cada uno de los casos mencionados
anteriormente existe una determinada fórmula para determinar el tamaño de la muestra.
A continuación presentaremos fórmulas para determinar tamaño de muestra para estimar media aritmética
( ) o proporción poblacional (p) considerando muestra aleatoria simple o sistemática.
En donde:
Z: correspondiente al nivel de confianza elegido
: Desviación estándar de una variable cuantitativa
e: error máximo, N: tamaño de la población
Ejemplo1: Un medico quiere estimar el peso promedio de los recién nacidos en cierto hospital. Un estudio
anterior de diez niños mostró que la desviación estándar de sus pesos es de 150 gr. ¿Qué tan grande debe
ser una muestra para que el médico tenga el 95% de confianza de que el error de estimación es a lo más de
40 gr?
Solución:
Entonces se necesita aproximadamente una muestra de 54 recién nacidos para estimar el peso promedio con
una confianza del 95% y un error máximo de 40 gr.
Ejemplo2: Para el ejemplo anterior. ¿Cuánto seria el tamaño de muestra si se conoce que el total de recién
nacidos en cierto mes es de 200 niños?
Solución:
Para ello se utilizara la formula de tamaño de muestra cuando se conoce la población, reemplazando sería
Por lo tanto se necesita aproximadamente una muestra de 43 recién nacidos para estimar el peso promedio
con una confianza del 95% y un error máximo de 40 gr.
Estadística II
Ejemplo 01: A cuántas familias tendríamos que estudiar para conocer la preferencia del mercado en cuanto a
las marcas de shampoo para bebé, si se desconoce la población total? Asumamos los siguientes datos nivel
de confianza 95%, una precisión (error muestral) del 3% y la proporción esperada es de 5%.
Solución:
Z: 1.96 (95% de confianza)
p: 0.05 (en este caso 5%)
q=1-p=1-0.05=0.95
e: 0.03 (3% error máximo)
Se requerirá entrevistar a no menos de 203 familias para poder tener la seguridad del 95%
Ejemplo 02:¿Cómo hubiera cambiado el ejemplo 01. Anterior, si se desconoce la proporción esperada?
Solución:
Cuando se desconoce la proporción esperada, se tiene que utilizar el criterio conservador (p=q=0.5=50%)
Z: 1.96 (95% de confianza)
p: 0.5 (en este caso 50%)
q=1-p=1-0.5=0.50
e: 0.03 (3% error máximo)
Se requerirá entrevistar a no menos de 1067 familias para poder tener la seguridad del 95%
Ejemplo 03: En una muestra aleatoria de 500 familias en el distrito de Los Olivos, se encuentra que 340
familias están suscritas a Seguros Rímac. ¿Qué tan grande se requiere que sea una muestra si se quiere tener
95% de confianza de que la estimación de P esté dentro de 0.06?
Solución:
Z: 1.96 (95% de confianza)
p: 340/500=0.68 (en este caso 68%)
q=1-p=1-0.68
e: 0.06 (6% error máximo)
Entonces se necesita aproximadamente una muestra de 232 familias para estimar la proporción de suscritos
a Seguros Rímac con una confianza del 95% y un error máximo de 0.06.
Estadística II
Ejemplo 4:
Si el total de familias en el distrito es de 5000, ¿Cuánto será la muestra necesaria para estimar P?
Por lo tanto se necesita aproximadamente una muestra de 222 familias para estimar la proporción de
suscritos a Seguros Rímac con una confianza del 95% y un error máximo de 0.06.
Ejemplo 05:
Solución:
Z: 2.575 (99% de confianza)
p: 1/3=0.33
q=1-p=1-0.33
e: 0.03 (3% error máximo)
Se requerirá entrevistar a no menos de 1637 familias para poder tener la seguridad del 99%
Para seleccionar una muestra de este tipo consiste en: Enumerar las unidades de la población, desde 1 hasta
N.
Usando la tabla de números aleatorios seleccionar la 1ra unidad para la muestra.
Continuar la selección excluyendo las que se repiten. En la actualidad la generación de números aleatorios se
realiza de forma automática a través del software Excel: se utiliza la siguiente función= Aleatorio. entre
(inferior, superior).
La extracción de una muestra aleatoria simple se efectúa seleccionando una a una las n unidades. La
utilización de una tabla de números aleatorios implica un mecanismo de probabilidad muy bien diseñado, de
manera que garantiza estadísticamente la aleatoriedad de sus elementos.
Ejemplo 07
Supongamos que deseamos elegir a dos números aleatorios entre 1 y 50. Para ellos podemos utilizar pares
de números en la tabla y estos pueden ser adyacentes. Iniciemos en la fila 1, columna 5: números (99) y
ava e os a la de e ha , , ,…El 99 y el o está o p e didos e t e y 50 de manera que
se descarta, el (16) y el (41) si se eligen por estar comprendidos entre 1 y 50. Por lo tanto los elementos
elegidos serian: el 16 y el 41.
Estadística II
Estadística II
b. Usando el Excel. Ver ejemplo de aplicación en el archivo de Excel adjunto que tienen por
nombre selección y calculo muestral.
Concepto. Este muestreo exige que los elementos componentes de la población tengan un orden de
posición, por ejemplo que esté en filas, en tarjetas, o en cualquier forma ordenada.
Proceso de selección del muestreo aleatorio sistemático. Para obtener una muestra sistemática se elige una
muestra de tamaño n y sea K el siguiente entero después de dividir N/n (intervalo muestral). Luego,
determinamos un número aleatorio R entre 1 y k, el cual determina que la muestra este formada por las
unidades numeradas R, R + k, R+ k,……….., R+ (n-1)k.
Ejemplo de aplicación 01. Por ejemplo para elegir una muestra de 45 estudiantes de una lista de 45,000 que
estudian en la universidad, el intervalo de muestreo k es 1000. Supongamos que el entero aleatorio elegido
sea R=597. Entonces los estudiantes numerados como 597, 1597, 2597,…, 9 esta ía e la uest a.
Ejemplo 02. A partir de una lista de 100 establecimientos de comestibles, deseamos seleccionar una muestra
probabilística de 20 tiendas. La forma de elegir seria:
Concepto. Si la variable que nos interesa asume distintos valores promedios en diferentes subpoblaciones.
Podríamos obtener estimaciones más precisas de las cantidades de la población al tomar una muestra
aleatoria estratificada. En el siguiente grafico se puede observar el muestreo aleatorio estratificado.
Asignación óptima. De poca aplicación, cuando se toma en cuenta la proporción de cada estrato
y se conoce dispersión previsible de los resultados a través de la desviación estándar.
Proceso de selección. Extraemos una muestra independiente en cada estrato ya sea por muestreo aleatorios
simple o sistemático, posteriormente, reunimos la información para obtener las estimaciones globales de la
población.
Ejemplo de aplicación 01. Selección aleatoria en estratos de diferente tamaño de acuerdo a su peso relativo.
Ejemplo: se desea asistir a una visita en una empresa y que se beneficien los alumnos de todas las escuelas
de la UCV. Por especialidad, el número de alumnos difieren entre ellos, por lo tanto debo tomar una muestra
que refleje el peso relativo de cada especialidad.
Concepto. Las unidades que presentan agrupadas en el espacio y/o en el tiempo pueden ser consideradas
como conglomerados y pueden servir como base para un procedimiento de muestreo.
Entre el muestreo estratificado y el de conglomerados existe una diferencia fundamental que es importante
acotarla:
El muestreo estratificado se trata de que cada estrato sea lo más homogéneo posible. En cambio,
En el muestreo por conglomerados el ideal consiste en que contenga elementos de todas las
variedades que estén mezcladas como se pueda.
Ejemplo de aplicación 01. Las unidades hospitalarias, las iglesias los departamentos académicos en una
universidad, una caja de determinado producto, etc., son conglomerados naturales. También existen los
conglomerados no naturales como por ejemplo las urnas electorales. Cuando los conglomerados son áreas
geográficas suele hablarse de muestreo de áreas.
Ejemplo de aplicación 02. Un diseño muestral probabilístico estratificado y por conglomerados. En una
ciudad hay N=5000 manzanas, las manzanas se utilizan como conglomerados, es decir son unidades
muestrales de las cuales obtendremos en última instancia a nuestros sujetos-adultos. Primero se determinó
n=909 manzanas a muestrear. ¿Cómo distribuiremos las 909 manzanas según los L=4 estratos
socioeconómicos, aplicar asignación igual y proporcional?
Estadística II
Solución:
Ejemplo de Aplicación 03. Una empresa quiere saber el porcentaje de personas que demandarían sus
servicios mediante una encuesta. N=150,000 habitantes. Determinar el tamaño de la muestra con un error
+/-2% para un nivel de confianza del 95%.
TOTAL DE TOTAL DE
NUMERO DE
ASIGNACION ASIGNACION PROPORCIONAL- HOGARES- HOGARES-
ESTRATO Nº MANZANAS HOGARES-SUJETO
IGUAL-AI AP SUJETO POR SUJETO POR
POR MANZANA
ESTRATO ESTRATO
Hi Ni n/L n/N Ni*n/N n' AI AP
Solución:
Entrevistas
Ejemplo de aplicación 04. La empresa anterior considera determinante para sus servicios la distribución de la
población en cuatro barrios: Barrio I: 20,000; Barrio II: 30,000, Barrio III: 75,000 y Barrio IV: 25,000.
Determinar la muestra en cada estrato por asignación simple o igual y proporcional.
Solución:
Asignación igual. Determina 625 entrevistas a cada estrato.
La asignación proporcional. Determina 333 entrevistas para el Barrio I, 500 entrevistas para el Barrio II, 1250
entrevistas para el Barrio III y 417 entrevistas para el Barrio IV
ASIGNACION
ESTRATO POBLACION ASIGNACION PROPORCIONAL
IGUAL
Hi Ni n/L n/N Ni*n/N
1. En una muestra aleatoria de 500 familias que tienen televisores en la ciudad de Lima, se encuentra
que 340 están suscritas a HBO. ¿Qué tan grande se requiere que sea una muestra si se quiere tener
95% de confianza de que la estimación de P esté dentro de 0.02?
2. Una legisladora estatal desea encuestar a los residentes de su distrito para conocer qué proporción
del electorado conoce la opinión de ella, respecto al uso de fondos estatales para pagar abortos.
¿Qué tamaño de muestra se necesita si se requiere una confianza del 95% y un error máximo de
estimación de 0.10?
3. ¿A cuántas familias tendríamos que estudiar para conocer la preferencia del mercado en cuanto a
las marcas de shampoo para bebé, si se conoce que el número de familias con bebés en el sector de
interés es de 15,000 con un error de 1% al 95% de confianza?
6. Un biólogo quiere estimar el peso promedio de los ciervos cazados en cierta región. Un estudio
anterior de diez ciervos mostró que la desviación estándar de sus pesos es de 12.2 libras. ¿Qué tan
grande debe ser una muestra para que el biólogo tenga el 95% de confianza de que el error de
estimación es a lo más 4 libras?
7. Una empresa eléctrica fabrica focos que tienen una duración aproximadamente normal con una
desviación estándar de 40 horas.
a. ¿De qué tamaño se necesita una muestra si se desea tener 95% de confianza que la media esté
dentro de 10 horas de la media real?
b. ¿Qué pasaría si en lugar de tener un error de estimación de 10 horas solo se requiere un error de
5 horas?
c. Suponga que se tiene una población de 300 focos, y se desea saber de qué tamaño debe ser la
muestra.
1. El presidente de una fraternidad en el campus universitario desea tomar una muestra de las opiniones de
112 miembros respecto a las actividades urgentes para el otoño
b. ¿cuál es la población?
_________________________________________________________
c. ¿Cuál es la mejor forma en qué debe tomarse la muestra?
_________________________________________________________
Estadística II
2. Se desea realizar una evaluación de los principales problemas detectados en el campus universitario:
Identifique la población y el tipo de muestreo que aplicaría. ¿Por qué? Responda en cada caso
Población: ___________________________________________________
Porque: ____________________________________________________
Población: ___________________________________________________
Porque: ____________________________________________________
Población: ___________________________________________________
Porque: ____________________________________________________
D. Vocación profesional.
Población: ___________________________________________________
Porque: ____________________________________________________
3. El censo del 2007 se muestra que en Jauja el 11.5% de los residentes tienen más de 60 años. Para verificar
un sistema de muestreo por teléfono se llaman a 200 residencias elegidas al azar. De los residentes
contactados, 10.2% tenían más de 60 años.
4. En el año 2006 la Universidad Cesar Vallejo tiene 5 453 estudiantes, en la tabla se muestra un detalle de
la composición. Necesitamos una muestra de tamaño n=20 de la población de estudiantes.
Sexo
MUJERES HOMBRES TOTAL
Nivel
Pregrado 2461 2848 5309
Postgrado 67 77 144
Total 2528 2925 5453
Elija muestras de tamaño 20 para 2 tipos de muestreo: (en cada alternativa use la tabla aleatoria,
empiece en la fila 3 y columna 4)
5. Supongamos que necesitamos seleccionar a 4 integrantes del programa de televisión "Gana con la
Estadística" de Abril del 2010. Calcule muestras de tamaño n=4 usando los distintos diseños muestrales
(tipos de selección) (muestreo aleatorio simple y muestreo estratificado). En cada alternativa, use la tabla
de números aleatorios (Excel), empiece en la fila 3 columna 3.
6. Suponga que nuestra población de interés es el comité de estudiantes de la UCV para efectos de
colaboración con la universidad en agosto del 2008. Juan Pérez, Miguel Cornejo, Juana Olivares, Lucia
Galán, Edwin Manrique, Angélica Mariño, Carlos Enciso, Julia Salinas, Manuela Enrico, Sonia Oquendo,
Ángel Bravo, Luis Alba, Abel Vivar, Carla Espinosa, Marcelo Oyarte, Elba Aguilar, Ernesto Aguirre,
Francisco Alama. (En cada alternativa use la tabla aleatoria, empiece en la fila 4 y columna 2)
A. Si nos interesa estudiar la proporción de mujeres en esta población. Elija una muestra aleatoria
simple de tamaño n=4 de esta población.
B. Indique cuál es el parámetro y el estadístico en (a)
C. Elija una muestra estratificada por sexo de tamaño n=4 de esta población
7. La Facultad de Administración de la Universidad Cesar Vallejo, quiere saber acerca del ingreso promedio
de sus estudiantes y para esto envía cartas a todos los Estudiantes desde su ingreso a la Universidad en el
año 2006. En la Encuesta había sólo una pregunta: ¿Cuál es el ingreso promedio en su hogar?
Aproximadamente 30% de los alumnos respondieron.
Comente los posibles sesgos acerca del salario promedio de los estudiantes de Administración. ¿Cómo
debe ser el ingreso promedio entre los que respondieron y los que no respondieron?
Estadística II
9. Una organización estudiantil quiere saber si a los estudiantes le interesa cambiar el horario de atención
de la biblioteca. Selecciona al azar 100 estudiantes de primer año, 100 de segundo, y 100 estudiantes que
egresarán este año. ¿Qué tipo de diseño muestral es éste?
10. Un profesor quiere investigar sobre el tiempo diario de estudio de 20 estudiantes de una clase
En cada alternativa, use la tabla de números aleatorios, empiece en la fila 1 columna 1 y continúe
seleccionando hacia la derecha.
a) Elija una muestra aleatoria simple de tamaño n=4 de esta población.
b) Calcule el Parámetro y el Estadístico en (a).
c) Elija una muestra estratificada de tamaño n=4 por sexo de esta población
d) Calcule el estadístico en (c)
11. Una compañía de marketing saca una muestra de la guía de teléfonos tomando 10 personas cuyos
apellidos comiencen con letra A, 10 personas cuyos apellidos comiencen con la letra B, y así
sucesivamente con cada letra del alfabeto, para una muestra total de 260 personas.