Diseño de Muestras

3. - C Á L C UL O S DE TA MA Ñ O DE MUES TR A Y ER R O R ES DE ES TI MA C I Ó N …

PROFESORA: BERTA TEITELBOIM MÉTODOS CUANTITATIVOS PARA LA INVESTIGACIÓN SOCIAL FACULTAD DE CIENCIAS SOCIALES E HISTORIA UNIVERSIDAD DIEGO PORTALES SEPTIEMBRE 2012

1

Tamaño de muestra Muestreo aleatorio simple

¿Cómo determinar el tamaño de la muestra?

Criterios financieros, estadísticos y gerenciales Mas grande, más cuesta Mas grande, más preciso ¿Qué tan grande es grande?

2

1

1.- Determinación del tamaño Factores de análisis que influyen

Objeto del Estudio- Necesidades de análisis estadístico (Población necesaria para analizar subgrupos) Tamaño de la población objetivo (si es finita). Por su intervalo de confianza
Precisión Variabilidad Nivel de significancia
3

INTERVALO DE CONFIANZA
Intervalo de Confianza (IC): Rango de valores que tiene una cierta probabilidad conocida de contener el verdadero valor del parámetro de la población.

Nivel de Confianza: es la probabilidad 1- α , que es la proporción de veces que el intervalo de confianza realmente contiene el parámetro de población.

Los intervalos de confianza se construyen con tres elementos: 1. el estimador puntual (la media o la proporción de la muestra), 2. un cierto nivel de confianza (que depende de z) y 3. el error estándar del estimador (error estándar de la media o proporción).

2

Nivel de confianza = 100*(1. Va a depender de la precisión deseada en la estimación.NIVEL DE CONFIANZA El nivel de confianza lo elige el investigador. 95% o 99%.1 Intervalo de Confianza para una proporción El Intervalo de confianza para una proporción es: Desviación estandar de la estimación de la proporción:DS(p) ˆ IC : p ± Z (1 − α ) * 2 ˆ ˆ p * (1 − p ) n 3 . Generalmente es 90%.α)% Nivel de significación = α% 1.

1 60 50 40 30 20 10 58. Construya un intervalo de confianza del 95% para la proporción de chilenos que confía en la Iglesia Católica EVOLUCIÓN DE LA CONFIANZA EN LAS INSTITUCIONES ¿Cuánta confianza tiene usted en las instituciones que le voy a nombrar? % MENCIONES “BASTANTE + MUCHO”.5 Carabineros 2009 Gobierno 2010 Grandes Empresas 2011 (BASE: TOTAL MUESTRA) 0 2008 4 .0 16.6 27.1% de los entrevistados confía en la Iglesia Católica .1 42.7 Iglesia Católica 25.300 personas indican que el 24. COMPARACIÓN 2008 .3 43.1 21.2011 70 59.9 38.Intervalo de Confianza para una proporción Ejemplo: Los resultados de una encuesta UDP aplicada a 1.8 47.6 47.9 24.2 27.4 32.4 23.9 54.

241 ± 1 .4 23. COMPARACIÓN 2008 .1%. 241 * 0 .229.7 Iglesia Católica 25.9 38.253) 5 .8 47.EVOLUCIÓN DE LA CONFIANZA EN LAS INSTITUCIONES ¿Cuánta confianza tiene usted en las instituciones que le voy a nombrar? % MENCIONES “BASTANTE + MUCHO”.9 54.6 47.1 60 50 40 30 20 10 58.0 16. la muestra es de 1300 personas.1 21.6 27.1 42.9 24.3 43.96 * 0 . IC ˆ : p ± Z (1 − α 2 ) * ˆ p * (1 − n ˆ p ) IC : 0 . 759 1300 (0. El % de personas que está de acuerdo con esta afirmación es 24.2011 70 59.4 32.5 Carabineros 2009 Gobierno 2010 Grandes Empresas 2011 (BASE: TOTAL MUESTRA) 0 2008 Intervalo de Confianza para una proporción Ejemplo Calculo del intervalo de confianza (95%) para la proporción de chilenos que confía en la Iglesia Católica.2 27.

1.1% de los entrevistados confía en la Iglesia Católica ¿Cuál es el error de estimación? (Se asume un nivel de confianza del 95%).232 *100) = 2. e = z 1− α 2 * p * (1 − p ) n El error en el caso de estimación de proporciones se expresa en porcentaje Error máximo y tamaño de la muestra Ejemplo En una muestra de 1.96 * = 0.2 Error máximo de la muestra para estimación de proporciones El error máximo de estimación nos indica el mayor error que podemos cometer por predecir la proporción poblacional con una proporción muestral.32% n 1300 1− α 2 Para reducir el error muestral hay que aumentar la muestra 12 6 . e=Z * p * (1 − p) .0232 = (0.759 = 1.241* . 24.300 hogares.

241* . n = 5200 e=Z 1− α 2 * p * (1 − p) .16% n 5200 Para reducir el error muestral a la mitad hay que cuadriplicar la muestra 1.96 * = 0.0116 = 1.759 = 1.Error máximo y tamaño de la muestra Ejemplo 13 Si aumentamos la muestra en cuatro veces.3 Tamaño de la muestra para estimación de proporciones Despejando la formula anterior se puede obtener el tamaño de la muestra : n = p * (1 − p ) * z e 2 2 1− α 2 Se debe fijar antes el error “e” 7 .

determinar el tamaño de la muestra.1%. 759 ) * ( 1 . n = p * (1 − p ) * z 2 1 − α e2 2 ( 0 .Ejemplo 1. 241 * 0 . manteniendo un nivel de confianza de 95% y un margen de error de 5%? 8 . 96 ) 2 n = = 1 .3%.5 Ejemplo 1 ¿De qué tamaño debe tomarse la muestra si no hay antecedentes.4 ¿Cuándo no se conoce p ? Se sustituye el valor por el caso más desfavorable (máxima varianza) Ocurre cuando p = 1-p. se sabe que la proporción de hogares que confía en la Iglesia es 24. si se desea obtener un error muestral máximo de 2. 0232 ) 2 1. 300 ( 0 . Utilizando el mismo ejemplo. sólo sucede cuando p=0.

02 ) 2 2 Tomado de: Manual de Muestreo poblacional. 05 ) 2 ( 1 .2 0.Tamaño de muestra para diferentes P manteniendo constantes una precisión de 0. 96 ) (. 1 )(.5 0. 7 ) ( 0 . 02 ) 2 2 Tamaño de la muestra (n´) 0.05 y un nivel de confianza del 95% P 0. 6 ) ( 0 . 4 )(. 96 ) 2 (.02 ) 2 2 n= n = (1 . 05 ) 2 ( 1 .2 0. 96 ) 2 (.5 Q 0. 8 )(.3 0. OPS. 05 ) 2 5 ) Tamaño de muestra para diferentes P manteniendo constantes una precisión de 0.5 Tamaño de la muestra (n´) 138 246 323 369 384 n = n = ( 1 . 96 ) (. 1 )(. 02 ) 2 n= (1 .5 0.8 0. 5 ) ( 0 .9 0.6 0. 96 ) 2 (. 2 )(. 3 )(. OMS 9 . 9 ) ( 0 . 05 ) 2 ( 1 .9 0. 96 ) 2 (. 8 ) ( 0 . 7 ) ( 0 . 3 )(. ( 0 .02 y un nivel de confianza del 95% P Q Cálculo del tamaño de muestra n= (1 .1 0. 96 ) 2 (. 96 ) 2 (.3 0. 02 ) 2 2 ( 1 .4 0. 5 )(. 05 ) 2 n = n = n = ( 1 .8 . 9 ) ( 0 .2 n´= 96 n´= 1537 n´= 2017 n´= 2401 n´= 1537 n= (1 . 8 ) ( 0 . 5 )(. 96 ) (.96 ) (.7 0. 2 )(.8 0.1 0. 2 ) ( 0 .7 0. Centro Panamericano de Ecología Humana y Salud.

02.Tamaño de muestra para diferentes niveles de confianza manteniendo constantes la precisión de 0.35)(. 65 ) ( 0 .5 Población de tamaño N “finita” Si el universo no es infinito.65) ( 0.000).35 y la q = 0.96 ) (.02 ) 2 2 n= ( 2 ) (.02 ) 2 2 Tamaño de la muestra (n´) 90% 95% 95.45% 98% 99% 1.33 2. 35 )(. influye el tamaño de éste y se debe usar un factor de corrección (algunos autores señalan que basta con 10.0 2. 02 ) 2 2 n= ( 2 . N menor de 100.65. Nivel de confianza Valor de Z Cálculo del tamaño de muestra n= (1.96 2. OPS.000. 35 )(. 35 )(. 02 ) 2 2 n= ( 2 . la P=0. 65 ) ( 0 . 65 ) ( 0 .645 1. 02 ) 2 2 Tomado de: Manual de Muestreo poblacional. 575 ) (.575 n´= 1540 n´= 2185 n´= 2275 n´= 3088 n´= 3772 n= (1 . 35 )(. Factor de corrección = n = ( n0 ) n0 1+ N 20 10 . 65 ) ( 0 . 33 ) (. OMS 19 1.645) (. Centro Panamericano de Ecología Humana y Salud.

05). Calcule el tamaño mínimo de la muestra 22 11 .Población de tamaño N “finita” tamaño de 21 muestra la n n=( 0 ) n 1+ 0 N donde : n0 = p * (1 − p ) * Z 21− α e 2 2 Corrección para población finita Ejemplo Ejemplo. el nivel de confianza con el que se quiere trabajar es del 95% y el error máximo de estimación es de 5% (0. Consideremos el estudio que se quiere realizar para estimar el porcentaje o proporción de alumnos fumadores en la Facultad de Ingeniería. La facultad tiene 4000 alumnos.

se utilizará el mismo nivel de confiamza (95%) y el error máximo de estimación es de 5% (0. El total de alumnos de esta carrera es 400.Ejemplo.05) 2 n0 385 ) = 385 /(1 + ) = 351.16 = = 196. La facultad tiene 4000 alumnos.05). Ahora se quiere realizar el mismo estudio en la Facultad de Ciencias Sociales. Calcule el tamaño mínimo de la muestra n0 ) n0 1+ N Z 21−α E2 n=( n0 = p * (1 − p ) * 2 n≥ 385 384.2 se aproxima a 352 N 4000 23 Población de tamaño N “finita” 24 Ejemplo. Calcule el tamaño mínimo de la muestra n 1 + n = ( 0 n 0 N ) donde : n0 = p * (1 − p ) * Z 21− α E 2 2 n0 = p * (1 − p) * n = n0 /(1 + Z 21−α E2 2 = 0.96 = 385 (0.9579 12 . el nivel de confianza con el que se quiere trabajar es del 95% y el error máximo de estimación es de 5% (0.5 * (1 − 0. (1 + 385 / 400) ) 1.96 *1.2 ≈ 197. Consideremos el estudio que se quiere realizar para estimar el porcentaje o proporción de alumnos fumadores en la Facultad de Ingeniería.05).5) * 1.

La facultad tiene 4000 alumnos.6 Población de tamaño N “finita” Error máximo de estimación 25 Error muestral “e” al estimar una proporción “p” de una muestra de tamaño n tomada desde una población de tamaño “N” e=Z 1− α 2 * 1− n N p * (1 − p ) n N= Tamaño de la población n= Tamaño de la muestra p= proporción del atributo e= Error máximo Z= Valor del coeficiente de confianza alfa Corrección para población finita f= n = Fracción Muestreo de N Ejemplo: Ejemplo. Calcule el error máximo de estimación. 26 13 .1. Consideremos el estudio que se quiere realizar para estimar el porcentaje o proporción de alumnos fumadores en la Facultad de Ingeniería. el nivel de confianza con el que se quiere trabajar es del 95% y tamaño de la muestra es de 352 alumnos.

39 28 14 .1.superior. ANALIZAR EXPLORAR Error=L.86-8. 7 Error de la muestra cuando la variable es cuantitativa 27 El Intervalo de confianza para la media de la población es: e= Error máximo IC : x ± Z (1 − α ) * 2 s n e = Z 1− α 2 * s n n= Tamaño de la muestra x= promedio muestral s= desviación estandar Z= Valor del coeficiente de confianza alfa Lo podemos calcular en el computador.Y en general.47=0.media 8. Ejemplo: Calcular el error muestral de la pregunta 92. con su vida actualmente? En SPSS elegimos.11 del cuestionario UDP: P92_11. ¿cuán satisfecho está Ud..

se ha decidido hacer un muestreo aleatorio simple. de estudios anteriores se sabe que la desviación estándar es de 5 lt. consumidos debe ser como máximo 0.5 lts. para determinar el consumo medio de bencina por semana. El error máximo para la media de lts. 30 15 ..8 Tamaño de la muestra cuando el estimador corresponde a un promedio 29 (la variable a medir es cuantitativa) n =Z 2 1− α 2 * s2 e 2 n= Tamaño de la muestra s= Desviación estándar e= Error máximo s2 = ∑ ( xi − x ) 2 n −1 Z= Valor del coeficiente de confianza alfa Ejemplo En la comuna de “La Florida”. Determine el tamaño muestral necesario si el nivel de confianza es 95%.1.

96 2 1− α 2 * s e 2 n = (1. e= 0.31 n =Z s= 5 lt. Z= 1.2 ≈ 385 1.96) 2 * 52 (0.5) 2 = 384.9 Tamaño de la muestra cuando el estimador (la variable a medir es cuantitativa) Corrección para población finita n = ( 1 donde n s 0 corresponde 32 un promedio a n + : = = s 2 0 n N ) 0 Z * ( x i 2 1 − 2 α 2 E 2 ∑ − x ) n − 1 2 16 .5 lt.

el error máximo para la media de lts. se ha decidido hacer un muestreo aleatorio simple. El número de viviendas es 5..96) 2 (0. 33 Ejemplo34 respuesta n = ( n 0 n0 1 + N donde : n s 0 2 ) n0 = s 2 * 2 1− 2 Z 21− α e 2 2 = (5) 2 * (1. Determine el tamaño muestral necesario si el nivel de confianza es 95%.000. consumidos debe ser como máximo 0.Ejemplo En un barrio de la comuna de “La Florida”.5) 2 = 385 = s = 2 Z * α 2 2 n=( ∑ e (xi − x ) n − 1 n0 385 )= = 358 n0 1 + 385 / 5000 1+ N 17 . de estudios anteriores se sabe que la desviación estándar es de 5 lt. para determinar el consumo medio de bencina por semana.5 lts.

Otras medidas: Coeficiente de Variación El error muestral se puede definir en forma relativa a partir del Coeficiente de Variación (CV). Metodología Encuesta de Empleo. abril 2010 18 . ) ds( p) CV = ) p CV = ds( x ) x ) DS ( p ) = p (1 − p ) n Para la media 35 CV: Coeficiente de variación ) ) DS( p) CV( p) = ) *100 p El cual generalmente se expresa en %. De esta manera es más fácil interpretar el error de muestreo. en base a una escala establecida (*): •Si CV < 5% • 5% <CV < 15% •15 % < CV < 25% •> 25% Muy buena precisión Buena precisión Aceptable Mala precisión 36 (*)Fuente: INE.

repasaremos el calculo De los errores muestrales en base a los intervalos de confianza: Analizar “Muestras complejas” a) Se entra a Asistente de Muestreo y se marca “Preparación para el análisis” b) Se debe presionar la opción “Crear un archivo del plan” presionamos “examinar” y le damos nombre a nuestro plan de muestreo “plan_muestreo_ villa”. En la pantalla resultados veremos lo siguiente: 38 19 . 37 d) En las próximas 2 pantallas marcamos la tecla “siguiente”. e) Nos va a parecer el resumen del diseño y luego presionamos “Finalizar”.Utilizando nuevamente Muestras Complejas. c) En la etapa 1: marcamos la variable “ponderación muestral.

Para Analizar los datos: a) Analizar “Muestras complejas” b) Se debe indicar el nombre del archivo con el plan (Fue definido en la etapa anterior) c) Se pide “Frecuencia” – var. 39 Si necesito análisis descriptivo: a) Analizar “Muestras complejas” b) b) Se debe indicar el nombre del archivo con el plan (Fue definido en la etapa anterior) c) Se pide “Descriptivo” – var. Categórica o “Descriptivo” – var. (nº de personas e ingresos) d) Y elegimos los “Estadísticos” que deseamos obtener. 40 20 . Cuantitativa. d) Y elegimos los “Estadísticos” que deseamos obtener. Cuantitativa.

41 Ejemplo: Utilizaremos ahora la muestra de la encuesta UDP 2011 Calcularemos el IC para la preg.Ejemplo: Archivo “Poperty.1 a p20.asses-cs”: corresponde a los datos de 11.6 20 PASE TARJETA “20”. Siendo 1 “Muy Mal” y 7 “Muy Bien”. ¿cómo evaluaría el desempeño de las siguientes autoridades e instituciones en los escándalos de abuso sexual que involucra a representantes de la Iglesia Católica? MUY MAL LEA: 1) 2) 3) 4) 5) 6) CARDENAL ERRÀZURIZ CARDENAL MEDINA EL ARZOBISPO DE SANTIAGO RICARDO EZZATI LOS TRIBUNALES DE JUSTICIA LOS MEDIOS DE COMUNICACIÓN EL VATICANO 1 1 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 3 3 3 3 4 4 4 4 4 4 4 5 5 5 5 5 5 5 MUY BIEN 6 6 6 6 6 6 6 7 7 7 7 7 7 7 NS/NC 9 9 9 9 9 9 42 21 . 20.000 viviendas Construir una muestra aleatoria simple de 600 casos Luego calcular frecuencias y promedios con sus respectivos intervalos de confianza.

Los subgrupos que se desean realizar (genero.). si hay o no discriminación hacia los mapuches en Chile en…? PASE TARJETA “60”. ¿Podría decirme Ud. El error de estimación. 44 22 . tramos de edad.y para la pregunta 60 En una escala de 1 a 7 donde 1 es “No hay discriminación” y 7 es “hay mucha discriminación”. se debe considerar además del costo: El nivel de confianza. etc. LEER SEGÚN ROTACION 1) LA ESCUELA/COLEGIO 2) EL TRABAJO 3) EL TRATO DE CARABINEROS 4) LOS TRIBUNALES DE JUSTICIA 5) LA MUNICIPALIDAD 6) 7) 8) 9) No hay discriminación 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 5 5 5 5 5 5 5 5 5 Hay mucha discriminación 6 6 6 6 6 6 6 6 6 7 7 7 7 7 7 7 7 7 NS/NC 9 9 9 9 9 9 9 9 9 LOS MEDIOS DE COMUNICACIÓN LAS FUERZAS ARMADAS LOS PARTIDOS POLÍTICOS LOS HOSPITALES 43 En resumen: Para definir el tamaño de la muestra.

Ejemplo: Encuesta de Empleo (INE)(pag. 58) 45 46 23 .

(2004) Investigación de Mercados. Edición. 2 MALHOTRA NARESH K.47 Bibliografía LOHR S. Thomson 1ª. (2000): Muestreo: diseño y análisis. 4th Edition. 11. México. Prentice Hall Ed. L. Muestreo). Cap. 48 24 . (cap.

Sign up to vote on this title
UsefulNot useful