Diseño de Muestras

3. - C Á L C UL O S DE TA MA Ñ O DE MUES TR A Y ER R O R ES DE ES TI MA C I Ó N …

PROFESORA: BERTA TEITELBOIM MÉTODOS CUANTITATIVOS PARA LA INVESTIGACIÓN SOCIAL FACULTAD DE CIENCIAS SOCIALES E HISTORIA UNIVERSIDAD DIEGO PORTALES SEPTIEMBRE 2012

1

Tamaño de muestra Muestreo aleatorio simple

¿Cómo determinar el tamaño de la muestra?

Criterios financieros, estadísticos y gerenciales Mas grande, más cuesta Mas grande, más preciso ¿Qué tan grande es grande?

2

1

1.- Determinación del tamaño Factores de análisis que influyen

Objeto del Estudio- Necesidades de análisis estadístico (Población necesaria para analizar subgrupos) Tamaño de la población objetivo (si es finita). Por su intervalo de confianza
Precisión Variabilidad Nivel de significancia
3

INTERVALO DE CONFIANZA
Intervalo de Confianza (IC): Rango de valores que tiene una cierta probabilidad conocida de contener el verdadero valor del parámetro de la población.

Nivel de Confianza: es la probabilidad 1- α , que es la proporción de veces que el intervalo de confianza realmente contiene el parámetro de población.

Los intervalos de confianza se construyen con tres elementos: 1. el estimador puntual (la media o la proporción de la muestra), 2. un cierto nivel de confianza (que depende de z) y 3. el error estándar del estimador (error estándar de la media o proporción).

2

Va a depender de la precisión deseada en la estimación.NIVEL DE CONFIANZA El nivel de confianza lo elige el investigador. Generalmente es 90%. Nivel de confianza = 100*(1.1 Intervalo de Confianza para una proporción El Intervalo de confianza para una proporción es: Desviación estandar de la estimación de la proporción:DS(p) ˆ IC : p ± Z (1 − α ) * 2 ˆ ˆ p * (1 − p ) n 3 . 95% o 99%.α)% Nivel de significación = α% 1.

1% de los entrevistados confía en la Iglesia Católica .300 personas indican que el 24.Intervalo de Confianza para una proporción Ejemplo: Los resultados de una encuesta UDP aplicada a 1.2011 70 59. Construya un intervalo de confianza del 95% para la proporción de chilenos que confía en la Iglesia Católica EVOLUCIÓN DE LA CONFIANZA EN LAS INSTITUCIONES ¿Cuánta confianza tiene usted en las instituciones que le voy a nombrar? % MENCIONES “BASTANTE + MUCHO”.1 42.9 38.1 21.3 43.6 47.4 32.1 60 50 40 30 20 10 58.4 23.6 27.9 54.0 16.9 24.7 Iglesia Católica 25.2 27.5 Carabineros 2009 Gobierno 2010 Grandes Empresas 2011 (BASE: TOTAL MUESTRA) 0 2008 4 .8 47. COMPARACIÓN 2008 .

1%.4 23.6 47. 241 * 0 . IC ˆ : p ± Z (1 − α 2 ) * ˆ p * (1 − n ˆ p ) IC : 0 .2 27. COMPARACIÓN 2008 .4 32.1 60 50 40 30 20 10 58.9 38.1 42. la muestra es de 1300 personas.2011 70 59.229.96 * 0 .9 24.7 Iglesia Católica 25.5 Carabineros 2009 Gobierno 2010 Grandes Empresas 2011 (BASE: TOTAL MUESTRA) 0 2008 Intervalo de Confianza para una proporción Ejemplo Calculo del intervalo de confianza (95%) para la proporción de chilenos que confía en la Iglesia Católica. 241 ± 1 .3 43.253) 5 .6 27.9 54.8 47. 759 1300 (0. El % de personas que está de acuerdo con esta afirmación es 24.0 16.EVOLUCIÓN DE LA CONFIANZA EN LAS INSTITUCIONES ¿Cuánta confianza tiene usted en las instituciones que le voy a nombrar? % MENCIONES “BASTANTE + MUCHO”.1 21.

24.1% de los entrevistados confía en la Iglesia Católica ¿Cuál es el error de estimación? (Se asume un nivel de confianza del 95%).2 Error máximo de la muestra para estimación de proporciones El error máximo de estimación nos indica el mayor error que podemos cometer por predecir la proporción poblacional con una proporción muestral.232 *100) = 2.0232 = (0.759 = 1.32% n 1300 1− α 2 Para reducir el error muestral hay que aumentar la muestra 12 6 .300 hogares.241* . e=Z * p * (1 − p) .1. e = z 1− α 2 * p * (1 − p ) n El error en el caso de estimación de proporciones se expresa en porcentaje Error máximo y tamaño de la muestra Ejemplo En una muestra de 1.96 * = 0.

0116 = 1.241* . n = 5200 e=Z 1− α 2 * p * (1 − p) .3 Tamaño de la muestra para estimación de proporciones Despejando la formula anterior se puede obtener el tamaño de la muestra : n = p * (1 − p ) * z e 2 2 1− α 2 Se debe fijar antes el error “e” 7 .Error máximo y tamaño de la muestra Ejemplo 13 Si aumentamos la muestra en cuatro veces.16% n 5200 Para reducir el error muestral a la mitad hay que cuadriplicar la muestra 1.759 = 1.96 * = 0.

3%.4 ¿Cuándo no se conoce p ? Se sustituye el valor por el caso más desfavorable (máxima varianza) Ocurre cuando p = 1-p.1%. 300 ( 0 . manteniendo un nivel de confianza de 95% y un margen de error de 5%? 8 . se sabe que la proporción de hogares que confía en la Iglesia es 24. 241 * 0 . determinar el tamaño de la muestra. 759 ) * ( 1 . 0232 ) 2 1. sólo sucede cuando p=0. si se desea obtener un error muestral máximo de 2. n = p * (1 − p ) * z 2 1 − α e2 2 ( 0 .5 Ejemplo 1 ¿De qué tamaño debe tomarse la muestra si no hay antecedentes.Ejemplo 1. 96 ) 2 n = = 1 . Utilizando el mismo ejemplo.

2 0.Tamaño de muestra para diferentes P manteniendo constantes una precisión de 0. 02 ) 2 2 ( 1 . ( 0 .05 y un nivel de confianza del 95% P 0. 5 ) ( 0 .8 . 96 ) 2 (. 05 ) 2 5 ) Tamaño de muestra para diferentes P manteniendo constantes una precisión de 0. 02 ) 2 2 Tamaño de la muestra (n´) 0. 2 )(. 7 ) ( 0 . 05 ) 2 ( 1 .4 0.7 0.5 Q 0. 96 ) 2 (. 8 ) ( 0 . Centro Panamericano de Ecología Humana y Salud. 5 )(.9 0. 96 ) 2 (. 96 ) (. 05 ) 2 n = n = n = ( 1 .1 0. 6 ) ( 0 .2 n´= 96 n´= 1537 n´= 2017 n´= 2401 n´= 1537 n= (1 .1 0.2 0.3 0. 96 ) 2 (.02 ) 2 2 n= n = (1 . 3 )(. 96 ) 2 (. 96 ) (. 5 )(. 7 ) ( 0 . 1 )(. 2 )(.5 Tamaño de la muestra (n´) 138 246 323 369 384 n = n = ( 1 . 05 ) 2 ( 1 . 3 )(.02 y un nivel de confianza del 95% P Q Cálculo del tamaño de muestra n= (1 .7 0. OPS. OMS 9 .5 0. 4 )(.02 ) 2 2 Tomado de: Manual de Muestreo poblacional. 1 )(.3 0. 96 ) 2 (. 96 ) (. 02 ) 2 n= (1 . 9 ) ( 0 . 2 ) ( 0 . 9 ) ( 0 .8 0. 8 )(.6 0.9 0.8 0.5 0. 05 ) 2 ( 1 . 8 ) ( 0 .96 ) (.

02 ) 2 2 n= ( 2 .5 Población de tamaño N “finita” Si el universo no es infinito. la P=0. influye el tamaño de éste y se debe usar un factor de corrección (algunos autores señalan que basta con 10.000. 65 ) ( 0 . 02 ) 2 2 Tomado de: Manual de Muestreo poblacional.96 ) (. OPS. 65 ) ( 0 . OMS 19 1. 65 ) ( 0 .575 n´= 1540 n´= 2185 n´= 2275 n´= 3088 n´= 3772 n= (1 . 35 )(. 33 ) (.45% 98% 99% 1.645 1. N menor de 100. 35 )(. Factor de corrección = n = ( n0 ) n0 1+ N 20 10 . Centro Panamericano de Ecología Humana y Salud.35 y la q = 0.02 ) 2 2 Tamaño de la muestra (n´) 90% 95% 95.65) ( 0. 35 )(. 02 ) 2 2 n= ( 2 .645) (.Tamaño de muestra para diferentes niveles de confianza manteniendo constantes la precisión de 0. 575 ) (. 65 ) ( 0 .65.35)(.0 2.33 2.000).96 2. 35 )(.02. Nivel de confianza Valor de Z Cálculo del tamaño de muestra n= (1.02 ) 2 2 n= ( 2 ) (.

Consideremos el estudio que se quiere realizar para estimar el porcentaje o proporción de alumnos fumadores en la Facultad de Ingeniería. La facultad tiene 4000 alumnos.Población de tamaño N “finita” tamaño de 21 muestra la n n=( 0 ) n 1+ 0 N donde : n0 = p * (1 − p ) * Z 21− α e 2 2 Corrección para población finita Ejemplo Ejemplo.05). Calcule el tamaño mínimo de la muestra 22 11 . el nivel de confianza con el que se quiere trabajar es del 95% y el error máximo de estimación es de 5% (0.

96 = 385 (0. Calcule el tamaño mínimo de la muestra n 1 + n = ( 0 n 0 N ) donde : n0 = p * (1 − p ) * Z 21− α E 2 2 n0 = p * (1 − p) * n = n0 /(1 + Z 21−α E2 2 = 0.16 = = 196.05) 2 n0 385 ) = 385 /(1 + ) = 351.5) * 1.05).Ejemplo. Ahora se quiere realizar el mismo estudio en la Facultad de Ciencias Sociales.2 ≈ 197. (1 + 385 / 400) ) 1.05). La facultad tiene 4000 alumnos.2 se aproxima a 352 N 4000 23 Población de tamaño N “finita” 24 Ejemplo.96 *1. Consideremos el estudio que se quiere realizar para estimar el porcentaje o proporción de alumnos fumadores en la Facultad de Ingeniería.9579 12 .5 * (1 − 0. se utilizará el mismo nivel de confiamza (95%) y el error máximo de estimación es de 5% (0. el nivel de confianza con el que se quiere trabajar es del 95% y el error máximo de estimación es de 5% (0. El total de alumnos de esta carrera es 400. Calcule el tamaño mínimo de la muestra n0 ) n0 1+ N Z 21−α E2 n=( n0 = p * (1 − p ) * 2 n≥ 385 384.

1. Calcule el error máximo de estimación. el nivel de confianza con el que se quiere trabajar es del 95% y tamaño de la muestra es de 352 alumnos. La facultad tiene 4000 alumnos.6 Población de tamaño N “finita” Error máximo de estimación 25 Error muestral “e” al estimar una proporción “p” de una muestra de tamaño n tomada desde una población de tamaño “N” e=Z 1− α 2 * 1− n N p * (1 − p ) n N= Tamaño de la población n= Tamaño de la muestra p= proporción del atributo e= Error máximo Z= Valor del coeficiente de confianza alfa Corrección para población finita f= n = Fracción Muestreo de N Ejemplo: Ejemplo. 26 13 . Consideremos el estudio que se quiere realizar para estimar el porcentaje o proporción de alumnos fumadores en la Facultad de Ingeniería.

7 Error de la muestra cuando la variable es cuantitativa 27 El Intervalo de confianza para la media de la población es: e= Error máximo IC : x ± Z (1 − α ) * 2 s n e = Z 1− α 2 * s n n= Tamaño de la muestra x= promedio muestral s= desviación estandar Z= Valor del coeficiente de confianza alfa Lo podemos calcular en el computador.47=0.Y en general. ANALIZAR EXPLORAR Error=L.11 del cuestionario UDP: P92_11.superior.media 8.39 28 14 . ¿cuán satisfecho está Ud.1. con su vida actualmente? En SPSS elegimos. Ejemplo: Calcular el error muestral de la pregunta 92.86-8..

5 lts.1. de estudios anteriores se sabe que la desviación estándar es de 5 lt. El error máximo para la media de lts.8 Tamaño de la muestra cuando el estimador corresponde a un promedio 29 (la variable a medir es cuantitativa) n =Z 2 1− α 2 * s2 e 2 n= Tamaño de la muestra s= Desviación estándar e= Error máximo s2 = ∑ ( xi − x ) 2 n −1 Z= Valor del coeficiente de confianza alfa Ejemplo En la comuna de “La Florida”. consumidos debe ser como máximo 0. para determinar el consumo medio de bencina por semana. 30 15 . Determine el tamaño muestral necesario si el nivel de confianza es 95%.. se ha decidido hacer un muestreo aleatorio simple.

31 n =Z s= 5 lt. Z= 1.2 ≈ 385 1.9 Tamaño de la muestra cuando el estimador (la variable a medir es cuantitativa) Corrección para población finita n = ( 1 donde n s 0 corresponde 32 un promedio a n + : = = s 2 0 n N ) 0 Z * ( x i 2 1 − 2 α 2 E 2 ∑ − x ) n − 1 2 16 . e= 0.5) 2 = 384.96 2 1− α 2 * s e 2 n = (1.5 lt.96) 2 * 52 (0.

5 lts. el error máximo para la media de lts. consumidos debe ser como máximo 0.5) 2 = 385 = s = 2 Z * α 2 2 n=( ∑ e (xi − x ) n − 1 n0 385 )= = 358 n0 1 + 385 / 5000 1+ N 17 .Ejemplo En un barrio de la comuna de “La Florida”. de estudios anteriores se sabe que la desviación estándar es de 5 lt. para determinar el consumo medio de bencina por semana. Determine el tamaño muestral necesario si el nivel de confianza es 95%. El número de viviendas es 5.96) 2 (0.000.. 33 Ejemplo34 respuesta n = ( n 0 n0 1 + N donde : n s 0 2 ) n0 = s 2 * 2 1− 2 Z 21− α e 2 2 = (5) 2 * (1. se ha decidido hacer un muestreo aleatorio simple.

Otras medidas: Coeficiente de Variación El error muestral se puede definir en forma relativa a partir del Coeficiente de Variación (CV). De esta manera es más fácil interpretar el error de muestreo. ) ds( p) CV = ) p CV = ds( x ) x ) DS ( p ) = p (1 − p ) n Para la media 35 CV: Coeficiente de variación ) ) DS( p) CV( p) = ) *100 p El cual generalmente se expresa en %. en base a una escala establecida (*): •Si CV < 5% • 5% <CV < 15% •15 % < CV < 25% •> 25% Muy buena precisión Buena precisión Aceptable Mala precisión 36 (*)Fuente: INE. abril 2010 18 . Metodología Encuesta de Empleo.

c) En la etapa 1: marcamos la variable “ponderación muestral. 37 d) En las próximas 2 pantallas marcamos la tecla “siguiente”. e) Nos va a parecer el resumen del diseño y luego presionamos “Finalizar”. repasaremos el calculo De los errores muestrales en base a los intervalos de confianza: Analizar “Muestras complejas” a) Se entra a Asistente de Muestreo y se marca “Preparación para el análisis” b) Se debe presionar la opción “Crear un archivo del plan” presionamos “examinar” y le damos nombre a nuestro plan de muestreo “plan_muestreo_ villa”.Utilizando nuevamente Muestras Complejas. En la pantalla resultados veremos lo siguiente: 38 19 .

Para Analizar los datos: a) Analizar “Muestras complejas” b) Se debe indicar el nombre del archivo con el plan (Fue definido en la etapa anterior) c) Se pide “Frecuencia” – var. d) Y elegimos los “Estadísticos” que deseamos obtener. 40 20 . Cuantitativa. (nº de personas e ingresos) d) Y elegimos los “Estadísticos” que deseamos obtener. 39 Si necesito análisis descriptivo: a) Analizar “Muestras complejas” b) b) Se debe indicar el nombre del archivo con el plan (Fue definido en la etapa anterior) c) Se pide “Descriptivo” – var. Cuantitativa. Categórica o “Descriptivo” – var.

000 viviendas Construir una muestra aleatoria simple de 600 casos Luego calcular frecuencias y promedios con sus respectivos intervalos de confianza.asses-cs”: corresponde a los datos de 11.1 a p20. 41 Ejemplo: Utilizaremos ahora la muestra de la encuesta UDP 2011 Calcularemos el IC para la preg.Ejemplo: Archivo “Poperty. 20. Siendo 1 “Muy Mal” y 7 “Muy Bien”. ¿cómo evaluaría el desempeño de las siguientes autoridades e instituciones en los escándalos de abuso sexual que involucra a representantes de la Iglesia Católica? MUY MAL LEA: 1) 2) 3) 4) 5) 6) CARDENAL ERRÀZURIZ CARDENAL MEDINA EL ARZOBISPO DE SANTIAGO RICARDO EZZATI LOS TRIBUNALES DE JUSTICIA LOS MEDIOS DE COMUNICACIÓN EL VATICANO 1 1 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 3 3 3 3 4 4 4 4 4 4 4 5 5 5 5 5 5 5 MUY BIEN 6 6 6 6 6 6 6 7 7 7 7 7 7 7 NS/NC 9 9 9 9 9 9 42 21 .6 20 PASE TARJETA “20”.

LEER SEGÚN ROTACION 1) LA ESCUELA/COLEGIO 2) EL TRABAJO 3) EL TRATO DE CARABINEROS 4) LOS TRIBUNALES DE JUSTICIA 5) LA MUNICIPALIDAD 6) 7) 8) 9) No hay discriminación 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 5 5 5 5 5 5 5 5 5 Hay mucha discriminación 6 6 6 6 6 6 6 6 6 7 7 7 7 7 7 7 7 7 NS/NC 9 9 9 9 9 9 9 9 9 LOS MEDIOS DE COMUNICACIÓN LAS FUERZAS ARMADAS LOS PARTIDOS POLÍTICOS LOS HOSPITALES 43 En resumen: Para definir el tamaño de la muestra. 44 22 . ¿Podría decirme Ud. si hay o no discriminación hacia los mapuches en Chile en…? PASE TARJETA “60”. etc. tramos de edad.y para la pregunta 60 En una escala de 1 a 7 donde 1 es “No hay discriminación” y 7 es “hay mucha discriminación”. Los subgrupos que se desean realizar (genero.). El error de estimación. se debe considerar además del costo: El nivel de confianza.

58) 45 46 23 .Ejemplo: Encuesta de Empleo (INE)(pag.

11. Thomson 1ª. (2000): Muestreo: diseño y análisis. 48 24 . Muestreo).47 Bibliografía LOHR S. Edición. 2 MALHOTRA NARESH K. México. L. (cap. Prentice Hall Ed. (2004) Investigación de Mercados. Cap. 4th Edition.

Sign up to vote on this title
UsefulNot useful