Está en la página 1de 25

Tamaño de Muestra

Docente: Lina Lucia Hernández


E-mail: lina.hernandez10@usc.edu.co
Facultad de Ciencias Básicas
El Proceso de la Estadística SI: Censo
Medición del total
Población de de elementos de
Interés una población

¿Podemos medir todos


los elementos de la
Muestra
población?
NO: Muestreo
Selección de un
subconjunto de la
población.
Inferencia
• 𝜇 media • 𝑋ത
• 𝜎 2 varianza • 𝑆2 Datos
• 𝜋 Proporción • 𝑝

Parámetros Estimadores Estadísticos


Muestreo Aleatorio Simple (MAS)
Es una técnica de muestreo en la que todos los elementos que
forman el universo tienen idéntica probabilidad de ser
seleccionados para la muestra.

¿Cómo seleccionar la muestra?


• Identificar claramente uno a uno los elementos de la población.
• Asignar a cada elemento de la población un número entre 1 y N.
• Calcular el tamaño de muestra n.
• Generar n número aleatorios diferentes que se encuentren entre 1 y N.
• Los elementos de la población cuyo número salga seleccionado,
pertenece a la muestra.
• Estimar el parámetro de interés con los datos obtenidos para los
elementos de la muestra.
Número aleatorios en Excel

Generar n números aleatorios diferentes


comprendidos entre 1 y N.
(descartar los números repetidos).
ALEATORIO.ENTRE(1;N)
Los números generados indican los
elementos de la población que se deben
incluir en la muestra.

Para los ejercicios vamos a usar el archivo


Aleatorios únicos.xlsm
Para los ejercicios vamos a usar el archivo
Ejemplo Aleatorios únicos.xlsm

Se le pregunta a los 324 egresados de los últimos 10 años de uno de los programas
académicos de la universidad, sobre la edad en la que lograron por primera vez,
obtener ingresos superiores a los 3 millones de pesos, los resultados obtenidos
se presentan a continuación. Generar una muestra de tamaño 10

1 2 3 4 5 6 7 8 9 10
Seleccionado 52 283 298 46 72 81 167 231 124 122
Edad
Ejemplo
# Edad # Edad # Edad # Edad # Edad # Edad # Edad # Edad # Edad # Edad # Edad # Edad
1 24 28 26 55 31 82 25 109 32 136 29 163 27 190 31 217 24 244 40 271 33 298 36
2 28 29 42 56 28 83 29 110 30 137 27 164 36 191 27 218 45 245 29 272 44 299 44
3 40 30 26 57 31 84 28 111 30 138 29 165 27 192 40 219 33 246 24 273 28 300 24
4 28 31 40 58 34 85 39 112 31 139 37 166 45 193 25 220 45 247 28 274 29 301 38
5 38 32 37 59 35 86 40 113 36 140 30 167 24 194 25 221 35 248 25 275 37 302 33
6 41 33 43 60 39 87 24 114 25 141 30 168 40 195 37 222 26 249 27 276 42 303 32
7 27 34 26 61 28 88 42 115 33 142 43 169 36 196 25 223 33 250 24 277 35 304 26
8 27 35 31 62 36 89 36 116 33 143 28 170 37 197 35 224 29 251 28 278 42 305 35
9 28 36 30 63 25 90 27 117 36 144 24 171 31 198 41 225 45 252 35 279 38 306 26
10 36 37 45 64 45 91 25 118 37 145 43 172 29 199 29 226 26 253 36 280 28 307 44
11 26 38 43 65 43 92 38 119 35 146 38 173 44 200 42 227 32 254 39 281 32 308 40
12 41 39 30 66 24 93 31 120 24 147 32 174 44 201 33 228 31 255 33 282 40 309 41
13 33 40 33 67 32 94 30 121 36 148 25 175 31 202 25 229 42 256 44 283 26 310 41
14 26 41 39 68 29 95 26 122 44 149 44 176 35 203 44 230 33 257 39 284 31 311 39
15 24 42 29 69 26 96 26 123 37 150 27 177 28 204 44 231 34 258 45 285 27 312 34
16 31 43 45 70 25 97 42 124 36 151 34 178 43 205 35 232 42 259 41 286 25 313 29
17 27 44 37 71 40 98 24 125 38 152 43 179 32 206 41 233 28 260 27 287 32 314 42
18 34 45 36 72 40 99 43 126 28 153 28 180 33 207 32 234 36 261 37 288 26 315 33
19 30 46 38 73 42 100 24 127 33 154 33 181 45 208 39 235 42 262 36 289 38 316 32
20 29 47 33 74 24 101 44 128 31 155 42 182 45 209 33 236 38 263 37 290 33 317 34
21 34 48 28 75 43 102 41 129 26 156 35 183 36 210 43 237 43 264 26 291 45 318 35
22 34 49 31 76 33 103 28 130 27 157 30 184 33 211 33 238 33 265 37 292 40 319 33
23 40 50 35 77 27 104 35 131 44 158 36 185 35 212 37 239 40 266 40 293 40 320 27
24 41 51 30 78 40 105 45 132 29 159 39 186 43 213 33 240 33 267 45 294 43 321 25
25 41 52 34 79 45 106 34 133 45 160 27 187 25 214 33 241 37 268 44 295 30 322 34
26 44 53 43 80 37 107 37 134 44 161 44 188 42 215 36 242 41 269 36 296 38 323 36
27 34 54 37 81 42 108 40 135 43 162 35 189 41 216 35 243 26 270 32 297 40 324 28
Cálculo del tamaño de muestra
Tamaño de la Muestra
Una de las decisiones más importantes que deben tomarse en un plan
de muestreo es la determinación del tamaño optimo de muestra n.

De que depende n?

Precisión: Máximo error que se está dispuesto a tolerar entre el


parámetro y su estimación.

n Confiabilidad: la seguridad de que se cumpla la precisión definida.

Varianza: La variabilidad asociada a la variable de interés.

“El tamaño de la muestra es proporcional a la varianza del estimador,


en ningún caso proporcional al tamaño de la población”
Para la media poblacional
• 𝑍 : Es el percentil obtenido bajo el
supuesto de normalidad para un
nivel de confianza establecido
𝑛0 , Si (𝑛0 /𝑁) ≤ 0.05
• 𝜎 2 : La varianza de la población
𝑛=
𝑛0 • 𝜀 : El margen de error o error de
𝑛0 , Si (𝑛0 /𝑁) > 0.05 muestreo máximo permitido
1+
𝑁

𝒁𝟐𝟏−𝜶/𝟐 𝝈𝟐
𝒏𝟎 =
𝜺𝟐
2
𝑍1−𝛼/2 𝑆2
Cuando 𝜎 se estima usando 𝑆 de una muestra piloto 𝑛0 =
𝜀2
Sensibilidad del tamaño de muestra

A mayor nivel de confianza, Entre más heterogénea sea


más grande es el tamaño de la población, el tamaño de
la muestra. muestra requerido será
mayor.
z
2 2
n=
 2

El máximo error tolerable influye


inversamente en el tamaño de la
muestra.
Tamaño de muestra vs Nivel de Confianza
Tamaño de muestra vs Precisión
2
𝑍1−𝛼/2 𝑆2
Ejemplo 1 𝑛=
𝜀2

En una comunidad integrada por 20.000 casas se desea estimar el


consumo promedio mensual de gas por vivienda con un nivel de
confianza del 95% y un error de muestreo de 6.95m3. Estudios
anteriores para dicha comunidad permiten suponer que para el
consumo mensual de gas en dicha comunidad S2=1255.

¿Qué tamaño de muestra será necesario en este caso para llevar a


cabo la correspondiente estimación?
Ejemplo 1 [Solución]
N= 20.000
En una comunidad integrada por 20.000 casas se desea 𝜀 = 6.95
𝑠 2 =1255
estimar el consumo promedio mensual de gas por vivienda
NC=95%
con un nivel de confianza del 95% y un error de muestreo de
6.95m3. Estudios anteriores para dicha comunidad permiten
suponer que para el consumo mensual de gas en dicha 1 − α = 0.95
comunidad S2=1255. α = 0.05
α/2 = 0.025
¿Qué tamaño de muestra será necesario en este caso para 𝒁=1.96
llevar a cabo la correspondiente estimación?

Z2 S2 (1.96) 2 *1255


n= = = 99.81  100 Si se aplicará la
 2
(6.95) 2
fracción de muestreo:
𝒏 𝟗𝟗.𝟖𝟏 n0 99.81
Como = = 𝟎. 𝟎𝟎𝟎𝟒𝟗𝟗𝟎𝟓 , no es necesario aplicar la fracción n= = = 99.31  100
𝑵 𝟐𝟎𝟎𝟎𝟎 n0 99.81
1+ 1+
de muestreo y el tamaño de muestra que garantiza el nivel de N 20.000
confianza y margen de error establecidos es n=100 casas.
Para la proporción poblacional
• 𝑍 : Es el percentil obtenido bajo el
𝑛0 , Si (𝑛0 /𝑁) ≤ 0.05 supuesto de normalidad para un nivel
de confianza establecido
𝑛= • 𝑝: La proporción de la característica de
𝑛0 interés de la población
𝑛0 , Si (𝑛0 /𝑁) > 0.05
1+
𝑁 • 𝜀 : El margen de error o error de
muestreo máximo permitido

La proporción se debe estimar: 2


• A partir de una muestra piloto de 𝑛 > 30. 𝑧(1−𝛼/2) 𝑝 1−𝑝
• Usando información de investigaciones previas. 𝑛0 =
• Asumiendo el peor escenario 𝑝 = 0.50 𝜀2
Comportamiento de la Varianza para el Estimador de p

La varianza del estimador de


p es mas alta para valores
cercanos a 0.5.

La varianza del estimador de p


es simétrica con respecto al
valor de 0.5.
2
𝑧(1−𝛼/2) 𝑝 1−𝑝
Ejemplo 2 𝑛=
𝜀2

Se quiere estimar el porcentaje de estudiantes que quedan en


embarazo durante su periodo de estudios en la Universidad,
para esto se requiere tomar una muestra de estudiantes. Se
sabe por estudios anteriores que este porcentaje ha sido
cercano al 20%. Si en total hay 3000 mujeres en la Universidad,
¿Cuál es el tamaño de muestra necesario para estimar la
proporción deseada con confianza del 95% y un error del 5%?
2
𝑧(1−𝛼/2) 𝑝 1−𝑝
Ejemplo 2 𝑛=
𝜀2

Considerando el mismo contexto, ¿Qué tamaño de muestra


recomendaría si no se tiene la menor idea de la proporción de
mujeres que quedan en embarazo en esta Universidad? Use un
nivel de confianza del 95% y un error del 5%.
2
𝑧(1−𝛼/2) 𝑝 1−𝑝
Ejemplo 3 𝑛=
𝜀2

Las encuestas anteriores revelan que 35% de los turistas que


van a Las Vegas a jugar durante el fin de semana gasta más
de $1.000 cada uno. La gerencia desea actualizar este
porcentaje.

a. El nuevo estudio utilizará el nivel de confianza de 90%. El estimador estará a menos de


1% de la proporción de la población. ¿Cuál es el tamaño necesario de la muestra?
2
𝑧(1−𝛼/2) 𝑝 1−𝑝
Ejemplo 3 𝑛=
𝜀2

Las encuestas anteriores revelan que 35% de los turistas que


van a Las Vegas a jugar durante el fin de semana gasta más
de $1.000 cada uno. La gerencia desea actualizar este
porcentaje.

b. La gerencia indicó que el tamaño de la muestra determinado es demasiado grande. ¿Qué


se puede hacer para reducir la muestra? Con base en su sugerencia, vuelva a calcular el
tamaño de la muestra.
Para disminuir el tamaño de muestra se
pueden realizar cualquiera de las siguientes
acciones:
• Disminuir el nivel de confianza.
• Aumentar el margen de error.
Ejercicio 1
En una empresa de 150 empleados, donde se trabaja de lunes a
sábado, se quiere estimar el porcentaje de empleados que
consumen más de cuatro cervezas el día viernes.

Para ello asuma una confianza del 90% y un margen de error del
10%, tenga en cuenta que en una investigación similar realizada
hace dos años, se encontró un porcentaje del 18%.

La siguiente información corresponde a la cantidad de cervezas


(CC) que toma cada empleado de la empresa durante el día
viernes.

Calcule el tamaño de muestra necesario y use


Aleatorios únicos.xlsm para seleccionar la
muestra.
Ejercicio 1
# CC # CC # CC # CC # CC # CC # CC # CC # CC # CC
1 0 16 1 31 2 46 3 61 3 76 1 91 4 106 4 121 5 136 3
2 4 17 0 32 3 47 3 62 1 77 6 92 4 107 5 122 3 137 0
3 4 18 4 33 0 48 2 63 7 78 4 93 0 108 4 123 1 138 1
4 3 19 3 34 4 49 2 64 8 79 4 94 1 109 1 124 2 139 2
5 4 20 2 35 6 50 8 65 4 80 6 95 2 110 5 125 5 140 1
6 1 21 3 36 0 51 5 66 0 81 0 96 8 111 2 126 5 141 5
7 2 22 4 37 4 52 3 67 2 82 3 97 5 112 0 127 4 142 9
8 1 23 10 38 6 53 0 68 5 83 7 98 6 113 6 128 5 143 0
9 5 24 3 39 0 54 3 69 7 84 8 99 0 114 4 129 0 144 5
10 4 25 4 40 4 55 3 70 0 85 1 100 3 115 1 130 2 145 1
11 2 26 3 41 4 56 2 71 5 86 6 101 5 116 1 131 0 146 2
12 0 27 3 42 7 57 3 72 4 87 0 102 2 117 3 132 1 147 2
13 1 28 1 43 8 58 2 73 3 88 6 103 1 118 2 133 6 148 1
14 3 29 1 44 2 59 0 74 1 89 4 104 1 119 5 134 5 149 0
15 2 30 5 45 4 60 3 75 4 90 0 105 5 120 9 135 2 150 3
Ejercicio 1 [Solución]
Ejercicio 1 [Solución]

El porcentaje de empleados
en la muestra que toma más
de 4 cervezas los viernes es
22%
Ejercicio 2
Si las directivas del programa de Gestión Empresarial desean
hacer un seguimiento a las calificaciones de los estudiantes en los
exámenes finales, sabiendo que la desviación estándar de estas
calificaciones es de 1.8 y que la proporción de estudiantes que
pierden los exámenes finales es de 0.43.

a. Calcule el tamaño de muestra requerido para estimar el promedio de las calificaciones,


con un nivel de confiabilidad del 98% y un error de muestreo de 0.2.

b. Calcule el tamaño de muestra requerido para estimar la proporción de estudiantes que


pierden los exámenes finales con un nivel de confiabilidad del 98%, un error de muestreo
de 0.07.

c. Para realizar el estudio conjunto sobre las calificaciones y el porcentaje de estudiantes


que pierden los exámenes finales, qué tamaño de muestra utilizaría usted?

También podría gustarte