Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Repaso de conceptos
Material elaborado por:
Lic. Roberto Damián Díaz González
Campus Universitario
San Lorenzo, Paraguay
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia
Índice
1. Muestro Aleatorio Simple (𝐌𝐀𝐒) ....................................................................................................4
1.1. Cómo seleccionar un 𝐌𝐀𝐒 .......................................................................................................4
1.2. Estimaciones.............................................................................................................................7
1.2.1. Media ...........................................................................................................................7
1.2.2. Proporción ....................................................................................................................9
1.2.3. Total........................................................................................................................... 10
1.3. Teorema Central de límite .................................................................................................... 11
1.4. Precisión que se alcanza en las estimaciones ....................................................................... 13
1.4.1. El error estándar “DE (estimación)” .......................................................................... 13
1.4.2. Intervalos de confianza (IC) ....................................................................................... 14
2. El factor costo de una encuesta .................................................................................................... 18
3. Determinación de la muestra ........................................................................................................ 18
3.1. Algunos factores que pueden incidir en el tamaño muestral ............................................... 19
3.2. Precisión Estadística .............................................................................................................. 19
3.2.1. Fracción del muestreo ............................................................................................... 19
3.2.2. Error ¨d¨ .................................................................................................................... 19
3.3. Tamaño de la muestra para la estimación ............................................................................ 20
3.3.1. Tamaño de la muestra para la estimación de Media ................................................ 20
3.3.2. Tamaño de la muestra para la estimación de Total .................................................. 21
3.3.3. Tamaño de la muestra para la estimación de proporción ........................................ 23
4. Muestreo estratificado (ME) ......................................................................................................... 24
4.1. Asignación proporcional al tamaño del estrato .................................................................... 25
4.2. Nomenclatura........................................................................................................................ 25
4.3. Estimación ............................................................................................................................. 26
4.3.1. Media ........................................................................................................................ 26
4.3.2. Total........................................................................................................................... 29
4.3.3. Proporción ................................................................................................................. 30
4.4. Precisión del muestreo estratificado .................................................................................... 32
5. Muestreo por conglomerado (MC) ............................................................................................... 33
5.1. Definición .............................................................................................................................. 33
5.2. Características principales del MC ........................................................................................ 34
5.3. Ventajas del (MC) .................................................................................................................. 34
5.4. Notación básica ..................................................................................................................... 35
2 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia
5.5. Estimaciones.......................................................................................................................... 35
5.5.1. Estimación de medias................................................................................................ 35
5.5.2. Estimación de proporciones ...................................................................................... 36
5.5.3. Estimación de totales ................................................................................................ 36
5.6. Muestreo por conglomerado en dos etapas ......................................................................... 40
Bibliografía ............................................................................................................................................ 41
3 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia
A continuación, se muestra una serie de pasos para seleccionar una muestra aleatoria
Paso 2: Extraemos la muestra de estas unidades, utilizando una tabla de números aleatorios,
un programa de computación (Excel, SPSS, etc.) o la calculadora.
Observaciones:
Debemos asegurarnos de que los números seleccionados sean todos diferentes y que
ninguno de ellos sea mayor que N.
Una vez que terminemos de seleccionar los números, los elementos de la población
correspondiente a estos números, tomamos como muestra.
4 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia
Solución:
Paso 1: En este caso nuestra base de datos ya está numerada del 1 al 20.
5 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia
6 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia
1.2. Estimaciones
Imaginémonos que de una población específica, cuyo número de habitante oscila entre
50.000 personas, y que se desea conocer la proporción de estudiantes existente, la edad
promedio de una zona de dicha población, etc. en estos casos, solo bastaría sacar una
muestra aleatoria y a través de un procedimiento matemático al que llamamos
“estimación”, obtener un valor que pueda representar adecuadamente a los valores
deseados de la población. Entonces, podemos decir que la estimación es un procedimiento
de la estadística inferencial por el cual podemos describir las características de una
población a partir de los datos de una muestra. A la característica de la muestra se lo conoce
como estadístico, o simplemente como estimador.
1.2.1. Media
Donde
De la misma forma la media muestral que utilizamos para estimar la media poblacional μ lo
∑𝐧
𝐢=𝟏 𝐱𝐢
denotamos de la siguiente forma: 𝐱̅ = 𝐧
Donde
La estimación de la varianza de la media 𝐱̅ de una muestra aleatoria simple está dada por:
𝐒𝟐
̂(𝐱̅) = (𝟏 − 𝐟) ∗
𝐕
𝐧
Donde
7 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia
𝒏
𝑓 = 𝑵 es la fracción de muestreo o proporción de la población que estamos muestreando.
∑n ̅ )2
1 (xi −x
S2 = es la varianza muestral.
n−1
Ejemplo 1. 2: Supongamos ahora que se desea estimar la edad promedio de los alumnos
seleccionados en la muestra del Ejemplo 1.1
Solución:
2 21
7 22
8 23
13 21
15 18
∑ni=1 𝑥𝑖 𝑥1 + 𝑥2 + 𝑥3 + 𝑥4 + 𝑥5 21 + 22 + 23 + 21 + 18 105
x̅ = = = =
n 5 5 5
x̅ = 21
2
∑n1(xi − x̅)2 (21 − 21)2 + (22 − 21)2 + (23 − 21)2 + (21 − 21)2 + (21 − 18)2
S = =
n−1 5−1
14
S2 = = 3,5
4
14
S2 5 3 2
̂(x̅) = (1 − 𝑓) ∗
V = (1 − 20) ∗ 4
= 4∗3 ̂(x̅) = 0,53
V
n 5
8 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia
1.2.2. Proporción
∑𝐧𝐢=𝟏 𝐱 𝐢
̂=
𝐩
𝐧
̂(𝟏 − 𝐩
𝐩 ̂)
̂(𝐩
𝐕 ̂) = (𝟏 − 𝐟) ∗
𝐧−𝟏
n
Donde 𝑓 = N
Ejemplo 1. 3: Sigamos con los mismos datos de los alumnos de los ejemplos anteriores.
Centrémonos ahora en los alumnos que poseen trabajo actualmente, es decir, estamos
interesados en estimar la proporción de los alumnos que poseen trabajo.
Solución:
Definamos primero a las características que presentan los alumnos y el evento de interés.
Eventos 𝑥𝑖 Cantidades
1 4
0 1
9 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia
1
p̂ ∗ (1 − p̂) 5 0,8 ∗ (1 − 0,8) 3 16
̂(p̂) = (1 − 𝑓) ∗
V = (1 − ) ∗ = ∗
n−1 20 5−1 4 4
̂(p̂) = 0,03
V
1.2.3. Total
El total muestral 𝐭̂ es un estimador puntual del total poblacional T. Para estimar un total en
el MAS utilizaremos la siguiente expresión:
∑𝐧𝐢=𝟏 𝐱 𝐢
𝐭̂ = 𝐍 ∗ = 𝐍 ∗ 𝐱̅
𝐧
Donde
𝐍𝟐 𝐒𝟐
̂(𝐭̂) = (𝟏 − 𝐟) ∗
𝐕
𝐧
∑n ̅ )2
1 (xi −x
Donde S 2 = n−1
Ejemplo 1.4: Se extrae una muestra aleatoria simple de tamaño 7 de un total de 30 alumnos
de la Facultad de Ciencias Exactas y Naturales del segundo semestre del 2017, se les
consulto la cantidad de asignaturas cursadas en el semestre, a continuación los datos
obtenidos:
Solución:
10 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia
Por otro lado, para calcular la estimación de un total por 𝐌𝐀𝐒 debemos primeramente
obtener la media estimada.
∑ni=1 xi x1 + x2 + x3 + x4 + x5 21 + 22 + 23 + 21 + 18 105
x̅ = = = = =2
n 5 5 5
∑n
i=1 xi
t̂ = N ∗ = N ∗ x̅ = 30 ∗ 21
n
t̂ = 630
El número total de asignaturas cursadas por los alumnos de la Facultad de Ciencias Exactas y
Naturales del segundo semestre del 2017 en el segundo semestre es aproximadamente 630.
Como veníamos haciendo en los demás ejemplos, calculemos también la varianza del total
estimada.
∑n1(xi − x̅)2
S2 =
n−1
S2
(5 − 21)2 + (6 − 21)2 + (4 − 21)2 + (5 − 21)2 + (6 − 21)2 + (7 − 21)2 + (4 − 21)2
=
7−1
1736
S2 = = 289,3
6
Por lo tanto,
N2 S2 7 302 ∗ 289,3
̂(t̂) = (1 − f) ∗
V = (1 − ) ∗
n 30 7
̂(t̂) = 28.520
V
11 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia
Ejemplo 1.5: Supongamos que 𝐗 es una variable aleatoria con una distribución de
probabilidad cualquiera y cuya población sea {𝟐, 𝟒, 𝟓}. Si tomamos una muestra 𝐧 = 𝟐,
calcular 𝛍𝐗̅ y 𝛔𝟐 𝐗̅ .
Solución:
1 1
μ = N ∑ni=1 Xi y σ2 = N ∑ni=1(Xi − μ)2
1 11
μ= ∗ (2 + 4 + 5) =
3 3
1 11 2 11 2 11 2 1 14 14
σ2 = ∗ ((2 − ) + (2 − ) + (2 − ) ) = ∗ ( ) =
3 3 3 3 3 3 9
Ahora bien, debemos extraer todas las muestras posibles de tamaño 2, sin reemplazo.
̅1 = 3
Las medias de las muestras son: X ̅ 2 = 3,5
X ̅ 3 = 4,5
X
12 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia
Entonces,
1 1 11
μX̅ = ∗ (3 + 3,5 + 4,5) = ∗ 11 =
3 3 3
2
1 11 2 11 2 11 2 2
σ ̅
X = ∗ ((3 − ) + (3,5 − ) + (4,5 − ) ) =
3 3 3 3 5
14
N − n σ2 3−2 2
σ2
̅
X =( )∗ =( )∗ 9 =
N−1 n 3−1 2 5
Según Rodríguez (1991), la precisión de las estimaciones tiene relación inversa con el error
muestral, cuanto menor sea el error menor es la dispersión de la distribución del estimador
y, en consecuencia, la precisión será mayor, pero para lograr una menor dispersión es
necesario aumentar el número de unidades en la muestra hasta que obtengamos los niveles
de precisión aceptables.
Al hacer nuestras estimaciones siempre tendremos errores, a esos errores se los llama “error
estándar” o también “error típico”. Es una medida de variabilidad del estimador con
respecto al parámetro de la población que estemos estimando.
El error estándar se calcula a partir de la varianza de los estimadores, este es la raíz cuadrada
de la misma.
13 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia
2 ∑n ̅ )2
̂(x̅) = √(1 − f) ∗ S donde S 2 =
Para la media estimada: DE(x̅) = √V 1 (xi −x
n n−1
̂(1−p
p ̂)
̂(p̂) = √(1 − f) ∗
Para la proporción: DE(p̂) = √V n−1
N 2 S2 ∑n ̅ )2
1 (xi −x
̂ (t̂) = √(1 − f) ∗
Para el total: DE(t̂) = √V donde S 2 =
n n−1
Según Cochran (1980), los errores estándar de las estimaciones de los parámetros
poblacionales son utilizados generalmente por los siguientes motivos:
Para estimar el tamaño de la muestra que se necesita en una encuesta que esté
siendo planteada.
En ocasiones es más factible estimar un rango de valores (valor mínimo y valor máximo) en
el cual se encuentre el parámetro con un nivel de confianza especificada; a este rango se le
denomina “intervalo de confianza”, y a este procedimiento, ¨estimación por intervalo¨.
𝛂: Nivel de significancia
Interpretación de un IC al 95%
(Lohr,2000).
14 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia
99% 1% 2,58
95% 5% 1,96
Consideremos los siguientes ejemplos para una mejor ilustración de la precisión de una
estimación.
Ejemplo 1. 6: Utilizando los datos del Ejemplo 1. 2: Supongamos ahora que se desea estimar
la edad promedio de los alumnos seleccionados en la muestra del Ejemplo 1.1estime el
intervalo de confianza para la edad promedio de los alumnos con las siguientes condiciones:
Observación: para los puntos c) y d) utilizar los mismos datos a excepción del tamaño
muestral.
15 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia
Solución
Calculemos ahora el margen de error, para ello utlizaremos el valor de t al 95%, esto es 1,96.
Entonces,
IC = x̅ ± DE(x̅) ∗ t
IC = 21 ± 1,42
Entonces,
IC = x̅ ± DE(x̅) ∗ t
IC = 21 ± 1,87
16 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia
14
S2 10 1 1 1
̂(x̅) = (1 − f) ∗ = (1 − ) ∗ 4 = ∗ = = 0,18
V
n 20 10 2 3 6
NC = 95% t = 1,96
Entonces,
IC = x̅ ± DE(x̅) ∗ t
IC = 21 ± 0,82
14
S2 10 1 1 1
̂(x̅) = (1 − f) ∗ = (1 − ) ∗ 4 = ∗ = = 0,18
V
n 20 10 2 3 6
NC = 99% t = 2,58
Entonces,
IC = x̅ ± DE(x̅) ∗ t
IC = 21 ± 1,08
17 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia
e) Este ejemplo nos ayuda a tener un mejor concepto sobre la precisión que pueden tener
los estimadores, si bien, en este caso solo usamos la estimación de la media, de la
misma manera se comportan los estimadores de proporción y total.
Se puede notar que cuando aumentamos el NC de 95% a 99% la amplitud del intervalo se
vuelve un poco más amplio. Esto es simplemente que al aumentar el nivel de confianza
estamos siendo más exigentes con respecto a donde se podría encontrar el verdadero valor
de la media poblacional. Sin embargo, cuando aumentamos el tamaño de la muestra, ocurrió
lo contrario, la amplitud del intervalo es menor comparando para cada nivel de confianza
correspondiente.
Cabe destacar que no existe una función que nos proporcione un costo óptimo para todos
los eventos, ya que para ello deberíamos considerar todos los ítems que inciden en
maximizar la precisión y minimizar el costo para cada diseño muestral.
3. Determinación de la muestra
El muestreo aleatorio simple se caracteriza por ser uno de los métodos más simples en
cuanto al cálculo de las estimaciones, sin embargo, cabe mencionar que hasta ahora hemos
tratado el procedimiento de selección y no acerca del número de observaciones que deben
ser incluidos en la muestra, el cálculo del tamaño muestral es una actividad a priori al
desarrollo de una encuesta y las estimaciones se realizan una vez realizada la encuesta.
Para estimar el tamaño muestral es importante tener en cuenta dos supuestos, el primero
corresponde al nivel de confianza al que queremos trabajar y el segundo, al error máximo
que estamos dispuestos a admitir en nuestra estimación.
18 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia
Según Pérez (2010); Rodríguez, Ferreras & Núñez (1991), estos son algunos de los factores
que podrían incidir a la hora de calcular la estimación del tamaño muestral:
El diseño muestral.
El nivel de confianza.
La precisión.
Veamos algunas definiciones que nos ayudarán a comprender mejor la precisión estadística
Según Cochran (1980), la ¨cpf se puede ignorar cuando la fracción de muestreo no exceda un
5%¨.
Como hemos visto, el intervalo de confianza para una estimación está dada por:
19 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia
Donde el margen de error o el error máximo permisible está representado por 𝐝, al límite o
margen de error también se la denomina precisión.
d = DE(estimación) ∗ t
La precisión hace referencia a la longitud del intervalo, si el intervalo es (a, b), entonces
cuanto menor sea la longitud ℓ = b − a más precisa será la estimación.
A continuación veremos las fórmulas para obtener el tamaño de muestra suficiente para la
estimación de los parámetros.
El tamaño de muestra necesario para estimar μ con un límite para el error de estimación d y
un nivel de confianza prefijado está dado por:
𝐒𝟐 ∗ 𝐭𝟐
𝐧=
𝐝𝟐
Dónde:
Debemos comprobar si se cumple N > n(n − 1), en caso de que se cumpla, el tamaño
muestral adecuado que debemos considerar es obtenido a partir de la fórmula presentada
más arriba.
𝐧𝟎
𝐧𝐟 = 𝐧
𝟏 + 𝐍𝟎
20 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia
Ejemplo 1.7: Supongamos que deseamos estimar la edad promedio de los alumnos que se
encuentran cursando el segundo año de un colegio de la capital, la totalidad de alumnos de
dicho curso es de aproximadamente 300. Para hacer el estudio se accedió a la lista de
matriculados del colegio, así también por un estudio anterior se sabe que la varianza de la
estimación es de 4 y pretendemos cometer un error máximo de hasta 1 al estimar la media.
Si usamos un nivel de confianza del 95%; ¿cuál debe ser el tamaño de la muestra?
Solución
S2 = 4
d=1
N = 300
S2 ∗ t2
n=
d2
4 ∗ (1,96)2 15,3664
n= = = 15,3664 ≈ 15
12 1
El tamaño de muestra necesario para estimar 𝐓 con un límite para el error de estimación 𝐝 y
un nivel de confianza prefijado está dado por:
21 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia
𝐍 𝟐 ∗ 𝐧𝟎 𝐒𝟐 ∗ 𝐭𝟐
𝐧= con 𝐧𝟎 =
𝟏 + 𝐍 ∗ 𝐧𝟎 𝐝𝟐
Dónde:
Ejemplo 1.8: ¿Cuál sería el tamaño de la muestra que debe utilizar el dueño de una fábrica
de cementos que desea estimar el monto total de la ganancia diaria generada por su
producto (esto es de acuerdo a su kg), si para ello pretende realizar una muestra aleatoria
con una confianza del 95%?, los datos siguientes fueron obtenidos a través de un estudio
anterior:
N = 20.000 Unidades
S 2 = 1.000.000 Gs.
d = 2.000.000 Gs.
Solución:
S 2 ∗ t 2 1.000.000 ∗ (1,96)2
n0 = = = 1,9208
d2 (2.000.0000)2
Entonces;
N 2 ∗ n0 20.0002 ∗ 1,9208
n= = = 19999,4794 ≅ 2.000
1 + N ∗ n0 1 + 20.000 ∗ 1,9208
22 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia
El tamaño de muestra necesario para estimar 𝐏 con un límite para el error de estimación 𝐝 y
un nivel de confianza prefijado está dado por:
𝐩 ∗ (𝟏 − 𝐩) ∗ 𝐭 𝟐
𝐧=
𝐝𝟐
Dónde:
Solución:
1 conocen la ley
Nuestra variable de interés es: xi = {
0 en otro caso.
p = 0,62 Proporción de amas de casa que conocen la ley de maternidad.
1 − p = 1 − 0,62 = 0,38
d = 5% → 0,05
23 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia
Entonces;
p ∗ (1 − p) ∗ t 2 0,62 ∗ 0,38 ∗ (1,96)2
n= = = 362,032384 ≅ 362
d2 (0,05)2
Vemos que no se cumple la condición; por tanto, usemos la fórmula alternativa para este
caso.
Por ello;
362
nf = = 209,98 ≈ 210
362
1+
500
Conclusión: como mínimo se debe muestrear a 210 casas para estimar la proporción de
conocimiento de las amas de casa cobre la ley de maternidad, con un nivel de confianza del
95% y un error máximo hasta el 5%.
En este caso el muestreo estratificado se adecua muy bien a estos objetivos ya que permite
obtener muy buenas informaciones de la población con un costo no tan elevado. Esto ocurre
por el diseño propio, la misma consiste en agrupar a las unidades de muestreo cuyas
características sean bastante similares.
24 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia
𝐍𝟏 + 𝐍𝟐 + ⋯ + 𝐍𝐡 = 𝐍
𝐍 → Total de unidades en toda la población
𝐄𝐧 𝐥𝐚 𝐚𝐬𝐢𝐠𝐧𝐚𝐜𝐢ó𝐧 𝐩𝐫𝐨𝐩𝐨𝐫𝐜𝐢𝐨𝐧𝐚𝐥,
𝐥𝐚 𝐟𝐫𝐚𝐜𝐜𝐢ó𝐧 𝐝𝐞 𝐦𝐮𝐞𝐬𝐭𝐫𝐞𝐨 𝐞𝐬 𝐥𝐚 𝐦𝐢𝐬𝐦𝐚 𝐩𝐚𝐫𝐚 𝐜𝐚𝐝𝐚 𝐞𝐬𝐭𝐫𝐚𝐭𝐨.
𝐧𝐡 𝐍𝐡 𝐧𝐡 𝐧
= ó = ó 𝐟𝐡 = 𝐟
𝐧 𝐍 𝐍𝐡 𝐍
4.2. Nomenclatura
L → número estratos
N → tamaño de la población
est → estratificado
Nh
Wh = → ponderación del estrato h
N
25 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia
n
fh = Nh → fracción de muestreo en el estrato h
h
n
h x
∑i=1 hi
x̅h = → media de la muestra en el estrato h
nh
n
h (x −x 2
∑i=1 hi ̅ h )
Sh 2 = → varianza estimada en el estrato h
nh −1
4.3. Estimación
4.3.1. Media
𝐋 𝐋
𝐍𝐡
𝐱̅ 𝐞𝐬𝐭 =∑ ∗ 𝐱̅ 𝐡 = ∑ 𝐖𝐡 ∗ 𝐱̅ 𝐡
𝐍
𝐡=𝟏 𝐡=𝟏
𝐋
𝐍𝐡 𝟐 𝐒𝐡 𝟐
𝐕(𝐱̅ 𝐞𝐬𝐭 ) = ∑ (𝟏 )
∗ − 𝐟𝐡 ∗
𝐍𝟐 𝐧𝐡
𝐡=𝟏
𝐋
𝐍𝐡 𝟐 𝐒𝐡 𝟐
𝐃𝐄(𝐱̅ 𝐞𝐬𝐭 ) = √∑ 𝟐 ∗ (𝟏 − 𝐟𝐡 ) ∗ = √𝐕(𝐱̅ 𝐞𝐬𝐭 )
𝐍 𝐧𝐡
𝐡=𝟏
26 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia
Observación: Los datos fueron extraídos en forma aleatoria a través de MAS en cada uno de
los departamentos.
Para Central → n1 = 4 y N1 = 25
Para Itapúa → n1 = 5 y N1 = 20
Solución:
L=3
N = N1 + N2 + N3 = 30 + 25 + 20 = 75
a) En este punto debemos hacer la estimación del promedio de gasto por la luz eléctrica
de los hogares en cada departamento, esto podremos hacer mediante la siguiente fórmula:
nh x
∑i=1 hi
x̅h = nh
27 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia
Podemos decir que si seleccionamos al azar un hogar del departamento de San Pedro,
esperamos que este tenga un gasto por luz eléctrica de Gs. 372.088 aproximadamente; si
escogemos de Central esperamos que tenga un gasto alrededor de Gs. 331.025 y, si
seleccionamos aleatoriamente un hogar de Itapúa esperamos que tenga un gasto
aproximado de Gs. 174.100.
b) Para estimar el promedio de gastos por luz eléctrica, usaremos la siguiente fórmula:
L
Nh
x̅est = ∑ ∗ x̅h
N
h=1
Por tanto:
N1 N2 N3 1
x̅est = ∗ x̅1 + ∗ x̅2 + ∗ x̅3 = ∗ (N1 ∗ x̅1 + N2 ∗ x̅2 + N3 ∗ x̅3 )
N N N N
Entonces:
1 1
x̅est = ∗ (30 ∗ 372.088 + 20 ∗ 331.025 + 25 ∗ 158.400) = ∗ 21.743.140
75 75
x̅est = 289.909
Esto nos indica que al seleccionar un hogar esperamos que el gasto promedio por la Luz
eléctrica sea Gs. 289.909 aproximadamente.
28 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia
4.3.2. Total
𝐭 𝐞𝐬𝐭 = ∑ 𝐱̅ 𝐡 ∗ 𝐍𝐡
𝐡=𝟏
𝐋
𝟐 𝐒𝐡 𝟐
𝐕(𝐭 𝐞𝐬𝐭 ) = ∑ 𝐍𝐡 ∗ (𝟏 − 𝐟𝐡 ) ∗
𝐧𝐡
𝐡=𝟏
𝐋
𝟐 𝐒𝐡 𝟐
𝐃𝐄(𝐭 𝐞𝐬𝐭 ) = √∑ 𝐍𝐡 ∗ (𝟏 − 𝐟𝐡 ) ∗ = √𝐕(𝐭 𝐞𝐬𝐭 )
𝐧𝐡
𝐡=𝟏
Ejemplo 1.11: Se pretende estudiar la disponibilidad total de dinero que poseen los alumnos
de una institución, para ello se utiliza el muestreo estratificado usando los 3 turnos
disponibles (mañana, tarde y noche) como estratos.
Solución:
a) Debemos estimar la disponibilidad total de dinero de los alumnos por cada turno.
Entonces tendremos:
Para la mañana:
29 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia
Para la tarde:
Para la noche:
Podemos decir que los alumnos del turno mañana disponen de 3.600.000 Gs., los de
turno tarde tienen disponible aproximadamente 6.500.000 Gs., mientras que los
alumnos del turno noche disponen de 5.175.000 Gs. Aproximadamente.
b) Para estimar el monto total que poseen los alumnos de la institución, debemos usar
la siguiente fórmula:
t est = ∑ x̅h ∗ Nh
h=1
Por tanto:
t est = 15.275.000
4.3.3. Proporción
𝐋
𝐍𝐡
𝐩𝐞𝐬𝐭 = ∑ ∗ 𝐩𝐡
𝐍
𝐡=𝟏
nh a
∑i=1 hi
Donde ph = nh
30 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia
𝐋
𝐍𝐡 𝟐 𝐩𝐡 ∗ (𝟏 − 𝐩𝐡 )
𝐕(𝐩𝐞𝐬𝐭 ) = ∑ 𝟐
∗ (𝟏 − 𝐟𝐡 ) ∗
𝐍 𝐧𝐡 − 𝟏
𝐡=𝟏
𝐋
𝐍𝐡 𝟐 𝐩𝐡 ∗ (𝟏 − 𝐩𝐡 )
𝐃𝐄(𝐩𝐞𝐬𝐭 ) = √∑ ∗ (𝟏 − 𝐟𝐡 ) ∗
𝐍𝟐 𝐧𝐡 − 𝟏
𝐡=𝟏
𝐈𝐂 = 𝐩𝐞𝐬𝐭 ± 𝐭 ∗ 𝐃𝐄(𝐩𝐞𝐬𝐭 )
Ejemplo 4.2:
Ejemplo 1. 12: A partir de los datos de la tabla siguiente, realizar una estimación de la
proporción de personas que no poseen seguro médico.
Solución:
Por tanto:
31 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia
la proporción de personas que no poseen seguro médico en cada una de las categorías de
ocupación.
Entonces:
Ahora bien, teniendo los datos mencionados más arriba, podemos calcular lo solicitado en el
ejemplo.
L
Nh
pest = ∑ ∗ ph
N
h=1
NDomésticas NDocentes
pest = ∗ pDomésticas + ∗ pDocentes
N N
15.000 25.000
pest = ∗ 0,90 + ∗ 0,07 = 0,38
40.000 40.000
3. Las principales variables a medir están íntimamente relacionadas con los tamaños de
las instituciones.
4. Se cuenta con una buena medida de tamaños para establecer los estratos.
32 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia
5.1. Definición
Una muestra por conglomerados es una muestra aleatoria en la que cada unidad de
muestreo es un conjunto, o conglomerado de elementos”.
33 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia
A diferencia del muestreo estratificado, en el muestreo por conglomerados nos interesa que
las unidades sean heterogéneas dentro de cada conglomerado, y que cada conglomerado
sea homogéneo entre uno y otro (Pérez, 2010).
Los siguientes puntos son algunas características principales del muestreo por
conglomerado, (Pérez 2010):
Pueden reducir los costos por observación, esto es debido a que generalmente las
unidades en los conglomerados no están tan dispersos geográficamente, sino, más
bien son agrupaciones geográficas, por tanto permite reducir gastos, como por
ejemplo: de transporte.
34 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia
∑n
1 mi
m
̅ = → tamaño medio del conglomerado en la muestra
n
M = ∑N
1 mi → número de elementos en la población
5.5. Estimaciones
En el muestreo por conglomerado también se puede estimar los valores de los parámetros
poblacionales.
∑𝐧𝟏 𝐲𝐢
𝐲̅ =
∑𝐧𝟏 𝐦𝐢
35 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia
𝐍−𝐧 ∑𝐧𝟏(𝐲𝐢 − 𝐲̅ ∗ 𝐦𝐢 )𝟐
𝐕(𝐲̅) = ( ) ∗
̅𝟐
𝐍∗𝐧∗𝐌 𝐧−𝟏
𝐈𝐂 = 𝐲̅ ± 𝐭 ∗ 𝐃𝐄(𝐲̅)
∑𝐧𝟏 𝐚𝐢
𝐩= 𝐧
∑𝟏 𝐦𝐢
𝐍−𝐧 ∑𝐧𝟏(𝐚𝐢 − 𝐩 ∗ 𝐦𝐢 )𝟐
𝐕(𝐩) = ( )∗
̅𝟐
𝐍∗𝐧∗𝐌 𝐧−𝟏
𝐈𝐂 = 𝐩 ± 𝐭 ∗ 𝐃𝐄(𝐩)
Si 𝐌 es conocido
𝐭 = 𝐌 ∗ 𝐲̅
𝐕(𝐭) = 𝐌𝟐 ∗ 𝐕(𝐲̅)
Si 𝐌 no es conocido
36 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia
𝐍 − 𝐧 ∑𝐧𝐢=𝟏(𝐲𝐢 − 𝐲̅𝐭 )𝟐
𝟐
𝐕(𝐭) = 𝐍 ∗ ( )∗
𝐍𝐧 𝐧−𝟏
1
Donde y̅t = n ∗ ∑n1 yi el cual es el promedio de los totales de conglomerados para los n
conglomerados muestreados.
𝐈𝐂 = 𝐭̅ ± 𝐭 ∗ 𝐃𝐄(𝒕)
Ejemplo 1.13: Los datos que se muestran en la tabla siguiente se refieren al número de
hogares y el total de personas por cada hogar según ciertos conglomerados seleccionados de
la capital en nuestro país. Para Asunción se estableció un total de 2.000 conglomerados.
Tabla 8: Número de hogares y el total de personas por cada hogar según conglomerados
muestreados.
37 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia
11 41 163 41 40
12 23 102 21 25
13 17 71 15 20
14 53 197 50 60
15 37 170 36 35
Solución:
a) Rememoremos las notaciones que debemos utilizar para la estimación de la media:
∑𝑛1 y𝑖
y̅ =
∑n1 mi
Dónde:
15
∑ mi = 493
1
15
∑ y𝑖 = 2.176
1
Ahora bien,
∑15
1 yi 2.176
y̅ = 15 = =4
∑1 m𝑖 493
38 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia
20
∑ mi = 493
1
20
∑ a𝑖 = 425
1
∑𝑛1 a𝑖 425
p= = = 0,86
∑n1 mi 493
Como está especificado en las formulas anteriores, existen dos opciones para la estimación
de un total a partir de un muestreo por conglomerado, estas dependen si M (número de
elementos en la población) es conocida o no.
𝑁 = 2.000 conglomerados
𝑛 = 15 conglomerados
20
∑ yi = 500
1
39 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia
2.000
t̅ = ∗ 500 = 66.667
15
40 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia
Bibliografía
Lohr, S. L. (2000). Muestreo: Diseño y Análisis. México: International Thomson Editores S.A.
Scheaffer, R. L., Mendenhall, W. & Lyman, R. (2007). Elementos de Muestreo (6a ed.).
Madrid: International Thomson Editores Spain Paraninfo S.A.
41 www.virtual.facen.una.py