Está en la página 1de 33

Cabe mencionar, que los Muestreos Probabilísticos que vamos a estudiar en este curso son:

1. El Muestreo Aleatorio Simple


2. El Muestreo Sistemático
3. El Muestreo Aleatorio Estratificado

UNIDAD III. MUESTREO ALEATORIO SIMPLE (MAS)


1. Características
2. Condiciones impuestas para calcular el tamaño de muestra
a) El nivel de confiabilidad
b) La Precisión o la Cota de Error (de muestreo)
3. Fórmula para calcular del tamaño de muestra cuando se desea estimar la Media de la Población
(𝜇𝑥 )
a) En una Población Infinita
b) En una Población Finita
4. Ejercicio
5. La estimación del Total de Poblacional
6. Factores que inciden en el tamaño de la muestra
7. Fórmula para calcular del tamaño de muestra cuando se desea estimar la Proporción de la
Población (𝑝) en un Muestreo de Atributos o Cualitativo:
a) En una Población Infinita
b) En una Población Finita
8. Ejercicio
9. Tamaño de muestra idóneo en Investigaciones de Mercado

Como su nombre lo indica, el Muestreo Aleatorio Simple, es el Muestreo más simple o sencillo de
todos los Muestreos Probabilísticos. Asimismo, como lo veremos, es la base en la cual se sustentan
todos los demás Muestreos Probabilísticos.

CARACTERÍSTICAS DE ESTE MUESTREO:

1. Todos los Elementos (o en su caso las Unidades de Muestreo) de la Población tienen la misma
probabilidad de ser seleccionados en la Muestra aleatoria.
𝑛
⇒ P(Elemento ∈ Muestra) =
𝑁

Esta característica implica que todas las muestras del mismo tamaño “𝑛” tienen la misma
probabilidad de ser seleccionadas:
1
⇒ P(muestra cualquiera) =
(𝑁
𝑛)

Donde: (𝑁
𝑛
) es el número total de muestras posibles en un muestreo sin remplazo

2. El MAS es apropiado para estudiar Poblaciones Homogéneas:

1
Es decir, en aquellas poblaciones cuyos Elementos de Muestreo presentan valores muy similares
con base en la variable objeto de estudio.

Sin embargo, no hay una regla que nos permita determinar cuándo una población deja de ser
homogénea y se convierte en heterogénea o viceversa, así que esto depende del juicio del
investigador.

Cabe mencionar, que se ha demostrado que si un MAS se aplica en poblaciones homogéneas se


generan estimadores con varianza mínima y, por el contrario, si se aplica en poblaciones
heterogéneas se obtienen estimadores con una enorme variación. Recordemos que una propiedad
idónea de un estimador es que tenga poca variación para obtener Errores de Muestreo (e)
pequeños e Intervalos de Confianza angostos.

3. Para aplicar un MAS se requiere contar con un Marco de Muestreo:

En consecuencia, el MAS se aplica básicamente en las Poblaciones Finitas o en las Poblaciones


Grandes y, por tanto, no se puede aplicar en Poblaciones Ilimitadas. A veces es posible aplicarlo
en aquellas poblaciones Difíciles de Contar siempre que sea factible generar un Marco de
Unidades de Muestreo.

El Marco de Muestreo (ya sea, de Elementos o de Unidades de Muestreo) se necesita para


numerar todos los Elementos (en su caso las Unidades de Muestreo) de la Población para realizar
una selección aleatoria de aquellos que deben participar en la muestra.

Fórmula para calcular el tamaño de muestra (𝒏) óptimo para estimar la Media de la Población
(𝜇𝑥 ):

Somos conscientes que en todo estudio de Muestreo se incurre en el Error de Muestreo (𝜀), así
que para determinar el tamaño de muestra (𝑛) es necesario que por adelantado se establezca el
máximo Error de Muestreo que se está dispuesto a aceptar en una investigación. Asimismo, como
el Error de Muestreo es una variable aleatoria (ya que sabemos que depende del Estimador
utilizado para inferir el valor del Parámetro: 𝜀 = 𝑥̅ - 𝜇𝑥 ), entonces también es necesario fijar el
Nivel de Confiabilidad (algunos autores le denominan también “Intervalo de Confianza”, porque
sabemos que éste se obtiene sumándole y restándole el Error de Muestreo al Estimador en
cuestión: ⇒ 𝑥̅ ∓ 𝜀).

Límite del Error de Muestreo, Precisión, Margen de Error o Cota de Error (𝜀):
Es el máximo Error de Muestreo que se está dispuesto a tolerar en un Estudio de Muestreo. Es
decir, es la máxima diferencia entre el valor del Estimador y el valor del Parámetro que se está
dispuesto a aceptar en un Muestreo aleatorio.

Ya hemos mencionado en múltiples ocasiones, que el Estimador por excelencia de la Media de la


Población (𝜇𝑥 ) es la Media Muestral (𝑥̅ ).

2
Recordando el TCL: La media muestral (𝑥̅ ) se distribuye como una Normal cuando la muestra es
𝜎𝑥2
grande con media 𝜇𝑥 y varianza . Es decir, simbólicamente:
𝑛

𝜎𝑥2
v. a. 𝑥̅ ~ N(𝜇𝑥 , 𝑛
) ⇔𝑛→∞

Estandarizando la v. a. 𝑥̅ :
𝑥̅ − 𝜇𝑥̅
⇒ La v. a. Z = 𝜎𝑥̅
……… (1)

Como 𝜇𝑥̅ = 𝜇𝑥 :
𝑥̅ − 𝜇𝑥
⇒ v. a. Z = 𝜎𝑥̅
……… (2)

Incorporando la Cota de Error (en el numerador) y el Nivel de Confiabilidad deseado en la


expresión (2):

Donde: 𝜀 = 𝑥̅ - 𝜇𝑥 ……. (3)


𝜀
⇒ 𝑍∝ = 𝜎 ……… (4)
2 ̅
𝑥

Despejando el Error Estándar (𝜎𝑥̅ ) y elevando al cuadrado ambos miembros:


𝜺𝟐
𝝈𝟐𝒙̅ = ……… (5) ← A partir de esta expresión de la Varianza de la media muestral se genera la
𝒁𝟐∝⁄2
fórmula para “𝑛”, tanto en una Población Finita como en una Infinita.

a) Primer caso: Si la Población es Infinita (si 𝑛⁄𝑁 ≤ 0.05 o si N = ?)


𝜎𝑥2
En este caso se aplica directamente el TCL: ⇒ 𝜎𝑥̅2 = 𝑛
……… (6.a)

Sustituyendo la expresión (6.a) en la (5):


𝜎𝑥2 𝜀2
⇒ 𝑛
= 𝑍2 ……… (7)
∝⁄ 2

Elevando ambos lados de la expresión (7) al exponente (-1):

𝑛 𝑍∝2⁄2
⇒ 𝜎𝑥2
= 𝜀2

Despejando “𝑛”:

𝑍∝2⁄2 𝜎𝑥2
𝑛= 𝜀2
………… (8.a) ← fórmula para calcular “n” con el fin de estimar 𝝁𝒙 en una población
Infinita (en un MAS)

b) Segundo caso: Si la Población es Finita (si 𝑛⁄𝑁 > 0.05)

3
En este caso a la Varianza de la media muestral (𝜎𝑥̅2 ) se le agrega el factor de corrección por finitud
(fcf) en la expresión (6.a):
𝜎𝑥2 𝑵−𝒏
⇒ 𝜎𝑥̅2 = (
𝑛 𝑵−𝟏
)……… (6.b)

Sustituyendo la expresión (6.b) en la (5):


𝜎𝑥2 𝑁−𝑛 𝜀2
⇒ (
𝑛 𝑁−1
) = 𝑍2
∝⁄ 2

𝜎𝑥2 𝑁−𝑛 𝜀2
⇒ ( ) =
𝑁−1 𝑛 𝑍∝2⁄2

𝑁−𝑛 (𝑁−1)𝜀 2
⇒ 𝑛
= 𝑍𝛼2⁄2 𝜎𝑥2

𝑁 𝑛 (𝑁−1)𝜀2
⇒ – = 2 𝜎2
𝑛 𝑛 𝑍𝛼 ⁄2 𝑥

𝑁 (𝑁−1)𝜀2
⇒ –1= 2 𝜎2
𝑛 𝑍𝛼 ⁄2 𝑥

𝑁 (𝑁−1)𝜀 2
⇒ 𝑛
= 𝑍𝛼2⁄2 𝜎𝑥2
+1

𝑁 (𝑁−1)𝜀 2 + 𝑍𝛼2⁄2 𝜎𝑥2


⇒ 𝑛
= 𝑍𝛼2⁄2 𝜎𝑥2

Elevando ambos miembros al exponente (-1):

𝑛 𝑍2⁄ 𝜎𝑥2
⇒ = (𝑁−1)𝜀𝛼2 2
𝑁 + 𝑍∝2⁄2 𝜎𝑥2

Despejando “𝑛”:
𝑁 𝑍2⁄ 𝜎𝑥2
⇒ 𝑛 = (𝑁−1)𝜀2𝛼+2𝑍2 2
∝⁄2 𝜎𝑥

Nota: con el fin de simplificar dicha expresión, supongamos que N – 1 = N (cabe mencionar que en
varios textos de Muestreo se considera este supuesto):
2 2
𝑁 𝑍𝛼 ⁄2 𝜎𝑥
𝑛= ……… (8.b) ← fórmula para calcular “n” con el fin de estimar 𝝁𝒙 en una población
𝑁𝜀 2 + 𝑍∝2⁄2 𝜎𝑥2

finita (en un MAS)

Nota: Los Niveles de Confiabilidad más utilizados son también los que usamos en la estimación del
Error de Muestreo y en el Intervalo de Confianza:

a) 90% o 0.90 ⇒ 𝑍𝛼⁄2 = 𝑍0.05 ≃ 1.65


b) 95% o 0.95 ⇒ 𝑍𝛼⁄2 = 𝑍0.025 = 1.96 (en algunos textos lo redondean a 2)← es el Nivel más utilizado
c) 99% o 0.99 ⇒ 𝑍𝛼⁄2 = 𝑍0.005 ≃ 2.58

4
Ejercicio: Estimar la superficie promedio (𝜇𝑥 ) de los productores de crisantemo de
Tequexquinahuac, Texcoco, Estado de México.

Condiciones deseadas:
1. 95% de confiabilidad: ⇒ 𝑍𝛼⁄2 = 𝑍0.025 = 1.96
2. Margen de Error o Cota de Error: 𝜀 = 120 m2 ⇒ |𝑥̅ - 𝜇𝑥 | ≤ 120

MARCO DE ELEMENTOS DE MUESTREO (productores de crisantemo):

PRODUCTORES DE CRISANTEMO DE TEQUEXQUINAHUAC ASOCIADOS A LA UNION


DE FLORICULTORES DE TEXCOCO (UNFLORTEX)
NUMERO SUPERFICIE CUBIERTA
ASIGNADO NOMBRE DEL PRODUCTOR (metros cuadrados)
1 BENJAMIN CARRILLO ESPEJEL 480
2 GERMAN ESPEJEL ESPEJEL 1,106
3 CRECENCIO VALDEZ MERAZ 1,656
4 DOMINGO HERNANDEZ MOLARES 672
5 LINO MARTINEZ ESPEJEL 200
6 ANDRES ESPEJEL HERNANDEZ 356
7 NICOLAS HERNANDEZ MERAZ 341
8 RAUL HERNANDEZ MERAZ 1,391
9 JAVIER CASTELL CHAVEZ 396
10 LUIS HERNANDEZ ESPEJEL 360
11 ELOY RICARDO NAVA SANCHEZ 520
12 MARCO RAUL HERNANDEZ CASTAÑEDA 600
13 CIPRIANO CASTILLO MORALES 1,168
14 JERONIMO HERNANDEZ MERAZ 720
15 JUAN MANUEL RUIZ BADILLO 1,616
16 ALFREDO MERAZ ESPEJEL 864
17 CEFERINO MERAZ ESPEJEL 512
18 RENE MIRANDA CRUZ 1,060
19 HIGINIO MIRANDA ESPEJEL 782
20 JOSE LUIS MERAZ 1,250
21 FELICIANO VELAZQUEZ ROGEL 225
22 FELIPE MONSALVO VALDEZ 710
23 GUSTAVO HERNANDEZ PEREZ 992

5
24 MACEDONIO VALDEZ MERAZ 1,064
25 MARIO ESPEJEL MIERANDA 208
26 DOMINGO GONZALEZ MERAZ 237
27 DIEGO CARRILLO MARTINEZ 1,775
28 FIDENCIO ESPEJEL RAMIREZ 993
29 ROBERTO HERNANDEZ MERAZ 530
30 ADOLFO PINEDA GUERRERO 990
31 JOSE CASTILLO JUAREZ 1,556
32 JOSE MELENCIO INOCENCIO MERAZ 816
33 PASCAL ORTIZ VALDEZ 2,122
34 ROBERTO NAVA SANCHEZ 731
35 RUBEN PEREZ ESPEJEL 136
36 ELODIA SAANCHEZ ESPEJEL 787
37 EUSTOQUIA NAVA HERNANDEZ 200
38 TELESFORO VALDEZ NAVA 488
39 MIGUEL HERNANDEZ ESPEJEL 195
40 ALEJANDRO AGUILAR ESPEJEL 416
41 EULALIO MENDEZ MONSALVO 1,260
42 GUILLERMO CERVANTES CASTILLO 240
43 JOSE LUIS MENDOZA 810
44 MARIO GUTIERREZ VALDEZ 108
45 JUAN MORALES MARTINEZ 756
46 JOSE LUIS CARRILLO MARTINEZ 600
47 RAUL GONZALEZ VALDEZ 399
48 BRUNO HERNANDEZ ISLAS 300
49 PEDRO SANCHEZ ESPEJEL 480
50 PEDRO MARTINEZ ESPEJEL 480
51 PEDRO CERVANTES BELTRAN 280
52 ELISEO MERAZ HERNANDEZ 986
53 RAYMUNDO MERAZ URIBE 3,337
54 PEDRO ROSA AYALA 592
55 BERNARDINO SANCHEZ CORONA 1,022
56 GUILLERMO SANCHEZ CORONA 766
57 NOE SANCHEZ SANCHEZ 1,235
58 PEDRO SANCHEZ SANCHEZ 1,240
59 AGUSTIN ROSAS GALICIA 990
60 MARIA ZARAGOZA ESPEJEL 240
61 MARCELO CERVANTES ROJAS 600
62 PEDRO SANCHEZ MEJIA 435
63 CRECENCIO ESPEJEL ESPEJEL 977
64 MANUEL FLORES ESPEJEL 176

6
65 MARTIN AYALA RIVERO 1,944
66 GREGORIO SANCHEZ LOPEZ 4,840
67 RAUL VALENCIA SANDOVAL 790
68 HERIBERTO TORRES NAVARRO 795
69 LUIS AYALA HERNANDEZ 575
70 FILIBERTO AYALA HERNANDEZ 1,150
71 CECILIO ROMERO AYALA 468
72 VICTOR ESPEJEL ESPEJEL 576
73 ARNULFO GALVAN MOSQUEDA 300
74 ARNULFO GALVAN FLORES 504
75 ALEJANDRO MOSQUEDA BUENDIA 1,440
76 DANIEL RIVERA BUENDIA 1,920
77 JOAQUIN ROMERO HERNANDEZ 936
78 ESTEBAN HERNANDEZ VELAZQUEZ 890
79 SALVADOR ESPINOZA MIRANDA 540
80 FELIPE ESPEJEL TERRAZAS 390

Calcular el tamaño de muestra (𝑛) apropiado para cumplir con las dos condiciones deseadas:

Nota: Como son 80 productores, entonces es obvio que se trata de una “población finita”

𝑁 𝑍∝2⁄2 𝜎𝑥2
⇒𝑛 = 𝑁𝜀 2 + 𝑍∝2⁄2 𝜎𝑥2

80(1.96)2 𝜎 2
𝑥 80(3.8416) 𝜎 2
𝑥 307.328 𝜎2
𝑥
⇒ 𝑛 = 80(𝟏𝟐𝟎)2 +(1.96)2 𝜎 2 = 80(𝟏𝟒,𝟒𝟎𝟎) +3.8416 𝜎2 = 𝟏′ 𝟏𝟓𝟐,𝟎𝟎𝟎+3.8416 𝜎2
𝑥 𝑥 𝑥

Para tener un valor exacto de la Varianza de la Población (𝜎𝑥2 ) deberíamos realizar un “censo”, es
decir, contar con todos los valores de la variable X (superficie): 𝑋1 , 𝑋2 , 𝑋3 ,…, 𝑋80 . Pero en ese
caso podríamos también calcular el valor exacto de 𝜇𝑥 y por tanto, ya no tendría sentido llevar a
cabo el Estudio de Muestreo. Obviamente, este procedimiento (un censo) sería muy laborioso y
costoso.

Entonces, ¿Cómo le hacemos para contar con un valor sobre 𝜎𝑥2 y que no sea mediante la
aplicación de un censo? Para resolver lo anterior, se puede recurrir a alguna de las siguientes dos
opciones:

a) 1ª. opción: Revisar estudios o investigaciones recientes, sobre el mismo tema y en la misma
región en los cuales se reporte el valor de la Varianza o de la Desviación Estándar; o al menos que
se publique información sobre dicha variable X (la superficie) mediante la cual podamos obtener
una estimación de la varianza.

b) 2ª. opción: Levantar una muestra piloto y a partir de la información de ésta obtener una
estimación de la Varianza Poblacional. (cabe mencionar, que esta es la opción más utilizada).

7
Así que en este problema vamos a levantar una muestra piloto de 12 productores de crisantemo
(Cabe hacer mención que no existe una regla para determinar el tamaño adecuado de la muestra
piloto, así que queda al criterio del investigador).
Pero debe ser una “muestra aleatoria”, así que en este ejercicio nos ubicaremos en la tabla de
números aleatorios en: la fila 81, columna 14, por columna y los últimos dos dígitos (ya que el
número N = 80 tiene 2 dígitos).

Los 12 números aleatorios son los siguientes (vamos a usar la modalidad de números aleatorios,
comenzando por el uno, así que los Elementos de Muestreo quedarían numerados como: 01, 02,
03, …, 80) ⇒ 56, 62, 41, 36, 28, 48, 08, 67, 50, 31, 71, 29 (33, 39, 30) ← añado tres números por si
algún o algunos productores se niegan a responder la encuesta o no se les localiza cuando se lleve
a cabo el estudio o ya no se dedican al cultivo de crisantemo o a lo mejor ya ni existen porque el
Marco de Muestreo no está actualizado, etc.

No. No. aleatorio Nombre Superficie (𝑋𝑖 ), m2


1 56 Guillermo Sánchez Corona 𝑥1 = 766
2 62 Pedro Sánchez Mejía 𝑥2 = 435
3 41 Eulalio Méndez Monsalvo 𝑥3 = 1,260
4 36 Elodia Sánchez Espejel 𝑥4 = 787
5 28 Fidencio Espejel Ramírez 𝑥5 = 993
6 48 Bruno Hernández Islas 𝑥6 = 300
7 08 Raúl Hernández Meraz 𝑥7 = 1,391
8 67 Raúl Valencia Sandoval 𝑥8 = 790
9 50 Pedro Martínez Espejel 𝑥9 = 480
10 31 José Castillo Juárez 𝑥10 = 1,556
11 71 Cecilio Romero Ayala 𝑥11 = 468
n’ = 12 29 Roberto Hernández Meraz 𝑥12 = 530
------ 33 Pascal Ortiz Valdez ---------
------ 39 Miguel Hernández Espejel Σ𝑥𝑖 = 9,756
------ 30 Adolfo Pineda Guerrero Σ𝑥𝑖2 = 9’769,440

Con base en la calculadora:


𝑆̂𝑥 = 408.746643 ⇒ 𝑆̂𝑥2 = 167,073.8182 (varianza de la muestra piloto) 𝑒𝑠𝑡𝑖𝑚𝑎 a 𝜎𝑥2 = ?

Sustituyendo 𝜎𝑥2 por 𝑆̂𝑥2 en la expresión del tamaño de muestra (𝑛):

307.328 (167,073.8182) 51′ 346,462.4 51′ 346,462.4


⇒ 𝑛 = 𝟏′ 𝟏𝟓𝟐,𝟎𝟎𝟎 + 3.8416 (167,073.8182) = 𝟏′ 𝟏𝟓𝟐,𝟎𝟎𝟎 + 641,830.78 = 𝟏′ 𝟕𝟗𝟑,𝟖𝟑𝟎.𝟕𝟖
= 28.62…

∴ 𝑛 = 29 productores

Pero, quiero trabajar con un tamaño de muestra más pequeño, por lo que tenemos dos opciones:
1. Disminuir el nivel de confiabilidad, por ejemplo, con un 90%: 𝑍𝛼⁄2 = 𝑍0.05 = 1.65
2. Bajar la precisión en nuestra estimación, es decir, aumentando el valor de la Cota de Error; por
ejemplo, aplicar 𝜀 = 150 m2 ⇒ |𝑥̅ - 𝜇𝑥 | ≤ 150 (en este ejercicio, yo voy aplicar esta última opción)
3. O ambas opciones: modificar la Cota de Error y el Nivel de Confianza simultáneamente

8
51´ 346,462.4 51´346,462.4 51´346,462.4 51´346,462.4
⇒𝑛 = = = = = 21.027…
80 (𝟏𝟓𝟎)2 + 641,830.78 80 (𝟐𝟐,𝟓𝟎𝟎) + 641,830.78 𝟏´𝟖𝟎𝟎,𝟎𝟎𝟎 + 641,830.78 𝟐´ 𝟒𝟒𝟏,𝟖𝟑𝟎

∴ 𝑛 = 22 productores ← esta es la muestra definitiva

Notas:
1. Cuando el valor de “𝑛” sea un número fraccionario (lo que es muy probable que suceda)
siempre se debe redondear hacia arriba. Porque el tamaño de muestra mínimo para cumplir
cabalmente las dos condiciones deseadas (95% de confiabilidad y 𝜀 = 150 m2) es de 𝒏 = 21.027 y
no de 𝑛 = 21.

2. Aunque el tamaño de muestra definitivo sea menor a 30 datos, se debe utilizar la v. a. Z en el


cálculo del tamaño de muestra.

Obviamente 𝑛 = 22 es una muestra pequeña y, por tanto, no aplica el TCL para garantizar que la
Media Muestral (𝑥̅ ) se distribuya como una Normal. Así que vamos a suponer que la Población o
sea la v. a. X (en este ejercicio, la superficie cultivada con crisantemo) se distribuye (si no
exactamente, al menos aproximadamente) como una Normal (desde luego en un problema real
habría que verificar el cumplimiento de este supuesto).

Nota:
Con el fin de aprovechar la información recabada en la muestra piloto (puesto que representa
trabajo ya realizado y recursos financieros ya desembolsados), entonces hay que ubicarnos en el
mismo punto de la tabla de números aleatorios y con las mismas condiciones (fila 81, columna 14,
por columna y los últimos dos dígitos).

Los 22 números aleatorios son: 56, 62, 41, 36, 28, 48, 08, 67, 50, 31, 71, 29, 33, 39, 30, 72, 47, 80,
68, 30, 67, 70, 21, 62, 01 (79, 75, 18, 53, 65, 19).

No. No. aleatorio Superficie (𝑋𝑖 ), m2


1 56 𝑥1 = 766
2 62 𝑥2 = 435
3 41 𝑥3 = 1,260
4 36 𝑥4 = 787
5 28 𝑥5 = 993
6 48 𝑥6 = 300
7 08 𝑥7 = 1,391
8 67 𝑥8 = 790
9 50 𝑥9 = 480
10 31 𝑥10 = 1,556
11 71 𝑥11 = 468
12 29 𝑥12 = 530
13 33 𝑥13 = 2,122
14 39 𝑥14 = 195
15 30 𝑥15 = 990
16 72 𝑥16 = 576
17 47 𝑥17 = 399

9
18 80 𝑥18 = 390
19 68 𝑥19 = 795
20 70 𝑥20 = 1,150
21 21 𝑥21 = 225
𝒏 = 22 01 𝑥22 = 480
----- 79 ----------
----- 75 Σ𝑥𝑖 = 17,078
----- 18 y
----- 53 2
Σ𝑥𝑖 = 18’169,076
----- 65 ----------
----- 19 ----------

1 1
1) 𝑆𝑥 = 483.6316… y 2) 𝑥̅ = 𝑛 Σ𝑥𝑖 = 22 (17,078) = 776.272…

̅ = 776.3 m2
⇒ 𝒙

Por tanto, se estima que la superficie promedio (𝜇𝑥 ) que cultivan con crisantemo los productores
de Tequexquinahuac es de 776.3 m2. (Obviamente, esta es una estimación puntual).

¿Qué tan buena (o mala) es esta estimación?, es decir ¿qué tan cerca (o alejada) se encuentra
esta estimación (𝑥̅ = 776.3 m2) de la superficie promedio verdadera (𝜇𝑥 ), o sea del Parámetro
poblacional? No sabemos (porque desconocemos el valor exacto de 𝜇𝑥 ), pero confiamos en que
se encuentra cerca, ya que partimos de una confiabilidad de 95% al calcular el tamaño de muestra
(𝑛).

Así que puede suceder que:

a) Cola izquierda: 𝜇𝑥 = ? Estimación muy alejada de 𝜇𝑥


⃡ 𝑥̅ = 776.3 (2.5% de las veces)
(valor de 𝒙
̅ muy pequeño)

b) 𝜇𝑥 = ? Estimación muy cercana a


𝜇𝑥
⃡ 𝑥̅ = 776.3 (95% de las veces)

c) 𝜇𝑥 = ? Estimación muy cercana a


𝜇𝑥
⃡ 𝑥̅ = 776.3 (95% de las veces)

d) Cola derecha: 𝜇𝑥 = ? Estimación muy alejada de


𝜇𝑥
⃡ 𝑥̅ = 776.3 (2.5% de las veces)
(valor de 𝒙̅ muy grande)

10
Para responder qué tan cerca o alejada se encuentra nuestra estimación (𝑥̅ = 776.3 m2) de la
verdadera superficie promedio (𝜇𝑥 ), entonces vamos a obtener una estimación del Error de
Muestreo (e). Utilicemos también una confiabilidad de 95% (aunque se puede usar un nivel de
confiabilidad distinto al usado para calcular el tamaño de muestra, así que podríamos utilizar un
90%, un 92%, un 97.5%, un 99%, etc.).

a) Como 𝑛 = 22 es una muestra pequeña, entonces debemos utilizar la v. a. t:

⇒ e = 𝑡𝛼,𝑛−1 𝑆𝑥̅
2

b) Como la Población es Finita, entonces debemos agregar el fcf en el Error Estándar de 𝑥̅ . Y si


𝑛 22
tenemos duda si es Finita, entonces obtenemos la fracción de muestreo: = = 0.275 > 0.05 ⇒
𝑁 80
obviamente la Población es Finita:

𝑆𝑥 𝑵−𝒏 𝟏
⇒ e = 𝑡𝛼,𝑛−1 ( )𝟐
2 √𝑛 𝑵−𝟏

Datos:

a) 𝑛 = 22; b) N = 80; c) 𝑆𝑥 = 483.6316 (obtenido de la calculadora);

d) 𝑡𝛼,𝑛−1 = 𝑡0.025,22−1 = 𝑡0.025,21 = 2.0796; Véase que es un poco mayor que: 𝑍0.025 = 1.96
2

Sustituyendo valores:

483.6316 80−22 1 483.6316 58 1


⇒ e =2.0796( )( 80−1 )2 = 2.0796 (4.690415)(79)2 = 2.0796(103.1106036)(0.856841) =
√22
183.731..

∴ e ≃ 183.7 m2

Nota:
Como e = 183.7 m2 resultó mayor que la Cota de Error (es decir, que la máxima diferencia
aceptable entre el valor de 𝑥̅ y el valor de 𝜇𝑥 ), entonces se debe aumentar el tamaño de muestra
hasta que se logre que e ≤ 𝜺 = 150. (Pero nosotros así lo vamos a dejar, ya que incrementé la
muestra hasta 𝑛 = 30 y, aun así, no fue posible cumplir dicha condición).

Interpretación del Error de Muestreo:

|𝑥̅ = 776.3 − 𝜇𝑥 | ≤ 183.7 ← con un 95%

Interpretación:
Con un 95% de confiabilidad, la diferencia es MENOR o cuando más igual a 183.7 m2 entre la
superficie promedio estimada (𝑥̅ = 776.3 m2) y la superficie promedio verdadera (𝜇𝑥 ) cultivada con
crisantemo por los productores de Tequexquinahuac.

11
Nota:
Como en este ejercicio contamos con la información de la superficie cultivada por todos los
productores de crisantemo, entonces podemos calcular la superficie promedio verdadera (𝜇𝑥 ),
misma que asciende a 854 m2; por lo que el Error de Muestreo verdadero es: 𝜀 = 𝑥̅ - 𝜇𝑥 = 776 – 854
= -78 = |-78| = 78 m2. Error que claramente es inferior al Error de Muestreo máximo calculado de
183.7 m2 al 95%.

El Intervalo de Confianza para la superficie promedio real (𝜇𝑥 ) con un 95% de confiabilidad:

⇒ 𝑥̅ ∓ e

a) LI = 𝑥̅ – e = 776.3 – 183.7 = 592.6 m2


b) LS = 𝑥̅ + e = 776.3 + 183.7 = 960 m2

∴ P(592.6 m2 ≤ 𝜇𝑥 ≤ 960 m2) = 0.95

Interpretación:
Con un 95% de confiabilidad, el Intervalo [592.6 m2, 960 m2] contiene a la superficie promedio
cultivada con crisantemo por los productores de Tequexquinahuac de Texcoco, Estado de México.

Interpretación convencional:
Con un 95% de confiabilidad, la superficie promedio cultivada con crisantemo por los productores
de Tequexquinahuac se encuentra entre 592.6 m2 y 960 m2.

Nota:
También véase que el Intervalo [592.6, 960] contiene al Parámetro 𝜇𝑥 = 854 𝑚2

Nota:
Parece que el Error de Muestreo (e) y la longitud del I de C son muy grandes, así que para tener
una estimación (𝑥̅ ) más precisa (más cercana a µ𝑥) deberíamos incrementar el tamaño de muestra.

Así tenemos:
a) e = 183.7 ← muy grande
b) Amplitud del I de C: A = LS – LI = 960 – 592.6 = 367.4 = 2(e) ← demasiado amplio

1) Véase gráficamente la interpretación de e = 183.7 m2:

𝜇𝑥 = ?

⃡ −𝑒 𝑥̅ = 776 +𝑒 ← con un 95% de confiabilidad

2) Véase gráficamente la interpretación del Intervalo de Confianza:

𝜇𝑥 = ?
𝐿𝐼 = 592.6 𝑥̅ = 776.3 𝐿𝑆 = 960 ← con 95% de confiabilidad

12
Conclusión:
Si la diferencia entre 𝑥̅ = 776.3 y 𝜇𝑥 es MENOR o cuando más igual a 183.7 m2 (véase el inciso 1),
entonces eso significa también que el I de C incluye a 𝜇𝑥 (véase el inciso 2). Es decir, si el I de C
incluye a 𝜇𝑥 (véase el inciso 2), entonces, también significa que la diferencia entre 𝑥̅ = 776.3 y el
valor de 𝜇𝑥 (o sea el Error de Muestreo) es MENOR o cuando más igual a 183.7 m2 (véase inciso
1).

Por eso es que se afirma que tanto la interpretación del Error de Muestreo como la del Intervalo
de Confianza conducen a la misma conclusión; por eso en los Estudios de Muestreo únicamente se
reporta el valor del Error de Muestreo (e).

1) Véase gráficamente, cuando la diferencia entre 𝑥̅ y 𝜇𝑥 es mayor al Error de Muestreo estimado (e):

⃡ ⃡− 𝑒 𝑥̅ = 776.3 +𝑒
↑ ↑ ← con un 5%
𝜇𝑥 = ? 𝜇𝑥 = ?

2) Véase gráficamente cuando el I de C no incluye a 𝝁𝒙 :

𝐿𝐼 𝑥̅ = 776.3 𝐿𝑆
↑ ↑ ← con un 5%
𝜇𝑥 = ? 𝜇𝑥 = ?
↓ ↓
⇒ 𝜇𝑥 < 592.6 ⇒ 𝜇𝑥 > 960

Conclusión:
Si la diferencia real entre 𝑥̅ y 𝜇𝑥 es mayor que e = 183.7 (véase el inciso 1), entonces también
significa que el Intervalo no incluye a 𝝁𝒙 (véase el inciso 2) y, viceversa. O sea que si el I de C no
incluye a 𝝁𝒙 (véase el inciso 2), entonces también implica que la diferencia entre 𝑥̅ y 𝜇𝑥 es mayor
que e = 183.7 (véase el inciso 1).

Así que nuevamente, ambas interpretaciones (del Error de Muestreo y del Intervalo) conllevan a la
misma conclusión, es decir, en un Estudio de Muestreo es suficiente una sola interpretación.

Estimación del Total Poblacional (𝜏):


En algunas variables cuantitativas es de interés obtener el Total Poblacional.

Además, se puede demostrar que el Total Poblacional depende de la Media de la Población:

13
Σ𝑋𝑖 𝑋1 + … +𝑋𝑁 𝐸𝑙 𝑇𝑜𝑡𝑎𝑙 𝜏
𝜇𝑥 = 𝑁
= 𝑁
= 𝑁
=𝑁

𝜏 = 𝑁𝜇𝑥 ………. (9) ← esta es la fórmula del cálculo del Parámetro Total Poblacional. Sustituyendo
𝜇𝑥 por 𝑥̅ , se obtiene el Estimador: Total de la Muestra (𝜏̂ )

Así que el Total Poblacional (𝜏) se estima mediante su Estimador natural, el Total muestral (𝜏̂ ):

⇒ 𝜏̂ = 𝑁𝑥̅ ………. (10)

Como 𝜏̂ es un Estimador, entonces cuando se lleva a cabo un Muestreo inevitablemente se


incurrirá en el Error de Muestreo (𝜀). Así que en este caso dicho Error es:

𝜀 = (el factor de confiabilidad)(el Error Estándar del Estimador en cuestión)

⇒ 𝜀𝜏̂ = (v. a. Z o v. a. t)(el Error Estándar del Total muestral)

⇒ 𝜀𝜏̂ = (𝑍𝛼 o 𝑡𝛼,𝑛−1 )(𝜎𝜏̂ ) ………. (11)


2 2

Necesitamos obtener la Varianza del Total muestral (V(𝜏̂ ) o 𝜎𝜏̂2 ):

⇒ 𝜎𝜏̂2 = V(𝜏̂ ) = V(N𝑥̅ ) = 𝑁 2 V(𝑥̅ ) = 𝑁 2 𝜎𝑥̅2 ………. (12)

∴ 𝜎𝜏̂ = 𝑁𝜎𝑥̅ ……….. (13)

Sustituyendo la expresión (13) en la (11):

⇒ 𝜀𝜏̂ = (𝑍𝛼 o 𝑡𝛼,𝑛−1 )(𝑁𝜎𝑥̅ ) ………. (14)


2 2

Pero como en una Muestreo únicamente obtenemos el Error Estándar estimado (𝑆𝑥̅ ) y no el valor
exacto de 𝜎𝑥̅ ; entonces ya sabemos que lo que se obtiene es una estimación del Error de Muestreo
(e):

⇒ 𝑒𝜏̂ = (𝑍𝛼 o 𝑡𝛼,𝑛−1 )(𝑁𝑆𝑥̅ ) ………. (15.a)


2 2

⇒ 𝑒𝜏̂ = N(𝑍𝛼 o 𝑡𝛼,𝑛−1 )(𝑆𝑥̅ ) ………. (15.b)


2 2

Donde ya sabemos que el Error de Muestreo de la media (𝑒𝑥̅ ) es:

𝑒𝑥̅ = (𝑍𝛼 o 𝑡𝛼,𝑛−1 )(𝑆𝑥̅ ) ……….. (16), y sustituyendo la expresión (16) en la (15.b):
2 2

∴ 𝑒𝜏̂ = 𝑁𝑒𝑥̅ ………. (17) ← es la fórmula para el cálculo del Error de Muestreo del Total muestral (o estimado)

El Intervalo de Confianza para el Total Poblacional (𝜏):

14
𝜏̂ ∓ 𝑒𝜏̂ ………. (18.a) ← en forma resumida

a) LI = 𝜏̂ - 𝑒𝜏̂
b) LS = 𝜏̂ + 𝑒𝜏̂

∴ P(LI ≤ 𝜏 ≤ LS) = 1 – 𝛼 ……….. (18.b) ← en forma desplegada

Ejercicio: Estimar la superficie cultivada total con crisantemo en Tequexquinahuac, Texcoco,


Estado de México

⇒ 𝜏̂ = N𝑥̅

⇒ 𝜏̂ = 80(776.272 m2) = 62,102 m2 ≃ 6.2 hectáreas

Por tanto, se estima que en Tequexquinahuac se cultivan 6.2 hectáreas con crisantemo

1) Obtener el Error de Muestreo (𝑒𝜏̂ ) al 95% de confiabilidad:

⇒ 𝑒𝜏̂ = 𝑁𝑒𝑥̅ = 80(183.731 m2) = 14,698 m2 ≃ 1.5 Ha

Así que la diferencia entre la superficie total estimada (6.2 Ha) y la superficie total verdadera
cultivada con crisantemo en Tequexquinahuac, Texcoco, Estado de México es MENOR o cuando
más igual 1.5 hectáreas con un 95% de confiabilidad.

2) Obtener el Intervalo de Confianza para la superficie total (𝜏) cultivada con crisantemo al 95%:

⇒ 𝜏̂ ∓ 𝑒𝜏̂

a) LI = 𝜏̂ - 𝑒𝜏̂ = 6.2 – 1.5 = 4.7 Ha


b) LS = 𝜏̂ + 𝑒𝜏̂ = 6.2 + 1.5 = 7.7 Ha

∴ P(4.7 Ha ≤ 𝜏 ≤ 7.7 Ha) = 95%

Por lo tanto, se estima que la superficie total cultivada con crisantemo en Tequexquinahuac se
encuentra entre 4.7 y 7.7 hectáreas con un 95% de confiabilidad.

Factores que inciden en el tamaño de la muestra (𝑛):

En principio partamos de la fórmula de “𝑛” cuando la Población es Infinita:


2 2
𝑍𝛼 ⁄2 𝜎𝑥
⇒ 𝑛= 𝜀2

Por tanto, en esta expresión podemos identificar tres factores:


1. El Nivel de Confiabilidad deseado: ⇒ 𝑍𝛼⁄2
2. La Variación de la Población: 𝜎𝑥2

15
3. La Cota de Error deseada: 𝜀

Nota:
Obviamente los dos factores que aparecen en el numerador (𝑍𝛼⁄2 y 𝜎𝑥2 ) tienen una relación
directa y, por el contrario, el factor que aparece en el denominador (𝜀) tiene una relación inversa
con el tamaño de muestra (𝑛).

1. El Nivel de Confiabilidad deseado (𝑍𝛼⁄2 ):


Se establece una relación directa entre el Nivel de Confiabilidad deseado y el tamaño de muestra.
Lo que parece obvio, si queremos mayor confiabilidad en la estimación del parámetro, entonces el
costo es un mayor tamaño de muestra y viceversa.

Así si deseamos:
a) 90% ⇒ 𝑛 = 17
b) 95% ⇒ 𝑛 = 22
c) 99% ⇒ 𝑛 = 31

2. La Variación de la Población o de la Variable Aleatoria estudiada (𝜎𝑥2 ):


También se establece una relación directa entre la Variación de la Población y el tamaño de
muestra. Es decir, si la Variación es pequeña (cuando los Elementos son muy semejantes entre sí,
el caso de una población Homogénea) entonces se requiere un tamaño de muestra pequeño
(incluso si todos los Elementos fueran idénticos, entonces bastaría con estudiar un solo Elemento
para tener una estimación precisa del Parámetro) y, por el contrario, si la Variación entre ellos es
grande (Población Heterogénea) entonces se requerirá un tamaño de muestra grande para que
cubra esa gran diversidad observada en la Población.

Por ejemplo si:


a) 𝜎𝑥2 = 140,000 ⇒ 𝑛 = 19
b) 𝜎𝑥2 = 167,000 ⇒ 𝑛 = 22
c) 𝜎𝑥2 = 200,000 ⇒ 𝑛 = 24

3. La Cota de Error de Muestreo o la Precisión (𝜀):


En este caso se establece una relación inversa entre el Margen de Error y el tamaño de la
muestra. O sea si somos muy exigentes en nuestra estimación del Parámetro, es decir, si el valor
de la Cota es muy pequeña entonces se va a requerir un tamaño de muestra muy grande (Incluso
el caso extremo si deseamos un Error de Muestreo igual a cero, entonces debemos estudiar a toda
la Población, o sea llevar a cabo un Censo). Por el contrario, si establecemos una Cota de Error
enorme entonces se necesitará un tamaño de muestra pequeño (ya que seremos poco exigentes
en nuestra estimación).

Así por ejemplo si:


a) 𝜀 = 50 ⇒ 𝑛 = 61
b) 𝜀 = 120 ⇒ 𝑛 = 29
c) 𝜀 = 150 ⇒ 𝑛 = 22

4. Sin embargo, revisando la fórmula de “𝑛” en una Población Finita:

16
𝑵𝑍𝛼2⁄2 𝜎𝑥2
⇒𝑛 =
𝑵𝜀 2 + 𝑍𝛼2⁄2 𝜎𝑥2

Detectamos que existe un cuarto factor que incide en la determinación del tamaño de la muestra:
el tamaño de la Población (N).

¿Y cómo incide N en el tamaño de la muestra (𝑛)? Vemos que N aparece tanto en el numerador
como en el denominador. Pero el dato de N en el numerador incide completamente en “𝑛”, en
cambio, N en el denominador aparece en uno de los dos términos, por tanto se diluye su efecto en
N, en consecuencia el efecto del dato de N en el numerador impera sobre el que aparece en el
denominador.
Así que al aparecer en el numerador el valor de N de mayor incidencia sobre “𝑛”, entonces se
desprende que se establece una relación directa entre N y el tamaño de la muestra (𝑛).

Lo cual parece lógico, así a menor tamaño de la Población menor tamaño de la muestra y
viceversa, o sea a mayor tamaño de la Población mayor tamaño de muestra.

Así tenemos que si:


a) N = 80 ⇒ 𝑛 = 22
b) N = 200 ⇒ 𝑛 = 25
c) N = 1,000 ⇒ 𝑛 = 28
d) N = 10,000 ⇒ 𝑛 = 29 ⇒ Población Infinita
e) N = 100,000 ⇒ 𝑛 = 29 ⇒ Población Infinita
f) N → ∞ ⇒ 𝑛 = 29 ⇒ Población Infinita

Notas:
a) Obsérvese que cuando la Población es Infinita se alcanza el tamaño de muestra más grande
posible.
b) Asimismo, véase que el tamaño de la población únicamente incide en el tamaño de la muestra
cuando la Población es finita.

Conclusión:
Por tanto, podemos afirmar que hay tres factores fundamentales que determinan el tamaño de
muestra (el Nivel de Confiabilidad deseado, la Cota de Error deseada y la Variación de la
Población). Y hay un cuarto factor, el tamaño de la población, pero éste incide sólo de manera
marginal en el tamaño de muestra.

Nota:
Cuando estudiemos el Muestreo Aleatorio Estratificado nos daremos cuenta que hay un quinto
factor, a saber el Costo Unitario de Investigación, es decir, el recurso financiero (el dinero).

Nota:
En ciertas situaciones, por ejemplo cuando el tamaño de la Población fluctúa entre 7,000 y 10,000;
no sabemos si dicha Población la tratamos como Finita o Infinita y, por tanto, no sabemos cuál
fórmula utilizar para calcular el tamaño de muestra (si la de Población Infinita o la de Finita).

En estos casos se hace lo siguiente:

17
1er. paso: Se calcula el tamaño de muestra (𝑛) como si la Población fuese Infinita: esto, como ya
vimos, garantiza el mayor tamaño de muestra posible:
𝑍𝛼2⁄2 𝜎𝑥2
⇒𝑛 = 𝜀2

2º. paso: Se obtiene la fracción de muestreo (𝑛⁄𝑁):

a) Si 𝑛⁄𝑁 ≤ 0.05; entonces se concluye que la Población es Infinita y por tanto, se usa el
tamaño de muestra calculado en el primer paso.

b) Si 𝑛⁄𝑁 > 0.05; entonces se concluye que la Población es Finita y por tanto, se procede a
recalcular el tamaño de muestra con base en la fórmula de Población Finita:
𝑁 𝑍𝛼2⁄2 𝜎𝑥2
⇒𝑛 = 𝑁𝜀 2 + 𝑍𝛼2⁄2 𝜎𝑥2

ESTIMACIÓN DE LA PROPORCIÓN POBLACIONAL O MUESTREO CUALITATIVO O “MUESTREO DE


ATRIBUTOS” (p):

Ya hemos mencionado que uno de los pocos Parámetros que podemos obtener en Variables
Cualitativas es la Proporción.

Derivación de la fórmula para calcular el tamaño de muestra (𝑛) óptimo para estimar la
Proporción de la Población (𝑝):

También ya hemos mencionado que el Estimador natural de la Proporción Poblacional (𝑝) es la


Proporción Muestral (𝑝̂ ).

Recordemos que en la Unidad II también dijimos que los Estadísticos han encontrado que cuando
el tamaño de muestra es grande entonces la Proporción Muestral se distribuye como una
Normal.
𝑝𝑞 𝒑𝒒
⇒ La v. a. 𝑝̂ ~ N(𝑝, 𝑛
) ⇔ 𝑛 → ∞ ⇒ a) 𝝁𝒑̂ = 𝒑 y b) 𝝈𝟐𝒑̂ = 𝒏

Si la Proporción Muestral (𝑝̂ ) se distribuye como una Normal, entonces es factible


“estandarizarla” (es decir, transformarla en la v. a. Normal Estándar: la v. a. Z):
𝑝̂ − 𝜇𝑝
̂ 𝑝̂ − 𝑝
⇒ La v. a. Z = 𝜎𝑝
= 𝜎𝑝
………. (19)
̂ ̂

Incorporando las dos condiciones deseadas: el Nivel de confiabilidad (1- α) y la Cota de Error: 𝜀 ≤
|𝑝̂ − 𝑝|:
𝜀
⇒ 𝑍𝛼 = 𝜎 ……….. (20)
2 ̂
𝑝

18
Despejando el Error (la desviación) Estándar de la Proporción Muestral (𝜎𝑝̂ ):
𝜀
⇒ 𝜎𝑝̂ = ……… (21)
𝑍𝛼
2

Elevando al cuadrado la expresión (21):


𝜺𝟐
⇒ 𝝈𝟐𝒑̂ = ………. (22) ← A partir de esta expresión de la Varianza de la Proporción Muestral se
𝒁𝟐∝⁄2
genera la fórmula para “𝑛”, tanto para una Población Finita como en una Infinita.

𝑛
a) Primer caso: Si la Población es Infinita (si 𝑁 ≤ 0.05 o si N = ?)
𝑝𝑞
⇒ 𝜎𝑝2̂ = 𝑛
………. (23.a)

Sustituyendo la expresión (23.a) en la (22):


𝑝𝑞 𝜺𝟐
⇒ =
𝑛 𝒁𝟐∝⁄𝟐

Despejando 𝑛:
2
𝑍𝛼 ⁄2 𝑝𝑞
𝑛= ………….. (24.a) ← fórmula para calcular “n” con el fin de estimar p en una población
𝜀2
Infinita (en un MAS)

b) Segundo caso: Si la Población es Finita (si 𝑛⁄𝑁 > 0.05)

En este caso a la Varianza de la Proporción Muestral (𝜎𝑝2̂ ) hay que agregarle el fcf:

𝑝𝑞 𝑵−𝒏
⇒ 𝜎𝑝2̂ = ( ) ……….. (23.b)
𝑛 𝑵−𝟏

Sustituyendo la expresión (23.b) en la (22):


𝑝𝑞 𝑵−𝒏 𝜺𝟐
⇒ ( ) =
𝑛 𝑵−𝟏 𝒁𝟐∝⁄𝟐

𝑁−𝑛 𝑝𝑞 𝜺𝟐
⇒ =
𝑛 𝑁−1 𝒁𝟐∝⁄𝟐

Despejando 𝑛:
𝑁𝑍2⁄ 𝑝𝑞
⇒ 𝑛 = (𝑁−1)𝜀2𝛼+2𝑍2
𝛼⁄2 𝑝𝑞

Para simplificar dicha expresión, se considera que N -1 = N:

19
𝑁 𝑍𝛼2⁄2 𝑝𝑞
𝑛= 𝑁𝜀 2 + 𝑍𝛼2⁄2 𝑝𝑞
……….. (24.b) ← fórmula para calcular “n” con el fin de estimar p en una

población
finita (en un MAS)

Nota: Se puede constatar que estas fórmulas (24.a y 24.b) son muy similares a sus
correspondientes cuando se desea estimar la Media (𝜇𝑥 ) y únicamente difieren en que el factor
“pq” se reemplaza por la Varianza de la Población (𝝈𝟐𝒙 ).

𝒑𝒒 𝝈𝟐𝒙
Lo cual se debe a que: 𝜎𝑝2̂ = 𝑛
versus 𝜎𝑥̅2 = 𝑛
; por lo tanto, nótese que ambas Varianzas
difieren sólo en el numerador.

Ejercicio:
Estimar la Proporción (o el porcentaje) de alumnas en la generación de 5o. año de la DICEA. O sea
aplicar un “Muestreo de Atributos”.

Condiciones deseadas:
1) 95% de Confiabilidad
2) Cota de Error: 𝜀 = 5% = 0.05 ⇒ |𝑝̂ − 𝑝| ≤ 0.05 o 5%

MARCO DE ELEMENTOS DE MUESTREO (alumnos):

No. NOMBRE
1 AGUILAR RAMÍREZ ADCEL GUADALUPE
2 ALBARRÁN CASANOVA NAOMI LILIANA
3 ANDREU MARCOS OSCAR
4 BARRIOS GARCÍA GRISELDA SOLEDAD
5 CANDELARIO DAMASO ELSA
6 CETINA CHEL EFRAÍN VIDAL
7 CORTEZ PINEDA AZUL DAYANA
8 CRUZ SANTOS JOSELINE
9 ESCALANTE ESPARZA TANIA MELISA
10 ESPINOSA ZAVALA MARIO ERNESTO
11 FIERRO CORTES SELENE
12 GARCÍA VALDEZ CLAUDIA ITZEL
13 GUZMÁN GARCÍA JOSÉ MANUEL
14 HERNÁNDEZ LEÓN LORENA ESTEPHANIA
15 IGNACIO HERNÁNDEZ ROSENDA
16 LÓPEZ ORTIZ DYLAN KRISTOFF
17 MARTÍNEZ GONZÁLEZ ARHALY

20
18 MARTÍNEZ MUÑOZ IRVIN
19 MARTÍNEZ ZARAGOZA DALIA GUADALUPE
20 MIRANDA JIMÉNEZ JAIR
21 ORTEGA DOMÍNGUEZ NOEMÍ
22 PACHECO OLIVARES LUIS EDUARDO
23 PERALTA NEQUIZ SERGIO ADÁN
24 PÉREZ HERNÁNDEZ JOSELYN LIZETH
25 PINEDA LUVIANO EDWIN
26 RAMÍREZ GARCÍA LENIN MIGUEL
27 ROJAS MARTÍNEZ DAYRA AURORA
28 SÁNCHEZ LÓPEZ CARMEN
29 SANTIAGO CRUZ ISAIAS
30 VALENCIA GÓMEZ QUETZALLI
31 ZEPEDA NAVARRETE PERLA RAQUEL

32 ARREDONDO GARCÍA CITLALY


33 BAUTISTA RIVERA MARÍA JAZMÍN
34 CANO VALVERDE DANIEL OCTAVIO
35 CAUICH PUC REYNA MARÍA
36 CEDEÑO ZÚÑIGA ALEJANDRA GUADALUPE
37 CRUZ CRUZ MARIO ADRIÁN
38 CRUZ GARCÍA IVETTE ELIZABETH
39 DE LA CRUZ ORTIZ JUAN DANIEL
40 DORANTES GARCÍA VANESA
41 EUSEBIO FLORES ANA PAULINA
42 GARCÍA LÓPEZ PILAR
43 GARCÍA REYES KATYA ESTEPHANIE
44 GÓMEZ HERRERA ZAIRA ISELA
45 HERNÁNDEZ DURÁN OSCAR ARTURO
46 JARQUIN MARTÍNEZ ALEJANDRA
47 LEAL VÁSQUEZ CYNTHIA ARACELI
48 LÓPEZ COLÍN HUMBERTO DAVID
49 LÓPEZ PÉREZ ABIGAIL
50 MARTÍNEZ MARTÍNEZ PERLA JAQUELINE
51 MOLINA VICARIO JOSUÉ
52 MORALES DÍAZ DIANA JASMÍN
53 MORTERA VERGARA MAIRIM

21
54 ORTEGA MARTÍNEZ MARÍA DOLORES
55 PACHECO VIZCAINO SANDRA LUZ
56 PÉREZ CONTRERAS YANELI RUBÍ
57 PÉREZ SILVANO ZITLALLI ISAMAR
58 RAMÍREZ BAUTISTA LUIS DONALDO
59 REYES ÁLVAREZ LARISSA DANIELA
60 RUIZ GARCÍA CAROLINA
61 VEGA VEGA HORACIO
62 VENADO LÓPEZ JULIETA ARIANNE
63 VIVEROS SALAZAR MARÍA CELIA

64 ARROYO MARTÍNEZ MICHEL DEL CARMEN


65 AYALA DE LA ROSA VIRIDIANA ROCIO
66 BETANCOURT ESPARZA JUAN DE DIOS
67 CABALLERO BARCENAS ISAAC BARUCH
68 CANO HERNÁNDEZ ESTEFANY
69 CASTILLO GARRIDO LUIS FELIPE
70 CRUZ MARTÍNEZ MARÍA DEL CARMEN
71 CUELLAR ESPINOSA EMILIO
72 GALEANA PEÑA MAURICIO YAEL
73 GARCÍA CALLEJA JULIÁN
74 GARCÍA CARMONA MARÍA FERNANDA
75 GARCÍA DIEGO MARCO POLO
76 GARCÍA SALDAÑA JENNIFER
77 GONZÁLEZ ALMORA MÓNICA
78 JUÁREZ FLORES MARIANA
79 JULIAN SALAS LUIS ENRIQUE
80 LINARES RABADAN JULIO CÉSAR
81 LÓPEZ VILCHIS ALEXANDRA
82 MARTÍNEZ JERÓNIMO LUIS ÁNGEL
83 MELO QUINTERO PAOLA ARACELY
84 OLIVARES BATALLA MANUEL ALEJANDRO
85 PACHECO RAMÍREZ DAVID
86 PIZAÑA BARRIOS MIREYA
87 RAMÍREZ PERALTA RAYMUNDO
88 RIVAS AREVALO SAYURI YAEL
89 SÁNCHEZ BERNAL AARÓN
90 SANTIZ ROSS GUADALUPE YAFETT

22
91 TORRES VALERIANO MAURICIO
92 VELÁZQUEZ ARTEAGA TANIA
93 YESCAS VILLEGAS JOSÉ YUVANEL

94 ALEJO BARRIENTOS EMILIANO


95 ANTONIO CRUZ ERICKA RUBI
96 ÁVILA ARELLANO JOSÉ CASTO
97 BLAS MARTÍNEZ CARLOS JOHANDY
98 CAMARGO MENDOZA CARLOS RUBÉN
99 COHUO COH VENUSTIANO
100 CRUZ SUASTI DANA YAZDID
101 FLORES BAÑOS YESSICA
102 FLORES MARTÍNEZ OCTAVIO AUGUSTO
103 GALÁN HERNÁNDEZ JESÚS ALEJANDRO
104 GAMBOA RUIZ CARLOS ANTONIO
105 GARCÍA MENDOZA FRANCISCO
106 GARCÍA SÁNCHEZ MARÍA FERNANDA
107 HERNÁNDEZ CORTES ZAIDE ITZEL
108 HERNÁNDEZ PÉREZ LUIS MAURICIO
109 HERRERA CHÁVEZ NATIVIDAD
110 LÓPEZ GONZÁLEZ JESÚS ABRAHAM
111 MARTÍNEZ HERNÁNDEZ MARÍA FERNANDA
112 MARTÍNEZ PÉREZ JOSÉ FRANCISCO
113 MENDIETA HERNÁNDEZ EVELIN
114 NUÑEZ GARCIA ALMA CRISTINA
115 RAMÍREZ OLIVARES ANDRW DAVID
116 REYES MORENO XALLI GABRIELA
117 SÁENZ GONZÁLEZ MARÍA ISABEL
118 SANTIAGO CASTELLANOS MIGUEL ÁNGEL
119 SANTOS OSORIO DANIEL TIMOTEO
120 TAFOYA CARRILLO ANTONIO
121 VENTURA RAMÍREZ KARINA MARISOL
122 VIURQUIZ CISNEROS ERICK

123 ALDANA SIDA SAÚL


124 BRISEÑO RAMOS ALMA DELIA
125 CALLEJA HERNÁNDEZ DELFINO
126 CASTAÑEDA FRAGOSO CARLOS ALBERTO

23
127 CASTRO MORALES DIEGO
128 CERVANTES CARPIO LESLY GUADALUPE
129 CHÁVEZ ARAMBULA ERNESTO
130 CORDOBA MEZA FRANCISCO JAVIER
131 CRISTOBAL BAUTISTA RICARDO
132 DELGADO VIVAR DIANA AKETZALI
133 FERNÁNDEZ ARREOLA GABRIELA
134 GALINDO VICUÑA JUAN CARLOS
135 GONZÁLEZ GALLARDO SHECCID GUADALUPE
136 GONZÁLEZ REYES CLAUDIA JOHANNY
137 GRANADOS CRUZ ISRAEL
138 GUZMÁN PÉREZ DANIELA GUADALUPE
139 HERNÁNDEZ TORRESCANO RENÉ JAVIER
140 JERÓNIMO JIMÉNEZ ARACELI
141 LAUREANO NAVA JORGE LUIS
142 MÁRQUEZ CARREÓN DIANA ISABEL
143 MORENO TORRES MONSERRAT
144 NIETO MUÑOZ ERICK DANIEL
145 PÉREZ ANAYA JACQUELINE
146 PÉREZ JUSTO ALDO RENÉ
147 RAMÍREZ TORRES CHRISTIAN
148 RIVERA SANTIAGO HILDA
149 SOSA MÁRQUEZ NAYELI
150 VELÁZQUEZ ROSALES ALBERTO

151 ARROYO GARCÍA GERARDO


152 BARRAGAN REYES SAÚL RENATO
153 BRAVO CRUZ LEIDY MARIBEL
154 CABRERA SOTO DAKIRA
155 CARRERA PALACIOS ELIAS
156 CASTILLO GONZÁLEZ ALONDRA
157 CORRALES HERNÁNDEZ JAIME FABRIZIO
158 ESTRADA ORTIZ ANA CRISTINA
159 FLORES VALLES ANGÉLICA
160 FUENTES FRANCO KAREYMI ATZIRY
161 GAONA MÁRQUEZ ESTELA
162 GUTIÉRREZ CHÁVEZ VIANEY
163 HERNÁNDEZ DE LA CRUZ ALFREDO

24
164 HERNÁNDEZ SANTIAGO MONTZERRAT
165 HERNÁNDEZ SOLANO FATIMA ELIN
166 JAIMES MONTES DE OCA DIANA LAURA
167 JERÓNIMO SANTIAGO DANIEL
168 LÓPEZ GARCÍA LUZ MARELIA
169 MORA MÉNDEZ FLORIBERTO
170 NICOLAS JULIAN ERNESTO
171 ORTIZ SORIANO BEATRÍZ
172 PÉREZ CASTRO ITZI
173 PLATAS YEPEZ DIEGO CHAPINGO
174 RIOS AVENDAÑO MILKA JASIVE
175 RÍOS GURROLA KARINA LIZETH
176 ROLDAN CABRERA FRIDA
177 ROMERO GONZÁLEZ ALEJANDRO
178 ROMERO SOLÍS DANIELA LARISSA
179 SANTIAGO SANTIAGO DANIEL ALEJANDRO
180 SEGOVIA PÉREZ YUREL JUANA
181 VÁLDEZ CENICEROS DANIEL ISAAC

182 AMADOR ESQUIVEL JAZMÍN AKATZIN


183 AMADOR TZAPOT ROSALINDA
184 ARELLANO GUARDADO JANETH
185 CALDERÓN VÁLDEZ VÍCTOR MANUEL
186 CASTRO MÉNDEZ LIDIA YAZMIN
187 CHÁVEZ QUITERIO ALAN JAIR
188 ESPINOZA RAMÍREZ ANGÉLICA LUCIA
189 GALLARDO ALVARADO DIANA JOYCE
190 GARCÍA VELÁZQUEZ JULIO CÉSAR
191 GÓMEZ CRUZ IVETTE
192 GRAJALES DÍAZ MARÍA PILARCITA
193 HERNÁNDEZ MÉNDEZ NOEL OSWALDO
194 HERRERA OZUNA AMAIRANY
195 JORGE ANTONIO OLIVIA
196 LANDÓN CUEVAS MARIANO ADOLFO
197 LICONA SOSA GABRIELA
198 LUCERO URIBE JONATHAN
199 MEJÍA CRUZ ÁNGEL DANIEL

25
200 NARVÁEZ EUCARIO EDGAR JARED
201 RAMÍREZ LIZCANO OMAR
202 RAMÍREZ VÁSQUEZ CARMELITA
203 RODRÍGUEZ FLORES JUAN FELIPE
204 ROSAS RODRÍGUEZ JOSHUA ABAD
205 SALVADOR NÚÑEZ ADRIANA
206 SÁNCHEZ CAMACHO ITZEL EVELYN
207 SÁNCHEZ LÓPEZ VERONICA
208 SEGOVIA YÁÑEZ MICHELL ABIGAIL
209 TEMOXTLE PANZO LORENA

210 BARRAGAN BARRAGAN JUAN FRANCISCO


211 BARRANCO MORA DIEGO ARGHE
212 CORTES PEÑA EDUARDO
213 ESPINOSA MARTÍNEZ PRISMA YARET
214 ESPINOSA VIEYRA DEYANIRA
215 GUERRERO OROZCO ORLANDO
216 HERNÁNDEZ HERNÁNDEZ CRISTIAN ALEXANDER
217 HERNÁNDEZ SANTIAGO BRISEYDA
218 JUÁREZ CASTRO ERICK SAÚL
219 LICONA HERNÁNDEZ VICTORIA IYARI
220 LINARES BRACAMONTES GISSELLE
221 LÓPEZ GALLARDO BLANCA
222 MARMOLEJO RUBIO ROSA MARÍA
223 MÁXIMO CESAREO RODRIGO
224 MENDOZA ROMERO DAVID ANTONIO
225 MENDOZA ZAVALETA ARELY
226 MONTES HERNÁNDEZ MARCO ANTONIO
227 OCHOA MARTÍNEZ YAROSLAGUA
228 ORTIZ BARRIOS LIZBETH
229 PANIAGUA CABRERA HANNIA LIZETH
230 PÉREZ ZAPATA LAURA ANDREA
231 PORTOCARRERO RÍOS ALITZEL XIADANI
232 ROBLES MONROY JENNY LISBETH
233 RUIZ NAVARRO ARELI
234 SÁNCHEZ ROBLES CARLOS DAVID
235 TORRES HIPOLITO CARLA ALEJANDRA
236 ZAMORANO ALAMEDA MARITZA

26
⇒ N = 236 alumnos en 5º. año de la DICEA

Vamos a utilizar la modalidad de numeración que hemos venido usando, es decir, iniciando a
partir del número uno. ¿Cuántos dígitos se deben utilizar?: como el número 2 3 6 tiene tres
dígitos, entonces se deben usar números aleatorios con tres dígitos, a saber: 001, 002,…, 010,
011,…, 099, 100,…, 204, 236.

Obviamente, esta Población es una Población Finita:

𝑁 𝑍𝛼2⁄2 𝑝𝑞
⇒ 𝑛= 𝑁𝜀 2 + 𝑍𝛼2⁄2 𝑝𝑞

Datos: a) N = 236; b) Confiabilidad en nuestra estimación: 95% ⇒ 𝑍𝛼⁄2 = 𝑍0.025 = 1.96;


c) 𝜀 = 0.05 (ojo: en la fórmula se opera en forma decimal y no en porcentaje)

Sustituyendo valores en el tamaño de muestra (𝑛):

236(1.96)2 𝒑𝒒 236(3.8416) 𝒑𝒒 906.6176 𝒑𝒒


⇒n = = =
236(0.05)2 + (1.96)2 𝒑𝒒 236(0.0025)+3.8416 𝒑𝒒 0.59 + 3.8416 𝒑𝒒

Nuevamente, como en el caso del cálculo de “𝑛” para la Media (𝜇𝑥 ), nos enfrentamos que en la
fórmula de “𝑛” aparece un Parámetro y, no solo eso, sino que en este caso necesitamos conocer el
propio Parámetro que deseamos estimar en este Estudio de Muestreo, o sea la Proporción
Poblacional (p). Pero ya dijimos que no vamos a llevar a cabo un Censo sino un Muestreo.

Entonces, ¿Qué hacemos para contar con un valor de la Proporción Población (p)?. Casi lo mismo
que hacemos en el caso de la Media de la Población (𝜇𝑥 ).

Mecanismos para contar con un valor de la Proporción poblacional (p):

a) 1ª. opción: Revisar estudios o investigaciones recientes, sobre el mismo tema y en la misma
región en los cuales se reporte el valor de la Proporción de la Población; o al menos que se
publique información sobre variable 𝑋 mediante la cual podamos obtener una estimación sobre la
Proporción.

b) 2ª. opción: Levantar una muestra piloto y a partir de la información de ésta obtener una
estimación de la Proporción Poblacional. (Cabe mencionar, que esta es la opción más utilizada).

Nota: véase que estas dos opciones son las mismas que se usan cuando se desea estimar la Media

c) 3ª. opción: Asignarle a la Proporción el valor de 0.5 y esto nos conduce al tamaño de muestra
máximo posible, así que cualquier valor de “p” distinto a 0.5 da lugar a una muestra más pequeña.

Nota:

27
Recordemos que la Varianza de la Proporción Muestral (𝜎𝑝2̂ ) es (en el caso de una Población
Infinita):
𝑝𝑞
⇒ 𝜎𝑝2̂ = 𝑛

Entonces, 𝜎𝑝2̂ depende directamente del valor de “𝑝”, y también se puede verificar que cuando p =
̂ . Por eso a esta alternativa se le conoce como
0.5, se alcanza el valor máximo de la Varianza de 𝒑
el Muestreo de Atributos de Máxima Varianza o variación máxima.

Véase por qué con p = 0.5 se alcanza el máximo valor de 𝜎𝑝2̂ :

p q = 1- p pq
0.1 0.9 0.09
0.3 0.7 0.21
0.47 0.53 0.2491
0.5 0.5 0.25
0.6 0.4 0.24
0.8 0.2 0.16
0.9 0.1 0.09

Nota:
Retomando nuestra tarea pendiente de calcular el tamaño de la muestra (𝑛). Vamos a obtener una
estimación de “𝑝” con base en la información de una muestra piloto de 20 alumnos: ⇒ 𝑛’ = 20 y
desde luego debe ser una muestra aleatoria. Así que ahora nos vamos a ubicar en la fila 96,
columna 4, por fila y los tres últimos dígitos.

Los 20 números aleatorios son: 136, 180, 092, 098, 003, 017, 204, 202, 203, 098, 183, 216, 053,
036, 199, 132, 011, 011, 179, 194, 207 y 198

No. Número
aleatorio Nombre Sexo 𝑥
1 136 González Reyes Claudia Johanny F 1
2 180 Segovia Pérez Yurel Juana F 2
3 092 Velázquez Arteaga Tania F 3
4 098 Camargo Mendoza Carlos Rubén M ----
5 003 Andreu Marcos Oscar M ----
6 017 Martínez González Arhaly F 4
7 204 Rosas Rodríguez Joshua Abad M ----
8 202 Ramírez Vásquez Carmelita F 5
9 203 Rodríguez Flores Juan Felipe M ----
10 183 Amador Tzapot Rosalinda F 6
11 216 Hernández Hernández Cristian Alexander M ----
12 053 Mortera Vergara Mairim F 7
13 036 Cedeño Zúñiga Alejandra Guadalupe F 8
14 199 Mejía Cruz Ángel Daniel M ----

28
15 132 Delgado Vivar Diana Aketzali F 9
16 011 Fierro Cortes Selene F 10
17 179 Santiago Santiago Daniel Alejandro M ----
18 194 Herrera Ozuna Amairany F 11

19 207 Sánchez López Verónica F 𝒙 = 12
𝒏’ = 20 198 Lucero Uribe Jonathan M ----

Resultados de la muestra piloto: 𝒏’ = 20 y 𝒙’ = 12


𝑥′ 12
⇒ 𝑝̂ ’ = = = 0.6 𝑒𝑠𝑡𝑖𝑚𝑎 𝑎 𝑝 = ? ∴ 𝑞̂‘ = 0.4
𝑛′ 20

Sustituyendo los valores de 𝑝̂ ’ = 0.6 y 𝑞̂‘ = 0.4 en el tamaño de muestra:

906.6176 𝑝𝑞 906.6176(0.6)(0.4) 217.588224 217.588224


⇒𝑛 = 0.59 + 3.8416 𝑝𝑞
= 0.59 + 3.8416(0.6)(0.4)
= 0.59 + 0.921984
= 1.511984
= 143.909…

𝑛 = 144 alumnos ⇒ entrevistar a muchos alumnos de un total de 236, es decir, al 61% de ellos

Nota:
Si a la proporción Poblacional (𝑝) le asignamos el valor de 0.5, es decir, suponiendo “máxima
variación” de la población, entonces el tamaño de muestra sería:

906.6176 𝑝𝑞 906.6176 (0.5)(0.5) 226.6544 226.6544


⇒𝑛 = 0.59 + 3.8416 𝑝𝑞
= 0.59 + 3.8416 (0.5)(0.5)
= 0.59 +0.9604
= 1.5504
= 146.1909…

⇒ 𝑛 = 147 alumnos ← es el tamaño de muestra máximo posible con un 95% de confiabilidad y


Margen de Error de 5%.

Nota:
Si ahora adoptamos una Cota de Error (𝜀) de 12%, o sea una condición menos exigente en nuestra
estimación, entonces:
⇒ 𝑛 = 51 alumnos (aun así, para un ejercicio de clase es algo laborioso, sobre todo para generar
los números aleatorios). Así que voy a disminuir el Nivel de Confiabilidad a un 90%, es decir,
también adoptaremos una postura menos exigente que al 95%:

Nota:
Finalmente, las condiciones deseadas utilizadas serán:
1) Nivel de Confiabilidad o un intervalo de confianza de: 90% ⇒ 𝑍𝛼⁄2 = 𝑍0.05 = 1.65
2) Precisión o Cota de Error: 𝜀 = 12% = 0.12 ⇒ |𝑝̂ − 𝑝| ≤ 0.12 o 12% ⇒ un Margen de Error
demasiado grande, ya les he mencionado que en los procesos electorales se utiliza un 𝜀 = 2.5% =
0.025

𝑁 𝑍𝛼2⁄2 𝑝𝑞
⇒ 𝑛= 𝑁𝜀 2 + 𝑍𝛼2⁄2 𝑝𝑞

236(1.65)2 (0.6)(0.4) 236(2.7225)(0.6)(0.4) 154.2024 154.2024


⇒ 𝑛 = 236(0.12)2 +(1.65)2 (0.4)(0.6) = 236(0.0144)+2.7225(0.6)(0.4)
= 3.3984+0.6534
= 4.0518
= 38.057…

29
∴ 𝑛 = 39 alumnos ← esta es la muestra definitiva (recordemos que para realizar inferencias sobre
la Proporción Poblacional necesariamente la muestra debe ser grande: 𝑛 ≥ 30).

Nota: como ya tenemos 20 alumnos en la muestra piloto, entonces únicamente vamos añadir
diecinueve y para que concuerden los primeros 20 números aleatorios, entonces debemos
ubicarnos nuevamente en la fila 96, columna 4, por fila y los últimos dígitos.

Así los 39 números aleatorios son: 136, 180, 092, 098, 003, 017, 204, 202, 203, 098, 183, 216, 053,
036, 199, 132, 011, 011, 179, 194, 207, 198, 095, 174, 130, 179, 081, 167, 093, 004, 121, 110, 008,
053, 016, 194, 013, 213, 069, 014, 045, 103 y 060

No. Número aleatorio Nombre Sexo 𝒙


1 136 González Reyes Claudia Johanny F 1
2 180 Segovia Pérez Yurel Juana F 2
3 092 Velázquez Arteaga Tania F 3
4 098 Camargo Mendoza Carlos Rubén M ----
5 003 Andreu Marcos Oscar M ----
6 017 Martínez González Arhaly F 4
7 204 Rosas Rodríguez Joshua Abad M ----
8 202 Ramírez Vásquez Carmelita F 5
9 203 Rodríguez Flores Juan Felipe M ----
10 183 Amador Tzapot Rosalinda F 6
11 216 Hernández Hernández Cristian Alexander M ----
12 053 Mortera Vergara Mairim F 7
13 036 Cedeño Zúñiga Alejandra Guadalupe F 8
14 199 Mejía Cruz Ángel Daniel M ----
15 132 Delgado Vivar Diana Aketzali F 9
16 011 Fierro Cortes Selene F 10
17 179 Santiago Santiago Daniel Alejandro M ----
18 194 Herrera Ozuna Amairany F 11
19 207 Sánchez López Verónica F 12
20 198 Lucero Uribe Jonathan M ----
21 095 Antonio Cruz Ericka Rubí F 13
22 174 Rios Avendaño Milka Jasive F 14
23 130 Córdoba Meza Francisco Javier M ----
24 081 López Vilchis Alexandra F 15
25 167 Jerónimo Santiago Daniel M ----
26 093 Yescas Villegas José Yuvanel M ----
27 004 Barrios García Griselda Soledad F 16
28 121 Ventura Ramírez Karina Marisol F 17
29 110 López González Jesús Abraham M ----
30 008 Cruz Santos Joseline F 18
31 053 Mortera Vergara Mairim F 19

30
32 016 López Ortiz Dylan Kristoff M ----
33 013 Guzmán García José Manuel M ----
34 213 Espinosa Martínez Prisma Yaret F 20
35 069 Castillo Garrido Luis Felipe M ----
36 014 Hernández León Lorena Estephania F 21
37 045 Hernández Durán Oscar Arturo M ----
38 103 Galán Hernández Jesús Alejandro M ----
𝒏 = 39 060 Ruiz García Carolina F 𝒙 = 22

Resultados de la muestra definitiva: a) 𝒙 = 22 y b) 𝒏 = 39

El propósito de este Estudio de Muestreo es estimar la Proporción (𝑝) o el porcentaje de alumnas


que hay en la generación de 5º. año de la DICEA.

En consecuencia:
𝑥 22
𝑝̂ = ⇒ 𝑝̂ = = 0.56410… (Redondeando el resultado a 3 decimales para que expresado en
𝑛 39
porcentaje quede con un solo decimal)

̂ = 0.564 = 56.4% 𝑒𝑠𝑡𝑖𝑚𝑎 𝑎: 𝑝 = ? ← Desde luego, la Proporción real de alumnas sigue siendo una
𝒑
incógnita y ya sabemos que para conocer su valor exacto deberíamos implementar un Censo, o
sea estudiar a cada uno de los 236 estudiantes de 5º. año de la DICEA.

⇒ Así que estimamos que un 56.4% de la matrícula de la generación de 5º. año de la DICEA son
alumnas.

También ya hemos mencionado que lo más seguro es que esta estimación de 56.4% difiere de la
Proporción verdadera de alumnas (p) porque nuestro resultado lo estamos basando en una
muestra (o fracción) de la Población.

Así que vamos a obtener una estimación del Error de Muestreo (e) también al 90% para comparar
el valor de éste con la Cota de Error prestablecida del 12%:

⇒ e = 𝑍𝛼 𝑆𝑝̂ ← como es una Población Finita (y si tenemos alguna duda, entonces obtenemos la
2
fracción de muestreo: 𝑛⁄𝑁 = 39⁄236 = 0.165 > 0.05); asimismo, significa que la muestra
representa el 16.5% de la población (y, por tanto, estamos dejando fuera del estudio de muestreo
al 83.5% de los alumnos de la generación de 5º. año): ⇒ incorporar el fcf en el cálculo del Error
Estándar (𝑆𝑝̂ ).
𝑝̂𝑞̂ 𝑵−𝒏
⇒ 𝑆𝑝2̂ = [ 𝑛 ][𝑵−𝟏]

Cuyos valores son: a) 𝑝̂ = 56.4%; b) 𝑞̂ = 43.6% (que en este caso significa la proporción de
alumnos); c) N = 236 y d) 𝑛 = 39
56.4(43.6) 236−39 2,459.04 197
⇒ 𝑆𝑝2̂ = [ 39
][ 236 −1 ] =[ 39
][235] = 63.05230769(0.838297872) = 52.8566…%2
1
∴ 𝑆𝑝̂ = [52.8566…%2 ]2 ≃ 7.270255%

31
⇒ e = 𝑍0.05 𝑆𝑝̂ = 1.65 (7.270255%) = 11.9959…% (redondeando a un decimal)

∴ e = 12%

Nota: como e = 12% ≡ 𝜀 = 12%, entonces nos encontramos justamente en el límite deseado del
Error de Muestreo por lo que no hay necesidad de incrementar el tamaño de la muestra como en
el ejercicio anterior.

Interpretación del Error de Muestreo estimado: e = 12%

Simbólicamente:
|𝑝̂ = 56.4% − 𝑝| ≤ 12% ← con un 90%

La diferencia entre la Proporción estimada (56.4%) en esta investigación y la Proporción verdadera


de alumnas en la generación de quinto año de la DICEA, es MENOR o cuando más igual a 12% con
una confiabilidad de 90%.

Por lo tanto, existe una probabilidad de 10% que esa diferencia sea superior a 12%, sin embargo,
esta probabilidad es relativamente pequeña.

Nota:
Como contamos con la información de los 236 alumnos, entonces podemos calcular el valor
exacto de la Proporción verdadera (𝑝). Se puede constatar que 𝑋 = 133 y N = 236 ⇒ 𝑝 =
133⁄236 = 56.36%, por lo tanto, nuestra estimación de 56.41% difiere apenas en 0.05% de ese
valor real. Es decir, nuestra estimación, en realidad, es una estimación sumamente precisa del
Parámetro. Por lo que el Error de Muestreo verdadero es de apenas: 𝜀 = 𝑝̂ – 𝑝 = 56.41 – 56.36 =
0.05%.

Estimación del Error de Muestreo (e) ante varios Niveles de Confiabilidad:

Confiabilidad 𝒁𝜶⁄𝟐 Error de Muestreo (e)


90% 1.65 12.0%
95% 1.96 14.2%
99% 2.58 18.8%

Estimación del Intervalo de Confianza para la Proporción de alumnas al 90% de Confiabilidad:

⇒ 𝑝̂ ∓ e

a) LI = 𝑝̂ – e = 56.4% – 12% = 44.4%

b) LS = 𝑝̂ + e = 56.4% + 12% = 68.4%

32
∴ P(44.4% ≤ 𝑝 ≤ 68.4%) = 90% ⇒ Amplitud = 68.4 – 44.4 = 24% ⇒ una anchura muy grande y
véase que es dos veces el Error de Muestreo: 2(e) = 2(12%) = 24%, como ya lo hemos mencionado
previamente. Por lo que si el Error de Muestreo es grande también lo será la amplitud del I de C y
viceversa.

Tamaño de muestra idóneo para estimar la Proporción (p) en investigaciones de mercado:


En estos problemas normalmente se trabaja con poblaciones ilimitadas (o sea, con Poblaciones
Infinitas) y suponiendo máxima Varianza de la Población (es decir, de la v. a. X) así que se asigna
el valor p = 0.5 y si además se exige una confiabilidad de 95% (y redondeando el valor de Z = 1.96 a
2) y un Margen de Error de 5% o 0.05:
2
𝑍𝛼 ⁄2 𝑝𝑞 (2)2 (0.5)(0.5) 4 (0.25) 1
⇒n= = = = = 400 ← la Regla de Oro !!
𝜀2 (0.05)2 0.0025 0.0025

Conclusión: Por eso es que muchas investigaciones de Mercado se basan en una muestra de al
menos 400 cuestionarios o entrevistas sobre los miembros de la población de interés.

Nota: Si consideramos que en las encuestas de los procesos electorales se proponen una Precisión
en sus estimaciones de 2.5% o 0.025: ⇒ |𝑝̂ − 𝑝| ≤ 2.5%
2
𝑍𝛼 ⁄2 𝑝𝑞 (2)2 (0.5)(0.5) 1
⇒n= = = = 1,600 ← con una muestra de al menos 1,600 electores, las
𝜀2 (0.025)2 0.000625
empresas encuestadoras obtienen sus estimaciones sobre las preferencias de la ciudadanía
mexicana sobre los candidatos de los distintos partidos.

33

También podría gustarte