Está en la página 1de 21

Unidad 1. Estudios poblacionales. Estudios por Muestreo. tipos de muestreo.

1.0 Caracterización estadística de estudios poblacionales

1.1 Estudios por muestreo

1.1.1 Muestreo aleatorio simple (M.A.S.).

1.1.2 Muestreo aleatorio sistemático.

1.1.2.1 Aplicaciones del muestreo aleatorio sistemático.

1.1.3 Muestreo aleatorio estratificado (M.A.E.).

1.1.3.1 Aplicaciones del muestreo aleatorio estratificado.

1.1.4 Muestreo aleatorio por conglomerados.

1.1. 5 Calculo estadístico del tamaño de muestra.

1.1.6 Calculo tamaño de muestra, cuando no se conoce la población.

1.1.6.1 Aplicación calculo tamaño de muestra, cuando no se conoce la población.

1.1.6.2 Ejercicio propuesto de aplicación calculo estadístico del tamaño de muestra,


cuando no se conoce la población.

1.1.7 Calculo estadístico del tamaño de muestra, cuando se conoce la población.

1.1.7.1 Aplicación calculo tamaño de muestra, cuando se conoce la población.

1.1.7.2 Ejercicio propuesto de aplicación calculo estadístico del tamaño de


muestra, cuando se conoce la población.
Unidad 1. Muestreo. Definiciones, tipos de muestreo.

El Censo poblacional es un estudio realizado a la totalidad de los sujetos de la


población. Cuando no es posible llevar a cabo algunos estudios sobre la totalidad
de los elementos o sujetos de la población (por carencia de recursos humanos,
carencia de recursos materiales, carencia de recursos económicos o tiempo
necesario), se hace necesario realizar el estudio por muestreo, es decir, basándose
en un subconjunto de la población, obteniéndose características de la muestra, con
el propósito de realizar inferencia estadística, afirmaciones sobre la población en
general.

El diseño estadístico de muestreo, consiste en seleccionar un método de muestreo


probabilístico, para calcular el tamaño de la muestra (cuantos elementos de la
población seleccionar para realizar la investigación), utilizar el criterio de
aleatoriedad en la selección de las unidades muestrales (cuales elementos de la
población seleccionar para realizar la investigación), lo que permitirá la obtención
de una muestra estadísticamente representativa de la población.

El muestreo con reemplazo, es aquel en el cual una vez ha sido seleccionado un


individuo (y estudiado) se le toma en cuenta nuevamente al elegir el siguiente
individuo a ser estudiado. El muestreo sin reemplazo, es aquel en el cual una vez
se ha tomado en cuenta un individuo para formar parte de la muestra, no se le vuelve
a tomar en cuenta nuevamente. En este caso, y hablando específicamente para el
caso de poblaciones pequeñas, las observaciones son dependientes entre sí, pues
al no tomar en cuenta nuevamente el individuo se altera la probabilidad para la
selección de otro individuo de la población. Para el caso de las poblaciones grandes
(por ejemplo la población de un país) dicha probabilidad para la selección de un
individuo se mantiene prácticamente igual, por lo que se puede decir que existe
independencia en las observaciones.

Los tipos de muestreo probabilístico más utilizados son, el muestreo aleatorio simple
(MAS), muestreo aleatorio sistemático, muestreo aleatorio estratificado (MAE) y
muestreo de conglomerados.
1.1 Muestreo aleatorio simple (M.A.S.). (tamaño de muestra)

Su característica principal es que un elemento de la población tiene igual


probabilidad de ser seleccionado. Es utilizado cuando se desea escoger
aleatoriamente (uso de tablas de números aleatorios) un elemento de la población
independientemente de la característica del sujeto escogido, por esta razón este
método de muestreo no permite tener control sobre las unidades de muestra. Los
números aleatorios se pueden consultar en la tabla E1: Tabla de números
aleatorios.

https://ugc.elogim.com:3107/es/ereader/ugc/39397?page=445

Por ejemplo, en un programa de televisión, se selecciona aleatoriamente un número


telefónico de una vivienda de la ciudad, para entregar un premio al miembro del
hogar, independientemente de la característica del sujeto escogido: sexo, edad,
estrato socioeconómico, entre otros.

1.2 Muestreo aleatorio sistemático. (seleccionar las unidades muestrales)

Este tipo de muestreo requiere considerar los siguientes componentes:

i) conocer previamente el tamaño del universo o población (denominada N);

ii) la población se ordena según criterio del estudio [por ejemplo, ordenar la
población estudiantil por programa académico ofertado (ascendente de la A a la Z),
a su vez ordenarlo por jornada (diurna y nocturna) y a su vez ordenarlo por semestre
(ascendente del 1º. Al 10º semestre) y];

iii) calcular previamente el tamaño de la muestra (conocer la muestra denominada


n),

iv) calcular la amplitud, equivalente a dividir el tamaño de población entre el


tamaño de la muestra (denominada A = N/n);

v) seleccionar un número aleatorio (entre uno y A, denominado arranque aleatorio


K); y finalmente,
vi) seleccionar los elementos en la posición k, k+A, ….. hasta obtener el tamaño
de unidades muestrales n. El muestreo aleatorio sistemático, es muy utilizado como
método de selección de las unidades muestrales, dado que permite recorrer la
totalidad del universo (previo ordenamiento) de tal forma que la muestra
seleccionada es estadísticamente representativa de la población.

1.2.1 Aplicaciones del muestreo aleatorio sistemático. Seleccionar unidades


muestrales

Se requiere seleccionar una muestra aleatoria de la población universitaria, para


realizar un estudio, para lo cual se procede como se describe a continuación.

i) El tamaño de la población universitaria es N=10.000 estudiantes matriculados;


ii) la población se ordena considerando el siguiente criterio: el listado de estudiantes
matriculados se numera del 1 al 10.000, en primer lugar por programa académico
(ascendente de la A a la Z, por ejemplo Administración de Empresas, Contaduría,
Economía, entre otras), y en segundo lugar, a su vez ordenarlo por semestre
(ascendente del 1º. Al 10º semestre) y en tercer lugar, a su vez ordenarlo por
jornada diurna y nocturna;
iii) El tamaño de muestra calculado previamente por método estadístico, fue de
n=1.000 unidades muestrales (estudiantes matriculados a seleccionar para el
estudio);
iv) Se calcula la amplitud del intervalo operando: A=(N/n)= (10.000/1.000)=10;
v) Calculamos el arranque aleatorio k entre 1 y A, es decir, entre 1 y A=10, utilizando
la tabla de números aleatorios. Consideramos k=5;
vi) Seleccionamos las unidades de muestra, equivalente a seleccionar los elementos
en la posición k, k+A, … hasta obtener el tamaño de las unidades de muestra
n=1000 estudiantes. Es decir, los estudiantes matriculados seleccionados serán
aquellos en el listado ordenado previamente en la posición: 5, 15, 25, 35, 45, 55,
65, 75, 85, 95, 105, 115, 125, 135, 145, 155, 165, 175, 185, 195, 205, 215, 225, 235,
245, … y así sucesivamente hasta seleccionar los n=1.000 estudiantes.
1.3 Muestreo aleatorio estratificado (M.A.E.).

Se requiere conocer el tamaño del universo o población (denominada N), según


criterio de estratificación, por el cual un elemento de la población pertenece a un
único estrato. En términos generales las características a estudiar sobre los
elementos al interior del estrato son homogéneas. El criterio de estratificación de la
población puede ser univariado. Por ejemplo: la población proyectada de Bogotá
D.C. para el periodo 2020, desagregada según criterio de sexo. Tabla 1.1

Ni
Wi = Dónde: Ni=tamaño del universo estrato i. Wi= proporción (ponderación) del
N
estrato i con respecto al total de la población.

Tabla 1.1: Proyección de población de Bogotá D.C., según sexo 2020.

SEXO población proyectada 2020 (Ni) Proporción Wi %


MUJERES 4.036.117 52,1 wmujer
HOMBRES 3.707.838 47,9 whombre
Total 7.743.955 100
Fuente: Departamento Administrativo Nacional de Estadística (DANE). Censo general de población y vivienda 2018.
Proyecciones de población de Bogotá D.C. anualizada por sexo. 2020.

El criterio de estratificación de la población puede ser bivariado. Por ejemplo: la


población de Bogotá desagregada según sexo y grupos de edades quinquenales.

Ni, j
Wi , j = dónde: Ni,j=tamaño del estrato i,j. Wi,j= proporción (ponderación) del
N
estrato i,j con respecto al total de la población. Donde i=sexo, j=grupos de edades
quinquenales. Tabla 1.2

Y el criterio de estratificación de la población puede ser multivariado, en la medida


que el universo lo permita. Por ejemplo, la población de Bogotá desagregada según
criterio de sexo y grupo de edades quinquenales y localización geográfica (lugar de
residencia o localidad donde reside).
N i , j ,k
Wi , j ,k = Dónde: Ni,j,k=tamaño del estrato i,j,k. Wi,j,k= proporción (ponderación)
N
del estrato i,j,k con respecto al total de la población. Donde i=sexo, j=grupos de
edades quinquenales, k= localidad.

Tabla 1.2: Proyección de población de Bogotá D.C., según sexo y grupos de edades
quinquenales. 2020.

Población
proyectada Población Población
ambos proyectada proyectada proporción Proporción
sexos 2020 mujeres hombres mujeres hombres
Edades (años) (Ni) 2020 (Ni,j) 2020 (Ni,j) W(i,j) (Wi,j)
Total Bogotá 7.743.955 4.036.117 3.707.838 52,1 47,9
00-04 493.287 241.435 251.852 3,1 3,3
05-09 482.823 236.517 246.306 3,1 3,2
10-14 490.700 241.276 249.424 3,1 3,2
15-19 550.879 273.634 277.245 3,5 3,6
20-24 711.590 356.644 354.946 4,6 4,6
25-29 749.246 376.169 373.077 4,9 4,8
30-34 673.163 340.455 332.708 4,4 4,3
35-39 613.704 315.704 298.000 4,1 3,8
40-44 539.925 284.724 255.201 3,7 3,3
45-49 477.123 257.705 219.418 3,3 2,8
50-54 468.097 257.211 210.886 3,3 2,7
55-59 435.209 241.982 193.227 3,1 2,5
60-64 352.709 198.658 154.051 2,6 2,0
65-69 260.464 149.260 111.204 1,9 1,4
70-74 183.141 106.789 76.352 1,4 1,0
75-79 119.787 70.936 48.851 0,9 0,6
80-84 71.361 42.949 28.412 0,6 0,4
85-89 39.366 24.193 15.173 0,3 0,2
90-94 19.577 12.305 7.272 0,2 0,1
95-99 8.078 5.199 2.879 0,1 0,0
100 Años y mas 3.726 2.372 1.354 0,0 0,0
Fuente: Departamento Administrativo Nacional de Estadística (DANE). Censo general de población y vivienda 2018.
Proyecciones de población de Bogotá D.C. anualizada por sexo y grupos de edades quinquenales. 2020.
1.3.1 Aplicaciones del muestreo aleatorio estratificado.

Se desea realizar una investigación, para evaluar el grado de satisfacción de los


usuarios de los servicios de las empresas promotoras de salud del régimen
subsidiado que operan en Bogotá, por el método de muestreo aleatorio estratificado,
considerando como criterio de estratificación, la localidad donde reside el usuario.
Se requiere: i) Calcular el tamaño estadístico de muestra probabilística,
considerando una población de N=1.275.000 usuarios, un nivel de confiabilidad (1-
α)%= 95%, un error admisible en las estimaciones del 2,5%, y una proporción de
satisfacción de p=30% de mediciones históricas anteriores y ii) Distribuir el tamaño
de muestra por localidades, procediendo como se describe a continuación.

En primer lugar, para hallar la constante de confiabilidad (Z=?) de la distribución


Normal Estándar para un nivel de confianza del (1-α)% = 95%, se procede así:

(1-α) = 0,95 por tanto la significancia α=1 – 0,95= 0,05, y la significancia media
α/2=(0,05)/(2)=0,025

Proporción p= (1–0,025)=0,975. Dada un área bajo la curva Normal estándar de


0.975, le corresponde una constante de confiabilidad z=1,96.

σ=1

μ=0 z=1,96 z

P(Z(0,1)≤ z)=0,975 (equivalente a la proporción 0,475 registrada en la tabla para el


área entre Z=0 y Z=1,96 y le sumamos 0,5 por simetría correspondiente a la
proporción del área Z<0).

Los valores de z se encuentran tabulados en la tabla E2: Distribución Normal


Estandarizada https://ugc.elogim.com:3107/es/ereader/ugc/39397?page=447
En segundo lugar, la variabilidad (S²) se estima así: una proporción de satisfacción
de mediciones históricas anteriores p=30%, p=0,3 por lo tanto q=(1- p)=(1- 0,3)=0,7.
Variabilidad S²= [p*q]= [ p* (1- p) ]= (0,3)*(0,7)= 0,21

En tercer lugar el error de muestreo admisible en las estimaciones es 2,5%, E=0,025


Finalmente, reemplazamos los valores de tamaño de la población (N=1.275.000
usuarios), confiabilidad (z=1,96), variabilidad (S²=0,21) y error de muestreo
(E=0,025), en la fórmula para calcular el tamaño de la muestra cuando se conoce
el tamaño de la población:

TamañodeMuestra (n) =
(N * Z * S )
2 2

(Z * S ) + (N *  )
2 2 2

n=
(1.275.000 * (1,96) * 0,21)
2

((1,96) * (0,21) + (1.275.000 * (0,025 ) = 1.290UsuariosaEncuestar


2 2
.

Aplicando muestreo aleatorio estratificado, considerando las localidades como


criterio de estratificación, se distribuye el tamaño estadístico de muestra
probabilístico estimado (n=1.290 usuarios) en las localidades, con afijación
proporcional al tamaño del universo del número de usuarios por localidad:

Ni
Wi = (Ponderación usuarios por localidad) ni = Wi * n (distribución tamaño
N
muestra por localidad).

Tabla 1.3: Distribución del tamaño de muestra probabilístico por localidades.

Localidad usuarios Ni Wi = Ni / N ni = Wi * n Wi = ni / n
Usaquén (1) 30.418 2,4 31 2,4
Chapinero (2) 9.742 0,8 10 0,8
Santafé (3) 35.668 2,8 36 2,8
San Cristóbal (4) 114.537 9,0 116 9,0
Usme (5) 115.135 9,0 116 9,0
Tunjuelito (6) 418.43 3,3 43 3,3
Bosa (7) 150.602 11,8 152 11,8
Kennedy (8) 148.398 11,6 150 11,6
Fontibón (9) 26.552 2,1 27 2,1
Engativá (10) 73.725 5,8 75 5,8
Suba (11) 93.429 7,3 94 7,3
Barrios Unidos (12) 12.868 1,0 13 1,0
Localidad usuarios Ni Wi = Ni / N ni = Wi * n Wi = ni / n
Teusaquillo (13) 1.827 0,1 1 0,1
Los Mártires (14) 16.349 1,3 17 1,3
Antonio Nariño (15) 9.411 0,7 9 0,7
Puente Aranda (16) 19.871 1,6 21 1,6
La Candelaria (17) 4.864 0,4 5 0,4
Rafael Uribe Uribe (18) 96.736 7,6 98 7,6
Ciudad Bolívar (19) 270.847 21,3 275 21,3
Sumapaz (20) 1.473 0,1 1 0,1
Total usuarios (N) 1.274.295 100 1.290 100

Fuente: Secretaria Distrital de Salud (SDS). Afiliados al régimen subsidiado de salud


por localidad.
1.4 Muestreo aleatorio por conglomerados.

Es aquel en el cual cada unidad de selección es un conglomerado de elementos de


la población. El muestreo aleatorio por conglomerados se define en una etapa, si
la población se divide en grupos y se selecciona una muestra, de tal forma que cada
grupo corresponde a una unidad de muestreo. En los conglomerados, en términos
generales las características a estudiar sobre los elementos al interior del
conglomerado, se espera sea lo más heterogénea posible, representando el
conglomerado a la población. Frecuentemente en el diseño de muestreo aleatorio
por conglomerado, los conglomerados se refieren a áreas en que se ha dividido el
terreno, por ejemplo, un barrio puede considerarse como un conglomerado,
equivalente a un grupo de manzanas; o también una manzana puede considerarse
como un conglomerado, equivalente a un grupo de viviendas. Este método de
muestreo permite reemplazar a las unidades más pequeñas de las poblaciones
(unidades de selección) cuando ellas no pueden ser enumeradas, por unidades más
grandes que las contienen, lo que hace más económico el muestro (menos costoso
en términos monetarios). El muestreo aleatorio por conglomerados se define en dos
etapas o bietapico, si en la primera etapa se obtiene una muestra aleatoria de
conglomerados y posteriormente, en la segunda etapa se obtiene una muestra
aleatoria de los elementos de cada conglomerado seleccionado.

1.5 Calculo estadístico del tamaño de muestra.

Para calcular el tamaño de una muestra hay que tomar en cuenta tres factores:

1. El nivel de confianza con el cual se quiere generalizar (inferir) los datos desde la
muestra hacia la población total.
2. El porcentaje de error admisible en las estimaciones, que se pretende aceptar al
momento de hacer la generalización.
3. El nivel de variabilidad que se calcula para comprobar la hipótesis.

El nivel de confianza.
Es la proporción de seguridad que existe para generalizar los resultados obtenidos.
Esto quiere decir que un porcentaje del 100% equivale a decir que no existe ninguna
duda para generalizar tales resultados, pero también implica estudiar a la totalidad
de los casos de la población. El nivel de confianza es subjetivo, por lo que se
recomienda tomar un valor (nivel de confianza) comprendido entre 90% y 99%.

Si el nivel de confianza (1-α)% escogido es 90%, la constante de confiabilidad de la


distribución de probabilidad Normal estándar es z=1,645; para el nivel de confianza
escogido del 95%, la constante de confiabilidad de la distribución de probabilidad
Normal estándar es z=1,96 y para el nivel de confianza escogido del 99%, la
constante de confiabilidad de la distribución de probabilidad Normal estándar es
z=2,58 entre los más utilizados.

Para hallar la constante de confiabilidad (Z=?) de la distribución Normal Estándar


para un nivel de confianza del (1-α)% = 95%, se procede así:

(1-α) = 0.95 por tanto la significancia α=1 - 0.95= 0.05, y la significancia media
α/2=0.025

Proporción p= (1–0,025)=0,975. Dada un área bajo la curva Normal estándar de


0.975, le corresponde una constante de confiabilidad z=1,96.

σ=1

μ=0 z=1,96 z

P(Z(0,1)≤ z)=0,975 (equivalente a la proporción 0,475 registrada en la tabla para el


área entre Z=0 y Z=1,96 y le sumamos 0,5 por simetría correspondiente a la
proporción del área Z<0).

Los valores de z se encuentran tabulados en la tabla E2: Distribución Normal


Estandarizada https://ugc.elogim.com:3107/es/ereader/ugc/39397?page=447

El error de muestreo admisible en las estimaciones.


Equivale a escoger una probabilidad de aceptar una hipótesis que sea falsa como
si fuera verdadera, o la inversa: rechazar la hipótesis verdadera por considerarla
falsa. Al igual que en el caso del nivel de confianza, si se quiere eliminar el riesgo
del error y considerarlo como 0%, entonces la muestra es del mismo tamaño que la
población, por lo que conviene asumir un cierto riesgo de equivocarse.

El error de muestreo admisible en las estimaciones es subjetivo, por lo que se


recomienda tomar un valor (error de muestreo) alrededor del 5%.

La variabilidad.

Es la probabilidad (o proporción) con el que se aceptó y se rechazó la hipótesis que


se quiere investigar en alguna investigación anterior o en un ensayo previo a la
investigación actual. El porcentaje con que se aceptó tal hipótesis se denomina
variabilidad positiva y se denota por p, y el porcentaje con el que se rechazó se la
hipótesis se denomina variabilidad negativa y se denotada por q, donde q=1-p

Hay que considerar que p y q son complementarios, es decir, que su suma es igual
a la unidad: p + q =1. Además, cuando se habla de la máxima variabilidad, en el
caso de no existir antecedentes sobre la investigación (no hay otras o no se pudo
aplicar una prueba previa), entonces los valores de variabilidad es p=q=0,5.

Una vez que se han determinado estos tres factores, entonces se puede calcular el
tamaño de la muestra cómo se describe a continuación.

1.6 Calculo estadístico del tamaño de muestra, cuando no se conoce la población.

La fórmula para calcular el tamaño de la muestra (n), cuando no se conoce con


precisión el tamaño de la población es:

Z2 *S2
TamañodeMuestra (n) =
E2 [1.1]

Dónde:
n es el tamaño de la muestra;
Z es el nivel de confianza;
p es la variabilidad positiva;
q es la variabilidad negativa;
E es la precisión o error de muestreo admisible en las estimaciones.

La variabilidad y el error de muestreo se pueden expresar en proporciones.

var iabilidad = S 2 = ( p * q) = p * (1 − p)

El nivel de confianza se obtiene a partir de la distribución de probabilidad Normal


Estándar (la proporción correspondiente al nivel de confianza, es el área simétrica
bajo la curva normal que se toma como la confianza, y la intención es buscar el valor
Z de la variable aleatoria que corresponda a tal área). Los valores de z se
encuentran tabulados en la tabla estadística de la Distribución Normal
Estandarizada (Tabla E2 : Distribución Normal Estandarizada).
https://ugc.elogim.com:3107/es/ereader/ugc/39397?page=447
1.6.1 Aplicación calculo estadístico del tamaño de muestra, cuando no se conoce la
población.

Una institución universitaria desea realizar una investigación de calidad en los


alumnos matriculados, para lo cual aplicara un cuestionario de manera aleatoria a
una muestra. Suponiendo que no se conoce el tamaño exacto de la población,
calcule un tamaño de muestra, considerando una confiabilidad del 95%, máxima
variabilidad por no disponer de antecedentes en la institución sobre la investigación
y porque no se puede aplicar una prueba preliminar y un error de muestreo
admisible en las estimaciones del 5%.

En primer lugar, para hallar la constante de confiabilidad (Z=?) de la distribución


Normal Estándar para un nivel de confianza del (1-α)% = 95%, se procede así:

(1-α) = 0,95 por tanto la significancia α=1 – 0,95= 0,05, y la significancia media
α/2=0,025

Proporción p= (1–0,025)=0,975. Dada un área bajo la curva Normal estándar de


0.975, le corresponde una constante de confiabilidad z=1,96.

σ=1

μ=0 z=1,96 z

P(Z(0,1)≤ z)=0,975 (equivalente a la proporción 0,475 registrada en la tabla para el


área entre Z=0 y Z=1,96 y le sumamos 0,5 por simetría correspondiente a la
proporción del área Z<0).

Los valores de z se encuentran tabulados en la tabla E2: Distribución Normal


Estandarizada https://ugc.elogim.com:3107/es/ereader/ugc/39397?page=447

En segundo lugar, la máxima variabilidad (S²) se estima así: p=50%=0,5 por lo tanto
q=(1-p) =(1-0,5)=0,5. La variabilidad S²=[p*q]=[p*(1- p)]=(0,5)*(0,5)=0,25

En tercer lugar, error de muestreo admisible en las estimaciones del 5%, E=0,05
Finalmente, reemplazamos los valores de confiabilidad (z=1,96), variabilidad
(S²=0,25) y error de muestreo (E=0,05), en la fórmula para calcular el tamaño de la
muestra cuando no se conoce el tamaño de la población:

TamañodeMuestra (n) =
Z2 *S2
=
(
(1,96) 2 * (0,25) )
= 384UnidadesdeMuestra
E2 (0,05) 2
El tamaño de muestra estimado es de 384 unidades a seleccionar, calculado con
una confiabilidad del 95%, una variabilidad de 0,25 (p=0,5) y error de muestreo
admisible en las estimaciones del 5%.

1.6.2 Ejercicio propuesto de aplicación calculo estadístico del tamaño de muestra,


cuando no se conoce la población.

Una institución de comercio desea realizar una investigación de satisfacción en sus


compradores, para lo cual aplicara un cuestionario de manera aleatoria a una
muestra. Suponiendo que no se conoce el tamaño exacto de la población de
compradores, calcule un tamaño de muestra, considerando una confiabilidad del
95%, estudios anteriores reportaron una calificación de satisfacción de compra del
30% y un error de muestreo admisible en las estimaciones del 4%.

En primer lugar, para hallar la constante de confiabilidad (Z=?) de la distribución


Normal Estándar para un nivel de confianza del (1-α)% = 95%, se procede así:

(1-α) = 0.95 por tanto la significancia α=1 - 0.95= 0.05, y la significancia media
α/2=0.025

Proporción p= (1–0,025)=0,975. Dada un área bajo la curva Normal estándar de


0.975, le corresponde una constante de confiabilidad z=1,96.

σ=1

μ=0 z=1,96 z
P(Z(0,1)≤ z)=0,975 (equivalente a la proporción 0,475 registrada en la tabla para el
área entre Z=0 y Z=1,96 y le sumamos 0,5 por simetría correspondiente a la
proporción del área Z<0).

Los valores de z se encuentran tabulados en la tabla E2: Distribución Normal


Estandarizada https://ugc.elogim.com:3107/es/ereader/ugc/39397?page=447

En segundo lugar, la variabilidad (S²) se estima así: estudios anteriores reportaron


una calificación de satisfacción de compra del 30%, p=30%=0,3 por lo tanto q=(1-
p)=(1-0,3)=0,7 La variabilidad S²=[ p*q]=[ p*(1-p)]=(0,3*0,7)=0,21

En tercer lugar el error de muestreo admisible en las estimaciones es 4%, E=0,04


Finalmente, reemplazamos los valores de confiabilidad (z=1,96), variabilidad
(S²=0,21) y error de muestreo (E=0,04), en la fórmula para calcular el tamaño de la
muestra cuando no se conoce el tamaño de la población:

TamañodeMuestra (n) =
Z2 *S2
=
( )
(1,96) 2 * (0,21)
= 504UnidadesdeMuestra
E2 (0,04) 2
El tamaño de muestra estimado es de 504 unidades a seleccionar, calculado con
una confiabilidad del 95%, una variabilidad de 0,21 (p=0.3) y error de muestreo
admisible en las estimaciones del 4%.
1.7 Calculo estadístico del tamaño de muestra, cuando se conoce la población.

La fórmula para calcular el tamaño de la muestra (n), cuando se conoce el tamaño


(N * Z 2 * S 2 )
de la población es: TamañodeMuestra (n) =
(Z 2 * S 2 ) + ( N * E 2 ) [1.2]

Dónde:

n es el tamaño de la muestra;
N= es el universo o tamaño de la población,

Z es el nivel de confianza;
p es la variabilidad positiva;
q es la variabilidad negativa;
E es la precisión o error de muestreo admisible en las estimaciones.

La variabilidad y el error de muestreo se pueden expresar en proporciones.

var iabilidad = S 2 = ( p * q) = p * (1 − p)

El nivel de confianza se obtiene a partir de la distribución de probabilidad Normal


Estándar (la proporción correspondiente al nivel de confianza, es el área simétrica
bajo la curva normal que se toma como la confianza, y la intención es buscar el valor
Z de la variable aleatoria que corresponda a tal área). Los valores de z se
encuentran tabulados en la tabla estadística de la Distribución Normal
Estandarizada (Tabla E2 : Distribución Normal Estandarizada).
https://ugc.elogim.com:3107/es/ereader/ugc/39397?page=447

Generalizando:

i) el tamaño de muestra y el nivel de confianza, están directamente relacionados.


Por consiguiente, a mayor confiabilidad, mayor será el tamaño de muestra; y a
menor confiabilidad, menor será el tamaño de muestra.
ii) el tamaño de muestra y el error de muestreo admisible en las estimaciones, están
inversamente relacionados. Por consiguiente, a mayor error de muestreo, menor
será el tamaño de muestra; y a menor error de muestreo, mayor será el tamaño de
muestra.

Lectura: “Muestreo y tipos de muestreo” capítulo 6. Páginas 323 – 331.

https://ugc.elogim.com:3107/es/ereader/ugc/39397?page=323
RODRÍGUEZ, J., PIERDANT, A. (2015). Estadística para administración. Primera
Edición Ebook. México: Grupo editorial Patria.

Recuperado de http://www.ugc.edu.co/wwwdat/pdf/9786074388619.pdf

1.7.1 Aplicación calculo estadístico del tamaño de muestra, cuando se conoce la


población.

Se desea calcular un tamaño de muestra para realizar una encuesta en el potencial


de votantes y validar su intención de voto en las próximas elecciones, considerando:
una población potencial de votantes N=13.000.000 (Universo finito no numerable),
una confiabilidad del 95%, una proporción de votantes del 30% y un error de
muestreo admisible en la estimaciones del 5%,

En primer lugar, para hallar la constante de confiabilidad (Z=?) de la distribución


Normal Estándar para un nivel de confianza del (1-α)% = 95%, se procede así:

(1-α) = 0.95 por tanto la significancia α=1 - 0.95= 0.05, y la significancia media
α/2=0.025

Proporción p= (1–0,025)=0,975. Dada un área bajo la curva Normal estándar de


0.975, le corresponde una constante de confiabilidad z=1,96.
σ=1

μ=0 z=1,96 z

P(Z(0,1)≤ z)=0,975 (equivalente a la proporción 0,475 registrada en la tabla para el


área entre Z=0 y Z=1,96 y le sumamos 0,5 por simetría correspondiente a la
proporción del área Z<0).

Los valores de z se encuentran tabulados en la tabla E2: Distribución Normal


Estandarizada https://ugc.elogim.com:3107/es/ereader/ugc/39397?page=447

En segundo lugar, la variabilidad (S²) se estima así: una proporción de votantes del
30%, p=30% =0,3 por lo tanto q=(1- p)=(1- 0,3)=0,7. Variabilidad S²= [p*q]= [ p* (1-
p) ]= (0,3)*(0,7)= 0,21

En tercer lugar el error de muestreo admisible en las estimaciones es 5%, E=0,05


Finalmente, reemplazamos los valores de tamaño de la población (N=13.000.000),
confiabilidad (z=1,96), variabilidad (S²=0,21) y error de muestreo (E=0,05), en la
fórmula para calcular el tamaño de la muestra cuando se conoce el tamaño de la
población:

TamañodeMuestra (n) =
(N * Z * S )2 2

(Z * S ) + (N *  )
2 2 2

n=
((13.000.000) * (1.96) * (0,21)
2

((1,96) * (0,21) + ((13.000.000) * (0.05) ) = 323UnidadesdeMuestra


2 2

El tamaño de muestra estimado es de 323 unidades a seleccionar, calculado con


una población N=13.000.000 de votantes, una confiabilidad del 95%, una
variabilidad de 0,21 (p=0.3) y error de muestreo admisible en las estimaciones del
5%.
1.7.2 Ejercicio propuesto de aplicación calculo estadístico del tamaño de muestra,
cuando se conoce la población.

La red de instituciones hospitalarias desea realizar una investigación de calidad del


servicio en los pacientes hospitalizados y aplicara un cuestionario de manera
aleatoria a una muestra. Si el tamaño de la población hospitalizada es N=3.500
pacientes, calcule un tamaño de muestra, considerando una confiabilidad del 95%,
estudios anteriores reportaron una calificación de calidad de servicio del 40% y un
error de muestreo del 4%.

En primer lugar, para hallar la constante de confiabilidad (Z=?) de la distribución


Normal Estándar para un nivel de confianza del (1-α)% = 95%, se procede así:

(1-α) = 0.95 por tanto la significancia α=1 - 0.95= 0.05, y la significancia media
α/2=0.025

Proporción p= (1–0,025)=0,975. Dada un área bajo la curva Normal estándar de


0.975, le corresponde una constante de confiabilidad z=1,96.

σ=1

μ=0 z=1,96 z

P(Z(0,1)≤ z)=0,975 (equivalente a la proporción 0,475 registrada en la tabla para el


área entre Z=0 y Z=1,96 y le sumamos 0,5 por simetría correspondiente a la
proporción del área Z<0).

Los valores de z se encuentran tabulados en la tabla E2: Distribución Normal


Estandarizada https://ugc.elogim.com:3107/es/ereader/ugc/39397?page=447

En segundo lugar, la variabilidad (S²) se estima así: estudios anteriores reportaron


una calificación de calidad de servicio del 40%, p=40%=0,4 por lo tanto q=(1- p)=
(1-0,4)=0,6. La variabilidad S²=[ p*q]=[ p*(1-p)]=(0,4)*(0,6)=0,24

En tercer lugar el error de muestreo admisible en las estimaciones es 4%, E=0,04


Finalmente, reemplazamos los valores de tamaño de la población (N=3500),
confiabilidad (z=1,96), variabilidad (S²=0,24) y error de muestreo (E=0,04), en la
fórmula para calcular el tamaño de la muestra cuando se conoce el tamaño de la
población:

TamañodeMuestra (n) =
(3500 * (1,96) * (0,24)
2

((1,96) * (0,24) + (3500 * (0,04) ) = 495unidadesmuestrales


2 2

El tamaño de muestra estimado es de 495 unidades a seleccionar, calculado con


una población de 3500 pacientes hospitalizados, confiabilidad del 95%, una
variabilidad de 0,24 (p=0.4) y error de muestreo admisible en las estimaciones del
4%.

También podría gustarte