Está en la página 1de 51

Unidad Académica de

Estudios Generales

Estadística Básica

Profesores: Equipo docente de Estadística


Unidad I
Semana 02

Tamaño de muestra y muestreo


Leer el caso: Televisión digital
TVCOM.SAC es una empresa que brinda el
servicio de televisión digital por cable con una
programación variada en canales nacionales e
internacionales comprometida con las exigencias
del público televidente como la claridad en la
señal, atención inmediata al cliente y precio al
alcance de las personas. Con la finalidad de
expandir su mercado en el distrito los Olivos, han
diseñado un paquete “Premium” a un costo
accesible y decide realizar un estudio para estimar
la proporción de hogares que tengan interés en la
contratación de televisión digital por cable.
¿A quiénes se debe encuestar?
¿A cuántos se debe encuestar?
¿Y Por qué?
LOGRO DE LA SESIÓN

Al finalizar la sesión, el estudiante calcula el tamaño de


muestra y aplica las técnicas de muestreo para seleccionar
muestras aleatorias y representativas en una población de
estudio.
Sesión 2: Tamaño de muestra y Muestreo
ASU: ECN 221 - Estadística para los Negocios. Módulo 5: Cap. 8 – Clase
8.03 Determinación del tamaño de muestra: Ejemplos adicionales

1. Tamaño de muestra
2. Conceptos básicos de muestreo
3. Muestreo probabilístico
4. Muestreo no probabilístico
5. Conclusiones
1. CÁLCULO DEL TAMAÑO DE MUESTRA

Valor fijo generalmente desconocido: Valores que varía de una muestra a otra:
μ : media X: media
σ2 : Varianza S2: Varianza
π ó P: Proporción p : proporción
Porqué Calcular el Tamaño de Muestra
• Las muestras pueden estudiarse con mayor rapidez que
las poblaciones.
• El estudio de una muestra es menos costosa que el de
una población.
• Toma menos tiempo su estudio
• En la mayoría de las situaciones el estudio de una
población es imposible.
• Con frecuencia los resultados de una muestra son más
precisos que los que se basan en una población.
Cuando Calcular el Tamaño de Muestra

• Cuando no se puede estudiar a toda la población y


se quieren estimar parámetros. Prevalencia,
Promedio, Porcentaje, Tasas.

• Cuando se desean comparar dos o más grupos y


establecer si hay diferencias.
Tamaño de muestra
Para estimar Para comparar
parámetros a grupos
partir de un grupo

Validación del
Una Una Dos Dos
tamaño
Proporción Media de la muestra
medias proporciones

Población Población Población Población


Infinita Finita Infinita Finita

Tamaño de muestra ajustado a las pérdidas


Fórmulas para calcular tamaño de una muestra
Variable cualitativa Variable cuantitativa
Población
(Proporción) (Promedio)

2
Población Infinita Z S
n =  1− / 2 
No se conoce la Población N  E 

Z12− / 2 NS 2
Población Finita n=
Se conoce la Población N ( N − 1) E 2 + Z12− / 2 S 2

Donde:
n: Tamaño de la muestra Z: Variable estandarizada de distribución normal
P: Proporción de una categoría de la variable 1- : Nivel de confianza = 95%
d = E: Margen de error S²: Varianza de la muestra
N: Tamaño de la población Q = 1- P
Tamaño de muestra para una proporción

a. Población Infinita
2
Z * p*q
n= 1−
2
d
Z = Valor de Z a un nivel de confianza (generalmente 95%).
p = Proporción (prevalencia) de la variable. De literatura, Prueba Piloto o
maximizar con p = 0,5.
q=1–p
d = Precisión (Margen de error). Determina el investigador en función del costo
y tiempo.
… tamaño de muestra para una proporción

Ejemplo 1
Se desea conocer la prevalencia de Solución:
p = 0.05
diabetes en personas mayores de 40
q = 1-0.05 = 0.95
años en una ciudad ¿A cuántas Z = 1.96
personas se debe estudiar? Tener en
cuenta que la prevalencia de diabetes 1,962 * 0,05 * 0,95
en la población es alrededor de 5%, n= = 203
considera un error de 3% y un nivel 0,032
de confianza del 95% (1-α=0,95).
Redondear al número mayor siempre

Respuesta: Realizar el estudio en 203 personas mayores de 40 años para conocer la


prevalencia de diabetes en dicha ciudad
Ejemplo aplicativo de ASU
Imagina que el Departamento de Seguridad Pública de
Arizona (ADPS) quiere estimar qué proporción de todos los Solución:
conductores excede el límite de velocidad de 75 mph en un p = 0,41
tramo de la Ruta 40 en Arizona y necesita un tamaño de q = 1-0,41 = 0,59
muestra lo suficientemente grande como para que la Z = 1,96
precisión estimada no sea superior a 0,04. Según un
estudio anterior realizado en la ruta 40 en Nuevo México,
1,96 2 * 0,41* 0,59
se reveló que la proporción de vehículos que supera las 75 n=
mph es 0,41 ¿Qué tamaño de muestra se requiere para 0,04 2
que el ADPS tenga un 95% de certeza de que no está más
allá del 4% (es decir, 0,04)? n = 581
Respuesta: Por lo tanto, una muestra de 581 permitiría al ADPS tener un 95% de seguridad de que la
proporción que obtienen (de la muestra de 581) no estaría en más del 4%.
Tomado de: Arizona State University (Enero, 2023). ECN221: Estadística para los negocios. Módulo 5: Cap. 8 Intervalos de confianza.
https://canvas.asu.edu/courses/39153/pages/ch-8-confidence-intervals
… tamaño de muestra para una proporción

b. Población Finita
N * Z12− * p * q
n= 2
d * ( N − 1) + Z12− * p * q

N = Tamaño de la Población de
estudio
… tamaño de muestra para una proporción

Ejemplo 2
Solución:
Suponiendo que la población de un p = 0,05
distrito limeño es de alrededor de q = 0,095
15000 habitantes, estimar la Z = 1,96
prevalencia de diabetes, con una N = 15000
seguridad de 95% y un margen de
error de 3%, sabiendo que la 15000 ∗ 1,962 ∗ 0,05 ∗ 0,95
𝑛=
0,032 ∗ (15000 − 1) + 1,962 ∗ 0,05 ∗ 0,95
proporción de diabetes es 5%.
¿Cuánto será el tamaño de la
muestra? n = 200

Respuesta: El tamaño de muestra es 200 personas para conocer la prevalencia de


diabetes en el distrito limeño.
Tamaño de muestra para estimar un promedio (media)

a. Población Infinita
Z12− * S 2
n = 2
d

S = Desviación estándar. A partir de la bibliografía o


prueba piloto.
…para estimar un promedio (media)

Ejemplo 3
Solución:
Se desea conocer la concentración media
Zα = 1,96
basal de glucosa en la sangre de los
adultos con sobrepeso en un distrito de S2 = 250
Lima, con una seguridad de 95% (α=0,05) y d =3
un error máximo de 3,0 mg/dL, sabiendo
por estudios anteriores que la varianza es 1,96 2 * 250
de 250 mg/dL. ¿Cuánto debe ser el n=
tamaño de muestra?
3
n = 107
Respuesta: El tamaño de muestra es 107 estudiantes para conocer la glucemia media
basal.
Ejemplo aplicativo de ASU

El Departamento de Pesos y Dimensiones de Arizona Solución:


desea estudiar la cantidad de cerveza que se dispensa en Zα = 1,96
cada botella en una microcervecería local. El
Departamento desea determinar el tamaño de muestra S = 0.02
adecuado de tal manera que tenga un 95% de confianza
en que la muestra no tiene más de 0,005 litros. En un
d = 0,005
estudio similar realizado anteriormente para otra fábrica
1,96 2 * 0,02 2
de cerveza, se determinó que la desviación estándar de
n=
la población es de 0,02 litros. ¿Cuál sería un tamaño de 0,0052
muestra adecuado?
n = 62
Respuesta: El tamaño de muestra es 62 botellas para conocer la cantidad media en
cada botella de cerveza.
Tomado de: Arizona State University (Enero, 2023). ECN221: Estadística para los negocios. Módulo 5: Intervalos de confianza.
https://canvas.asu.edu/courses/39153/pages/ch-8-confidence-intervals
…para estimar un promedio (media)

b. Población Finita

N * Z2 * S 2
n= 2
d * ( N − 1) + Z2 * S 2

N = Tamaño de la Población de
estudio
…para estimar un promedio (media)

Ejemplo 4
Solución:
Se realiza un estudio para conocer la
Z1-α = 1,96
concentración media basal de glucosa
en la sangre de los adultos con N = 3000
sobrepeso en una población de 3000, S2 = 250
considera un nivel de confianza de 95%,
d =3
un error máximo de 3 mg/dL, se sabe
por estudios anteriores que la varianza 3000*1,962 * 250
n= 2
es de 250 mg/dL. Calcular el tamaño de 3 * (3000 − 1) + 1,962 * 250
muestra.
n = 103
Respuesta: La muestra para el estudio será de 103 personas para conocer la glucemia
media de los estudiantes.
RESUELVE Y RESPONDE
Se pide calcular el tamaño de muestra, para estimar la proporción de
hogares interesados en el paquete Premium de televisión digital por
cable, en el distrito de los Olivos, con una de confianza es de 95% y un
error máximo de 5%.

https://kahoot.it/
2. CONCEPTOS BÁSICOS DE MUESTREO

¿Qué es el muestreo? Población Muestra


Es una técnica estadística que
selecciona una muestra
representativa a partir de una
población de estudio.

El propósito es reducir sesgos de


selección, costos, tiempo
garantizando la calidad de datos
que debe recolectarse.
Elementos básicos del muestreo
¿Cuántos?
1. Población: Son todas las unidades de estudio
¿Cuáles?
(individuos u objetos) cuyas características se tiene
interés en estudiar (criterios de inclusión).
2. Marco muestral: Es una lista o un mapa de las
unidades de la población en un espacio y tiempo.
3. Muestra: Es un grupo de unidades seleccionadas
aplicando una técnica de muestreo.
Una muestra es representativa si cumple con una
cantidad óptima (tamaño de muestra) y representan
características de la población que se utiliza para Unidad de estudio
estimar parámetros.
4. Unidad de estudio: Es cada uno de los elementos que
se toman mediciones de las características a estudiar.
Ejemplo 1.

Se desea conocer la prevalencia de


diabetes mellitus tipo 2 en los adultos
mayores con sobrepeso atendidos en
el hospital Santa Rosa del distrito de
Pueblo Libre en Lima durante el año
2018, siendo considerados solo 117
para el estudio.

Identifica los elementos básicos del muestreo


Elementos básicos del muestreo
1. Población de estudio
Todos los adultos mayores con sobrepeso atendidos en el hospital
Santa Rosa de Pueblo Libre en el año 2018.
4. Marco muestral
Listado de los adultos mayores con sobrepeso atendidos en el hospital
Santa Rosa en el año 2018.
2. Muestra
Los 117 adultos mayores con sobrepeso atendidos en el hospital Santa
Rosa de Pueblo Libre durante el año 2018.
3. Unidad de estudio
Cada adulto mayor con sobrepeso atendido en el hospital Santa Rosa
en el 2018.
Tipos de Muestreo
Probabilístico No
(Aleatorio) Probabilístico

Aleatorio Simple Conveniencia

Según criterio
Sistemático

Estratificado Bola de nieve

Por conglomerados Por cuotas


3. MUESTREO PROBABILÍSTICO

• Garantiza la representatividad
• Obtención de muestras insesgadas
• Resultados generaliza a la población
• Permite calcular el error
• La probabilidad de seleccionar las
unidades es conocida
• Admite supervisar la muestra
• El marco muestral resulta ser costoso
Muestreo Aleatorio Simple

Población Muestra - Poblaciones pequeñas con variabilidad


similar entre las unidades o
individuos.
- Cada unidad tiene la probabilidad
equitativa de ser incluida en la
muestra.
- Lista de todos los individuos de la
población de estudio: “marco
muestral”.
- Selección al azar (tablas de números
aleatorios, calculadoras, software).
Ejemplo 2
De un listado de 36 alumnos matriculados en el segundo ciclo de Psicología de la
Universidad Norbert Wiener del periodo académico 2019-I, se quiere seleccionar
una muestra aleatoria de 10 alumnos, utilizando un muestreo aleatorio simple,
con el propósito de conocer el porcentaje de alumnos que trabajan y estudian.

Indicaciones:

Uso de Excel para generar números aleatorios

1. En Excel usar la siguiente función: =ALEATORIO.ENTRE(1;N) en el ejemplo N=36


2. Copiar tantas filas según el tamaño de muestra (en el ejemplo solo se necesita 10 números aleatorios,
serán 10 filas)
3. Copiar todos los números aleatorios generados y pegar como valores en una columna .
4. Ordenar los valores copiados y verificar si existen duplicados. Si hay duplicados generar nuevos
números aleatorios y reemplazar.
5. Ubicar en el marco muestral cada número aleatorio y genera el listado de la muestra.
Listado de alumnos matriculados en Psicología del periodo 2019-I
Muestreo Aleatorio Sistemático
• Se selecciona individuos del marco
muestral a intervalos regulares.
Ejemplo:
N = 60
n = 12
K = 60/12 =5
Los números seleccionados son:
2, 7, 12, 17, 22, ............
• Lleva a sesgo de selección si el marco
muestral está distribuido siguiendo
algún patrón particular.
Muestreo Aleatorio Sistemático
i listado de N = 600
1. Elaborar el listado de pacientes sin ningún ii Tamaño: n = 40
ordenamiento. iii Rango: N/n = 600/40

2. Calcular el intervalo con la siguiente fórmula: k = 15


iv Selección:
N
k = N n
n
1 1) 3
Redondear al entero inferior 2

2) 18
3. Seleccionar aleatoriamente el número de 3 3) 33

4
arranque en la serie de 1 a N. Arranque en 

3° de la lista entre 1 y 15 600 40)


4. Elaborar la lista de los seleccionados de la
muestra.
Ejemplo 3.

De un listado de 36 alumnos matriculados en la escuela de Psicología de la


Universidad Norbert Wiener del periodo académico 2019-I, se quiere seleccionar
una muestra aleatoria de 8 alumnos, utilizando un muestreo aleatorio
sistemático, con el propósito de conocer el porcentaje de alumnos que trabajan
y estudian.
Indicaciones:

Usar el listado de estudiantes del ejemplo 2


Muestreo Aleatorio Estratificado

• La población se dividide en grupos


(estratos) de acuerdo a alguna
característica común.

• Este tipo de muestreo garantiza la


representatividad de cada grupo en
la muestra.

• Cuánto más homogénea sean los


estratos, más precisas serán las
estimaciones.
Muestreo Aleatorio Estratificado
i Listado : N
1. Determinar la característica de los estratos o la
composición de los estratos, cantidad de unidades ii Tamaño: n
de estudio en cada estrato. iii Divide N en estratos
2. Calcular el factor de proporción con la siguiente o subpoblaciones
fórmula:
K = n/N. nA
NA
Donde:
NB nB
n = Tamaño de la muestra
NC nC
N = Tamaño de la población. n
4. Multiplicar el factor K por la cantidad respectiva en nA n n
= B = C =
n
los estratos. NA NB NC N

5. Seleccionar aleatoriamente o sistemático los iv Selección:


individuos en cada estrato. a) M. sistemático
6. Elaborar la lista de la muestra por cada estrato. b) M. A.S
Ejemplo 4.
Se tiene el propósito de conocer la presencia de estrés académico en 1500 estudiantes
ingresantes de una universidad la cantidad de ingresantes por carera se muestran en la
siguiente tabla:
Carrera Ingresantes Muestra
Farmacia 180
Enfermería 250
Obstetricia 50
Administración 200
Psicología 40
Contabilidad 50
Ingeniería 190
Odontología 150
Turismo 60
Tecnología Médica 280
Derecho 50
Total 1500 350

Se pide seleccionar una muestra aleatoria de 350 estudiantes en forma proporcional al


número de ingresantes por carrera profesional y completar la tabla.
Muestreo por conglomerados

• También se denomina de etapas múltiples.


• Se utiliza para poblaciones grandes y
dispersas.
• No es posible disponer de un listado.
• En lugar de individuos se seleccionan
conglomerados que están agrupados de
forma natural (cuadras de casas,
departamentos, hospitales, provincias, etc.)
• Se selecciona en primer lugar el
conglomerado más grande, a partir de éste
se selecciona un subgrupo. A partir de este
subgrupo se selecciona otro subgrupo y así
sucesivamente, hasta llegar a las unidades
de análisis.
Ejemplo 5.

Si se desea estudiar a las personas con VIH atendidos en los


hospitales de nivel I de ESSALUD.
Nuestro primer conglomerado serían las regiones o departamentos,
a partir de estas regiones aleatoriamente seleccionar un subgrupo.
Del subgrupo anterior formar un nuevo conglomerado de segunda
etapa con las provincias. De este conglomerado seleccionar
aleatoriamente un subgrupo de provincias.
De este subgrupo de provincias formar un conglomerado de
hospitales de Nivel I. Luego seleccionar aleatoriamente un subgrupo
de Hospitales.
A partir del grupo de hospitales hacer un listado de los pacientes
hipertensos luego realizar muestreo aleatorio.
4. MUESTREO NO PROBABILÍSTICO
• No garantiza la representatividad
• Obtención de muestras sesgadas
• Resultados no se generaliza a la población
• No permite calcular el error
• La probabilidad de seleccionar las unidades
no se conoce
• Elección solo unidades requeridas
• El marco muestral flexible y bajo costo
Muestreo no probabilístico accidental o conveniencia
• Selecciona las unidades de la
Población Muestra población que tiene a su
Investigador
alcance, en un lugar y momento
determinados hasta completar
el tamaño de muestra.
• Útil en investigaciones
exploratorias formulando
hipótesis.
• Resultados no se generaliza
Ejemplos:

✓ Personas diabéticas que llegan a un hospital o


consultorio.
✓ Personas voluntarias que participan en un estudio.
✓ Personas afectadas por una epidemia.
✓ Clientes que llegan a un establecimiento o negocio.
Muestreo no probabilístico según criterio

El investigador elige las


unidades de la muestra en
base a juicio o experiencia
quienes son representativos
de la población.
Ejemplo 6.

Si se quiere conocer la incidencia del consumo de


tabaco y bebidas alcohólicas en estudiantes de
medicina del quinto año de una universidad, tal vez
sea conveniente no considerar a los estudiantes de
otras carreras.
Muestreo no probabilístico por cuotas

La muestra se selecciona tomando en


cuenta características (variables)
específicas de la población.
Tiene similitud con el muestreo
estratificado, solo que en este caso la
selección dentro de cada cuota se hace
de manera accidental.
Generalmente se usa para encuestas de
opinión y mercado.
Ejemplo 7.

En un estudio de opinión sobre preferencias electorales se


requiere una muestra de 400 personas de 18 a 70 años, el
investigador puede estar interesado que 100 sean varones
de 18 a 25 años, 100 mujeres de 18 a 25 años, 100 amas de
casa y 100 personas profesionales.
Ejemplo 8.
Se desea conocer el gasto en la compra de útiles para
el nivel de educación inicial en las familias de Lima
metropolitana, para ello se ha seleccionado a 300
padres de 24 a 50 años en los diferentes estratos
socioeconómicos, cuyos resultados revelan que el
gasto promedio es de 720 soles. Se pide identificar:
a) Población:
b) Unidad de estudio:
c) Muestra:
d) Muestreo:
e) Variable:
f) Tipo de variable:
g) Escala de medición:
Recuperado de http://laprensa.pe/economia/noticia-educacion-lima-cada-vez-mas-costosa-3399
Muestreo no probabilístico por Bola de Nieve

• Poblaciones minoritarias de
difícil acceso por razones
sociales (prostitutas, alcohólicos,
drogadictos, etc.)
• Contacta con una persona del
grupo (líder) y a partir de éste,
poco a poco se va formando la
muestra de individuos.
Ejemplo 9.

Se quiere evaluar el conocimiento sobre


cuidados de VIH en trabajadoras sexuales de
una ciudad.
4. CONCLUSIONES
1. Calcular el tamaño de muestra depende del tipo de
variable.
2. El muestreo permite seleccionar unidades de una
muestra de una población de estudio.
3. Las muestras pueden ser seleccionarse utilizando un
muestreo probabilístico o no probabilístico.
4. Las unidades de estudio en muestras probabilísticas
dependen del azar.
ACTIVIDAD 2

Del archivo
ejemplos sesión 2,
en equipos de 5
integrantes resolver
los ejercicios 1 y 2.

También podría gustarte