Está en la página 1de 86

Población, muestra, muestreo y

criterios de selección

Roberto Niño-Garcia
• Miembro titular, Sociedad Científica de Estudiantes de Medicina de la Universidad Nacional de Piura (SOCIEMUNP)

• Pasante, Emerge Piura | Unidad de Investigación en Enfermedades Emergentes y Cambio Climático, Filial Piura.

• Facultad de Ciencias de la Salud, Universidad Nacional de Piura.

E-mail: rasng1997@gmail.com

1
Contenidos
1. Introducción
2. Población y muestra
3. Cálculo del tamaño muestral
4. Muestreo
5. Criterios de selección

2
1. Introducción

• Es fundamental para la validez del estudio que se calcule un


tamaño de muestra adecuado, según el tipo de diseño de
estudio
• Este es un tema complejo debido al fuerte componente
metodológico y matemático que está detrás.

3
2. Población y muestra
 Población: conjunto de personas, objetos o situaciones con características
comunes, en un período y lugar determinado. La población abarca el total de
elementos que interesan al investigador.

 Muestra: es un subconjunto de una población


 Muestra probabilística
 Muestra no probabilística

4
5
3. Cálculo del tamaño muestral

CONCEPTOS PRIMARIOS
► Población
► Muestra
► Parámetro
► Estadístico
► Varianza poblacional
► Inferencia estadística
► Error muestral o Tolerancia de error
► Nivel de confianza.
Conceptos primarios
►Población: conjunto de individuos o elementos que
cumplen ciertas propiedades comunes.

►Muestra: subconjunto representativo de una


población.
MUESTRA
POBLACIÓN

UNIDAD
Conceptos primarios
►Parámetro : Son las medidas o datos que se obtienen
sobre la distribución de probabilidades de la
población, tales como la media, la varianza, la
proporción, etc.

►Estadístico. Los datos o medidas que se obtienen


sobre una muestra y por lo tanto una estimación de
los parámetros, es decir es igual al parámetro pero
de la muestra.
Población
Muestra

Estadístico

Parámetro
Conceptos primarios
►Varianza Poblacional. Cuando una población es más
homogénea la varianza es menor. Generalmente es
un valor desconocido y hay que estimarlo a partir de
datos de estudios previos.

►Inferencia estadística. Inferencias acerca de la


población a partir de una muestra extraída de la
población.
Conceptos primarios
► Nivel de Confianza. Probabilidad de que la estimación
efectuada se ajuste a la realidad.

► Error Muestral o Tolerancia de error: de estimación o


standard. Es la diferencia entre un estadístico y su parámetro
correspondiente. Generalmente 5%, en estudios con fármacos
1%.La tolerancia debe ir de la mano de la prevalencia del
estudio en cuestión.
Margen de confianza en la estimación
• Expresa el grado de probabilidad que el
investigador tiene en que su estimación se
ajuste a la realidad.
• Los valores comúnmente utilizados son 95, 99,
99,9%
NIVEL DE CONFIANZA
Errores, Errores, ERRORES
Aleatorio
Muestral
Sistemático
V = v± e

Valor Valor
ERROR
Verdadero Medido en
en la la muestra
población
Variables: Tipos y escalas de medición
Sexo: Masculino/Femenino Peso
Grupo sanguíneo: A/B/AB/O Temperatura
Nivel económico: alto/medio/bajo Número de hijos
Estado de salud: bueno/regular/malo Índice de masa corporal

15
Variable independiente y dependiente
Obesidad

Exposición

Sedentarismo Mortalidad HTA

Resultado
DM2
Inferencia estadística
• La inferencia estadística comprende los métodos que son usados para determinar
algo acerca de la población en base a una muestra probabilística.
• Existen dos procedimientos para la inferencia: estimación de parámetros (puntual
y por intervalo) y el contraste de hipótesis sobre los parámetros.

Población

Muestra
Muestreo

Inferencia
Contraste de hipótesis
Se compara un tratamiento nuevo (N) contra la DM2 con uno tradicional
(T) en dos grupos de individuos. Luego de un tiempo, N controla al 70%
de los individuos y T al 30%.
Se quiere saber si esto es debido a una real mayor eficacia de N o se debe
simplemente a diferencias que el azar puede establecer (variaciones aleatorias
del muestreo), sin que existan diferencias reales en el control de diabéticos entre
ambos tratamientos.

• Se formulan las hipótesis:


―Hipótesis nula (H0): no hay ningún efecto o diferencia.
―Hipótesis alternativa o de investigación (H 1): hay un efecto o
diferencia. Generalmente es la hipótesis del investigador. Es la
conclusión que se acepta cuando los datos no apoyan la H0. 18
Error Aleatorio
El error aleatorio no se suele ajustar a ninguna regla
o norma , varían en cada caso , en su sentido y
magnitud, y por ello tiende a anularse cuando se
trata de un número elevado de casos.
– Los errores aleatorios se comenten, por ejemplo, cuando
un encuestado elige erróneamente una casilla queriendo
hacerlo en otra, cuando un encuestador marca
erróneamente un dato, etc.
Errores Sistemáticos
• Un error sistemático es aquel que se produce de igual modo (sentido y
proporción) en todas las mediciones que se realizan sobre un parámetro
de la muestra

• Contrario al error aleatorio, NO se anula en muestras grandes.

Ejemplos
Las tendencias subjetivas conscientes o inconscientes del investigador.
Sustituciones, según criterio propio del investigador, de unidades de la muestra
que habían sido elegidas al azar.
Insuficiente observación del conjunto de la población que influye en una deficiente
definición de sus características.
Error Muestral
• Cuando se extrae una muestra de una población es
frecuente que los resultados obtenidos de la muestra
no sean exactamente los valores reales de la
población.
• El error de muestreo ocurre al estudiar una muestra
en lugar de la población total.
• La diferencia entre el valor del parámetro de una
población y el obtenido de una muestra recibe el
nombre de error muestral. ( y que no puede ser asociado a otro tipo de
explicación, es decir no es error aleatorio o sistemático)
Error Muestral
Por muy perfecta que sea la muestra siempre habrá
grado de divergencia entre los parámetros estimados
usándola y los de la verdadera población.
En el cálculo del error intervienen:
Tamaño de la muestra
Varianza poblacional
Nivel de confianza
Tipo de muestreo
Tamaño de la muestra vs. Error muestral
Margen de error admisible
Los incrementos en el tamaño de la muestra
repercuten en una mayor precisión y por
consiguiente en menor error muestral.
El error muestral interviene en el cálculo del tamaño
de la muestra solo si el diseño es probabilístico.
En el muestreo probabilístico el investigador fija el
error máximo admisible a priori y sobre esa base
realiza el cálculo del tamaño de la muestra.
Por lo tanto el tamaño de la muestra:

Es directamente
proporcional al nivel
de confianza Z.

Es directamente
Es inversamente proporcional a la
proporcional al variabilidad del
error estimado. fenómeno a
estudiar.
Factores que influyen
►Tipo de diseño de estudio.
►Tipo de muestreo utilizado.
►Comparación de muestras independientes o
pareadas.
1. Identificación de la población

2. Indicadores a estimar
 Proporciones
 Promedios (medias)
 Métodos multivariados
3. Análisis de subgrupos

4. Precisión deseada en los estimadores


https://www.sergas.es/Saude-publica/EPIDAT-4-2

28
Muestra para la media de población
Población conocida Población no conocida

Las variables son numéricas


El nivel de confianza o seguridad (1-α). El nivel de confianza prefijado da lugar
a un coeficiente (Zα).
d : error máximo permisible o Tolerancia de error (mayormente 5%)
𝑺𝟐: varianza poblacional
Ejemplo 1
• Es necesario estimar entre 10.000 establecimiento de salud, el número
de usuarios por cada centro con un error de estimación de 4 y un nivel
de confianza del 95%. Sabemos que la varianza es 1000. ¿Cuántos
centros de salud deben visitarse para satisfacer estos requerimientos?

S=√𝑉
Muestra para la proporción de población
Población conocida Población no conocida

n: Tamaño muestral Las variables son nominales


N: Tamaño de la población, número total de historias.
Z: Valor correspondiente a la distribución de Gauss 1,96 para α =0,05
p: Prevalencia del fenómeno en estudio.
q: 1-p
“i” o “d”: Tolerancia de error (mayormente 5%)*.
•Si las prevalencias son bajas, las tolerancias de error lo debe ser aun más.
Ejemplo de la tasa de prevalencia, se puede suponer que la proporción que ha de
estimarse se moverá probablemente entre un 5% y un 15%, y es razonable
aspirar a que no se incurra en un error mayor del 1%.
Ejemplo 2
• Se desea hacer una encuesta para determinar la proporción de familias
que carecen de medios económicos para atender los problemas de salud.
Existe la impresión de que esta proporción está próxima a 35%. Se desea
determinar un intervalo de confianza del 95% con un error de estimación
de 5%. ¿De qué tamaño debe tomarse la muestra?
Cálculo del tamaño muestral en estudios de
casos y controles
Cálculo del tamaño muestral en estudios de
casos y controles
Cálculo del tamaño muestral en estudios de
casos y controles
Cálculo del tamaño muestral en estudios de
casos y controles
Ejemplo 3
• En una región donde el cólera es un problema grave de salud, se supone
que el 30% de la población utilizan agua contaminada. Se desea realizar
un estudio para estimar el OR con una precisión relativa del 25% (OR
anticipado igual a 2) con un 95% de confianza. ¿Cuál es el tamaño de la
muestra en los casos de cólera y en los controles?
Cálculo del tamaño muestral en estudios de
Cohortes
Ejemplo 4
• Supongamos que queremos estudiar la posible asociación de un factor
ambiental en la incidencia de una enfermedad respiratoria específica, si
deseamos una precisión del 10%, tenemos dos poblaciones semejantes
una no expuesta con P2 = 0.2 y una expuesta con P1 = 0.4.
Cálculo del tamaño muestral en estudios de
Cohortes
Ejemplo 5
• Para calcular el tamaño de muestra suponiendo que P1 = 0.2 y P2 = 0.1, α
= 0.05, β = 0.2 y r = 1, o sea un no expuesto por cada expuesto.
4. Muestreo
 Forma de seleccionar la muestra
 Tipos:
 Probabilístico
 No probabilístico

AZAR

42
Tipos de muestreo

43
Muestreo probabilístico
• Para ser elegido implica la modalidad: Azar/suerte.
• Gracias a esto se puede inferir los resultados (a la
población).
• Hay muchas posibilidades de muestreo:
– Aleatorio simple.
– Sistemático.
– Estratificado.
– Por conglomerados.
A) MUESTREO PROBABILÍSTICO

“Todos los individuos de la población tienen


una probabilidad superior a cero de ser
elegidos, la cual es independiente de las
preferencias del investigador”
A.1. Muestreo aleatorio simple
Usted tiene una población total de 100 estudiantes universitarios, el cálculo del tamaño
de muestra llevó a que elija 20 .
1 2 3 4 5 6 7 8 9 10
11 12 13 14 15 16 17 18 19 20
21 22 23 24 25 26 27 28 29 30
31 32 33 34 35 36 37 38 39 40
41 42 43 44 45 46 47 48 49 50
51 52 53 54 55 56 57 58 59 60
61 62 63 64 65 66 67 68 69 70
71 72 73 74 75 76 77 78 79 80
81 82 83 84 85 86 87 88 89 90
91 92 93 94 95 96 97 98 99 100
Muestreo aleatorio simple
Ingresa a un software de números aleatorios y le menciona que debe de tomar los
siguientes sujetos: 3,4,6,8,15,19,21,26,38,43,47,50,55,58,63,72,80,90,96,99
1 2 3 4 5 6 7 8 9 10
11 12 13 14 15 16 17 18 19 20
21 22 23 24 25 26 27 28 29 30
31 32 33 34 35 36 37 38 39 40
41 42 43 44 45 46 47 48 49 50
51 52 53 54 55 56 57 58 59 60
61 62 63 64 65 66 67 68 69 70
71 72 73 74 75 76 77 78 79 80
81 82 83 84 85 86 87 88 89 90
91 92 93 94 95 96 97 98 99 100
Muestreo aleatorio simple

• Sencillo y con menos sesgos.


• La probabilidad de que un sujeto sea
elegido es similar para todos.
• Se usan procedimientos para elegir al
azar a los participantes (números
aleatorios)
A.2. Muestreo sistemático
Si su población es de 100 y la muestra es de 20, k es 100/20=5.
Elegimos aleatoriamente entre 1 a 5 para elegir la unidad de arranque.
1 2 3 4 5 6 7 8 9 10
11 12 13 14 15 16 17 18 19 20
21 22 23 24 25 26 27 28 29 30
31 32 33 34 35 36 37 38 39 40
41 42 43 44 45 46 47 48 49 50
51 52 53 54 55 56 57 58 59 60
61 62 63 64 65 66 67 68 69 70
71 72 73 74 75 76 77 78 79 80
81 82 83 84 85 86 87 88 89 90
91 92 93 94 95 96 97 98 99 100
Muestreo sistemático
Elige aleatoriamente y sale 3. Por tanto luego sería 3+k, luego 3+2k, luego 3+3k y así
sucesivamente
1 2 3 4 5 6 7 8 9 10
11 12 13 14 15 16 17 18 19 20
21 22 23 24 25 26 27 28 29 30
31 32 33 34 35 36 37 38 39 40
41 42 43 44 45 46 47 48 49 50
51 52 53 54 55 56 57 58 59 60
61 62 63 64 65 66 67 68 69 70
71 72 73 74 75 76 77 78 79 80
81 82 83 84 85 86 87 88 89 90
91 92 93 94 95 96 97 98 99 100
Muestreo sistemático
• Se seleccionan las unidades de muestreo
empleando un intervalo de medida constante
sobre el marco muestral.
• El intervalo muestral es la división del tamaño
de la población sobre la muestra calculada.
• Se recomienda cuando la población es
numerosa.
• Puede ser usado con un buen grado de
confiabilidad.
A.3. Muestreo estratificado
De los 100 estudiantes que tiene su población, 40 son hinchas de la U, 30 de Alianza
Lima, 20 de Cristal y 10 de Sport Boys.
1 2 3 4 5 6 7 8 9 10
11 12 13 14 15 16 17 18 19 20
21 22 23 24 25 26 27 28 29 30
31 32 33 34 35 36 37 38 39 40
1 2 3 4 5 6 7 8 9 10
11 12 13 14 15 16 17 18 19 20
21 22 23 24 25 26 27 28 29 30
1 2 3 4 5 6 7 8 9 10
11 12 13 14 15 16 17 18 19 20
1 2 3 4 5 6 7 8 9 10
Muestreo estratificado con afijación
igual
El tamaño de la muestra es 20, usted tiene 4 estratos, ¿cuántos corresponden a
cada estrato? 5 entonces toma aleatoriamente de cada estrato 5 estudiantes
1 2 3 4 5 6 7 8 9 10
11 12 13 14 15 16 17 18 19 20
21 22 23 24 25 26 27 28 29 30
31 32 33 34 35 36 37 38 39 40
1 2 3 4 5 6 7 8 9 10
11 12 13 14 15 16 17 18 19 20
21 22 23 24 25 26 27 28 29 30
1 2 3 4 5 6 7 8 9 10
11 12 13 14 15 16 17 18 19 20
1 2 3 4 5 6 7 8 9 10
Muestreo estratificado con afijación
proporcional
El tamaño de la muestra es 20. Si los hinchas de la U son el 40% , AL 30%, SC 20% y
SBA 10%, entonces en la muestra se requieren 8, 6 , 4 y 2 sujetos , respectivamente.
1 2 3 4 5 6 7 8 9 10
11 12 13 14 15 16 17 18 19 20
21 22 23 24 25 26 27 28 29 30
31 32 33 34 35 36 37 38 39 40
1 2 3 4 5 6 7 8 9 10
11 12 13 14 15 16 17 18 19 20
21 22 23 24 25 26 27 28 29 30
1 2 3 4 5 6 7 8 9 10
11 12 13 14 15 16 17 18 19 20
1 2 3 4 5 6 7 8 9 10
Muestreo estratificado
• Es útil cuando existen subgrupos bien definidos
dentro de la población y la variable de interés varía
considerablemente entre estos subgrupos. (Existe
heterogeneidad entre ellos)
• El método asegura que en la muestra habrá
representantes de todos los estratos (incluso
de los que representan pequeños grupos en la
población).
ESTRATOS Homogéneos en su interior;
diferentes entre sí en propiedades y
tamaño
Comuna B
Comuna A

Comuna C
Comuna D
Los estratos más grandes
Tienen mayor probabilidad de ser representados
A.4. Muestreo por conglomerados
Cada uno de los conglomerados tiene 5 sujetos, por lo que tenemos un total de 20
conglomerados. Si dividimos la muestra entre el número promedio de sujetos por
conglomerados sería 20/5= 4, necesitamos 4 conglomerados, los cuales seleccionamos
de manera aleatoria.
1 2 3 4 5 1 2 3 4 5
1 2 3 4 5 1 2 3 4 5
1 2 3 4 5 1 2 3 4 5
1 2 3 4 5 1 2 3 4 5
1 2 3 4 5 1 2 3 4 5
1 2 3 4 5 1 2 3 4 5
1 2 3 4 5 1 2 3 4 5
1 2 3 4 5 1 2 3 4 5
1 2 3 4 5 1 2 3 4 5
1 2 3 4 5 1 2 3 4 5
Muestreo por conglomerados
• Todos los elementos de la población
pertenecen a uno y solo uno de los
conglomerados.
• Debe de tenerse una aproximación del
número de elementos que conforman
cada conglomerado.
• Los conglomerados deben de ser de
tamaño pequeño.
Muestreo por conglomerados
• Los conglomerados son
agrupaciones de elementos que
existen naturalmente, pero que
pueden ser homogéneos entre sí.
• Consiste en realizar una muestra
aleatoria simple en la cuales las
unidades de muestreo son
conglomerados.
Muestreo NO probabilístico
• Para ser elegido implica la modalidad:
Conveniencia, los que se puedan o acepten.
• NO SE PUEDE inferir los resultados (los intervalos
de confianza no se deben usar).

• Posibilidades de muestreo:
– Por bola de nieves. (poblaciones particulares).
– Otros (por juicios, por cuotas).
Muestreo por bola de nieves
• Cuando se ubica a un sujeto a encuestar y este refiere a otros
más, estos al ser encuestados darán referencia de otros más.
(o también de manera anónima).
• Usable cuando no se conoce a la totalidad de los sujetos a los
que se enrolará.
También: Muestreo de tipo censal
• Uno de los más comunes.
– Sobre todo cuando ya tienes una base de datos (análisis
secundario de datos).
• La población es igual a la muestra.
Población Muestra

=
• POBLACIONES PEQUEÑAS

• POBLACIONES MUY VARIABLES


Comparación
Muestreo Muestreos No
Probabilísticos Probabilísticos
• Estimación de • Estudios Pilotos
• Estudios Cualitativos
Parámetros • Investigaciones en
• Comprobación de poblaciones de difícil
registro o localización ( Ej.
Hipótesis Marginales, prostitutas,
enfermos de VIH, etc…)
Y que pasa cuando…
• Se quiere hacer un muestreo a nivel nacional (para
que se puedan inferir a todo el país).

• Se puede hacer de tipo:


– Censal.
– Probabilístico.

• Un ejemplo con una población universitaria.


Para muestrear
Va a realizarse un estudio en estudiantes universitarios de
Universidades de la ciudad Z

¿Ustedes pueden contar


con un listado de la
totalidad de alumnos
matriculados en el
semestre en todas las
universidades?
Si elegimos la ciudad de Lima
Va a realizarse un estudio en estudiantes universitarios de
Universidades de la ciudad Z

¿Usted pueden contar con


un listado de la totalidad
de universidades de Lima?
Total de Universidades de la ciudad

Universidades de Lima
Selección aleatoria de Universidad

Universidades de Lima
Pero se complica…
Recuerde que hay Universidades Pública y Universidades Privadas

¿Estrat0? o es
¿Conglomerado?
Universidades de Lima

Públicas Privadas
Estudiantes universitarios
Muestreo aleatorio estratificado

N1=10 1:2 N2=20


Estratificando con afijación
proporcional por Tipo
Muestreo aleatorio estratificado

n=9
Y también se debe hacer por carreras
y/o años de estudios
Suponga que tenga el listado total de estudiantes de las 9 universidades elegidas.
¿Como llega a la unidad de análisis al final?
Universidades de Lima

Públicas Privadas
Muestreo Multietápico
Pero a pesar de todo siente que la muestra no será representativa, de modo que
considera la distribución por Facultad..¿Qué muestreo usaría? Suponga que puede tener
acceso al listado de cada Facultad.
Universidades de Lima

Públicas Privadas
Muestreo Polietápico o multietápico
• En la realidad se combina más de un método
con la finalidad de minimizar los costos y
maximizar los resultados.
• Se parte de muestreos sucesivos con
diferentes unidades de muestreo hasta llega
a la unidad de análisis.
• Según las fases puede ser: bietápico,
trietápico, pentaetápico.
Plan de muestreo
5. Criterios de selección

Criterios de inclusión

Criterios de exclusión

Criterios de eliminación

82
Criterios de inclusión
Utilizados para seleccionar a los participantes entre
los potenciales participantes:
 Que tenga característica o condición en estudio:
Edad, sexo, …, apropiados.
 Que desee colaborar voluntariamente
 Que pueda participar
 Que no presente otras características no
deseadas.
83
Criterios de exclusión
Características de los casos que aún cumpliendo los
criterios de inclusión, presentan otras características
que no deberá tener la muestra.
Nunca entraron al estudio

84
Criterios de eliminación
Definición de las características que presenten
los sujetos de estudio durante el desarrollo del
mismo y que obliguen a prescindir de ellos.
Entraron pero se les eliminó

85
Roberto Niño-Garcia
• Miembro titular, Sociedad Científica de Estudiantes de Medicina de la Universidad Nacional de Piura (SOCIEMUNP)

• Pasante, Emerge Piura | Unidad de Investigación en Enfermedades Emergentes y Cambio Climático, Filial Piura.

• Facultad de Ciencias de la Salud, Universidad Nacional de Piura.

• E-mail: rasng1997@gmail.com

Gracias.
86

También podría gustarte