04 Cuantitativo

SESIÓN N°7:
POBLACION, MUESTRA, MUESTREO
POBLACIÓN Y MUESTRA
Una población está determinada por sus características definitorias. Por lo tanto, el
conjunto de elementos que posea esta característica se denomina población o universo.
Población es la totalidad del fenómeno a estudiar, donde las unidades de población
poseen una característica común, la que se estudia y da origen a los datos de la
investigación.
Entonces, una población es el conjunto de todas las cosas que concuerdan con una
serie determinada de especificaciones. Un censo, por ejemplo, es el recuento de todos
los elementos de una población.
Cuando seleccionamos algunos elementos con la intención de averiguar algo sobre

una población determinada, nos referimos a este grupo de elementos como muestra.
Por supuesto, esperamos que lo que averiguamos en la muestra sea cierto para la
población en su conjunto. La exactitud de la información recolectada depende en gran
manera de la forma en que fue seleccionada la muestra.
Cuando no es posible medir cada uno de los individuos de una población, se toma
una muestra representativa de la misma.
La muestra descansa en el principio de que las partes representan al todo y, por tal,
refleja las características que definen la población de la que fue extraída, lo cual nos
indica que es representativa. Por lo tanto, la validez de la generalización depende de la
validez y tamaño de la muestra.
Leyes del método de muestreo.
El método de muestreo se basa en ciertas leyes que le otorgan su fundamento

científico, las cuales son:
 Ley de los grandes números: si en una prueba, la probabilidad de un

acontecimiento o suceso es P, y si éste se repite una gran cantidad de veces, la
relación entre las veces que se produce el suceso y la cantidad total de pruebas
(es decir, la frecuencia F del suceso) tiende a acercarse cada vez más a la
probabilidad P.
 Cálculo de probabilidades: La probabilidad de un hecho o suceso es la relación

entre el número de casos favorables (p) a este hecho con la cantidad de casos
posibles, suponiendo que todos los casos son igualmente posibles. El método
de establecer la probabilidad es lo que se denomina cálculo de probabilidad.
De estas dos leyes fundamentales de la estadística, se infieren aquellas que sirven
de base más directamente al método de muestreo:
 Ley de la regularidad estadística: un conjunto de n unidades tomadas al azar de

un conjunto N, es casi seguro que tenga las características del grupo más
grande.
 Ley de la inercia de los grandes números: esta ley es contraria a la anterior. Se

refiere al hecho de que en la mayoría de los fenómenos, cuando una parte varía
en una dirección, es probable que una parte igual del mismo grupo, varíe en
dirección opuesta.
 Ley de la permanencia de los números pequeños: si una muestra

suficientemente grande es representativa de la población, una segunda muestra
de igual magnitud deberá ser semejante a la primera; y, si en la primera muestra
se encuentran pocos individuos con características raras, es de esperar
encontrar igual proporción en la segunda muestra.
CONCEPTO DE MUESTREO
El muestreo es una herramienta de la investigación científica. Su función básica es

determinar que parte de una realidad en estudio (población o universo) debe examinarse
con la finalidad de hacer inferencias sobre dicha población. El error que se comete
debido a hecho de que se obtienen conclusiones sobre cierta realidad a partir de la
observación de sólo una parte de ella, se denomina error de muestreo. Obtener una
muestra adecuada significa lograr una versión simplificada de la población, que
reproduzca de algún modo sus rasgos básicos.
Terminología
 Población objeto: conjunto de individuos de los que se quiere obtener una

información.
 Unidades de muestreo: número de elementos de la población, no solapados, que
se van a estudiar. Todo miembro de la población pertenecerá a una y sólo una
unidad de muestreo.
 Unidades de análisis: objeto o individuo del que hay que obtener la información.
 Marco muestral: lista de unidades o elementos de muestreo.
 Muestra: conjunto de unidades o elementos de análisis sacados del marco.
MUESTREO NO PROBABILÍSTICO
El muestreo no probabilístico es una técnica de muestreo donde las muestras se

recogen en un proceso que no brinda a todos los individuos de la población iguales
oportunidades de ser seleccionados.
Los métodos de muestreo no probabilísticos no garantizan la representatividad de la
muestra y por lo tanto no permiten realizar estimaciones inferenciales sobre la población.
(En algunas circunstancias los métodos estadísticos y epidemiológicos permiten
resolver los problemas de representatividad aun en situaciones de muestreo no
probabilístico, por ejemplo los estudios de caso-control, donde los casos no son
seleccionados aleatoriamente de la población.)
Técnicas de muestreo No Probabilístico:
Muestreo por cuotas: se divide a la población en estratos o categorías, y se asigna una

cuota para las diferentes categorías y, a juicio del investigador, se selecciona las
unidades de muestreo. La muestra debe ser proporcional a la población, y en ella
deberán tenerse en cuenta las diferentes categorías. El muestreo por cuotas se presta
a distorsiones, al quedar a criterio del investigador la selección de las categorías.
Muestreo por conveniencia: Es probablemente la técnica de muestreo más común. En el

muestreo por conveniencia, las muestras son seleccionadas porque son accesibles para el
investigador. Los sujetos son elegidos simplemente porque son fáciles de reclutar. Esta
técnica es considerada la más fácil, la más barata y la que menos tiempo lleva.
Muestreo “Por bola de nieve”: Se lleva a cabo generalmente cuando hay una población
muy pequeña. En este tipo de muestreo, el investigador le pide al primer sujeto que
identifique a otro sujeto potencial que también cumpla con los criterios de la investigación.
La desventaja de usar una muestra de bola de nieve es que difícilmente sea representativa
de la población.
Muestreo Discrecional: Es más comúnmente conocido como muestreo intencional. En

este tipo de toma de muestras, los sujetos son elegidos para formar parte de la muestra
con un objetivo específico. Con el muestreo discrecional, el investigador cree que
algunos sujetos son más adecuados para la investigación que otros. Por esta razón,
aquellos son elegidos deliberadamente como sujetos.
Cuándo utilizar el muestreo no probabilístico
Este tipo de muestreo puede ser utilizado cuando se quiere mostrar que existe un rasgo
determinado en la población. También se puede utilizar cuando el investigador tiene
como objetivo hacer un estudio cualitativo, piloto o exploratorio.
Se puede utilizar cuando es imposible la aleatorización, como cuando la población es
casi ilimitada y cuando la investigación no tiene como objetivo generar resultados que
se utilicen para hacer generalizaciones respecto de toda la población.
También es útil cuando el investigador tiene un presupuesto, tiempo y mano de obra
limitados.
Esta técnica también se puede utilizar en un estudio inicial que será llevado a cabo
nuevamente utilizando un muestreo probabilístico aleatorio.
MUESTREO PROBABILÍSTICO
El método otorga una probabilidad conocida de integrar la muestra a cada elemento de

la población, y dicha probabilidad no es nula para ningún elemento.
Ventajas e inconvenientes de los distintos tipos de muestreo probabilístico
CARACTERISTICAS VENTAJAS INCONVENIENTES
Aleatorio simple Se selecciona una muestra de - Sencillo y de fácil comprensión. - Requiere que se posea de
tamaño n de una población de N antemano un listado completo
unidades, cada elemento tiene - Cálculo rápido de medias y de toda la población.
una probabilidad de inclusión varianzas.
igual y conocida de n/N. -Cuando se trabaja con
muestras pequeñas es posible
- Se basa en la teoría que no represente a la
estadística, y por tanto existen población adecuadamente.
paquetes informáticos para
analizar los datos
Sistemático Conseguir un listado de los N - Fácil de aplicar. - Si la constante de muestreo

elementos de la población está asociada con el fenómeno
- No siempre es necesario tener de interés, las estimaciones
Determinar tamaño muestral n. un listado de toda la población. obtenidas a partir de la muestra
pueden contener sesgo de
selección
Definir un intervalo k=N/n. - Cuando la población está
ordenada siguiendo una
Elegir un número aleatorio, r, tendencia conocida, asegura
entre 1 y k (r=arranque aleatorio). una cobertura de unidades de
todos los tipos.
Seleccionar los elementos de la

lista.
Estratificado En ciertas ocasiones resultará - Tiende a asegurar que la - Se ha de conocer la

conveniente estratificar la muestra represente distribución en la población de
muestra según ciertas variables adecuadamente a la población las variables utilizadas para la
de interés. Para ello debemos en función de unas variables estratificación.
conocer la composición seleccionadas.
estratificada de la población
objetivo a muestrear. Una vez - Se obtienen estimaciones más
calculado el tamaño muestral precisa
apropiado, este se reparte de
manera proporcional entre los
distintos estratos definidos en la -Su objetivo es conseguir una
población usando una simple muestra lo más semejante
regla de tres. posible a la población en lo que
a la o las variables
estratificadoras se refiere.
Conglomerados Se realizan varias fases de - Es muy eficiente cuando la - El error estándar es mayor
muestreo sucesivas (polietápico) población es muy grande y que en el muestreo aleatorio
dispersa. simple o estratificado.
La necesidad de listados de las
unidades de una etapa se limita - No es preciso tener un listado - El cálculo del error estándar
a aquellas unidades de muestreo de toda la población, sólo de las es complejo.
seleccionadas en la etapa unidades primarias de muestreo.
anterior.
EL TAMAÑO MUESTRAL
Cada estudio tiene un tamaño muestral idóneo, que permite comprobar lo que se
pretende con la seguridad y precisión fijadas por el investigador.
¿De qué depende el tamaño muestral?
 Variabilidad del parámetro a estimar: Datos previos, estudios piloto o usar

50% como peor estimación.
 Precisión: Amplitud del intervalo de confianza. Si se estima prevalencia su
formato será %.
 Nivel de confianza: Habitualmente 95% o 99%. Probabilidad complementaria al
error admitido.
Si aumentamos el tamaño muestral n, podremos mejorar la calidad de la estimación

bien aumentando la precisión (disminuye amplitud del intervalo) o bien aumentando la
seguridad (disminuye el error admitido).
CÁLCULO DEL TAMAÑO MUESTRAL
Todo estudio lleva implícito en la fase de diseño la determinación del tamaño muestral
necesario para la ejecución del mismo. El no realizar dicho proceso, puede llevarnos a
dos situaciones diferentes: primera que realicemos el estudio sin el número adecuado
de pacientes, con lo cual no podremos ser precisos al estimar los parámetros y además
no encontraremos diferencias significativas cuando en la realidad sí existen. La segunda
situación es que podríamos estudiar un número innecesario de pacientes, lo cual lleva
implícito no solo la pérdida de tiempo e incremento de recursos innecesarios sino que
además la calidad del estudio, dado dicho incremento, puede verse afectada en sentido
negativo.
Para determinar el tamaño muestral de un estudio, debemos considerar diferentes

situaciones:
A. Estudios para determinar parámetros. Es decir pretendemos hacer inferencias a

valores poblacionales (proporciones, medias) a partir de una muestra.
B. Estudios para contraste de hipótesis. Es decir pretendemos comparar si las

medias o las proporciones de las muestras son diferentes.
Tabla 1. Elementos de la Inferencia
Estadística
A. Estudios para determinar parámetros
Con estos estudios pretendemos hacer inferencias a valores poblacionales

(proporciones, medias) a partir de una muestra.
A.1. Estimar una proporción:
Si deseamos estimar una proporción, debemos saber:
a. El nivel de confianza o seguridad (1-a). El nivel de confianza prefijado da
lugar a un coeficiente (Za). Para una seguridad del 95% = 1.96, para una
seguridad del 99% = 2.58.
b. La precisión que deseamos para nuestro estudio.
c. Una idea del valor aproximado del parámetro que queremos medir (en este
caso una proporción). Esta idea se puede obtener revisando la literatura,
por estudio pilotos previos. En caso de no tener dicha información
utilizaremos el valor p = 0.5 (50%).
Ejemplo: ¿A cuántas personas tendríamos que estudiar para conocer la prevalencia?
Seguridad = 95%; Precisión = 3%: Proporción esperada = asumamos que puede ser
próxima al 5%; si no tuviésemos ninguna idea de dicha proporción utilizaríamos el valor
p = 0,5 (50%) que maximiza el tamaño muestral (Criterio conservador):
donde:
 Za 2 = 1.962 (ya que la seguridad es del 95%)
 p = proporción esperada (en este caso 5% = 0.05)
 q = 1 – p (en este caso 1 – 0.05 = 0.95)
 d = precisión (en este caso deseamos un 3%)
Si la población es finita, es decir conocemos el total de la población y deseásemos
saber cuántos del total tendremos que estudiar la respuesta seria:
donde:
 N = Total de la población
 Za2 = 1.962 (si la seguridad es del 95%)
 p = proporción esperada (en este caso 5% = 0.05)
 q = 1 – p (en este caso 1-0.05 = 0.95)
 d = precisión (en este caso deseamos un 3%).
¿A cuántas personas tendría que estudiar de una población de 15 000 habitantes para
conocer la prevalencia de diabetes?
Seguridad = 95%; Precisión = 3%; proporción esperada = asumamos que puede ser
próxima al 5%; si no tuviese ninguna idea de dicha proporción utilizaríamos el valor p =
0.5 (50%) que maximiza el tamaño muestral.
Según diferentes seguridades el coeficiente de Za varía, así:
 Si la seguridad Za fuese del 90% el coeficiente sería 1.645

 Si la seguridad Za fuese del 97.5% el coeficiente sería 2.24
A.2. Estimar una media:

Si deseamos estimar una media: debemos saber:
 El nivel de confianza o seguridad (1-a). El nivel de confianza prefijado da
lugar a un coeficiente (Za ). Para una seguridad del 95% = 1.96; para una
seguridad del 99% = 2.58.
 La precisión con que se desea estimar el parámetro (2 * d es la amplitud del

intervalo de confianza).
 Una idea de la varianza S2 de la distribución de la variable cuantitativa que

se supone existe en la población.
Ejemplo 1. Para estudiar la imagen de los diferentes políticos, se pide a los encuestados
que los evalúen en una escala (continua) de 0 a 10 puntos. Si se acepta que la
desviación típica de esta variable es de 1.5 puntos, ¿cuántos casos se necesitan
considerando un intervalo de confianza al 95% de la media poblacional sea de 0.05
puntos?
𝑍. 𝜎 2 1,96 . 1,5 2
𝑛= ( ) = ( ) = 3457,44 ≈ 3457 𝑐𝑎𝑠𝑜𝑠.
𝑒 0,05
Si la población es finita, como previamente se señaló, es decir conocemos el total de

la población y desearíamos saber cuántos del total tendríamos que estudiar, la
respuesta sería:
B. Estudios para contraste de hipótesis:
Estos estudios pretenden comparar si las medias o las proporciones de las muestras
son diferentes. Habitualmente el investigador pretende comparar dos
tratamientos. Para el cálculo del tamaño muestral se precisa conocer:
a. Magnitud de la diferencia a detectar que tenga interés clínicamente relevante.

Se pueden comparar dos proporciones o dos medias.
b. Tener una idea aproximada de los parámetros de la variable que se
estudia (bibliografía, estudios previos).
c. Seguridad del estudio (riesgo de cometer un error a)
d. Poder estadístico (1 - b) (riesgo de cometer un error b)
e. Definir si la hipótesis va a ser unilateral o bilateral.
 Bilateral: Cualquiera de los dos parámetros a comparar (medias o
proporciones) puede ser mayor o menor que el otro. No se establece
dirección.
 Unilateral: Cuando se considera que uno de los parámetros debe ser
mayor que el otro, indicando por tanto una dirección de las
diferencias.
La hipótesis bilateral es una hipótesis más conservadora y disminuye el riesgo de

cometer un error de tipo I (rechazar la H0 cuando en realidad es verdadera).
B1. Comparación de dos proporciones:

Donde:
 n = sujetos necesarios en cada una de las muestras

 Za = Valor Z correspondiente al riesgo deseado
 Zb = Valor Z correspondiente al riesgo deseado
 p1 = Valor de la proporción en el grupo de referencia, placebo, control o
tratamiento habitual.
 p2 = Valor de la proporción en el grupo del nuevo tratamiento, intervención o
técnica.
 p = Media de las dos proporciones p1 y p2
B2. Comparación de dos medias:
Donde:
 n = sujetos necesarios en cada una de las muestras

 Za = Valor Z correspondiente al riesgo deseado
 Zb = Valor Z correspondiente al riesgo deseado
 S2 = Varianza de la variable cuantitativa que tiene el grupo control o de
referencia.
 d = Valor mínimo de la diferencia que se desea detectar (datos
cuantitativos)
Ejemplo de comparación de dos medias:
Deseamos utilizar un nuevo fármaco antidiabético y consideramos que sería

clínicamente eficaz si lograse un descenso de 15 mg/dl respecto al tratamiento habitual
con el antidiabético estándar. Por estudios previos sabemos que la desviación típica de
la glucemia en pacientes que reciben el tratamiento habitual es de 16 mg/dl. Aceptamos
un riesgo de 0.05 y deseamos un poder estadístico de 90% para detectar diferencias si
es que existen.
Precisamos 19 pacientes en cada grupo.
Ejemplo de comparación de dos proporciones:
Deseamos evaluar si el Tratamiento T 2 es mejor que el tratamiento T1 para el alivio del

dolor para lo que diseñamos un ensayo clínico. Sabemos por datos previos que la
eficacia del fármaco habitual está alrededor del 70% y consideramos clínicamente
relevante si el nuevo fármaco alivia el dolor en un 90%. Nuestro nivel de riesgo lo fijamos
en 0.05 y deseamos un poder estadístico de un 80%.
n = 48 pacientes. En cada grupo precisamos 48 pacientes.
El tamaño muestral ajustado a las pérdidas:
En todos los estudios es preciso estimar las posibles pérdidas de pacientes por razones
diversas (pérdida de información, abandono, no respuesta….) por lo que se debe
incrementar el tamaño muestral respecto a dichas pérdidas.
El tamaño muestral ajustado a las pérdidas se puede calcular:
Muestra ajustada a las pérdidas = n (1 / 1–R)
 n = número de sujetos sin pérdidas

 R = proporción esperada de pérdidas
Así por ejemplo si en el estudio anterior esperamos tener un 15% de pérdidas el

tamaño muestral necesario seria: 48 (1 / 1-0.15) = 56 pacientes en cada grupo.

04 Cuantitativo

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

04 Cuantitativo

Cargado por

Copyright:

Formatos disponibles

SESIÓN N°7:

POBLACION, MUESTRA, MUESTREO

Cuando seleccionamos algunos elementos con la intención de averiguar algo sobre

Leyes del método de muestreo.

El método de muestreo se basa en ciertas leyes que le otorgan su fundamento

 Ley de los grandes números: si en una prueba, la probabilidad de un

 Cálculo de probabilidades: La probabilidad de un hecho o suceso es la relación

 Ley de la regularidad estadística: un conjunto de n unidades tomadas al azar de

 Ley de la inercia de los grandes números: esta ley es contraria a la anterior. Se

 Ley de la permanencia de los números pequeños: si una muestra

El muestreo es una herramienta de la investigación científica. Su función básica es

 Población objeto: conjunto de individuos de los que se quiere obtener una

El muestreo no probabilístico es una técnica de muestreo donde las muestras se

Técnicas de muestreo No Probabilístico:

Muestreo por cuotas: se divide a la población en estratos o categorías, y se asigna una

Muestreo por conveniencia: Es probablemente la técnica de muestreo más común. En el

Muestreo Discrecional: Es más comúnmente conocido como muestreo intencional. En

Cuándo utilizar el muestreo no probabilístico

El método otorga una probabilidad conocida de integrar la muestra a cada elemento de

Ventajas e inconvenientes de los distintos tipos de muestreo probabilístico

CARACTERISTICAS VENTAJAS INCONVENIENTES

Sistemático Conseguir un listado de los N - Fácil de aplicar. - Si la constante de muestreo

Seleccionar los elementos de la

Estratificado En ciertas ocasiones resultará - Tiende a asegurar que la - Se ha de conocer la

¿De qué depende el tamaño muestral?

 Variabilidad del parámetro a estimar: Datos previos, estudios piloto o usar

Si aumentamos el tamaño muestral n, podremos mejorar la calidad de la estimación

CÁLCULO DEL TAMAÑO MUESTRAL

Para determinar el tamaño muestral de un estudio, debemos considerar diferentes

A. Estudios para determinar parámetros. Es decir pretendemos hacer inferencias a

B. Estudios para contraste de hipótesis. Es decir pretendemos comparar si las

A. Estudios para determinar parámetros

Con estos estudios pretendemos hacer inferencias a valores poblacionales

Ejemplo: ¿A cuántas personas tendríamos que estudiar para conocer la prevalencia?

Según diferentes seguridades el coeficiente de Za varía, así:

 Si la seguridad Za fuese del 90% el coeficiente sería 1.645

A.2. Estimar una media:

 La precisión con que se desea estimar el parámetro (2 * d es la amplitud del

 Una idea de la varianza S2 de la distribución de la variable cuantitativa que

Si la población es finita, como previamente se señaló, es decir conocemos el total de

B. Estudios para contraste de hipótesis:

a. Magnitud de la diferencia a detectar que tenga interés clínicamente relevante.

La hipótesis bilateral es una hipótesis más conservadora y disminuye el riesgo de

B1. Comparación de dos proporciones:

 n = sujetos necesarios en cada una de las muestras

B2. Comparación de dos medias:

 n = sujetos necesarios en cada una de las muestras

Ejemplo de comparación de dos medias:

Deseamos utilizar un nuevo fármaco antidiabético y consideramos que sería

Precisamos 19 pacientes en cada grupo.

Ejemplo de comparación de dos proporciones:

Deseamos evaluar si el Tratamiento T 2 es mejor que el tratamiento T1 para el alivio del

El tamaño muestral ajustado a las pérdidas:

El tamaño muestral ajustado a las pérdidas se puede calcular:

Muestra ajustada a las pérdidas = n (1 / 1–R)

 n = número de sujetos sin pérdidas

Así por ejemplo si en el estudio anterior esperamos tener un 15% de pérdidas el

También podría gustarte