Está en la página 1de 13

TEMA: CALCULO DEL TAMAÑO DE LA MUESTRA

Todo estudio epidemiológico lleva implícito en la fase de diseño la


determinación del tamaño muestral necesario para la ejecución del mismo. El no
realizar dicho proceso, puede llevarnos a dos situaciones diferentes:

1ª) Que realicemos el estudio sin el número adecuado de pacientes, con lo cual
no podremos ser precisos al estimar los parámetros y además no encontraremos
diferencias significativas cuando en la realidad sí existen.

2ª) Que podríamos estudiar un número innecesario de pacientes, lo cual lleva


implícito no solo la pérdida de tiempo e incremento de recursos innecesarios sino que
además la calidad del estudio, dado dicho incremento, puede verse afectada en
sentido negativo.

Para determinar el tamaño muestral de un estudio, debemos considerar


diferentes situaciones:

A) Estudios para determinar parámetros  Pretendemos hacer inferencias a


valores poblacionales (proporciones, medias) a partir de una muestra.

A.1. Estimar una proporción: Debemos saber:

a. El nivel de confianza o seguridad (1-α ). El nivel de confianza prefijado


da lugar a un coeficiente (Za ). Para una seguridad del 95% = 1.96,
para una seguridad del 99% = 2.58.
b. La precisión que deseamos para nuestro estudio.

c. Una idea del valor aproximado del parámetro que queremos medir (en
este caso una proporción). Esta idea se puede obtener revisando la
literatura, por estudio pilotos previos. En caso de no tener dicha
información utilizaremos el valor p = 0.5 (50%), ya que asi maximiza el
tamaño muestral.

donde:

Za 2 = 1.962 (ya que la seguridad es del 95%)


p = proporción esperada (en este caso 5% = 0.05)

q = 1 – p (en este caso 1 – 0.05 = 0.95)

d = precisión (en este caso deseamos un 3%)

Si la población es finita, es decir conocemos el total de la población y deseásemos


saber cuántos del total tendremos que estudiar la respuesta seria:
donde:

N = Total de la población
Za2 = 1.962 (si la seguridad es del 95%)

p = proporción esperada (en este caso 5% = 0.05)

q = 1 – p (en este caso 1-0.05 = 0.95)

d = precisión (en este caso deseamos un 3%).

Según diferentes seguridades el coeficiente de Za varía, así:

Si la seguridad Za fuese del 90% el coeficiente sería 1.645


Si la seguridad Za fuese del 95% el coeficiente sería 1.96

Si la seguridad Za fuese del 97.5% el coeficiente sería 2.24

Si la seguridad Za fuese del 99% el coeficiente sería 2.576

A.2. Estimar una media: Debemos saber:

El nivel de confianza o seguridad (1-α ). El nivel de confianza prefijado


da lugar a un coeficiente (Za ). Para una seguridad del 95% = 1.96;
para una seguridad del 99% = 2.58.
La precisión con que se desea estimar el parámetro (2 * d es la
amplitud del intervalo de confianza).

Una idea de la varianza S2 de la distribución de la variable cuantitativa


que se supone existe en la población.

Ejemplo: Si deseamos conocer la media de la glucemia basal de una población, con


una seguridad del 95 % y una precisión de ± 3 mg/dl y tenemos información por un
estudio piloto o revisión bibliográfica que la varianza es de 250 mg/dl

Si la población es finita, como previamente se señaló, es decir conocemos el total de


la población y desearíamos saber cuantos del total tendríamos que estudiar, la
respuesta sería:
B) Estudios para contraste de hipótesis: Pretenden comparar si las medias o las
proporciones de las muestras son diferentes. Para el cálculo del tamaño muestral se
precisa conocer:

a. Magnitud de la diferencia a detectar que tenga interés clínicamente


relevante. Se pueden comparar dos proporciones o dos medias.
b. Tener una idea aproximada de los parámetros de la variable que se
estudia (bibliografía, estudios previos).

c. Seguridad del estudio (riesgo de cometer un error α)

d. Poder estadístico (1 - β) (riesgo de cometer un error β)

e. Definir si la hipótesis va a ser unilateral o bilateral.

o Bilateral: Cualquiera de los dos parámetros a comparar (medias


o proporciones) puede ser mayor o menor que el otro. No se
establece dirección.

o Unilateral: Cuando se considera que uno de los parámetros


debe ser mayor que el otro, indicando por tanto una dirección
de las diferencias.

La hipótesis bilateral es una hipótesis más conservadora y disminuye el riesgo de


cometer un error de tipo I (rechazar la H0 cuando en realidad es verdadera).

B1. Comparación de dos proporciones:

Donde:

n = sujetos necesarios en cada una de las muestras


Za = Valor Z correspondiente al riesgo deseado

Zb = Valor Z correspondiente al riesgo deseado

p1 = Valor de la proporción en el grupo de referencia, placebo, control o


tratamiento habitual.

p2 = Valor de la proporción en el grupo del nuevo tratamiento,


intervención o técnica.

p = Media de las dos proporciones p1 y p2 :

Los valores Za según la seguridad y Zb según el poder se indican en la Tabla 2 (8).

B2. Comparación de dos medias:


Donde:

n = sujetos necesarios en cada una de las muestras


Za = Valor Z correspondiente al riesgo deseado

Zb = Valor Z correspondiente al riesgo deseado

S2 = Varianza de la variable cuantitativa que tiene el grupo control o de


referencia.

d = Valor mínimo de la diferencia que se desea detectar (datos


cuantitativos)

Los valores Za según la seguridad y Zb según el poder se indican en la Tabla 2 (8).

Tabla 2. Valores de Za y Zb más frecuentemente utilizados

Za

α Test unilateral Test bilateral

0.200 0.842 1.282


0.150 1.036 1.440
0.100 1.282 1.645
0.050 1.645 1.960
0.025 1.960 2.240
0.010 2.326 2.576

Potencia

β (1-β) Zb

0.01 0.99 2.326


0.05 0.95 1.645
0.10 0.90 1.282
0.15 0.85 1.036
0.20 0.80 0.842
0.25 0.75 0.674
0.30 0.70 0.524
0.35 0.65 0.385
0.40 0.60 0.253
0.45 0.55 0.126
0.50 0.50 0.000

El tamaño muestral ajustado a las pérdidas


En todos los estudios es preciso estimar las posibles perdidas de pacientes por
razones diversas (pérdida de información, abandono, no respuesta….) por lo que se
debe incrementar el tamaño muestral respecto a dichas pérdidas.

El tamaño muestral ajustado a las pérdidas se puede calcular:

Muestra ajustada a las pérdidas = n (1 / 1–R)

← n = número de sujetos sin pérdidas


← R = proporción esperada de pérdida

Factores estadísticos que influyen el cálculo del


tamaño de muestra
Los factores que intervienen al calcular el tamaño de muestra son los siguientes:

El error máximo admisible (d)

Es el que determina la precisión de los resultados. Es la máxima diferencia que


podemos tolerar entre el valor de la variable obtenido en la muestra y el
verdadero valor de ésta en la población. Para establecer el valor del error
máximo admisible debemos preguntarnos cuán precisos deseamos que sean los
resultados de la investigación.

Por ejemplo, para nuestra tienda de regalos, la investigación tiene por objetivo
conocer el ticket promedio de compra en una tienda de regalos, y considera un
error máximo admisible del 5%. Si en el estudio se obtiene que el ticket
promedio es de S/. 100 por persona, estaríamos aceptando que realmente el
verdadero valor esté entre 100 ± 5, es decir entre S/. 100 + 5% y S/. 100 – 5%, lo
que da un intervalo de entre S/. 95 y S/. 105.

El error máximo admisible está relacionado inversamente con el tamaño de la


muestra. A mayor error, el tamaño de muestra será más pequeño, y a menor
error el tamaño de muestra será más grande.
Las empresas encuestadoras de renombre en el Perú utilizan un margen de
error del 5%. Sin embargo, si se utilizara un margen de error del 10%, en
muchos casos, los resultados también podrían ser significativos.

Coeficiente de confianza de la estimación (Z)

Para hacer la afirmación anterior sobre los límites dentro de los cuales se
encuentra el verdadero valor poblacional, debe conocerse la probabilidad de
que estos resultados sean ciertos y esto lo da el coeficiente o nivel de confianza,
el cual es la medida probabilística de que el intervalo fijado con el error máximo
admisible, contenga el valor poblacional.

En el ejemplo anterior, del ticket promedio de compra de regalos, se decidió


trabajar con un nivel de confianza de 90%, con lo cual podríamos afirmar con un
90% de certeza que el ticket promedio de compra está entre S/. 95 y S/. 105.
Claro está, queda 10% de posibilidades de equivocarnos al establecer esa
conclusión. Si trabajamos con 95% de confianza, nos quedaría una posibilidad
de equivocarnos de 5%.

A mayor nivel de confianza, más elevado será el tamaño de muestra, y al


contrario, a menor nivel de confianza, el tamaño de muestra también será
menor.

En general, los niveles de confianza más usuales son: 90%; 95% y 99%. En Perú
las grandes empresas encuestadoras trabajan con un nivel de confianza del 95%
y muchos investigadores trabajan con 90% de confianza.

Es necesario señalar que el nivel de confianza da lugar a un coeficiente


denominado coeficiente Z, el mismo que es utilizado en las fórmulas para
calcular el tamaño de muestra. Cada nivel de confianza es representado por el
valor correspondiente del coeficiente Z, tal como sigue:

Varianza de la población (p.q)

Recordemos el significado de los símbolos:

p = Es la probabilidad de éxito o proporción esperada. (Las personas responden


Si.)
q = Es la probabilidad de fracaso o proporción de repuestas en la otra
categoría. (Las personas responden No.).

La varianza en los ítems dicotómicos (dos respuestas que se excluyen


mutuamente) es igual a pq y la varianza mayor (la mayor diversidad de
respuestas) se da cuando p = q = 0.50 (la mitad de las personas responde sí y la
otra mitad responde no).

Como se desconoce la varianza de la población, ponemos la varianza mayor


posible porque a mayor varianza hará falta una muestra mayor. Es decir,
consideramos los valores de p=q=0.50.

Pasos para calcular el tamaño de muestra


Para que la explicación sea práctica, utilizaré un caso ejemplo. Se trata de
realizar un estudio de mercado para iniciar un negocio de regalos dirigido a
personas entre 18 y 35 años de edad, hombres y mujeres, del nivel socio-
económico B y C del distrito de San Borja en Lima, Perú. De acuerdo a las
estadísticas, la población entre 18 y 35 años de edad perteneciente a los niveles
socio-económicos B y C es de 32,084 personas.

Para obtener los datos se debe realizar una encuesta y aplicar un cuestionario a
un determinado número de personas que tengan dichas características, y para
ello es necesario calcular el tamaño de muestra a considerar en el estudio.

Paso 1. Definir tipo de población y fórmula

En primer lugar, dependiendo de la población, si es finita o infinita, se utilizará la


fórmula correspondiente, tal como sigue:

Fórmula para población finita

En donde:

n: Tamaño de muestra que queremos calcular


N: Tamaño de la población

Z: Coeficiente de confianza para un nivel de confianza determinado

p: Probabilidad de éxito

q: Probabilidad de fracaso. d: Error máximo admisible

***************************************

¿Qué es el tamaño de la muestra?


Una muestra es una selección de los encuestados elegidos y que representan a la
población total. El tamaño de la muestra es una porción significativa de la población
que cumple con las características de la investigación reduciendo los costos y el tiempo.
Saber cómo determinar el tamaño de la muestra antes de comenzar una investigación es
un principio estadístico que nos ayuda a evitar el sesgo en la interpretación de los
resultados obtenidos.

¿Cómo calcular el tamaño de la muestra?


El tamaño de la muestra de una encuesta es muy importante para poder realizar una
investigación de manera correcta, por lo que hay que tener en cuenta los objetivos y las
circunstancias en que se desarrolle la investigación.

Recuerda que la finalidad es que las personas completen la encuesta y te otorguen los
datos que estás buscando.
Una muestra demasiado grande dará lugar a la pérdida de valiosos recursos como
tiempo y dinero, mientras que una muestra pequeña puede no proporcionar información
confiable.

¿Entonces de qué tamaño debe ser una muestra? Esto sin duda depende de qué tan
exactos necesites que sean los datos obtenidos en tu encuesta, que tan cercanos quieres
que sean a los de la población total.

El tamaño de la muestra puede ser:


Representativa: Hace referencia a que todos los miembros de un grupo de personas
tengan las mismas oportunidades de participar en la investigación.
Adecuada: Se refiere a que el tamaño de la muestra debe de ser obtenido mediante un
análisis que permite resultados como disminuir el margen de error.

Ejemplo:

Si quieres realizar una investigación dentro de una universidad que ofrece 10 carreras
diferentes y cada una tiene 700 alumnos, no querrás hacer 7000 mil encuestas, bastará
con determinar el tamaño de la muestra. Sin embargo, debemos considerar el margen de
error.

Ejemplo de cómo calcular el tamaño de muestra finita


Es hora de aprender a determinar el tamaño de la muestra mediante un cálculo de la
misma.
Tu nivel de confianza corresponde a una puntuación Z. Este es un valor constante
necesario para esta ecuación. Aquí están las puntuaciones Z para los niveles de
confianza más comunes:

90% - Puntuación Z = 1,645

95% - Puntuación Z = 1.96

99% - Puntuación Z = 2.576

Supongamos que nos piden calcular el tamaño para una población de 543.098
consumidores de una marca de bebidas energéticas, donde el investigador asigna un
nivel de confianza de 95% y un margen de error de 3%. Donde se desconoce la
probabilidad “p” del evento.
Basándonos en este ejemplo, y en nuestra fórmula, el "N" será 543.098, nuestro Z será
1.96 (recuerda que el investigador asignó un nivel de confianza de 95%) y “e” será de
3%. Y como nuestro ejemplo dice que se desconoce la probabilidad de que ocurra el
evento, se asigna un 50% a "p" y un 50% a "q".

El resultado de nuestro tamaño de muestra sería: 1065.2, y tendría que ser redondeado
pues estamos hablando de personas.

Ejemplo de cómo calcular el tamaño de muestra infinita


Si necesitas calcular el tamaño de muestra de una población desconocida, donde el
investigador necesite un nivel de confianza del 95%, un margen de error del 3% y se
desconoce la probabilidad “p” del evento que se está estudiando, sigue la siguiente
fórmula:

También podría gustarte