Está en la página 1de 1

Buscar en Wikipedia

Determinación del tamaño de la muestra


Artículo Hablar

Idioma Descargar PDF Mirar Editar

La determinación del tamaño de la muestra es el acto de elegir el número de observaciones o réplicas que se incluirán en una muestra
estadística . El tamaño de la muestra es una característica importante de cualquier estudio empírico en el que el objetivo sea hacer
inferencias sobre una población a partir de una muestra. En la práctica, el tamaño de la muestra utilizada en un estudio generalmente se
determina en función del costo, el tiempo o la conveniencia de recopilar los datos y la necesidad de que ofrezcan suficiente poder
estadístico . En estudios complicados puede haber varios tamaños de muestra diferentes: por ejemplo, en una encuesta estratificada habría
diferentes tamaños para cada estrato. En un censo se buscan datos de toda una población, de ahí que el tamaño de muestra previsto sea
igual al de la población. En el diseño experimental , donde un estudio puede dividirse en diferentes grupos de tratamiento , puede haber
diferentes tamaños de muestra para cada grupo.

Los tamaños de muestra se pueden elegir de varias maneras:

utilizando la experiencia: las muestras pequeñas, aunque a veces inevitables, pueden dar lugar a intervalos de confianza amplios y riesgo
de errores en las pruebas de hipótesis estadísticas .

utilizar una varianza objetivo para obtener una estimación a partir de la muestra finalmente obtenida, es decir, si se requiere una alta
precisión (intervalo de confianza estrecho), esto se traduce en una varianza objetivo baja del estimador.

utilizar un objetivo para el poder de una prueba estadística que se aplicará una vez que se recopile la muestra.

utilizando un nivel de confianza, es decir, cuanto mayor sea el nivel de confianza requerido, mayor será el tamaño de la muestra (dado un
requisito de precisión constante).

Contenido

Introducción

Los tamaños de muestra más grandes generalmente conducen a una mayor precisión al estimar parámetros desconocidos. Por ejemplo, si
deseamos conocer la proporción de una determinada especie de pez que está infectada con un patógeno, generalmente tendríamos una
estimación más precisa de esta proporción si tomamos muestras y examinamos 200 peces en lugar de 100. Varios hechos fundamentales de
la estadística matemática describen este fenómeno, incluida la ley de los grandes números y el teorema del límite central .

En algunas situaciones, el aumento de la precisión para tamaños de muestra más grandes es mínimo o incluso inexistente. Esto puede
deberse a la presencia de errores sistemáticos o una fuerte dependencia de los datos, o si los datos siguen una distribución de cola pesada.

Los tamaños de las muestras pueden evaluarse por la calidad de las estimaciones resultantes. Por ejemplo, si se estima una proporción, es
posible que desee que el intervalo de confianza del 95% tenga menos de 0,06 unidades de ancho. Alternativamente, el tamaño de la
muestra puede evaluarse en función del poder de una prueba de hipótesis. Por ejemplo, si comparamos el apoyo a un determinado
candidato político entre las mujeres con el apoyo a ese candidato entre los hombres, es posible que deseemos tener un poder del 80% para
detectar una diferencia en los niveles de apoyo de 0,04 unidades.

Estimacion

Estimación de una proporción


Artículo principal: proporción de población

Una situación relativamente simple es la estimación de una proporción . Por ejemplo, es posible que deseemos estimar la proporción de
residentes de una comunidad que tienen al menos 65 años.

El estimador de una proporción es , donde X es el número de "positivos", por ejemplo, el número de personas de las n muestras
que tienen al menos 65 años). Cuando las observaciones son independientes , este estimador tiene una distribución binomial (escalada) (y
también es la media muestral de los datos de una distribución de Bernoulli ). La varianza máxima de esta distribución es 0,25, lo que ocurre
cuando el parámetro verdadero es p = 0,5. En la práctica, dado que p es desconocido, la varianza máxima se utiliza a menudo para evaluar el
tamaño de la muestra. Si se conoce una estimación razonable de p, la cantidad se puede utilizar en lugar de 0,25.

Para n suficientemente grande , la distribución de se aproximará estrechamente mediante una distribución normal . [1] Usando esto y el
método de Wald para la distribución binomial , se obtiene un intervalo de confianza de la forma

donde Z es una puntuación Z estándar para el nivel de confianza deseado (1,96 para un intervalo de confianza del 95%).

Si deseamos tener un intervalo de confianza de W unidades de ancho total (W/2 en cada lado de la media muestral), resolveremos

para n , obteniendo el tamaño de la muestra

, en el caso de utilizar .5 como estimación más conservadora de la proporción. (Nota: W/2 =

margen de error ).

En la siguiente figura se puede observar cómo cambian los tamaños de muestra para proporciones
binomiales dados diferentes niveles de confianza y márgenes de error.

tamaños de muestra para


proporciones binomiales dados
De lo contrario, la fórmula sería , cuyos rendimientos .
diferentes niveles de confianza y
márgenes de error
Por ejemplo, si estamos interesados en estimar la proporción de la población estadounidense que apoya a
un candidato presidencial en particular y queremos que la amplitud del intervalo de confianza del 95% sea como máximo de 2 puntos
2 2
porcentuales (0,02), entonces necesitaríamos un tamaño de muestra de (1,96) / (0,02 ) = 9604. Es razonable utilizar la estimación de 0,5
para p en este caso porque las carreras presidenciales suelen estar cerca del 50/50, y también es prudente utilizar una estimación
conservadora. El margen de error en este caso es de 1 punto porcentual (la mitad de 0,02).

Lo anterior comúnmente se simplifica

formará un intervalo de confianza del 95% para la proporción real. Si este intervalo no necesita tener más de W unidades de ancho, la
ecuación

2 2
[2] [3]
se puede resolver para n , lo que produce n = 4/ W = 1/ B donde B es el límite de error en la estimación, es decir, la estimación
generalmente se da dentro de ± B . Para B = 10% se requiere n = 100, para B = 5% se necesita n = 400, para B = 3% el requisito se aproxima
a n = 1000, mientras que para B = 1% se requiere un tamaño de muestra de n = 10000 . Estas cifras se citan a menudo en informes
noticiosos de encuestas de opinión y otras encuestas por muestreo . Sin embargo, es posible que los resultados informados no sean el valor
exacto, ya que es preferible que los números se redondeen hacia arriba. Sabiendo que el valor de n es el número mínimo de puntos de
muestra necesarios para adquirir el resultado deseado, el número de encuestados debe estar en el mínimo o por encima de él.

Estimación de una media

Al estimar la media poblacional utilizando una muestra independiente e idénticamente distribuida (iid) de tamaño n , donde cada valor de
2
datos tiene una varianza σ , el error estándar de la media muestral es:

Esta expresión describe cuantitativamente cómo la estimación se vuelve más precisa a medida que aumenta el tamaño de la muestra. El uso
del teorema del límite central para justificar la aproximación de la media muestral con una distribución normal produce un intervalo de
confianza de la forma

donde Z es una puntuación Z estándar para el nivel de confianza deseado (1,96 para un intervalo de confianza del 95%).

Si deseamos tener un intervalo de confianza de W unidades de ancho total (siendo W/2 el margen de error a cada lado de la media
muestral), resolveríamos

para n , obteniendo el tamaño de la muestra

Por ejemplo, si estamos interesados en estimar la cantidad en la que un fármaco reduce la presión arterial de un sujeto con un intervalo de
confianza del 95% de seis unidades de ancho, y sabemos que la desviación estándar de la presión arterial en la población es 15, entonces la

el tamaño de muestra requerido es , que se redondearía a 97, porque el valor obtenido es el tamaño mínimo de

muestra, y los tamaños de muestra deben ser números enteros y deben estar en o por encima del mínimo calculado.

Tamaños de muestra requeridos para las pruebas de hipótesis

Un problema común al que se enfrentan los estadísticos es calcular el tamaño de muestra necesario para obtener una determinada potencia
para una prueba, dada una tasa de error tipo I predeterminada α. De la siguiente manera, esto puede estimarse mediante tablas
predeterminadas para ciertos valores, mediante la ecuación de recursos de Mead o, más generalmente, mediante la función de distribución
acumulativa :

Mesas

[4]
d de Cohen

Poder 0,2 0,5 0,8

0,25 84 14 6

0,50 193 32 13

0,60 246 40 dieciséis

0,70 310 50 20

0,80 393 64 26

0,90 526 85 34

0,95 651 105 42

0,99 920 148 58

La tabla que se muestra a la derecha se puede utilizar en una prueba t de dos muestras para estimar los tamaños de muestra de un grupo
experimental y un grupo de control que son del mismo tamaño, es decir, el número total de individuos en el ensayo es el doble que del
número dado, y el nivel de significancia deseado es 0,05. [4] Los parámetros utilizados son:

El poder estadístico deseado del ensayo, que se muestra en la columna de la izquierda.

d de Cohen (= tamaño del efecto), que es la diferencia esperada entre las medias de los valores objetivo entre el grupo experimental y el
grupo de control , dividida por la desviación estándar esperada .

La ecuación de recursos de Mead

La ecuación de recursos de Mead se utiliza a menudo para estimar tamaños de muestras de animales de laboratorio , así como en muchos
otros experimentos de laboratorio. Puede que no sea tan preciso como utilizar otros métodos para estimar el tamaño de la muestra, pero da
una idea de cuál es el tamaño de muestra apropiado cuando parámetros como las desviaciones estándar esperadas o las diferencias
esperadas en los valores entre grupos se desconocen o son muy difíciles de estimar. [5]

Todos los parámetros de la ecuación son, de hecho, los grados de libertad del número de sus conceptos y, por lo tanto, sus números se
restan en 1 antes de insertarlos en la ecuación.

La ecuación es: [5]

dónde:

N es el número total de individuos o unidades en el estudio (menos 1)

B es el componente de bloqueo , que representa los efectos ambientales permitidos en el diseño (menos 1)

T es el componente de tratamiento , correspondiente al número de grupos de tratamiento (incluido el grupo de control ) que se utilizan, o
al número de preguntas que se hacen (menos 1).

E son los grados de libertad del componente de error y debe estar entre 10 y 20.

Por ejemplo, si se planifica un estudio con animales de laboratorio con cuatro grupos de tratamiento ( T =3), con ocho animales por grupo,
lo que hace un total de 32 animales ( N = 31), sin ninguna estratificación adicional ( B =0), entonces E igual a 28, que está por encima del
límite de 20, lo que indica que el tamaño de la muestra puede ser demasiado grande y que seis animales por grupo podrían ser más
apropiados. [6]

Función de distribución acumulativa


2
Sean X , i = 1, 2, ..., n observaciones independientes tomadas de una distribución normal con media desconocida μ y varianza conocida σ .
i
Consideremos dos hipótesis, una hipótesis nula :

y una hipótesis alternativa:

*
para alguna 'diferencia significativa más pequeña' μ > 0. Este es el valor más pequeño para el cual nos interesa observar una diferencia.
Ahora, si deseamos (1) rechazar H con una probabilidad de al menos 1 − β cuando H es verdadera (es decir, una potencia de 1 − β ), y
0 a
(2) rechazar H con probabilidad α cuando H es cierto, entonces necesitamos lo siguiente:
0 0

Si z α es el punto porcentual α superior de la distribución normal estándar, entonces

y entonces

'Rechace H si nuestro promedio muestral ( ) Es mas que '


0

es una regla de decisión que satisface (2). (Esta es una prueba de una cola).

Ahora deseamos que esto suceda con una probabilidad de al menos 1 − β cuando H es verdadera. En este caso, nuestro promedio
a
*
muestral provendrá de una distribución normal con media μ . Por lo tanto, requerimos

Mediante una manipulación cuidadosa, se puede demostrar que esto sucede (ver Ejemplo de poder estadístico ) cuando

dónde es la función de distribución acumulativa normal .

Tamaño de muestra estratificado

Con técnicas de muestreo más complicadas, como el muestreo estratificado , la muestra a menudo se puede dividir en submuestras.
Normalmente, si hay H tales submuestras (de H estratos diferentes), entonces cada una de ellas tendrá un tamaño de muestra n , h = 1, 2,
h
..., H . Estos n deben ajustarse a la regla de que n + n + ... + n H = n (es decir, que el tamaño total de la muestra viene dado por la suma
h 1 2
de los tamaños de las submuestras). La selección óptima de estos n se puede realizar de varias maneras, utilizando (por ejemplo) la
h
asignación óptima de Neyman.

Hay muchas razones para utilizar el muestreo estratificado: [7] disminuir las varianzas de las estimaciones de la muestra, utilizar métodos
parcialmente no aleatorios o estudiar los estratos individualmente. Un método útil, en parte no aleatorio, sería tomar muestras de individuos
cuando sean fácilmente accesibles y, cuando no, muestrear conglomerados para ahorrar costos de viaje. [8]

En general, para los estratos H , una media muestral ponderada es

con

[9]

Los pesos, , frecuentemente, pero no siempre, representan las proporciones de los elementos de la población en los estratos, y
. Para un tamaño de muestra fijo, es decir ,

[10]

que puede ser mínimo si la tasa de muestreo dentro de cada estrato se hace proporcional a la desviación estándar dentro de cada estrato:
, dónde y es una constante tal que .

Se alcanza una "asignación óptima" cuando las tasas de muestreo dentro de los estratos se hacen directamente proporcionales a las
desviaciones estándar dentro de los estratos e inversamente proporcionales a la raíz cuadrada del costo de muestreo por elemento dentro
de los estratos. :

[11]

dónde es una constante tal que , o, más generalmente, cuando

[12]

Investigación cualitativa

La determinación del tamaño de la muestra en estudios cualitativos adopta un enfoque diferente. Generalmente es un juicio subjetivo,
tomado a medida que avanza la investigación. [13] Un enfoque es continuar incluyendo más participantes o material hasta que se alcance la
saturación . [14] El número necesario para alcanzar la saturación se ha investigado empíricamente. [15] [16] [17] [18]

Hay escasez de orientación confiable sobre la estimación del tamaño de las muestras antes de comenzar la investigación, con una variedad
de sugerencias. [16] [19] [20] [21] Se ha sugerido para el análisis temático una herramienta similar a un cálculo de potencia cuantitativa, basada
en la distribución binomial negativa . [22] [21]

Ver también

Diseño de experimentos Portal de


matemáticas
Ejemplo de superficie de respuesta de ingeniería en regresión por pasos

h de Cohen

Referencias

1. ^ NIST / SEMATECH , "7.2.4.2. Tamaños de muestra requeridos" , 15. ^ Francisco, Jill J.; Johnston, María; Robertson, Clara; Glidewell, Liz;
Manual electrónico de métodos estadísticos. Enroscar, Vikki; Eccles, Martín P.; Grimshaw, Jeremy M. (2010). "¿Qué es
un tamaño de muestra adecuado? Operacionalizar la saturación de
2. ^ "Inferencia para la regresión" . utdallas.edu .
datos para estudios de entrevistas basados en teoría" (PDF) .
3. ^ "Intervalo de confianza para una proporción" Archivado el 23 de Psicología y Salud . 25 (10): 1229-1245. doi :
agosto de 2011 en la Wayback Machine. 10.1080/08870440903194015 . PMID 20204937 . S2CID

4. ^a b Capítulo 13 , página 215, en: Kenny, David A. (1987). Estadística 28152749 .

para las ciencias sociales y del comportamiento. Boston: pequeño, 16. ^a b Invitado, Greg; Bunce, Arwen; Johnson, Laura (2006). "¿Cuántas
marrón. ISBN 978-0-316-48915-7. entrevistas son suficientes?". Métodos de campo. 18: 59–82.

5. ^Kirkwood , James; Robert Hubrecht (2010). Manual de la UFAW sobre el doi:10.1177/1525822X05279903 . S2CID62237589 .

cuidado y manejo de animales de laboratorio y otros animales de 17. ^ Wright, Adán; Maloney, Francine L.; Feblowitz, Joshua C. (2011).
investigación. Wiley-Blackwell. pag. 29.ISBN_ 978-1-4051-7523-4. en "Actitudes de los médicos hacia y el uso de listas de problemas
línea Página 29 electrónicos: un análisis temático" . BMC Informática Médica y Toma

6. ^ Isogenic.info > Ecuación de recursos de Michael FW Festing. de Decisiones . 11 : 36. doi : 10.1186/1472-6947-11-36 . PMC

Actualizado en septiembre de 2006 3120635 . PMID 21612639 .

7. ^ Kish (1965, sección 3.1) 18. ^ Mason, Mark (2010). "Tamaño de muestra y saturación en estudios
de doctorado mediante entrevistas cualitativas" . Foro Cualitativo
8. ^ Kish (1965), pág. 148.
Sozialforschung . 11 (3): 8.
9. ^ Kish (1965), pág. 78.
19. ^ Emmel, N. (2013). Muestreo y elección de casos en investigación
10. ^ Kish (1965), pág. 81. cualitativa: un enfoque realista. Londres: sabio.

11. ^ Kish (1965), pág. 93. 20. ^ Onwuegbuzie, Anthony J.; Sanguijuela, Nancy L. (2007). "Un llamado
a análisis de poder cualitativo". Calidad y cantidad . 41 : 105-121. doi :
12. ^ Kish (1965), pág. 94.
10.1007/s11135-005-1098-1 . S2CID 62179911 .
13. ^ Sandelowski, M. (1995). Tamaño de la muestra en la investigación
21. ^a b Fugard AJB; Potts HWW (10 de febrero de 2015). "Apoyar el
cualitativa. Investigación en enfermería y salud , 18, 179–183
pensamiento sobre tamaños de muestra para análisis temáticos: una
14. ^ Glaser, B. (1965). El método comparativo constante del análisis herramienta cuantitativa" (PDF). Revista Internacional de Metodología
cualitativo. Problemas sociales , 12, 436–445 de la Investigación Social. 18(6): 669–684. doi:
10.1080/13645579.2015.1005453 . S2CID59047474 .

22. ^ Galvin R (2015). ¿Cuántas entrevistas son suficientes? ¿Las


entrevistas cualitativas en la investigación del consumo de energía de
los edificios producen conocimientos confiables? Revista de ingeniería
de la construcción, 1:2–12.

Referencias generales

Bartlett, JEII; Kotrlik, JW; Higgins, C. (2001). "Investigación organizacional: determinación del tamaño de muestra adecuado para la
investigación por encuesta" (PDF) . Revista de tecnología de la información, aprendizaje y desempeño . 19 (1): 43–50.

Kish, L. (1965). Muestreo de encuestas . Wiley. ISBN 978-0-471-48900-9.

Smith, Scott (8 de abril de 2013). "Determinación del tamaño de la muestra: cómo asegurarse de obtener el tamaño de muestra
correcto" . Calidades . Consultado el 19 de septiembre de 2018 .

Israel, Glenn D. (1992). "Determinación del tamaño de la muestra" . Universidad de Florida, PEOD-6 . Consultado el 29 de junio de 2019 .

Rens van de Schoot, Milica Miočević (eds.). 2020. Soluciones para muestras pequeñas (acceso abierto): una guía para investigadores y
profesionales aplicados . Rutledge.

Otras lecturas

NIST: Selección de tamaños de muestra

ASTM E122-07: Práctica estándar para calcular el tamaño de la muestra para estimar, con precisión especificada, el promedio de una
característica de un lote o proceso

enlaces externos

Un script de MATLAB que implementa la fórmula de tamaño de muestra de Cochran

Última edición hace 13 días por el monje trapense

El contenido está disponible bajo CC BY-SA 4.0 a menos que se indique lo contrario.

Condiciones de uso • Política de privacidad • Escritorio

También podría gustarte