Documentos de Académico
Documentos de Profesional
Documentos de Cultura
La determinación del tamaño de la muestra es el acto de elegir el número de observaciones o réplicas que se incluirán en una muestra
estadística . El tamaño de la muestra es una característica importante de cualquier estudio empírico en el que el objetivo sea hacer
inferencias sobre una población a partir de una muestra. En la práctica, el tamaño de la muestra utilizada en un estudio generalmente se
determina en función del costo, el tiempo o la conveniencia de recopilar los datos y la necesidad de que ofrezcan suficiente poder
estadístico . En estudios complicados puede haber varios tamaños de muestra diferentes: por ejemplo, en una encuesta estratificada habría
diferentes tamaños para cada estrato. En un censo se buscan datos de toda una población, de ahí que el tamaño de muestra previsto sea
igual al de la población. En el diseño experimental , donde un estudio puede dividirse en diferentes grupos de tratamiento , puede haber
diferentes tamaños de muestra para cada grupo.
utilizando la experiencia: las muestras pequeñas, aunque a veces inevitables, pueden dar lugar a intervalos de confianza amplios y riesgo
de errores en las pruebas de hipótesis estadísticas .
utilizar una varianza objetivo para obtener una estimación a partir de la muestra finalmente obtenida, es decir, si se requiere una alta
precisión (intervalo de confianza estrecho), esto se traduce en una varianza objetivo baja del estimador.
utilizar un objetivo para el poder de una prueba estadística que se aplicará una vez que se recopile la muestra.
utilizando un nivel de confianza, es decir, cuanto mayor sea el nivel de confianza requerido, mayor será el tamaño de la muestra (dado un
requisito de precisión constante).
Contenido
Introducción
Los tamaños de muestra más grandes generalmente conducen a una mayor precisión al estimar parámetros desconocidos. Por ejemplo, si
deseamos conocer la proporción de una determinada especie de pez que está infectada con un patógeno, generalmente tendríamos una
estimación más precisa de esta proporción si tomamos muestras y examinamos 200 peces en lugar de 100. Varios hechos fundamentales de
la estadística matemática describen este fenómeno, incluida la ley de los grandes números y el teorema del límite central .
En algunas situaciones, el aumento de la precisión para tamaños de muestra más grandes es mínimo o incluso inexistente. Esto puede
deberse a la presencia de errores sistemáticos o una fuerte dependencia de los datos, o si los datos siguen una distribución de cola pesada.
Los tamaños de las muestras pueden evaluarse por la calidad de las estimaciones resultantes. Por ejemplo, si se estima una proporción, es
posible que desee que el intervalo de confianza del 95% tenga menos de 0,06 unidades de ancho. Alternativamente, el tamaño de la
muestra puede evaluarse en función del poder de una prueba de hipótesis. Por ejemplo, si comparamos el apoyo a un determinado
candidato político entre las mujeres con el apoyo a ese candidato entre los hombres, es posible que deseemos tener un poder del 80% para
detectar una diferencia en los niveles de apoyo de 0,04 unidades.
Estimacion
Una situación relativamente simple es la estimación de una proporción . Por ejemplo, es posible que deseemos estimar la proporción de
residentes de una comunidad que tienen al menos 65 años.
El estimador de una proporción es , donde X es el número de "positivos", por ejemplo, el número de personas de las n muestras
que tienen al menos 65 años). Cuando las observaciones son independientes , este estimador tiene una distribución binomial (escalada) (y
también es la media muestral de los datos de una distribución de Bernoulli ). La varianza máxima de esta distribución es 0,25, lo que ocurre
cuando el parámetro verdadero es p = 0,5. En la práctica, dado que p es desconocido, la varianza máxima se utiliza a menudo para evaluar el
tamaño de la muestra. Si se conoce una estimación razonable de p, la cantidad se puede utilizar en lugar de 0,25.
Para n suficientemente grande , la distribución de se aproximará estrechamente mediante una distribución normal . [1] Usando esto y el
método de Wald para la distribución binomial , se obtiene un intervalo de confianza de la forma
donde Z es una puntuación Z estándar para el nivel de confianza deseado (1,96 para un intervalo de confianza del 95%).
Si deseamos tener un intervalo de confianza de W unidades de ancho total (W/2 en cada lado de la media muestral), resolveremos
margen de error ).
En la siguiente figura se puede observar cómo cambian los tamaños de muestra para proporciones
binomiales dados diferentes niveles de confianza y márgenes de error.
formará un intervalo de confianza del 95% para la proporción real. Si este intervalo no necesita tener más de W unidades de ancho, la
ecuación
2 2
[2] [3]
se puede resolver para n , lo que produce n = 4/ W = 1/ B donde B es el límite de error en la estimación, es decir, la estimación
generalmente se da dentro de ± B . Para B = 10% se requiere n = 100, para B = 5% se necesita n = 400, para B = 3% el requisito se aproxima
a n = 1000, mientras que para B = 1% se requiere un tamaño de muestra de n = 10000 . Estas cifras se citan a menudo en informes
noticiosos de encuestas de opinión y otras encuestas por muestreo . Sin embargo, es posible que los resultados informados no sean el valor
exacto, ya que es preferible que los números se redondeen hacia arriba. Sabiendo que el valor de n es el número mínimo de puntos de
muestra necesarios para adquirir el resultado deseado, el número de encuestados debe estar en el mínimo o por encima de él.
Al estimar la media poblacional utilizando una muestra independiente e idénticamente distribuida (iid) de tamaño n , donde cada valor de
2
datos tiene una varianza σ , el error estándar de la media muestral es:
Esta expresión describe cuantitativamente cómo la estimación se vuelve más precisa a medida que aumenta el tamaño de la muestra. El uso
del teorema del límite central para justificar la aproximación de la media muestral con una distribución normal produce un intervalo de
confianza de la forma
donde Z es una puntuación Z estándar para el nivel de confianza deseado (1,96 para un intervalo de confianza del 95%).
Si deseamos tener un intervalo de confianza de W unidades de ancho total (siendo W/2 el margen de error a cada lado de la media
muestral), resolveríamos
Por ejemplo, si estamos interesados en estimar la cantidad en la que un fármaco reduce la presión arterial de un sujeto con un intervalo de
confianza del 95% de seis unidades de ancho, y sabemos que la desviación estándar de la presión arterial en la población es 15, entonces la
el tamaño de muestra requerido es , que se redondearía a 97, porque el valor obtenido es el tamaño mínimo de
muestra, y los tamaños de muestra deben ser números enteros y deben estar en o por encima del mínimo calculado.
Un problema común al que se enfrentan los estadísticos es calcular el tamaño de muestra necesario para obtener una determinada potencia
para una prueba, dada una tasa de error tipo I predeterminada α. De la siguiente manera, esto puede estimarse mediante tablas
predeterminadas para ciertos valores, mediante la ecuación de recursos de Mead o, más generalmente, mediante la función de distribución
acumulativa :
Mesas
[4]
d de Cohen
0,25 84 14 6
0,50 193 32 13
0,70 310 50 20
0,80 393 64 26
0,90 526 85 34
La tabla que se muestra a la derecha se puede utilizar en una prueba t de dos muestras para estimar los tamaños de muestra de un grupo
experimental y un grupo de control que son del mismo tamaño, es decir, el número total de individuos en el ensayo es el doble que del
número dado, y el nivel de significancia deseado es 0,05. [4] Los parámetros utilizados son:
d de Cohen (= tamaño del efecto), que es la diferencia esperada entre las medias de los valores objetivo entre el grupo experimental y el
grupo de control , dividida por la desviación estándar esperada .
La ecuación de recursos de Mead se utiliza a menudo para estimar tamaños de muestras de animales de laboratorio , así como en muchos
otros experimentos de laboratorio. Puede que no sea tan preciso como utilizar otros métodos para estimar el tamaño de la muestra, pero da
una idea de cuál es el tamaño de muestra apropiado cuando parámetros como las desviaciones estándar esperadas o las diferencias
esperadas en los valores entre grupos se desconocen o son muy difíciles de estimar. [5]
Todos los parámetros de la ecuación son, de hecho, los grados de libertad del número de sus conceptos y, por lo tanto, sus números se
restan en 1 antes de insertarlos en la ecuación.
dónde:
B es el componente de bloqueo , que representa los efectos ambientales permitidos en el diseño (menos 1)
T es el componente de tratamiento , correspondiente al número de grupos de tratamiento (incluido el grupo de control ) que se utilizan, o
al número de preguntas que se hacen (menos 1).
E son los grados de libertad del componente de error y debe estar entre 10 y 20.
Por ejemplo, si se planifica un estudio con animales de laboratorio con cuatro grupos de tratamiento ( T =3), con ocho animales por grupo,
lo que hace un total de 32 animales ( N = 31), sin ninguna estratificación adicional ( B =0), entonces E igual a 28, que está por encima del
límite de 20, lo que indica que el tamaño de la muestra puede ser demasiado grande y que seis animales por grupo podrían ser más
apropiados. [6]
*
para alguna 'diferencia significativa más pequeña' μ > 0. Este es el valor más pequeño para el cual nos interesa observar una diferencia.
Ahora, si deseamos (1) rechazar H con una probabilidad de al menos 1 − β cuando H es verdadera (es decir, una potencia de 1 − β ), y
0 a
(2) rechazar H con probabilidad α cuando H es cierto, entonces necesitamos lo siguiente:
0 0
y entonces
es una regla de decisión que satisface (2). (Esta es una prueba de una cola).
Ahora deseamos que esto suceda con una probabilidad de al menos 1 − β cuando H es verdadera. En este caso, nuestro promedio
a
*
muestral provendrá de una distribución normal con media μ . Por lo tanto, requerimos
Mediante una manipulación cuidadosa, se puede demostrar que esto sucede (ver Ejemplo de poder estadístico ) cuando
Con técnicas de muestreo más complicadas, como el muestreo estratificado , la muestra a menudo se puede dividir en submuestras.
Normalmente, si hay H tales submuestras (de H estratos diferentes), entonces cada una de ellas tendrá un tamaño de muestra n , h = 1, 2,
h
..., H . Estos n deben ajustarse a la regla de que n + n + ... + n H = n (es decir, que el tamaño total de la muestra viene dado por la suma
h 1 2
de los tamaños de las submuestras). La selección óptima de estos n se puede realizar de varias maneras, utilizando (por ejemplo) la
h
asignación óptima de Neyman.
Hay muchas razones para utilizar el muestreo estratificado: [7] disminuir las varianzas de las estimaciones de la muestra, utilizar métodos
parcialmente no aleatorios o estudiar los estratos individualmente. Un método útil, en parte no aleatorio, sería tomar muestras de individuos
cuando sean fácilmente accesibles y, cuando no, muestrear conglomerados para ahorrar costos de viaje. [8]
con
[9]
Los pesos, , frecuentemente, pero no siempre, representan las proporciones de los elementos de la población en los estratos, y
. Para un tamaño de muestra fijo, es decir ,
[10]
que puede ser mínimo si la tasa de muestreo dentro de cada estrato se hace proporcional a la desviación estándar dentro de cada estrato:
, dónde y es una constante tal que .
Se alcanza una "asignación óptima" cuando las tasas de muestreo dentro de los estratos se hacen directamente proporcionales a las
desviaciones estándar dentro de los estratos e inversamente proporcionales a la raíz cuadrada del costo de muestreo por elemento dentro
de los estratos. :
[11]
[12]
Investigación cualitativa
La determinación del tamaño de la muestra en estudios cualitativos adopta un enfoque diferente. Generalmente es un juicio subjetivo,
tomado a medida que avanza la investigación. [13] Un enfoque es continuar incluyendo más participantes o material hasta que se alcance la
saturación . [14] El número necesario para alcanzar la saturación se ha investigado empíricamente. [15] [16] [17] [18]
Hay escasez de orientación confiable sobre la estimación del tamaño de las muestras antes de comenzar la investigación, con una variedad
de sugerencias. [16] [19] [20] [21] Se ha sugerido para el análisis temático una herramienta similar a un cálculo de potencia cuantitativa, basada
en la distribución binomial negativa . [22] [21]
Ver también
h de Cohen
Referencias
1. ^ NIST / SEMATECH , "7.2.4.2. Tamaños de muestra requeridos" , 15. ^ Francisco, Jill J.; Johnston, María; Robertson, Clara; Glidewell, Liz;
Manual electrónico de métodos estadísticos. Enroscar, Vikki; Eccles, Martín P.; Grimshaw, Jeremy M. (2010). "¿Qué es
un tamaño de muestra adecuado? Operacionalizar la saturación de
2. ^ "Inferencia para la regresión" . utdallas.edu .
datos para estudios de entrevistas basados en teoría" (PDF) .
3. ^ "Intervalo de confianza para una proporción" Archivado el 23 de Psicología y Salud . 25 (10): 1229-1245. doi :
agosto de 2011 en la Wayback Machine. 10.1080/08870440903194015 . PMID 20204937 . S2CID
para las ciencias sociales y del comportamiento. Boston: pequeño, 16. ^a b Invitado, Greg; Bunce, Arwen; Johnson, Laura (2006). "¿Cuántas
marrón. ISBN 978-0-316-48915-7. entrevistas son suficientes?". Métodos de campo. 18: 59–82.
5. ^Kirkwood , James; Robert Hubrecht (2010). Manual de la UFAW sobre el doi:10.1177/1525822X05279903 . S2CID62237589 .
cuidado y manejo de animales de laboratorio y otros animales de 17. ^ Wright, Adán; Maloney, Francine L.; Feblowitz, Joshua C. (2011).
investigación. Wiley-Blackwell. pag. 29.ISBN_ 978-1-4051-7523-4. en "Actitudes de los médicos hacia y el uso de listas de problemas
línea Página 29 electrónicos: un análisis temático" . BMC Informática Médica y Toma
6. ^ Isogenic.info > Ecuación de recursos de Michael FW Festing. de Decisiones . 11 : 36. doi : 10.1186/1472-6947-11-36 . PMC
7. ^ Kish (1965, sección 3.1) 18. ^ Mason, Mark (2010). "Tamaño de muestra y saturación en estudios
de doctorado mediante entrevistas cualitativas" . Foro Cualitativo
8. ^ Kish (1965), pág. 148.
Sozialforschung . 11 (3): 8.
9. ^ Kish (1965), pág. 78.
19. ^ Emmel, N. (2013). Muestreo y elección de casos en investigación
10. ^ Kish (1965), pág. 81. cualitativa: un enfoque realista. Londres: sabio.
11. ^ Kish (1965), pág. 93. 20. ^ Onwuegbuzie, Anthony J.; Sanguijuela, Nancy L. (2007). "Un llamado
a análisis de poder cualitativo". Calidad y cantidad . 41 : 105-121. doi :
12. ^ Kish (1965), pág. 94.
10.1007/s11135-005-1098-1 . S2CID 62179911 .
13. ^ Sandelowski, M. (1995). Tamaño de la muestra en la investigación
21. ^a b Fugard AJB; Potts HWW (10 de febrero de 2015). "Apoyar el
cualitativa. Investigación en enfermería y salud , 18, 179–183
pensamiento sobre tamaños de muestra para análisis temáticos: una
14. ^ Glaser, B. (1965). El método comparativo constante del análisis herramienta cuantitativa" (PDF). Revista Internacional de Metodología
cualitativo. Problemas sociales , 12, 436–445 de la Investigación Social. 18(6): 669–684. doi:
10.1080/13645579.2015.1005453 . S2CID59047474 .
Referencias generales
Bartlett, JEII; Kotrlik, JW; Higgins, C. (2001). "Investigación organizacional: determinación del tamaño de muestra adecuado para la
investigación por encuesta" (PDF) . Revista de tecnología de la información, aprendizaje y desempeño . 19 (1): 43–50.
Smith, Scott (8 de abril de 2013). "Determinación del tamaño de la muestra: cómo asegurarse de obtener el tamaño de muestra
correcto" . Calidades . Consultado el 19 de septiembre de 2018 .
Israel, Glenn D. (1992). "Determinación del tamaño de la muestra" . Universidad de Florida, PEOD-6 . Consultado el 29 de junio de 2019 .
Rens van de Schoot, Milica Miočević (eds.). 2020. Soluciones para muestras pequeñas (acceso abierto): una guía para investigadores y
profesionales aplicados . Rutledge.
Otras lecturas
ASTM E122-07: Práctica estándar para calcular el tamaño de la muestra para estimar, con precisión especificada, el promedio de una
característica de un lote o proceso
enlaces externos
El contenido está disponible bajo CC BY-SA 4.0 a menos que se indique lo contrario.