Está en la página 1de 26

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

net/publication/306346785

Manual de Bioestadística para estudiantes de carreras de Ciencias de salud y


residentes- Parte 4.

Chapter · August 2016

CITATIONS READS

0 3,152

3 authors:

Octavio O. Danel Ruas Asela Isabel Acosta Valenzuela


Universidad de Ciencias Médicas de La Habana Universidad de las Artes Cuba
125 PUBLICATIONS 47 CITATIONS 24 PUBLICATIONS 10 CITATIONS

SEE PROFILE SEE PROFILE

Carlos Andrés Santa María Rodríguez


Universidad de Ciencias Médicas de La Habana
24 PUBLICATIONS 10 CITATIONS

SEE PROFILE

Some of the authors of this publication are also working on these related projects:

Bioestadística Project View project

Aula Virtual Universidad de las Artes View project

All content following this page was uploaded by Octavio O. Danel Ruas on 11 August 2017.

The user has requested enhancement of the downloaded file.


Bioestadística para estudiantes de salud. La Técnica del muestreo. Parte VII
Octavio O. Danel Ruas
Julio 2017
CAPITULO VII. LA TECNICA DEL MUESTREO.
Introducción. Conceptos de población y muestra. El tamaño de la muestra. Ventajas y
desventajas del muestreo. Tipos de muestreo.
En los problemas que se presentan en la práctica, el personal de salud suele
encontrarse ante la necesidad de estudiar el comportamiento de una enfermedad, de
un medicamento, de un nuevo método de operar una dolencia determinada, u otra,
en los elementos de un determinado colectivo, para lo cual tendría que examinar
cada uno de los elementos de dicho grupo y observar aquel conjunto de variables
que sean de su interés concreto.
Variable y datos para hacer un análisis estadístico.
Un análisis estadístico es siempre antecedido de una pregunta de investigación. Hay
algo que se quiere estudiar, eventualmente una hipótesis que se pretende comprobar.
La definición de la variable principal considerada debe ser cuidadosa, una vez que
tiene un peso enorme en la estrategia de investigación. En particular, es determinante
en el cálculo del número de sujetos a testar, en el establecimiento de las medidas a
efectuar y en el protocolo de la investigación. Si ninguna otra variable más fuese
medida además de la “variable principal”, ésta debe ser suficiente para dar una
respuesta al problema y preguntas de investigación.
Más allá de la “variable principal” se recogen otros dados que ayudan a la respuesta
de la cuestión de averiguación, genéricamente designados por medidas secundarias.
Las medidas secundarias son usadas para evaluar otros potenciales efectos
importantes, competidores para la hipótesis primaria. Pueden ser variables que
permitan tener una evaluación más completa de la cuestión de averiguación. Podrán
eventualmente exprimir posibles factores condicionantes de la relación
beneficio/riesgo. También pueden ser recogidos datos de variables asociadas la
seguridad o efectos adversos.
Ya hemos visto en la Parte 1 de estos capítulos de Bioestadística1 que las variables
suelen clasificarse del siguiente modo:
Cualitativas Nominales - Dicotómicas o Binarias
- Politómicas
Variables Ordinales
Cuantitativas Discretas
Continuas
1 Danel Ruas, O. O. (2016) Bioestadística para residentes, estudiantes de medicina,
enfermería y ciencias de salud. Disponible en:
https://www.researchgate.net/publication/305466999
Paralelamente a la definición clara de la pregunta de investigación, la elección de la
“variable principal” es uno de los aspectos centrales de un estudio estadístico. Deberá
tenerse en consideración algunos aspectos:
1. La medida principal debe ser definida a priori, esto es, en la fase de diseño del
estudio que ocurre antes de empezar a recoger los datos. La definición de la variable
principal a considerar es guiada por la observación de los datos que deben ser
recolectados.
2. El proceso de medida asociado a la “variable principal” debe ser exacto,
necesita de alta confiabilidad, debiendo ser aplicado uniformemente para todos los
elementos del estudio. En cada área del conocimiento, es preferible adoptar como
medida principal lo aceptado por la comunidad científica, obviando informaciones que
aún no han sido completamente comprobadas.
1- ¿Cuántas “variables principales” se deben considerar?
Deberá haber apenas una medida principal, a cuál deberá observar estrictamente las
calidades discutidas anteriormente.
2- ¿Cuántas otras variables medibles se deben considerar?
Las que aporten para responder al problema o la(s) pregunta(s) de investigación de
una forma objetiva. Deberá tenerse en cuenta el mayor número posible de criterios
posible en la elección de la(s) variable(s) por incluir en el estudio.
No se debe excluir una variable que sea importante para explicar los resultados del
trabajo, esto perjudicaría el análisis de los resultados, pues faltarán factores que
permitan explicar los mismos.
Por otro lado, incluir variables inútiles o poco relevantes es contraproducente. De una
forma general, cuántos menos test(pruebas) estadísticos son realizados, más difícil
será el análisis. Como regla práctica a recordar, se debe siempre tener mucho más
sujetos en el estudio que variables medidas. La inclusión de más variables podrá
obligar también a la inclusión de más sujetos.
3- ¿Cuál debe ser el número de sujetos a incluir en la investigación?
Depende de las diferencias estimadas y la variabilidad en los grupos que se
pretenden observar. Si hubiera una grande variabilidad en los resultados, tendremos
entonces que incluir más personas en la muestra. Existen formulas para calcular la
“n” de una experiencia, pero el uso de las mismas depende del conocimiento (o
suposición de conocimiento) a priori de algunos elementos, del problema investigado
y la experiencia del equipo de investigación.
Ahora bien, ocurre muy a menudo que tales variables de elementos a observar son a
veces muy grandes, lo que hace así imposible el observar a cada uno de sus
componentes. Por ejemplo, un investigador que desee estudiar el comportamiento de
la talla de los niños de nivel primario en todo el país tendría que emplear un tiempo
excesivamente grande en hacerlo, aún contando con una organización adecuada que
le permitiera el hacerlo. En casos como este y en otros semejantes lo que se hace
comúnmente es examinar un número determinado de individuos u objetos y suponer
que se puede ir observando el comportamiento de lo que se desea estudiar en este
conjunto limitado, extender luego estos resultados en cierto grado de confianza al
conjunto o colectivo de donde provienen los elementos ya observados y analizados.
Esto nos conduce de manera natural a formularnos la siguiente pregunta. ¿Qué
puede decirse sobre un colectivo de elementos del cual sólo cabe examinar un
número limitado de elementos?
Dar respuesta a esta pregunta contiene dentro de sí el origen de la llamada "teoría del
muestreo" y de sus distintos métodos.
Es importante volver a señalar para que quede claro al lector que aunque la que se
observa y estudia es una parte del todo o total, sobre lo que se quiere juzgar y emitir
determinados juicios a posterior, es acerca del todo y que sobre el comportamiento
de las características del fenómeno bajo estudio en este todo se juzga a partir de lo
observado en la parte escogida y que por tanto esto implica un proceso de
generalización de lo observado en un número limitado de elementos a todos los
elementos de esa clase, generalización que no tendría sentido o trascendencia si los
individuos que se eligen para realizar las observaciones no son escogidos
adecuadamente.
Antes de continuar con otros aspectos, es necesario precisar un vocabulario mínimo
con el objetivo de comprender y fijar mejor las ideas que se expongan más adelante.
Ante todo, es fundamental fijarlas ideas de lo que se conoce como "universo o
población" y a qué se le denomina muestra.
Concepto de universo o población y muestra.
La idea de tomar una pequeña parte de un conjunto (todo) para representar o
caracterizar el mismo, es una idea general de fácil comprensión la cual se usa
ampliamente. Así, cuando a un paciente se le quiere inyectar un medicamento del
que cabe esperar algún tipo de reacción, lo que se hace es probar con una pequeña
parte del mismo para observar-si se presenta la mencionada reacción y así poder-
tomar una decisión al respecto. Esa pequeña parte con la que se hace la prueba
para observar su efecto en el paciente es lo que se denomina como "muestra" y el
todo de donde procede esa pequeña porción es 1 o que recibe el nombre de
"población".
La muestra además de ser una herramienta muy útil e importante para el médico,
investigador-, lo es también para el estadístico, pues esta conforma la materia prima
a ser procesada por los diferentes ,métodos estadísticos que se haya previsto
utilizar para dar respuesta a las diversas interrogantes planteadas, en el marco de una
investigación.
En el presente y sencillo estudio de la teoría del muestreo, se seguirá la práctica
habitual de los estadísticos de inferirse al conjunto que se muestrea como la
población y la pequeña parte en la que se determinan las observaciones como la
muestra a los efectos prácticos se usará el siguiente criterio: Se denomina
''población o universo", a la totalidad o conjunto de elementos (personas, animales,
números, etc.) susceptibles de presentar una o varias características en común
que estén bien definidas llamándose muestra como consecuencia de lo
anteriormente analizado, a cualquier subconjunto del universo a población.
Debe señalarse que, aunque desde el punto de vista formal las definiciones
anteriores son correctas, ellas no cobran sentido práctico sino ante un problema
concreto, y que al hablar de población y de muestra se supone implícita la
intención de conocer algo específico.
Por consiguiente, cabe señalar respecto al concepto de población lo siguiente:
Todo universo o población debe definirse sin ambigüedades, es decir debe ser
posible decidir cuándo un individuo pertenece o no al universo bajo consideración,
contextualizando dicha población.
Véanse los siguientes ejemplos como ilustración de esto último que se ha
plateado:
1) Universo: la totalidad o conjunto de pacientes asmáticos con un deficiente grado
de conciencia de la importancia de su padecimiento.
2) Es la totalidad o conjunto de pacientes que han padecido de enfermedades
diarreicas agudas que se atienden en el Hospital Pediátrico de Centro Habana de
menos de un año de edad en el año 2016.
En el primer caso se tiene un universo mal definido pues no es posible discernir
claramente cuando un paciente asmático pertenece o no a este conjunto debido al
grado de subjetividad presente en el criterio expresado por “deficiente grado de
conciencia de la importancia de su padecimiento”. En el segundo caso esto no es
así pues el criterio expresa por la frase "ser atendido en el Hospital Pediátrico de
Centro Habana por una enfermedad diarreica aguda con menos de un año de
edad durante el año 2016", permite delimitar correctamente cuándo un niños
pertenece o no a dicho universo.
En lo planteado anteriormente, hemos expresado acerca de lo que es una muestra,
como “parte del todo o universo, que consta en general de un número limitado de
elementos", los cuales se relacionan de alguna manera concreta para luego ser
analizados y a partir de ellos hacer las inferencias correspondientes al resto de la
población.
Nos corresponde ahora acerca de este "número limitado" de elementos a
relacionar en la población, valor este para el cual los estadísticos tienen una
designación propia dentro de la Teoría del muestreo, conocida como "tamaño de
muestra”
El tamaño de la muestra. Se denomina así al total de elementos a ser relacionados
de la población para luego ser analizados. Es el número de unidades que la
constituyen.
El tamaño de la muestra no determina si ella es de buena o mala calidad, más
importante del que su tamaño es su representatividad, o sea, su grado de
semejanza con la población en estudio. Se considera que la dimensión mínima de
una muestra debe ser de 30 unidades estadísticas. Sin embargo, el tamaño de la
muestra depende básicamente de:
- El tamaño de la población en estudio.
- El grado de confianza que se quiere alcanzar en los resultados;
- El grado mínimo deseado para el análisis;
- Los recursos y tiempo disponibles.
Con relación a este valor cabe señalar los siguientes aspectos:
a) Su importancia dentro del muestreo.
b) Los aspectos que inciden en su determinación y que dificultan a la vez su
valoración objetiva.
Puede señalarse en este momento que uno de los elementos más importantes
dentro de todo esquema de muestreo aparte del propio método a utilizar para llevar
a cabo la selección de la muestra es, a su vez el tamaño de la muestra por
seleccionar, de la población concreta que se esté analizando, pues dentro de toda
investigación por ejecutar, la cual se haya planificado debidamente y en la cual se
haya decidido usar un determinado método de muestreo, existe siempre una etapa
en la cual hay que darle respuesta a la siguiente pregunta, cuántas observaciones
es necesario hacer?, en otras palabras más técnicas, cuál es el tamaño de
muestra requerido?
Para responder esta pregunta uno debe tener bien claro cuáles son los objetivos
que se persiguen con una investigación dada, en otras palabras, que se pretende
lograr y con qué grado de aproximación se quiere explicar o calcular algo. Este
último aspecto, el grado de aproximación que se pretende alcanzar, es una faceta
muy relacionada con el tamaño de la muestra, pues la forma más común de medir
indirectamente el grado de aproximación alcanzado es a través de la varianza o de
la desviación estándar de la población. Esto para el caso en que se desea obtener
un valor aproximado del valor medio de una característica dada a través del valor
promedio observado en la muestra se conoce hoy día que es as¡, es decir cuando
se intenta saber cuántas observaciones son necesarias para obtener una
aproximación prefijada de antemano, nos encontramos que existe una manifiesta
relación entre la varianza de la media muestral, el tamaño de la muestra y la
varianza poblacional, siendo en general éste último valor desconocido.
Ahora bien, significa esto en este caso y en otros por extensión con sus
particularidades propias, que el tamaño de la muestra no pueda ser racionalmente
determinado?, esto en general no es así, ya que usualmente uno (es decir el
investigador) tiene,' debido a su experiencia cotidiana, algunas ideas
preconcebidas acerca del valor posible que puedan tomar estos parámetros de la
población a estudiar, de manera que esto puede usarse en muchos casos para
hacer cálculos que a groso modo resultan bastante apropiados para la
determinación del tamaño de la muestra. Otra vía de llegar a tomar este tipo de
conocimiento es mediante la realización, previo a la investigación principal, de un
muestreo piloto, es decir, un muestreo mucho más pequeño que el que en defini-
tiva se llevará a cabo con el objetivo de obtener valores preliminares acerca de
aquellos parámetros que influyen sobre la determinación del tamaño de la muestra.
Esta forma de proceder es lo que comúnmente se denomina como diseño de una
investigación por etapas, en este caso de dos etapas.
Otro hecho que incide también sobre la determinación del tamaño de la muestra es
el método (o métodos estadísticos previstos) a ser empleado con los resultados
observados, pues en dependencia de este la determinación del tamaño de la
muestra varía de uno a otro. Por el momento no señalaremos nada más sobre este
último aspecto, el cual será retomado en el momento oportuno, para pasar ahora a
detallar algunas características importantes de la razón de ser del muestreo.
Ventajas y desventajas del muestreo. El error de muestreo.
Existen varias razones por las cuales el uso del muestreo es indicado o preferido
ante el estudio de todo el universo, entre las cuales se pueden señalar las
siguientes.
1. Algunas valoraciones del aspecto en cuestión pueden implicar pruebas
destructivas o de uso que imposibilitan una utilización posterior de lo analizado.
Por ejemplo, esto puede ocurrir al inspeccionar la calidad de un lote de
medicamentos con el objetivo de valorar el estado de utilización del mismo.
2. Es mucho más eficiente valorar una muestra que todo el universo, en el sentido
de:
a) Ahorrar recursos y esfuerzos.
b) Ahorrar tiempo.
3. Mediante el uso de muestras se pueden obtener resultados razonablemente más
precisos en muchos casos que mediante la elaboración de todo el universo. Esto
es factible ya que se puede emplear un personal auxiliar caso de hacer falta, al
cual se le puede preparar mejor con el objetivo de que puedan recoger una infor-
mación que va comparativamente más detallada y elaborada.
Como desventaja cabe señalar como la más importante, la existencia en todo
método de muestreo del llamado "error de muestreo", del cual se puede decir que
es producto de la variabilidad intrínseca que poseen los elementos de todo
universo o población y que la interpretación del término "error" en la frase "error de
muestreo" no debe entenderse como sinónimo de equivocación.
Para ilustrar de qué manera se origina este tipo de error en un muestreo simple o
al azar, método este de muestreo el cual se explicará más adelante, se usará una
situación problemática hipotética con el fin de que la idea de éste quede clara al
lector.
Para lograr lo anterior supóngase que se ha medido el valor de una característica
tal como la "estatura" en una población compuesta por sola 5 niños de
aproximadamente la misma edad y que se han obtenido los siguientes valores de
estatura en centímetros: 125, 130, 117, 120 y 125.
Dada la situación anterior supóngase que se desea tener una idea del valor
"estatura media" de esta población, pero a través de muestras de diversos
tamaños, en particular usando 3 muestras de 2, 3 y 4 elementos respectivamente.
La forma de llevar a cabo lo anteriormente planteado, dada la condición del uso de
un esquema de muestreo al azar, requiere, en primera instancia, enumerar en
forma consecutiva .,,todos los elementos de la población a muestrear, y luego
escoger los elementos que compondrán la futura muestra mediante un mecanismo
aleatorio, para lo Cual uno muy utilizado comúnmente son las llamadas “Tablas de
números aleatorios", con el objetivo de que se garantice una selección objetiva de
los elementos de la muestra, o sea, de forma que se elimine cualquier inclinación
natural (no mal intencionada) del investigador o persona que ha de llevar a cabo la
selección, de considerar que en la muestra estén presentes ciertos y determinados
elementos en específico por alguna razón particular.
Para tener una idea sencilla de lo que es una tabla de números aleatorios, diremos
que esta no es otra cosa que hojas llenas de columnas de números que son
combinaciones de cifras en forma de libro, en la que dichas hojas semejan una
matriz numérica. Dichas hojas sirven de ayuda inestimable para efectuar la
selección de la muestra.
El procedimiento a seguir en este ejemplo y en cualquier otro caso semejante a
este es el siguiente:
1. Se enumeran los elementos de la población.
0 1 2 3 4
117 120 125 125 130
(Comenzando por el cero siempre)
2. Seleccionar una columna cualquiera de la tabla y dentro de ella -ir agrupamiento
de números arbitrarios.
Este mecanismo se aplicará ahora a las muestras de tamaño 2, lo mismo podrá
hacerse con las de tamaño 3 y 4 usando la hoja de números aleatorios que se
adjunta para facilitar la comprensión.
Para escoger los elementos de la muestra de tamaño 2, nos fijamos en que los
números que representan a los valores de la población son todos números de una
sola cifra, a continuación tomamos la hoja de números aleatorios de ella
seleccionamos arbitrariamente la 2da columna; en esta columna comenzamos a
observar las parejas de cifras que en ella aparecen, suponiendo que empezamos
por la primera (puede seleccionarse otra cualquiera) nos encontramos a
continuación con las siguientes parejas de números.19, 02, 85,45,31,31,42,65,32,33.
Al tomar la 1era pareja se puede usar de ella el primer dígito v desechamos el
9, esto significa que automáticamente seleccionado el elemento de la población
con dicho número, en este caso el valor 120 como primer miembro de una de las
muestras de tamaño 2. Para la selección del 2do miembro tomamos la siguiente
pareja de cifras 02 y esta nos indica que el próximo valor por considerar para la
muestra es el 117. Luego la primera muestra es la pareja de valores 117,120.
Para la selección de la segunda muestra se procede de manera análoga y así
llegamos a los valores 125,130, los cuales corresponden a los dígitos 2 y 4 de la
2da y 4ta parejas de cifras y por último a los valores 125 y 120 correspondiente a
la 6ta pareja de valores.
Para la selección de las muestras de tamaño 3 y 4, un esquema idéntico de
selección es factible de llevar a cabo, en lo que sigue a continuación se supondrá
que ya esto fue ejecutado de esta manera, obteniéndose la siguiente tabla en la
que aparecen además de los valores muéstrales, el valor correspondiente a la
media muestral de cada muestra.
TABLA DE VALORES MUESTRALES
Tamaño de muestra Valores muéstrales Media muestral
2 117,120 118,50 centímetros
3 125,130 127,50 "
2 125,120 122,50 "
3 125,130,125 126,66 "
3 125,125,120 123,3 "
3 125,117,125 122,3 "
4 120, 117, 125,130 123,00 "
4 130,117,125,125 124,25 "
4 117,125,125,120 121,75 "

Si calculamos la media poblacional, la cual en este caso es fácil de hallar, pues


solo son 5 valores en total, (en otros casos este valor resulta ser desconocido), se
llega a la siguiente valoración de la estatura media poblacional.
117 120 125 125 130
ó 123,4
5
Al comparar este valor poblacional con los valores de la estatura media muestral
vemos la existencia de ciertas diferencias debidas a la variabilidad existente en
losdatos de partida, a los valores de estas diferencias es que lo que se denomina
"error de muestrea" del promedio, que como vemos puede ser mayor o menor en
dependencia del tamaño de la muestra.
El diseño de un estudio de investigación debe ser asumido como la solución de un
conjunto de factores. Teniendo como punto de partida la(s) pregunta(s) de
investigación bien formulada(s), donde debe estar explicitado, aspectos como cuál
es la población a ser estudiada, como debe ser escogida la muestra o cuál es la
variable principal por considerar, medir u observar. Previa a esto es necesario
tomar en cuenta la cuestión ¿Qué datos se deberán recoger para hacer un análisis
estadístico? Pretendemos en la presente a partir de la definición de población y de
muestra, bien como la relación entre estas dos.
En particular, la definición de la variable principal es crucial para el cálculo del
tamaño de la muestra. Por otro lado, la definición de la población restringe la
muestra. Se puede pensar en población como siendo el grupo de personas – o
animales u otros objetos, conforme el estudio - para lo cual queramos aplicar las
conclusiones de nuestro estudio y para lo cual pensamos consiguen éstas ser
válidas.
No todos los elementos de la población están necesariamente disponibles para
participar en el estudio, su disponibilidad está afectada por diversos factores –
económicos, geográficos, éticos u otros.
Así, es usual distinguirse población blanco de población accesible, siendo esta
última un subconjunto de la primera, para la cual queramos sacar conclusiones.
Como ejemplo de una población blanco podemos considerar los consumidores
habituales de un determinado número de residentes en un territorio y como
población accesible los clientes que en las farmacias de este territorio consumen
habitualmente ese medicamento.
Más allá de población blanco y población accesible, deberá definirse el concepto
de muestra. Ni todas las personas pertenecientes a la población accesible
participarán en el estudio.
Se designa este último subgrupo que participa en el estudio como la muestra, para
lo cual, se asume entonces que las conclusiones que se vengan a obtener en el
estudio desde la muestra deberán ser válidas para la población blanco. La validez
de este proceso carece de algunos requisitos y algunas atenciones que deben ser
tenidos en cuenta.
Desde luego la forma como es seleccionada la muestra tiene un papel de gran
relevancia. Es también en esta fase que deben ser definidos los criterios de
inclusión y exclusión, quiénes deben ser considerados o no por la
representatividad de la muestra.
Selección de la muestra
Existen varias técnicas de muestreo siendo genéricamente divididas en métodos
probabilísticos y no probabilísticos. Un método probabilístico es tal que cada uno
de sus sujetos presenta una probabilidad finita no nula de ser escogido y esta
probabilidad es determinable. Este método produce muestras no sesgadas que
representan los trazos presentes en la población. Ya un método no probabilístico
es tal que existen elementos con probabilidad nula de ser escogidos. Así, en este
caso son producidos sesgos de exclusión poniendo limitaciones en las
extrapolaciones que se pueden hacer desde la muestra.
Tamaño de la muestra.
La dimensión de la muestra es determinada partiendo del conocimiento de algunos
parámetros que dependen de la naturaleza del objetivo y problema de
investigación, que generalmente incluyen el tamaño y la intención de lo que se
investiga. Este valor es calculado según sea cada caso empleando determinadas
expresiones establecidas. Por comodidad, es usual recurrir a programas
computacionales.
Condiciones de una buena muestra.
Con anterioridad se planteó que en todo proceso que haga uso de muestras, éstas,
es decir, sus elementos, deben ser escogidos adecuadamente para poder dar
satisfacción al propósito de este método, poder extender los resultados que se
observen al resto de los elementos que componen una población. Este último
aspecto de la frase anterior, vale la pena insistir en ello, es la base para declarar
una muestra como buena, en otras
Muestreo Simple Aleatorio (MSA).
El muestreo es una parte de la Estadística de amplio uso en las diferentes ramas
del saber científico y de la actividad diaria. Muestrear una población significa sacar
una muestra de ella para estudiar el comportamiento de una o varias
características, con el objetivo de hacer inferencias a la población.
Podemos seleccionar muestras para estudiar el número de votos que obtendrá un
candidato a delegado de una circunscripción, para estudiar las características de
un asentamiento poblacional, para conocer sobre las reservas ecológicas de un
lugar, etc.
Es muy importante la forma en que se seleccionan los individuos que van a
conformar la muestra, pues una mala selección de los individuos, de forma tal que
no representen adecuadamente a la población, puede desvirtuar los resultados.
Un buen muestreo requiere que tengamos en consideración la estructura inherente
a la población. Existen diferentes tipos de muestreo:
Muestreo simple aleatorio
Muestreo sistemático
Muestreo estratificado
Una muestra se dice probabilística cuando las unidades que la constituyen tuvieron
la misma probabilidad de ser seleccionadas en la población, y se considera
muestra no probabilística en las otras situaciones.2
Muestras probabilísticas
Las muestras probabilísticas pueden ser: aleatorias simples, aleatorias
sistemáticas, aleatorias estratificadas y agregados.
Características de los modelos de muestras
Modelos de muestras Características de estos modelos
Aleatoria simple Las unidades son seleccionadas, una a una, de
forma casual desde un conjunto.
Aleatoria sistemática Se selecciona una única unidad casual, las otras
son extraídas con intervalos fijos.
Aleatoria estratificada Las unidades son seleccionadas casualmente,
en el seno de subgrupos homogéneos.
Agregados o racimos Es constituida por subgrupos homogéneos
Seleccionados. No se seleccionan las unidades
pero si los grupos.
Generalmente, una muestra estratificada de dimensión n es constituida desde
varias muestras simples, siendo cada unidad lograda en uno de los subgrupos que
constituyen la muestra.
Algunos ejemplos sobre el uso del muestreo en ciencias de salud:
• Reacción adversa de los usuarios del uso de un determinado fármaco.
• Investigaciones de una compañía farmacéutica para evaluar la efectividad sobre el
uso de determinado medicamento en pacientes que lo consumen.
• Seguimiento y vigilancia posterior a la suspensión de la administración
masiva de un determinado medicamento.
• Muestras de medidas de azúcar en la sangre de pacientes diabéticos para probarla
eficacia de una técnica o de un fármaco nuevo.
2 Mezquita Morais, C. Escalas de Medida, Estadística Descriptiva e Inferencia Estadística. Disponible
en https://www.researchgate.net/publication/242681022
Cuando nos interesa estudiar las características de poblaciones grandes, se
utilizan muestras por muchas razones; una enumeración completa de la población,
es llamada censo, pero puede resultar económicamente imposible, o no se cuenta
con el tiempo suficiente.
Los dados primarios son los datos logrados desde la realización de pesquisas
directas (cuestionarios) o por la observación; y los datos secundarios son los datos
elaborados desde la existencia de datos primarios, ya disponibles en anuarios,
bases de datos, censos, entre otros3.
Cuando se quiere hacer inferencias de una población, a partir de datos tomados
de las muestras, esas inferencias son válidas solamente si las muestras son
representativas de la población. En la práctica no existe forma de garantizar esa
representatividad sin tener información de la población entera para comparar con
la muestra.
Una muestra aleatoria independiente es una muestra seleccionada de tal forma
que:
-Todos los miembros de la población tienen la misma probabilidad de ser
seleccionados;
- Cada combinación posible de un dato tiene la misma probabilidad de ser
seleccionado.
En principio, la mejor forma de lograr una muestra aleatoria de tamaño N es tener
una lista de todos los elementos de la población, numerar los elementos de 1 a N,
y entonces seleccionar aleatoriamente n números, en el conjunto {1, …, N.}
Después de seleccionados esos números, basta hacer corresponder a cada
número el respectivo elemento, que pasará a constituir un elemento de la
muestra.
En la práctica, este proceso no es simple, especialmente cuando la población es
infinita.
Siempre que una muestra es seleccionada, el proceso de muestreo debe estar
bien documentado de tal forma que cualquier inferencia acerca de una
población pueda ser evaluada a la luz de la estrategia muestral.

3 Wiebusch Sindelar, F. C. Et. al.(2014) Teoria e prática em estatística para cursos de graduação.
Editora Univates.Bairro Universitário - Lajeado - RS - Brasil
De las muchas razones que podrían ser nombradas para la utilización de una
muestra, en vez de una población, destacamos:
- Costos muy elevados para lograr información de toda la población;
- Excesivo tiempo para obtener información de toda la población;
- En ocasiones es imposible obtener datos de toda la población;
- Generalmente es condición imposible considerar toda la población. Como
ejemplo, de esa imposibilidad, destacamos: en un caso de enfermedades
infecciosas como Dengue o Fiebre Chikungunya, en las cuales resulta imposible
tomar la temperatura a toda la población de una región para comprobar existencia
del virus, en un tiempo reducido.
Muestras no probabilísticas: las muestras no probabilísticas pueden ser:
voluntarias, intencionales (por acuerdo), accidentales (casual) y de asignación por
cuotas4.
Características de los modelos de muestras no probabilísticos.
Voluntarias (o por conveniencia) - Constituidas por unidades que se disponen
voluntariamente para integrar la muestra. En este método se selecciona la muestra
en función de la disponibilidad y accesibilidad de los elementos de la población.
Intencionales - Constituidas desde las intenciones o necesidades del investigador
para estudiar una situación particular, se basan en opiniones de una o más
personas que conocen características específicas que se pretenden analizar de la
población en estudio.
Accidentales (casuales) - Las unidades son seleccionadas respetando el
orden con que aparecen. El método consiste en seleccionar inicialmente los
inquiridos de modo aleatorio y, enseguida, escoger unidades adicionales desde la
información lograda de los primeros.
Por cuotas - La característica principal de una muestra por cuotas es la necesidad
de calificarse el respondiendo "a priori";
- Tienen las ventajas de la economía de tiempo y de dinero;
- Son estratificadas con la locación proporcional al número de sujetos de cada
estrato.

4 Mezquita Morais, C. Escalas de Medida, Estadística Descriptiva e Inferencia Estadística. Disponible


en https://www.researchgate.net/publication/242681022
Los modelos de muestras no probabilísticos son bastantes criticados por los
teóricos porque no se concibe que todos los elementos de la población tienen la
misma probabilidad de ser seleccionados.

Cuando realizamos un muestreo, por lo general, efectuamos algunos de los cinco


pasos siguientes o todos ellos:
1. Decidir qué tipo de muestreo a utilizar
2. Estimar parámetros de interés
3. Hallar el error estándar de los estimadores
4. Construir intervalos de confianza para los parámetros estimados
5. Determinar el tamaño de muestra
Cuando se realiza un Muestreo Simple Aleatorio (MSA) todas las muestras tienen
la misma probabilidad de ser seleccionadas. El MSA se realiza con la ayuda de
una tabla de números aleatorios. A continuación se da una sección de dicha tabla:
231 117 070 092
055 433 432 979
148 938 615 373
389 495 313 726
973 367 570 610
Para explicar el procedimiento tomemos un ejemplo. Supongamos que tenemos
una población formada por niños que identificaremos por una letra y que hemos
registrado sus edades:
3 1 10 11 9 12 4 5 6 7 8 9
A B C D E F G H I J K L
Se quiere sacar una muestra de tamaño 4.
• sin reemplazo,
• con reemplazo.
Paso1
A cada individuo se le asigna un número, comenzando por 1. Contamos los dígitos
que tiene el último número asignado, o sea, los dígitos del tamaño de la población:
3 1 10 11 9 12 4 5 6 7 8 9 ◄Edad del niño
A B C D E F G H I J K L ◄ Nombre del niño
1 2 3 4 5 6 7 8 9 10 11 12 Tiene 2 dígitos
Paso2
Seleccionar tantas columnas de la tabla de números aleatorios como dígitos se
hayan contado en el paso anterior: en el ejemplo se tomaran 2 columnas y
empezaremos a leer por las 2 primeras. Si un número de la tabla coincide con uno
de los números asignados, el individuo en la muestra, sino el número leído se
desecha y se sigue con el mismo orden: Si el muestreo es con reemplazo el
individuo entra en la muestra tantas veces como aparezca su número. Si el
muestreo es sin reemplazo, el individuo entra solo una vez.
23-------------se desecha
05------------entra el niño E que tiene 9 años de edad.
14------------se desecha
38------------se desecha
97------------se desecha
Tomamos ahora la última cifra de la primera columna y la primera cifra de la
segunda columna, y así sucesivamente resulta que son seleccionados los niños
con número de orden:

11---------- K que tiene 8 años de edad

07---------- G que tiene 4 años de edad

06---------- F que tiene 13 años de edad.

De esta forma la muestra será E, K, G, F


9 8 4 13
Si queremos buscar valores que sean próximos a los valores de la población (por
lo general desconocidos), decimos que queremos estimar los parámetros
poblacionales. Así por ejemplo queremos poder estimar la altura promedio de la
población, su ingreso medio, etc.
Ejercicio 1: Se lleva a cabo un estudio sobre el hábito de fumar en un barrio de una
comunidad urbana para establecer si existe diferencia entre los dos sexos. Se toma una
muestra aleatoria simple de tamaño 100de una población de hombres adultos. Se toma una
muestra aleatoria simple de tamaño 120de una población de mujeres. Se encuentra que la
proporción de hombres fumadores en la muestra es de 0.40 y la proporción de mujeres que
fuman es 0.55
a) ¿Cuál es la variable respuesta? ¿Cuál es la variable explicadora?
b) ¿Es este un estudio observacional o experimental? Explica por qué.
c) ¿Es este un estudio prospectivo o retrospectivo? Justifique.
d) Diga qué método de muestreo se usó para obtener la muestra. Justifique.
Solución:
a) Variable respuesta (Y): es el hábito de fumar (FUMA/NO FUMA).Variable explicadora
(X): es el sexo de la persona (Hombre/Mujer).
b) Es un estudio observacional, ya que sólo se pregunta a las personas por su sexo y
hábito de fumar. No hay ningún tratamiento “impuesto” por el investigador
c) Es un estudio prospectivo, ya que se comienza eligiendo una muestra aleatoria de
hombres y una muestra de mujeres que es la variable exploratoria. Luego se averigua
la proporción de fumadores que es la variable respuesta.
d) La descripción del estudio:“Se toma una muestra aleatoria simple de tamaño 100 de
una población de hombres adultos. Se toma una muestra aleatoria simple de tamaño
120 de una población de mujeres”. Corresponde a un muestreo aleatorio estratificado
por sexo. Primero se dividen en dos estratos, hombres y mujeres, y luego se toman
muestras aleatorias simples de cada estrato. Eso define a un muestreo aleatorio
estratificado por sexo.
Ejercicio 2: Para estudiar el efecto del alcohol en el tiempo de reacción a un estímulo, se
distribuyen aleatoriamente 60 sujetos en dos grupos iguales. Los sujetos de un grupo
consumen una cantidad de alcohol específica, y los sujetos del otro grupo consumen una
bebida no alcohólica. Se miden los tiempos de reacción en segundos para todos los sujetos
antes y después de la bebida.
Solución:
a) La variable respuesta es: el tiempo de reacción a un estímulo en segundos.
b) La variable explicadora es: el grupo o tratamiento (con alcohol/sin alcohol)
c) Este es un estudio experimental porque el investigadora efectivamente impone un
tratamiento a los sujetos (tomar una bebida alcohólica para un grupo y sin alcohol
para el otro).
d) Es un estudio prospectivo por ser un estudio experimental, ya que los investigadores
eligieron la muestra según la variable explicatoria (tratamiento) y averiguaron la
variable respuesta (tiempo de reacción). Un estudio experimental NO puede ser
retrospectivo.

Ejercicio 3- Se aplicó una prueba sobre 10 puntos para analizar la valoración que
tienen de si la población de jóvenes desvinculados del estudio de una localidad. Los
resultados fueron:

8.2 8.96 8.62 7.96 8.82 9 8.51 7.46 8.39 8.56

a) Obtenga una muestra simple aleatoria sin reemplazo de tamaño 4,

b) Estime la puntuación media de la muestra hallada.

c) Estime la desviación estándar de la muestra hallada.

Consideremos la siguiente Tabla de números aleatorios (para una muestra de una


población de menos de mil habitantes).

231 117 070 092


055 433 433 979
148 938 615 373
389 495 313 726
973 367 570 610
213 128 042 302
111 135 020 193
Respuesta

Se recorre la Tabla de números aleatorios por columnas (primeros dos dígitos), salen
23,05, 14,38, 97, 21, 11 y así sucesivamente, como el tamaño de la muestra n=4
entonces escogemos el quinto, séptimo, cuarto y segundo, los restantes se rechazan
por ser mayores que 10 (marcados ya en la Tabla)

SUMA
Xi 8.82 8.51 7.96 8.96 34,25
−−
La media es X = 34.25/4 =8.5625

Sustituyendo en las fórmulas se obtiene:

Xi 8.82 8.51 7.96 8.96 SUMA


(X i
−−
− X )2 0.066 0.0025 0.362 0.157 0.5875
−−
b) X =
∑X i
=
34.25
= 8.5625
n 4

1 −− 1
c) S 2 =
n −1
∑ ( X i − X ) 2 = (0.5875) = 0.20 ⇒ S = 0.44
3
Ejercicio 4-Se aplicó una prueba sobre 10 puntos para analizar la valoración que
tienen de las tele clases la población de jóvenes estudiantes de una localidad. Los
resultados fueron 8,2 7,6 8,2 8,9 8,6 9,2 8,5 7,6 8,6 8,8

a) Obtenga una muestra simple aleatoria con reemplazo de tamaño 6.

b) Para esa muestra de desvinculados estime la media o promedio y la varianza.

Solución:

a) Se recorre la tabla de números aleatorios y quedan seleccionados

05 07 04 02 06 01

b) X i 8,6 8,5 8,9 7,6 9,2 8,2 8,5


(X i
−−
− X )2 0.01 0 0.16 0.81 0.49 0.09 1.56
1 −− 1
S2 =
n −1
∑ ( X i − X ) 2 = (1,56) = 0.312 ⇒ S = 0.56
5

En general, hemos llamado N al tamaño de la población (número de individuos que la


componen, en el caso que sea finita) y n al de la muestra.

- Muestreo aleatorio estratificado

Es el que se utiliza cuando en la población se pueden distinguir varios colectivos


(estratos) cuya presencia queremos reflejar en la muestra. Llamaremos N 1,N 2,N 3,...al
tamaño de los estratos (con N 1+N 2+N 3+,..=N),y n1,n 2 ,n3 ,.., al número de individuos de los
respectivos estratos que hay en la muestra (con n1+n 2+n 3+...=n).
Según el criterio que elijamos para reflejarlos estratos en la muestra, tenemos dos sub-
tipos en este muestreo: con afijación igual (también llamada constante o simple) y con
afijación proporcional.
En el caso de muestreo aleatorio estratificado con afijación igual, no se toma en cuenta
el número de individuos que componen cada estrato, sino que todos tienen la misma
presencia en la muestra. Por ejemplo, si hay 5 estratos, de cada uno se elegirían n/5
individuos para la muestra, independientemente del peso que cada uno de ellos tuviera
en la población. Es decir, n1 = n2 = n3 =...= n/5.
En el caso de muestreo aleatorio estratificado con afijación proporcional, sí se toma en
cuenta el tamaño de cada estrato. Lo que se pretende es que la muestra mantenga, en
su composición, la misma proporción de individuos que cada estrato tenga en la
población. En este caso tendremos:

De n1/N1=n / N, obtenemos n1=(N1.n)/N


De n2/N2=n / N, obtenemos n=(N2.n)/N,y así sucesivamente.
Ejercicio 5: En cierta población habitan 1500 niños y jóvenes, 7500 adultos y 1000
ancianos. Se desea realizar un estudio para conocer el tipo de actividades de ocio que se
desean incluir en el nuevo parque en construcción. Para ello, van a ser encuestados 200
individuos elegidos al azar.
a) Si se utiliza muestreo estratificado con afijación igual, ¿cuál será el tamaño muestral
correspondiente a cada estrato?
b) Si se utiliza muestreo estratificado con afijación proporcional, ¿cuál será el tamaño
muestral correspondiente a cada estrato?
Solución:
El muestreo evidentemente es sin reemplazamiento
(a) En el muestreo estratificado conafijaciónigualdividimoseltotaldelanuestraentre3 (niños,
adultos, ancianos) y tomamos esa cantidad de cada estrato.
Ennuestrocaso200/3= 66’66, como son personas elegimos 66 niños, 67 adultos y 67
ancianos, porque 66+ 67+ 67, (la suma tiene que ser 200 y tenemos que aproximar los
datos).
b) En el muestreo estratificado con afijación proporcional deben considerarse los estratos
formados por niños y jóvenes, adultos y ancianos. El tamaño de cada uno de los estratos
debe ser proporcional a la cantidad de individuos de cada uno de ellos. Así, se tiene que:

Lamuestradebeestarformadapor30niñosyjóvenes, 150 adultos y 20 ancianos elegidos


aleatoriamente entre sus respectivos colectivos.
Muestreo aleatorio sistemático. 5
Se suele utilizar para ahorrar costos, y en este tipo de muestreo es necesario ordenar a los
individuos de la población asignándole de este modo un número ordinal a cada uno.
Dividimos N (tamaño de la población) entre n (tamaño de la muestra), nos da como
resultado un h (llamado coeficiente de elevación), y después elegimos, al azar, uno de los
n primeros individuos de la población, por ejemplo el que ocupa el lugar k, ya partir de ahí
la muestra se iría obteniendo escogiendo individuos de h en h, es decir:
k,k+ h,k+ 2h,k+ 3h,...,k+ (n-1)h.

5 Rubio Luna, G.J. (2012) Muestreo. Tipos de muestreo. Inferencia. IES Francisco Ayala.
Ejercicio 6: Las estaturas de 1200 estudiantes de un centro de educación superior se
distribuyen normalmente con media 1,72 y desviación típica 0,9 m. Si se toman 100 muestras
de 36 estudiantes cada una, se desea calcular:
a) La media y la desviación típica esperada de la distribución muestral de medias.
b) ¿En cuántas muestras se puede esperar una media entre 1,68 y 1,73 m?
c) ¿En cuántas muestras es de esperar que la media sea menor que 0,69 m?
Solución: a) La media y la desviación típica esperada de la distribución muestral de medias
es:
µ = µ = 1,72m σ 0,9 0,9
σ= = = = 0,15m
n 36 6
Por ser el tamaño muestral mayor que 30 aplicamos el teorema central del límite,
que afirma que la distribución muestral de medias se aproxima a una distribución
σ
normal: N(µ; )
n
b) Tipificamos los valores 1,68 y 1,73 según la distribución N (1,72, 0,15), obteniendo.
z1,68 =(1,68 – 1,72)/0,15 = – 0,27 y z1,73 =(1,73 – 1,72)/0,15 = 0,07
La probabilidad de muestras con medias entre 1,68 y 1,73 m es:
p(1,68 ≤ X ≤ 1,73) = p (–0,27 ≤ Z ≤ 0,07) = p(Z ≤ 0,07) – [1 – p(Z ≤ 027)] =
= 0,5279 – (1 – 0,6064) = 0,1343
El número de muestras esperado es 100●0,1343 = 13 muestras, entre esos dos valores
c) Tipificamos el valor 1,69 m que se distribuye según N(1,72, 0,15), obteniendo:
z1,69 =(1,69 – 1,72)/0,15 = – 0,2
La probabilidad de muestras con medias menores que 1’69 m es:
p(Z ≤ – 0,2) = 1 – p(Z ≤ 0,2) = 1 – 0,5793 = 0,4207
El número de muestras esperado en que la media sea menor que 0,69 m es 100 .0,4207 =
42 muestras.
Ejercicio 7: Se ha seleccionado una muestra de 145 estudiantes de pre grado, a los que
se les ha aplicado un test de habilidad. La media y la desviación típica obtenida de la
muestra son 82 y 14, respectivamente. A partir de estos datos, calcula el intervalo en el
cual se hallará la media de población al nivel de confianza del 95%. Calcula el intervalo de
confianza para los mismos datos correspondientes al nivel de confianza del 99%.

Los valores que proporciona la muestra de tamaño n = 145 son: x x = 82 y σ = 14.


La distribución muestral de medias sigue una distribución normal N (µ, σ x ). Como el tamaño
muestral es superior a 100, podemos aproximar la desviación típica de la muestra por la de la
población:
El valor crítico z1-α/2, correspondiente al nivel de confianza 1 – α = 95% es z1-α/2 = 1,96;
Porque p (Z≤ z1-α/2) =1–α/2=1–0,05/2=0,975, mirando en N(0;1) obtenemos z1-α/2=1,96
Sustituyendo y operando, se obtiene:
(82–1,96●1,162;82+1’96 ●1,162)=(79,72; 84,28)
Ejercicio 8: La estatura de los estudiantes de una Facultad presenta una distribución
aproximadamente normal. Para estimar a altura media de la población, fue observada la altura de

30 estudiantes, obteniendo x =175 cm y σ=15 cm. Determine um intervalo de confianza de 99%:

a. Para la media poblacional.


b. Para la varianza.
c. Para la desviación media poblacional.
Solución:

a) Para encontrar el error, utilizamos a fórmula: , pues n ≥ 30 y σ ≅ s .

c= 99%. Entonces ZC= 2,575

n=30

s=15 cm.

El intervalo de confianza está dado por:

175 - 7,05 < µ < 175 + 7,05

167,95 < µ < 182,05

Por tanto, con 99% de confianza, podemos decir que la media poblacional está entre
167,95 cm y 182,05 cm.

b) Para um nível de confianza de 99% (c=0,99) y muestra n=30, tenemos:

Grados de libertad = n-1= 30-1=29. Luego, el valor de =52,336.


Tabla reducida de números aleatorios
Bibliografía:
Danel Ruas, O. O. (2016) Bioestadística para residentes, estudiantes de medicina,
enfermería y ciencias de salud. Disponible en:
https://www.researchgate.net/publication/305466999
Mezquita Morais, C. Escalas de Medida, Estadística Descriptiva e Inferencia Estadística.
Disponible en:
https://www.researchgate.net/publication/242681022
Organización Panamericana de la Salud, Organización Mundial de la Salud. 52º
.Consejo Directivo 65ª Sesión del Comité Regional. Resolución CD52/R11. Protección
Social en Salud. Washington, D. C.: OPS-OMS; 2013 [citado 10 Enero 2014].
Disponible en:

http://www.paho.org/hq/index.php?option=com_docman&task=doc_download&gid=255
91&Itemid=

Rubio Luna, G.J. (2012) Muestreo. Tipos de muestreo. Inferencia. IES Francisco Ayala.

Wiebusch Sindelar, F. C. Et. al.(2014) Teoria e prática em estatística para cursos de


graduação. Editora Univates. Bairro Universitário - Lajeado - RS - Brasil
Direcciones electrónicas en los sítios:

http://Funstats.un.org%2Funsd%2Fpublication%2FseriesM%2Fseriesm_67Rev2s.pdf

https://www.revsaludpublica.sld.cu%2Findex.php%2Fspu%2Farticle%2FviewFile

https://www.paho.org%2Fhq%2Findex.php%3Foption%3Dcom_docman%26task%3Ddo
c_view%26gid%3D15814%26Itemid&usg=AFQjCNG2mZd2vitsHkctLIYO0D6vCDUMsg
&bvm=bv.131783435,d.eWE

https://www.paho.org%2Fhq%2Findex.php%3Foption%3Dcom_docman%26task%3Ddo
c_download

View publication stats

También podría gustarte