Está en la página 1de 58

La Selección de la Muestra y

Métodos de Recolección de Datos


Identificación y
Operacionalización de Variables
MC.MG. Sandro Casavilca Zambrano
• La muestra como todos los elementos que componen la
investigación dependerá de:
• La naturaleza del estudio
• Las capacidades del investigador para acceder a ella
• Los recursos económicos
• El plazo disponible
Recolección
de datos
Población

• Es el conjunto de todos los que concuerdan


con una serie de especificaciones
• Se reconoce principalmente por:
• Criterios geográficos
• Demográficos (Edad, género, estado civil,
etc)
• Psicográficos (Estilo de vida, valores, ingreso
económico, etc)
Población de
Población diana: estudio: Población
Población a la que definida por los Muestra: Sujetos
se desea criterios de realmente
generalizar los selección y estudiados
estudios accesible para el
investigador
La Muestra
• Los parámetros para extraer la
muestra son realizando una
descripción general de las
características de la población
• Para limitar la población del estudio
se deben detallar los criterios de
inclusión y exclusión de las
unidades de análisis
Simplicidad. Los elementos que pertenecen a la
población deben estar definidos en forma clara,
simple y precisa

Principios
fundamentales
Representatividad. Las características relevantes de la
que debe población deben encontrarse en la muestra
cumplir toda
muestra: Comparabilidad. Cuando en un estudio es necesario
contar con dos muestras entre las cuales se desea
establecer alguna diferencia o asociación, es
necesario que ambas no conduzcan a hallazgos
sesgados (sesgo de selección)
Características socio-demográficas

Consideraciones
al definir Características de la enfermedad o
exposición
criterios de
selección
Otras características de importancia (por
ejp: co-morbilidades, limitaciones
fisiológicas o cognitivas, factores de riesgo,
factores ambientales entre otros)
La selección de la muestra

01 02 03
ES NECESARIO HACER UN ES IMPORTANTE PRECISAR LAS DEFINIR LA POBLACIÓN O
DISEÑO DE MUESTREO, DONDE UNIDADES DE ANÁLISIS, POBLACIONES, DETERMINAR
SE DECIDE EL TAMAÑO DE LA TAMBIÉN DENOMINADAS QUE TIPO DE MUESTREO SE
MUESTRA PUES ESTO INFLUYE ELEMENTOS O CASOS REALIZARÁ, CALCULAR EL
EN LA PRECISIÓN DE LOS (PERSONAS, INSTITUCIONES, TAMAÑO MUESTRAL,
RESULTADOS COMUNIDADES, ETC) IDENTIFICAR EL MARCO
POBLACIONAL Y SELECCIONAR
A LOS INDIVIDUOS DE LA
MUESTRA.
Unidad de análisis de muestreo y marco
muestral

Unidad de análisis: Elementos de Unidad de muestreo: Elementos Marco muestral: Listado de cada
la población objetivo de nuestra que nos permiten llegar a las una de las unidades de
investigación unidades de análisis muestreo
Tamaño de la
muestra

• Las muestras de menos de 30 participantes


(pequeñas), se usan en diseños exploratorios
cualitativos y en los estudios de caso
• Las muestras medianas, compuestas por entre 30
y 100 elementos se utilizan en diseños
descriptivos o causales
• Las muestras de más de 100 participantes se
prefieren en diseños cuantitativos descriptivos, en
los cuales se debe usar un muestreo de tipo
probabilistico
• Una muestra grande ayuda a minimizar los
errores de muestreo y hace los resultados
generalizables (La distribución normal se
Estimación del consigue a partir de 100 elementos)
tamaño de la • Una muestra óptima cumple con:
❑Eficiencia
muestra ❑Representatividad
❑Confianza
❑Flexibilidad
Cálculo del tamaño de la muestra:
• Nivel de confianza (grado de certeza o probabilidad, expresado en
porcentaje con el que queremos realizar la estimación de un parámetro)
• Potencia (cuando se comparan grupos, es la probabilidad de que la
hipótesis nula sea aceptada)
• Varianza de la variante
• Margen de Error (en algunos textos figura precisión)

• n=(Nivel de Confianza+Potencia) x Varianza


Margen de error
Estimación del tamaño de la muestra (Cont)
• N: Tamaño muestral
• k : Constante que depende del nivel de
• Si el Universo supera los 100 000 elementos el confianza asignado (z)
tamaño suficiente de muestra será 370
• Si el universo es menor se aplicaran formulas para • E : Error máximo aceptable (Mayormente 5%)
calcular el tamaño representativo, con ayuda de algún
programa estadístico • p : Porcentaje de probabilidad que el
• Un análisis estadístico óptimo debería llegar a 350
unidades muestrales
fenómeno ocurra (representatividad). Por lo
general se asume un 50%
• q : Porcentaje de probabilidad que el
fenómeno no ocurra (no representatividad).
Por lo general se asume un 50%
• Z : Nivel deseado de confianza, depende del
error máximo elegido. Si eligio 5%, el nivel de
confianza será de 95%
Formula
Criterios de Bradford Hill
De validez interna (propios del estudio)

• Fuerza de asociación: A mayor intensidad de la relación entre dos variables,


mayor es la probabilidad de que exista una relación.
• Secuencia temporal: Aunque en ocasiones es difícil establecerlo, la causa debe
preceder al efecto. Es el único criterio considerado por algunos autores como
condición sine qua non.
• Efecto dosis-respuesta: Cuanto mayor es el tiempo y/o dosis de exposición al
factor causal, mayor es el riesgo de enfermedad.
De coherencia científica

• Consistencia: Los resultados de un estudio deben mantenerse constantes y ser


reproducibles por cualquier investigador en cualquier lugar.
• Plausibilidad biológica: La relación causal sugerida debe mantener la línea de
los principios científicos aceptados en el momento, es decir, creemos más en
una relación causal si conocemos su mecanismo patogénico.

• Especificidad de asociación y analogía: Cierta especificidad (una causa


conduce a un único efecto) aumenta la verosimilitud de la relación causal. Con
analogía, nos referimos a que asociaciones causales similares pueden producir
enfermedades similares.
• Evidencia experimental: No siempre es posible realizar el estudio necesario,
pero es la prueba más sólida de causalidad. En el caso de que no se pueda
acceder a un ensayo clínico, hay quienes lo interpretan este punto en el sentido
de que si un factor produce un efecto, éste debería cesar cuando desaparece el
factor.
Sesgos (Biais)
• Si se obtienen datos incorrectos por una muestra mal
elegida, sus inferencias serán equivocadas. El sesgo
sistemático ocurre:
• Cuando no se identifica correctamente el marco muestral
• Los instrumentos de medición están mal elaborados o no se
han construido satisfactoriamente
• Los elementos muestrales son insuficientes
• Los participantes cambian su comportamiento natural
debido a la evaluación
• Otros
Los pasos
esenciales para
establecer una
relación causal en
un estudio
epidemiológico
Validez interna:
Noción de
sesgos
El sesgo sistemático no se
elimina por aumentar la
cantidad de elementos de la
muestra
• Errores de selección:
• Desestimar o no incluir casos que
deberían ser parte de la muestra
• Incluir casos que no deberían estar
porque no forman parte de la
población
• Seleccionar casos que son
verdaderamente inelegibles
Ejemplo:
• En un estudio de casos y controles en mujeres,
el método utilizado fue el contacto telefónico
para seleccionar los controles; esto lleva a la
exclusión del estudio de una parte de la
población que no dispone de teléfono. Así,
puede existir un sesgo de selección si las
mujeres con y sin teléfono tienen diferencias
en la exposición (o exposiciones) estudiadas.
Este sesgo podría superarse excluyendo los
casos que no tienen teléfono y, por tanto,
redefiniendo la población de estudio (mujeres
con teléfono, de 20 a 54 años, que residen en
las ocho regiones seleccionadas).
Sesgo de medición (o información)

• El sesgo de información es una distorsión en


la estimación del efecto, debido a un error de
medición o clasificación errónea de los
sujetos según una o más variables.
• Este sesgo surge cuando las medidas o
clasificaciones de enfermedad o exposición
no son válidas (es decir, cuando no miden
correctamente lo que se supone deben medir.
• Los errores de medición pueden ser
introducidos por el observador (sesgo del
observador), por el individuo estudiado
(sesgo de respuesta) o por los instrumentos
(por ejemplo, un cuestionario o tensiómetro o
pruebas de laboratorio) utilizados para
realizar las medidas.
Ilustracion de la
relación entre
exposición,
enfermedad y
factor de
confusión
Trascendencia
• A nivel de protocolo • A nivel de análisis
- Motivo principal de los estudios de - Ajuste y modelado (confusión)
planificación - De otros sesgos (demasiado tarde, con mayor
- Definición de criterios y modalidades de frecuencia)
selección
- Definición de criterios y métodos de medición
- Medición y control de factores de confusión
- Importancia de la vigilancia y el seguimiento
- Importancia de los estudios piloto y la
validación de herramientas
Métodos de
muestreo

• Se pueden emplear dos


clases de métodos de
muestreo:
• Muestreos probabilísticos
• Muestreos no
probabilísticos
• Cualquier elemento tiene la misma probabilidad
de ser elegido. La selección se hace de forma
aleatoria o mecánica. Cada elección es
independiente
• Es la más adecuada para identificar índices y
Muestreos definir poblaciones
• Método de muestreo típico en investigaciones
probabilísticos cuantitativas, descriptivas y correlacionales
• La muestra probabilística permite regularidad
estadística
• La principal ventaja del muestreo probabilístico
es la posibilidad de minimizar el error estándar
Cada elemento del marco muestral tiene la
misma probabilidad de ser seleccionado

Requiere un marco muestral completo


Muestreo
aleatorio
simple Al tener el tamaño de la muestra, se
seleccionarán los elementos mediante cualquier
procedimiento que haga la selección al azar

Generalmente la selección se hace sin reemplazo


Todos los elementos tienen la
misma probabilidad de selección:
Muestreo n/N
aleatorio
simple. Los cálculos matemáticos son
Ventajas: sencillos (los programas estadísticos
por lo general asumen que se trata
con una muestra obtenida mediante
este procedimiento)
Primero se clasifica los elementos de la
población en sub grupos (estratos)

En cada estrato se selecciona una muestra


aleatoria simple, tomando al menos un
Muestreo elemento de cada estrato

estratificado Los estratos deben ser mutuamente


excluyentes y en su conjunto se corresponden a
toda la población

Los estratos pueden reflejar distintos grupos de


edad, diferente grado de exposición, nivel
socio-económico, etc
Ventajas:

La estimación final del parámetro puede tener


un error menor al obtenido para una muestra
Muestreo aleatoria simple de similar tamaño

estratificado Permite estimar los parámetros para cada


estrato y para la población total

Asegura la participación de todos los estratos


Desventajas:

Mayor complejidad en los cálculos


Muestreo
estratificado Se necesita un marco muestral detallado
para cada estrato

Los criterios para conformar los estratos


podrían ser operativamente difíciles
(trabajo de campo)
• La afijación es la distribución de la muestra en
función de los diferentes estratos. Puede ser:
• Uniforme (muestra de igual tamaño en cada
Muestreo estrato)
• Proporcional (muestra proporcional al tamaño
estratificado: del estrato)
Afijación • De Neyman (muestra en función a la varianza y
tamaño del estrato)
• Óptima (muestra en función al costo, varianza y
tamaño del estrato)
Muestreo por
conglomerados
Muestreo por Ventajas:
conglomerados • Disminución en los costos del
trabajo de campo
• Poder trabajar en ausencia
de listados muy complejos
Desventajas:

Complicación de los calculos para la


estimación de los parámetros
Muestreo por
conglomerados Si no se incluyen en el estudio a todos los
individuos de cada conglomerado se
puede generar un sesgo

Es un método menos preciso y requiere


muestras de mayor tamaño
Permite seleccionar la muestra deseada
al seleccionar aleatoriamente un
elemento de los primeros k elementos en
el marco muestral y después de cada k-
ésimo elemento hasta completar los n
necesarios
Muestreo
sistemático
Se incorpora un criterio importante
respecto al muestreo aleatorio simple: el
orden establecido previamente por el
investigador. Con esto se gana
representatividad
Por cuota: Se seleccionan unidades de
estudio de cada uno de los grupos que
componen la población en una cuota
predeterminada
Muestreo no
probabilístico Por bola de nieve: Se selecciona un
grupo inicial de entrevistados, por lo
general en forma aleatoria, después de la
entrevista se pide a los participantes que
identifiquen a otros que pertenecen a la
población objetivo
Por conveniencia (a criterio): Se
seleccionan a las unidades de estudio que
se encuentren disponibles al momento de
la recolección de datos
Muestreo no
probabilístico Por casos consecutivos: Consiste en
elegir a cada paciente que cumpla con los
criterios de selección, dentro de un
intervalo de tiempo específico o hasta
alcanzar un número definido de pacientes
En la práctica, cuando se hace investigaciones de
base poblacional donde se requiere
representatividad a nivel de país o grandes
divisiones administrativas, el muestreo se realiza
combinando los diseños muestrales básicos
Muestreo descritos

multietápico
Se hace una primera división en unidades
o poli-etápico primarias de muestreo (UPM), luego en cada
UPM se divide la población en unidades
secundarias de muestreo (USM) y de ser
necesario así sucesivamente hasta llegar en una
última etapa a los elementos o unidades de
análisis
FORMULACION DEL PROBLEMA

FORMULACION DE LOS
OBJETIVOS
Proceso de
Investigación
CONSTRUCCION DE LA
HIPOTESIS

OPERACIONALIZACION DE
VARIABLES
La variable es determinada característica o propiedad del objeto de estudio,
a la cual se observa y/o cuantifica en la investigación y que puede variar de
un elemento a otro

Por su naturaleza, las variables pueden ser cuantitativa, cuando es posible


una medición en función de magnitud, extensión o cantidad y cualitativas
cuando se distinguen en ella cualidades: Ejemplos: Dolor: Poco dolor/
Variable, Mucho dolor.

Variables dicotómicas son las que tienen dos valores como el sexo:
conceptos hombre/ mujer; el rendimiento: aprobado/desaprobado.

Variables que tienen tres valores serán tricotómicas como la Talla:


básicos alta/mediana/baja.

Las variables tetratómicas son las que tienen cuatro valores: estado civil:
casado, soltero, viudo, divorciado.

Las variables politómicas tienen varios valores como la creencia religiosa:


católica, protestante, budista, taoísta, etc.
¿ Donde identificamos a las variables en un
estudio de investigación?

1 2 3
En el problema El Objetivo: Se La Hipótesis: Se
aparecen las formulan en función formula en relación
variables principales a las variables a las variables
Las variables pueden establecer
relaciones que no son causales, pero si
pueden establecer variaciones
conjuntas o covariaciones:

Clasificación
de las
Variables Correlaciones: directas, inversas

Relación NO
CAUSAL
Asociativas: asociación sin relación de
dependencia
Según RELACIÓN CAUSAL

Independiente Dependiente
CAUSA EFECTO

Interviniente Condicionante
CONFUSORA INDISPENSABLE
• Variable Independiente (VI).- Es relativamente
autónoma, viene a ser el factor determinante o
Relación que causa que explica un fenómeno.
se establecen • Variable Dependiente (VD).- Su existencia y
desenvolvimiento depende de la
en las mismas independiente. Viene a ser el efecto o aspecto
determinado.
variables • Ejm:
(causa – • VI = Bajo desarrollo neuromotor (V.
Independiente)
efecto) • VD = Bajo rendimiento académico (V.
Dependiente
(Cont)

• Variable Interviniente (Vi).- Variable que especifica las condiciones o


requisitos para que las variables independiente y dependiente tomen sus
correspondientes valores.
• Ejemplo:
• La escasa educación nutricional (independiente) en la población, genera
mayor desnutrición infantil (dependiente) en las familias de bajo nivel de
instrucción (interviniente).
• CUANTITATIVA
• Discreta (Contar). Ejplo: Tasa de natalidad
Según su • Continua (Medir). Ejplo: Peso, talla, etc
Naturaleza
• CUALITATIVA
• Ejplo: Sexo, Estado civil, etc
Clasificación de las Variables según su
NATURALEZA

Cuantitativas:

Son aquellas cuyos valores del dominio de variación son contadas o medidas.

• Pueden ser:

– Discretas

– Continuas
Discreta:

– Cuando los valores del


dominio de variación son
contados.
– Por lo tanto, sólo pueden
asumir valores enteros.
• Ejemplo:
• Número de alumnos: 35
alumnos ,
• Número de Hijos: 3
CONTINUA

• Cuando los valores del dominio


de variación son susceptibles de
ser medidos.
• – Pueden asumir valores
decimales.
• Ejemplo:
• Peso: 60.5 Kg, 70.4 Kg
• Talla: 1.60 mt., 1.65 mts
• Son aquellas que sólo pueden ser expresadas
en términos cualitativos, -no numéricos-
estableciendo categorías, niveles, jerarquías,
Cualitativas o etc.
categorías no – Ejemplo: Lugar de residencia , sexo

Métricas: Pueden ser :


• Nominales y
• Ordinales
NOMINAL

• Este nivel sólo permite clasificar,


es decir, la única relación existente
entre los objetos a los cuales se les
ha asignado un número es una
relación de equivalencia.
• Ejm.: Sexo.
Variables Estadísticas
• ORDINAL
• Permite clasificar además ordenar, es
decir, establecer una secuencia
lógica que mide la intensidad del
atributo.
• Ejemplo.:
• – Grado de aprendizaje: bueno, malo
y deficiente
ESCALAS DE MEDICION

Nominal
Ordinal (Grado
CUALITATIVA (Sexo, Estado
de educación)
civil)

- Numérica
CUANTITATIVA (Peso, talla,
glicemia)
INTERVALAR:
• Permite clasificar y ordenar, pero los intervalos
son iguales.
Escalas de • En este nivel de medición no solo es posible
ordenar las escalas sino que es posible conocer
Medición las distancias o grados que separan unas de
NUMÉRICA otras.
- Ejemplos:
• Temperatura, rendimiento académico,
coeficiente intelectual.
• Posee las propiedades anteriores como
clasificar, ordenar y los intervalos son iguales;
pero además, existe el “cero absoluto o
verdadero”.
DE RAZÓN O • Es decir que, si un objeto que se está midiendo
PROPORCIÓN: tiene el valor cero, ese objeto no posee la
propiedad o atributo que se está midiendo:
- Ejemplo :
• Peso, talla
INDICADORES

1 2 3
Son las Componentes o Deben ser medibles
subdimensiones de índices del hecho u observables
las variables que se estudia
Operacionalización de variables
Gracias

También podría gustarte