Está en la página 1de 34

BIOESTADÍSTICA

Es de las áreas de la estadística que trata principalmente con las ciencias biológicas y las
disciplinas relacionada con la medicina y la salud.

VARIABLE
Es una propiedad que puede variar y cuya variación es susceptible de medirse y describe
una característica que puede variar de un sujeto a otro , se aplica a un grupo de personas
u objetos, los cuales pueden adquirir diversos valores respecto de ella.
Tipos de variables:

 Variable cualitativa

Son aquellas que representan una cualidad o atributo que clasifica a cada caso.
Ejemplos: sexo (varón o hembra); color de os ojos (azul, negro, marrón...).

 Variable cuantitativa

Es cuantitativa o numérica cuando expresa un carácter mediante un número real.


Ejemplos: talla (1.56, 1.53….); edad (23; 22…).

Pueden ser de dos tipos:

 Variable cuantitativa continua: Admiten cualquier valor intermedio dentro


de un intervalo numéricos determinados (edad, peso, talla).

 Variable cuantitativa discreta: No admiten valores intermedios en un


rango, suele tomarse valores enteros (número de hijo, número de
hermanos).

ESCALAS DE MEDICIÓN

La medición es un proceso inherente y consustancial a toda investigación, sea ésta cualitativa


o cuantitativa. Medimos principalmente variables y ello demanda considerar tres elementos
básicos: el instrumento de medición, la escala de medición y el sistema de unidades de
medición.

Una escala de medición es el conjunto de los posibles valores que una cierta variable puede
tomar. Es un continuo de valores ordenados correlativamente, que admite un punto inicial
y otro final.
Las escalas o niveles de medición se utilizan para medir variables o atributos. Por lo
general, se distinguen cuatro escalas o niveles de medición: nominal, ordinal, intervalos y
razón. Las dos primeras (nominal y ordinal) se conocen como escalas categóricas, y las
dos últimas (intervalo y razón) como escalas numéricas. Las escalas categóricas se usan
comúnmente para variables cualitativas, mientras que las numéricas son adecuadas para
la medición de variables cuantitativas.

 ESCALA NOMINAL: Es la escala más elemental y la forma más rudimentaria de


medir. Como su nombre lo dice “nominal” se refiere a nombre o etiqueta. En una
escala como estas se clasifica a las unidades de estudio (objetos, personas, etc.)
en categorías, basándose en una o más características, atributos o propiedades
distintivas y observadas, dándole a cada categoría un nombre.

Ejemplos:

• Sexo: masculino – femenino.


• Clasificación de los estudiantes por carreras (Administración – 1; Sistemas – 2;
Electrónica – 3; Derecho – 4; etc.).
• Nacionalidad (colombiano, ruso, italiano, senegalés, etc.).
• Uso de anteojos (normales, bifocales, lentes de contacto, transición, etc.).
• Número de camiseta de los jugadores en un equipo de fútbol (1, 2, 3,…, 20).

 ESCALA ORDINAL: Se logra cuando las observaciones pueden colocarse en un


orden relativo con respecto a la característica que se evalúa, es decir, las categorías
de datos están clasificadas u ordenadas de acuerdo con la característica especial
que poseen. Aquí, las etiquetas o símbolos de las categorías sí indican jerarquía.

Ejemplos:

 Notas escolares cualitativas (I - insuficiente; A - aceptable; B bueno; S -


sobresaliente; E - excelente).
 Rangos militares (recluta, dragoneante, cabo, sargento, teniente, etc.).
 Asignación del orden de atención según llegada de pacientes a consulta
médica (primer turno, segundo turno, tercer turno, etc.).
 Grado de escolaridad (primaria, bachillerato, técnico profesional, tecnólogo,
universitario, etc.).

 ESCALA DE INTERVALOS: Son más refinadas puesto que además del orden o
jerarquía entre categorías, las etiquetas o números consecutivos establecen
intervalos iguales en la medición. La medición en una escala de intervalos se basa
en suponer que puede conocerse exactamente la diferencia entre los objetos
medidos según esta escala. El inicio de la escala (0) es arbitrario convencional.

Ejemplos:
 Lapsos de tiempo transcurridos entre 1995-1999 y 2000-2004.
 Escalas de los test psicológicos.
 Temperatura del cuerpo humano.

 ESCALA DE RAZÓN: Estas escalas tienen las propiedades de las ordinales y de


intervalo además, el cero es real, es absoluto, no es arbitrario. Es decir, el cero
representa la ausencia de la característica en cuestión; en consecuencia, los
números pueden compararse como proporciones y nos permite indicar cuántas
veces es más grande un objeto que otro, además de señalar la cantidad en que
difieren.
Ejemplos:

 Número de hijos en una familia.


• Medición magnitudes físicas como: longitud, masa, intensidad de corriente,
peso, velocidad, etc.
• Estatura de las personas.
• Litros de agua consumidos por persona al día.
• Velocidad de un auto de carreras.
• Número de goles marcados por un jugador en un partido.
• Longitud, masa, intensidad de corriente eléctrica.
• Nivel de productividad.

CUADRO DE VARIABLES
VARIABLES TIPO ESCALA INTERPRETACIÓN
Servicio Cualitativo Nominal No existe ningún orden o
hospitalario. (nominal) categoría solo
nombraríamos los servicios
que existen como
medicina, pediatría.
Agentes causantes Cualitativo Nominal No hay una jerarquización
de alergia: físicas o (nominal) entre agentes físicos o
químicas. químicos.
Tipo de parto. Cualitativo Nominal Pues solo se nombra para
(nominal) diferenciar uno del otro si
es eutócico o distócico.
Temperatura del Cuantitativo Intervalo Porque la temperatura
polo Ártico. (continua ) puede tomar valores
inferiores al 0 C°, lo que no
indica ausencia de valor.
Células sexuales. Cualitativo Nominal Porque no existe un orden
(nominal) entre óvulo y
espermatozoide.
Peso de niños al Cuantitativo Razón Porque no existe el cero
nacer. (continua ) arbitrario respecto al peso,
no tiene valor alguno.
PH de la orina. Cuantitativo Intervalo El pH de la orina de la
(continua) persona se puede
encontrar en un intervalo
de 0 -14 que puede ser de
ácido hasta alcalino sin
embargo los niveles
normales son desde 4.5 a
8.0.
Valor en glucosa en Cuantitativo Razón Porque no existirá un
sangre de 20 niños. (continua) persona de no tenga
glucosa en sangre.
Nivel de Cualitativo Ordinal Porque se puede
conocimiento de un (ordinal ) jerarquizar como: nivel alto,
niño. nivel intermedio y bajo.
Colesterol en sangre Cuantitativo Razón Los niveles de colesterol
de una persona. (continua) en sangre no pueden ser
menor a cero.
Grado de Cualitativo Ordinal Se puede establecer un
desnutrición. (Ordinal) orden: leve, moderado,
grave.
Nivel de pobreza. Cualitativo Ordinal Porque existe una
(ordinal) jerarquización: alto, medio,
bajo.
Velocidad de felinos. Cuantitativo Razón Porque el cero significaría
(discreta) ausencia de velocidad, no
tiene valor alguno.

Número de cachorro Cuantitativo Razón Porque al presentar un


de un perro. (discreta) cero absoluto lo que
indicaría la ausencia de
cachorros.
Nivel educativo. Cualitativa Ordinal Porque se puede clasificar
(ordinal) desde muy bueno, bueno,
regular, mal, muy mal.
Nacionalidad Cualitativo Nominal Solo se puede decir que
(nominal) tiene nacionalidad
peruana, argentina y
chilena no existe un orden
especifico.
Pronóstico medico Cualitativo Ordinal Siento el pronóstico
de salud (ordinal) medico en la salud del
paciente podemos
ordenarlo según el grado
de una salud optima,
medianamente saludable,
saludable, poco saludable
y no saludable.
Estado de gravedad Cualitativo Ordinal El estado de gravedad se
(ordinal) puede ordenar de acuerdo
a leve, moderada y
severa.
Punto de fusión del Cuantitativo Intervalo Se puedes considerar el
agua (continua) cero arbitrario.
N° de accidentes de Cuantitativo Razón Porque el número de
tránsito en 3 (discreta) accidentes partiría del cero
semanas absoluto lo que significaría
la ausencia de este.
DISTRIBUCION DE FRECUENCIAS

Es la agrupación de datos en categorías que indican el número de observaciones. Esto


proporciona un valor añadido a la agrupación de datos.
Para realizar la agrupación de datos tenemos que tener en cuenta:

1) Toma de decisiones (recopilación )

Ejemplo:
Niveles de LDL – colesterol en pacientes del Hospital Regional Honorio Delgado
Espinoza 2016.

68 22 36 12 16 23
63 23 42 32 24 19
42 24 28 49 69 46
26 25 31 38 47 30
30 44 28 42 23 43
36 65 25 27 22 49
28 43 45 31 43 12
32 25 12 50 27 10
79 74 57 38 49 45
27 51 51 21 26 55

n = muestra
N = población

2) Ordenamiento

a) Variable : LDL – colesterol (mg/dl)


Tipo: cuantitativa – discontinua (discreta)
Escala: Razón

b) Rango : R = V máximo - V mínimo


R = 79 - 10 + 1 cuando es discontinua

c) Número de clase (K)


K = 1 + 3.32 log (n) número de casos
K = 1 + 3.32 log (60)
K = 6.19 ~ 7

d) Intervalo de clase
𝑅 70
I.C =
𝐾
= 7
=10
e) Construir en cuadro D.F.

CUADRO N°1 D.F. PARA NIVELES DE LDL EN PACIENTES DEL HOSPITAL REGIONAL "HONORIO DELGADO ESPINOZA".
INTERVALO DE LIMITES DE
K CLASE INTERVALOS REAL Xi Fa Fr F% Fa ACUMULADA Fr ACUMULADA F% ACUMULADA
1 10 – 19 9.5 - 19,5 14. 5 6 0.1 10 6 0.1 10
2 20 – 29 19.5 - 29,5 24.5 19 0.3167 31.67 25 0.4167 41.67
3 30 – 39 29.5 - 39,5 34.5 10 0.1667 16.67 35 0.5834 58.34
4 40 – 49 39.5 - 49,5 44.5 14 0.2333 23.33 49 0.8167 81.67
5 50 – 59 49.5 - 59,5 54.5 5 0.0833 8.33 54 0.9 90
6 60 – 69 59.5 - 69,5 64.5 4 0.0667 6.67 58 0.9667 96.67
7 70 - 79 69.5 - 79,5 74.5 2 0.0333 3.33 60 1 100
60 1 100

 Xi: PROMEDIO DE INTERVALO DE CLASE

𝐿𝑖 + 𝐿𝑠
Xi =
2
 Fa: FRECUENCIA ABSOLUTA (CONTEO DE DATOS)
 Fr: FRECUENCIA RELATIVA

𝑭𝒊
Fr:
𝒏

GRAFICAS PARA VARIABLE CUANTITATIVA


1) HISTOGRAMA: Es una representación de datos, generalmente numéricos se
emplea para ilustrar muestras agrupadas en intervalo .Esta formados por
rectángulos unidos a otros, el centro de cada intervalo es la marca de clase. En
la gráfica se utilizan el promedio de clase (Xi) o el intervalo de clase (I.C) en el
eje de las abscisas y la frecuencia absoluta (Fa) o porcentual (%F) en el eje de
las ordenadas.

20 19
18
16
14
14
12
10
10
8
6
6 5
4
4
2
2
0
14. 5 24.5 34.5 44.5 54.5 64.5 74.5
INTERPRETACIÓN:

• A 6 pacientes del hospital regional “Honorio Delgado Espinoza” tiene un promedio de


14.5 mg/dl de colesterol.
• La mayoría de pacientes que del hospital regional “Honorio Delgado Espinoza” tiene un
promedio de 24.5 mg/dl de colesterol.
• A 10 pacientes del hospital regional “Honorio Delgado Espinoza” tienen un promedio de
34.5 mg /dl de colesterol.
• La menor cantidad de paciente de hospital regional “Honorio Delgado Espinoza” tienen
el mayor promedio de niveles de colesterol que es de 74.5 mg/dl.

2) POLÍGONO: Se construyen de manera similar a los histogramas, excepto que


en lugar de poner una barra sobre cada intervalo, se coloca puntos a la altura
apropiada del eje Y.

GRAFICA N° 2 Distribución de LDL -


Colesterol (mg/dl) en pacientes del
HDHDE 2016
35
31.67
30

25
23.33
20
16.67
15

10 10
8.33
6.67
5
3.33
0
14. 5 24.5 34.5 44.5 54.5 64.5 74.5

INTERPRETACIÓN:

• El 10 % de los pacientes del hospital regional “Honorio Delgado Espinoza” tiene un


promedio de 14.5 mg/dl de colesterol.
• La mayoría de paciente del hospital regional “Honorio Delgado Espinoza “que
representa el 31.67 % tiene un promedio de 24.5 mg/dl de colesterol.
• El 16.67 % de los pacientes del hospital “Honorio Delgado Espinoza” tiene un
promedio de 34.5 mg/dl de colesterol.
• El mayor promedio en los niveles de colesterol se encuentra en un 3.33% de
pacientes con 74.5 mg/dl.
3) OJIVA: Es un polígono frecuencial acumulado, es decir, que permite ver cuantas
observaciones se encuentran por encima o debajo de ciertos valores.

GRAFICA N° 3 Distribución de LDL - Colesterol en


pacientes (mg/dl) del HDHDE 2016
70

60 60
58
54
50 49

40
35
30
25
20

10
6
0
14. 5 24.5 34.5 44.5 54.5 64.5 74.5

Interpretación:

 Más de la mitad de pacientes que es 35, tiene niveles de colesterol entre 14.5 a 34.5
mg/dl.
• El total de paciente 60 del hospital regional “Honorio Delgado Espinoza” el niveles de
colesterol están entre 14.5 a 74.5 mg/dl.
PROCESO DE DATOS PARA VARIABLES CUALITATIVAS
 EJEMPLO :

Sexo de los estudiantes del curso de bioestadística 2017 – IB de la escuela


profesional de biología UNSA.

OPERACIONALIZACION DE VARIABLES
VARIABLE INDICADOR TIPO ESCALA
sexo femenino cualitativo nominal
masculino

F F F F
F F F
M F M
F M F
F F F
M F F
M F F
M M F
F M F
F F F
F M M

 Construir en cuadro D.F.

TABLA N° 2 DISTRIBUCIÓN POR SEXO EN ESTUDIANTES DE BIOESTADÍSTICA


2017 - IB ESCUELA DE BIOLOGIA - UNSA
SEXO N° %
Masculino 10 29.41
Femenino 24 70.59
34 100

GRAFICAS PARA VARIABLE CUALITATIVAS

a) BARRAS: Se usa cuando se pretende resaltar la presentación de porcentajes de


datos cualitativos, también es una forma de representar frecuencias; las frecuencias
están asociados con categorías.
GRÁFICO N°1.DISTRIBUCIÓN POR SEXO EN
ESTUDIANTES EN EL CURSO DE BIOESTADÍSTICA 2017-1
(B). ESCUELA PROFESIONAL DE BIOLOGÍA -U.N.S.A.
30

25

20

15

10

0
Masculino Femenino

b) SECTORES: Se utiliza para representar porcentajes y proporciones.

GRÁFICO N °2. DISTRIBUCIÓN POR SEXO EN


ESTUDIANTES EN EL CURSO DE
BIOESTADÍSTICA 2017 -1 (B). ESCUELA
PROFESIONAL DE BIOLOGÍA -UNSA

29%

71%

Masculino Femenino
ESTADÍSTICA DESCRIPTIVA

Estadísticos muéstrales

1. MEDIDA DE TENDENCIA CENTRAL:


 Media (promedio).
 Mediana.
 Moda.

2. MEDIDA DE POSICIÓN:
 Quartiles.
 Deciles.
 Porcentiles.

3. MEDIDA DE DISPERSIÓN:
 Rango.
 Varianza.
 Desviación estadística.

1.- MEDIDA DE TENDENCIA CENTRAL:

 Es el valor central en sentido aritmético. Se obtiene sumando los n


Media (promedio):
datos de la muestra y dividiéndolos por el tamaño.

∑ 𝑋𝑖 𝑓𝑖
Me =
𝑛

EJEMPLO:

 Datos no acumulados
 Datos agrupados
Número de costillas en Raymondi Arequipensis.
n = 6 cactus.

Variable = Número de costillas.


Cuantitativa - discontinua - razón
X: 7 – 6 – 8 – 5 – 6 – 5 = 37

Me = Ordenar de menor a mayor Me = 6 + 6 = 6


2
5, 5, 6, 6, 7, 8
Xi Fi Xi Fi
5 2 10
6 2 12
7 1 7
8 1 8
26 6 37

ESTADÍSTICA DE MUESTREO

Ẋ = Σ Xi / n

Ẋ = 37 / 6 Xi = Valor de la variable.
n = Numero de muestras.
Ẋ = 6,17 ≈ 6

a) Parámetros Poblacionales.

µ = Σ Xi /
N
Xi = Valor de la variable.
µ = 10.86 / 7 N = Numero poblacional.

 Mediana:

1,00 – 1,15 – 1,15 – 1,16 – 1,8 – 2,1 – 2,5


Md = 1,16 ppm

Moda: Valor que se repite con mayor frecuencia.


 Unimodal.
 Bimodal.
 Polimodal.

Moda = Mediana = Moda


Distribución simétrica.

Media datos agrupados


 Variable: Niveles de LDL – colesterol mg / dl
 Cuantitativa, continua, razón.

IC Xi Fi Xi Fi
Ẋ = Σ Xi Fi / Σ Fi
10 – 19 14,5 6 87
Ẋ = 2200 / 60
20 – 29 24,5 19 465,5
30 – 39 34,5 10 345 Ẋ = 36,67 Media

40 – 49 44,5 14 623
50 – 59 54,5 5 272,5
60 – 69 64,5 4 258
70 – 79 74,5 2 149 Xi = Valor
central.

 La mediana es generalmente ordinal. Fi =


Frecuencia
absoluta.
TEORÍA DEL MUESTREO
INTRODUCCIÓN AL MUESTREO: POBLACIÓN, MUESTRAS Y TIPOS

POBLACIÓN:

Es la colección de datos que corresponde a las características de la totalidad de individuos,


objetos, cosas o valores en un proceso de investigación.

Para su estudio, en general se clasifican en Poblaciones Finitas y Poblaciones Infinitas.

(Una población panmíctica es uno donde todos los individuos son socios potenciales. Esto supone
que no hay restricciones de apareamiento, ni genéticas ni de comportamiento , a la población, y
que por lo tanto toda la recombinación es posible- que pueden cruzarse entre sí)

MUESTRA:

Muestra: “Es una parte representativa de la población que es seleccionada para ser estudiada, ya
que la población es demasiado grande para ser estudiada en su totalidad” Allen Webster.

Parámetro: Son las medidas o características descriptivas inherentes a las poblaciones. Los
salarios promedio de todos los empleados de una empresa, puede ser un ejemplo de
parámetro.

Estadístico o Estadígrafo: Son las medidas descriptivas inherentes a una muestra, las cuales
pueden usarse como estimación del parámetro. Como ejemplo podría tomarse los salarios
promedio de una muestra de los empleados de la empresa.
MUESTREO:

En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos los elementos
de una población), se selecciona una muestra, entendiendo por tal una parte representativa de la
población.

El muestreo es por lo tanto una herramienta de la investigación científica, cuya función básica es
determinar que parte de una población debe examinarse, con la finalidad de hacer inferencias
sobre dicha población.

La muestra debe lograr una representación adecuada de la población, en la que se reproduzca de


la mejor manera los rasgos esenciales de dicha población que son importantes para la
investigación. Para que una muestra sea representativa, y por lo tanto útil, debe de reflejar las
similitudes y diferencias encontradas en la población, es decir ejemplificar las características de
ésta.

TIPOS DE MUESTREO:

Existen diferentes criterios de clasificación de los diferentes tipos de muestreo, aunque en general
pueden dividirse en dos grandes grupos: métodos de muestreo probabilísticos y métodos de
muestreo no probabilísticos.
MUESTREO ALEATORIO SIMPLE

MUESTREO ALEATORIO SISTEMÁTICO

MUESTREO ALEATORIO ESTRATIFICADO

MUESTREO
MUESTREO ALEATORIO POR CONGLOMERADOS
PROBABILÍSTICO

MUESTREO POR CUOTAS


MUESTREO NO
PROBABILÍSTICO
MUESTREO INTENCIONAL O DE CONVENIENCIA

MUESTREO BOLA DE NIEVE

MUESTREO DISCRECIONAL
I. MUESTREO PROBABILÍSTICO
Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de
equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad
de ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles
muestras de tamaño n tienen la misma probabilidad de ser seleccionadas. Sólo estos métodos de
muestreo probabilísticos nos aseguran la representatividad de la muestra extraída y son, por
tanto, los más recomendables. Dentro de los métodos de muestreo probabilísticos encontramos
los siguientes tipos:

A) MUESTREO ALEATORIO
SIMPLE

El procedimiento empleado es el siguiente: 1) se asigna un número a cada individuo de la


población y 2) a través de algún medio mecánico (bolas dentro de una bolsa, tablas de números
aleatorios, números aleatorios generados con una calculadora u ordenador, etc.) se eligen tantos
sujetos como sea necesario para completar el tamaño de muestra requerido.

Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad práctica cuando la
población que estamos manejando es muy grande.

𝟐𝟓𝟎
𝑷 = 𝟏𝟓𝟎𝟎 = 0.25 ------------ 25%

*Sorteo
*Tabla de números aleatorios
Ejemplo:
Estudio de casos de cáncer en cuello uterino en pacientes del H.R.H.D.E año
2000 a 2010
P: Historias Clínicas pacientes atendidos por el servicio de
cáncer del H.R.H.D.E.
N=2000
H.C

A.1) TABLA DE NÚMEROS ALEATORIOS

Año Mes Día Paciente 2001, Agosto 15 paciente 150


02 08 05 150

A.2) MUESTREO AL AZAR (POR SORTEO)

Empresa: Control calidad alimentos


Lotes:

L =500
Caja =300
Conserva =20
Muestreo
n=10
V.I= conservas
Lote= 3 dígitos
Caja= 3 dígitos
Conserva= 2 dígitos

B) MUESTREO ALEATORIO
SISTEMÁTICO

Este procedimiento exige, como el anterior, numerar todos los elementos de la población, pero en
lugar de extraer n números aleatorios sólo se extrae uno. Se parte de ese número aleatorio i, que
es un número elegido al azar, y los elementos que integran la muestra son los que ocupa los
lugares i, i+k, i+2k, i+3k,...,i+(n-1)k, es decir se toman los individuos de k en k, siendo k el resultado
de dividir el tamaño de la población entre el tamaño de la muestra: k= N/n. El número i que
empleamos como punto de partida será un número al azar entre 1 y k. El riesgo este tipo de
muestreo está en los casos en que se dan periodicidades en la población ya que al elegir a los
miembros de la muestra con una periodicidad constante (k) podemos introducir una
homogeneidad que no se da en la población. Imaginemos que estamos seleccionando una
muestra sobre listas de 10 individuos en los que los 5 primeros son varones y los 5 últimos
mujeres, si empleamos un muestreo aleatorio sistemático con k=10 siempre seleccionaríamos o
sólo hombres o sólo mujeres, no podría haber una representación de los dos sexos.

Hay que conocer la población


Se acercan las Navidades y cierta empresa de turrones cree que no va a poder
entregar todos los pedidos a tiempo, a no ser que aumente la plantilla. La empresa
dispone de un listado ordenado alfabéticamente de 20 personas con las mismas
características para el puesto y que actualmente están en paro. Puesto que el
tiempo apremia y no es posible hacer una entrevista para seleccionar al personal, se
decide elegir cinco trabajadores de forma aleatoria usando el muestreo sistemático.

Tenemos que elegir 5 elementos sistemáticamente de un total de 20, por tanto se


debe elegir uno de cada k=20/5=4.

Se elige el punto de partida eligiendo un número al azar entre 1 y 4. Si obtenemos,


por ejemplo h=2, los elementos de la muestra serán 2, 2+4, 2+2·4, 2+3·4, es decir:

2, 6, 10, 14, 8.

El método de muestreo sistemático se utiliza en muestras ordenadas del 1 al N. Consiste en lo


siguiente:

Supongamos que tenemos una población de N individuos ordenados del 1 al N. Queremos


seleccionar una muestra de tamaño n.

Sea k el entero más próximo a N/n.

Escogemos al azar un número i entre 1 y k (utilizando los números aleatorios, sacar una bola de un
bombo, etc.).

La muestra será el elemento i y los elementos i+k, i+2k, etc.. Es decir, el elemento k y los
elementos a intervalos fijos k hasta conseguir los n sujetos:

Suponemos que queremos saber la opinión sobre un profesor de una clase de 60 personas. Dichas
personas están ordenadas por orden alfabético en la lista de alumnos de clase. Para realizar la
encuesta, seleccionamos a 12 personas. Por lo tanto, N=60 y n=12. El intervalo fijo entre sujetos
es:

Ejemplo del cálculo del intervalo fijo en el muestreo sistemático

Ahora elegimos al azar un número entre 1 y k=5. Suponemos que nos sale i=2. La muestra
resultado mediante el muestreo sistemático será:
C) MUESTREO ALEATORIO
ESTRATIFICADO

Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos y
suelen reducir el error muestral para un tamaño dado de la muestra. Consiste en considerar
categorías típicas diferentes entre sí (estratos) que poseen gran homogeneidad respecto a alguna
característica (se puede estratificar, por ejemplo, según la profesión, el municipio de residencia, el
sexo, el estado civil, etc.). Lo que se pretende con este tipo de muestreo es asegurarse de que
todos los estratos de interés estarán representados adecuadamente en la muestra. Cada estrato
funciona independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o
el estratificado para elegir los elementos concretos que formarán parte de la muestra. En
ocasiones las dificultades que plantean son demasiado grandes, pues exige un conocimiento
detallado de la población. (Tamaño geográfico, sexos, edades,...).

La distribución de la muestra en función de los diferentes estratos se denomina afijación, y puede


ser de diferentes tipos:

Afijación Simple: A cada estrato le corresponde igual número de elementos muéstrales.

Afijación Proporcional: La distribución se hace de acuerdo con el peso (tamaño) de la población


en cada estrato.

Afijación Optima: Se tiene en cuenta la previsible dispersión de los resultados, de modo que se
considera la proporción y la desviación típica. Tiene poca aplicación ya que no se suele conocer la
desviación.
Entre estrato y estrato
debe existir la máxima
Heterogeneidad; Pero
dentro de cada Estrato
debe haber la máxima
Homogeneidad.

En el muestreo estratificado, los individuos se dividen en grupos


o estratos. Cada elemento pertenece a un único estrato.

La muestra se elige escogiendo en cada estrato un número representativo de individuos. La


elección de los elementos en cada estrato se realiza mediante algún método de muestreo
aleatorio simple o muestreo sistemático.
Suponemos que hay k estratos de tamaños N1, N2,…, Nk, de forma que:

En cada estrato se toman n1, n2,…, nk elementos para la muestra, de manera que se toman en
total n individuos, es decir:

Se tomará una muestra que sea representativa del conjunto de la población. El número de
individuos que se eligen de cada estrato se puede decidir mediante diversos criterios:

 Elección simple: se toman el mismo número de sujetos de cada uno de los k estratos. De
cada estrato se seleccionarían n/k individuos. Este criterio no es recomendable cuando los
estratos tienen diferente número de individuos.
 Elección proporcional al tamaño del estrato: el tamaño de la muestra en cada grupo es
proporcional a los elementos de dicho grupo. En cada estrato se tomarán ni elementos,
calculados mediante la fórmula:

Por ejemplo, suponemos que estamos haciendo un estudio de la vista de la población de una
ciudad. Suponemos que el 30% de la población lleva gafas y el 70% no. Mediante este método se
escogería el 30% de la muestra de personas que lleven gafas y el 70% de los que no.

 Elección proporcional a la variabilidad del estrato: si se conoce la variabilidad de la


característica que estamos tomando en cuenta en cada estrato, se toman los sujetos
proporcionalmente a ella en cada grupo. En los grupos donde la varianza es mayor, se
toman, por tanto, más sujetos.
CUANDO UTILIZARLO
Se utiliza el método de muestreo estratificado cuando los elementos se dividen en estratos y
estos estratos pueden ser diferenciales para la variable que se está estudiando.

Por ejemplo, supongamos que hacen una encuesta para las elecciones en EEUU y se sabe que el
candidato demócrata tiene mayor influencia en las mujeres que el candidato republicano. La
muestra de la encuesta debería estratificarse en hombres y mujeres, puesto que sabemos que
la variable género influye en la votación.

En las encuestas conocemos datos como la edad, sexo, nivel socioeconómico. Conviene que la
muestre tenga una composición proporcional a los individuos de cada estrato.

Se utiliza el muestreo estratificado cuando los grupos o estratos son muy homogéneos
internamente y diferentes entre ellos. Si los grupos son muy heterogéneos y no existen muchas
diferencias entre ellos, es recomendable utilizar el muestreo por conglomerados.

D) MUESTREO ALEATORIO POR


CONGLOMERADO

Los métodos presentados hasta ahora están pensados para seleccionar


directamente los elementos de la población, es decir, que las unidades muéstrales son los
elementos de la población.

En el muestreo por conglomerados la unidad muestral es un grupo de elementos de la población


que forman una unidad, a la que llamamos conglomerado. Las unidades hospitalarias, los
departamentos universitarios, una caja de determinado producto, etc., son conglomerados
naturales. En otras ocasiones se pueden utilizar conglomerados no naturales como, por ejemplo,
las urnas electorales. Cuando los conglomerados son áreas geográficas suele hablarse de
"muestreo por áreas".

El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto número de


conglomerados (el necesario para alcanzar el tamaño muestral establecido) y en investigar
después todos los elementos pertenecientes a los conglomerados elegidos.

El método de muestreo por conglomerados se utiliza cuando


la población está agrupada en conglomerados naturales.
Si se supone que los conglomerados son muestra significativa de la
variable que se está estudiando, se puede seleccionar algunos
conglomerados al azar (todos los conglomerados deben tener las mismas
probabilidades de ser seleccionados) y utilizarlos en representación de
la población.

Una vez seleccionados los conglomerados, el estudio se simplifica puesto que hay menos
individuos en el análisis. El investigador debe elegir si estudiar a todos los sujetos de los
conglomerados seleccionados o seleccionar una muestra mediante el método de muestreo
aleatorio simple o muestreo sistemático.

En la práctica, el conglomerado más utilizado es el geográfico. Si queremos hacer un estudio en un


país, podemos dividir el país en conglomerados como las comunidades, provincias, ciudades, etc.

Supongamos que el Ministerio de Sanidad quiere hacer en su país para ver si un tratamiento ayuda
a prevenir el cáncer de colon. Si en los datos históricos se observa que la incidencia y
comportamiento del cáncer es parecido en todas las comunidades, podríamos dividir el país en
comunidades y seleccionar algunas. Mediante el muestreo por conglomerados se reducen
notablemente los individuos a estudiar, lo que implica reducir los costes económicos.

Entre conglomerado y
conglomerado debe existir
máxima Homogeneidad.
Dentro de cada conglomerado
debe existir la máxima
Heterogeneidad

CUANDO UTILIZARLO

Se utiliza el muestreo por conglomerados cuando los grupos son muy hetereogéneos y no existen
muchas diferencias entre conglomerados. Se utiliza el muestreo estratificado cuando los grupos o
estratos son muy homogéneos internamente y diferentes entre ellos.

El inconveniente de este método es que se puede suponer una heterogeneidad que no existe.

Supongamos que se realiza una encuesta de opinión en diferentes comunidades por las reformas en
educación realizadas por el gobierno en el último mes. Se podría deducir que no existirá diferencias
significativas en la opinión de las diferentes regiones, pero resulta que en las comunidades más ricas
pueden tener una opinión muy diferente a las pobres.

E) MUESTREO ALEATORIO POR ETAPAS


SUCESIVAS

En este muestreo se procede por etapas. Cuando son dos, recibe el nombre de bietápico y si son
más de dos etapas se le considera polietápico En cada una de ellas salvo en las ultima, la unidad de
muestreo no coincide con la unidad que proporciona la información. Es decir, se definen unas
unidades primarias, por ejemplo, ciudades y entre ellas se elige una muestra. Los conglomerados
que resultan de la primera división se les denomina unidades primarias. Las unidades secundarias,
de menor entidad, por ejemplo, manzanas de las ciudades elegidas y así se obtiene una muestra
aleatoria entre ellas.

Tiene la ventaja de que no es necesario confeccionar la lista de todas las familias de todo el país,
si no únicamente la de las ciudades, en primer lugar; la de las manzanas solo en las ciudades
elegidas y, por ultimo las viviendas de las manzanas que forman parte de la muestra. Además,
tiene la ventaja de concentrar geográficamente las encuestas. El principal inconveniente es que
incrementa los errores, pues en cada etapa se obtiene una muestra con su correspondiente error.
Una muestra con dos etapas está sujeta a dos errores muéstrales y una muestra de cinco etapas
tendría cinco errores muéstrales. Otra cuestión que se plantea es cómo repartir el tamaño de la
muestra en las etapas, por ejemplo para una muestra de 1.000familias se podrían elegir, entre las
probabilidades, 100 ciudades con10 entrevistas en cada una, o bien 10 ciudades con 100
entrevistasen cada una.

Se dice que es de dos etapas, ya que se obtiene primer una muestra aleatoria de conglomerados y,
luego en una segunda etapa, una muestra aleatoria de los elemento de cada conglomerado que
han sido seleccionados Este método facilita la elaboración del marco en la primera etapa y luego
el de la segunda, siendo al final más económico que el obtenido mediante el muestreo aleatorio
estratificado.

EJEMPLO: Supongamos que una firma tiene 110 fábricas distribuidas por todo el territorio
nacional y desea estimar el tiempo y numero de máquinas que duraron paralizadas ya sea por el
mantenimiento o por daño, durante un trimestre. Por tiempo y distancia se diseña una
investigación aplicando el muestreo por conglomerados en dos etapas, para ello se procede a
realizar una muestra de 12 fábricas década una de ellas. El problema se puede presentar de dos
maneras

•Conociendo el total de las máquinas para las 110 fábricas, por ejemplo 5.500 máquinas.

•Se desconoce el valor de M.


Consisten en seleccionar una muestra grande en forma rápida, sencilla y poco costosa, acerca de
las características generales de la población. Utilizando unidades ya consideradas como base para
la realización de una nueva selección de una muestra más pequeña, destinada al estudio de una
característica más específica.

F) MUESTREO ALEATORIO POR


EXPERIMENTACIÓN

C E
Ejemplo:
Efectos de sustratos entre producción de tomate
Sustratos Orgánicos Producción de tomate Ganancia del producto

II. MUESTREO NO PROBABILÍSTICOS

A veces, para estudios exploratorios, el muestreo probabilístico resulta excesivamente costoso y


se acude a métodos no probabilísticos, aun siendo conscientes de que no sirven para realizar
generalizaciones (estimaciones inferenciales sobre la población), pues no se tiene certeza de que
la muestra extraída sea representativa, ya que no todos los sujetos de la población tienen la
misma probabilidad de se elegidos. En general se seleccionan a los sujetos siguiendo determinados
criterios procurando, en la medida de lo posible, que la muestra sea representativa. En algunas
circunstancias los métodos estadísticos y epidemiológicos permiten resolver los problemas de
representatividad aun en situaciones de muestreo no probabilístico, por ejemplo los estudios de
caso-control, donde los casos no son seleccionados aleatoriamente de la población. Entre los
métodos de muestreo no probabilísticos más utilizados en investigación encontramos:

MUESTREO POR
CUOTAS

También denominado en ocasiones "accidental". Se asienta generalmente sobre la base de un


buen conocimiento de los estratos de la población y/o de los individuos más "representativos" o
"adecuados" para los fines de la investigación. Mantiene, por tanto, semejanzas con el muestreo
aleatorio estratificado, pero no tiene el carácter de aleatoriedad de aquél. En este tipo de
muestreo se fijan unas "cuotas" que consisten en un número de individuos que reúnen unas
determinadas condiciones, por ejemplo: 20 individuos de 25 a 40 años, de sexo femenino y
residentes en Gijón. Una vez determinada la cuota se eligen los primeros que se encuentren que
cumplan esas características. Este método se utiliza mucho en las encuestas de opinión.

MUESTREO INTENCIONAL O DE
CONVENIENCIA
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras
"representativas" mediante la inclusión
en la muestra de grupos supuestamente
BOLA DE NIEVE típicos. Es muy frecuente su utilización en
sondeos preelectorales de zonas que en anteriores votaciones han marcado tendencias de voto.
También puede ser que el investigador seleccione directa e intencionadamente los individuos de la
población. El caso más frecuente de este procedimiento el utilizar como muestra los individuos a
los que se tiene fácil acceso (los profesores de universidad emplean con mucha frecuencia a sus
propios alumnos).

Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y así hasta conseguir
una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se hacen estudios con
poblaciones "marginales", delincuentes, sectas, determinados tipos de enfermos, etc.

MUESTREO
DISCRECIONAL

A criterio del investigador los elementos son elegidos sobre lo que él cree que pueden aportar al
estudio.
TAMAÑO DE MUESTRA
En estadística el tamaño de la muestra es el número de sujetos que componen la muestra extraída
de una población, necesarios para que los datos obtenidos sean representativos de la población.

1. Estimar un parámetro determinado con el nivel de confianza deseado.


2. Detectar una determinada diferencia, si realmente existe, entre los grupos de estudio con
un mínimo de garantía.
3. Reducir costes o aumentar la rapidez del estudio.
Por ejemplo, en un estudio de investigación epidemiológico la determinación de un tamaño
adecuado de la muestra tendría como objetivo su factibilidad. Así:

1. Si el número de sujetos es insuficiente habría que modificar los criterios de selección,


solicitar la colaboración de otros centros o ampliar el período de reclutamiento. Los
estudios con tamaños muestrales insuficientes, no son capaces de detectar diferencias
entre grupos, llegando a la conclusión errónea de que no existe tal diferencia.
2. Si el número de sujetos es excesivo, el estudio se encarece desde el punto de vista
económico y humano. Además, es poco ético al someter a más individuos a una
intervención que puede ser menos eficaz o incluso perjudicial.
El tamaño de una muestra es el número de individuos que contiene.
- Poblaciones Finitas
a) Variables Cualitativas:
𝒁𝟐 𝑵𝒑𝒒
𝒏=
𝑬𝟐
n = Tamaño de la muestra
N = Población
p = Probabilidad de ocurrencia de la variable (p=0.5=50%)
q = q-p
Z = El nivel de significancia
∝ = 0.05 = 95% = 1.96

E = Error permisible ± 2.3 3.3 5.3


b) Variables Cuantitativas
𝒁𝟐 𝝈𝟐 𝑵
𝒏=
𝑬𝟐
n = Tamaño de muestra
N = Población
𝝈𝟐 = Varianza poblacional
E = Error permisible
Poblaciones Infinitas
Variables Cualitativas:
𝒁𝟐 𝒑𝒒
𝑬𝟐
Variables Cualitativas:
𝒁𝟐 𝝈𝟐
𝒏=
𝑬𝟐

Ejemplo:
Un investigador en parasitología está interesado en la incidencia de paracitos por oxiurosis en
niños menores de 5 años de los colegios nacionales del pueblo joven Ciudad de Dios durante su
indagación encuentra en las estadísticas del INI que los niños de 5 años en ese pueblo joven es de
9500 así mismo en la búsqueda de la revisión bibliográfica encuentra que en estudios de años
anteriores en lugares similares al que él va a realizar su estudio la probabilidad de ocurrencia de la
oxiurosis es del 0.40 o 40%. Cuál es el tamaño de muestra que debe considerar para tener una
confiabilidad del 95% y un error permisible del 4%.
Ref. Bibliográfica
P Muestra Piloto
Asumo
= 95% = 0.05 = 1.96
E = 4%
N = 9500 – Muestra piloto (n=100)

𝟏. 𝟗𝟔𝟐 (𝟗𝟓𝟎𝟎)(𝟎. 𝟒)(𝟎. 𝟔)


𝒏=
𝟎. 𝟎𝟒𝟐
n = 5472

Si “n” sobrepasa al 10% de la población “corrección”


𝒏 𝟓𝟒𝟕𝟒
𝒏′ = 𝒏= = 𝟑𝟒𝟕𝟒
𝟏 + 𝑵 𝟏 + 𝟓𝟒𝟕𝟒
𝟗𝟓𝟎𝟎

También podría gustarte