Manual Bioestadiacutestica Plus Medic A PDF

Manual de Bioestadística, Salud Pública y Epidemiología RM PLUS MEDIC A
BIOESTADÍSTICA
www.plus-medica.com
MANUAL de BIOESTADÍSTICA , SALUD

PÚBLICA, y EPIDEMIOLOGÍA
PLUS MEDIC A
1ª Edición
Paul Pachas Chávez MD, MPH (c), MSc(c)

Médico epidemiólogo
Instituto Nacional de Salud
Ministerio de Salud
José castro Zevallos

Médico internista
Asistente del Dpto de Medicina del Hospital Nacional Dos de Mayo
Docente de la Universidad Científica del Sur
Docente de la Universidad San Juan Baustista
Ramón Flores Valdeiglesias
Médico internista
Asistente del Dpto de Medicina del Hospital Nacional Dos de Mayo
Docente de la Universidad Ricardo Palma
Docente de la Universidad Científica del Sur
Carátula: Edy Flores Valdeiglesias
Derechos Reservados 2012
Prohibida su venta
www.plus-medica.com
Este manual está dedicado a los estudiantes de Medicina Humana y a los médicos
jóvenes de las diferentes universidades de Lima y de nuestro Perú, que se esfuerzan
día a día en busca del conocimiento médico actualizado y que son fuente de
inspiración y razón de ser de PLUS MEDIC A.
Los autores
www.plus-medica.com
Contenido
1. Estadística. Generalidades ……………………………………………………………………….. 6
1.1 Tipos de estadística
1.2 Población
1.3 Parámetro
1.4 Estadístico
2. Estadística descriptiva …………………………………………………………………………… 21
2.1 Variables
2.2 Gráficos para variables cualitativas
2.3 Gráficos para variables cuantitativas
2.4 Medidas de posición y de dispersión
3. Diseño y análisis del muestreo …………………………………………………………………. 37
3.1 Población o universo
3.2 Muestra
3.3 Marco muestral, unidad de muestreo, unidad de información y unidad de análisis.
3.4 Muestreo
3.5 Muestreo probabilístico
3.6 Muestreo no probabilístico
3.7 Tamaño muestral
4. Estadística inferencial …………………………………………………...………………………. 42
4.1 Estadística paramétrica
4.2 Estadística no paramétrica
4.3 Análisis estadístico
4.4 Pruebas con dos muestras independientes
5. Contraste de hipótesis………………………………………………………………………........ 56
5.1 Hipótesis nula, hipótesis alternativa y grado de significación estadística
5.2 Errores alfa y beta
5.3 Pruebas de significación estadística
5.4 Prueba de Chi cuadrado
www.plus-medica.com
MANUAL de SALUD PÚBLICA ,EPIDEMIOLOGÍA y BIOESTADÍSTICA PLUS MEDIC A
INTRODUCCIÓN  

La estadística es una serie ordenada de métodos que 
se ocupan de la recolección, organización,
presentación, análisis e interpretación de datos Determinar si el estudio es del momento presente o
numéricos. si se va a estudiar a una población de cinco años
atrás o si se van a entrevistar personas de diferentes
¿Cómo se clasifica la estadística?
generaciones.

  
 

Por falta de tiempo y recursos hay que limitar el
Utiliza técnicas para recolectar, resumir, analizar
presentar un conjunto de datos, a través de tablas o estudio a un área o comunidad en específico.
gráficos, con la finalidad de describir
apropiadamente las características de ese conjunto.  
 El tamaño de la población determina o afecta al
 tamaño de la muestra que se vaya a seleccionar.


 MUESTRA
 Es un subconjunto fielmente representativo de la
Comprende las técnicas matemáticas que permiten
generalizar la información obtenida de una muestra población. sobre la que tenemos acceso y donde
a la población. Debido a que las decisiones se toman hacemos las observaciones (mediciones).
en condiciones de incertidumbre, serán confiables 
con cierto grado de probabilidad. 
 
POBLACIÓN
Es el conjunto total de Hay diferentes tipos de muestreo. El tipo de
individuos, objetos o medidas muestra que se seleccione dependerá de la
que poseen algunas calidad y cuán representativo se quiera sea el
características comunes obser- estudio de la población:
vables en un lugar y en un  cuando se selecciona al azar y
momento determinado. cada miembro tiene igual oportunidad de ser
 incluido.

  cuando se subdivide en

 estratos o subgrupos según las variables o
 características que se pretenden investigar. Cada
Cuando se vaya a llevar a cabo alguna investigación estrato debe corresponder proporcionalmente a
debe de tenerse en cuenta algunas características la población.
esenciales al seleccionarse la población bajo estudio: : cuando se establece un patrón
que todos los miembros de la
o criterio al seleccionar la muestra.
población tengan las mismas características según las

variables que se vayan a considerar en el estudio o

investigación.
5
Muestreo 

Es indispensable para el investigador ya que es

imposible entrevistar a todos los miembros de 
una población debido a problemas de tiempo, 
recursos y esfuerzo. 
Al seleccionar una muestra lo que se hace es 
estudiar una parte o un subconjunto de la 

población, pero que la misma sea lo

suficientemente representativa de ésta para 
que luego pueda generalizarse con seguridad 
de ellas a la población.
 VARIABLES

 ¿Cómo se define a las variables en
 estadística?
 
 
 
 
 por su naturaleza y a) Desde el punto de vista estadístico

por la necesidad de tener control sobre las
CUALITATIVAS
variables, se recomienda muestras pequeñas que
Si sus valores no se pueden asociar naturalmente a
suelen ser de por lo menos 30 sujetos. un número (no se pueden hacer operaciones
 se emplean muestras algebraicas con ellos).
grandes y algunas veces se recomienda seleccionar Tipos:
Si sus valores no se pueden ordenar
de un 10 a un 20 por ciento de la población
 .Sexo, Fumar (Sí/No)
accesible  . : estado civil, color de los ojos,
profesión.
PARÁMETRO  : si sus valores se pueden ordenar
Es una unidad numérica calculada sobre una IRA, grado de desnutrición, Intensidad del dolor.
población y resume los valores que ésta toma en 
varios atributos. CUANTITATIVAS 
 Si sus valores son numéricos (tiene sentido hacer
 operaciones algebraicas con ellos)

ESTADÍSTICO Tipos:
Si toma valores enteros
Es una unidad numérica calculada sobre una muestra Ejemplo: Número de abortos, número de parejas
que resume su información sobre algún aspecto. sexuales, etc.
 Si entre dos valores, son posibles
 infinitos valores intermedios.
Ejemplo: Edad, talla, presión intraocular, etc.
  El cero no es absoluto
Ejemplo: la media del peso de 300 habitantes de la Temperatura en grados centígrado, la nota de un
ciudad de Lima. examen
  El cero es absoluto.
 Altura, peso
6
Si, mediante el gráfico, se intenta comparar varias

poblaciones entre sí, existen otras modalidades,
Variable cualitativa nominal como las mostradas en la figura.
Es la variable cualitativa que no tiene punto de
comparación. Ejemplo: el color de los ojos .
Variable cualitativa ordinal
Cuando hay un determinado orden. Ejemplo:
duración de una enfermedad (aguda, subaguda,
crónica).
Variable cuantitativa discreta, discontínua o de
intervalo
Cuando la variable cuantitativa sólo se puede
medir en valores enteros. Ejemplo: número de
partos.
Variables cuantitativas continuas o de razón
Si la variable se puede expresar en fracciones,
Fi. 2 Diagrama de barras para comparar una variable
como peso al nacimiento (3,460 g) o estatura (51.3 cualitativa en varias poblaciones
cm)
 Gráfico de sectores (tartas)

b) Desde el punto de vista metodológico 
 
Se divide un círculo en
tantas porciones como
clases existan, de
modo que a cada clase
GRÁFICOS para variables CUALITATIVAS le corresponde un
arco de círculo
Gráfico de barras proporcional a su
 frecuencia absoluta o

 relativa .
Representamos en el eje de ordenadas las 

modalidades y en abscisas las frecuencias absolutas o 
bien, las frecuencias relativas. Cuando los tamaños de
las dos poblaciones son diferentes, es conveniente
utilizar las frecuencias relativas, ya que en otro caso
podrían resultar engañosas







Sean n1 < = n2 los tamaños respectivos de las 2
poblaciones. La población más pequeña se representa
con un semicírculo de radio r1 y la mayor con otro de
Fi. 1 Diagrama de barras para una variable cualitativa radio r2.
7
La relación existente entre los radios, es la que se El criterio para calcular la altura de cada rectángulo
obtiene de suponer que la relación entre las áreas de es el de mantener la proporcionalidad entre la
las circunferencias es igual a la de los tamaños de las frecuencias absolutas (o relativas) de cada intervalo y
poblaciones respectivas, es decir: el área de los mismos.
Polígono de frecuencia




Pictogramas Para representar el polígono de frecuencias en el
 primer y último intervalo, suponemos que
 adyacentes a ellos existen otros intervalos de la
 misma amplitud y frecuencia nula, y se unen por una
Expresan con dibujos alusivos al tema de estudio las línea recta los puntos del histograma que
frecuencias de las modalidades de la variable. Estos corresponden a sus marcas de clase. 
gráficos se hacen representado a diferentes escalas 
El polígono de frecuencias tiene en común con el
un mismo dibujo. histograma el que las áreas de la gráficas sobre un
intervalo son idénticas.
Fi. 3 Pictogramas
GRÁFICOS para variables CUANTITATIVAS

El diagrama integral para una variable continua se
Para las variables continuas denomina también polígono de frecuencias
Utilizamos como diagramas diferenciales acumulado, y se obtiene como la poligonal definida
los histogramas y los polígonos de frecuencias. en abcisas a partir de los extremos de los intervalos
en los que hemos organizado la tabla de la variable, y
Histogramas
 en ordenadas por alturas que son proporcionales a
 las frecuencias acumuladas.

ESTADÍSTICOS

Indican los valores centrales de los datos.
Media, mediana y moda

Indican la mayor o menor concentración de los datos
con respecto a las medidas de centralización.
Desviación típica, coeficiente de variación, rango,
varianza
8








Si los datos son una muestra, el promedio y la
mediana se llamarán estadísticos. Si los datos
Centralización o tendencia central son una población entonces estas medidas de
tendencia central se llamarán parámetros


Ejem. Media de 2, 2, 3 y 7 es (2+2+3+7) /4=3,5
¿Cuándo debemos usarla? cuando los datos tie-
nen distribución normal o casi normal
Precaución: es muy sensible a valores extremos.

 Dispersión 

 
 

Cuantiles, percentiles, cuartiles, deciles
¿Cuándo usarla? si la distribución de los datos es

asimétrica.
No es sensible a valores extremos.
Mediana de 1,2,4,5,6,6,800 es 5. ¡La media es 117,7
Pasos para encontrar la mediana:

Posición 1. Ordenar los datos de menor a mayor;
 2. Calcular la posición de la mediana: (n+1)/2,
Asimetría donde n es el número de observaciones
Apuntamiento o curtosis 3. a) Si el número de observaciones es impar, la
mediana es un único término central.
b) Si el número de observaciones es par, la
mediana es el promedio de los dos términos
centrales.
Ejemplo
Edades de n=20 sujetos...
Calculamos (n+1)/2 obtenemos (20+1)/2 = 10,5.
Forma Entonces los términos centrales son la décima y un-
9
décima observaciones, es decir 43 y 44. La mediana Estadísticos de DISPERSIÓN

es el promedio de estos dos términos, Miden el grado de dispersión (variabilidad) de los da-
(43+44)/2=43,5 años. tos, independientemente de su causa.
32 37 39 40 41 41 41 42 42 43 44 45 45 45 46 47 47
49 50 51 
Diferencia entre observaciones extremas.
 -2, 1, 4, 3, 8, 4.
 El rango es 8-1=7
• La moda de los valores: { 0, 0, 0, 0, 1, 1, 2, 2, 3, 4 } es -Es muy sensible a los valores extremos.
0.
• { 0, 0, 0, 1, 1, 2, 2, 2, 3, 4 } dos modas, 0 y 2 Rango
(bimodal). Es la medida de variabilidad o dispersión más
• ¿Cuál sería la moda del siguiente conjunto de simple. Se calcula tomando la diferencia entre el
valores? { 0, 1, 2, 4, 5, 8 }. valor máximo y el mínimo observado.
• {0, 0, 0, 0, 0, 1, 2, 3, 4, 4, 4, 4, 5} ... Rango = Máximo – Mínimo.
La Moda no se usa a menudo como medida de
tendencia central para datos cuantitativos. Sin
embargo la Moda es la medida de tendencia central
que puede ser calculada en datos cualitativos.
Pregunta: En nueve familias encuestadas los

números de niños por familia fueron: 4,6,2,2,4,3,2,1
y 7. La media, mediana y moda de los niños por Analice cuáles podrían ser las ventajas y
familia son respectivamente: desventajas del rango como medida de
a) 3.4, 2,3 variabilidad.
b) 3, 3.4, 2
c) 3, 3.4, 2
d) 2, 3.5, 3 
-Es la distancia entre el primer y tercer cuartil.
e) Ninguna anterior Rango intercuartílico = P75 - P25
-Parecida al rango, pero eliminando las
observaciones más extremas inferiores y superiores.
-No es tan sensible a valores extremos.
Pregunta: Un jefe de servicio desea considerar un

valor central que resuma el tiempo de estancia de sus
pacientes ingresados. En este valor prefiere que
tengan escasa contribución aquellos pacientes
ingresados por error diagnóstico que son trasladados
a otro servicio en poco tiempo y aquellos pacientes
que permanecen ingresados debido a su
problemática social una vez finalizada la intervención
médica. ¿Qué parámetro le recomendaría?:
A. Mediana.
B. Moda.
C. Media.
D. Desviación típica.
E. Recorrido.



10
ESTADÍSTICOS de POSICIÓN
. 



 -La mediana es el percentil 50
 -El percentil de orden 15 deja por debajo al 15% de
 las observaciones. Por encima queda el 85%
1
S2   ( xi  x )2
n i
Pensemos la desviación estándar como En general, el k-ésimo percentil es un valor tal que el
aproximadamente un promedio de las distancias k% de los datos son menores o iguales que él, y el
de las observaciones a la media. (100-k) % restante son mayores o iguales que él.
Si todas las observaciones son iguales, entonces
la desviación estándar es cero. .
La desviación estándar es positiva y mientras 
más alejados están los valores del promedio, -Primer cuartil = Percentil 25 = Cuantil 0,25
mayor será la desviación estándar. -Segundo cuartil = Percentil 50 = Cuantil 0,5 =
mediana
Dispersión en distribuciones “normales” -Tercer cuartil = Percentil 75 = cuantil 0,75
-Centrado en la media y a
una desviación estándar
de distancia tenemos más
de la mitad de las
observaciones (68.25%).
-A dos desviaciones
estándar tenemos al
95.45%
-A tres desviaciones
estándar tenemos el 99.7%
11
12
OF: Un estudio ha codificado la intensidad del dolor b)El valor 6 indica la intensidad de dolor que puede
de los pacientes como: sin dolor, dolor leve, dolor considerarse normal en la escala utilizada.
moderado y dolor intenso. La variable ha sido media c)El valor 6 de la escala ha sido la puntuación
en una escala: obtenida con mayor frecuencia por los sujetos de la
a. Cualitativa nominal muestra.
b. Cualitativa ordinal d)El valor 6 es la media aritmética de las
c. Cualitativa discreta puntuaciones obtenidas por los sujetos de la
d. Cualitativa contínua muestra.
e. Dicotómica e)La diferencia entra la puntuación máxima y la
Rpta. B mínima obtenida por los sujetos de la muestra es 6.
Rpta. A
OF: Se está realizando un estudio para conocer el
efecto de un analgésico. La variable principal de OF: En un ensayo clínico se comparan 3 tratamientos
respuesta es una escala de dolor con los siguientes (p.e. placebo, tratamiento establecido y un
valores: 1 . No dolor 2. Dolor leve 3.Dolor moderado tratamiento nuevo). La variable respuesta es
y 4. Dolor intenso. ¿De qué tipo de variable se trata? contínua (p.e. nivel de glucosa en sangre). Aceptando
a. Variable dicotómica que la variable tiene una distribución normal, el test
b. Variable contínua correcto para comparar la respuesta es:
c. Variable discreta a)La t de Student.
d. Variable ordinal b)El test de Wilcoxon.
e. Variable cuantitativa c)Análisis de la varianza.
Rpta. D d)El test de Kruskal-Wallis.
e)El test ji-cuadrado.
OF : Al consultar la distribución del peso en una Rpta. C
muestra de sujetos adultos, se aprecia que el
percentil 25 corresponde a 65 kg. ¿Cuál de las
siguientes afirmaciones es correcta?:
a)El 25% de los sujetos de la muestra pesan
aproximadamente 65 kg.
b)El 25% de los sujetos de la muestra tienen un peso
igual o superior a 65 kg.
c)Para poder interpretar este valor, es necesario
conocer la desviación estándar de la distribución.
d)Para poder interpretar este valor, es necesario
conocer la media de la distribución.
e)El 25% de los sujetos de la muestra tienen un peso
igual o inferior a 65 kg.
Rpta. E
OF : En un estudio en que se ha medido la intensidad

de dolor en un grupo de 145 pacientes con artritis
reumatoide mediante una escala de 0 (ausencia de
dolor) a 10 (dolor de intensidad máxima), se informa
que la mediana es de 6. ¿Cuál el significado de este
valor?:
a)La mitad de los sujetos de la muestra tienen
valores de intensidad de dolor iguales o inferiores a
6.
13
¡Estudiar a la población de bañistas de una

INTRODUCCIÓN piscina es fácil, pero no precisamente de la
La investigación en salud tiene como objeto obtener piscina de abajo!
conclusiones que permitan una adecuada toma de
decisiones en lo que compete a conductas específicas
y cambio de políticas establecidas en relación con la
salud de los seres humanos.
CONCEPTOS
Población o Universo
Es un conjunto de individuos
o elementos que guardan
similitud entre sí en los
aspectos que son relevantes 
para los objetivos de la 
investigación. Cada uno de 
los elementos están ¿Cuáles son las razones que limitan la
perfectamente identificados. medición en todos los sujetos de la
población?
La población o universo es demasiado grande para -Las limitaciones severas en relación a recursos
estudiarla en su totalidad. económicos y de tiempo, para lograr un cubrimiento
del ciento por ciento de la población.
-Falta de recurso humano suficientemente calificado
para realizar las observaciones o para obtener las
mediciones necesarias .
-Dificultades geográficas y logísticas que presenta una
tarea de gran magnitud como es el cubrimiento total
de una población.
Muestra
Es un subgrupo de la población total.
¡Para muestra…. un
botón!
Las dificultades ante-
riormente menciona-
Población o universo das, que podrían hacer
irrealizable un estudio,
 pueden ser soluciona-
 das si se estudia una
 muestra de la pobla-
 ción.

14
Una muestra correctamente seleccionada puede 

representar a la comunidad total de la cual fue 
extraídas y permite , que los resultados obtenidos 
en ella puedan extrapolar a un número mucho 
mayor personas pertenecientes a la misma población 
o a po-blaciones diferentes de características muy 
similares. 
 Unidad de información

 Es la unidad que nos brinda información de la unidad
 de estudio.

 Cuando la unidad de estudio es la población el
individuo se convierte en unidad de información.
Marco muestral En un estudio retrospectivo las unidades de
Es un subconjunto de la población en el cual cada uno información son las historias clínicas.
de los elementos está identificado Es una lista de
unidades de muestreo. 



Unidad de análisis
Es la unidad definida por el investigador para realizar
mediciones. Es el elemento básico de estudio.
Dentro del marco muestral se va a 

identificar la unidad de muestreo. 


Unidad de muestreo
Es la unidad que se somete al proceso de Las unidades de análisis pueden corresponder a las
aleatorización en los estudios que requieren siguientes categorías o entidades:
muestreo.
 
 
 
 
 


 

En un muestreo por conglomerados o clústers son los
grupos de unidades de estudio los que ingresan al El tipo de análisis al que se someterá la información
sorteo. es determinante para elegir la unidad de análisis.
En un estudio sobre la relación médico-paciente son Por ejemplo, si el objetivo es dar cuenta de la
los médicos las unidades de muestreo. satisfacción del usuario de un servicio médico, la
15
unidad de análisis natural es el paciente atendido, o presentes, podrían cambiar radicalmente los
la persona que se atiende en ese servicio médico. resultados finales de una investigación.
Selección de una muestra Validez externa

La muestra se selecciona del Universo, de acuerdo Equivale a la posibilidad de generalizar los resultados a
con unos criterios de inclusión y exclusión la población, que se caracteriza por tener
previamente establecidos. características compartidas.
 
 
 
 
 

 Métodos de muestreo
 El muestreo puede ser, de acuerdo con sus
 características básicas, de dos tipos: probabilística y
 no probabilística.

En este sentido, cuantos más criterios de inclusión 
o exclusión se propongan, más reducida será la 
población a la que se pueda extrapolar el 
resultado. 

MUESTREO Muestreo no probabilístico
-Por conveniencia o deliberado
Preguntas en todo proceso de muestreo: -Accidental
Para que los datos sean representativos de la población -Selección por expertos
que se pretende estudiar. Muestreo no probabilístico
-Muestreo aleatorio simple o irrestricto
Tamaño de la muestra : ¿A cuántos
-Muestreo Sistemático
vamos a muestrear ?
Diseño muestral : ¿A quienes
-Muestreo Estratificado
vamos a muestrear? -Muestreo por Conglomerados
-Muestreo Polietápico – Estratificado.
Objetivo del muestreo 
Es obtener una población que permita generalizar los
resultados del estudio a personas que comparten las MUESTREO NO PROBABILÍSTICO
características del interés, pero que no estuvieron
involucradas en el desarrollo del mismo. En general, en este tipo de muestreo, las unidades se
 seleccionan por conveniencia, de manera secuencial,
 siguiendo determinados criterios subjetivos o porque
 simplemente están disponibles.

Desventaja
Validez Interna La desventaja del muestreo no probabilístico es
Se refiere al grado en que la selección de sujetos y los que no sirven para realizar generalizaciones,
otros aspectos del desarrollo de un estudio están dado que no se tiene certeza de que la muestra
libres de sesgos o errores sistemáticos que, de estar extraída sea representativa de la población.
16
Muestreo por CONVENIENCIA : Implica el empleo de El muestreo por cuotas no requiere de la aplicación
una muestra integrada por las personas o los objetos de técnicas complejas ni la inversión de una cantidad
cuya disponibilidad como sujetos de estudio sea más extraordinaria de tiempo o esfuerzos, salvo por la
conveniente. identificación de estratos y la representación
proporcional correspondiente, la técnica de
 muestreo por cuotas es muy semejante a la de
 conveniencia.

 Este muestreo comparte muchas de las
Las muestras por conveniencia no constan deficiencias de la técnica de conveniencia.
necesariamente de individuos que el investigador
conozca. Muestreo INTENCIONAL : Se basa en la idea de que
el investigador puede usar sus conocimientos acerca
 de la población para elegir los casos que incluirá en la
 muestra.

El investigador debe seleccionar la variedad más
¡Las chicas los prefieren amplia posible de personas o los sujetos que a su juicio
flaquitos! son característicos de la población que le interesa o
que disponen de mayor información acerca del tema
El muestreo por convenien- de estudio.
cia es la técnica menos Si bien esta forma subjetiva de muestreo no ofrece un
sólida, pero también la que método externo y objetivo para evaluar cuán típicos
más se utiliza en los de la población son los sujetos seleccionados, puede
estudios de ciencias de la representar ciertas ventajas en circunstancias como
salud. la evaluación preprueba de instrumentos recién
desarrollados con una muestra de diversos tipos de
Cuando los fenómenos que se investigan son sujetos intencionalmente elegidos.
suficientemente homogéneos en la población, se
reduce el riesgo de sesgo. El muestreo intencional se aplica a menudo se
busca una muestra de expertos, como cuando se
Muestreo por CUOTAS : En el muestreo por cuotas el desea aplicar una prueba de detección de
investigador identifica estratos de la población y necesidades con base en la técnica del
establece las proporciones de elementos necesarias a informante clave.
partir de los distintos segmentos estratificados.
MUESTREO PROBABILÍSTICO
¿Muestreo por cuotas?
En este tipo de muestreo cada miembro de la
población tiene una probabilidad, conocida y superior
a cero, de ser incluido en la muestra y las unidades
muestrales hacen parte de la muestra
independientemente del criterio o gusto del
investigador.
Con base en información previa acerca de la Es el MEJOR MÉTODO para asegurar la validez
composición de la población, el investigador se de cualquier inferencia o generalización hecha
asegura de que los diversos segmentos o sectores con base en los resultados obtenidos a partir de
estén representados en la muestra en las mismas la muestra.
proporciones en que se presentan en la población.
17
 
 
 
 
 
 
 
Aplicación práctica
Clasificación Como puede verse en la fig. 1 primero debemos
El muestreo probabilístico se clasifica en: seleccionar de una población una muestra. Luego de
  seleccionar la muestra hay que determinar los
 estadísticos:
 x=Media s=Desviación standard
  2=
s Varianza p=Proporción n=Tamaño
 Luego estos estadísticos deben ser extrapolados a la
población para obtener los parámetros.
Muestreo ALEATORIO SIMPLE o Irrestricto: µ = Media σ= Desviación standard
Es la técnica considerada como la más sencilla en el 2=
σ Varianza π=Proporción
muestreo probabilístico. En ella, cada sujeto o unidad
N=Tamaño
tiene una probabilidad igual y conocida de ser
seleccionado. Todas las unidades están
adecuadamente identificadas.
¡Asi de fácil es el
Muestreo aleatorio
simple!
Supone que no existen razones para considerar que

un conjunto específico de la población debe ser
seleccionada con prioridad a otro.
Debido a estas importantes características, las

muestras aleatorias simples son consideradas
relativamente libre de sesgos.
Forma de seleccionar una muestra Fig 1. Muestreo aleatorio simple

Este método se realiza en poblaciones pequeñas , lo
que permite identificar y enumerar todos los Muestreo ALEATORIO SISTEMÁTICO :
elementos de la población de manera unívoca y exacta. Este procedimiento se caracteriza por seleccionar las
¿Qué se requiere para el muestreo? unidades de muestreo empleando un intervalo de
A través de algún procedimiento (tablas de números medida constante sobre el marco muestral.
aleatorios, números aleatorios generados con una No requiere la enumeración de las unidades del
calculadora o una lista aleatoria generada por marco muestral; solamente basta con que estén
paquetes estadísticos) se elige a tantos participantes
físicamente ordenadas en un orden ascendente o
como sea necesario para completar el tamaño de
descendente, para permitir el conteo.
muestra requerido.
18
La aplicación de este procedimiento requiere resulta de la suma de  y así sucesivamente

determinar de manera inicial el: hasta completar el tamaño de la muestra que es 
-Intervalo muestral (k) intervalo que se
calcula dividiendo N / n
N = tamaño de la población total
n= tamaño de la muestra calculada
Aproximando el resultado al número entero
más próximo.

La variable de interés es una variable que puede
influir en los resultados del estudio.
Ej. Si se quiere determinar la media de la talla de un
grupo de alumnos de un colegio mixto ,es necesario
ordenar a los alumnos por la variable sexo, ya que la
talla va a depender del sexo.
El sexo es una variable que va a influir en la media de
la talla que se va a determinar.
 Fig.2 Muestreo aleatorio sistemático

Para hacer esta división vamos a tener una constante
que se denomina como K . Aplicación práctica
 Como puede verse en la fig. 1 tenemos una población
 que debe ser ordenada en base a una variable que
 nos interesa controlar.
 
 Una vez ordenada la población hay que calcular el
Por ejemplo: valor de K.
N = 300 (población total) N = 40 y n = 8
n = 60 (tamaño de la muestra) N/n = K = 5
 
N / n =300/60 = K = 5 En este ejemplo el valor elegido entre 1 y K es 3.
 
 
Se selecciona al azar el número . 
  hasta completar el tamaño de la
 muestra requerido
 1º elemento : 3+5= 8 ; 2º elemento: 8+5= 13 ;
  3º elemento : 13 +5 = 18 y así sucesivamente hasta
 completar el tamaño de la muestra que es 40.

hasta completar el tamaño de la muestra requerido
se localizan las unidades del marco muestral corres-  y extrapolamos los valores de los estadísticos a la
pondientes a los valores obtenidos. población para obtener los parámetros.
El primer elemento por lo tanto es , el segundo
Muestreo ESTRATIFICADO : En algunas ocasiones la
elemento es el resultado de la suma de  , el
población que se desea estudiar está compuesta por
tercer elemento se halla sumando  , el cuarto
subgrupos bien definidos que pueden ser identificados
elemento resulta de la suma de , el quinto
con anterioridad al proceso de selección de la
elemento sumando  , el sexto elemento
muestra.
19
La característica de interés en el estudio varía Afijación proporcional: La distribución del tamaño de

ampliamente entre esos subgrupos definidos, es muestra se realiza porcentualmente según tamaño de
decir, existe gran heterogeneidad entre ellos; en cada estrato dentro de la población; por tanto,
tanto que dentro de cada subgrupo la variabilidad es requiere conocer el número de estratos y el tamaño
poca, es decir, existe homogeneidad dentro del porcentual de cada uno en la población.
subgrupo. 

Muestreo estratificado : “Dios los cría y ellos se 
juntan” 


Afijación Óptima: Requiere conocer además del

número de estratos y el tamaño porcentual de estos
en la población, la desviación estándar poblacional en
cada estrato. Consiste en balancear la variabilidad
dentro de los estratos con su tamaño.
Ignorar la heterogeneidad que presenta la

característica de interés sobre el marco muestral
puede llevar a que las estimaciones obtenidas a
partir de la muestra difieran considerablemente
de los verdaderos valores de la población.
Estratificación de la población
La estratificación en algunas ocasiones puede 
obedecer a características de tipo espacial, tales 
como el sitio de vivienda, lo cual puede identificar una Tenemos una población bastante heterogénea por lo
clase económica determinada que sigue ciertos que vamos a formar estratos para tratar de
comportamientos sociales, políticos, económicos y homogenizar la población en cada uno de los estratos.
culturales.





Existen diferentes formas de realizar la selección de

las unidades dentro de los estratos:
Afijación igual: Consiste en distribuir
equitativamente el tamaño de la muestra en cada uno
de los estratos de la población; requiere conocer el
número de estratos existentes.






Fig.3 Muestreo Estratificado
20
En el ejemplo de la fig. 3 estamos formando 2 

estratos para tratar de homogenizar los elementos en Los conglomerados tienen las siguientes
el estrato que estamos determinando. características:
-Dentro de cada conglomerado debe haber la mayor
 heterogeneidad posible. Entre los conglomerados
La variable que vamos a utilizar para estratificar la debe haber la mayor homogeneidad posible.
población, es una variable que sabemos que puede
influir en los resultados del estudio.

Una vez determinados los estratos el siguiente paso
es seleccionar una muestra de cada uno de los
estratos ,.
La selección de la muestra se puede realizar
utilizando el:
-Muestreo aleatorio simple
-Sistemático.


Una vez obtenida la muestra determinamos los
estadísticos.
Extrapolamos los valores de los estadísticos a la
población para obtener los parámetros.
Muestreo por CONGLOMERADOS o Complejos Fig.4 Muestreo por conglomerados

Los conglomerados son agrupaciones de elementos -El tamaño de los conglomerados no necesariamente
que existen naturalmente (no los define el es el mismo.
investigador) por razones económicas, biológicas, Al no ser del mismo tamaño la probabilidad de
sociales, etc. (el hogar, el curso de estudiantes de un selección de cada sujeto va a variar en cada
colegio, un municipio o ciudad). conglomerado. Por lo tanto no todas las unidades de
Una muestra por conglomerados es una muestra muestreo tienen las misma probabilidad de ser
aleatoria simple en la cual las unidades muestradas seleccionadas.
son grupos de unidades del marco muestral.

DESVENTAJA -Una vez que se han formado los conglomerados
Este muestreo tiende a contener más errores de vamos a seleccionar de todos estos una muestra de
muestreo que los de tipo simple o estratificado. los conglomerados.
VENTAJA Este muestreo se puede hacer con :
. Muestreo aleatorio simple
Sin embargo es mucho más económico y práctico
. Muestreo aleatorio Sistemático.
que otras variantes de muestreo probabilística,

en particular cuando la población es grande y se
-Se ha seleccionado una muestra de los conglomerados
halla dispersa.
pero que sigue siendo demasiado grande, es por eso
que dentro de cada conglomerado vamos a seleccionar
Se tiene una población bastante heterogénea y una muestra de cada conglomerado
grande, como por ejemplo la población de un En la muestra de cada conglomerado estimamos los
distrito , de una provincia o de un país. estadísticos y luego extrapolamos los valores de los
estadísticos a la población para obtener los
parámetros (este proceso es difícil).
21
Más datos: Uno de los criterios durante la planeación de la

 selección de una muestra es obtener estimadores
 confiables para alcanzar los objetivos del estudio.
 
 
Como puede verse en el ejemplo de la fig.4 en la 
selección de la muestra de los conglomerados (1ra.
etapa) se utiliza el muestreo aleatorio Simple y para 
seleccionar la muestra de cada conglomerado (2da. 
etapa) es decir los elementos o unidades de Es necesario equilibrar los recursos, la logística de
muestreo se puede utilizar el muestreo aleatorio la selección, el proceso de recolección y el análisis
sistemático. de la muestra seleccionada.
Por estas razones, existe un tamaño de muestra
TAMAÑO DE LA MUESTRA específico para cada diseño de muestreo y para los
Según Fisher, el tamaño de la muestra debe definirse diferentes diseños de investigación en salud.
partiendo de los criterios: 

 

Con relación al primer criterio la recomendación es Adicionalmente, se quiere ganar eficiencia en el
siempre tomar la muestra mayor posible. La lógica cálculo del tamaño de la muestra, involucrando
nos indica que entre más grande sea ésta mayor dentro de la fórmula los elementos del tipo de diseño
posibilidad tendrá de ser más representativa y menor implementado en el estudio.
será el error de muestreo, el cual siempre existe.
 Además, si se trata de un estudio exploratorio, los
 requisitos para calcular el tamaño de la muestra son
 menores en cantidad si se les compara con estudios
Fisher plantea que el tamaño de la muestra deberá ser en los que el objetivo sea la evaluación de una
suficiente para permitir un análisis confiable de los intervención.
cruces de variables, para obtener el grado de 
precisión requerido en la estimación de 
proporciones, y para probar si las diferencias entre
proporciones son estadísticamente significativas. El tamaño de la muestra debe ser calculado
siempre en la fase de planeación, para permitir la
Otro de los conceptos básicos planeación adecuada del estudio, para
Otro de los conceptos básicos al usar las herramientas programar las estrategias de recolección,
estadísticas es la diferencia entre los resultados de determinar los costos, preparar las
una muestra seleccionada (estimadores) y el valor intervenciones y procedimientos de evaluación y
poblacional de interés (parámetros). en general para determinar la factibilidad
 general.


Cuando se selecciona una muestra específica, esa

muestra seleccionada es una de las posibles muestras
que se pudo haber seleccionado.
Por esta razón, existen procesos inferenciales que
permiten extrapolar los resultados de una muestra
aleatoria seleccionada a la población de estudio.
22



Cuadro nº 1 : Características comunes de las pruebas
paramétricas.
DEFINICIÓN
1. Independencia de las observaciones a excepción de
Estadística inferencial es el conjunto de métodos
datos pareados.
estadísticos que permiten deducir (inferir) cómo se
distribuye la población bajo estudio, a partir de la 2. Las observaciones para la variable dependiente se
información que proporciona una muestra han obtenido de manera aleatoria de una población
representativa obtenida de dicha población. con distribución normal.
3. La variable dependiente es medida al menos en
La estadística inferencial extrapola los datos ob- una escala de intervalo.
tenidos de una muestra hacia la población de la 4. Se recomienda un tamaño de muestra mínimo de
cual ha sido seleccionada la muestra que hemos 30 sujetos por grupo.
estudiado. 5. Los datos son obtenidos de poblaciones que tienen
varianzas iguales (una varianza no debe ser el doble o
 mayor que la otra).
 6. Habitualmente las hipótesis se hacen sobre
 valores numéricos, especialmente el promedio de
una población (μ), como ejemplo:
CLASIFICACIÓN Ho: μ1 = μ2 H1: μ1 ≠ μ2
7. Otros posibles requisitos: variable independiente
Existen dos tipos básicos de estadística diferencial:
nominal o de intervalo, homocedasticidad (para cada
-Estadística paramétrica
nivel de la variable independiente hay una variación
-Estadistica no-paramétrica
similar de la variable dependiente) y casillas de igual
tamaño.
Estadística paramétrica
Cuadro Nº2 : Valoración de las características de
Es la estadística que se recomienda por tener los datos.
mayor potencia, se trata de técnicas más
1. Determinar el nivel de medida de la variable de
precisas.
interés.
Para que la estadística inferencial proporcione 2. Valorar la distribución de las variables.
buenos resultados debe cumplir con 3 requisitos: • Medidas de tendencia central para cada variable.
• Sesgo y curtosis para cada variable.
-Distribución normal de los datos en la población • Valoración visual de la distribución de los datos.
-Muestra aleatoria (representativa de la población)
• Examinar los diagramas de las probabilidades de
-Datos cuantitativos: contínuos, discretos o de
la distribución.
intervalo o razón.
• Si se considera necesario transformar las
Técnicas paramétricas variables.
• Ver los resultados de la transformación.
 3. Ver la homogeneidad de las varianzas.
 4. Ver el tamaño de muestra total y de los
 subgrupos.

5. Determinar qué prueba estadística paramétrica o
 no paramétrica es la más adecuada.

23
 Con las pruebas no paramétricas se puede trabajar

 con muestras pequeñas de datos categóricos u
 ordinales, independientemente de la distribución de
 las muestras que se desea contrastar.
 
 
 
 
 



Estadística no paramétrica 
Si los procedimientos estadísticos no requieren 
plantear inferencias acerca de los parámetros de la
población (su media y dispersión) se le conoce como
Cuadro Nº 4. Características de las pruebas no
no paramétricos, o de distribución libre (ya que no se
hacen suposiciones acerca de la distribución de la paramétricas.
población de donde procede la muestra. Ventajas
Es la alternativa para cuando no se puedan utilizar 1.Determinación sencilla. Mediante fórmulas
las técnicas paramétricas. simples de combinación.
-No hay requisitos para la muestra 2. Fáciles de aplicar.
-Se pueden utilizar tanto datos cualitativos como Las operaciones matemáticas son la jerarquización,
cuantitativos. conteo, suma y resta.
-Datos cualitativos: nominal u ordinal 3. Rápidas de aplicar.
Cuando las muestras son pequeñas.
Técnicas no paramétricas para datos 4. Campos de aplicación.
cuantitativos A grupos mayores de poblaciones.

 5. Menos susceptibles a la contravención de los
 supuestos. Ya que los supuestos son escasos y
 menos complicados.
Técnicas no paramétricas para datos 6. Tipo de medición requerida. Se pueden utilizar
cualitativos
 con datos ordinales o nominales.
 7. Tamaño de la muestra.
Cuando la muestra es < 10 son sencillas, rápidas y
Cuadro 3. Características comunes de las pruebas sólo un poco menos eficaces. Conforme aumenta el
no paramétricas. tamaño de la muestra se hacen más laboriosas y
tardadas, y menos efectivas.
1. Independencia de las observaciones aleatorias a
8. Efectividad estadística.
excepción de datos pareados.
2. Pocas asunciones con respecto a la distribución
Cuando se satisfacen los supuestos de la prueba no
de la población. paramétrica son igual de efectivas. Si se satisfacen los
3. La variable dependiente es medida en escala supuestos de una prueba paramétrica con muestras
categórica. pequeñas son un poco menos efectivas y se vuelven
4. El punto primario es el ordenamiento por rangos menos eficaces a medida que aumenta el tamaño de
o por frecuencias. muestra.
5. Las hipótesis se hacen sobre rangos, mediana o 
frecuencias de los datos. 

6. El tamaño de muestra requerido es menor (20 o

<).
24
 Luego de responder las 4 preguntas podemos

 identificar cual es la prueba estadística que le
corresponde.
ANALISIS ESTADÍSTICO 





CASO: Se compara la talla promedio entre 2 grupos

de niños que recibieron distintos patrones de
alimentación. Cada grupo comprendía 25 niños.
Señale la prueba de significación estadística más
apropiada para analizar los datos:
a)Prueba de Chi cuadrado
bPrueba “Z”
cPrueba “t” de student
dPrueba de Spearson
ePrueba de Mc Nemar
Tabla Nº1 Técnicas de análisis estadístico

 Comentario
 Para resolver este caso es necesario formular varias
 preguntas:
 
Preguntas básicas en el análisis estadístico 
1º ¿Qué tipo de muestra nos están presentando en el Cuando estamos frente a un problema y no nos dicen
problema? ¿La muestra es independiente o que la muestra es dependiente o independiente
dependiente? debemos asumir que es independiente.
Independiente: la selección de los elementos no 
depende de la selección de otras unidades o 
elementos. 

 En el caso que estamos viendo no nos indican si la
En este caso tenemos muestras pareadas. Por muestra es dependiente o independiente por lo que
ejemplo: si estamos haciendo un muestreo de tipo asumimos que es una muestra independiente.
pareado por una variable que nos interesa (por 
ejemplo el sexo), si selecciono un sujeto del sexo 
femenino el siguiente sujeto también tiene que ser La variable que se va a comparar es la talla , la cual es
femenino. El máximo grado de apareamiento lo una variable de tipo cuantitativa.
tendremos cuando estamos haciendo estudios en los 
cuales los sujetos son grupo control y grupo de 
intervención. En este ejemplo nos dicen explícitamente que se
están comparando 2 grupos.
2º ¿Es una variable cualitativa o cuantitativa? 
3º ¿Cuántos grupos se están comparando en el 
problema? En este ejemplo no nos indican el tipo de distribución
4º ¿Qué tipo de distribución tiene la variable que nos de los datos, pero si nos dicen de manera implícita
están presentando? que los datos tienen distribución normal, cuando nos
25
indican que lo que se va a comparar es la talla por eso que tenemos que ir a las alternativas de la
promedio o sea la media de la talla. respuesta.
Si se van a comparar 2 medias , la condición es que
tengan una distribución normal. a)Test de la t de Student para datos independientes
 La T de Student para datos independientes se usa
cuando las muestras son independientes.
 En este ejemplo la muestra es dependiente por lo que
 no es el test estadístico apropiado.

b)Análisis de varianza
 Lo utilizamos cuando queremos comparar 2 ó más
 grupos , la variable independiente es de tipo
 cuantitativa pero el tipo de muestra también tiene
que ser independiente por lo tanto no es la alternativa
correcta.
CASO: En un ensayo clínico se comparan las cifras
de glucosa en una muestra de sujetos c)Test de la t de student – Fisher para los datos
representativa de una comunidad antes y después apareados
de la aplicación de un determinado tratamiento La T de Student para datos pareados se usa cuando:
hipoglucemiante cuya eficacia queremos 
comprobar ¿Cuál prueba estadística es más 
adecuada para analizar los datos obtenidos? 
a)Test de la t de Student para datos independientes 
b)Análisis de varianza Por lo que es la alternativa correcta.
c)Test de la t de student – Fisher para los datos
apareados d)Test de comparaciones múltiples
d)Test de comparaciones múltiples Se utiliza después de realizar el Test de ANOVA para
e)Chi – cuadrado ver si hay alguna diferencia entre las medias que se
están comparando. El test de ANOVA nos dice que
hay una diferencia significativa entre las medias que
se están comparando y el Test de comparaciones
múltiples nos dice entre que medias hay esa
diferencia significativa. Es falsa.
e)Chi – cuadrado
Comentario Se utiliza para variables de tipo cualitativo
Para resolver este caso es necesario formular varias
preguntas: Estadística paramétrica

Como es un estudio “antes y después” los sujetos son Estadística paramétrica
los mismos, por lo que es una muestra de tipo Cuando se pretende probar una hipótesis respecto
dependiente. a uno o más parámetros de una población que
 tiende a una distribución normal, las pruebas
 usadas son las de la estadística paramétrica, como
Lo que se quiere comparar son los niveles de glucosa la t de Student (cuadro Nº2)
, la cual es una variable cuantitativa.
 Aunque la potencia de las pruebas estadísticas
 paramétricas es mayor que la que ofrecen las
A pesar que el estudio es de un solo grupo de sujetos, pruebas no paramétricas, ya que con ellas se tiene la
se consideran como 2 grupos debido a que los mismos probabilidad de rechazar la hipótesis nula cuando
sujetos están antes de la intervención y después de la ésta realmente es falsa (error de tipo II: 1-β).
misma se vuelve a hacer la medición. El adecuado tamaño de la muestra es un requisito
 indispensable para aumentar la eficacia de una
 prueba: a medida que aumenta el tamaño de
En este caso no se menciona ni implícita ni muestra, disminuye la posibilidad de cometer el error
explícitamente cual es la distribución de los datos , es de tipo II.
26
Tabla Nº 2. Pruebas paramétricas y su 

alternativa no paramétrica. 
Esto quiere decir que si la variable no es dicotómica
se deben colapsar los datos en 2 categorías
mutuamente excluyentes.



Esta proporción teórica puede venir de registros
públicos, censos o investigaciones previas. La
prueba binomial está indicada cuando la variable a
ser examinada es dicotómica, es especialmente útil
en casos de tamaño de muestra pequeños, que no
cumplen los requisitos de la bondad de ajuste de la
Ji cuadrada.

Prueba de las rachas
La prueba de las rachas mide hasta qué punto en una
Es conveniente comentar que el adecuado tamaño de variable dicotómica la observación de uno de sus
muestra es un requisito indispensable para aumentar atributos puede influir en las siguientes
la eficacia de una prueba. observaciones; es decir, si el orden de ocurrencia en
la observación de uno de los atributos de una
PRUEBAS CON UNA SOLA MUESTRA variable dicotómica ha sido por azar.
Ji cuadrada
Esta prueba de hipótesis se usa para comparar la

posible diferencia entre las frecuencias observadas

en la distribución de una variable con respecto a las
esperadas, en razón de una determinada hipótesis.
Una serie de datos en los que hay muchas o pocas
Prueba binomial rachas, hacen pensar que éstas no han ocurrido por
La prueba binomial compara las frecuencias azar. Alternativa: para probar que dos muestras
observadas en cada una de las dos categorías de una vienen de poblaciones con las mismas distribuciones,
variable dicotómica con respecto a las frecuencias se emplea la prueba de rachas sugerida por Wald-
esperadas bajo una distribución binomial que tiene Wolfowitz.
un parámetro de probabilidad específico que, por
defecto, para ambas categorías es 0.5. Prueba de Kolmogorov-Smirnov
Para cambiar las probabilidades se puede ingresar Para una muestra
una proporción de la prueba para el primer grupo
por lo que la probabilidad para el segundo será La prueba se usa para definir si el grado de ajuste
1 menos la probabilidad especificada para el primero. de los datos a una distribución teórica: que
 puede ser con tendencia a la normal, a la de
 Poisson o exponencial.

 La prueba Z de Kolmogorov-Smirnov (K-S), se
 computa a partir de la diferencia mayor (en valor
 absoluto) entre la distribución acumulada de una
muestra (observada) y la distribución teórica.
Se asume que:
 La bondad de ajuste de la muestra permite suponer
 de manera razonable, que las observaciones pudieran
27
corresponder a la distribución específica. La Es la alternativa no paramétrica a la comparación de

contribución de Kolmogorov corresponde al dos promedios independientes a través de la t de
problema relacionado con una sola muestra, Student.
mientras que la de Smirnov se ocupa de responder al 
problema respecto a dos muestras, tratando de 
probar la hipótesis de igualdad entre las poblaciones 
de origen de una con respecto a la de la otra. 

La prueba de K-S no precisa que las observaciones 
sean agrupadas (como es el caso de la Ji cuadrada). Tiene tres asunciones:

Se usa en cualquier muestra de cualquier tamaño, 
mientras que la Ji cuadrada requiere muestras con un 
tamaño mínimo. Esta prueba no se debe usar cuando 
los parámetros tienen que ser estimados a partir de 
la población y es útil, especialmente cuando se

conoce la estructura en que subyace la distribución

de la variable en estudio. Es más poderosa que la Ji

cuadrada, especialmente cuando el tamaño de la

muestra es pequeño y el nivel de medición de la
variable es ordinal. 
 

 

Alternativa: No hay opción paramétrica. Una El número de pares debe ser pequeño en relación al
alternativa no paramétrica es la prueba de bondad de número total de observaciones. Si las poblaciones son
ajuste de Ji cuadrada. idénticas en situación, los rangos deben mezclarse al
azar entre las dos muestras.
PRUEBAS DE DOS MUESTRAS Se calcula el número de veces que una cuenta del
INDEPENDIENTES grupo 1 precede una cuenta del grupo 2 y el número
de veces que una cuenta del grupo 2 precede una
Las pruebas de dos muestras independientes cuenta del grupo 1.
comparan dos grupos de casos con una variable.

Hay disponibles cuatro pruebas para ver si las dos 
muestras independientes (grupos) vienen de la
misma población y son: t de Student
 Es la alternativa paramétrica para muestras
independientes, que es más poderosa que la U de

Mann-Whitney cuando se llenan todas las asunciones,

mientras que si los datos no se distribuyen

normalmente, el tamaño de muestra es pequeño, los
grupos son de diferente tamaño.
U de Mann-Whitney

Es la más popular de las pruebas para el estudio de

dos muestras independientes.

Es equivalente a la prueba de suma de rangos de
Una alternativa no paramétrica que puede ser
Wilcoxon y a la prueba de dos grupos de Kruskal-
utilizada, sobre todo si las colas de la distribución no
Wallis. son similares es la prueba de la mediana.
28
Prueba Z de Kolmogorov-Smirnov
Está basada en la diferencia absoluta máxima entre la
función de distribución acumulada observada para
ambas muestras.
Cuando esta diferencia es significativamente grande,
las dos distribuciones son consideradas diferentes. La
prueba de las reacciones extremas de Moses asume
que la variable experimental afecta algunos sujetos
en una dirección y otros sujetos en la dirección
opuesta.






Prueba de rachas de Wald-Wolfowitz

Es una alternativa no paramétrica para contrastar si
dos muestras con datos independientes proceden de
poblaciones con la misma distribución. Combina y
acomoda las observaciones de ambos grupos.
Si las dos muestras son de la misma población, los
dos grupos deben distribuirse al azar a lo largo de la
clasificación jerárquica. Si hay pocas rachas habla de
que se tratan de grupos diferentes mientras que, si
hay muchas rachas no hay diferencias significativas
en la distribución de los dos grupos.




MIR: Un investigador está interesado en determinar

si existe una asociación entre las cifras de tensión
arterial diastólica (medida en mm de Hg) y los
niveles de colesterol (medidos en mgr/ml). Para ello,
ha realizado estas mediciones a 230 voluntarios.
¿Qué prueba estadística es la más apropiada para
examinar esta asociación?:
a)Regresión logística.
b)Prueba de la t.
c)Prueba de chi cuadrado.
d)Correlación de Pearson.
e)Prueba de Fisher.
Rpta. D
29



La hipótesis alternativa (H1) es
Prueba de hipótesis cualquier hipótesis que difiera
de la hipótesis nula. Es una
Definición afirmación que se acepta si los
datos maestrales proporcionan
Es el método para desarrollar un procedimiento para
evidencia suficiente de que la
probar la validez de una aseveración acerca de un
parámetro poblacional . hipótesis nula es falsa.




 
 
 


Objetivo
Nivel de significacia: Probabilidad de rechazar la
El propósito de la prueba de hipótesis no es cuestionar hipótesis nula cuando es verdadera.
el valor calculado del estadístico (muestral), sino hacer
Se le denota mediante la letra griega α, también es
un juicio con respecto a la diferencia entre estadístico de
denominada como nivel de riesgo.
muestra y un valor planteado del parámetro.

Procedimiento sistemático para una prueba

de hipótesis de una muestra

 

Si suponemos que la hipótesis planteada es
La hipótesis nula (Ho) verdadera, entonces, el nivel de significación
se refiere siempre a un indicará la probabilidad de no aceptarla, es decir, que
valor especificado del estén fuera del área de aceptación.
parámetro de pobla-
ción, no a una esta- Nivel de confianza (1-α): indica la probabilidad de
dística de muestra. aceptar la hipótesis planteada, cuando es verdadera
en la población.
La letra H significa hipótesis y el subíndice
cero no hay diferencia. La distribución de muestreo de la estadística de
prueba se divide en dos regiones:
Por lo general hay un "no" en la hipótesis nula que
indica que "no hay cambio" Podemos rechazar o -Región de rechazo (conocida como región crítica)
aceptar la Ho. -Región de no rechazo (aceptación).
Si la estadística de prueba cae dentro de la región de

aceptación, no se puede rechazar la hipótesis nula.

 La región de rechazo puede considerarse como
 el conjunto de valores de la estadística de prueba que
 no tienen posibilidad de presentarse si la hipótesis nula
 es verdadera.
30
 Decisión correcta


Una decisión correcta se presenta si la hipótesis nula

Ho es falsa y es rechazada por el test de significancia.
Tipos de errores Una decisión correcta también se presenta si la
Cuando realizamos una prueba de hipótesis estamos hipótesis nula Ho es verdadera y no es rechazada por
haciendo un test de significancia para ver si la hipótesis el test de significancia (FIg. 1)
nula es verdadera o falsa. Error tipo I (alfa)
 Una error tipo I se presenta si la hipótesis nula Ho es
 verdadera (en el estado real) y es rechazada por el
 test de significancia (FIg. 2)
Cualquiera sea la decisión tomada a partir de una Nivel de significancia
prueba de hipótesis, ya sea de aceptación de la Ho o de
la Ha, puede incurrirse en error. También se conoce al error de tipo I como nivel de
significancia y por convención se considera que este
Error tipo I error de significancia debe ser de 5%.
Un error tipo I se presenta si la hipótesis nula Ho Nivel de confianza
siendo verdadera es rechazada por el test de
significancia (Fig 1) Es el complemento del nivel de significancia, cuyo
valor debe ser de 95%:
La probabilidad de
cometer un error tipo I se La suma del nivel de significancia más el nivel de
denomina con la letra alfa confianza siempre debe ser 100%, lo que gana uno
α. de ellos lo pierde el otro. Ejemplo: si el nivel de
significancia aumenta a 10% , el nivel de confianza
Error tipo II disminuye a 90%).
Un error tipo II, se denota
con la letra griega β se
presenta si la hipótesis nula
es aceptada cuando de hecho
es falsa y debía ser
rechazada (Fig. 1)


Fig 2. Otros tipos de error

Error tipo II (beta)
Una error tipo II se presenta si la hipótesis nula Ho es
falsa (en el estado real) y no es rechazada por el test
de significancia (FIg. 2)
Fig 1. Tipos de error

31
Por convención el error de tipo II tiene un valor de Si aplicamos lo anterior a Salud tenemos:
20%.
-Cuando la hipótesis nula es falsa y el test de
Potencia significancia la rechaza es un decisión correcta.
Es el complemento del error de tipo 2, su valor es de -Cuando la hipótesis nula es verdadera y el test
80%. de significancia no la rechaza también es un
decisión correcta.
Si incrementamos el valor del error de tipo II la
potencia disminuye. Error de tipo II
Si aumentamos la potencia se disminuye la -Cuando la hipótesis nula es falsa y el test de
probabilidad de cometer un error de tipo II. significancia no la rechaza es un error de tipo II.
La suma de la potencia más el error de tipo II Si estamos probando la eficacia de un
siempre debe dar 100% tratamiento, de una droga A sobre una droga B ,
Ejemplo: en este caso se comete un error de tipo II cuando
decimos que el tratamiento si tiene un efecto
Tenemos un reo en la vida real, que puede ser pero no lo percibimos. Es decir que hay diferencia
inocente o culpable y un juez que da el veredicto. entre el tratamiento A y B pero la prueba de
 significancia dice que no hay diferencia, no se
 rechaza la hipótesis nula. Se busca un
tratamiento alternativo y no hay consecuencias
adversas para el paciente.
Error de tipo I (alfa)
-Cuando en la vida real el tratamiento no tiene

efecto pero el test de significancia nos dice que si
tiene efecto , es decir rechazamos la hipótesis
nula. Este error es más grave que el error de tipo
II porque se está dando al paciente una droga
que en la vida real no tiene efecto para la
Fig. 3 Ejemplo de tipo de error
enfermedad que estamos tratando . Se le da
Decisión correcta porque la prueba de significancia nos dice que si
tiene efecto.
Tenemos 2 posibilidades:
Se produce cuando en la vida real el reo es realmente
inocente y el veredicto del juez dice que es inocente.
Se produce también cuando en la vida real el reo es
culpable y el veredicto del juez dice que es culpable.
Error
Se produce también cuando en la vida real el reo es
culpable y el veredicto del juez dice que es inocente.
Error más grave
Se produce cuando en la vida real el reo es inocente y el
veredicto del juez dice que es culpable.
Fig. 4 Ejemplo de tipo de error
32
Ejemplo: Términos estadísticos

Pregunta: Al comparar dos medias muestrales el  es la
rechazo de una hipótesis nula, que es verdadera, nos probabilidad de que nuestro resultado sea
lleva a cometer un ERROR conocido como _________. correcto: Probabilidad = (1-α) ó 95%
a. Beta o Tipo II
 es el máximo error que
b. Aleatorio estamos dispuestos a aceptar como válida
c. Estándar nuestra hipótesis. Es el error tipo I o α.
d. Alfa o tipo I Probabilidad : 5%
e. Sistemático  significancia estadística ,es la
cuantificación probabilística de error tipo I.
 representa la
probabilidad de observar en la muestra una
determinada diferencia y efecto, si existe en la
población.
¿Cómo nos protegemos contra el error tipo
I?
p < 0,05 protege contra el error tipo I debido al
chance. No garantiza protección contra el error tipo I
debido a sesgo o confusión
Comentario:

Estamos frente a una hipótesis nula que es verdadera 
y que ha sido rechazada por el test de significancia. Se
¿Cómo nos protegemos contra el error tipo
trata de un error alfa (tipo I). II?
-Estimando un tamaño de muestra adecuado
Factores que influyen en el poder -Estableciendo grandes diferencias en nuestras
estadístico de un estudio. hipótesis
El tamaño de la muestra a estudiar: A > tamaño
muestral, > potencia estadística de un estudio. La probabilidad de cometer un error de tipo II
denotada con la letra griega beta β, depende de
 la diferencia entre los valores supuesto y real del

parámetro de la población. Como es más fácil
 encontrar diferencias grandes, si la diferencia
 entre la estadística de muestra y el
Para que cualquier ensayo de hipótesis sea correspondiente parámetro de población es
bueno, debe diseñarse de forma que minimice grande, la probabilidad de cometer un error de
los errores de decisión. La única forma de reducir tipo II, probablemente sea pequeña.
ambos tipos de errores es incrementar el tamaño 
de la muestra, lo cual puede ser o no ser posible. 
El nivel de significación estadística: Si se disminuye el 
valor de α también se disminuye el poder de la 
prueba. 
.
Es decir, si disminuimos la probabilidad de cometer
un error de tipo I, aumentamos la probabilidad de Existe una relación inversa entre la magnitud de los
cometer un error de tipo II. Se debe encontrar un errores α y β: conforme a aumenta, β disminuye. Esto
punto de “equilibrio” de cometer ambos errores. obliga a establecer con cuidado el valor de a para las
Habitualmente se trabaja con un nivel de pruebas estadísticas. Lo ideal sería establecer α y β.
significación de 5% y un poder de 80%.
En la práctica se establece el nivel α y para disminuir
el Error β se incrementa el número de observaciones
33
en la muestra, pues así se acortan los límites de

confianza respecto a la hipótesis planteada .
¿Cómo incrementamos la potencia de un
estudio?
-Incrementando el tamaño de muestra
-Estimando un tamaño de muestra adecuado
-Utilizando el método más preciso y exacto (menor
variabilidad) para medir la exposición y el efecto
La meta de las pruebas estadísticas es rechazar la En las pruebas de hipótesis para la media (μ), cuando se
hipótesis planteada. Es deseable aumentar conoce la desviación estándar (σ) poblacional, o cuando
cuando ésta es verdadera, o sea, incrementar lo el valor de la muestra es grande (30 o más), el valor
que se llama poder de la prueba (1- β). estadístico de prueba es z y se determina a partir de:
La aceptación de la hipótesis planteada debe

interpretarse como que la información aleatoria de
la muestra disponible no permite detectar la
falsedad de esta hipótesis. El valor estadístico z, para muestra grande y
desviación estándar poblacional desconocida se
 determina por la ecuación:
Este valor es determinado a partir de la información
muestral, que se utiliza para determinar si se rechaza
la hipótesis nula , existen muchos estadísticos de
prueba para nuestro caso utilizaremos los En la prueba para una media poblacional con
estadísticos z y t. muestra pequeña y desviación estándar poblacional
 desconocida se utiliza el valor estadístico :



Tipos de prueba
 la hipótesis 
planteada se formula con la igualdad Se establece las condiciones específicas en la que se
Ejemplo rechaza la hipótesis nula y las condiciones en que no
se rechaza la hipótesis nula.
H0 : µ = 200
La región de rechazo define la ubicación de todos los
H1 : µ ≠ 200 valores que son tan grandes o tan pequeños, que la
probabilidad de que se presenten bajo la suposición
de que la hipótesis nula es verdadera, es muy remota.
 la hipótesis
planteada se formula con ≥ o ≤
H0 : µ ≥ 200 H0 : µ ≤ 200
H1 : µ < 200 H1 : µ > 200
34
Distribución muestral del valor estadístico z, con Supongamos que tenemos un número k de clases en
las cuales se han ido registrado un total de n
prueba de una cola a la derecha observaciones (n será el tamaño muestral).
 Es el punto de división entre la región Denotaremos las frecuencias observadas en cada
clase por O1, O2, ..., O k
en la que se rechaza la hipótesis nula y la región en la
que no se rechaza la hipótesis nula. (Oi es el número de valores en la clase Ai ). Se
cumplirá:
Paso 5: Tomar una decisión.
E1 + E2 + ... + E k = n
En este último paso de la prueba de hipótesis, se
calcula el estadístico de prueba, se compara con el
valor crítico y se toma la decisión de rechazar o no la
hipótesis nula.
Tenga presente que en una prueba de hipótesis solo

se puede tomar una de dos decisiones: aceptar o
rechazar la hipótesis nula. Se tratará ahora de decidir si las frecuencias
observadas están o no en concordancia con las
Debe subrayarse que siempre existe la posibilidad de
frecuencias esperadas (es decir, si el número de
rechazar la hipótesis nula cuando no debería haberse
resultados observados en cada clase corresponde
rechazado (error tipo I). También existe la posibilidad
aproximadamente al número esperado). Para
de que la hipótesis nula se acepte cuando debería
comprobarlo, haremos uso de un contraste de
haberse rechazado (error de tipo II)
hipótesis usando la distribución Chi-cuadrado:
Prueba de CHI CUADRADO
El estadístico de contraste será
Es una de las pruebas estadísticas más utilizadas ,va a
depender si tiene una ó 2 variables.

 Observar que este valor será la suma de k números
no negativos.


El numerador de cada término es la diferencia entre la
frecuencia observada y la frecuencia esperada. Por
tanto, cuanto más cerca estén entre sí ambos valores
más pequeño será el numerador, y viceversa.
El denominador permite relativizar el tamaño del
numerador.

χ2 


Por el contrario, valores grandes de este

estadístico indicarán falta de concordancia entre
Fig.5 Test de Chi cuadrado las observaciones y lo esperado.
En este tipo de contraste se suele rechazar la
PRUEBA DE BONDAD DE AJUSTE hipótesis nula (los valores observados son
Cuando queremos decidir , a partir de una muestra, si coherentes con los esperados) cuando el
la población sigue (“ajusta”) una determinada estadístico es mayor que un determinado valor
distribución (problema de bondad de ajuste).
crítico.
35
Prueba de HOMOGENEIDAD de pertenecer un individuo a cada una de las

Cuando queremos decidir si dos o más muestras categorías podemos utilizar:
provienen de la misma poblacional ¿Estas muestras
provienen de poblaciones con la misma distribución?
Estamos interesados en determinar si los datos

correspondientes a dos o más muestras aleatorias Observar que este valor será la suma de n*k números
provienen de la misma población. Nuevamente el no negativos.
conjunto de posibles valores de las observaciones se El numerador de cada término es la diferencia entre la
divide en k conjuntos disjuntos: A1, A2, ..., Ak. frecuencia observada y la frecuencia esperada. Por
; clasificando en ellos las observaciones de cada tanto, cuanto más cerca estén entre sí ambos valores
muestra. Si nij representa el número de más pequeño será el numerador, y viceversa.
observaciones de la muestra i que pertenecen al El denominador permite relativizar el tamaño del
conjunto Aj , los datos pueden tabularse en lo que se numerador.
denomina una tabla de contingencia. Las ideas anteriores sugieren que, cuanto menor sean
el valor del estadístico ∗χ2, más coherentes serán las
observaciones obtenidas con los valores esperados.
Por el contrario, valores grandes de este estadístico
indicarán falta de concordancia entre las
observaciones y lo esperado. En este tipo de
contraste se suele rechazar la hipótesis nula (los
valores observados son coherentes con los
esperados) cuando el estadístico es mayor que un
determinado valor crítico
Prueba de INDEPENDENCIA
La hipótesis de que las m poblaciones son
homogéneas, se traduce en que cada conjunto Aj debe Se trata de contrastar si dos variables cualitativas
tener una probabilidad teórica pj , desconocida, pero son independientes (es decir, si existe relación entre
que no varía de la población i a la población i’. Esto ellas), o no. Por ejemplo:
debe verificarse para todas las categorías, i.e., las ¿Los hábitos de lectura de los padres influyen en los
hábitos de lectura de los hijos?
categorías deben ser homogéneas en las diversas
muestras.
Estamos interesados en determinar si dos cualidades
Del mismo modo que la Prueba de Bondad de Ajuste,
o variables referidas a individuos de una población
en este caso debemos comparar las frecuencias
están relacionadas. Se diferencia de los contrastes
observadas en cada una de las muestras y para cada
anteriores en que en este caso estamos interesados
categoría con las frecuencias bajo el supuesto de
en ver la relación existente entre dos variables de una
homogeneidad en las poblaciones.
misma población, no queremos contrastar la
En este caso las frecuencias observadas corresponde
distribución teórica de una variable (prueba de
al número de individuos de la muestra i en la clase j,
bondad de ajuste) ni en comparar la distribución de
i.e., nij
una única variable en dos poblaciones (prueba de
El estadístico de contraste será
homogeneidad).
Supongamos que de n elementos de una población se
han observado dos características X e Y,
obteniéndose una muestra aleatoria simple
bidimensional (X1,Y1),(X2,Y2),...,(Xn,Yn). Sobre la
Donde eij es la frecuencia esperada bajo el supuesto
base de dichas observaciones se desea contrastar si
de homogeneidad, que puede representarse como ni
las características poblacionales X e Y son
Pj , es decir, el número de individuos en la muestra i
independientes o no. Para ello se dividirá el conjunto
por la probabilidad de que ocurra la característica j
de posibles valores de X en k conjuntos disjuntos
en la población. Para el cálculo de las probabilidades
36
A1,A2,...,Ak; mientras que el conjunto de posibles A los totales se les llama totales marginales
valores Y será descompuesto en r conjuntos 
disjuntos: B1,B2,...,Br 
. Al clasificar os elementos de la muestra, aparecerá
un cierto número de ellos,
ijn , en cada una de las k × r clases así constituidas,
dando lugar a una tabla de contingencia de la forma:
Al igual que para el Test de homogeneidad, el

estadístico del contraste será: En este caso vamos a estimar las frecuencias
esperadas para las 4 celdas a, b, c y d y obtenemos los
totales marginales de las filas y de las columnas .


Hay una fórmula para obtener estas frecuencias que
consiste en multiplicar los tatoles marginales
EJEMPLO: Hemos preguntado a un grupo de 20 dividiendo entre el total de observación.
hombres y 20 mujeres si fumaban o no. ¿Crees que 
hay diferencias significativas entre ambos sexos? 







Tenemos una tabla con la distribución de los 20

hombres y 20 mujeres. El total de los hombres y
mujeres están en las columnas y en las filas el total de
los que fuman y los que no fuman. En total son 40
sujetos.
37
¿Cómo obtenemos el Chi cuadrado? a)t de Student para datos independientes.

El Chi cuadrado es igual a la sumatoria de las b)Análisis de la varianza de medidas repetidas.
frecuencias observadas (Oi) menos las frecuencias c)Chi-cuadrado.
esperadas (Ei) elevadas al cuadrado sobre las
frecuencias esperadas. d)t de Student para datos apareados.
e)Análisis de la varianza.

Rpta. C






Los valores esperados en cualquiera de las celdas
siempre deben de ser > o = a 5
Si en una de las celdas el valor es menor a 5 NO
podemos utilizar el valor del Chi cuadrado.,
debiéndose usar la prueba de Fisher exact ( más
frecuentemente utilizado) o la prueba de Corrección
de yates.
OF: En un estudio que compara la eficacia de dos

fármacos no se observa una diferencia
estadísticamente significativa entre ellos. Si en
realidad ambos tratamientos fueran diferentes,
todos los siguientes factores podrían explicar por
qué se ha obtenido un resultado "falso negativo",
EXCEPTO uno. Señálelo:
a)Error tipo alfa.
b)Error tipo beta.
c)Potencia estadística insuficiente.
d)Número de sujetos estudiados insuficiente.
e)Existencia de un sesgo en la comparación.
Rpta. A
OF: En un contraste de hipótesis, la potencia es la

probabilidad de:
a)Rechazar la hipótesis nula siendo cierta.
b)Rechazar la hipótesis nula siendo falsa.
c)Aceptar la hipótesis alternativa.
d)Que la hipótesis alternativa sea verdadera.
e)Que la hipótesis nula sea falsa.
Rpta. B
OF: Un ensayo clínico evalúa dos pautas

terapéuticas en pacientes hipertensos. Para
comparar los porcentajes de pacientes controlados
observados en cada grupo a los 6 meses de
tratamiento, ¿qué prueba estadística le parece más
adecuada?:
38

Manual Bioestadiacutestica Plus Medic A PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Manual Bioestadiacutestica Plus Medic A PDF

Cargado por

Copyright:

Formatos disponibles

Manual de Bioestadística, Salud Pública y Epidemiología RM PLUS MEDIC A

MANUAL de BIOESTADÍSTICA , SALUD

Paul Pachas Chávez MD, MPH (c), MSc(c)

José castro Zevallos

Carátula: Edy Flores Valdeiglesias

Derechos Reservados 2012

INTRODUCCIÓN  

Si, mediante el gráfico, se intenta comparar varias

Representamos en el eje de ordenadas las 

GRÁFICOS para variables CUANTITATIVAS

¿Cuándo usarla? si la distribución de los datos es

Pasos para encontrar la mediana:

décima observaciones, es decir 43 y 44. La mediana Estadísticos de DISPERSIÓN

Pregunta: En nueve familias encuestadas los

Pregunta: Un jefe de servicio desea considerar un

OF : En un estudio en que se ha medido la intensidad

¡Estudiar a la población de bañistas de una

Es un subgrupo de la población total.

Una muestra correctamente seleccionada puede 

 Unidad de información

Dentro del marco muestral se va a 

Selección de una muestra Validez externa

Supone que no existen razones para considerar que

Debido a estas importantes características, las

Forma de seleccionar una muestra Fig 1. Muestreo aleatorio simple

La aplicación de este procedimiento requiere resulta de la suma de  y así sucesivamente

 Fig.2 Muestreo aleatorio sistemático

La característica de interés en el estudio varía Afijación proporcional: La distribución del tamaño de

Afijación Óptima: Requiere conocer además del

Ignorar la heterogeneidad que presenta la

Existen diferentes formas de realizar la selección de

En el ejemplo de la fig. 3 estamos formando 2 

Muestreo por CONGLOMERADOS o Complejos Fig.4 Muestreo por conglomerados

Más datos: Uno de los criterios durante la planeación de la

Cuando se selecciona una muestra específica, esa

 Con las pruebas no paramétricas se puede trabajar

 Luego de responder las 4 preguntas podemos

CASO: Se compara la talla promedio entre 2 grupos

Tabla Nº 2. Pruebas paramétricas y su 

corresponder a la distribución específica. La Es la alternativa no paramétrica a la comparación de

Prueba de rachas de Wald-Wolfowitz

MIR: Un investigador está interesado en determinar

 Decisión correcta

Fig 2. Otros tipos de error

Fig 1. Tipos de error

Error de tipo I (alfa)

-Cuando en la vida real el tratamiento no tiene

Fig. 4 Ejemplo de tipo de error

Ejemplo: Términos estadísticos

en la muestra, pues así se acortan los límites de

La aceptación de la hipótesis planteada debe

Tenga presente que en una prueba de hipótesis solo

Por el contrario, valores grandes de este

Prueba de HOMOGENEIDAD de pertenecer un individuo a cada una de las

Estamos interesados en determinar si los datos

Al igual que para el Test de homogeneidad, el

Tenemos una tabla con la distribución de los 20

¿Cómo obtenemos el Chi cuadrado? a)t de Student para datos independientes.

OF: En un estudio que compara la eficacia de dos

OF: En un contraste de hipótesis, la potencia es la

OF: Un ensayo clínico evalúa dos pautas

También podría gustarte