Está en la página 1de 38

Manual de Bioestadstica, Salud Pblica y Epidemiologa RM PLUS MEDIC A

www.plus-medica.com
























































BIOESTADSTICA

Manual de Bioestadstica, Salud Pblica y Epidemiologa RM PLUS MEDIC A
www.plus-medica.com









1 Edicin








Paul Pachas Chvez MD, MPH (c), MSc(c)




Jos castro Zevallos





Ramn Flores Valdeiglesias







Cartula: Edy Flores Valdeiglesias

Derechos Reservados 2012

Prohibida su venta



MANUAL de BIOESTADSTICA , SALUD
PBLICA, y EPIDEMIOLOGA
PLUS MEDIC A
Mdico epidemilogo
Instituto Nacional de Salud
Ministerio de Salud

Mdico internista
Asistente del Dpto de Medicina del Hospital Nacional Dos de Mayo
Docente de la Universidad Cientfica del Sur
Docente de la Universidad San Juan Baustista

Mdico internista
Asistente del Dpto de Medicina del Hospital Nacional Dos de Mayo
Docente de la Universidad Ricardo Palma
Docente de la Universidad Cientfica del Sur

Manual de Bioestadstica, Salud Pblica y Epidemiologa RM PLUS MEDIC A
www.plus-medica.com




Este manual est dedicado a los estudiantes de Medicina Humana y a los mdicos
jvenes de las diferentes universidades de Lima y de nuestro Per, que se esfuerzan
da a da en busca del conocimiento mdico actualizado y que son fuente de
inspiracin y razn de ser de PLUS MEDIC A.

Los autores











































Manual de Bioestadstica, Salud Pblica y Epidemiologa RM PLUS MEDIC A
www.plus-medica.com




Contenido


1. Estadstica. Generalidades .. 6
1.1 Tipos de estadstica
1.2 Poblacin
1.3 Parmetro
1.4 Estadstico
2. Estadstica descriptiva 21
2.1 Variables
2.2 Grficos para variables cualitativas
2.3 Grficos para variables cuantitativas
2.4 Medidas de posicin y de dispersin
3. Diseo y anlisis del muestreo . 37
3.1 Poblacin o universo
3.2 Muestra
3.3 Marco muestral, unidad de muestreo, unidad de informacin y unidad de anlisis.
3.4 Muestreo
3.5 Muestreo probabilstico
3.6 Muestreo no probabilstico
3.7 Tamao muestral
4. Estadstica inferencial .... 42
4.1 Estadstica paramtrica
4.2 Estadstica no paramtrica
4.3 Anlisis estadstico
4.4 Pruebas con dos muestras independientes
5. Contraste de hiptesis........ 56
5.1 Hiptesis nula, hiptesis alternativa y grado de significacin estadstica
5.2 Errores alfa y beta
5.3 Pruebas de significacin estadstica
5.4 Prueba de Chi cuadrado















MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

5




INTRODUCCIN
La estadstica es una serie ordenada de mtodos que
se ocupan de la recoleccin, organizacin,
presentacin, anlisis e interpretacin de datos
numricos.

Cmo se clasifica la estadstica?
Estadstica DESCRIPTIVA
Se utiliza para describir la frecuencia y distribu-
cin de las caractersticas (o variables) del objeto
en estudio.
Utiliza tcnicas para recolectar, resumir, analizar
presentar un conjunto de datos, a travs de tablas o
grficos, con la finalidad de describir
apropiadamente las caractersticas de ese conjunto.

Estadstica INFERENCIAL
Se ocupa del proceso metdico para obtener con-
clusiones vlidas de una muestra, con respecto a la
poblacin, de manera tal que se le pueda conside-
rar representativa de ella.
Comprende las tcnicas matemticas que permiten
generalizar la informacin obtenida de una muestra
a la poblacin. Debido a que las decisiones se toman
en condiciones de incertidumbre, sern confiables
con cierto grado de probabilidad.

POBLACIN
Es el conjunto total de
individuos, objetos o medidas
que poseen algunas
caractersticas comunes obser-
vables en un lugar y en un
momento determinado.
La poblacin incluye los elementos que portan in-
formacin del fenmeno que se estudia (sobre el
que se hace inferencia).
Normalmente es demasiado grande para estudiarla
en su totalidad.

Cuando se vaya a llevar a cabo alguna investigacin
debe de tenerse en cuenta algunas caractersticas
esenciales al seleccionarse la poblacin bajo estudio:
Homogeneidad : que todos los miembros de la
poblacin tengan las mismas caractersticas segn las
variables que se vayan a considerar en el estudio o
investigacin.


Tiempo : se refiere al perodo de tiempo donde se u-
bicara la poblacin de inters.
Determinar si el estudio es del momento presente o
si se va a estudiar a una poblacin de cinco aos
atrs o si se van a entrevistar personas de diferentes
generaciones.
Espacio : se refiere al lugar donde se ubica la pobla-
cin de inters.
Por falta de tiempo y recursos hay que limitar el
estudio a un rea o comunidad en especfico.
Cantidad : se refiere al tamano de la poblacin.
El tamao de la poblacin determina o afecta al
tamao de la muestra que se vaya a seleccionar.

MUESTRA
Es un subconjunto fielmente representativo de la
poblacin. sobre la que tenemos acceso y donde
hacemos las observaciones (mediciones).
-Debe ser ~representativa
-Esta formada por unidades ~seleccionadas de la
poblacin.

Hay diferentes tipos de muestreo. El tipo de
muestra que se seleccione depender de la
calidad y cun representativo se quiera sea el
estudio de la poblacin:
ALEATORIA: cuando se selecciona al azar y
cada miembro tiene igual oportunidad de ser
incluido.
ESTRATIFICADA: cuando se subdivide en
estratos o subgrupos segn las variables o
caractersticas que se pretenden investigar. Cada
estrato debe corresponder proporcionalmente a
la poblacin.
SISTEMTICA: cuando se establece un patrn
o criterio al seleccionar la muestra.
Ejemplo: se entrevistar una familia por cada die
z que se detecten.


MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

6

Muestreo
Es indispensable para el investigador ya que es
imposible entrevistar a todos los miembros de
una poblacin debido a problemas de tiempo,
recursos y esfuerzo.
Al seleccionar una muestra lo que se hace es
estudiar una parte o un subconjunto de la
poblacin, pero que la misma sea lo
suficientemente representativa de sta para
que luego pueda generalizarse con seguridad
de ellas a la poblacin.

El tamano de la muestra depende de la precisin
con que el investigador desea llevar a cabo su estu-
dio, pero por regla general se debe usar una mues-
tra tan grande como sea posible de acuerdo a los
recursos que haya disponibles.
Cuanto ms grande la muestra mayor posibilidad
de ser ms representativa de la poblacin.

En la investigacin experimental, por su naturaleza y
por la necesidad de tener control sobre las
variables, se recomienda muestras pequeas que
suelen ser de por lo menos 30 sujetos.
En la investigacin descriptiva se emplean muestras
grandes y algunas veces se recomienda seleccionar
de un 10 a un 20 por ciento de la poblacin
accesible

PARMETRO
Es una unidad numrica calculada sobre una
poblacin y resume los valores que sta toma en
varios atributos.
Intenta resumir toda la informacin que hayen la
poblacin en unos pocos nmeros (parmetros).

ESTADSTICO
Es una unidad numrica calculada sobre una muestra
que resume su informacin sobre algn aspecto.
Si un estadstico se usa para aproximar un parme-
tro se le suele llamar ~estimador.

Ejemplo: la media del peso de 300 habitantes de la
ciudad de Lima.
Debe ser una muestra representativa de la poblacin.

Tipos:
-De posicin: dividen un conjunto ordenado de datos
en grupos con la misma cantidad de individuos.
-Centralizacin: indican valores con respecto a las
medidas de centralizacin: media, mediana y moda.
-Dispersin: indican la mayor o menor concentracin
de los datos con respecto a las medidas de centraliza-
cin: desviacin tpica, coeficiente de variacin, ras-
gos, varianza.
-Forma: dan una idea de cmo se distribuyen los da-
tos: asimetra, apuntamiento o curtosis.



VARIABLES

Cmo se define a las variables en
estadstica?
Son los atributos, rasgos o propiedades de un grupo
de elementos que toman diferentes valores, magnitu-
des o intensidades.

a) Desde el punto de vista estadstico
Segn Stevens se dividen :
CUALITATIVAS (segn su calidad o atributo)
Si sus valores no se pueden asociar naturalmente a
un nmero (no se pueden hacer operaciones
algebraicas con ellos).
Tipos:
-Nominales : Si sus valores no se pueden ordenar
. Dicotmicas : Sexo, Fumar (S/No)
. Politmicas : estado civil, color de los ojos,
profesin.
-Ordinales : si sus valores se pueden ordenar
IRA, grado de desnutricin, Intensidad del dolor.

CUANTITATIVAS (de acuerdo a su magnitud).
Si sus valores son numricos (tiene sentido hacer
operaciones algebraicas con ellos)

Tipos:
-Discretas : Si toma valores enteros
Ejemplo: Nmero de abortos, nmero de parejas
sexuales, etc.
-Contnuas: Si entre dos valores, son posibles
infinitos valores intermedios.
Ejemplo: Edad, talla, presin intraocular, etc.
-Intervalo: El cero no es absoluto
Temperatura en grados centgrado, la nota de un
examen
-Razn: El cero es absoluto.
Altura, peso

MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

7


Variable cualitativa nominal
Es la variable cualitativa que no tiene punto de
comparacin. Ejemplo: el color de los ojos .
Variable cualitativa ordinal
Cuando hay un determinado orden. Ejemplo:
duracin de una enfermedad (aguda, subaguda,
crnica).
Variable cuantitativa discreta, discontnua o de
intervalo
Cuando la variable cuantitativa slo se puede
medir en valores enteros. Ejemplo: nmero de
partos.
Variables cuantitativas continuas o de razn
Si la variable se puede expresar en fracciones,
como peso al nacimiento (3,460 g) o estatura (51.3
cm)

b) Desde el punto de vista metodolgico






GRFICOS para variables CUALITATIVAS

Grfico de barras
Alturas proporcionales a las frecuencias (absolutas
o relativas)
Se pueden aplicar tambin a variables discretas

Representamos en el eje de ordenadas las
modalidades y en abscisas las frecuencias absolutas o
bien, las frecuencias relativas. Cuando los tamaos de
las dos poblaciones son diferentes, es conveniente
utilizar las frecuencias relativas, ya que en otro caso
podran resultar engaosas











Fi. 1 Diagrama de barras para una variable cualitativa
Si, mediante el grfico, se intenta comparar varias
poblaciones entre s, existen otras modalidades,
como las mostradas en la figura.


















Fi. 2 Diagrama de barras para comparar una variable
cualitativa en varias poblaciones

Grfico de sectores (tartas)
No usarlo con variables ordinales.
El rea de cada sector es proporcional a su frecuen-
cia (absoluta o relativa)

Se divide un crculo en
tantas porciones como
clases existan, de
modo que a cada clase
le corresponde un
arco de crculo
proporcional a su
frecuencia absoluta o
relativa .

El arco de cada porcin se calcula usando laregla
de tres:




Si se quiere comparar dos poblaciones es aconsea--
ble el uso de las frecuencias relativas (porcentajes)
de ambas sobre grficos .

Otra posibilidad es comparar las 2 poblaciones u-
sando para cada una de ellas un diagrama semicir-
cular.
Sean n1 < = n2 los tamaos respectivos de las 2
poblaciones. La poblacin ms pequea se representa
con un semicrculo de radio r1 y la mayor con otro de
radio r2.





MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

8

La relacin existente entre los radios, es la que se
obtiene de suponer que la relacin entre las reas de
las circunferencias es igual a la de los tamaos de las
poblaciones respectivas, es decir:





Pictogramas
Fciles de entender.
En lugar de barras, utiliza figuras que deben ser
proporcional a la frecuencia.
Expresan con dibujos alusivos al tema de estudio las
frecuencias de las modalidades de la variable. Estos
grficos se hacen representado a diferentes escalas
un mismo dibujo.














Fi. 3 Pictogramas

GRFICOS para variables CUANTITATIVAS

Para las variables continuas
Utilizamos como diagramas diferenciales
los histogramas y los polgonos de frecuencias.

Histogramas
Se construye a partir de la tabla estadstica, repre-
sentando sobre cada intervalo, un rectngulo que tie-
ne a este segmento como base.











El criterio para calcular la altura de cada rectngulo
es el de mantener la proporcionalidad entre la
frecuencias absolutas (o relativas) de cada intervalo y
el rea de los mismos.
Polgono de frecuencia
Se construye fcilmente si tenemos representado
previamente el histograma, ya que consiste en unir
mediante lneas rectas los puntos del histograma qu
e corresponden a las marcas de clase.
Para representar el polgono de frecuencias en el
primer y ltimo intervalo, suponemos que
adyacentes a ellos existen otros intervalos de la
misma amplitud y frecuencia nula, y se unen por una
lnea recta los puntos del histograma que
corresponden a sus marcas de clase.

El polgono de frecuencias tiene en comn con el
histograma el que las reas de la grficas sobre un
intervalo son idnticas.














El diagrama integral para una variable continua se
denomina tambin polgono de frecuencias
acumulado, y se obtiene como la poligonal definida
en abcisas a partir de los extremos de los intervalos
en los que hemos organizado la tabla de la variable, y
en ordenadas por alturas que son proporcionales a
las frecuencias acumuladas.
ESTADSTICOS
-Centralizacin o tendencia central
Indican los valores centrales de los datos.
Media, mediana y moda
-Dispersin
Indican la mayor o menor concentracin de los datos
con respecto a las medidas de centralizacin.
Desviacin tpica, coeficiente de variacin, rango,
varianza





MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

9











Centralizacin o tendencia central









Dispersin

-Posicin
Dividen un conjunto ordenado de datos en grupos co
n la misma cantidad de individuos.
Cuantiles, percentiles, cuartiles, deciles









Posicin
-Forma
Asimetra
Apuntamiento o curtosis









Forma

Medidas (Estadsticos) de Tendencia Central.
Son valores numricos que quieren mostrar el cen-
tro de un conjunto de datos, nos interesan espe-
cialmente dos medidas: la media y la mediana.
Son medidas que buscan posiciones (valores) con
respecto a los cuales los datos muestran tendencia
agruparse.

Si los datos son una muestra, el promedio y la
mediana se llamarn estadsticos. Si los datos
son una poblacin entonces estas medidas de
tendencia central se llamarn parmetros

Media: Es la suma de los valores de todas las obser-
vaciones dividido por el nmero de observaciones.
Ejem. Media de 2, 2, 3 y 7 es (2+2+3+7) /4=3,5
Cundo debemos usarla? cuando los datos tie-
nen distribucin normal o casi normal
Precaucin: es muy sensible a valores extremos.

Mediana: La mediana de un conjunto de n observa-
ciones, ordenadas de menor a mayor, es un valor tal
que la mitad de las observaciones son menores o
iguales que tal valor y la mitadde las observaciones
son mayores o iguales que ese valor.






Cundo usarla? si la distribucin de los datos es
asimtrica.
No es sensible a valores extremos.
Mediana de 1,2,4,5,6,6,800 es 5. La media es 117,7

Pasos para encontrar la mediana:
1. Ordenar los datos de menor a mayor;
2. Calcular la posicin de la mediana: (n+1)/2,
donde n es el nmero de observaciones
3. a) Si el nmero de observaciones es impar, la
mediana es un nico trmino central.
b) Si el nmero de observaciones es par, la
mediana es el promedio de los dos trminos
centrales.

Ejemplo
Edades de n=20 sujetos...
Calculamos (n+1)/2 obtenemos (20+1)/2 = 10,5.
Entonces los trminos centrales son la dcima y un-





MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

10

dcima observaciones, es decir 43 y 44. La mediana
es el promedio de estos dos trminos,
(43+44)/2=43,5 aos.
32 37 39 40 41 41 41 42 42 43 44 45 45 45 46 47 47
49 50 51

Moda: La moda de un conjunto de observaciones es
el valor ms frecuente.
La moda de los valores: { 0, 0, 0, 0, 1, 1, 2, 2, 3, 4 } es
0.
{ 0, 0, 0, 1, 1, 2, 2, 2, 3, 4 } dos modas, 0 y 2
(bimodal).
Cul sera la moda del siguiente conjunto de
valores? { 0, 1, 2, 4, 5, 8 }.
{0, 0, 0, 0, 0, 1, 2, 3, 4, 4, 4, 4, 5} ...
La Moda no se usa a menudo como medida de
tendencia central para datos cuantitativos. Sin
embargo la Moda es la medida de tendencia central
que puede ser calculada en datos cualitativos.

Pregunta: En nueve familias encuestadas los
nmeros de nios por familia fueron: 4,6,2,2,4,3,2,1
y 7. La media, mediana y moda de los nios por
familia son respectivamente:
a) 3.4, 2,3
b) 3, 3.4, 2
c) 3, 3.4, 2
d) 2, 3.5, 3
e) Ninguna anterior






Pregunta: Un jefe de servicio desea considerar un
valor central que resuma el tiempo de estancia de sus
pacientes ingresados. En este valor prefiere que
tengan escasa contribucin aquellos pacientes
ingresados por error diagnstico que son trasladados
a otro servicio en poco tiempo y aquellos pacientes
que permanecen ingresados debido a su
problemtica social una vez finalizada la intervencin
mdica. Qu parmetro le recomendara?:
A. Mediana.
B. Moda.
C. Media.
D. Desviacin tpica.
E. Recorrido.




Estadsticos de DISPERSIN
Miden el grado de dispersin (variabilidad) de los da-
tos, independientemente de su causa.

Amplitud o Rango
Diferencia entre observaciones extremas.
-2, 1, 4, 3, 8, 4.
El rango es 8-1=7
-Es muy sensible a los valores extremos.

Rango
Es la medida de variabilidad o dispersin ms
simple. Se calcula tomando la diferencia entre el
valor mximo y el mnimo observado.
Rango = Mximo Mnimo.







Analice cules podran ser las ventajas y
desventajas del rango como medida de
variabilidad.


Rango intercuartlico
-Es la distancia entre el primer y tercer cuartil.
Rango intercuartlico = P
75
- P
25

-Parecida al rango, pero eliminando las
observaciones ms extremas inferiores y superiores.
-No es tan sensible a valores extremos.
















Desviacin Standard: Es una medida de la dispersin
de las observaciones a la media. Es un ~promedio de
la distancia de las observaciones a la media".




MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

11


















Varianza muestral : est definida como la suma de
las desviaciones al cuadrado divididas por el tamano
muestral menos 1, es decir, dividas por n -1 .










Pensemos la desviacin estndar como
aproximadamente un promedio de las distancias
de las observaciones a la media.
Si todas las observaciones son iguales, entonces
la desviacin estndar es cero.
La desviacin estndar es positiva y mientras
ms alejados estn los valores del promedio,
mayor ser la desviacin estndar.

Dispersin en distribuciones normales

-Centrado en la media y a
una desviacin estndar
de distancia tenemos ms
de la mitad de las
observaciones (68.25%).
-A dos desviaciones
estndar tenemos al
95.45%
-A tres desviaciones
estndar tenemos el 99.7%














ESTADSTICOS de POSICIN
. PERCENTIL de orden k = cuantil de orden k/100
Podemos dividir conjuntos de datos en 100 par-
tes iguales y los puntos de divisin se conocen como
percentiles.
-La mediana es el percentil 50
-El percentil de orden 15 deja por debajo al 15% de
las observaciones. Por encima queda el 85%










En general, el k-simo percentil es un valor tal que el
k% de los datos son menores o iguales que l, y el
(100-k) % restante son mayores o iguales que l.

.CUANTILES: Dividen a la muestra en 4 grupos con
frecuencias similares.
-Primer cuartil = Percentil 25 = Cuantil 0,25
-Segundo cuartil = Percentil 50 = Cuantil 0,5 =
mediana
-Tercer cuartil = Percentil 75 = cuantil 0,75














i
i
x x
n
S
2 2
) (
1






MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

12











































































































MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

13

OF: Un estudio ha codificado la intensidad del dolor
de los pacientes como: sin dolor, dolor leve, dolor
moderado y dolor intenso. La variable ha sido media
en una escala:
a. Cualitativa nominal
b. Cualitativa ordinal
c. Cualitativa discreta
d. Cualitativa contnua
e. Dicotmica
Rpta. B

OF: Se est realizando un estudio para conocer el
efecto de un analgsico. La variable principal de
respuesta es una escala de dolor con los siguientes
valores: 1 . No dolor 2. Dolor leve 3.Dolor moderado
y 4. Dolor intenso. De qu tipo de variable se trata?
a. Variable dicotmica
b. Variable contnua
c. Variable discreta
d. Variable ordinal
e. Variable cuantitativa
Rpta. D

OF : Al consultar la distribucin del peso en una
muestra de sujetos adultos, se aprecia que el
percentil 25 corresponde a 65 kg. Cul de las
siguientes afirmaciones es correcta?:
a)El 25% de los sujetos de la muestra pesan
aproximadamente 65 kg.
b)El 25% de los sujetos de la muestra tienen un peso
igual o superior a 65 kg.
c)Para poder interpretar este valor, es necesario
conocer la desviacin estndar de la distribucin.
d)Para poder interpretar este valor, es necesario
conocer la media de la distribucin.
e)El 25% de los sujetos de la muestra tienen un peso
igual o inferior a 65 kg.
Rpta. E

OF : En un estudio en que se ha medido la intensidad
de dolor en un grupo de 145 pacientes con artritis
reumatoide mediante una escala de 0 (ausencia de
dolor) a 10 (dolor de intensidad mxima), se informa
que la mediana es de 6. Cul el significado de este
valor?:
a)La mitad de los sujetos de la muestra tienen
valores de intensidad de dolor iguales o inferiores a
6.
b)El valor 6 indica la intensidad de dolor que puede
considerarse normal en la escala utilizada.
c)El valor 6 de la escala ha sido la puntuacin
obtenida con mayor frecuencia por los sujetos de la
muestra.
d)El valor 6 es la media aritmtica de las
puntuaciones obtenidas por los sujetos de la
muestra.
e)La diferencia entra la puntuacin mxima y la
mnima obtenida por los sujetos de la muestra es 6.
Rpta. A

OF: En un ensayo clnico se comparan 3 tratamientos
(p.e. placebo, tratamiento establecido y un
tratamiento nuevo). La variable respuesta es
contnua (p.e. nivel de glucosa en sangre). Aceptando
que la variable tiene una distribucin normal, el test
correcto para comparar la respuesta es:
a)La t de Student.
b)El test de Wilcoxon.
c)Anlisis de la varianza.
d)El test de Kruskal-Wallis.
e)El test ji-cuadrado.
Rpta. C



























MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

14






INTRODUCCIN
La investigacin en salud tiene como objeto obtener
conclusiones que permitan una adecuada toma de
decisiones en lo que compete a conductas especficas
y cambio de polticas establecidas en relacin con la
salud de los seres humanos.

CONCEPTOS

Poblacin o Universo

Es un conjunto de individuos
o elementos que guardan
similitud entre s en los
aspectos que son relevantes
para los objetivos de la
investigacin. Cada uno de
los elementos estn
perfectamente identificados.

La poblacin o universo es demasiado grande para
estudiarla en su totalidad.
















Poblacin o universo

En la prctica las observaciones y mediciones que se
requieren para obtener informacin suficiente, que
permita llegar a conclusiones vlidas, no pueden ser
siempre hechas sobre el total de la poblacin para la
que son necesarias.




Estudiar a la poblacin de baistas de una
piscina es fcil, pero no precisamente de la
piscina de abajo!















Cules son las razones que limitan la
medicin en todos los sujetos de la
poblacin?
-Las limitaciones severas en relacin a recursos
econmicos y de tiempo, para lograr un cubrimiento
del ciento por ciento de la poblacin.
-Falta de recurso humano suficientemente calificado
para realizar las observaciones o para obtener las
mediciones necesarias .
-Dificultades geogrficas y logsticas que presenta una
tarea de gran magnitud como es el cubrimiento total
de una poblacin.

Muestra

Es un subgrupo de la poblacin total.

Para muestra. un
botn!
Las dificultades ante-
riormente menciona-
das, que podran hacer
irrealizable un estudio,
pueden ser soluciona-
das si se estudia una
muestra de la pobla-
cin.







MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

15

Una muestra correctamente seleccionada puede
representar a la comunidad total de la cual fue
extradas y permite , que los resultados obtenidos
en ella puedan extrapolar a un nmero mucho
mayor personas pertenecientes a la misma poblacin
o a po-blaciones diferentes de caractersticas muy
similares.

Ejemplo: En un estudio sobre diabetes mellitus tipo
2, la poblacin es el conjunto de sujetos diabticos
que tienen las caractersticas comunes que define
a este tipo de enfermedad en relacin con la edad y
forma de presentacin.

Marco muestral
Es un subconjunto de la poblacin en el cual cada uno
de los elementos est identificado Es una lista de
unidades de muestreo.








Dentro del marco muestral se va a
identificar la unidad de muestreo.


Unidad de muestreo
Es la unidad que se somete al proceso de
aleatorizacin en los estudios que requieren
muestreo.









En un muestreo por conglomerados o clsters son los
grupos de unidades de estudio los que ingresan al
sorteo.
En un estudio sobre la relacin mdico-paciente son
los mdicos las unidades de muestreo.
Ejemplo, si se desea estimar la prevalencia de dano
auditivo en relacin con niveles de ruido ambiental
en una muestra de trabajadores de una fbrica:
La unidad de muestreo puede corresponder a la en-
tidad "sujeto", si se dispone de un registro detalla-
do de cada sujeto.
La unidad de anlisis es el trabajador de la fbrica.
Unidad de informacin
Es la unidad que nos brinda informacin de la unidad
de estudio.

Cuando la unidad de estudio es la poblacin el
individuo se convierte en unidad de informacin.
En un estudio retrospectivo las unidades de
informacin son las historias clnicas.

Cuando evaluamos el trastorno por dficit de aten-
cin en los ninos se le encuesta a sus padres y/o a sus
profesores. Puede haber ms de una unidad de infor-
macin.

Unidad de anlisis
Es la unidad definida por el investigador para realizar
mediciones. Es el elemento bsico de estudio.

Ejemplo: si queremos conocer el nivel de glucosa
en plasma 5cc de sangre sern suficientes, se pue
de requerirms de una unidad de anlisis de una
misma uni-dad de estudio.
Las unidades de anlisis pueden corresponder a las
siguientes categoras o entidades:
Personas
Grupos humanos
Poblaciones completas
Unidades geogrficas determinadas
Eventos o interacciones sociales (enfermeda-
des, accidentes, casos de infecciones intrahos-
pitalarias, etc)
Entidades intangibles, susceptibles de medir
(exmenes, das camas)
El tipo de anlisis al que se someter la informacin
es determinante para elegir la unidad de anlisis.
Por ejemplo, si el objetivo es dar cuenta de la
satisfaccin del usuario de un servicio mdico, la


MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

16

unidad de anlisis natural es el paciente atendido, o
la persona que se atiende en ese servicio mdico.
Seleccin de una muestra
La muestra se selecciona del Universo, de acuerdo
con unos criterios de inclusin y exclusin
previamente establecidos.
Los criterios de inclusin son aquellos que permi-
ten definir y caracterizar la poblacin de estudio,
generalmente definen sexo, edad, entre otros.
Los criterios de exclusin son aquellos que indi-
can que quien ya cumpli los criterios de inclu-
sin tendr que ser excluido por alguna razn.
Estos criterios sirven para decidir si puede o no
extrapolar los resultados a sus pacientes, puesto
que los criterios definen la poblacin a la que pue-
den generalizarse las conclusiones de un estudio.

En este sentido, cuantos ms criterios de inclusin
o exclusin se propongan, ms reducida ser la
poblacin a la que se pueda extrapolar el
resultado.

MUESTREO

Preguntas en todo proceso de muestreo:
Para que los datos sean representativos de la poblacin
que se pretende estudiar.

Tamao de la muestra : A cuntos
vamos a muestrear ?
Diseo muestral : A quienes
vamos a muestrear?

Objetivo del muestreo
Es obtener una poblacin que permita generalizar los
resultados del estudio a personas que comparten las
caractersticas del inters, pero que no estuvieron
involucradas en el desarrollo del mismo.
Es importante tener la seguridad de que el proceso
de seleccin de los sujetos y la conduccin o desa-
rrollo del protocolo tienen la calidad suficiente pa-
ra que los resultados resulten altamente confiables.

Validez Interna
Se refiere al grado en que la seleccin de sujetos y los
otros aspectos del desarrollo de un estudio estn
libres de sesgos o errores sistemticos que, de estar
presentes, podran cambiar radicalmente los
resultados finales de una investigacin.

Validez externa
Equivale a la posibilidad de generalizar los resultados a
la poblacin, que se caracteriza por tener
caractersticas compartidas.
Una vez que se puede afirmar que los resultados de
un estudio tienen validez interna, se puede pensar
en extrapolarlos a una poblacin ms grande que
aquella de donde se originaron, lo que corresponde
al concepto de Validez Externa,

Mtodos de muestreo
El muestreo puede ser, de acuerdo con sus
caractersticas bsicas, de dos tipos: probabilstica y
no probabilstica.
Segn el empleo de mecanismos objetivos o subjeti-
vos, la presencia o ausencia del criterio del investi-
gador y el conocimiento a priori de la probabilidad
de que cada unidad de la poblacin forme parte de
la muestra.

Muestreo no probabilstico
-Por conveniencia o deliberado
-Accidental
-Seleccin por expertos
Muestreo no probabilstico
-Muestreo aleatorio simple o irrestricto
-Muestreo Sistemtico
-Muestreo Estratificado
-Muestreo por Conglomerados
-Muestreo Polietpico Estratificado.


MUESTREO NO PROBABILSTICO

En general, en este tipo de muestreo, las unidades se
seleccionan por conveniencia, de manera secuencial,
siguiendo determinados criterios subjetivos o porque
simplemente estn disponibles.

Desventaja
La desventaja del muestreo no probabilstico es
que no sirven para realizar generalizaciones,
dado que no se tiene certeza de que la muestra
extrada sea representativa de la poblacin.


MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

17

Muestreo por CONVENIENCIA : Implica el empleo de
una muestra integrada por las personas o los objetos
cuya disponibilidad como sujetos de estudio sea ms
conveniente.

Ejemplo: el profesor que distribuye cuestionarios
en una sala de clases utiliza una muestra por conve-
niencia o tambin llamada muestra accidental.

Las muestras por conveniencia no constan
necesariamente de individuos que el investigador
conozca.

Ejemplo: detener a una persona en una esquina pa-
ra realizar una entrevista tambin representa un
caso de muestreo por conveniencia.

Las chicas los prefieren
flaquitos!

El muestreo por convenien-
cia es la tcnica menos
slida, pero tambin la que
ms se utiliza en los
estudios de ciencias de la
salud.

Cuando los fenmenos que se investigan son
suficientemente homogneos en la poblacin, se
reduce el riesgo de sesgo.

Muestreo por CUOTAS : En el muestreo por cuotas el
investigador identifica estratos de la poblacin y
establece las proporciones de elementos necesarias a
partir de los distintos segmentos estratificados.

Muestreo por cuotas?







Con base en informacin previa acerca de la
composicin de la poblacin, el investigador se
asegura de que los diversos segmentos o sectores
estn representados en la muestra en las mismas
proporciones en que se presentan en la poblacin.

El muestreo por cuotas no requiere de la aplicacin
de tcnicas complejas ni la inversin de una cantidad
extraordinaria de tiempo o esfuerzos, salvo por la
identificacin de estratos y la representacin
proporcional correspondiente, la tcnica de
muestreo por cuotas es muy semejante a la de
conveniencia.

Este muestreo comparte muchas de las
deficiencias de la tcnica de conveniencia.

Muestreo INTENCIONAL : Se basa en la idea de que
el investigador puede usar sus conocimientos acerca
de la poblacin para elegir los casos que incluir en la
muestra.

El investigador debe seleccionar la variedad ms
amplia posible de personas o los sujetos que a su juicio
son caractersticos de la poblacin que le interesa o
que disponen de mayor informacin acerca del tema
de estudio.
Si bien esta forma subjetiva de muestreo no ofrece un
mtodo externo y objetivo para evaluar cun tpicos
de la poblacin son los sujetos seleccionados, puede
representar ciertas ventajas en circunstancias como
la evaluacin preprueba de instrumentos recin
desarrollados con una muestra de diversos tipos de
sujetos intencionalmente elegidos.

El muestreo intencional se aplica a menudo se
busca una muestra de expertos, como cuando se
desea aplicar una prueba de deteccin de
necesidades con base en la tcnica del
informante clave.

MUESTREO PROBABILSTICO

En este tipo de muestreo cada miembro de la
poblacin tiene una probabilidad, conocida y superior
a cero, de ser incluido en la muestra y las unidades
muestrales hacen parte de la muestra
independientemente del criterio o gusto del
investigador.

Es el MEJOR MTODO para asegurar la validez
de cualquier inferencia o generalizacin hecha
con base en los resultados obtenidos a partir de
la muestra.



MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

18

No debe confundirse la seleccin aleatoria con
la designacin aleatoria que se utiliza al realizar
una investigacin experimental, pues esta tcnica
se refiere a la asignacin al azar de los sujetos a
diferentes condiciones experimentales y no tiene
relacin con la forma en que, en un inicio, se eli-
gieron los participantes en el experimento.

Clasificacin
El muestreo probabilstico se clasifica en:
-Muestreo aleatorio Simple o irrestricto
-Muestreo aleatorio Sistemtico
-Muestreo Estratificado
-Muestreo por Conglomerados
-Muestreo Polietpico ~ Estratificado

Muestreo ALEATORIO SIMPLE o Irrestricto:
Es la tcnica considerada como la ms sencilla en el
muestreo probabilstico. En ella, cada sujeto o unidad
tiene una probabilidad igual y conocida de ser
seleccionado. Todas las unidades estn
adecuadamente identificadas.

Asi de fcil es el
Muestreo aleatorio
simple!





Supone que no existen razones para considerar que
un conjunto especfico de la poblacin debe ser
seleccionada con prioridad a otro.

Debido a estas importantes caractersticas, las
muestras aleatorias simples son consideradas
relativamente libre de sesgos.

Forma de seleccionar una muestra
Este mtodo se realiza en poblaciones pequeas , lo
que permite identificar y enumerar todos los
elementos de la poblacin de manera unvoca y exacta.
Qu se requiere para el muestreo?
A travs de algn procedimiento (tablas de nmeros
aleatorios, nmeros aleatorios generados con una
calculadora o una lista aleatoria generada por
paquetes estadsticos) se elige a tantos participantes
como sea necesario para completar el tamao de
muestra requerido.
Si no se tiene nada de los anterior se puede usar
una bolsa donde se introducen todos los nmeros o
los nombres de los sujetos que conforman la pobla-
cin , luego de mover los elementos dentro de la
bolsa se va a sacar la muestra que necesitamos pa-
ra hacer el estudio.

Aplicacin prctica
Como puede verse en la fig. 1 primero debemos
seleccionar de una poblacin una muestra. Luego de
seleccionar la muestra hay que determinar los
estadsticos:
x=Media s=Desviacin standard
s
2 =
Varianza p=Proporcin n=Tamao
Luego estos estadsticos deben ser extrapolados a la
poblacin para obtener los parmetros.
= Media = Desviacin standard

2=
Varianza =Proporcin
N=Tamao




















Fig 1. Muestreo aleatorio simple

Muestreo ALEATORIO SISTEMTICO :
Este procedimiento se caracteriza por seleccionar las
unidades de muestreo empleando un intervalo de
medida constante sobre el marco muestral.
No requiere la enumeracin de las unidades del
marco muestral; solamente basta con que estn
fsicamente ordenadas en un orden ascendente o
descendente, para permitir el conteo.


MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

19

La aplicacin de este procedimiento requiere
determinar de manera inicial el:
-Intervalo muestral (k) intervalo que se
calcula dividiendo N / n
N = tamao de la poblacin total
n= tamao de la muestra calculada
Aproximando el resultado al nmero entero
ms prximo.

1.- Ordenar las unidades por una variable de inters
La variable de inters es una variable que puede
influir en los resultados del estudio.
Ej. Si se quiere determinar la media de la talla de un
grupo de alumnos de un colegio mixto ,es necesario
ordenar a los alumnos por la variable sexo, ya que la
talla va a depender del sexo.
El sexo es una variable que va a influir en la media de
la talla que se va a determinar.

2.- Dividir N / n = K (constante)
Para hacer esta divisin vamos a tener una constante
que se denomina como K .
3.- Elegir al azar un nmero entre 1 y K. A partir de
ese nmero (seleccionado de manera aleatoria) se se-
leccionarn las unidades ltimas de muestreo.
4.- Sumar al nmero elegido K sucesivamente, hasta
alcanzar la ~n necesaria:
Por ejemplo:
N = 300 (poblacin total)
n = 60 (tamao de la muestra)
-Tenemos que calcular K
N / n =300/60 = K = 5
-A continuacin, se debe seleccionar aleatoriamente u
n valor entre 1 y K sea entre 1 y 5
Se selecciona al azar el nmero 4.
A este nmero elegido se denomina ~unidad de arra
nque del proceso de seleccin.
-Para seleccionar las dems unidades que formarn
la muestra, se le suma a la posicin de la unidad de
arranque los valores k, 2k, 3k y as sucesivamente
hasta completar el tamao de la muestra requerido
se localizan las unidades del marco muestral corres-
pondientes a los valores obtenidos.
El primer elemento por lo tanto es 4, el segundo
elemento es el resultado de la suma de 4 + 5 = 9 , el
tercer elemento se halla sumando 9+ 5 = 14 , el cuarto
elemento resulta de la suma de 14+ 5 = 19, el quinto
elemento sumando 19 + 5 = 24 , el sexto elemento
resulta de la suma de 24+ 5 = 29 y as sucesivamente
hasta completar el tamao de la muestra que es 60.


















Fig.2 Muestreo aleatorio sistemtico

Aplicacin prctica
Como puede verse en la fig. 1 tenemos una poblacin
que debe ser ordenada en base a una variable que
nos interesa controlar.
-Calcular K (aplicando K = N / n)
Una vez ordenada la poblacin hay que calcular el
valor de K.
N = 40 y n = 8
N/n = K = 5
-Seleccionar un valor entre 1 y K
En este ejemplo el valor elegido entre 1 y K es 3.
-Para seleccionar las dems unidades que formarn l
a muestra, se le suma a la posicin de la unidad de
arranque ,o sea el nmero 3 ,los valores k, 2k, 3k y
as sucesivamente hasta completar el tamao de la
muestra requerido
1 elemento : 3+5= 8 ; 2 elemento: 8+5= 13 ;
3 elemento : 13 +5 = 18 y as sucesivamente hasta
completar el tamao de la muestra que es 40.
-De la muestra obtenida determinamos los estadstico
s y extrapolamos los valores de los estadsticos a la
poblacin para obtener los parmetros.

Muestreo ESTRATIFICADO : En algunas ocasiones la
poblacin que se desea estudiar est compuesta por
subgrupos bien definidos que pueden ser identificados
con anterioridad al proceso de seleccin de la
muestra.

MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

20

La caracterstica de inters en el estudio vara
ampliamente entre esos subgrupos definidos, es
decir, existe gran heterogeneidad entre ellos; en
tanto que dentro de cada subgrupo la variabilidad es
poca, es decir, existe homogeneidad dentro del
subgrupo.

Muestreo estratificado : Dios los cra y ellos se
juntan













Estratificacin de la poblacin
La estratificacin en algunas ocasiones puede
obedecer a caractersticas de tipo espacial, tales
como el sitio de vivienda, lo cual puede identificar una
clase econmica determinada que sigue ciertos
comportamientos sociales, polticos, econmicos y
culturales.
En otros casos la estratificacin se basa en una o
ms variables sobre las cuales se tiene suficiente
conocimiento. Estas variables pueden ser cualitati-
vas (sexo, estado civil, entre otras.) o cuantitativas
(edad, peso, entre otras).

Existen diferentes formas de realizar la seleccin de
las unidades dentro de los estratos:
Afijacin igual: Consiste en distribuir
equitativamente el tamao de la muestra en cada uno
de los estratos de la poblacin; requiere conocer el
nmero de estratos existentes.
As, por ejemplo, si existen 3 estratos identificados
y se requiere un tamano de muestra de 30 unidades
, se procede a seleccionar de manera independien
te 10 unidades o elementos de cada estrato, me-
diante las tcnicas de muestreo aleatorio simple o
muestreo sistemtico.

Afijacin proporcional: La distribucin del tamao de
muestra se realiza porcentualmente segn tamao de
cada estrato dentro de la poblacin; por tanto,
requiere conocer el nmero de estratos y el tamao
porcentual de cada uno en la poblacin.
Por ejemplo: se tienen tres estratos, que correspon-
de al 50%, 30% y 20%, respectivamente de la po-
blacin. Un tamano de muestra de 30 unidades se-
ra recolectado de la siguiente manera: 15 unida-
des en el estrato1, 9 unidades en el estrato 2 y las
resultantes 6 unida- des en el estrato 3.

Afijacin ptima: Requiere conocer adems del
nmero de estratos y el tamao porcentual de estos
en la poblacin, la desviacin estndar poblacional en
cada estrato. Consiste en balancear la variabilidad
dentro de los estratos con su tamao.

Ignorar la heterogeneidad que presenta la
caracterstica de inters sobre el marco muestral
puede llevar a que las estimaciones obtenidas a
partir de la muestra difieran considerablemente
de los verdaderos valores de la poblacin.

Primer paso: estratificar la poblacin
Tenemos una poblacin bastante heterognea por lo
que vamos a formar estratos para tratar de
homogenizar la poblacin en cada uno de los estratos.



















Fig.3 Muestreo Estratificado






MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

21

En el ejemplo de la fig. 3 estamos formando 2
estratos para tratar de homogenizar los elementos en
el estrato que estamos determinando.

Segundo paso: determinar la variable a utilizar
La variable que vamos a utilizar para estratificar la
poblacin, es una variable que sabemos que puede
influir en los resultados del estudio.

Tercer paso: selecionar una muestra de cada estrato
Una vez determinados los estratos el siguiente paso
es seleccionar una muestra de cada uno de los
estratos ,.
La seleccin de la muestra se puede realizar
utilizando el:
-Muestreo aleatorio simple
-Sistemtico.

Cuarto paso: determinar los estadsticos y par-
metros
Una vez obtenida la muestra determinamos los
estadsticos.
Extrapolamos los valores de los estadsticos a la
poblacin para obtener los parmetros.

Muestreo por CONGLOMERADOS o Complejos
Los conglomerados son agrupaciones de elementos
que existen naturalmente (no los define el
investigador) por razones econmicas, biolgicas,
sociales, etc. (el hogar, el curso de estudiantes de un
colegio, un municipio o ciudad).
Una muestra por conglomerados es una muestra
aleatoria simple en la cual las unidades muestradas
son grupos de unidades del marco muestral.

DESVENTAJA
Este muestreo tiende a contener ms errores de
muestreo que los de tipo simple o estratificado.
VENTAJA
Sin embargo es mucho ms econmico y prctico
que otras variantes de muestreo probabilstica,
en particular cuando la poblacin es grande y se
halla dispersa.

Se tiene una poblacin bastante heterognea y
grande, como por ejemplo la poblacin de un
distrito , de una provincia o de un pas.


Primer paso: conformar los conglomerados
Los conglomerados tienen las siguientes
caractersticas:
-Dentro de cada conglomerado debe haber la mayor
heterogeneidad posible. Entre los conglomerados
debe haber la mayor homogeneidad posible.


















Fig.4 Muestreo por conglomerados
-El tamao de los conglomerados no necesariamente
es el mismo.
Al no ser del mismo tamao la probabilidad de
seleccin de cada sujeto va a variar en cada
conglomerado. Por lo tanto no todas las unidades de
muestreo tienen las misma probabilidad de ser
seleccionadas.

1ra. etapa (Muestra de conglomerados)
-Una vez que se han formado los conglomerados
vamos a seleccionar de todos estos una muestra de
los conglomerados.
Este muestreo se puede hacer con :
. Muestreo aleatorio simple
. Muestreo aleatorio Sistemtico.
2da. etapa (Muestra de cada conglomerado)
-Se ha seleccionado una muestra de los conglomerados
pero que sigue siendo demasiado grande, es por eso
que dentro de cada conglomerado vamos a seleccionar
una muestra de cada conglomerado
En la muestra de cada conglomerado estimamos los
estadsticos y luego extrapolamos los valores de los
estadsticos a la poblacin para obtener los
parmetros (este proceso es difcil).

MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

22

Ms datos:
-En el muestreo por conglomerados puede ha-
ber ms de 2 etapas.
-En este tipo de muestreo se pueden combinar to-
dos los tipos de muestreo conocidos.
Como puede verse en el ejemplo de la fig.4 en la
seleccin de la muestra de los conglomerados (1ra.
etapa) se utiliza el muestreo aleatorio Simple y para
seleccionar la muestra de cada conglomerado (2da.
etapa) es decir los elementos o unidades de
muestreo se puede utilizar el muestreo aleatorio
sistemtico.

TAMAO DE LA MUESTRA
Segn Fisher, el tamao de la muestra debe definirse
partiendo de los criterios:

1.Los recursos disponibles, que fijan el tamano m-
ximo de la muestra
Con relacin al primer criterio la recomendacin es
siempre tomar la muestra mayor posible. La lgica
nos indica que entre ms grande sea sta mayor
posibilidad tendr de ser ms representativa y menor
ser el error de muestreo, el cual siempre existe.

2.Los requerimientos del plan de anlisis que fija
el tamano mnimo de la muestra.
Fisher plantea que el tamao de la muestra deber ser
suficiente para permitir un anlisis confiable de los
cruces de variables, para obtener el grado de
precisin requerido en la estimacin de
proporciones, y para probar si las diferencias entre
proporciones son estadsticamente significativas.

Otro de los conceptos bsicos
Otro de los conceptos bsicos al usar las herramientas
estadsticas es la diferencia entre los resultados de
una muestra seleccionada (estimadores) y el valor
poblacional de inters (parmetros).
La razn principal para seleccionar una muestra de
la poblacin de inters es que no podemos medir to-
dos los elementos de esa poblacin.

Cuando se selecciona una muestra especfica, esa
muestra seleccionada es una de las posibles muestras
que se pudo haber seleccionado.
Por esta razn, existen procesos inferenciales que
permiten extrapolar los resultados de una muestra
aleatoria seleccionada a la poblacin de estudio.

Uno de los criterios durante la planeacin de la
seleccin de una muestra es obtener estimadores
confiables para alcanzar los objetivos del estudio.
En trminos generales, cuanto mayor sea el tamano
de la muestra seleccionada mayor ser la confiabili-
dad de los estimadores obtenidos con ella.

Existe un tamano de muestra especfico para cada
diseno de muestreo
Es necesario equilibrar los recursos, la logstica de
la seleccin, el proceso de recoleccin y el anlisis
de la muestra seleccionada.
Por estas razones, existe un tamao de muestra
especfico para cada diseo de muestreo y para los
diferentes diseos de investigacin en salud.
Las investigaciones en el rea de la salud siempre
parten del supuesto de que la muestra seleccionada
sigue un procedimiento aleatorio.

Adicionalmente, se quiere ganar eficiencia en el
clculo del tamao de la muestra, involucrando
dentro de la frmula los elementos del tipo de diseo
implementado en el estudio.

Adems, si se trata de un estudio exploratorio, los
requisitos para calcular el tamao de la muestra son
menores en cantidad si se les compara con estudios
en los que el objetivo sea la evaluacin de una
intervencin.
El clculo del tamano de la muestra tambin difiere
segn el tipo de estimador que se desea medir.

El tamao de la muestra debe ser calculado
siempre en la fase de planeacin, para permitir la
planeacin adecuada del estudio, para
programar las estrategias de recoleccin,
determinar los costos, preparar las
intervenciones y procedimientos de evaluacin y
en general para determinar la factibilidad
general.










MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

23






DEFINICIN
Estadstica inferencial es el conjunto de mtodos
estadsticos que permiten deducir (inferir) cmo se
distribuye la poblacin bajo estudio, a partir de la
informacin que proporciona una muestra
representativa obtenida de dicha poblacin.

La estadstica inferencial extrapola los datos ob-
tenidos de una muestra hacia la poblacin de la
cual ha sido seleccionada la muestra que hemos
estudiado.

El inters es conocer la probabilidad de que los re-
sultados de la muestra sean los mismos si se tomara
la poblacin total.

CLASIFICACIN

Existen dos tipos bsicos de estadstica diferencial:
-Estadstica paramtrica
-Estadistica no-paramtrica

Estadstica paramtrica

Es la estadstica que se recomienda por tener
mayor potencia, se trata de tcnicas ms
precisas.

Para que la estadstica inferencial proporcione
buenos resultados debe cumplir con 3 requisitos:

-Distribucin normal de los datos en la poblacin
-Muestra aleatoria (representativa de la poblacin)
-Datos cuantitativos: contnuos, discretos o de
intervalo o razn.

Tcnicas paramtricas

- t de student para medias
- Anlisis de varianza
- Anlisis de covarianza
- Correlacion de Pearson





Cuadro n 1 : Caractersticas comunes de las pruebas
paramtricas.
1. Independencia de las observaciones a excepcin de
datos pareados.
2. Las observaciones para la variable dependiente se
han obtenido de manera aleatoria de una poblacin
con distribucin normal.
3. La variable dependiente es medida al menos en
una escala de intervalo.
4. Se recomienda un tamao de muestra mnimo de
30 sujetos por grupo.
5. Los datos son obtenidos de poblaciones que tienen
varianzas iguales (una varianza no debe ser el doble o
mayor que la otra).
6. Habitualmente las hiptesis se hacen sobre
valores numricos, especialmente el promedio de
una poblacin (), como ejemplo:
Ho: 1 = 2 H1: 1 2
7. Otros posibles requisitos: variable independiente
nominal o de intervalo, homocedasticidad (para cada
nivel de la variable independiente hay una variacin
similar de la variable dependiente) y casillas de igual
tamao.

Cuadro N2 : Valoracin de las caractersticas de
los datos.
1. Determinar el nivel de medida de la variable de
inters.
2. Valorar la distribucin de las variables.
Medidas de tendencia central para cada variable.
Sesgo y curtosis para cada variable.
Valoracin visual de la distribucin de los datos.
Examinar los diagramas de las probabilidades de
la distribucin.
Si se considera necesario transformar las
variables.
Ver los resultados de la transformacin.
3. Ver la homogeneidad de las varianzas.
4. Ver el tamao de muestra total y de los
subgrupos.
5. Determinar qu prueba estadstica paramtrica o
no paramtrica es la ms adecuada.

MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

24

El procedimiento estadstico que se usar para el a-
nlisis depende de (cuadro N1) :
1) El tipo de medida de la variable a analizar.
2) La distribucin que caracteriza a las mediciones de
las variables, la homogeneidad de las varianzas en los
grupos de ellas, el impacto de los residuos y el tama-
o de la muestra.
3) Del poder de la prueba que se usar, es decir, la cap
a-cidad de aceptar o rechazar, correctamente, la hiptesi
s nula.

Estadstica no paramtrica
Si los procedimientos estadsticos no requieren
plantear inferencias acerca de los parmetros de la
poblacin (su media y dispersin) se le conoce como
no paramtricos, o de distribucin libre (ya que no se
hacen suposiciones acerca de la distribucin de la
poblacin de donde procede la muestra.
Es la alternativa para cuando no se puedan utilizar
las tcnicas paramtricas.
-No hay requisitos para la muestra
-Se pueden utilizar tanto datos cualitativos como
cuantitativos.
-Datos cualitativos: nominal u ordinal

Tcnicas no paramtricas para datos
cuantitativos
- U de Mann-Whitney
- Test de Kruskal-Wallis
- Test de Friedman
- Correlacion de Spearman
Tcnicas no paramtricas para datos
cualitativos
- Chi-cuadrado
- Test de Fisher exact

Cuadro 3. Caractersticas comunes de las pruebas
no paramtricas.
1. Independencia de las observaciones aleatorias a
excepcin de datos pareados.
2. Pocas asunciones con respecto a la distribucin
de la poblacin.
3. La variable dependiente es medida en escala
categrica.
4. El punto primario es el ordenamiento por rangos
o por frecuencias.
5. Las hiptesis se hacen sobre rangos, mediana o
frecuencias de los datos.
6. El tamao de muestra requerido es menor (20 o
<).
Con las pruebas no paramtricas se puede trabajar
con muestras pequeas de datos categricos u
ordinales, independientemente de la distribucin de
las muestras que se desea contrastar.
Las pruebas no paramtricas:
1) Son ms fciles de aplicar
2) Son aplicables a los datos jerarquizados
3) Se pueden usar cuando dos series de observacio
nes provienen de distintas poblaciones
4) Son la nica alternativa cuando el tamano
de muestra es pequeno.
5) Son tiles a un nivel de significancia previamen
te especificado.

Cuadro N 4. Caractersticas de las pruebas no
paramtricas.
Ventajas
1.Determinacin sencilla. Mediante frmulas
simples de combinacin.
2. Fciles de aplicar.
Las operaciones matemticas son la jerarquizacin,
conteo, suma y resta.
3. Rpidas de aplicar.
Cuando las muestras son pequeas.
4. Campos de aplicacin.
A grupos mayores de poblaciones.
5. Menos susceptibles a la contravencin de los
supuestos. Ya que los supuestos son escasos y
menos complicados.
6. Tipo de medicin requerida. Se pueden utilizar
con datos ordinales o nominales.
7. Tamao de la muestra.
Cuando la muestra es < 10 son sencillas, rpidas y
slo un poco menos eficaces. Conforme aumenta el
tamao de la muestra se hacen ms laboriosas y
tardadas, y menos efectivas.
8. Efectividad estadstica.

Cuando se satisfacen los supuestos de la prueba no
paramtrica son igual de efectivas. Si se satisfacen los
supuestos de una prueba paramtrica con muestras
pequeas son un poco menos efectivas y se vuelven
menos eficaces a medida que aumenta el tamao de
muestra.
Desventajas
1. Si se puede utilizar una prueba paramtrica y se
usa una no paramtrica hay una prdida de infor-
macin.
MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

25

2. En muestras grandes las pruebas no paramtricas
son muy laboriosas.

ANALISIS ESTADSTICO














Tabla N1 Tcnicas de anlisis estadstico

La tabla N1 resume las tcnicas de estadstica que va
mos a necesitar dependiendo del tipo de variable de-
pendiente y del nmero de muestras y si la distribu-
cin normal o no.

Preguntas bsicas en el anlisis estadstico
1 Qu tipo de muestra nos estn presentando en el
problema? La muestra es independiente o
dependiente?
Independiente: la seleccin de los elementos no
depende de la seleccin de otras unidades o
elementos.
Dependiente: la seleccin de unidad de la muestra va
a depender de la seleccin de otra unidad .
En este caso tenemos muestras pareadas. Por
ejemplo: si estamos haciendo un muestreo de tipo
pareado por una variable que nos interesa (por
ejemplo el sexo), si selecciono un sujeto del sexo
femenino el siguiente sujeto tambin tiene que ser
femenino. El mximo grado de apareamiento lo
tendremos cuando estamos haciendo estudios en los
cuales los sujetos son grupo control y grupo de
intervencin.

2 Es una variable cualitativa o cuantitativa?
3 Cuntos grupos se estn comparando en el
problema?
4 Qu tipo de distribucin tiene la variable que nos
estn presentando?
Luego de responder las 4 preguntas podemos
identificar cual es la prueba estadstica que le
corresponde.
En la tabla N1 podemos ver que una tcnica no pa-
ramtrica como la U de Mann Whitney es la alter-
nativa a una prueba paramtrica comT de Student.
De igual manera la tcnica de Spearman es la alter
nativa a la tcnica de Perason, el Test de Kruskal
Walli es la alternativa a la tcnica de ANOVA.

CASO: Se compara la talla promedio entre 2 grupos
de nios que recibieron distintos patrones de
alimentacin. Cada grupo comprenda 25 nios.
Seale la prueba de significacin estadstica ms
apropiada para analizar los datos:
a)Prueba de Chi cuadrado
bPrueba Z
cPrueba t de student
dPrueba de Spearson
ePrueba de Mc Nemar




Comentario
Para resolver este caso es necesario formular varias
preguntas:
Primera pregunta: Es una muestra dependiente o
independiente?
Cuando estamos frente a un problema y no nos dicen
que la muestra es dependiente o independiente
debemos asumir que es independiente.
Si la muestra es dependiente nos tienen que decir
explcitamente que los grupos que estamos compa-
rando son grupos dependientes.

En el caso que estamos viendo no nos indican si la
muestra es dependiente o independiente por lo que
asumimos que es una muestra independiente.
Segundo pregunta: Qu tipo de variable es la varia-
ble dependiente?
La variable que se va a comparar es la talla , la cual es
una variable de tipo cuantitativa.
Tercera pregunta: Cuntos grupos se estn compa-
rando?
En este ejemplo nos dicen explcitamente que se
estn comparando 2 grupos.
Cuarta pregunta : Qu tipo de distribucin tienen
los datos?
En este ejemplo no nos indican el tipo de distribucin
de los datos, pero si nos dicen de manera implcita
que los datos tienen distribucin normal, cuando nos


MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

26

indican que lo que se va a comparar es la talla
promedio o sea la media de la talla.
Si se van a comparar 2 medias , la condicin es que
tengan una distribucin normal.
Conclusin:
-Tipo de muestra: independiente
-Tipo de variable: cuantitativa
-Se van a comparar 2 grupos
-La distribucin de los datos es normal
Por lo tanto la prueba que le corresponde es la T de
Student.

CASO: En un ensayo clnico se comparan las cifras
de glucosa en una muestra de sujetos
representativa de una comunidad antes y despus
de la aplicacin de un determinado tratamiento
hipoglucemiante cuya eficacia queremos
comprobar Cul prueba estadstica es ms
adecuada para analizar los datos obtenidos?
a)Test de la t de Student para datos independientes
b)Anlisis de varianza
c)Test de la t de student Fisher para los datos
apareados
d)Test de comparaciones mltiples
e)Chi cuadrado







Comentario
Para resolver este caso es necesario formular varias
preguntas:
Primera pregunta: Cul es el tipo de muestra?
Como es un estudio antes y despus los sujetos son
los mismos, por lo que es una muestra de tipo
dependiente.
Segundo pregunta: Qu tipo de variable es la varia-
ble dependiente?
Lo que se quiere comparar son los niveles de glucosa
, la cual es una variable cuantitativa.
Tercera pregunta: Cuntas muestras se van a com-
par?
A pesar que el estudio es de un solo grupo de sujetos,
se consideran como 2 grupos debido a que los mismos
sujetos estn antes de la intervencin y despus de la
misma se vuelve a hacer la medicin.
Cuarta pregunta : Qu tipo de distribucin tienen
los datos?
En este caso no se menciona ni implcita ni
explcitamente cual es la distribucin de los datos , es
por eso que tenemos que ir a las alternativas de la
respuesta.

a)Test de la t de Student para datos independientes
La T de Student para datos independientes se usa
cuando las muestras son independientes.
En este ejemplo la muestra es dependiente por lo que
no es el test estadstico apropiado.

b)Anlisis de varianza
Lo utilizamos cuando queremos comparar 2 ms
grupos , la variable independiente es de tipo
cuantitativa pero el tipo de muestra tambin tiene
que ser independiente por lo tanto no es la alternativa
correcta.

c)Test de la t de student Fisher para los datos
apareados
La T de Student para datos pareados se usa cuando:
-La muestra es dependiente
-El tipo de variable es cuantitativa
-Cuando estamos comparando 2 grupos
-La distribucin de los datos es de tipo normal
Por lo que es la alternativa correcta.

d)Test de comparaciones mltiples
Se utiliza despus de realizar el Test de ANOVA para
ver si hay alguna diferencia entre las medias que se
estn comparando. El test de ANOVA nos dice que
hay una diferencia significativa entre las medias que
se estn comparando y el Test de comparaciones
mltiples nos dice entre que medias hay esa
diferencia significativa. Es falsa.

e)Chi cuadrado
Se utiliza para variables de tipo cualitativo

Estadstica paramtrica

Estadstica paramtrica
Cuando se pretende probar una hiptesis respecto
a uno o ms parmetros de una poblacin que
tiende a una distribucin normal, las pruebas
usadas son las de la estadstica paramtrica, como
la t de Student (cuadro N2)

Aunque la potencia de las pruebas estadsticas
paramtricas es mayor que la que ofrecen las
pruebas no paramtricas, ya que con ellas se tiene la
probabilidad de rechazar la hiptesis nula cuando
sta realmente es falsa (error de tipo II: 1-).
El adecuado tamao de la muestra es un requisito
indispensable para aumentar la eficacia de una
prueba: a medida que aumenta el tamao de
muestra, disminuye la posibilidad de cometer el error
de tipo II.

MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

27

Tabla N 2. Pruebas paramtricas y su
alternativa no paramtrica.
















Es conveniente comentar que el adecuado tamao de
muestra es un requisito indispensable para aumentar
la eficacia de una prueba.

PRUEBAS CON UNA SOLA MUESTRA
Ji cuadrada
Esta prueba de hiptesis se usa para comparar la
posible diferencia entre las frecuencias observadas
en la distribucin de una variable con respecto a las
esperadas, en razn de una determinada hiptesis.

Prueba binomial
La prueba binomial compara las frecuencias
observadas en cada una de las dos categoras de una
variable dicotmica con respecto a las frecuencias
esperadas bajo una distribucin binomial que tiene
un parmetro de probabilidad especfico que, por
defecto, para ambas categoras es 0.5.
Para cambiar las probabilidades se puede ingresar
una proporcin de la prueba para el primer grupo
por lo que la probabilidad para el segundo ser
1 menos la probabilidad especificada para el primero.
La prueba est basada en la distribucin binomial,
que permite estimar que la probabilidad en una
muestra de sujetos que puedan proceder de una po-
blacin binomial cuyo valor de p y q (donde q es la
probabilidad contraria) son similares a los de la
poblacin de donde se obtuvo la muestra.

Se asume que:
1) Las observaciones son seleccionadas al azar, son
independientes y se obtienen de una sola muestra.
2) Los datos son de dos categoras distintas, que se les
ha asignado un valor de 1 y 0.
Esto quiere decir que si la variable no es dicotmica
se deben colapsar los datos en 2 categoras
mutuamente excluyentes.

3) Se debe de especificar la probabilidad de ocurren-
cia de un evento en la poblacin dada.
Esta proporcin terica puede venir de registros
pblicos, censos o investigaciones previas. La
prueba binomial est indicada cuando la variable a
ser examinada es dicotmica, es especialmente til
en casos de tamao de muestra pequeos, que no
cumplen los requisitos de la bondad de ajuste de la
Ji cuadrada.

Prueba de las rachas
La prueba de las rachas mide hasta qu punto en una
variable dicotmica la observacin de uno de sus
atributos puede influir en las siguientes
observaciones; es decir, si el orden de ocurrencia en
la observacin de uno de los atributos de una
variable dicotmica ha sido por azar.

Una racha es una secuencia de observacio-
nes de un mismo atributo o cualidad.

Una serie de datos en los que hay muchas o pocas
rachas, hacen pensar que stas no han ocurrido por
azar. Alternativa: para probar que dos muestras
vienen de poblaciones con las mismas distribuciones,
se emplea la prueba de rachas sugerida por Wald-
Wolfowitz.

Prueba de Kolmogorov-Smirnov
Para una muestra

La prueba se usa para definir si el grado de ajuste
de los datos a una distribucin terica: que
puede ser con tendencia a la normal, a la de
Poisson o exponencial.

La prueba Z de Kolmogorov-Smirnov (K-S), se
computa a partir de la diferencia mayor (en valor
absoluto) entre la distribucin acumulada de una
muestra (observada) y la distribucin terica.

La bondad de ajuste de la muestra permite suponer
de manera razonable, que las observaciones pudieran

MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

28

corresponder a la distribucin especfica. La
contribucin de Kolmogorov corresponde al
problema relacionado con una sola muestra,
mientras que la de Smirnov se ocupa de responder al
problema respecto a dos muestras, tratando de
probar la hiptesis de igualdad entre las poblaciones
de origen de una con respecto a la de la otra.

La prueba de K-S no precisa que las observaciones
sean agrupadas (como es el caso de la Ji cuadrada).

Se usa en cualquier muestra de cualquier tamao,
mientras que la Ji cuadrada requiere muestras con un
tamao mnimo. Esta prueba no se debe usar cuando
los parmetros tienen que ser estimados a partir de
la poblacin y es til, especialmente cuando se
conoce la estructura en que subyace la distribucin
de la variable en estudio. Es ms poderosa que la Ji
cuadrada, especialmente cuando el tamao de la
muestra es pequeo y el nivel de medicin de la
variable es ordinal.
Se considera ms poderosa que la Ji cuadrada y
que la prueba binomial; requiere que la variable de
pendiente sea una variable cuantitativa continua.

Alternativa: No hay opcin paramtrica. Una
alternativa no paramtrica es la prueba de bondad de
ajuste de Ji cuadrada.

PRUEBAS DE DOS MUESTRAS
INDEPENDIENTES

Las pruebas de dos muestras independientes
comparan dos grupos de casos con una variable.

Hay disponibles cuatro pruebas para ver si las dos
muestras independientes (grupos) vienen de la
misma poblacin y son:
-La U de Mann-Whitney
-La Z de Kolmogorov-Smirnov,
-Las reacciones extremas de Moses
-La prueba de rachas de Wald-Wolfowitz.

U de Mann-Whitney
Es la ms popular de las pruebas para el estudio de
dos muestras independientes.
Es equivalente a la prueba de suma de rangos de
Wilcoxon y a la prueba de dos grupos de Kruskal-
Wallis.
Es la alternativa no paramtrica a la comparacin de
dos promedios independientes a travs de la t de
Student.
Se utiliza cuando se desea efectuar la comparacin
de dos grupos en quienes se les ha medido una va-
riable cuantitativa continua que no tiene una distri-
bucin normal o cuando la variable es de tipo cuan-
titativa discreta.

Tiene tres asunciones:
1) La variable independiente es dicotmica y la esc
alade medicin de la variable dependiente es al
menos ordinal.
2) Los datos son de muestras aleatorias de observ
a- ciones independientes de dos grupos independie
ntes, por lo que no hay observaciones repetidas.
3) La distribucin de la poblacin de la variable
de-pendiente para los dos grupos independientes
com-parte una forma similar no especificada, aun
que con una posible diferencia en las medidas de te
ndencia central.

Las observaciones de ambos grupos se combinan y a-
comodan, con el rango promedio en el caso de pares.
El nmero de pares debe ser pequeo en relacin al
nmero total de observaciones. Si las poblaciones son
idnticas en situacin, los rangos deben mezclarse al
azar entre las dos muestras.
Se calcula el nmero de veces que una cuenta del
grupo 1 precede una cuenta del grupo 2 y el nmero
de veces que una cuenta del grupo 2 precede una
cuenta del grupo 1.

La U de Mann-Whitney es el nmero ms pequeno
de estos dos nmeros.

t de Student
Es la alternativa paramtrica para muestras
independientes, que es ms poderosa que la U de
Mann-Whitney cuando se llenan todas las asunciones,
mientras que si los datos no se distribuyen
normalmente, el tamao de muestra es pequeo, los
grupos son de diferente tamao.
La U de Mann-Whitney es ms poderosa, sobre to-
do cuando las colas de la distribucin son grandes y
hay la presencia de residuales.
Una alternativa no paramtrica que puede ser
utilizada, sobre todo si las colas de la distribucin no
son similares es la prueba de la mediana.
MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

29


Prueba Z de Kolmogorov-Smirnov
Est basada en la diferencia absoluta mxima entre la
funcin de distribucin acumulada observada para
ambas muestras.
Cuando esta diferencia es significativamente grande,
las dos distribuciones son consideradas diferentes. La
prueba de las reacciones extremas de Moses asume
que la variable experimental afecta algunos sujetos
en una direccin y otros sujetos en la direccin
opuesta.
Se prueba las reacciones extremas comparadas a
un grupo de control. Esta prueba se enfoca en la
distribucin del grupo de control y es una medida
de cuantos valores extremos del grupo experimen-
tal influencian la distribucin cuando se combinan
con el grupo de control.

Prueba de rachas de Wald-Wolfowitz
Es una alternativa no paramtrica para contrastar si
dos muestras con datos independientes proceden de
poblaciones con la misma distribucin. Combina y
acomoda las observaciones de ambos grupos.
Si las dos muestras son de la misma poblacin, los
dos grupos deben distribuirse al azar a lo largo de la
clasificacin jerrquica. Si hay pocas rachas habla de
que se tratan de grupos diferentes mientras que, si
hay muchas rachas no hay diferencias significativas
en la distribucin de los dos grupos.
La prueba Z de Kolmogorov-Smirnov y la prueba
de rachas de Wald-Wolfowitz son pruebas ms
generales que detectan diferencias en la localizacin
y formas de las distribuciones.

MIR: Un investigador est interesado en determinar
si existe una asociacin entre las cifras de tensin
arterial diastlica (medida en mm de Hg) y los
niveles de colesterol (medidos en mgr/ml). Para ello,
ha realizado estas mediciones a 230 voluntarios.
Qu prueba estadstica es la ms apropiada para
examinar esta asociacin?:
a)Regresin logstica.
b)Prueba de la t.
c)Prueba de chi cuadrado.
d)Correlacin de Pearson.
e)Prueba de Fisher.
Rpta. D






















































MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

30







Prueba de hiptesis
Definicin
Es el mtodo para desarrollar un procedimiento para
probar la validez de una aseveracin acerca de un
parmetro poblacional .
A partir de los valores de una muestra aleatoria,
se decide si se rechaza o no el supuesto que plan-
tea el investigador para el parmetro o parme-
tros de la poblacin o poblaciones bajo estudio,
pero con cierta probabilidad de error (riesgo) por
tomar una decisin.
Objetivo
El propsito de la prueba de hiptesis no es cuestionar
el valor calculado del estadstico (muestral), sino hacer
un juicio con respecto a la diferencia entre estadstico de
muestra y un valor planteado del parmetro.
Procedimiento sistemtico para una prueba
de hiptesis de una muestra
Paso 1: Plantear la hiptesis nula Ho y la hiptesisal-
ternativaH1.
La hiptesis nula (Ho)
se refiere siempre a un
valor especificado del
parmetro de pobla-
cin, no a una esta-
dstica de muestra.
La letra H significa hiptesis y el subndice
cero no hay diferencia.
Por lo general hay un "no" en la hiptesis nula que
indica que "no hay cambio" Podemos rechazar o
aceptar la Ho.
La hiptesis nula es una afirmacin que no se re-
chaza a menos que los datos muestrales propor-
cionen evidencia convincente de que es falsa. El
planteamiento de la hiptesis nula siempre contie-
ne un signo deigualdadcon respecto al valor espe-
cificado del parmetro.



La hiptesis alternativa (H1) es
cualquier hiptesis que difiera
de la hiptesis nula. Es una
afirmacin que se acepta si los
datos maestrales proporcionan
evidencia suficiente de que la
hiptesis nula es falsa.
Se le conoce tambin como la hiptesis de in-
vestigacin.
El planteamiento de la hiptesis alternativa nunca
contiene un signo de igualdad con respecto al valor
especificado del parmetro.
Paso 2: Seleccionar el nivel de significancia.
Nivel de significacia: Probabilidad de rechazar la
hiptesis nula cuando es verdadera.
Se le denota mediante la letra griega , tambin es
denominada como nivel de riesgo.
Este trmino es ms adecuado ya que se corre el ries-
go de rechazar la hiptesis nula, cuando en realidad es
verdadera. Este nivel est bajo elcontrolde laperso-
naque realiza la prueba.
Si suponemos que la hiptesis planteada es
verdadera, entonces, el nivel de significacin
indicar la probabilidad de no aceptarla, es decir, que
estn fuera del rea de aceptacin.
Nivel de confianza (1-): indica la probabilidad de
aceptar la hiptesis planteada, cuando es verdadera
en la poblacin.
La distribucin de muestreo de la estadstica de
prueba se divide en dos regiones:
-Regin de rechazo (conocida como regin crtica)
-Regin de no rechazo (aceptacin).
Si la estadstica de prueba cae dentro de la regin de
aceptacin, no se puede rechazar la hiptesis nula.
La regin de rechazo puede considerarse como
el conjunto de valores de la estadstica de prueba que
no tienen posibilidad de presentarse si la hiptesis nula
es verdadera.



MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

31

Estos valores no son tan improbables de presentarse si
la hiptesis nula es falsa. El valor crtico separa la re-
gin de no rechazo de la de rechazo.
Tipos de errores
Cuando realizamos una prueba de hiptesis estamos
haciendo un test de significancia para ver si la hiptesis
nula es verdadera o falsa.
Si aplicamos un test de significancia puede rechazar o
no la hiptesis nula. En la vida real tenemos una hip-
tesis nula o verdadera.
Cualquiera sea la decisin tomada a partir de una
prueba de hiptesis, ya sea de aceptacin de la Ho o de
la Ha, puede incurrirse en error.
Error tipo I
Un error tipo I se presenta si la hiptesis nula Ho
siendo verdadera es rechazada por el test de
significancia (Fig 1)
La probabilidad de
cometer un error tipo I se
denomina con la letra alfa
.
Error tipo II
Un error tipo II, se denota
con la letra griega se
presenta si la hiptesis nula
es aceptada cuando de hecho
es falsa y deba ser
rechazada (Fig. 1)
En cualquiera de los dos casos se comete un error al
tomar una decisin equivocada.












Fig 1. Tipos de error
Decisin correcta
Una decisin correcta se presenta si la hiptesis nula
Ho es falsa y es rechazada por el test de significancia.
Una decisin correcta tambin se presenta si la
hiptesis nula Ho es verdadera y no es rechazada por
el test de significancia (FIg. 1)
Error tipo I (alfa)
Una error tipo I se presenta si la hiptesis nula Ho es
verdadera (en el estado real) y es rechazada por el
test de significancia (FIg. 2)
Nivel de significancia
Tambin se conoce al error de tipo I como nivel de
significancia y por convencin se considera que este
error de significancia debe ser de 5%.
Nivel de confianza
Es el complemento del nivel de significancia, cuyo
valor debe ser de 95%:
La suma del nivel de significancia ms el nivel de
confianza siempre debe ser 100%, lo que gana uno
de ellos lo pierde el otro. Ejemplo: si el nivel de
significancia aumenta a 10% , el nivel de confianza
disminuye a 90%).









Fig 2. Otros tipos de error
Error tipo II (beta)
Una error tipo II se presenta si la hiptesis nula Ho es
falsa (en el estado real) y no es rechazada por el test
de significancia (FIg. 2)




MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

32

Por convencin el error de tipo II tiene un valor de
20%.
Potencia
Es el complemento del error de tipo 2, su valor es de
80%.
Si incrementamos el valor del error de tipo II la
potencia disminuye.
Si aumentamos la potencia se disminuye la
probabilidad de cometer un error de tipo II.
La suma de la potencia ms el error de tipo II
siempre debe dar 100%
Ejemplo:
Tenemos un reo en la vida real, que puede ser
inocente o culpable y un juez que da el veredicto.
El veredicto del juez es que el reo sea culpable o
inocente.






Fig. 3 Ejemplo de tipo de error
Decisin correcta
Tenemos 2 posibilidades:
Se produce cuando en la vida real el reo es realmente
inocente y el veredicto del juez dice que es inocente.
Se produce tambin cuando en la vida real el reo es
culpable y el veredicto del juez dice que es culpable.
Error
Se produce tambin cuando en la vida real el reo es
culpable y el veredicto del juez dice que es inocente.
Error ms grave
Se produce cuando en la vida real el reo es inocente y el
veredicto del juez dice que es culpable.

Si aplicamos lo anterior a Salud tenemos:
-Cuando la hiptesis nula es falsa y el test de
significancia la rechaza es un decisin correcta.
-Cuando la hiptesis nula es verdadera y el test
de significancia no la rechaza tambin es un
decisin correcta.
Error de tipo II
-Cuando la hiptesis nula es falsa y el test de
significancia no la rechaza es un error de tipo II.
Si estamos probando la eficacia de un
tratamiento, de una droga A sobre una droga B ,
en este caso se comete un error de tipo II cuando
decimos que el tratamiento si tiene un efecto
pero no lo percibimos. Es decir que hay diferencia
entre el tratamiento A y B pero la prueba de
significancia dice que no hay diferencia, no se
rechaza la hiptesis nula. Se busca un
tratamiento alternativo y no hay consecuencias
adversas para el paciente.
Error de tipo I (alfa)
-Cuando en la vida real el tratamiento no tiene
efecto pero el test de significancia nos dice que si
tiene efecto , es decir rechazamos la hiptesis
nula. Este error es ms grave que el error de tipo
II porque se est dando al paciente una droga
que en la vida real no tiene efecto para la
enfermedad que estamos tratando . Se le da
porque la prueba de significancia nos dice que si
tiene efecto.









Fig. 4 Ejemplo de tipo de error


MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

33

Ejemplo:
Pregunta: Al comparar dos medias muestrales el
rechazo de una hiptesis nula, que es verdadera, nos
lleva a cometer un ERROR conocido como _________.
a. Beta o Tipo II
b. Aleatorio
c. Estndar
d. Alfa o tipo I
e. Sistemtico






Comentario:
Estamos frente a una hiptesis nula que es verdadera
y que ha sido rechazada por el test de significancia. Se
trata de un error alfa (tipo I).
Factores que influyen en el poder
estadstico de un estudio.
El tamao de la muestra a estudiar: A > tamao
muestral, > potencia estadstica de un estudio.
-Estudios con muestras muy grandes, detectan como
significativas diferencias poco relevantes..
-Estudios con muestras pequenas es ms fcil obtener
resultados falsos negativos.
Para que cualquier ensayo de hiptesis sea
bueno, debe disearse de forma que minimice
los errores de decisin. La nica forma de reducir
ambos tipos de errores es incrementar el tamao
de la muestra, lo cual puede ser o no ser posible.
El nivel de significacin estadstica: Si se disminuye el
valor de tambin se disminuye el poder de la
prueba.
Es decir, si disminuimos la probabilidad de cometer
un error de tipo I, aumentamos la probabilidad de
cometer un error de tipo II. Se debe encontrar un
punto de equilibrio de cometer ambos errores.
Habitualmente se trabaja con un nivel de
significacin de 5% y un poder de 80%.

Trminos estadsticos
Nivel de confianza (intervalo de confianza): es la
probabilidad de que nuestro resultado sea
correcto: Probabilidad = (1-) 95%
Nivel de significacin: es el mximo error que
estamos dispuestos a aceptar como vlida
nuestra hiptesis. Es el error tipo I o .
Probabilidad : 5%
P valor: significancia estadstica ,es la
cuantificacin probabilstica de error tipo I.
Poder o potencia de estudio: representa la
probabilidad de observar en la muestra una
determinada diferencia y efecto, si existe en la
poblacin.
Cmo nos protegemos contra el error tipo
I?
p < 0,05 protege contra el error tipo I debido al
chance. No garantiza proteccin contra el error tipo I
debido a sesgo o confusin
Utilizando el mtodo ms preciso y exacto (menor
variabilidad) para medir la exposicin y el efecto.
Cmo nos protegemos contra el error tipo
II?
-Estimando un tamao de muestra adecuado
-Estableciendo grandes diferencias en nuestras
hiptesis
La probabilidad de cometer un error de tipo II
denotada con la letra griega beta , depende de
la diferencia entre los valores supuesto y real del
parmetro de la poblacin. Como es ms fcil
encontrar diferencias grandes, si la diferencia
entre la estadstica de muestra y el
correspondiente parmetro de poblacin es
grande, la probabilidad de cometer un error de
tipo II, probablemente sea pequea.
El estudio y las conclusiones que obtengamos para
una poblacin cualquiera, se habrn apoyado ex-
clusivamente en el anlisis de una parte de sta. De
la probabilidad con la que estemos dispuestos a a-
sumir estos errores, depender, por ejemplo, el ta-
mano de la muestra requerida.
Existe una relacin inversa entre la magnitud de los
errores y : conforme a aumenta, disminuye. Esto
obliga a establecer con cuidado el valor de a para las
pruebas estadsticas. Lo ideal sera establecer y .
En la prctica se establece el nivel y para disminuir
el Error se incrementa el nmero de observaciones

MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

34

en la muestra, pues as se acortan los lmites de
confianza respecto a la hiptesis planteada .
Cmo incrementamos la potencia de un
estudio?
-Incrementando el tamao de muestra
-Estimando un tamao de muestra adecuado
-Utilizando el mtodo ms preciso y exacto (menor
variabilidad) para medir la exposicin y el efecto
La meta de las pruebas estadsticas es rechazar la
hiptesis planteada. Es deseable aumentar
cuando sta es verdadera, o sea, incrementar lo
que se llama poder de la prueba (1- ).
La aceptacin de la hiptesis planteada debe
interpretarse como que la informacin aleatoria de
la muestra disponible no permite detectar la
falsedad de esta hiptesis.
Paso 3:Clculodel valor estadstico de prueba
Este valor es determinado a partir de la informacin
muestral, que se utiliza para determinar si se rechaza
la hiptesis nula , existen muchos estadsticos de
prueba para nuestro caso utilizaremos los
estadsticos z y t.
La eleccin de uno de estos depende de la cantidad
de muestras que se toman, si las muestras son de la
prueba son iguales a 30 o mas se utiliza el estadsti-
co z, en caso contrario se utiliza el estadstico t.
Tipos de prueba
a) Prueba bilateral o de dos extremos: la hiptesis
planteada se formula con la igualdad
Ejemplo
H0 : = 200
H1 : 200




b) Pruebas unilateral o de un extremo: la hiptesis
planteada se formula con o
H0 : 200 H0 : 200
H1 : < 200 H1 : > 200





En las pruebas de hiptesis para la media (), cuando se
conoce la desviacin estndar () poblacional, o cuando
el valor de la muestra es grande (30 o ms), el valor
estadstico de prueba es z y se determina a partir de:


El valor estadstico z, para muestra grande y
desviacin estndar poblacional desconocida se
determina por la ecuacin:


En la prueba para una media poblacional con
muestra pequea y desviacin estndar poblacional
desconocida se utiliza el valor estadstico :



Paso 4: Formular la regla de decisin
Se establece las condiciones especficas en la que se
rechaza la hiptesis nula y las condiciones en que no
se rechaza la hiptesis nula.
La regin de rechazo define la ubicacin de todos los
valores que son tan grandes o tan pequeos, que la
probabilidad de que se presenten bajo la suposicin
de que la hiptesis nula es verdadera, es muy remota.













MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

35

Distribucin muestral del valor estadstico z, con
prueba de una cola a la derecha
Valor critico: Es el punto de divisin entre la regin
en la que se rechaza la hiptesis nula y la regin en la
que no se rechaza la hiptesis nula.
Paso 5: Tomar una decisin.
En este ltimo paso de la prueba de hiptesis, se
calcula el estadstico de prueba, se compara con el
valor crtico y se toma la decisin de rechazar o no la
hiptesis nula.
Tenga presente que en una prueba de hiptesis solo
se puede tomar una de dos decisiones: aceptar o
rechazar la hiptesis nula.
Debe subrayarse que siempre existe la posibilidad de
rechazar la hiptesis nula cuando no debera haberse
rechazado (error tipo I). Tambin existe la posibilidad
de que la hiptesis nula se acepte cuando debera
haberse rechazado (error de tipo II)
Prueba de CHI CUADRADO
Es una de las pruebas estadsticas ms utilizadas ,va a
depender si tiene una 2 variables.
Cuando tenemos 1 variable vamos a realizar la Prue-
ba de bondad de ajuste.
Si tenemos 2 variables podemos realizar la Prueba
de homogeneidad o la Prueba de independencia.








Fig.5 Test de Chi cuadrado
PRUEBA DE BONDAD DE AJUSTE
Cuando queremos decidir , a partir de una muestra, si
la poblacin sigue (ajusta) una determinada
distribucin (problema de bondad de ajuste).

Supongamos que tenemos un nmero k de clases en
las cuales se han ido registrado un total de n
observaciones (n ser el tamao muestral).
Denotaremos las frecuencias observadas en cada
clase por O1, O2, ..., O k
(Oi es el nmero de valores en la clase Ai ). Se
cumplir:
E1 + E2 + ... + E k = n




Se tratar ahora de decidir si las frecuencias
observadas estn o no en concordancia con las
frecuencias esperadas (es decir, si el nmero de
resultados observados en cada clase corresponde
aproximadamente al nmero esperado). Para
comprobarlo, haremos uso de un contraste de
hiptesis usando la distribucin Chi-cuadrado:
El estadstico de contraste ser


Observar que este valor ser la suma de k nmeros
no negativos.

El numerador de cada trmino es la diferencia entre la
frecuencia observada y la frecuencia esperada. Por
tanto, cuanto ms cerca estn entre s ambos valores
ms pequeo ser el numerador, y viceversa.
El denominador permite relativizar el tamao del
numerador.
Las ideas anteriores sugieren que, cuanto menor
sean el valor del estadstico 2 mas coherentes se-
rn las observaciones obtenidas con los valores es-
perados.

Por el contrario, valores grandes de este
estadstico indicarn falta de concordancia entre
las observaciones y lo esperado.
En este tipo de contraste se suele rechazar la
hiptesis nula (los valores observados son
coherentes con los esperados) cuando el
estadstico es mayor que un determinado valor
crtico.




MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

36

Prueba de HOMOGENEIDAD
Cuando queremos decidir si dos o ms muestras
provienen de la misma poblacional Estas muestras
provienen de poblaciones con la misma distribucin?

Estamos interesados en determinar si los datos
correspondientes a dos o ms muestras aleatorias
provienen de la misma poblacin. Nuevamente el
conjunto de posibles valores de las observaciones se
divide en k conjuntos disjuntos: A1, A2, ..., Ak.
; clasificando en ellos las observaciones de cada
muestra. Si nij representa el nmero de
observaciones de la muestra i que pertenecen al
conjunto Aj , los datos pueden tabularse en lo que se
denomina una tabla de contingencia.











La hiptesis de que las m poblaciones son
homogneas, se traduce en que cada conjunto Aj debe
tener una probabilidad terica pj , desconocida, pero
que no vara de la poblacin i a la poblacin i. Esto
debe verificarse para todas las categoras, i.e., las
categoras deben ser homogneas en las diversas
muestras.
Del mismo modo que la Prueba de Bondad de Ajuste,
en este caso debemos comparar las frecuencias
observadas en cada una de las muestras y para cada
categora con las frecuencias bajo el supuesto de
homogeneidad en las poblaciones.
En este caso las frecuencias observadas corresponde
al nmero de individuos de la muestra i en la clase j,
i.e., nij
El estadstico de contraste ser




Donde eij es la frecuencia esperada bajo el supuesto
de homogeneidad, que puede representarse como ni
Pj , es decir, el nmero de individuos en la muestra i
por la probabilidad de que ocurra la caracterstica j
en la poblacin. Para el clculo de las probabilidades
de pertenecer un individuo a cada una de las
categoras podemos utilizar:




Observar que este valor ser la suma de n*k nmeros
no negativos.
El numerador de cada trmino es la diferencia entre la
frecuencia observada y la frecuencia esperada. Por
tanto, cuanto ms cerca estn entre s ambos valores
ms pequeo ser el numerador, y viceversa.
El denominador permite relativizar el tamao del
numerador.
Las ideas anteriores sugieren que, cuanto menor sean
el valor del estadstico 2, ms coherentes sern las
observaciones obtenidas con los valores esperados.
Por el contrario, valores grandes de este estadstico
indicarn falta de concordancia entre las
observaciones y lo esperado. En este tipo de
contraste se suele rechazar la hiptesis nula (los
valores observados son coherentes con los
esperados) cuando el estadstico es mayor que un
determinado valor crtico

Prueba de INDEPENDENCIA
Se trata de contrastar si dos variables cualitativas
son independientes (es decir, si existe relacin entre
ellas), o no. Por ejemplo:
Los hbitos de lectura de los padres influyen en los
hbitos de lectura de los hijos?

Estamos interesados en determinar si dos cualidades
o variables referidas a individuos de una poblacin
estn relacionadas. Se diferencia de los contrastes
anteriores en que en este caso estamos interesados
en ver la relacin existente entre dos variables de una
misma poblacin, no queremos contrastar la
distribucin terica de una variable (prueba de
bondad de ajuste) ni en comparar la distribucin de
una nica variable en dos poblaciones (prueba de
homogeneidad).
Supongamos que de n elementos de una poblacin se
han observado dos caractersticas X e Y,
obtenindose una muestra aleatoria simple
bidimensional (X1,Y1),(X2,Y2),...,(Xn,Yn). Sobre la
base de dichas observaciones se desea contrastar si
las caractersticas poblacionales X e Y son
independientes o no. Para ello se dividir el conjunto
de posibles valores de X en k conjuntos disjuntos



MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

37

A1,A2,...,Ak; mientras que el conjunto de posibles
valores Y ser descompuesto en r conjuntos
disjuntos: B1,B2,...,Br
. Al clasificar os elementos de la muestra, aparecer
un cierto nmero de ellos,
ijn , en cada una de las k r clases as constituidas,
dando lugar a una tabla de contingencia de la forma:











Al igual que para el Test de homogeneidad, el
estadstico del contraste ser:






EJEMPLO: Hemos preguntado a un grupo de 20
hombres y 20 mujeres si fumaban o no. Crees que
hay diferencias significativas entre ambos sexos?

















Tenemos una tabla con la distribucin de los 20
hombres y 20 mujeres. El total de los hombres y
mujeres estn en las columnas y en las filas el total de
los que fuman y los que no fuman. En total son 40
sujetos.
A los totales se les llama totales marginales
Qu debera salir, si fueran ~perfectamente inde-
pendientes?
















En este caso vamos a estimar las frecuencias
esperadas para las 4 celdas a, b, c y d y obtenemos los
totales marginales de las filas y de las columnas .
Cmo estimamos las frecuencias esperadas para las
caldas a, b, c y d?
Hay una frmula para obtener estas frecuencias que
consiste en multiplicar los tatoles marginales
dividiendo entre el total de observacin.
Por ejemplo para determinar el valor de a tenemos
que multiplicar el valor marginal de la columna que
es 20 por el total marginal de la fila que es 12 y todo
esto lo dividimos por el total de sujetos que es 40. La
frecuencia esperada de la celda a es 6.
De igual modo procederemos para determinar las fr
ecuencias de las otras celdas (b, c y d) obteniendose l
os siguientes valores:
6, 6, 14 y 14.



















MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

38

Cmo obtenemos el Chi cuadrado?
El Chi cuadrado es igual a la sumatoria de las
frecuencias observadas (Oi) menos las frecuencias
esperadas (Ei) elevadas al cuadrado sobre las
frecuencias esperadas.



X
2
: Chi cuadrado

O
i
: Frecuencias observadas
E
i
: Frecuencias esperadas
Los valores esperados en cualquiera de las celdas
siempre deben de ser > o = a 5
Si en una de las celdas el valor es menor a 5 NO
podemos utilizar el valor del Chi cuadrado.,
debindose usar la prueba de Fisher exact ( ms
frecuentemente utilizado) o la prueba de Correccin
de yates.

OF: En un estudio que compara la eficacia de dos
frmacos no se observa una diferencia
estadsticamente significativa entre ellos. Si en
realidad ambos tratamientos fueran diferentes,
todos los siguientes factores podran explicar por
qu se ha obtenido un resultado "falso negativo",
EXCEPTO uno. Selelo:
a)Error tipo alfa.
b)Error tipo beta.
c)Potencia estadstica insuficiente.
d)Nmero de sujetos estudiados insuficiente.
e)Existencia de un sesgo en la comparacin.
Rpta. A

OF: En un contraste de hiptesis, la potencia es la
probabilidad de:
a)Rechazar la hiptesis nula siendo cierta.
b)Rechazar la hiptesis nula siendo falsa.
c)Aceptar la hiptesis alternativa.
d)Que la hiptesis alternativa sea verdadera.
e)Que la hiptesis nula sea falsa.
Rpta. B

OF: Un ensayo clnico evala dos pautas
teraputicas en pacientes hipertensos. Para
comparar los porcentajes de pacientes controlados
observados en cada grupo a los 6 meses de
tratamiento, qu prueba estadstica le parece ms
adecuada?:
a)t de Student para datos independientes.
b)Anlisis de la varianza de medidas repetidas.
c)Chi-cuadrado.
d)t de Student para datos apareados.
e)Anlisis de la varianza.
Rpta. C