Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Manual Bioestadiacutestica Plus Medic A PDF
Manual Bioestadiacutestica Plus Medic A PDF
BIOESTADÍSTICA
www.plus-medica.com
Manual de Bioestadística, Salud Pública y Epidemiología RM PLUS MEDIC A
1ª Edición
Prohibida su venta
www.plus-medica.com
Manual de Bioestadística, Salud Pública y Epidemiología RM PLUS MEDIC A
Este manual está dedicado a los estudiantes de Medicina Humana y a los médicos
jóvenes de las diferentes universidades de Lima y de nuestro Perú, que se esfuerzan
día a día en busca del conocimiento médico actualizado y que son fuente de
inspiración y razón de ser de PLUS MEDIC A.
Los autores
www.plus-medica.com
Manual de Bioestadística, Salud Pública y Epidemiología RM PLUS MEDIC A
Contenido
1. Estadística. Generalidades ……………………………………………………………………….. 6
1.1 Tipos de estadística
1.2 Población
1.3 Parámetro
1.4 Estadístico
2. Estadística descriptiva …………………………………………………………………………… 21
2.1 Variables
2.2 Gráficos para variables cualitativas
2.3 Gráficos para variables cuantitativas
2.4 Medidas de posición y de dispersión
3. Diseño y análisis del muestreo …………………………………………………………………. 37
3.1 Población o universo
3.2 Muestra
3.3 Marco muestral, unidad de muestreo, unidad de información y unidad de análisis.
3.4 Muestreo
3.5 Muestreo probabilístico
3.6 Muestreo no probabilístico
3.7 Tamaño muestral
4. Estadística inferencial …………………………………………………...………………………. 42
4.1 Estadística paramétrica
4.2 Estadística no paramétrica
4.3 Análisis estadístico
4.4 Pruebas con dos muestras independientes
5. Contraste de hipótesis………………………………………………………………………........ 56
5.1 Hipótesis nula, hipótesis alternativa y grado de significación estadística
5.2 Errores alfa y beta
5.3 Pruebas de significación estadística
5.4 Prueba de Chi cuadrado
www.plus-medica.com
MANUAL de SALUD PÚBLICA ,EPIDEMIOLOGÍA y BIOESTADÍSTICA PLUS MEDIC A
Muestreo
Es indispensable para el investigador ya que es
imposible entrevistar a todos los miembros de
una población debido a problemas de tiempo,
recursos y esfuerzo.
Al seleccionar una muestra lo que se hace es
estudiar una parte o un subconjunto de la
población, pero que la misma sea lo
suficientemente representativa de ésta para
que luego pueda generalizarse con seguridad
de ellas a la población.
VARIABLES
¿Cómo se define a las variables en
estadística?
por su naturaleza y a) Desde el punto de vista estadístico
por la necesidad de tener control sobre las
CUALITATIVAS
variables, se recomienda muestras pequeñas que
Si sus valores no se pueden asociar naturalmente a
suelen ser de por lo menos 30 sujetos. un número (no se pueden hacer operaciones
se emplean muestras algebraicas con ellos).
grandes y algunas veces se recomienda seleccionar Tipos:
Si sus valores no se pueden ordenar
de un 10 a un 20 por ciento de la población
.Sexo, Fumar (Sí/No)
accesible . : estado civil, color de los ojos,
profesión.
PARÁMETRO : si sus valores se pueden ordenar
Es una unidad numérica calculada sobre una IRA, grado de desnutrición, Intensidad del dolor.
población y resume los valores que ésta toma en
varios atributos. CUANTITATIVAS
Si sus valores son numéricos (tiene sentido hacer
operaciones algebraicas con ellos)
ESTADÍSTICO Tipos:
Si toma valores enteros
Es una unidad numérica calculada sobre una muestra Ejemplo: Número de abortos, número de parejas
que resume su información sobre algún aspecto. sexuales, etc.
Si entre dos valores, son posibles
infinitos valores intermedios.
Ejemplo: Edad, talla, presión intraocular, etc.
El cero no es absoluto
Ejemplo: la media del peso de 300 habitantes de la Temperatura en grados centígrado, la nota de un
ciudad de Lima. examen
El cero es absoluto.
Altura, peso
6
MANUAL de SALUD PÚBLICA ,EPIDEMIOLOGÍA y BIOESTADÍSTICA PLUS MEDIC A
Se divide un círculo en
tantas porciones como
clases existan, de
modo que a cada clase
GRÁFICOS para variables CUALITATIVAS le corresponde un
arco de círculo
Gráfico de barras proporcional a su
frecuencia absoluta o
relativa .
7
MANUAL de SALUD PÚBLICA ,EPIDEMIOLOGÍA y BIOESTADÍSTICA PLUS MEDIC A
La relación existente entre los radios, es la que se El criterio para calcular la altura de cada rectángulo
obtiene de suponer que la relación entre las áreas de es el de mantener la proporcionalidad entre la
las circunferencias es igual a la de los tamaños de las frecuencias absolutas (o relativas) de cada intervalo y
poblaciones respectivas, es decir: el área de los mismos.
Polígono de frecuencia
Pictogramas Para representar el polígono de frecuencias en el
primer y último intervalo, suponemos que
adyacentes a ellos existen otros intervalos de la
misma amplitud y frecuencia nula, y se unen por una
Expresan con dibujos alusivos al tema de estudio las línea recta los puntos del histograma que
frecuencias de las modalidades de la variable. Estos corresponden a sus marcas de clase.
gráficos se hacen representado a diferentes escalas
El polígono de frecuencias tiene en común con el
un mismo dibujo. histograma el que las áreas de la gráficas sobre un
intervalo son idénticas.
Fi. 3 Pictogramas
8
MANUAL de SALUD PÚBLICA ,EPIDEMIOLOGÍA y BIOESTADÍSTICA PLUS MEDIC A
Si los datos son una muestra, el promedio y la
mediana se llamarán estadísticos. Si los datos
Centralización o tendencia central son una población entonces estas medidas de
tendencia central se llamarán parámetros
Ejem. Media de 2, 2, 3 y 7 es (2+2+3+7) /4=3,5
¿Cuándo debemos usarla? cuando los datos tie-
nen distribución normal o casi normal
Precaución: es muy sensible a valores extremos.
Dispersión
Cuantiles, percentiles, cuartiles, deciles
Ejemplo
Edades de n=20 sujetos...
Calculamos (n+1)/2 obtenemos (20+1)/2 = 10,5.
Forma Entonces los términos centrales son la décima y un-
9
MANUAL de SALUD PÚBLICA ,EPIDEMIOLOGÍA y BIOESTADÍSTICA PLUS MEDIC A
10
MANUAL de SALUD PÚBLICA ,EPIDEMIOLOGÍA y BIOESTADÍSTICA PLUS MEDIC A
ESTADÍSTICOS de POSICIÓN
.
-La mediana es el percentil 50
-El percentil de orden 15 deja por debajo al 15% de
las observaciones. Por encima queda el 85%
1
S2 ( xi x )2
n i
Pensemos la desviación estándar como En general, el k-ésimo percentil es un valor tal que el
aproximadamente un promedio de las distancias k% de los datos son menores o iguales que él, y el
de las observaciones a la media. (100-k) % restante son mayores o iguales que él.
Si todas las observaciones son iguales, entonces
la desviación estándar es cero. .
La desviación estándar es positiva y mientras
más alejados están los valores del promedio, -Primer cuartil = Percentil 25 = Cuantil 0,25
mayor será la desviación estándar. -Segundo cuartil = Percentil 50 = Cuantil 0,5 =
mediana
Dispersión en distribuciones “normales” -Tercer cuartil = Percentil 75 = cuantil 0,75
-Centrado en la media y a
una desviación estándar
de distancia tenemos más
de la mitad de las
observaciones (68.25%).
-A dos desviaciones
estándar tenemos al
95.45%
-A tres desviaciones
estándar tenemos el 99.7%
11
MANUAL de SALUD PÚBLICA ,EPIDEMIOLOGÍA y BIOESTADÍSTICA PLUS MEDIC A
12
MANUAL de SALUD PÚBLICA ,EPIDEMIOLOGÍA y BIOESTADÍSTICA PLUS MEDIC A
OF: Un estudio ha codificado la intensidad del dolor b)El valor 6 indica la intensidad de dolor que puede
de los pacientes como: sin dolor, dolor leve, dolor considerarse normal en la escala utilizada.
moderado y dolor intenso. La variable ha sido media c)El valor 6 de la escala ha sido la puntuación
en una escala: obtenida con mayor frecuencia por los sujetos de la
a. Cualitativa nominal muestra.
b. Cualitativa ordinal d)El valor 6 es la media aritmética de las
c. Cualitativa discreta puntuaciones obtenidas por los sujetos de la
d. Cualitativa contínua muestra.
e. Dicotómica e)La diferencia entra la puntuación máxima y la
Rpta. B mínima obtenida por los sujetos de la muestra es 6.
Rpta. A
OF: Se está realizando un estudio para conocer el
efecto de un analgésico. La variable principal de OF: En un ensayo clínico se comparan 3 tratamientos
respuesta es una escala de dolor con los siguientes (p.e. placebo, tratamiento establecido y un
valores: 1 . No dolor 2. Dolor leve 3.Dolor moderado tratamiento nuevo). La variable respuesta es
y 4. Dolor intenso. ¿De qué tipo de variable se trata? contínua (p.e. nivel de glucosa en sangre). Aceptando
a. Variable dicotómica que la variable tiene una distribución normal, el test
b. Variable contínua correcto para comparar la respuesta es:
c. Variable discreta a)La t de Student.
d. Variable ordinal b)El test de Wilcoxon.
e. Variable cuantitativa c)Análisis de la varianza.
Rpta. D d)El test de Kruskal-Wallis.
e)El test ji-cuadrado.
OF : Al consultar la distribución del peso en una Rpta. C
muestra de sujetos adultos, se aprecia que el
percentil 25 corresponde a 65 kg. ¿Cuál de las
siguientes afirmaciones es correcta?:
a)El 25% de los sujetos de la muestra pesan
aproximadamente 65 kg.
b)El 25% de los sujetos de la muestra tienen un peso
igual o superior a 65 kg.
c)Para poder interpretar este valor, es necesario
conocer la desviación estándar de la distribución.
d)Para poder interpretar este valor, es necesario
conocer la media de la distribución.
e)El 25% de los sujetos de la muestra tienen un peso
igual o inferior a 65 kg.
Rpta. E
13
MANUAL de SALUD PÚBLICA ,EPIDEMIOLOGÍA y BIOESTADÍSTICA PLUS MEDIC A
CONCEPTOS
Población o Universo
Es un conjunto de individuos
o elementos que guardan
similitud entre sí en los
aspectos que son relevantes
para los objetivos de la
investigación. Cada uno de
los elementos están ¿Cuáles son las razones que limitan la
perfectamente identificados. medición en todos los sujetos de la
población?
La población o universo es demasiado grande para -Las limitaciones severas en relación a recursos
estudiarla en su totalidad. económicos y de tiempo, para lograr un cubrimiento
del ciento por ciento de la población.
-Falta de recurso humano suficientemente calificado
para realizar las observaciones o para obtener las
mediciones necesarias .
-Dificultades geográficas y logísticas que presenta una
tarea de gran magnitud como es el cubrimiento total
de una población.
Muestra
¡Para muestra…. un
botón!
Las dificultades ante-
riormente menciona-
Población o universo das, que podrían hacer
irrealizable un estudio,
pueden ser soluciona-
das si se estudia una
muestra de la pobla-
ción.
14
MANUAL de SALUD PÚBLICA ,EPIDEMIOLOGÍA y BIOESTADÍSTICA PLUS MEDIC A
Unidad de análisis
Es la unidad definida por el investigador para realizar
mediciones. Es el elemento básico de estudio.
15
MANUAL de SALUD PÚBLICA ,EPIDEMIOLOGÍA y BIOESTADÍSTICA PLUS MEDIC A
unidad de análisis natural es el paciente atendido, o presentes, podrían cambiar radicalmente los
la persona que se atiende en ese servicio médico. resultados finales de una investigación.
16
MANUAL de SALUD PÚBLICA ,EPIDEMIOLOGÍA y BIOESTADÍSTICA PLUS MEDIC A
Muestreo por CONVENIENCIA : Implica el empleo de El muestreo por cuotas no requiere de la aplicación
una muestra integrada por las personas o los objetos de técnicas complejas ni la inversión de una cantidad
cuya disponibilidad como sujetos de estudio sea más extraordinaria de tiempo o esfuerzos, salvo por la
conveniente. identificación de estratos y la representación
proporcional correspondiente, la técnica de
muestreo por cuotas es muy semejante a la de
conveniencia.
Este muestreo comparte muchas de las
Las muestras por conveniencia no constan deficiencias de la técnica de conveniencia.
necesariamente de individuos que el investigador
conozca. Muestreo INTENCIONAL : Se basa en la idea de que
el investigador puede usar sus conocimientos acerca
de la población para elegir los casos que incluirá en la
muestra.
El investigador debe seleccionar la variedad más
¡Las chicas los prefieren amplia posible de personas o los sujetos que a su juicio
flaquitos! son característicos de la población que le interesa o
que disponen de mayor información acerca del tema
El muestreo por convenien- de estudio.
cia es la técnica menos Si bien esta forma subjetiva de muestreo no ofrece un
sólida, pero también la que método externo y objetivo para evaluar cuán típicos
más se utiliza en los de la población son los sujetos seleccionados, puede
estudios de ciencias de la representar ciertas ventajas en circunstancias como
salud. la evaluación preprueba de instrumentos recién
desarrollados con una muestra de diversos tipos de
Cuando los fenómenos que se investigan son sujetos intencionalmente elegidos.
suficientemente homogéneos en la población, se
reduce el riesgo de sesgo. El muestreo intencional se aplica a menudo se
busca una muestra de expertos, como cuando se
Muestreo por CUOTAS : En el muestreo por cuotas el desea aplicar una prueba de detección de
investigador identifica estratos de la población y necesidades con base en la técnica del
establece las proporciones de elementos necesarias a informante clave.
partir de los distintos segmentos estratificados.
MUESTREO PROBABILÍSTICO
¿Muestreo por cuotas?
En este tipo de muestreo cada miembro de la
población tiene una probabilidad, conocida y superior
a cero, de ser incluido en la muestra y las unidades
muestrales hacen parte de la muestra
independientemente del criterio o gusto del
investigador.
Con base en información previa acerca de la Es el MEJOR MÉTODO para asegurar la validez
composición de la población, el investigador se de cualquier inferencia o generalización hecha
asegura de que los diversos segmentos o sectores con base en los resultados obtenidos a partir de
estén representados en la muestra en las mismas la muestra.
proporciones en que se presentan en la población.
17
MANUAL de SALUD PÚBLICA ,EPIDEMIOLOGÍA y BIOESTADÍSTICA PLUS MEDIC A
Aplicación práctica
Clasificación Como puede verse en la fig. 1 primero debemos
El muestreo probabilístico se clasifica en: seleccionar de una población una muestra. Luego de
seleccionar la muestra hay que determinar los
estadísticos:
x=Media s=Desviación standard
2=
s Varianza p=Proporción n=Tamaño
Luego estos estadísticos deben ser extrapolados a la
población para obtener los parámetros.
Muestreo ALEATORIO SIMPLE o Irrestricto: µ = Media σ= Desviación standard
Es la técnica considerada como la más sencilla en el 2=
σ Varianza π=Proporción
muestreo probabilístico. En ella, cada sujeto o unidad
N=Tamaño
tiene una probabilidad igual y conocida de ser
seleccionado. Todas las unidades están
adecuadamente identificadas.
¡Asi de fácil es el
Muestreo aleatorio
simple!
La variable de interés es una variable que puede
influir en los resultados del estudio.
Ej. Si se quiere determinar la media de la talla de un
grupo de alumnos de un colegio mixto ,es necesario
ordenar a los alumnos por la variable sexo, ya que la
talla va a depender del sexo.
El sexo es una variable que va a influir en la media de
la talla que se va a determinar.
19
MANUAL de SALUD PÚBLICA ,EPIDEMIOLOGÍA y BIOESTADÍSTICA PLUS MEDIC A
20
MANUAL de SALUD PÚBLICA ,EPIDEMIOLOGÍA y BIOESTADÍSTICA PLUS MEDIC A
Una vez determinados los estratos el siguiente paso
es seleccionar una muestra de cada uno de los
estratos ,.
La selección de la muestra se puede realizar
utilizando el:
-Muestreo aleatorio simple
-Sistemático.
Una vez obtenida la muestra determinamos los
estadísticos.
Extrapolamos los valores de los estadísticos a la
población para obtener los parámetros.
22
MANUAL de SALUD PÚBLICA ,EPIDEMIOLOGÍA y BIOESTADÍSTICA PLUS MEDIC A
Cuadro nº 1 : Características comunes de las pruebas
paramétricas.
DEFINICIÓN
1. Independencia de las observaciones a excepción de
Estadística inferencial es el conjunto de métodos
datos pareados.
estadísticos que permiten deducir (inferir) cómo se
distribuye la población bajo estudio, a partir de la 2. Las observaciones para la variable dependiente se
información que proporciona una muestra han obtenido de manera aleatoria de una población
representativa obtenida de dicha población. con distribución normal.
3. La variable dependiente es medida al menos en
La estadística inferencial extrapola los datos ob- una escala de intervalo.
tenidos de una muestra hacia la población de la 4. Se recomienda un tamaño de muestra mínimo de
cual ha sido seleccionada la muestra que hemos 30 sujetos por grupo.
estudiado. 5. Los datos son obtenidos de poblaciones que tienen
varianzas iguales (una varianza no debe ser el doble o
mayor que la otra).
6. Habitualmente las hipótesis se hacen sobre
valores numéricos, especialmente el promedio de
una población (μ), como ejemplo:
CLASIFICACIÓN Ho: μ1 = μ2 H1: μ1 ≠ μ2
7. Otros posibles requisitos: variable independiente
Existen dos tipos básicos de estadística diferencial:
nominal o de intervalo, homocedasticidad (para cada
-Estadística paramétrica
nivel de la variable independiente hay una variación
-Estadistica no-paramétrica
similar de la variable dependiente) y casillas de igual
tamaño.
Estadística paramétrica
Cuadro Nº2 : Valoración de las características de
Es la estadística que se recomienda por tener los datos.
mayor potencia, se trata de técnicas más
1. Determinar el nivel de medida de la variable de
precisas.
interés.
Para que la estadística inferencial proporcione 2. Valorar la distribución de las variables.
buenos resultados debe cumplir con 3 requisitos: • Medidas de tendencia central para cada variable.
• Sesgo y curtosis para cada variable.
-Distribución normal de los datos en la población • Valoración visual de la distribución de los datos.
-Muestra aleatoria (representativa de la población)
• Examinar los diagramas de las probabilidades de
-Datos cuantitativos: contínuos, discretos o de
la distribución.
intervalo o razón.
• Si se considera necesario transformar las
Técnicas paramétricas variables.
• Ver los resultados de la transformación.
3. Ver la homogeneidad de las varianzas.
4. Ver el tamaño de muestra total y de los
subgrupos.
5. Determinar qué prueba estadística paramétrica o
no paramétrica es la más adecuada.
23
MANUAL de SALUD PÚBLICA ,EPIDEMIOLOGÍA y BIOESTADÍSTICA PLUS MEDIC A
24
MANUAL de SALUD PÚBLICA ,EPIDEMIOLOGÍA y BIOESTADÍSTICA PLUS MEDIC A
Comentario
Para resolver este caso es necesario formular varias
preguntas:
Preguntas básicas en el análisis estadístico
1º ¿Qué tipo de muestra nos están presentando en el Cuando estamos frente a un problema y no nos dicen
problema? ¿La muestra es independiente o que la muestra es dependiente o independiente
dependiente? debemos asumir que es independiente.
Independiente: la selección de los elementos no
depende de la selección de otras unidades o
elementos.
En el caso que estamos viendo no nos indican si la
En este caso tenemos muestras pareadas. Por muestra es dependiente o independiente por lo que
ejemplo: si estamos haciendo un muestreo de tipo asumimos que es una muestra independiente.
pareado por una variable que nos interesa (por
ejemplo el sexo), si selecciono un sujeto del sexo
femenino el siguiente sujeto también tiene que ser La variable que se va a comparar es la talla , la cual es
femenino. El máximo grado de apareamiento lo una variable de tipo cuantitativa.
tendremos cuando estamos haciendo estudios en los
cuales los sujetos son grupo control y grupo de
intervención. En este ejemplo nos dicen explícitamente que se
están comparando 2 grupos.
2º ¿Es una variable cualitativa o cuantitativa?
3º ¿Cuántos grupos se están comparando en el
problema? En este ejemplo no nos indican el tipo de distribución
4º ¿Qué tipo de distribución tiene la variable que nos de los datos, pero si nos dicen de manera implícita
están presentando? que los datos tienen distribución normal, cuando nos
25
MANUAL de SALUD PÚBLICA ,EPIDEMIOLOGÍA y BIOESTADÍSTICA PLUS MEDIC A
indican que lo que se va a comparar es la talla por eso que tenemos que ir a las alternativas de la
promedio o sea la media de la talla. respuesta.
Si se van a comparar 2 medias , la condición es que
tengan una distribución normal. a)Test de la t de Student para datos independientes
La T de Student para datos independientes se usa
cuando las muestras son independientes.
En este ejemplo la muestra es dependiente por lo que
no es el test estadístico apropiado.
b)Análisis de varianza
Lo utilizamos cuando queremos comparar 2 ó más
grupos , la variable independiente es de tipo
cuantitativa pero el tipo de muestra también tiene
que ser independiente por lo tanto no es la alternativa
correcta.
CASO: En un ensayo clínico se comparan las cifras
de glucosa en una muestra de sujetos c)Test de la t de student – Fisher para los datos
representativa de una comunidad antes y después apareados
de la aplicación de un determinado tratamiento La T de Student para datos pareados se usa cuando:
hipoglucemiante cuya eficacia queremos
comprobar ¿Cuál prueba estadística es más
adecuada para analizar los datos obtenidos?
a)Test de la t de Student para datos independientes
b)Análisis de varianza Por lo que es la alternativa correcta.
c)Test de la t de student – Fisher para los datos
apareados d)Test de comparaciones múltiples
d)Test de comparaciones múltiples Se utiliza después de realizar el Test de ANOVA para
e)Chi – cuadrado ver si hay alguna diferencia entre las medias que se
están comparando. El test de ANOVA nos dice que
hay una diferencia significativa entre las medias que
se están comparando y el Test de comparaciones
múltiples nos dice entre que medias hay esa
diferencia significativa. Es falsa.
e)Chi – cuadrado
Comentario Se utiliza para variables de tipo cualitativo
Para resolver este caso es necesario formular varias
preguntas: Estadística paramétrica
Como es un estudio “antes y después” los sujetos son Estadística paramétrica
los mismos, por lo que es una muestra de tipo Cuando se pretende probar una hipótesis respecto
dependiente. a uno o más parámetros de una población que
tiende a una distribución normal, las pruebas
usadas son las de la estadística paramétrica, como
Lo que se quiere comparar son los niveles de glucosa la t de Student (cuadro Nº2)
, la cual es una variable cuantitativa.
Aunque la potencia de las pruebas estadísticas
paramétricas es mayor que la que ofrecen las
A pesar que el estudio es de un solo grupo de sujetos, pruebas no paramétricas, ya que con ellas se tiene la
se consideran como 2 grupos debido a que los mismos probabilidad de rechazar la hipótesis nula cuando
sujetos están antes de la intervención y después de la ésta realmente es falsa (error de tipo II: 1-β).
misma se vuelve a hacer la medición. El adecuado tamaño de la muestra es un requisito
indispensable para aumentar la eficacia de una
prueba: a medida que aumenta el tamaño de
En este caso no se menciona ni implícita ni muestra, disminuye la posibilidad de cometer el error
explícitamente cual es la distribución de los datos , es de tipo II.
26
MANUAL de SALUD PÚBLICA ,EPIDEMIOLOGÍA y BIOESTADÍSTICA PLUS MEDIC A
27
MANUAL de SALUD PÚBLICA ,EPIDEMIOLOGÍA y BIOESTADÍSTICA PLUS MEDIC A
28
MANUAL de SALUD PÚBLICA ,EPIDEMIOLOGÍA y BIOESTADÍSTICA PLUS MEDIC A
Prueba Z de Kolmogorov-Smirnov
Está basada en la diferencia absoluta máxima entre la
función de distribución acumulada observada para
ambas muestras.
Cuando esta diferencia es significativamente grande,
las dos distribuciones son consideradas diferentes. La
prueba de las reacciones extremas de Moses asume
que la variable experimental afecta algunos sujetos
en una dirección y otros sujetos en la dirección
opuesta.
29
MANUAL de SALUD PÚBLICA ,EPIDEMIOLOGÍA y BIOESTADÍSTICA PLUS MEDIC A
La hipótesis alternativa (H1) es
Prueba de hipótesis cualquier hipótesis que difiera
de la hipótesis nula. Es una
Definición afirmación que se acepta si los
datos maestrales proporcionan
Es el método para desarrollar un procedimiento para
evidencia suficiente de que la
probar la validez de una aseveración acerca de un
parámetro poblacional . hipótesis nula es falsa.
Objetivo
Nivel de significacia: Probabilidad de rechazar la
El propósito de la prueba de hipótesis no es cuestionar hipótesis nula cuando es verdadera.
el valor calculado del estadístico (muestral), sino hacer
Se le denota mediante la letra griega α, también es
un juicio con respecto a la diferencia entre estadístico de
denominada como nivel de riesgo.
muestra y un valor planteado del parámetro.
Procedimiento sistemático para una prueba
de hipótesis de una muestra
Si suponemos que la hipótesis planteada es
La hipótesis nula (Ho) verdadera, entonces, el nivel de significación
se refiere siempre a un indicará la probabilidad de no aceptarla, es decir, que
valor especificado del estén fuera del área de aceptación.
parámetro de pobla-
ción, no a una esta- Nivel de confianza (1-α): indica la probabilidad de
dística de muestra. aceptar la hipótesis planteada, cuando es verdadera
en la población.
La letra H significa hipótesis y el subíndice
cero no hay diferencia. La distribución de muestreo de la estadística de
prueba se divide en dos regiones:
Por lo general hay un "no" en la hipótesis nula que
indica que "no hay cambio" Podemos rechazar o -Región de rechazo (conocida como región crítica)
aceptar la Ho. -Región de no rechazo (aceptación).
Si la estadística de prueba cae dentro de la región de
aceptación, no se puede rechazar la hipótesis nula.
La región de rechazo puede considerarse como
el conjunto de valores de la estadística de prueba que
no tienen posibilidad de presentarse si la hipótesis nula
es verdadera.
30
MANUAL de SALUD PÚBLICA ,EPIDEMIOLOGÍA y BIOESTADÍSTICA PLUS MEDIC A
Por convención el error de tipo II tiene un valor de Si aplicamos lo anterior a Salud tenemos:
20%.
-Cuando la hipótesis nula es falsa y el test de
Potencia significancia la rechaza es un decisión correcta.
Es el complemento del error de tipo 2, su valor es de -Cuando la hipótesis nula es verdadera y el test
80%. de significancia no la rechaza también es un
decisión correcta.
Si incrementamos el valor del error de tipo II la
potencia disminuye. Error de tipo II
Si aumentamos la potencia se disminuye la -Cuando la hipótesis nula es falsa y el test de
probabilidad de cometer un error de tipo II. significancia no la rechaza es un error de tipo II.
La suma de la potencia más el error de tipo II Si estamos probando la eficacia de un
siempre debe dar 100% tratamiento, de una droga A sobre una droga B ,
Ejemplo: en este caso se comete un error de tipo II cuando
decimos que el tratamiento si tiene un efecto
Tenemos un reo en la vida real, que puede ser pero no lo percibimos. Es decir que hay diferencia
inocente o culpable y un juez que da el veredicto. entre el tratamiento A y B pero la prueba de
significancia dice que no hay diferencia, no se
rechaza la hipótesis nula. Se busca un
tratamiento alternativo y no hay consecuencias
adversas para el paciente.
32
MANUAL de SALUD PÚBLICA ,EPIDEMIOLOGÍA y BIOESTADÍSTICA PLUS MEDIC A
33
MANUAL de SALUD PÚBLICA ,EPIDEMIOLOGÍA y BIOESTADÍSTICA PLUS MEDIC A
la hipótesis
planteada se formula con ≥ o ≤
H0 : µ ≥ 200 H0 : µ ≤ 200
H1 : µ < 200 H1 : µ > 200
34
MANUAL de SALUD PÚBLICA ,EPIDEMIOLOGÍA y BIOESTADÍSTICA PLUS MEDIC A
Distribución muestral del valor estadístico z, con Supongamos que tenemos un número k de clases en
las cuales se han ido registrado un total de n
prueba de una cola a la derecha observaciones (n será el tamaño muestral).
Es el punto de división entre la región Denotaremos las frecuencias observadas en cada
clase por O1, O2, ..., O k
en la que se rechaza la hipótesis nula y la región en la
que no se rechaza la hipótesis nula. (Oi es el número de valores en la clase Ai ). Se
cumplirá:
Paso 5: Tomar una decisión.
E1 + E2 + ... + E k = n
En este último paso de la prueba de hipótesis, se
calcula el estadístico de prueba, se compara con el
valor crítico y se toma la decisión de rechazar o no la
hipótesis nula.
35
MANUAL de SALUD PÚBLICA ,EPIDEMIOLOGÍA y BIOESTADÍSTICA PLUS MEDIC A
Prueba de INDEPENDENCIA
La hipótesis de que las m poblaciones son
homogéneas, se traduce en que cada conjunto Aj debe Se trata de contrastar si dos variables cualitativas
tener una probabilidad teórica pj , desconocida, pero son independientes (es decir, si existe relación entre
que no varía de la población i a la población i’. Esto ellas), o no. Por ejemplo:
debe verificarse para todas las categorías, i.e., las ¿Los hábitos de lectura de los padres influyen en los
hábitos de lectura de los hijos?
categorías deben ser homogéneas en las diversas
muestras.
Estamos interesados en determinar si dos cualidades
Del mismo modo que la Prueba de Bondad de Ajuste,
o variables referidas a individuos de una población
en este caso debemos comparar las frecuencias
están relacionadas. Se diferencia de los contrastes
observadas en cada una de las muestras y para cada
anteriores en que en este caso estamos interesados
categoría con las frecuencias bajo el supuesto de
en ver la relación existente entre dos variables de una
homogeneidad en las poblaciones.
misma población, no queremos contrastar la
En este caso las frecuencias observadas corresponde
distribución teórica de una variable (prueba de
al número de individuos de la muestra i en la clase j,
bondad de ajuste) ni en comparar la distribución de
i.e., nij
una única variable en dos poblaciones (prueba de
El estadístico de contraste será
homogeneidad).
Supongamos que de n elementos de una población se
han observado dos características X e Y,
obteniéndose una muestra aleatoria simple
bidimensional (X1,Y1),(X2,Y2),...,(Xn,Yn). Sobre la
Donde eij es la frecuencia esperada bajo el supuesto
base de dichas observaciones se desea contrastar si
de homogeneidad, que puede representarse como ni
las características poblacionales X e Y son
Pj , es decir, el número de individuos en la muestra i
independientes o no. Para ello se dividirá el conjunto
por la probabilidad de que ocurra la característica j
de posibles valores de X en k conjuntos disjuntos
en la población. Para el cálculo de las probabilidades
36
MANUAL de SALUD PÚBLICA ,EPIDEMIOLOGÍA y BIOESTADÍSTICA PLUS MEDIC A
A1,A2,...,Ak; mientras que el conjunto de posibles A los totales se les llama totales marginales
valores Y será descompuesto en r conjuntos
disjuntos: B1,B2,...,Br
. Al clasificar os elementos de la muestra, aparecerá
un cierto número de ellos,
ijn , en cada una de las k × r clases así constituidas,
dando lugar a una tabla de contingencia de la forma:
Los valores esperados en cualquiera de las celdas
siempre deben de ser > o = a 5
Si en una de las celdas el valor es menor a 5 NO
podemos utilizar el valor del Chi cuadrado.,
debiéndose usar la prueba de Fisher exact ( más
frecuentemente utilizado) o la prueba de Corrección
de yates.
38