Está en la página 1de 85

Prueba de Hipótesis

Dr. Cristian Díaz Vélez


Epidemiólogo Clínico
Auditor Médico
 Es el procedimiento que permite llegar a
conclusiones acerca de una población a partir
de la información que se obtiene de una
muestra seleccionada de esa población.

 Se puede inferir a cerca de :

Parámetros poblacionales
Relaciones entre variables
Predicción de resultados

Cristian Díaz Vélez 3


Cristian Díaz Vélez 4
Estimación puntual: Es un solo valor numérico
utilizado para estimar el parámetro
correspondiente de la población.

Estimación por intervalos : Consta de dos valores


numéricos que definen un intervalo que, con
un grado específico de confianza, incluye al
parámetro por estimar.

Cristian Díaz Vélez 5


 Se desea conocer los niveles de glicemia de los
habitantes de un pueblo
 Se tomo una muestra de sangre de cada
habitante del pueblo
 Se calcula el promedio y la desviación estándar

Cristian Díaz Vélez 6


Estimación puntual:
Nivel de glicemia
La glicemia promedio de
70 la población es 100 mg/dl
80
90
100 μ =100
110
75 Estimación de intervalo:
85
95
195
σ = 35.6 El IC es igual a μ ± Z(σ /√n)
100
El IC: 100 ± 1.96 (35.6/ √100)
: (93 , 107)
Con una confianza de 95% el verdadero
valor de la glicemia promedio de los
habitantes se halla entre 93 a 107 mg/dl.

Cristian Díaz Vélez 7


 Es el intervalo que contiene con determinada
confianza al valor del parámetro poblacional,
que se desea estimar.

X - (Z(σ /√n) X X + (Z(σ /√n)

Cristian Díaz Vélez 8


Cristian Díaz Vélez 9
Intervalo de confianza

Rango

Cristian Díaz Vélez 10


Cristian Díaz Vélez 11
Se sospecha que el Valor del Sodio sérico de los
pacientes con Tuberculosis Miliar es diferente de
la población general
 Se sustenta esta suposición en la observación de
3 pacientes que tienen la concentración de sodio
sérico menos de 140 meq/l.
 El valor promedio observado de los tres
pacientes fue 137.5 meq/l.

Cristian Díaz Vélez 12


Los pasos solo son referenciales
No absolutos

Cristian Díaz Vélez 13


 1.- Establecer la Hipótesis (H0 y H1)
 2.- Elección de la prueba estadística
 3.- Nivel de significación
 4.- Aplicación de la prueba
 5.- Valor P
 6.- La decisión

Cristian Díaz Vélez 14


Cristian Díaz Vélez 15
Las hipótesis estadísticas son expresadas como
relación entre variables
Tradicionalmente se denomina:
 Hipótesis Nula (H0), aquella que expresa que
no hay diferencia
 Hipótesis Alterna (H1), aquella que expresa
que hay diferencia o asociación entre variables

Cristian Díaz Vélez 16


Ante la sospecha que el Valor del Sodio sérico de
los pacientes con Tuberculosis Miliar es diferente
de la población general. La hipótesis a evaluar :
 H0: El nivel del sodio sérico en pacientes con
tuberculosis miliar no difiere de la población
general.
 H1: El nivel del sodio sérico en pacientes con
tuberculosis miliar difiere de la población
general.

Cristian Díaz Vélez 17


Eficacia y seguridad del Tramadol
subcutáneo vs
endovenoso en el manejo del dolor
agudo post operatorio
en pacientes traumatológicos

Cristian Díaz Vélez 18


Contraste Unilateral
La Eficacia y seguridad del Tramadol subcutáneo es igual al
endovenoso en el manejo del dolor agudo post operatorio
en pacientes traumatológicos

La Eficacia y seguridad del Tramadol subcutáneo es mayor al


endovenoso en el manejo del dolor agudo post operatorio
en pacientes traumatológicos

Contraste Bilateral
La Eficacia y seguridad del Tramadol subcutáneo es igual al
endovenoso en el manejo del dolor agudo post operatorio
en pacientes traumatológicos

La Eficacia y seguridad del Tramadol subcutáneo son diferentes


al endovenoso en el manejo del dolor agudo post operatorio
en pacientes traumatológicos

Nivel de significancia: 95%


Cristian Díaz Vélez 19
Supongamos que en estudio se obtuvo p = 0,03
Entonces es 3%, como se uso nivel de significancia 95% (p<0,05)
Vemos que el 3% (1,5% a cada lado de la cola) es menor de 5% y estaría
en el área sombreada.

El “p” se interpreta
sobre la hipótesis
nula

Conclusión: Se rechaza la hipótesis nula, por lo tanto se acepta la hipótesis alterna


Cristian Díaz Vélez 20
Para tener en cuenta:
 Cuanto más grande sea la diferencia entre las
dos variables, más fácil es demostrar que la
diferencia es significativa.
 Cuanto más grande es el tamaño muestral más
fácil es detectar diferencias entre los grupos.

Cristian Díaz Vélez 21


Cristian Díaz Vélez 22
 Existen más de 300 pruebas estadísticas básicas.
 Hay dos clases de pruebas estadísticas: Las
paramétricas y las no paramétricas.

Cristian Díaz Vélez 23


 Los valores de la variable dependiente sigan la
distribución de la curva normal en la muestra en la que
se hizo la investigación.
 Las varianzas de los grupos que se comparan en una
variable dependiente sean aproximadamente iguales
(homogeneidad de las varianzas).
 La variable dependiente esté medida en una escala que
sea por lo menos de intervalo, aunque este último
requisito no es compartido por todos los estadísticos.
Cuando los datos cumplen con los requisitos indicados,
especialmente con los dos primeros, las pruebas
estadísticas paramétricas exhiben su máximo poder.

Cristian Díaz Vélez 24


 Las pruebas estadísticas no paramétricas, en
cambio, no hacen a los datos ninguna de las
exigencias que les hacen las pruebas
estadísticas paramétricas; por eso se les
denomina "pruebas estadísticas libres de
distribución".
 Todas estas pruebas poseen menos poder que
las pruebas paramétricas correspondientes,
pero han demostrado ser muy útiles como
alternativas cuando no se considera apropiado
el uso de pruebas paramétricas.

Cristian Díaz Vélez 25


 Tipo:
Categórica/cualitativa
Numérica/cuantitativa
 Escala:
Categórica/cualitativa Nominal
Ordinal

Numérica/cuantitativa Razón
Proporción
Intervalo

Cristian Díaz Vélez 26


 Categóricas nominales Dicotómicas
Nominales ppd

 Categóricas ordinales
Ordinales
 Numéricas proporción
 Numéricas razón Cuantitativas

Cristian Díaz Vélez 27


Variable Dependiente Variable Prueba
Independiente
Dicotómica Dicotómica z, Chi-2, Fisher
Dicotómica Nominal z, Chi-2, Metha-Patel
Dicotómica Ordinal Mann-Whitney /
Wilcoxon
Dicotómica Cuantitativa Regresión Logística
Nominal Dicotómica z, Chi-2, Metha-Patel
Nominal Cuantitativa Regresión Discriminante
Ordinal Nominal Kruskal-Wallis
Ordinal Cuantitativa Regresión Odds
Proporcional
Cuantitativa Dicotómica t de Student
Cuantitativa Nominal ANOVA
Cuantitativa Cuantitativa Regresión Lineal,
Cristian Díaz Vélez correlaciones 28
Identificar una variable dependiente

Ninguna V. ind. Una V. ind. Más de una V. ind.

V. Dep. V. Dep. V. Dep. V. Dep. V. Dep. V. Dep. V. Dep. V. Dep. V. Dep.


Continua Ordinal Nominal Continua Ordinal Nominal Continua Ordinal Nominal

1 2 3 4 5 6 7 8 9

Para fines estadísticos una variable nominal solo se refiere a dos categorías de una
Característica. Si la característica tiene K categorías, se necesitan K-1 variables.
Cristian Díaz Vélez 29
1
V. Dependiente
Continua

Interés en la Interés en la
posición dispersión

Media Varianza, DS Coef. Variación


T student Chi2 T student

Cristian Díaz Vélez 30


2

Var. Depend.
Ordinal

Interés en la Interés en la
posición dispersión

Mediana Amplitud
Prueba de Willcoxon intercuartilica

Cristian Díaz Vélez 31


3
V. Dependiente
nominal

Interés en la
Si posición No

Proporción Tasa

Desenlace Desenlace Aprox. Normal


común raro Poisson

Binomial Poisson

Cristian Díaz Vélez 32


4
V. Dependiente
Continua

No Interés en la Si
posición
Dif. Medias
T student
Var. Indep Var. Indep
intencionada aleatoria

Regresión lineal Análisis Correlación

T student T student
Prueba F Z de Fisher

Cristian Díaz Vélez 33


5

Var. Depend.
Ordinal

Var. Indep. Var. Indep


Nominal Ordinal

Mediana Coef. Correlación


Mann-Whitney
Prueba Sperman

Cristian Díaz Vélez 34


6

Var. Depend.
Nominal

Var. Indep. Var. Indep.


Nominal Ordinal o continua

Datos Datos Chi2 para


apareados Indep. tendencia

P. McNemar Dif. Medias


Chi2
Test Fisher

Cristian Díaz Vélez 35


7

Var. Depend.
Ordinal

Var. Indep. Var. Indep. Var. Indep


Nominal continua Continua o nominal

Var. Indep Var. Indep Var. Indep Var. Indep


Datos Datos intencionada aleatoria intencionada aleatoria
apareados Indep.

ANOVA ANOVA Análisis Análisis Análisis Análisis


Factorial Medidas Regresión Correlación Covarianza Correlación
de una via repetidas múltiple múltiple (ANCOVA) múltiple

Prueba F Prueba F Prueba F Prueba F Prueba F Prueba F


Student Student F parcial F parcial F parcial F parcial
Cristian Díaz Vélez 36
8
V. Dependiente
ordinal

Var. Indep
Nominal

Datos Datos
Indep. pareados

Prueba
Prueba
Friedman
Kruskal-Wallis

Cristian Díaz Vélez 37


9

Var. Depend.
Nominal

Var. Indep. Var. Indep


Nominal Continua o nominal

Dependiente No dependiente
Del tiempo Del tiempo.
Dependiente No dependiente
Del tiempo Del tiempo.

Análisis de Análisis Regresión Regresión Análisis


Tablas de vida estratificado De Cox logística discriminante

Log-rank Mantel-Haenszel Razón de Razón de Razón de


chi2 Máxima Máxima Máxima
probabilidad probabilidad probabilidad
Cristian Díaz Vélez 38
Cristian Díaz Vélez 39
PRUEBAS
PARAMETRICAS

NUMERO DE
GRUPOS
PRUEBAS DE
HIPOTESIS

TIPO DE
VARIABLE

PRUEBA
PRUEBAS NO
PARAMETRICAS

NUMERO DE
GRUPOS

TIPO DE
VARIABLE

PRUEBA

40
Si Prueba Z para la media
1 grupo
Si
n > = 30 Prueba T para la media
Distribución
normal
No Prueba del signo
No para la mediana
Si
Prueba Z para la ≠ media
Si
n > = 30 Si Prueba T
Si Varianzas para ≠ de medias
No Distribución iguales Prueba T
normal No Con ajustes de
g de libertad
2 grupos
Número No Prueba de Mann Whitney
de grupos Independientes para comparación de poblac

Si Prueba Z para la media


de la ≠ en datos apareados

Si Prueba T para la media de


No La ≠ en datos apareados
n > = 30

Distribución
No normal Prueba del signo ó de
No Wilcoxon para datos apareados
Si
3 grupos Si Distribución ANVA Comparación de Ttos0
Normal c/varianzas
semejantes No Prueba de krustal-Wallis-Comp Ttos
Independientes
Distribución Si
Normal c/varianzas ANVA en bloque Comparación de Ttos
No
semejantes No
Prueba de Friedman -Comp Ttos 41
1 grupo Si
Prueba Z para la proporción poblacional
Muestra grande
nP y n (1-P) > 5
No Prueba binomial p/ proporción poblacional

Si
Prueba exacta de Fisher
Si Frecuencias Comparación de proporciones
Esperadas
pequeñas
No Prueba Z o Prueba JI Cuadrado para
2 grupos Comparación de proporciones
Número
de grupos Independientes

No Prueba de McNemar
Comparación de proporciones

Si Prueba JI Cuadrado (reunir categorías)


para comparación de proporciones
Frecuencias
3 grupos Si Esperadas
pequeñas No Prueba JI Cuadrado para
Independientes Comparación de proporciones

No Prueba Q de Cochran
comparación de tratamientos
42
Continua
Coeficiente de correlación lineal de Pearson

Escala de
Medición
para Ordinal y/ó númerica
ambas Coeficiente de correlación por rangos de Spearman
variables

Prueba JI Cuadrado (Coeficiente ǿ)


Riesgo relativo (Estudios de cohorte)
Odds ratio (Estudios de casos-control)
Nominal Coeficiente de concordancia Kappa
Cada variable (Comparación de métodos)
Tiene dos
Categorías
(tabla de 2x2)
Prueba de JI Cuadrado para independencia
de variables (Coeficiente de contingencia)

43
Cristian Díaz Vélez 44
Los valores críticos de los errores en los estudios
del área biomédica:
Alfa () menor al 5%
Beta () menor al 20%
La confianza en 95% o más
La Potencia (1-β) 80% o más.
El tamaño de la muestra influye.

Cristian Díaz Vélez 45


2.5% 2.5%
No No
esperada esperada

Población Esperada

R. Rechazo Ho Región de no rechazo R. Rechazo Ho


Cristian Díaz Vélez 46
 La confianza es de 95%, el error alfa se fija a lo
mas en 5%.
 De modo similar se fija la potencia del estudio
en 80%, por tal el error beta es a lo mas 20%.

Cristian Díaz Vélez 47


La probabilidad de rechazar la hipótesis nula
cuando en realidad es verdadera y es la “p”,
por lo es un riesgo que asume el investigador
de equivocarse al rechazar la hipótesis nula,
cuando en realidad es cierta. Este riesgo se
establece normalmente en 0.05 ó 0.01
“Aceptar algo que es falso” Por lo tanto “p” no es un indicador de fuerza
de la asociación ni de su importancia, sino
una probabilidad.

El error de tipo II consiste en aceptar la


hipótesis nula cuando es falsa y esto se
conoce como el error de tipo II o Beta (β ).

“Rechazar algo que en realidad es verdadero”

Cristian Díaz Vélez 48


 H0: El nivel del sodio sérico en pacientes con
tuberculosis miliar no difiere de la población
general.
 H1: El nivel del sodio sérico en pacientes con
tuberculosis miliar difiere de la población
general.

Error α: Probabilidad de decir que el Sodio sérico


es diferente en los pacientes con TBC miliar
cuando en realidad son iguales.
Error β: Probabilidad de decir que el Sodio sérico
es igual en los pacientes con TBC miliar cuando
en realidad son diferentes.
Cristian Díaz Vélez 49
1-β = Potencia
“Aceptar (hipótesis alterna)
algo que en realidad es
verdadero”

 Probabilidad de aceptar la hipótesis alterna


cuando realmente sea verdadera.
 Probabilidad de rechazar la hipótesis nula
cuando realmente sea falsa.

Cristian Díaz Vélez 50


1-α = Nivel de confianza
“Rechazar (hipótesis alterna)
algo que es falso”

 Probabilidad de rechazar la hipótesis alterna


cuando realmente sea falsa.
 Probabilidad de aceptar la hipótesis nula
cuando realmente sea verdadera.

Cristian Díaz Vélez 51


 Partimos con un nivel de confianza de 0,95
para la variable principal, es decir α = 0,05
Hipótesis: El nivel del sodio sérico en
pacientes con tuberculosis miliar difiere de la
población general.
 Análisis de subgrupos: Sexo, edad, nivel de
instrucción.
Hipótesis: El nivel del sodio sérico en
pacientes con tuberculosis miliar difiere de la
población general según sexo, edad.
0,95 x 0,95= 0,9025; α = 0,0975
Cristian Díaz Vélez 52
Cristian Díaz Vélez 53
Tolerancia de error ≠ Error tipo I

Cristian Díaz Vélez 54


 Disponer de una teoría que guíe la investigación,
evitando el "salir de pesca" con el ordenador buscando
asociaciones entre variables.
 Disminuir el número de test estadísticos llevados a
cabo en el estudio.
 Depurar la base de datos para evitar errores de valores
extremos que puedan producir hallazgos significativos.
 Utilizar valores de “p” más reducidos (0.01 ó 0.001).
 Reproducir el estudio. Si al reproducir el estudio se
obtienen resultados similares, estaremos más seguros
de no estar cometiendo el error de tipo I.

Cristian Díaz Vélez 55


 Incrementar el tamaño de la muestra.
 Estimar el poder estadístico del estudio.
 Incrementar el valor de “p”.
 Utilizar test paramétricos (más potentes) en
lugar de test no paramétricos.

Cristian Díaz Vélez 56


Una vez descartado lo
imposible, lo que queda, por
improbable que parezca, debe
ser la verdad.
Sir Arthur Conan Doyle (1859-1930)
Cristian Díaz Vélez 58
 El término "estadísticamente significativo"
invade la literatura médica y se percibe como
una etiqueta que indicase "garantía de calidad".

 Los test de hipótesis son test de significación


estadística.

Cristian Díaz Vélez 59


 La significancia estadística viene dada por el
nivel de Significancia que nos trazamos
inicialmente.
- Un nivel de significancia del 95% lleva
implícito una p < de 0,05
- Y nivel de significancia del 99% lleva implícita
una p < 0,01.

En conclusión: cuanto más estadísticamente


significativo sea, es menos probable de cometer
el error tipo I.
Al el error tipo I el error tipo II
Cristian Díaz Vélez 60
Cristian Díaz Vélez 61
 Disponemos de 2 tratamientos (A y B). El
tratamiento A lo reciben 25 pacientes y el
tratamiento B otros 25 pacientes. 15 pacientes
responden favorablemente al tratamiento A y
20 al tratamiento B. ¿Existe diferencia
significativa entre ambos tratamientos?

Ho (hipótesis nula) = No hay diferencia entre


ambos tratamientos.
Ha (hipótesis alternativa) = Sí existe diferencia
entre ambos tratamientos.

Nivel de significancia: 95%


Cristian Díaz Vélez 62
p : 0,20

Si ahora la muestra es de 900 pacientes por grupo, se tiene que:


p : 0,043

Por lo tanto los valores de la "p“ deben ser considerados solo como una guía
y no como base de conclusiones definitivas e irrevocables.

Cristian Díaz Vélez 63


Cristian Díaz Vélez 64
 Poder estadístico o potencia estadística.
 Es el complemento del error tipo II (1-β).
 Es la probabilidad de rechazar la hipótesis nula
cuando es realmente falsa o Probabilidad de
aceptar la hipótesis alterna cuando realmente
es verdadera.
 Representa la capacidad de un test para
detectar como estadísticamente significativas
diferencias o asociaciones de una magnitud
determinada.

Cristian Díaz Vélez 65


 El tamaño del efecto a detectar:
> tamaño del efecto relevancia clínica.
> probabilidad hallazgos significativos
> poder estadístico.
 Variabilidad:
A mayor variabilidad
< probabilidad obtener diferencias
< poder estadístico.

Cristian Díaz Vélez 66


 El tamaño de la muestra:
> muestra
> potencia estadística.

 El nivel de significación estadística.


valor α poder estadístico
Es decir, si disminuimos la probabilidad de cometer un error
de tipo I aumentamos simultáneamente la probabilidad de un
error de tipo II (por lo tanto disminuye la potencia), por lo
que se trata de encontrar un punto de “equilibrio” entre
ambas.

 Generalmente, se suele trabajar con un poder en torno al 80%


o al 90%.
Cristian Díaz Vélez 67
Cristian Díaz Vélez 68
Cristian Díaz Vélez 69
 Para EVALUAR las hipótesis establecidas se
debe realizar un estudio.
 Se toma una muestra de 35 pacientes con
tuberculosis miliar y se realizará el dosaje de
Na+ sérico.
 Entonces se comparará una muestra contra una
población con parámetros conocidos.

Cristian Díaz Vélez 70


x 
z 

n
Cristian Díaz Vélez 71
 Con los valores obtenidos, se calcula el
estadístico de prueba
 Se trata de evaluar cuanto se asemejan los
datos a lo que teóricamente sería la distribución
si la hipótesis nula es verdadera

Cristian Díaz Vélez 72


Si se tomó una muestra de 35 individuos
Se sabe que en la población el sodio tiene
una tipo Normal con  = 140 meq/l, y  =
2.5 meq/l.
¿Qué prueba estadística se usaría?

Cristian Díaz Vélez 73


x  El promedio de Sodio
z 
 sérico en la muestra es
138 meq/l
n
138 - 140
Z = ---------------
2.5/ √35 El valor de la prueba
para este ejercicio es
Z = - 4,76 Z = -4,76
Cristian Díaz Vélez 74
Cristian Díaz Vélez 75
 El valor p , es la probabilidad de que por azar
obtengamos un resultado como el tenemos en
frente o mas extremo, asumiendo que no hay
diferencia entre la población y la muestra
estudiada.

Cristian Díaz Vélez 76


La probabilidad de
obtener -4 ,7 o aun
menos por Azar
:0.0001

-4

Cristian Díaz Vélez 77


P

Se rechaza H0: =140

Y se acepta H1:  140



P
X  138

Cristian Díaz Vélez 78


Cristian Díaz Vélez 79
 Luego de obtener los resultados se pudo
calcular el valor “p,” que es la probabilidad de
un resultado tanto o mas extremo que el que
hemos encontrado a base de nuestros datos.
 Usualmente si cae en la región de rechazo (o p
es menor que ) se rechaza H0

Cristian Díaz Vélez 80


 Se tomo una muestra de 35 individuos con
tuberculosis miliar
 El promedio de Sodio de la muestra resultó en
138 meq/l
 ¿ 138 es diferente al de la población ?

Tenemos que establecer un criterio para


decidir si 138 es un valor esperado de la
población general o no.
¿ Cuales son los valores esperados ?

Cristian Díaz Vélez 81


Cristian Díaz Vélez 82
 Ocurrió que el valor de Z es -4,7
Lo que corresponde a un valor de p = 0,0001
 Dado que ese valor es menor que el valor alfa
prefijado.
 Se rechaza la hipótesis nula.

ACEPTAMOS LA HÍPOTESIS ALTERNA

Cristian Díaz Vélez 83


Cristian Díaz Vélez 84
Cristian Díaz Vélez 85

También podría gustarte