Pruebadehipotesis 120121203526 Phpapp02

Prueba de Hipótesis
Dr. Cristian Díaz Vélez

Epidemiólogo Clínico
Auditor Médico
 Es el procedimiento que permite llegar a
conclusiones acerca de una población a partir
de la información que se obtiene de una
muestra seleccionada de esa población.
 Se puede inferir a cerca de :
Parámetros poblacionales
Relaciones entre variables
Predicción de resultados
Cristian Díaz Vélez 3

Estimación puntual: Es un solo valor numérico
utilizado para estimar el parámetro
correspondiente de la población.
Estimación por intervalos : Consta de dos valores

numéricos que definen un intervalo que, con
un grado específico de confianza, incluye al
parámetro por estimar.

 Se desea conocer los niveles de glicemia de los
habitantes de un pueblo
 Se tomo una muestra de sangre de cada
habitante del pueblo
 Se calcula el promedio y la desviación estándar

Estimación puntual:
Nivel de glicemia
La glicemia promedio de
70 la población es 100 mg/dl
80
90
100 μ =100
110
75 Estimación de intervalo:
85
95
195
σ = 35.6 El IC es igual a μ ± Z(σ /√n)
100
El IC: 100 ± 1.96 (35.6/ √100)
: (93 , 107)
Con una confianza de 95% el verdadero
valor de la glicemia promedio de los
habitantes se halla entre 93 a 107 mg/dl.

 Es el intervalo que contiene con determinada
confianza al valor del parámetro poblacional,
que se desea estimar.
X - (Z(σ /√n) X X + (Z(σ /√n)

Intervalo de confianza
≠
Rango

Se sospecha que el Valor del Sodio sérico de los
pacientes con Tuberculosis Miliar es diferente de
la población general
 Se sustenta esta suposición en la observación de
3 pacientes que tienen la concentración de sodio
sérico menos de 140 meq/l.
 El valor promedio observado de los tres
pacientes fue 137.5 meq/l.

Los pasos solo son referenciales
No absolutos

 1.- Establecer la Hipótesis (H0 y H1)
 2.- Elección de la prueba estadística
 3.- Nivel de significación
 4.- Aplicación de la prueba
 5.- Valor P
 6.- La decisión

Las hipótesis estadísticas son expresadas como
relación entre variables
Tradicionalmente se denomina:
 Hipótesis Nula (H0), aquella que expresa que
no hay diferencia
 Hipótesis Alterna (H1), aquella que expresa
que hay diferencia o asociación entre variables

Ante la sospecha que el Valor del Sodio sérico de
los pacientes con Tuberculosis Miliar es diferente
de la población general. La hipótesis a evaluar :
 H0: El nivel del sodio sérico en pacientes con
tuberculosis miliar no difiere de la población
general.
tuberculosis miliar difiere de la población
general.

Eficacia y seguridad del Tramadol
subcutáneo vs
endovenoso en el manejo del dolor
agudo post operatorio
en pacientes traumatológicos

Contraste Unilateral
La Eficacia y seguridad del Tramadol subcutáneo es igual al
endovenoso en el manejo del dolor agudo post operatorio
La Eficacia y seguridad del Tramadol subcutáneo es mayor al

Contraste Bilateral
La Eficacia y seguridad del Tramadol subcutáneo es igual al
La Eficacia y seguridad del Tramadol subcutáneo son diferentes

al endovenoso en el manejo del dolor agudo post operatorio
Nivel de significancia: 95%

Supongamos que en estudio se obtuvo p = 0,03
Entonces es 3%, como se uso nivel de significancia 95% (p<0,05)
Vemos que el 3% (1,5% a cada lado de la cola) es menor de 5% y estaría
en el área sombreada.
El “p” se interpreta
sobre la hipótesis
nula
Conclusión: Se rechaza la hipótesis nula, por lo tanto se acepta la hipótesis alterna

Para tener en cuenta:
 Cuanto más grande sea la diferencia entre las
dos variables, más fácil es demostrar que la
diferencia es significativa.
 Cuanto más grande es el tamaño muestral más
fácil es detectar diferencias entre los grupos.

 Existen más de 300 pruebas estadísticas básicas.
 Hay dos clases de pruebas estadísticas: Las
paramétricas y las no paramétricas.

 Los valores de la variable dependiente sigan la
distribución de la curva normal en la muestra en la que
se hizo la investigación.
 Las varianzas de los grupos que se comparan en una
variable dependiente sean aproximadamente iguales
(homogeneidad de las varianzas).
 La variable dependiente esté medida en una escala que
sea por lo menos de intervalo, aunque este último
requisito no es compartido por todos los estadísticos.
Cuando los datos cumplen con los requisitos indicados,
especialmente con los dos primeros, las pruebas
estadísticas paramétricas exhiben su máximo poder.

 Las pruebas estadísticas no paramétricas, en
cambio, no hacen a los datos ninguna de las
exigencias que les hacen las pruebas
estadísticas paramétricas; por eso se les
denomina "pruebas estadísticas libres de
distribución".
 Todas estas pruebas poseen menos poder que
las pruebas paramétricas correspondientes,
pero han demostrado ser muy útiles como
alternativas cuando no se considera apropiado
el uso de pruebas paramétricas.

 Tipo:
Categórica/cualitativa
Numérica/cuantitativa
 Escala:
Categórica/cualitativa Nominal
Ordinal
Numérica/cuantitativa Razón
Proporción
Intervalo

 Categóricas nominales Dicotómicas
Nominales ppd
 Categóricas ordinales
Ordinales
 Numéricas proporción
 Numéricas razón Cuantitativas

Variable Dependiente Variable Prueba
Independiente
Dicotómica Dicotómica z, Chi-2, Fisher
Dicotómica Nominal z, Chi-2, Metha-Patel
Dicotómica Ordinal Mann-Whitney /
Wilcoxon
Dicotómica Cuantitativa Regresión Logística
Nominal Dicotómica z, Chi-2, Metha-Patel
Nominal Cuantitativa Regresión Discriminante
Ordinal Nominal Kruskal-Wallis
Ordinal Cuantitativa Regresión Odds
Proporcional
Cuantitativa Dicotómica t de Student
Cuantitativa Nominal ANOVA
Cuantitativa Cuantitativa Regresión Lineal,
Cristian Díaz Vélez correlaciones 28
Identificar una variable dependiente
Ninguna V. ind. Una V. ind. Más de una V. ind.
V. Dep. V. Dep. V. Dep. V. Dep. V. Dep. V. Dep. V. Dep. V. Dep. V. Dep.

Continua Ordinal Nominal Continua Ordinal Nominal Continua Ordinal Nominal
1 2 3 4 5 6 7 8 9
Para fines estadísticos una variable nominal solo se refiere a dos categorías de una
Característica. Si la característica tiene K categorías, se necesitan K-1 variables.
1
V. Dependiente
Continua
Interés en la Interés en la
posición dispersión
Media Varianza, DS Coef. Variación

T student Chi2 T student

2
Var. Depend.
Ordinal
Interés en la Interés en la
posición dispersión
Mediana Amplitud
Prueba de Willcoxon intercuartilica

3
V. Dependiente
nominal
Interés en la
Si posición No
Proporción Tasa
Desenlace Desenlace Aprox. Normal

común raro Poisson
Binomial Poisson

4
V. Dependiente
Continua
No Interés en la Si
posición
Dif. Medias
T student
Var. Indep Var. Indep
intencionada aleatoria
Regresión lineal Análisis Correlación
T student T student
Prueba F Z de Fisher

5
Var. Depend.
Ordinal
Var. Indep. Var. Indep

Nominal Ordinal
Mediana Coef. Correlación

Mann-Whitney
Prueba Sperman

6
Var. Depend.
Nominal
Var. Indep. Var. Indep.

Nominal Ordinal o continua
Datos Datos Chi2 para

apareados Indep. tendencia
P. McNemar Dif. Medias

Chi2
Test Fisher

7
Var. Depend.
Ordinal
Var. Indep. Var. Indep. Var. Indep

Nominal continua Continua o nominal
Var. Indep Var. Indep Var. Indep Var. Indep

Datos Datos intencionada aleatoria intencionada aleatoria
apareados Indep.
ANOVA ANOVA Análisis Análisis Análisis Análisis

Factorial Medidas Regresión Correlación Covarianza Correlación
de una via repetidas múltiple múltiple (ANCOVA) múltiple
Prueba F Prueba F Prueba F Prueba F Prueba F Prueba F

Student Student F parcial F parcial F parcial F parcial
8
V. Dependiente
ordinal
Var. Indep
Nominal
Datos Datos
Indep. pareados
Prueba
Prueba
Friedman
Kruskal-Wallis

9
Var. Depend.
Nominal
Var. Indep. Var. Indep

Nominal Continua o nominal
Dependiente No dependiente
Del tiempo Del tiempo.
Dependiente No dependiente
Del tiempo Del tiempo.
Análisis de Análisis Regresión Regresión Análisis

Tablas de vida estratificado De Cox logística discriminante
Log-rank Mantel-Haenszel Razón de Razón de Razón de

chi2 Máxima Máxima Máxima
probabilidad probabilidad probabilidad
PRUEBAS
PARAMETRICAS
NUMERO DE
GRUPOS
PRUEBAS DE
HIPOTESIS
TIPO DE
VARIABLE
PRUEBA
PRUEBAS NO
PARAMETRICAS
NUMERO DE
GRUPOS
TIPO DE
VARIABLE
PRUEBA
40
Si Prueba Z para la media
1 grupo
Si
n > = 30 Prueba T para la media
Distribución
normal
No Prueba del signo
No para la mediana
Si
Prueba Z para la ≠ media
Si
n > = 30 Si Prueba T
Si Varianzas para ≠ de medias
No Distribución iguales Prueba T
normal No Con ajustes de
g de libertad
2 grupos
Número No Prueba de Mann Whitney
de grupos Independientes para comparación de poblac
Si Prueba Z para la media

de la ≠ en datos apareados
Si Prueba T para la media de

No La ≠ en datos apareados
n > = 30
Distribución
No normal Prueba del signo ó de
No Wilcoxon para datos apareados
Si
3 grupos Si Distribución ANVA Comparación de Ttos0
Normal c/varianzas
semejantes No Prueba de krustal-Wallis-Comp Ttos
Independientes
Distribución Si
Normal c/varianzas ANVA en bloque Comparación de Ttos
No
semejantes No
Prueba de Friedman -Comp Ttos 41
1 grupo Si
Prueba Z para la proporción poblacional
Muestra grande
nP y n (1-P) > 5
No Prueba binomial p/ proporción poblacional
Si
Prueba exacta de Fisher
Si Frecuencias Comparación de proporciones
Esperadas
pequeñas
No Prueba Z o Prueba JI Cuadrado para
2 grupos Comparación de proporciones
Número
de grupos Independientes
No Prueba de McNemar
Comparación de proporciones
Si Prueba JI Cuadrado (reunir categorías)

para comparación de proporciones
Frecuencias
3 grupos Si Esperadas
pequeñas No Prueba JI Cuadrado para
Independientes Comparación de proporciones
No Prueba Q de Cochran
comparación de tratamientos
42
Continua
Coeficiente de correlación lineal de Pearson
Escala de
Medición
para Ordinal y/ó númerica
ambas Coeficiente de correlación por rangos de Spearman
variables
Prueba JI Cuadrado (Coeficiente ǿ)

Riesgo relativo (Estudios de cohorte)
Odds ratio (Estudios de casos-control)
Nominal Coeficiente de concordancia Kappa
Cada variable (Comparación de métodos)
Tiene dos
Categorías
(tabla de 2x2)
Prueba de JI Cuadrado para independencia
de variables (Coeficiente de contingencia)
43
Los valores críticos de los errores en los estudios
del área biomédica:
Alfa () menor al 5%
Beta () menor al 20%
La confianza en 95% o más
La Potencia (1-β) 80% o más.
El tamaño de la muestra influye.

2.5% 2.5%
No No
esperada esperada
Población Esperada
R. Rechazo Ho Región de no rechazo R. Rechazo Ho

 La confianza es de 95%, el error alfa se fija a lo
mas en 5%.
 De modo similar se fija la potencia del estudio
en 80%, por tal el error beta es a lo mas 20%.

La probabilidad de rechazar la hipótesis nula
cuando en realidad es verdadera y es la “p”,
por lo es un riesgo que asume el investigador
de equivocarse al rechazar la hipótesis nula,
cuando en realidad es cierta. Este riesgo se
establece normalmente en 0.05 ó 0.01
“Aceptar algo que es falso” Por lo tanto “p” no es un indicador de fuerza
de la asociación ni de su importancia, sino
una probabilidad.
El error de tipo II consiste en aceptar la

hipótesis nula cuando es falsa y esto se
conoce como el error de tipo II o Beta (β ).
“Rechazar algo que en realidad es verdadero”

tuberculosis miliar no difiere de la población
general.
tuberculosis miliar difiere de la población
general.
Error α: Probabilidad de decir que el Sodio sérico

es diferente en los pacientes con TBC miliar
cuando en realidad son iguales.
Error β: Probabilidad de decir que el Sodio sérico
es igual en los pacientes con TBC miliar cuando
en realidad son diferentes.
1-β = Potencia
“Aceptar (hipótesis alterna)
algo que en realidad es
verdadero”
 Probabilidad de aceptar la hipótesis alterna

cuando realmente sea verdadera.
 Probabilidad de rechazar la hipótesis nula
cuando realmente sea falsa.

1-α = Nivel de confianza
“Rechazar (hipótesis alterna)
algo que es falso”
 Probabilidad de rechazar la hipótesis alterna

cuando realmente sea falsa.
 Probabilidad de aceptar la hipótesis nula
cuando realmente sea verdadera.

 Partimos con un nivel de confianza de 0,95
para la variable principal, es decir α = 0,05
Hipótesis: El nivel del sodio sérico en
pacientes con tuberculosis miliar difiere de la
población general.
 Análisis de subgrupos: Sexo, edad, nivel de
instrucción.
Hipótesis: El nivel del sodio sérico en
pacientes con tuberculosis miliar difiere de la
población general según sexo, edad.
0,95 x 0,95= 0,9025; α = 0,0975
Tolerancia de error ≠ Error tipo I

 Disponer de una teoría que guíe la investigación,
evitando el "salir de pesca" con el ordenador buscando
asociaciones entre variables.
 Disminuir el número de test estadísticos llevados a
cabo en el estudio.
 Depurar la base de datos para evitar errores de valores
extremos que puedan producir hallazgos significativos.
 Utilizar valores de “p” más reducidos (0.01 ó 0.001).
 Reproducir el estudio. Si al reproducir el estudio se
obtienen resultados similares, estaremos más seguros
de no estar cometiendo el error de tipo I.

 Incrementar el tamaño de la muestra.
 Estimar el poder estadístico del estudio.
 Incrementar el valor de “p”.
 Utilizar test paramétricos (más potentes) en
lugar de test no paramétricos.

Una vez descartado lo
imposible, lo que queda, por
improbable que parezca, debe
ser la verdad.
Sir Arthur Conan Doyle (1859-1930)
 El término "estadísticamente significativo"
invade la literatura médica y se percibe como
una etiqueta que indicase "garantía de calidad".
 Los test de hipótesis son test de significación

estadística.

 La significancia estadística viene dada por el
nivel de Significancia que nos trazamos
inicialmente.
- Un nivel de significancia del 95% lleva
implícito una p < de 0,05
- Y nivel de significancia del 99% lleva implícita
una p < 0,01.
En conclusión: cuanto más estadísticamente

significativo sea, es menos probable de cometer
el error tipo I.
Al el error tipo I el error tipo II
 Disponemos de 2 tratamientos (A y B). El
tratamiento A lo reciben 25 pacientes y el
tratamiento B otros 25 pacientes. 15 pacientes
responden favorablemente al tratamiento A y
20 al tratamiento B. ¿Existe diferencia
significativa entre ambos tratamientos?
Ho (hipótesis nula) = No hay diferencia entre

ambos tratamientos.
Ha (hipótesis alternativa) = Sí existe diferencia
entre ambos tratamientos.
Nivel de significancia: 95%

p : 0,20
Si ahora la muestra es de 900 pacientes por grupo, se tiene que:

p : 0,043
Por lo tanto los valores de la "p“ deben ser considerados solo como una guía
y no como base de conclusiones definitivas e irrevocables.

 Poder estadístico o potencia estadística.
 Es el complemento del error tipo II (1-β).
 Es la probabilidad de rechazar la hipótesis nula
cuando es realmente falsa o Probabilidad de
aceptar la hipótesis alterna cuando realmente
es verdadera.
 Representa la capacidad de un test para
detectar como estadísticamente significativas
diferencias o asociaciones de una magnitud
determinada.

 El tamaño del efecto a detectar:
> tamaño del efecto relevancia clínica.
> probabilidad hallazgos significativos
> poder estadístico.
 Variabilidad:
A mayor variabilidad
< probabilidad obtener diferencias
< poder estadístico.

 El tamaño de la muestra:
> muestra
> potencia estadística.
 El nivel de significación estadística.

valor α poder estadístico
Es decir, si disminuimos la probabilidad de cometer un error
de tipo I aumentamos simultáneamente la probabilidad de un
error de tipo II (por lo tanto disminuye la potencia), por lo
que se trata de encontrar un punto de “equilibrio” entre
ambas.
 Generalmente, se suele trabajar con un poder en torno al 80%

o al 90%.
 Para EVALUAR las hipótesis establecidas se
debe realizar un estudio.
 Se toma una muestra de 35 pacientes con
tuberculosis miliar y se realizará el dosaje de
Na+ sérico.
 Entonces se comparará una muestra contra una
población con parámetros conocidos.

x 
z 

n
 Con los valores obtenidos, se calcula el
estadístico de prueba
 Se trata de evaluar cuanto se asemejan los
datos a lo que teóricamente sería la distribución
si la hipótesis nula es verdadera

Si se tomó una muestra de 35 individuos
Se sabe que en la población el sodio tiene
una tipo Normal con  = 140 meq/l, y  =
2.5 meq/l.
¿Qué prueba estadística se usaría?

x  El promedio de Sodio
z 
 sérico en la muestra es
138 meq/l
n
138 - 140
Z = ---------------
2.5/ √35 El valor de la prueba
para este ejercicio es
Z = - 4,76 Z = -4,76
 El valor p , es la probabilidad de que por azar
obtengamos un resultado como el tenemos en
frente o mas extremo, asumiendo que no hay
diferencia entre la población y la muestra
estudiada.

La probabilidad de
obtener -4 ,7 o aun
menos por Azar
:0.0001
-4

P

Se rechaza H0: =140
Y se acepta H1:  140


P
X  138

 Luego de obtener los resultados se pudo
calcular el valor “p,” que es la probabilidad de
un resultado tanto o mas extremo que el que
hemos encontrado a base de nuestros datos.
 Usualmente si cae en la región de rechazo (o p
es menor que ) se rechaza H0

 Se tomo una muestra de 35 individuos con
tuberculosis miliar
 El promedio de Sodio de la muestra resultó en
138 meq/l
 ¿ 138 es diferente al de la población ?
Tenemos que establecer un criterio para

decidir si 138 es un valor esperado de la
población general o no.
¿ Cuales son los valores esperados ?

 Ocurrió que el valor de Z es -4,7
Lo que corresponde a un valor de p = 0,0001
 Dado que ese valor es menor que el valor alfa
prefijado.
 Se rechaza la hipótesis nula.
ACEPTAMOS LA HÍPOTESIS ALTERNA


Pruebadehipotesis 120121203526 Phpapp02

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Pruebadehipotesis 120121203526 Phpapp02

Cargado por

Copyright:

Formatos disponibles

Prueba de Hipótesis

Dr. Cristian Díaz Vélez

 Se puede inferir a cerca de :

Cristian Díaz Vélez 3

Estimación por intervalos : Consta de dos valores

Cristian Díaz Vélez 5

Cristian Díaz Vélez 6

Cristian Díaz Vélez 7

X - (Z(σ /√n) X X + (Z(σ /√n)

Cristian Díaz Vélez 8

Cristian Díaz Vélez 10

Cristian Díaz Vélez 12

Cristian Díaz Vélez 13

Cristian Díaz Vélez 14

Cristian Díaz Vélez 16

Cristian Díaz Vélez 17

Cristian Díaz Vélez 18

La Eficacia y seguridad del Tramadol subcutáneo es mayor al

La Eficacia y seguridad del Tramadol subcutáneo son diferentes

Nivel de significancia: 95%

Conclusión: Se rechaza la hipótesis nula, por lo tanto se acepta la hipótesis alterna

Cristian Díaz Vélez 21

Cristian Díaz Vélez 23

Cristian Díaz Vélez 24

Cristian Díaz Vélez 25

Cristian Díaz Vélez 26

Cristian Díaz Vélez 27

Ninguna V. ind. Una V. ind. Más de una V. ind.

V. Dep. V. Dep. V. Dep. V. Dep. V. Dep. V. Dep. V. Dep. V. Dep. V. Dep.

Media Varianza, DS Coef. Variación

Cristian Díaz Vélez 30

Cristian Díaz Vélez 31

Desenlace Desenlace Aprox. Normal

Cristian Díaz Vélez 32

Regresión lineal Análisis Correlación

Cristian Díaz Vélez 33

Var. Indep. Var. Indep

Mediana Coef. Correlación

Cristian Díaz Vélez 34

Var. Indep. Var. Indep.

Datos Datos Chi2 para

P. McNemar Dif. Medias

Cristian Díaz Vélez 35

Var. Indep. Var. Indep. Var. Indep

Var. Indep Var. Indep Var. Indep Var. Indep

ANOVA ANOVA Análisis Análisis Análisis Análisis

Prueba F Prueba F Prueba F Prueba F Prueba F Prueba F

Cristian Díaz Vélez 37

Var. Indep. Var. Indep

Análisis de Análisis Regresión Regresión Análisis

Log-rank Mantel-Haenszel Razón de Razón de Razón de

Si Prueba Z para la media

Si Prueba T para la media de

Si Prueba JI Cuadrado (reunir categorías)

Prueba JI Cuadrado (Coeficiente ǿ)

Cristian Díaz Vélez 45

R. Rechazo Ho Región de no rechazo R. Rechazo Ho

Cristian Díaz Vélez 47

El error de tipo II consiste en aceptar la

“Rechazar algo que en realidad es verdadero”

Cristian Díaz Vélez 48

Error α: Probabilidad de decir que el Sodio sérico

 Probabilidad de aceptar la hipótesis alterna