Está en la página 1de 46

ESTADISTICA INFERENCIAL:

PRUEBA DE HIPOTESIS
(CONTRASTE DE HIPOTESIS)
ahuacoto@minsa.gob.pe

Bioestadistica 8

Hiptesis: definicin
Son

suposiciones que
relacionan una variable con
otra y que sern probadas a
travs de la investigacin,
con el fin de ser aceptadas o
rechazadas por medio de los
resultados obtenidos.

Son

ante todo, enunciados


que expresan afirmaciones o
negaciones sobre la realidad.
A

(Variable
independiente)

B
(Variable
dependiente)

Qu es la prueba de
hipotesis?
Es un procedimiento
estadstico,
(matemtico),
una
herramienta
de
anlisis de datos que
permite ACEPTAR o
RECHAZAR
la
Hiptesis
estadstica
(NULA).
Mide la significancia
estadstica, es decir,
mide la probabilidad

Pasos de una prueba de


hiptesis
1.
2.

3.
4.

5.

Establecer la hiptesis nula y la alternativa


Elegir el error estadstico tolerable: nivel de
significacin o el grado de error esperado: nivel
crtico para alfa (generalmente es 5% o 0.05)
Elegir un estadstico de contraste (Prueba
estadstica o de significancia)
Procesamiento de datos del experimento para
calcular el estadstico de la muestra aleatoria
(obtener valor p).
Comparar el valor p con el valor alfa para
concluir si la Hipotesis nula se rechaza o no
(Criterio de rechazo).
P>

NO ACEPTA

PE

Hiptesis Nula

Hiptesis
cientfica

No
Rechazar la Ho

Rechazar la Ho
ACEPTA

Contraste de hiptesis
Hiptesis Alterna

Hiptesis
Alterna

P<

Establecer las Hiptesis


estadsticas
TIPOS DE HIPOTESIS ESTADISTICA
1

En el proceso de la estadstica inferencial, hay dos tipos de hiptesis claves:


LA HIPOTESIS NULA (Ho), se construye artificialmente para que el investigador

evale su hiptesis de investigacin. Plantea que no existe relacin entre los dos
fenmenos comparados. ES LA QUE SE DEBE CONTRASTAR.
LA

HIPOTESIS ALTERNA (H1), es la hiptesis complementaria que


simplemente seala la existencia de un hecho o de un evento (representa a la
hiptesis de investigacin o experimental), o la relacin entre dos o ms
fenmenos. ES COMPLEMENTARIA A LA ANTERIOR.

EJEMPLO:
Hiptesis cientfica: El nivel de colesterol en sangre de los hombres difiere del de
las mujeres
Hiptesis estadstica (NULA): el promedio de la variable Nivel de colesterol En
sangre de la poblacin de Hombres es igual al promedio de esa misma Distribucin
en la poblacin de mujeres.

Ho:

hombres

Hiptesis Experimental:
El frmaco A (variable independiente) provoca una reduccin importante de la
PA (variable dependiente).
Grupo experimental

RESULTADOS

X PA
(ge)

Frmaco
A

comparar

Grupo control
Placebo
B

X PA
(ge)

X PA
(gc)

X PA
(gc)

HIPOTESIS ALTERNA
(Hiptesis experimental)

X PA
(ge)

X PA
(gc)

HIPOTESIS NULA

Elegir el error estadstico aceptable (error


tipo I )

Es la probabilidad de error al comparar dos o ms


muestras o grupos cuando aseguramos que ambos son
diferentes, siendo en realidad iguales.

< 0.05 significa que tenemos un 5% de probabilidades


de error en las conclusiones, por lo cual la probabilidad
de equivocarnos es baja.
Ho es verdadera ( A = B)
El tto no es mas efcicaz que el
control

/2
regin rechazo

Regin de
No rechazo
(correcto)
1-

/2
regin rechazo

SUPUESTO ESTADISTICO:
De 100 experimentos realizados, habr una cantidad de aciertos y una cantidad de errores.

RESULTADOS o AFIRMACIONES = ACIERTOS +


ERRORES
P (acierto) + P (error) = 100%

Probabilidad
de error

confianza

error

95%

5%

90%

10%

99%

1%

Probabilidad de
acierto
(95%)

Probabilidad
de error

Posibilidades de error y acierto


al contrastar la hiptesis nula
Realidad de la H0

Conclusi
n del
contraste
de la
hiptesis
(Estadsti
ca
Analtica)

No
rechazo
H0

p>

Rechazo
H0
(aceptacin de la

p H1)
<

Verdadera

Falsa

Correcto

Error de
tipo II

(grado de
confianza

El tratamiento s
tiene efecto pero
no lo percibimos.

1- )

Error de
tipo I
(GRAVE)
El tratamiento no
tiene efecto pero
se decide que s.

Probabilidad

Correcto
(Poder de la
Prueba
1- )

DECISION DEL
JURADO

RESULTADO
DE LA PRUEBA
TAMIZAJE

REALIDAD
(golden test)

ENFERMO

SANOS

PRUEBA +

VP

FP (error)

PRUEBA -

FN (error
grave)

VN

CULPABLE

INOCENTE

CULPABLE

JUSTICIA

Injusticia
(error
grave)

INOCENTE

Injusticia
(error)

JUSTICIA

ERROR DE TIPO I

Es rechazar una hiptesis nula siendo verdadera


(GRAVE).
ERROR TIPO
I

RECHAZAR

Ho

CHE VERE

SIENDO Ho,

VERDADERA

A la probabilidad de cometer un error de Tipo I se denota por alfa (


), y se le llama el nivel o tamao de significancia de la prueba es
decir

= P(error Tipo I)= P (rechazar H


Es claro que se puede reducir de dos maneras:
verdadera)
-- Aumentando
Aumentando la
la regin
regin de
de aceptacin
aceptacin (grficamente)
(grficamente)
-- Aumentando
Aumentando el
el tamao
tamao de
de la
la muestra
muestra

H0 es

Nivel

de confianza (1

Representa el complemento del error tipo


I, es decir la probabilidad de no rechazar la
hiptesis nula siendo sta verdadera
(acierto).
Se representa con (1 -). Los niveles ms
utilizados
son 0,90 0,95 y 0,99.
Mnemotecnia: invertir la primera parte del CHE VERE:
INVERSA

CHE VERE

No Rechazar Ho
Siendo Ho,
VERDADERA

EN TODA INVESTIGACION, NINGUNA CONCLUSION A LA QUE SE LLEGUE


FINALMENTE SER TOTALMENTE ABSOLUTA, SIEMPRE TENDRA UNA
PROBABILIDAD DE ERROR Y UNA PROBABILIDAD DE ACIERTO.

ERROR DE TIPO II -

Error tipo Beta: o tipo II, es aceptar una hiptesis nula siendo
falsa
Nemotecnia: es la inversa al error tipo I o alfa:
inverso

NO RECHAZAR Ho

ANTI : CHE VERE


inverso
SIENDO Ho,
FALSA
Para evaluar un experimento de prueba de hiptesis tambin se
requiere calcular la probabilidad del error de Tipo II, denotada por
, es decir
= P(error Tipo II) = P(aceptar H0 | H0 es falsa)
Se observa la existencia de una relacin inversa entre la magnitud de los
errores y : conforme aumenta, disminuye.

Poder de la Prueba (Potencia del test)

(1-)
La meta de todo investigador en el proceso de contraste de
hipotesis es: rechazar la hiptesis nula, por ello es
importante que la prueba tenga dicho poder.
El poder de la prueba se debe entender como la capacidad que
tiene la prueba estadstica de RECHAZAR LA HIPOTESIS
NULA SIENDO ESTA FALSA.
Mnemotecnia: invertir la segunda parte del CHEVERE:
Rechazar Ho

CHE VERE
INVERSA

Siendo Ho, FALSA

Elegir el estadstico de contraste (Prueba


estadstica)

Para cada tipo de diseo se debe elegir una Prueba de contraste


particular:

PRUEBAS PARAMETRICAS

PRUEBAS NO PARAMETRICAS

T de student independiente
T de student apareada
ANOVA
Correlacin de pearson

Chi cuadrado
Wilcoxon
U de Mann Whitney
Mc Nemar
Kruskall wallis
Correlacin de pearson

Procesar los datos con la Prueba estadstica


elegida: obtener el valor P

Valores P
el P valor o nivel de significacin emprico del contraste (a
posteriori) es el dato obtenido a partir del valor del estadstico
del contraste (Prueba estadstica o de significancia) , en las
observaciones que corresponden a la realizacin de la muestra
de tamao n extrada de la poblacin X.
Prueba estadstica
elegida
Datos
(variables
) de la
muestra

Valor p


Criterio de rechazo de Ho: Comparar
py

Si el valor p es ms chico que el nivel de significacin


alfa, la hiptesis nula es rechazada.

si p<, H0 se rechaza
Si el valor de p es mayor que alfa, la hiptesis nula no es
rechazada.

Interpretacin del Criterio de rechazo de


la Ho

p<

RECHAZO LA
Ho
ACEPTO LA H1.

Se acepta que la diferencia


entre los tratamientos no se
debe al azar, pero, con un % de
confianza o % de error (alfa).
La diferencia aceptada, es
significativa o
estadsticamente significativa,
porque la probabilidad de
equivocarnos es bastante baja
(pej. < del 5%).

RESUMEN
Resultados
del contraste
de Hiptesis

p<
Proceso :
Contraste
de
hiptesis

p>

Toma de
decisiones
(conclusin del
estudio)

Rechazar
Ho

No
Rechazar
Ho

RECHAZAR = NO
ACEPTAR

Aceptar
H1

No
Aceptar
H1

Condicin

Probabilidad
de Acertar
Probabilidad
de
Equivocarse
Probabilidad
de Acertar
Probabilidad
de
Equivocarse

% confianza
% error

% confianza
% error

NO RECHAZAR =
ACEPTAR

PRUEBAS DE SIGNIFICACION
ESTADISTICA

Definicin
Son

frmulas
estadsticas
(matemticas) que permiten saber si
hay diferencias significativas (no por
azar) entre dos resultados.
Permiten al
investigador
determinar si hay
una diferencia
significativa entre
las medias
muestrales

Como seleccionar la prueba estadstica adecuada?


Criterios de seleccin

Tipo de variables

Cuantitativa
Cualitativa

Tipos de preguntas de investigacin

Asociacin (correlacin)
Comparacin (Factor de riesgo).

Cuntos grupos se estn comparando.

Estructura de datos

Independientes
Dependientes (Pareados)

TIPO DE VARIABLE

La

eleccin del Mtodo Analtico o Prueba


Estadistica, esta determinada
principalmente por el tipo de variable con el
que se vaya a trabajar.
Test Paramtricos (porque se

Variable cuantitativa

conocen los parmetros estadsticos de


la poblacin y muestra).
excepto

Variable cualitativa

Cuando te indican que:


La distribucin de la muestra no es
NORMAL
La muestra es muy pequea
Escojas una Prueba No paramtrica

Test No Paramtrico

Tipos de Pruebas estadsticas


En la estadstica inferencial el investigador se encuentra
con dos tipos de tcnicas:

Paramtricas

Son las ms potentes y por consiguiente las inferencias que se realizan


son ms fiables.
El inconveniente es que el investigador no siempre puede cumplir con
los requisitos y supuestos que exige el enfoque paramtrico, sobre
todo en investigaciones educativas y sociales.

No paramtricas
Son fciles de utilizar y no son tan potentes como las paramtricas.
El anlisis de datos cualitativos ha generado tcnicas propias, que
actualmente constituyen toda una metodologa especfica que viene
marcada por la propia idiosincrasia cualitativa y que toma
determinadas opciones en relacin a las unidades del registro de los
datos y la forma de tratarlos.

PRUEBAS PARAMETRICAS
Requisitos:
- Variables son cuantitativas (Escalas de intervalo
y proporciones).
- Variables tienen un comportamiento NORMAL.
- Seleccin de participantes o formacin de grupos
puede ser dependientes o independientes.
- Varianzas de grupos son similares.
1.
2.
3.

Test de la t de
Student.
t de Student
apareada.
ANOVA

Qu es la prueba t
(t de student) ?

Definicin:

Es una prueba estadstica


para evaluar si dos grupos
difieren entre s de manera
significativa respecto a su
medias.
Se simboliza por t
Hiptesis a probar:
De diferencia entre dos
grupos. La hiptesis de
investigacin propone que los
grupos difieren
significativamente entre s y la

William Sealey
Gosset
(Student)

Caractersticas de las
pruebas t

Prueba t no pareada o independiente: prueba si las medias


estimadas de la poblacin por 2 muestras independientes
difieren significativamente (grupo de hombres y grupo de
mujeres)

Prueba t pareada: prueba si la media estimada de la poblacin


por muestras dependientes difieren significativamente (media de
pre y post-tratamiento para el mismo grupo de pacientes.

Existen dos versiones de la prueba t Student: una que supone


que las varianzas poblacionales son iguales y otra versin que
no asume esto ltimo.

PRUEBA F Snedecor: Se aplica cuando existen varianzas


diferentes para ambos grupos de comparacin.

La igualdad de varianzas se conoce como homocedasticidad y


la no igualdad de varianzas como heterocedasticidad.

Concepto de grupos
dependientes o pareados

Diseos
Analticos

Casos

Control

Cohorte
expuesta

Cohorte
no
expuest
a

Intervencin

Diseo Cuasi
experimenta
l

Antes

Despus

Experime
ntal

Tratamiento A

Control

Tratamiento B

Ensayo
cruzado

Qu es el anlisis de varianza
unidireccional ? ANOVA
(oneway)
Definicin
Es una prueba estadstica para analizar si ms
de dos grupos (3 o mas), difieren
significativamente entre s en cuanto a sus
medias y varianzas.
La prueba t es utilizada para dos grupos y
el anlisis de varianza unidireccional (ANOVA)
se usa para tres o ms grupos
Hiptesis a probar:
De diferencia entre ms de dos grupos, se
propone
que
los
grupos
difieren
significativamente entre si y la nula propone
que no difieren

Concepto de Correlacin

Denota fuerza de relacin entre variables

Anlisis de Correlacin .- Es el conjunto de tcnicas


estadsticas empleadas para medir la intensidad de la
asociacin entre dos variables.
El principal objetivo del estudio del anlisis de
correlacin consiste en determinar que tan intensa es la
relacin entre dos variables. Normalmente, el primer paso es
mostrar los datos en un grfico de dispersin.

Qu es el Coeficiente de correlacin de
Pearson?

Definicin.- Es una prueba estadstica para analizar la relacin entre


dos o ms variables cuantitativas. Se simboliza por r y sus
valores son de -1 a +1
Mientras mas cerca a los extremos la relacin es mas fuerte (positiva
o negativa).

Si r > 0, la correlacin lineal es positiva (si sube el valor de una


variable sube la otra). La correlacin es ms fuerte cuanto ms se
aproxime a 1.
Por ejemplo: altura y peso: los alumnos ms altos suelen pesar ms.

Si r < 0, la correlacin lineal es negativa (si sube el valor de una


variable disminuye el de la otra). Esta correlacin es tanto ms fuerte
cuanto ms se aproxime a 1. Por ejemplo: peso y velocidad: los
alumnos ms gordos suelen correr menos.

Si r = 0, no existe correlacin lineal entre las variables. Aunque


podra existir otro tipo de correlacin (parablica, exponencial, etc.)

El Coeficiente de Determinacin (r2) es el cuadrado del


Coeficiente de correlacin e indica el porcentaje de variacin que
sufre una variable respecto a la otra.

PRUEBAS NO PARAMETRICAS
Requisitos:
- Variables son cualitativas (Escalas nominal y
ordinal) o cuantitativas con bajo tamao muestral
(n<30).
- No asumen nada respecto a la distribucin de las
variables.
Chi cuadrado
- Seleccin
de participantes independientes o
Test de Wilcoxon o del Rango con signo.
dependientes.
Test de la U de Mann-Whitney.
Test de Kruskal-Wallis.
Coeficiente de correlacin de spearman
Test de Mc Nemar
Test de Friedman.

Prueba chi cuadrado (chi o X o ji)


La prueba chi-cuadrado es una prueba no paramtrica que se
emplea para medir la asociacin entre dos o mas variables
cualitativas nominales cuando tenemos tablas de contingencia.
De manera general, el estadstico chi-cuadrado se obtiene as:

2
f e ft
2

ft
Donde fe representa las frecuencias empricas (observadas) y ft
representa las frecuencias tericas (esperadas).

F. Esperada=

Total de Fila x Total de Columna


Total General

Caractersticas de la ji cuadrado

Los datos debern estar en forma de frecuencias. En


general, cuando las frecuencias absolutas esperadas,
en la gran mayora de celdas son grandes (>5), se
utiliza el X2 para realizar el contraste mencionado.

La Prueba Chi cuadrado no establece causalidad, solo de


asociacin.

En Tablas de 2 x 2, cuando una de las celdas (20% de celdas)


tiene <5 de frecuencia observada o esperada se usa
correccin de Yates (Mayor de 30 variables) o Prueba
exacta de Fisher (Menor de 30 variables).

No tiene valores negativos. El valor mnimo es 0.

Todas las curvas son asimtricas

Test de la U de Mann-Whitney.
Es una prueba no paramtrica aplicada a dos
muestras independientes, cuyos datos han
sido medidos al menos en una escala de nivel
ordinal (mediana).
El test es virtualmente idntico a la realizacin
de una prueba paramtrica ordinaria T student
de dos muestras independientes en los datos
despus de haber ordenado las muestras
combinadas.
Estudiante Universitario
Independiente

Test de Wilcoxon o del Rango con signo.

La prueba de los signos de Wilcoxon es una


prueba no paramtrica para comparar la mediana
de dos muestras relacionadas o dependientes
(APAREADAS) y determinar si existen diferencias
entre ellas.
Se utiliza como alternativa a la prueba t de
Student apareada cuando no se puede suponer la
normalidad de dichas muestras.

Test de Kruskal-Wallis.
Es un mtodo no paramtrico para
probar si un grupo de datos proviene de
la misma poblacin. Intuitivamente, es
idntico al ANOVA con los datos
reemplazados por categoras. Es una
extensin de la prueba de la U de MannWhitney para 3 o ms grupos.
(independientes)

TEST DE McNEMAR
Prueba no paramtrica para dos variables
dicotmicas relacionadas.
Contrasta los cambios en las respuestas utilizando
la distribucin de chi-cuadrado.
Es til para detectar cambios en las respuestas
debidas a la intervencin experimental en los
diseos del tipo "antes-despus o para
comparar dos tipos de tratamiento.

Test de Friedman
Esta es una prueba no parametrica desarrollada
por el economista Milton Friedman.
Este test es utilizado para comparar varias
medianas (variable cualitativa ordinal), solo que
es utilizado cuando estas medianas son del
mismo grupo.
Es una versin no paramtrica del ANOVA para
grupos dependientes.

TEST DE KOLMOGOROV-SMIRNOV
Para

conocer si se puede suponer que los


datos siguen una distribucin normal, se
pueden realizar diversos contrastes llamados
de BONDAD DE AJUSTE.

El

Test de Kolmogorov-Smirnov es la prueba


estadstica mas utilizada para demostrar si
una coleccin de datos sigue una
distribucin NORMAL (una Curva de Gauss)

Otros

tests empleados para la prueba de


normalidad son debidos a Saphiro y Wilks
(< 30 elementos).

ESTADISTICO DE KAPPA

ndice de comparacin de la
concordancia entre dos (02)
observadores independientes sobre si el
resultado de una prueba diagnstica es
normal o anormal.
Se usa para medir la repetibilidad del test
diagnstico.

TABLAS RESUMEN DE PRUEBAS


ESTADISTICAS

FLUXOGRAMA PARA SELECCIONAR PRUEBA ESTADISTICA


Qu prueba estadstica
debo elegir?
Tipo de
variable?

CUANTITATIVA

CUALITATIVA

PRUEBAS PARAMETRICAS

PRUEBAS NO PARAMETRICAS

Qu
establece
entre variables?

Qu
establece
entre variables?
Comparacin estadstica
(Significacin estadstica
de las diferencias)

Relacin

Comparacin estadstica
(Significacin estadstica
de las diferencias)

Relacin

V. Ordinal

Cuntos
grupos?

V. Nominal

Cuntos
grupos?

>2
2

Cuntos
grupos?

>2

>2

V. Ordinal
Dependientes

Correlacin
de Pearson

t student
apareada

Independientes

t de
student

Dependientes e
independientes

ANOVA

Depend.

Correlacin
de Spearman

Wilcoxon

Independ.

U de Mann
Whitney

Independ.

Kruskall
Wallis

Depend.

Friedman

Dependientes

Nc
Nemar

Q de
Cochrane

Independientes

Chi
cuadrado

EJERCICIOS
1. Con que Test se pueden comparar dos
proporciones?
2.

Cul de las siguientes pruebas


estadsticas puede utilizarse para
comparar las medias observadas en
dos muestras independientes?
3. Cul es la prueba de significacin
estadstica que permite analizar los
estudios de investigacin con datos
categorizables que comparan dos o
mas grupos independientes medidos
en escalas nominales?
4. El Test no paramtrico que permite
estudiar la relacin entre dos variables
cuantitativas es:

Chi cuadrado

T de student
independient
e

Chi cuadrado

Correlacin
de spearman

EJERCICIOS
5. En un ensayo clnico se comparan 03
tratamientos, la variable respuesta es
continua. Aceptando que la variable
tiene una distribucin normal, el test
correcto para comparar la respuesta es:
6. Se desea comparar la colesterolemia en
3 muestras de sujetos, cada una de
ellas representativas. Cul de las
siguientes ser la prueba apropiada?

ANOVA

ANOVA

7. Se determin la colesterolemia de de un
grupo de 30 pacientes antes de iniciar
un tto y 6 meses despus. Cul es la
prueba estadstica es la mas adecuada?

T de student
apareada

8.

Test de Mc
Nemar

La asociacin entre 02 variables


cualitativas apareadas se verifica con:

EJERCICIOS
9. La existencia de relacin entre dos
variables
cuantitativas
se
verifica
mediante el test de:
10. La comparacin entre dos medias
apareadas se estudia con:
11. Para comparar varias proporciones con
datos independientes se aplica el test
de:
12. Se compara la talla promedio entre 2
grupos de nios que recibieron distintos
patrones de alimentacin. Cada grupo
comprenda 25 nios. Seale la prueba
de significancia mas apropiada
13. Se desea comparar la intensidad de
dolor, medida en una escala ordinal,
entre 2 grupos de sujetos que han
recibido tto diferentes. La prueba

Correlacin de
pearson
T de student
apareada
Chi cuadrado

Prueba T de
student

Test de U de
Mann
Withney

GRACIAS

También podría gustarte