Pruebas de Hipotesis AEDC09

I-1
Curso

Anlisis Estadstico de Datos
Climticos

TEMA: Pruebas de Hiptesis
Mario Bidegain (FC) Alvaro Diaz (FI) Marcelo Barreiro (FC)

Universidad de la Repblica

Montevideo, Uruguay

2009
I-2
PRUEBAS DE HIPTESIS

Objetivo: Tratar de determinar cundo es razonable
concluir, a partir del anlisis de una muestra, que la
poblacin entera posee determinada propiedad y
cuando esto no es razonable.

I-3
TIPOS DE PRUEBAS
Establecen un valor un intervalo de valores para los
parmetros de una variable
Asociada a la construccin de Intervalos de confianza
Ejemplo: La media de una variable es 10

Establecen la igualdad de las distribuciones de dos mas
variables
Requiere un diseo experimental
Ejemplo: La media de dos poblaciones normales son
iguales con igual variancia

Determinan la forma de la distribucin de la variable
Pruebas especificas para establecer el tipo de distribucin
de una variable
Ejemplo: La distribucin de una variable es normal
I-4
PRUEBAS PARAMETRICA Y NO
PARAMETRICAS
Etapas Bsicas en Pruebas de Hiptesis.
Al realizar pruebas de hiptesis, se parte de un valor supuesto (hipottico) en parmetro poblacional. Despus de recolectar una muestra aleatoria, se compara la estadstica muestral, as como la media (x), con el parmetro hipottico, se compara con una supuesta media poblacional (). Despus se acepta o se rechaza el valor hipottico, segn proceda. Se rechaza el valor hipottico slo si el resultado muestral resulta muy poco probable cuando la hiptesis es cierta.
Etapa 1.- Planear la hiptesis nula y la hiptesis alternativa. La hiptesis nula (H0) es el valor hipottico del parmetro que se compra con el resultado muestral resulta muy poco probable cuando la hiptesis es cierta.
Etapa 2.- Especificar el nivel de significancia que se va a utilizar. El nivel de significancia del 5%, entonces se rechaza la hiptesis nula solamente si el resultado muestral es tan diferente del valor hipottico que una diferencia de esa magnitud o mayor, pudiera ocurrir aleatoria mente con una probabilidad de 1.05 o menos.
Etapa 3.- Elegir la estadstica de prueba. La estadstica de prueba puede ser la estadstica muestral (el estimador no segado del parmetro que se prueba) o una versin transformada de esa estadstica muestral. Por ejemplo, para probar el valor hipottico de una media poblacional, se toma la media de una muestra aleatoria de esa distribucin normal, entonces es comn que se transforme la media en un valor z el cual, a su vez, sirve como estadstica de prueba.
Consecuencias de las Decisiones en Pruebas de Hiptesis.

D
e
c
i
s
i
o
n
e
s

P
o
s
i
b
l
e
s
Situac
iones
Posibl
es

L
a

h
i
p
t
e
s
i
s

n
u
l
a

e
s

v
e
r
d
a
d
e
r
a
L
a

h
i
p
t
e
s
i
s

n
u
l
a

e
s

f
a
l
s
a
A
c
e
p
t
a
r

l
a

H
i
p
t
e
s
i
s

N
u
l
a
S
e

a
c
e
p
t
a

c
o
r
r
e
c
t
a
m
e
n
t
e
E
r
r
o
r

t
i
p
o

I
I

R
e
c
h
a
z
a
r

l
a

H
i
p
t
e
s
i
s

N
u
l
a
E
r
r
o
r

t
i
p
o

I
S
e

r
e
c
h
a
z
a

c
o
r
r
e
c
t
a
m
e
n
t
e

Se denominan pruebas paramtricas aquellas que presuponen una
dada distribucin de probabilidad para los datos.

Se denominan pruebas no paramtricas aquellas que no presuponen
una distribucin de probabilidad para los datos, por ello se conocen
tambin como de distribucin libre.

NOTA:

Cuando trabajamos con muestras pequeas (n < 20) en las que se desconoce si es vlido
suponer la normalidad de los datos, conviene utilizar pruebas no paramtricas, al menos para
corroborar los resultados obtenidos a partir de la utilizacin de la teora basada en la normal.
En estos casos se emplea como parmetro de centralizacin la mediana, que es aquel punto
para el que el valor de X est el 50% de las veces por debajo y el 50% por encima.

I-5
TIPOS DE ERROR
Rechazar una hiptesis no significa que sta sea falsa,
como tampoco el no rechazarla significa que sea verdadera.
La decisin tomada no esta libre de error.

Error I: Rechazar una hiptesis que es verdadera.
(Rechazamos una hiptesis cuando debiera ser aceptada).

Error II: No rechazar una hiptesis que es falsa
(Aceptamos una hiptesis que debiera ser rechazada).

I-6
ERRORES TIPO I Y II
Para que las reglas de decisin (o contraste de hiptesis) sean
buenas, deben disearse de modo que minimicen los errores de
la decisin; y no es una cuestin sencilla, porque para cualquier
tamao de la muestra, un intento de disminuir un tipo de error
suele ir acompaado de un crecimiento del otro tipo. En la
prctica, un tipo de error puede ser ms grave que el otro, y
debe alcanzarse un compromiso que disminuya el error ms
grave.

La nica forma de disminuir ambos a la vez es aumentar el
tamao de la muestra que no siempre es posible.
I-7
NIVEL DE SIGNIFICACION

o es la Probabilidad de cometer un Error tipo I.
Se llama Nivel de significacin

| es la probabilidad de cometer un Error tipo II

Es deseable que estas dos probabilidades de
error sean pequeas.

I-8
ERRORES TIPO I Y II
Y NIVEL DE SIGNIFICACION
I-9
NIVEL DE SIGNIFICACION Y
NIVEL DE CONFIANZA

En la prctica, es frecuente un nivel de significacin de 0,05
95% de NIVEL DE CONFIANZA

Si por ejemplo se escoge el nivel de significacin 0,05 ( 5%), entonces
hay unas cinco (05) oportunidades entre 100 de rechazar la hiptesis
cuando debiera haberse aceptado; Es decir, tenemos un 95% de
confianza de que hemos adoptado la decisin correcta. En tal caso
decimos que la hiptesis ha sido rechazada al nivel de significacin
0,05, lo cual quiere decir que tal hiptesis tiene una probabilidad 0,05
de ser falsa.

I-10
NIVELES DE SIGNIFICACION

Prueba de Uno y Dos Extremos.
Cuando estudiamos ambos valores estadsticos es decir, ambos lados de la media lo llamamos
prueba de uno y dos extremos o contraste de una y dos colas.
Con frecuencia no obstante, estaremos interesados tan slo en valores extremos a un lado de
la media (o sea, en uno de los extremos de la distribucin), tal como sucede cuando se
contrasta la hiptesis de que un proceso es mejor que otro, tales contrastes se llaman
unilaterales, o de un extremo. En tales situaciones, la regin crtica es una regin situada a un
lado de la distribucin, con rea igual al nivel de significacin.
I-11
PRUEBA DE HIPOTESIS
La prueba de hiptesis es un procedimiento
de toma de decisiones, relacionada
principalmente con la eleccin de una accin
entre dos conjuntos posibles de valores del
parmetro, es decir, en dos hiptesis
estadsticas, a las cuales llamaremos:

Hiptesis nula H
0

Hiptesis alternativa H
1

I-12
HIPOTESIS NULA y ALTERNATIVA
Hiptesis nula corresponde a la ausencia de
una modificacin en la variable investigada, y
por lo tanto se especifica de una forma exacta:
H
0
: u = u
0

Hiptesis alternativa se especifica de manera
ms general :

H
1
: u = u
0

H
1
: u > u
0

H
1
: u < u
0
.

I-13
CUADRO DE DECISIONES Y
TIPOS DE ERRORES
Estado de la Naturaleza
H
0
verdadera H
0
falsa
Acepto H
0

D
e
c
i
s
i
n

Rechazo H
0

Acierto
Acierto
Error Tipo II
Error Tipo I

Nivel de significacin
1 -
Nivel de confianza

1 -
Potencia de prueba
I-14
Al realizar pruebas de hiptesis, se parte de un valor supuesto (hipottico) de un parmetro
poblacional. Despus de recolectar una muestra aleatoria, se compara la estadstica muestral,
as como la media (x), con el parmetro hipottico, se compara con una supuesta media
poblacional. Despus se acepta o se rechaza el valor hipottico, segn proceda. Se rechaza el
valor hipottico slo si el resultado muestral resulta muy poco probable cuando la hiptesis es
cierta.

Etapa 1.- Planear la hiptesis nula y la hiptesis alternativa. La hiptesis nula (H
0
)
es el valor hipottico del parmetro que se compara con el resultado muestral
resulta muy poco probable cuando la hiptesis es cierta.

Etapa 2.- Especificar el Nivel de Significacin que se va a utilizar. El nivel de
significacin del 5%, entonces se rechaza la hiptesis nula solamente si el resultado
muestral es tan diferente del valor hipottico que una diferencia de esa magnitud o
mayor, pudiera ocurrir aleatoriamente con una probabilidad de 0.05 o menos.

Etapa 3.- Elegir la estadstica de prueba. La estadstica de prueba puede ser la
estadstica muestral (el estimador no sesgado del parmetro que se prueba) o una
versin transformada de esa estadstica muestral. Por ejemplo, para probar el valor
hipottico de una media poblacional, se toma la media de una muestra aleatoria de
esa distribucin normal, entonces es comn que se transforme la media en un valor
z el cual, a su vez, sirve como estadstica de prueba.
Etapas Bsicas en Pruebas de Hiptesis.
I-15
Etapas Bsicas en Pruebas de Hiptesis (Cont.)
Etapa 4.- Establecer el valor o valores crticos de la estadstica de prueba. Habiendo
especificado la hiptesis nula, el nivel de significacin y la estadstica de prueba que se
van a utilizar, se procede a establecer el o los valores crticos de la estadstica de
prueba. Puede haber uno o ms de esos valores, dependiendo de si se va a realizar una
prueba de uno o dos extremos.

Etapa 5.- Determinar el valor real de la estadstica de prueba. Por ejemplo, al probar
un valor hipottico de la media poblacional, se toma una muestra aleatoria y se
determina el valor de la media muestral. Si el valor crtico que se establece es un valor
de z, entonces se transforma la media muestral en un valor de z.

Etapa 6.- Tomar la decisin. Se compara el valor observado de la estadstica muestral
con el valor (o valores) crticos de la estadstica de prueba. Despus se acepta o se
rechaza la hiptesis nula. Si se rechaza sta, se acepta la alternativa.

La distribucin apropiada de la prueba estadstica se divide en dos regiones: una regin de
rechazo y una de no rechazo. Si la prueba estadstica cae en esta ltima regin no se puede
rechazar la hiptesis nula.
Al tomar la decisin con respecto a la hiptesis nula, se debe determinar el valor crtico en la
distribucin estadstica que divide la regin del rechazo (en la cual la hiptesis nula no se puede
rechazar) de la regin de rechazo. El valor crtico depende del tamao de la regin de rechazo.
I-16
POTENCIA DE UNA PRUEBA
El complemento (1-) de la probabilidad de cometer un Error del
tipo II se conoce como POTENCIA de una prueba estadstica.

La potencia de una prueba es una probabilidad de rechazar la
hiptesis nula cuando de hecho esta es falsa y debera ser rechazada.

NOTA:
Una manera en que podemos controlar la probabilidad de cometer un error del tipo II en un estudio,
consiste en aumentar el tamao de la muestra. Tamaos ms grandes de muestra, nos permitirn
detectar diferencias incluso muy pequeas entre las estadsticas de muestra y los parmetros de la
poblacin. Cuando se disminuye , aumentar de modo que una reduccin en el riesgo de cometer
un error de tipo I tendr como resultado un aumento en el riesgo de cometer un error tipo II.
representa la probabilidad de que la hiptesis nula no sea rechazada cuando de hecho es falsa.

La potencia de prueba 1- representa la sensibilidad de la prueba estadstica para detectar cambios
que se presentan al medir la probabilidad de rechazar la hiptesis nula cuando de hecho es falsa. La
potencia de prueba estadstica depende de qu tan diferente en realidad es la media verdadera de la
poblacin del valor supuesto.
Una prueba de un extremo es ms poderosa que una de dos extremos, y se debera utilizar siempre que
sea adecuado especificar la direccin de la hiptesis alternativa.

I-17
INTERVALOS DE CONFIANZA
En el contexto de estimar un parmetro poblacional, un intervalo de confianza es un rango de
valores (calculado en una muestra) en el cual se encuentra el verdadero valor del parmetro,
con una probabilidad determinada.
La probabilidad de que el verdadero valor del parmetro se encuentre en el intervalo construido
se denomina nivel de confianza, y se denota 1- . La probabilidad de equivocarnos se llama
nivel de significacin y se simboliza .. Generalmente se construyen intervalos con confianza
1- .= 95% (o significacin . = 5%).

Ejemplo:
Construir un intervalo de confianza, para la Distribucin Normal estndar que cumple:
P(-1.96 < z < 1.96) = 0.95

Luego, si una variable X tiene distribucin N( , ), entonces el 95% de las veces se cumple:

Despejando en la ecuacin se tiene:

El resultado es un intervalo que incluye al el 95% de las veces. Es decir, es un intervalo de
confianza al 95% para la media cuando la variable X es normal y es conocido
I-18
I-19
INTERVALOS DE CONFIANZA (Cont.)
Intervalo de confianza para un promedio

Generalmente, cuando se quiere construir un intervalo de confianza para la media poblacional , la varianza
poblacional es desconocida.

Si en el intervalo se reemplaza la desviacin estndar poblacional por la desviacin estndar muestral s, el
intervalo de confianza toma la forma:

La cual es una buena aproximacin para el intervalo de confianza de 95% para con desconocido. Esta
aproximacin es mejor en la medida que el tamao muestral sea grande.

NOTA: Cuando el tamao muestral es pequeo, el intervalo de confianza requiere utilizar la distribucin t de
Student (con n-1 grados de libertad, siendo n el tamao de la muestra), en vez de la distribucin normal (por
ejemplo, para un intervalo de 95% de confianza, los lmites del intervalo ya no sern construidos usando el
valor 1,96).

Ejemplo: Supongamos se plantea la hiptesis de que el promedio anual de horas de sol de 30 aos es igual a
la media climtica de 3250 horas. Al tomar una muestra se obtuvo:
= 2930
s= 450
n= 30
Al construir un intervalo de 95% de confianza para la media poblacional, las horas de sol varan entre 2769 y
3091 horas, con una confianza de 95%.. Como el intervalo no incluye el valor medio =3250 horas planteado
en la hiptesis, entonces esta es rechazada con confianza 95% (o un valor p menor a 0,5).
I-20
Comparacin de dos muestras
Prueba t de Student

La prueba t de Student como todos los estadsticos de contraste se basa en el clculo de estadsticos
descriptivos previos: el nmero de observaciones, la media y la desviacin tpica en cada grupo. A travs
de estos estadsticos previos se calcula el estadstico de contraste experimental. Con la ayuda de tablas se
obtiene a partir de dicho estadstico el p-valor. Si p<0,05 se concluye que hay diferencia entre los dos
muestras.

Las hiptesis o suposiciones para poder aplicar la t de Student son que en cada grupo la
variable estudiada siga una distribucin Normal y que la dispersin en ambos grupos sea
homognea (hiptesis de homocedasticidad = igualdad de varianzas).

Si no se verifica que se cumplen estas suposiciones los resultados de la prueba t de Student no tienen
ninguna validez. No es obligatorio que los tamaos de los grupos sean iguales, ni tampoco es necesario
conocer la dispersin de los dos grupos.

En el caso de que no se cumpla la suposicin de Normalidad se suele intentar alguna transformacin de los
datos que "normalice" los datos, siendo la transformacin logaritmo neperiano la ms usual. Ocurre en la
prctica que la transformacin que "normaliza" los datos tambin consigue igualdad de varianzas.

I-21
Prueba t de Student (comparacin de dos muestras)
Podemos aplicar la prueba t de Student para comparar de dos medias muestrales procedentes de la misma
poblacin, independientes y con igual desviacin tpica. De la diferencia de sus medias, que se espera sea
nula, se prueba su nivel de significacin.

Si n
1
y n
2
y X
1
y X
2
son los nmeros de elementos y medias muestrales se cumple que si escribimos las
desviaciones tpicas en funcin de cada muestra y consideramos sus grados de libertad tenemos:

Ejemplo
En un periodo de medidas de precipitacin de 11 aos tenemos estimada una media de M
2
= 480 mm y una
varianza
2
= 2500 mm A partir de ese periodo en los 7 aos siguientes se han medido: 640, 670, 600, 470,
400, 480 y 500 mm. La pregunta es Difieren significativamente estos ltimos aos del periodo anterior?
La media y la varianza de los ltimos 7 aos es M
1
= 550 mm y
2
= 6057 mm Por lo tanto el estadstico t
de Student

t = 550 480 / SQRT( (11 * 2500 + 7 * 6057)/16) * (11+7/77)) = 70/33.33 = 2.10

La tabla da para t = 2.10 y 16 grados de libertad un valor prximo a 0.025 que nos dice que es significativo a
un nivel de casi el 2.5% a cada lado de la curva de distribucin. Si se excluyen los valores de 640 y 670 mm
se tendra que el nuevo valor de t no es significativo y los datos pertenecen al mismo colectivo.
I-22
Tabla t de Student
I-23
PRUEBAS DE HIPOTESIS NO PARAMETRICAS
Se denominan pruebas no paramtricas aquellas que no presuponen una
distribucin de probabilidad para los datos, por ello se conocen tambin como de
distribucin libre (distribution free).

En la mayor parte de ellas los resultados estadsticos se derivan nicamente a partir
de procedimientos de ordenacin y recuento, por lo que su base lgica es de fcil
comprensin. Cuando trabajamos con muestras pequeas (n < 20) en las que se
desconoce si es vlido suponer la normalidad de los datos, conviene utilizar pruebas
no paramtricas, al menos para corroborar los resultados obtenidos a partir de la
utilizacin de la teora basada en la normal.

En estos casos se emplea como parmetro de centralizacin la mediana, que es
aquel punto para el que el valor de X est el 50% de las veces por debajo y el 50%
por encima.

I-24
Veremos cinco pruebas no paramtricas, que en buena medida son paralelas a las
versiones paramtricas (t Student, F, etc.):

Caso de una serie
Prueba del recorrido

Caso de dos grupos independientes
Prueba de Helmert

Caso de dos grupos independientes
Prueba de Mann-Whitney-----(paralela a la t de grupos independientes)

Caso de dos grupos relacionados
Prueba de Wilcoxon-----(paralela a la t de grupos relacionados)

Caso de "a" grupos independientes
Prueba de Kruskal-Wallis-----(paralela a la F unifactorial entre-sujetos)

PRUEBAS NO PARAMETRICAS
I-25
HOMOGENEIDAD DE SERIES
Causas habituales de la no homogeneidad de una serie:

Mal estado o defectos de los instrumentos meteorolgicos. Se produce en
forma progresiva y puede pasar desapercibido si las estaciones no son
inspeccionadas frecuentemente. En las estaciones automticas puede ser
abrupto o con deriva.
Cambio de observador meteorolgico, que se puede notar en las estimaciones
en que intervienen elementos subjetivos (ej: nubosidad) o en las lecturas del
termmetro. Se ha constatado que algunos observadores tienen tendencia
sistemtica a adoptar cifras pares o grados enteros. No se trata de errores
accidentales de lectura que no presentan carcter sistemtico.
Cambio del tipo de instrumental y/o de sus condiciones de instalacin (ej:
altura de los anemmetros sobre el suelo, ya que a mayor altura hay ms
intensidad de viento).
Cambio de los mtodos de depuracin de datos.
Modificaciones eventuales del ambiente: por transporte del instrumental de un
punto a otro o por cambios en un punto dado. Estos cambios pueden ser:
naturales (desarrollo de la vegetacin) o artificiales (ligados a las actividades
humanas).
Cambios climticos o microclimticos.
I-26
PRUEBA DE RECORRIDO DE UNA SERIE

Comprende las siguientes etapas:
Estimacin de la mediana de la serie.
Clculo de los desvos de cada elemento
respecto a la mediana. Se asigna a cada
valor de la serie el signo correspondiente,
(+) si est el valor de la serie por encima de
la media y (-) si est por debajo.
Clculo del nmero de cambios de signo
que presenta la serie, segn el Criterio de
Doorembos), si el nmero de cambios est
dentro del rango admitido, la serie analizada
es homognea, en caso contrario no es
homognea.
Criterio de Doorembos
N observ. Intervalo
12 5-8
14 5-10
16 6-11
18 7-12
20 8-13
22 9-14
24 9-16
26 10-17
28 11-18
30 12-19
32 13-20
34 14-21
36 15-22
38 16-23
40 16-25
50 22-30
60 26-36
70 31-41
80 35-47
90 40-52
100 45-57
I-27
CRITERIO DE HELMERT

La aplicacin del test de Helmert entre 2 series, comprende las siguientes etapas:
Debe verificarse la no existencia de tendencias en ambas series.
Se calculan las diferencias entre ambas series trmino a trmino, y se calcula la
diferencia promedio ( d ).
Se calculan las diferencias entre d
i
y d.
Se comparan 2 observaciones consecutivas (la ltima se compara con la
primera).
Se define como S cuando no existe cambio de signo entre un valor y el
siguiente, y con C cuando hay cambio de signo entre el valor y el siguiente.
Sea y
Segn el Criterio de Helmert si la serie es homognea se cumple

siendo N el nmero de observaciones.
S S
i
= C C
i
=
s s + N S C N 1 1
I-28
Prueba de Mann-Whitney
(comparacin de dos grupos independientes)

Este procedimiento es una buena alternativa cuando no se puede utilizar la prueba t de Student, en
razn de no cumplir con los requisitos que esta prueba exige.
La frmula es la siguiente:
U1 y U2 = valores estadsticos de U Mann-Whitney.
n1 = tamao de la muestra del grupo 1.
n2 = tamao de la muestra del grupo 2.
R1 = sumatoria de los rangos del grupo 1.
R2 = sumatoria de los rangos del grupo 2.
Pasos:
Determinar el tamao de las muestras (n1 y n2). Si n1 y n2 son menores que 20, se consideran
muestras pequeas, pero si son mayores que 20, se consideran muestras grandes.
Arreglar los datos en rangos del menor al mayor valor. En caso de que existan ligas o empates de
rangos iguales, se debern detectar para un ajuste posterior.
Calcular los valores de U1 y U2, de modo que se elija el ms pequeo para comparar con los
crticos de U Mann-Whitney de la tabla de probabilidades asociadas con valores pequeos como
los de U en la prueba de Mann-Whitney. En caso de muestras grandes, calcular el valor Z, pues
en estas condiciones se distribuye normalmente. Decidir si se acepta o rechaza la hiptesis.

Muestras pequeas (n1 y n2 s 20)

U = R
i1
Muestras grandes
zemp =
U
n
1
(N+1)
2
n
1
n
2
(N+1)
12

I-29

Ejemplo para muestras pequeas:

Un experimentador utiliza dos mtodos para ensear a leer a un grupo de 10 nios de 6 aos, quienes
ingresan por primera vez a la escuela. El experimentador quiere demostrar que el procedimiento ideado por l
es ms efectivo que el tradicional; para ello, mide el desempeo en la lectura en funcin de la fluidez,
comprensin, anlisis y sntesis.El plan experimental preliminar consiste en elegir al azar tanto una muestra
de 10 nios como el mtodo por utilizar.

Eleccin de la prueba estadstica.
El modelo experimental tiene dos muestras independientes. Las mediciones revelan que no se satisfacen los
requisitos para utilizar una media aritmtica, en razn de que uno de los valores en cada muestra se aleja
demasiado de las dems; por lo tanto, no corresponde a una escala de intervalo, de manera que se decide usar
una escala ordinal.

Planteamiento de la hiptesis.
Hiptesis nula (Ho). Las diferencias observadas entre las calificaciones de ejecucin de lectura mediante los
dos mtodos se deben al azar.
Hiptesis alterna (Ha). Las calificaciones de ejecucin de lectura, segn el mtodo de enseanza del
experimentador son ms altas y diferentes que las observadas en el mtodo tradicional.

Nivel de significacin.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza Ho.
Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.
I-30

Aplicacin de la prueba estadstica.
De acuerdo con los paso, las observaciones se deben ordenar en rangos del menor al mayor.
Calculamos la U.
De los dos valores de U calculados, se elige el ms pequeo (4) y se comparan con los valores crticos de U
Mann-Whitney.
En caso de que el valor de U calculado no se localice en las tablas correspondientes, se transformar en la
frmula siguiente:
U = n
1
n
2
- U'
En esta frmula, U' corresponde al valor ms alto.
Decisin.
A la probabilidad del valor U de Mann-Whitney, calculado anteriormente, corresponde 0.048, el cual es ms
pequeo que el nivel de significacin; por lo tanto, se acepta Ha y se rechaza Ho.
I-31
Prueba de Wilcoxon
(comparacin de dos grupos relacionados)
Si tenemos parejas de valores, por ejemplo antes y despus de un cambio, que podemos denominar
(X1,Y1), (X2,Y2), ... ,(Xn,Yn). De la misma forma, ahora calcularemos las diferencias X1-Y1, X2-Y2,
... , Xn-Yn y las ordenaremos en valor absoluto, asignndoles el rango correspondiente. Calculamos
R+ la suma de rangos positivos (cuando Xi es mayor que Yi), y la suma de rangos negativos R-. Ahora
la hiptesis nula es que esas diferencias proceden de una distribucin simtrica en torno a cero y si
fuera cierta los valores de R+ y R- debern ser parecidos.
Pasos:
1. Restar las puntuaciones (elemento a elemento) entre grupos 1 y 2, y
dejarlas en valor absoluto.
2. En valores ordinales, hacer una columna con los rangos para G2>G1 y
otra para G1>G2
Muestras pequeas
S
+
= R
i
+
Muestras grandes
zemp =
S
+
n(n+1)
4
n(n +1) (2 n+1)
24

Es la suma de rangos de la columna "G2>G1"
Hay tablas para este caso de
muestras pequeas; en todo
caso, si la muestra es
relativamente grande, se puede
efectuar la aproximacin a la
distribucin normal
La hiptesis nula es que no haya diferencias entre los dos grupos
I-32
Prueba de Wilcoxon
Ejemplo para muestras pequeas utilizando la prueba de dos colas:

Un investigador desea comparar el grado de hiperactividad en sujetos obesos cuando estn en un programa
para bajar de peso (dieta) y sin programa para bajar de peso.

Eleccin de la prueba estadstica.
Se tienen dos muestras dependientes y, por el tipo de medicin, es posible listarlas en una escala ordinal.
Planteamiento de la hiptesis.
Hiptesis alterna (Ha). Existe diferencia significativa entre el grado de hiperactividad en obesos cuando estn
en un programa de dieta y sin el programa de dieta.
Hiptesis nula (Ho). No existe diferencia significativa entre el grado de hiperactividad en obesos cuando
estn en un programa de dieta y sin el programa de dieta, esto es debido al azar.
Nivel de significacin.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza Ho.
Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.
Aplicacin de la prueba estadstica.
Con base a los pasos, se obtienen las diferencias observadas en los incrementos de hiperactividad en obesos,
estando en un programa de dieta o no. Estos valores podrn tener signos positivos y negativos, los cuales
quedaran abolidos al ordenarse los rangos y stos los adoptan.
I-33
Prueba de Wilcoxon
El valor T de la prueba de Wilcoxon obtenido se compara con los valores crticos de la tabla T en pruebas de
rangos sealados de pares iguales de Wilcoxon, y se puede apreciar que para ser significativo (es decir, por
debajo de 0.05, que fue el nivel de significacin), requiere que este 0.05 sea menor; por lo tanto, la
probabilidad es mayor que 0.05.
tc = 15.5
tt = 8
Para dos colas = a = 0.05
N= 10
se cumple que rechazamos Ho
Decisin.
En virtud de que la probabilidad es mayor que 0.05, se acepta Ho y se rechaza Ha.
I nterpretacin.
Las diferencias en el incremento o disminucin de la hiperactividad en personas obesas con dieta o sin dieta,
no son significativas. Estadsticamente resultan iguales, en razn de que pueden ser diferencias dadas al azar.
I-34
Prueba de Kruskal-Wallis
(comparacin de "a" grupos independientes)

La prueba de Kruskal-Wallis, es una alternativa a la prueba F del anlisis de varianza
para diseos de clasificacin simple. En este caso se comparan varios grupos pero
usando la mediana de cada uno de ellos, en lugar de las medias

Pasos:
1. pasar las puntuaciones a rangos (conjuntamente en los "a" grupos)
2. computar la suma de los rangos en cada grupo (son las R
j
)
H =
12
N(N + 1)
R
j
2
n
j
\
|
|
.
3 (N + 1)
Si la Hiptesis nula es cierta (es decir, que no haya diferencias entre los grupos),
H se distribuye segn Chi-cuadrado con a-1 grados de libertad
Estadstico de contraste
Observa que se puede aplicar esta prueba cuando no se cumplan los supuestos de
homogeneidad de varianzas ni el de normalidad del ANOVA unifactorial entre sujetos.
I-35
La prueba de Kruskal-Wallis para
comparar ms de dos grupos
Si hay empates en los datos entonces, se aplica la siguiente modificacin a H

Se puede mostrar que si los tamaos de cada grupo son mayores que 5
entonces, H se distribuye como una Ji-Cuadrado con, k-1 grados de libertad.
Luego, la hiptesis nula se rechaza si

n n
t t
H
H
g
i
i i
=
3
1
3
1
'
2
1 , 1 o
_

>
k
H
I-36
Tabla I. Tipo de test estadstico para hacer inferencias (comparaciones entre muestras).
DISTRIBUCION VARIABLE
INDEPENDIENTE
(PREDICTORA)
VARIABLE
DEPENDIENTE
(RESULTADO)
RELACIN ENTRE LAS
MUESTRAS
PRUEBA ESTADSTICA
Normal
(Paramtricos)
Una sola muestra (se
compara con
valor terico)
Dicotmica
Policotmica
Cuantitativa
Categrica
Cuantitativa
Categrica
Cuantitativa

No relacionadas
Relacionadas
No relacionadas
Relacionadas
No relacionadas
No relacionadas
Relacionadas
t-student para una muestra
No existe (usar Chi-cuadrado de Pearson)
No existe (usar no paramtricos)
t-student muestras independientes
t-student muestras relacionadas
No existe (usar Chi-cuadrado de Pearson)
ANOVA de una va
ANOVA de medidas repetidas
No normal
(No paramtricos)
Una sola muestra (se
compara con
valor terico)
Dicotmica
Policotmica
Categrica
Cuantitativa
Categrica
Cuantitativa
Relacionadas
No relacionadas
Relacionadas
No relacionadas
No relacionadas
Relacionadas
No relacionadas
Binomial
Chi-cuadrado de Pearson
Chi-cuadrado de Mantel-Haenzsel
Prueba de Kolmogorow-Smirnov
Prueba de las Rachas
Test exacto de McNemar
Prueba de los Signos
Chi-cuadrado de Pearson
Test exacto de Fisher
Test de Wilcoxon
Prueba de los signos
Mann-Whitney
Mediana
Z Kolmogorov-Smirnov
Rachas de Wald-Wolfowitz
Valores extremos de Moses
Prueba Q de Cochran
Prueba de Friedman
W de Kendall (concordancia)
Prueba de Kruskal-Wallis
Mediana K variables
ANOVA de dos vas por rangos
COVARIACION (medidas de dos variables en los mismos sujetos o unidades de anlisis del estudio)
Paramtrico Cuantitativa Cuantitativa Correlacin de Pearson
No paramtrico Cuantitativa Cuantitativa Correlacin de Spearman

Pruebas de Hipotesis AEDC09

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Pruebas de Hipotesis AEDC09

Cargado por

Copyright:

Formatos disponibles

I-1

También podría gustarte