Está en la página 1de 23

i

UNIVERSIDAD NACIONAL DE LOJA


ÁREA AGROPECUARIA Y DE LOS RECURSOS NATURALES
RENOVABLES

Edison Ramiro Vásquez


PROFESOR

Loja- Ecuador
2 009
ii
iii

TABLA DE CONTENIDOS
Página

3. CAPÍTULO III. PRUEBAS DE HIPÓTESIS ................................................................ 1


3.1. INTRODUCCIÓN ............................................................................................. ..... 1
3.2. PRUEBA DE HIPÓTESIS ACERCA DE LA MEDIA ( µ ) .................................... 1

3.3. PRUEBA DE HIPÓTESIS ACERCA DE LA VARIANZA σ 2 .............................. 8


3.4. PRUEBA DE HIPÓTESIS ACERCA DE LA COMPARACIÓN DE DOS
VARIANZAS POBLACIONALES ........................................................................ 10
3.5. PRUEBA DE HIPÓTESIS ACERCA DE LA COMPARACIÓN DE DOS
MEDIAS POBLACIONALES ............................................................................... 13
3.6. PRUEBA DE HIPÓTESIS O BASES PARA LA COMPARACIÓN DE
MAS DE DOS MEDIAS POBLACIONALES ....................................................... 17
1

3. Capítulo III. PRUEBAS DE HIPÓTESIS

3.1. INTRODUCCIÓN

Durante el proceso de análisis e inferencia estadística se presentan dos tipos


de problemas: La estimación de parámetros y las pruebas de hipótesis. En un sentido
estadístico, el concepto de hipótesis es una suposición acerca del o los parámetros de una
distribución y que mediante una prueba estadística se puede establecer una regla que
permita tomar la decisión de rechazar o no el planteamiento propuesto.

Al realizar una prueba de hipótesis, es necesario tener en cuenta la posibilidad de


cometer ya sea un error tipo I (α) o un error tipo II (β). El error tipo I, se comete al
rechazar una hipótesis verdadera, la probabilidad de cometer este error es fijada por el
investigador y su magnitud constituye lo que se conoce como nivel de significación de la
prueba. El error tipo II se comete al aceptar una hipótesis falsa. De esta forma, al tomar
una decisión sobre una hipótesis planteada, el investigador sabe que se pueden presentar
las siguientes situaciones:

Decisión tomada
Carácter de la hipótesis Aceptación Rechazo
La hipótesis es falsa Error tipo II Correcta
La hipótesis es verdadera Correcta Error tipo I

Entonces, siempre que se tome una decisión acerca de una hipótesis, es necesario
minimizar la posibilidad de cometer error tipo II, ya que como se mencionó, la
probabilidad de cometer error tipo I, es fijada por el investigador.

3.2. PRUEBA DE HIPÓTESIS ACERCA DE LA MEDIA (µ)


Una de las situaciones más comunes es la de plantear una hipótesis acerca del
valor de la media de una población (µ). Si el valor planteado como hipótesis es (µo), la
relación existente entre el parámetro de interés, en este caso la media poblacional y el
valor propuesto como hipótesis, se puede indicar bajo las siguientes alternativas:

µ < µo
µ = µo
µ > µo

Estas tres posibilidades deben ser consideradas al momento de construir la hipótesis


planteada y su alternativa correspondiente. De esta forma, al considerar la igualdad entre
el parámetro y el valor propuesto, se pueden presentar estas tres situaciones alternativas.

1. Ho: µ = µo
Ha: µ ≠ µo

2. Ho: µ ≤ µo
Ha: µ > µo

3. Ho: µ ≥ µo
Ha: µ < µo
2

En el primer caso se tiene lo que se conoce como hipótesis bilateral o de dos colas,
puesto que la hipótesis alterna puede estar a cualquiera de los dos lados del valor
promedio; mientras que en los casos 2 y 3, se tienen hipótesis de una cola o unilaterales.
Ahora bien, para decidir si se rechaza o no la hipótesis planteada, se tendrá que
determinar un evento que sirva como criterio para tomar una decisión. La
determinación de este evento se basa en los mismos principios que los utilizados para la
construcción de los límites de confianza; es decir, por el teorema del límite central se
sabe que:
⎛ σ2 ⎞
x ~ N ⎜⎜ µ , ⎟⎟
⎝ N ⎠
Donde x es el promedio de una muestra para una variable X cualquiera.
⎛ σ2 ⎞
Pero si µ = µo; entonces: x ~ N ⎜⎜ µ O , ⎟⎟
⎝ N ⎠
y por lo tanto, la población hipotética la suponemos normalmente distribuida con una
media igual a µo y varianza σ2. Entonces, utilizando las propiedades de la distribución
normal se establece el evento que servirá como criterio para tomar una decisión.

Ejemplo, si se usa como variable de prueba x , y si la hipótesis planteada es:

Ho: µ = µo
Ha: µ ≠ µo
entonces, el evento que se utilizará como criterio para no rechazar la Ho será:

x1 < x < x2

en donde, si se supone varianza conocida, (σ para muestras grandes), los promedios


x1 y x 2 , se calculan utilizando un valor tabular de z, de la siguiente manera:

σ σ
x1 = µ o − Z α / 2 y x 2 = µo + Zα / 2
n n

y en el caso de que la varianza no es conocida (muestras pequeñas), los valores de la


variable de prueba son:
s s
x1 = µ o − tα / 2 y x 2 = µ o + tα / 2
n n

Como el criterio para tomar una decisión está basado en las siguientes
consideraciones:
( <
Pr x 1 x < x2 = 1−α , ) si Ho es cierta (Pr = probabilidad)

Pr (x < x 1 o x > x2 = α ,) si Ho es cierta

Se dice que se ha considerando como criterio para tomar una decisión un evento
que tiene una alta probabilidad de ocurrencia, cuando la Ho es cierta.
3

En el caso de pruebas de hipótesis unilaterales se aplica un razonamiento similar


para establecer los eventos que sirvan como criterios para tomar decisiones. Por ejemplo
se puede examinar la siguiente situación:

Ho: µ ≥ µo
Ha: µ < µo
El evento cuya ocurrencia sirve para tomar la decisión de no rechazar la Ho será:
x > x1
σ
en donde si la varianza es conocida: x1 = µ o − Z α
n

s
pero si la varianza no es conocida: x 1 = µ o − tα
n

El evento planteado, tal como en el caso anterior se justifica en el hecho de que es


un evento con alta probabilidad de ocurrencia cuando Ho es cierta, es decir:

( )
Pr x > x 1 = 1 − α , si Ho es cierta

Analizando la otra alternativa de la hipótesis unilateral, es decir:

Ho: µ ≤ µo
Ha: µ > µo

el evento cuya ocurrencia servirá para no rechazar la Ho será: x < x1

σ
en donde si la varianza es conocida: x1 = µ o + Z α
n
s
y si la varianza no es conocida: x1 = µ o + tα
n

El evento planteado, tal como en el caso anterior se justifica en el hecho de que es


un evento con alta probabilidad de ocurrencia cuando Ho es cierta, es decir:

( )
Pr x < x 1 = 1 − α , si Ho es cierta

Volviendo al caso de la alternativa bilateral, en que Ho: µ = µo, con la que se ha


establecido el evento:

x1 < x < x2

y cuya ocurrencia determinará que se tome la decisión de no rechazar la Ho. Consideremos


el caso de que la Ho no es cierta y pongámonos que µ = µ1, entonces:

(
Pr x 1 )
< x < x 2 = β , si µ = µ1

Un ejemplo ayudará a aclarar los conceptos hasta ahora presentados.


4

Ejemplo 3.1. Se desea probar que el rendimiento promedio de raíces por planta del
cultivar ECU-512 de zanahoria blanca es igual o menor a 1,015 kg. Se decide
utilizar un nivel de significación del 5% y una muestra al azar de 36 plantas.
De pruebas agronómicas anteriores con este cultivo, se conoce que la
varianza σ2 = 0,0625. Entonces, se tiene la siguiente situación:

Hipótesis planteada: Ho : µ ≤ 1,015


Hipótesis alterna: Ha : µ > 1,015
Varianza: σ2 = 0,0625 σ = 0,25
Nivel de significación: α = 0,05 (de la tabla Z0,05 = 1,645)

Suposiciones:
a) Se trata de una población normal de plantas de zanahoria blanca.
b) Se ha realizado un muestreo al azar
c) La varianza es conocida

Se establece el evento que sirve para tomar la decisión de aceptación (o rechazo)


de la Ho

x < x1

En donde:
σ
x1 = µ o + Z α
n 1,015 1,084
0,25
x1 = 1,015 + 1,645 = 1,084
36

entonces sí el rendimiento promedio por planta en la muestra al azar de 36 plantas es


menor que 1,084 kg, se tomará la decisión de no rechazar la hipótesis Ho, en caso contrario
se rechazará la Ho. La justificación para haber escogido este evento como criterio está en
que:

( )
Pr x < 1,084 = 0,95 , si µ es 1,015

Por otro lado, como ya hemos visto, si el promedio poblacional es un valor distinto,
se tiene que la probabilidad esperada no es igual 1— α, sino es igual a β (error tipo II),
porque se estaría aceptando una hipótesis falsa como verdadera, así:

(
Pr x < 1,084 = β , ) si µ = µ1
5

Para determinar la probabilidad de cometer error tipo II o sea la magnitud de β


para diferentes valores de µ1, se procederá de la siguiente manera:

1. Si: µ1 = 1,018

1,084 − 1,018
z= = 1,57 0,9418
0,25
36
1,084
Luego: Pr ( z < 1,57) = 0,9418 1,018

2. Si: µ1 = 1,025
1,084 − 1,025
z= = 1,41 0,9207
0,25
36
1,084
Luego: Pr ( z < 1,41) = 0,9207 1,025

3. Si: µ1 = 1,035
1,084 − 1,035
z= = 1,17 0,8790
0,25
36
1,084
1,035
Luego: Pr ( z < 1,17) = 0,8790

4. Si: µ1 = 1,050
1,084 − 1,050
z= = 0,81 0,7910
0,25
36
1,050 1,084
Luego: Pr ( z < 0,81) = 0,7910

5. Si: µ1 = 1,1
1,084 − 1,1
z= = −0,38
0,25
0,3520
36
1,1 1,084
Luego: Pr ( z < - 0,38) = 0,3520
6

Ahora, si se considera como grado de falsedad la distancia entre el valor hipotético


planteado y el valor "real" del parámetro, es decir:

Grado de falsedad = µo - µ1 (µo = 1,015)

Se puede observar que la magnitud del error tipo II, (β), es inversamente
proporcional al grado de falsedad, mientras que la potencia de prueba (1- β), es
directamente proporcional, lo que se puede apreciar en el Cuadro 3.1, Para una media µo =
1,015 y n = 36.

Cuadro 3.1. Relaciones entre la magnitud del error tipo II, con el grado de falsedad de la hipótesis
y la potencia de prueba.
µ1 |µo - µ1| β 1-β
1,018 0,003 0,9418 0,0582
1,025 0,010 0,9207 0,0793
1,035 0,020 0,8790 0,1210
1,050 0,035 0,7910 0,2090
1,100 0,085 0,3520 0,6480
1,150 0,135 0,0582 0,9418
1,200 0,185 0,0029 0,9971

Entonces, si por ejemplo conociendo la magnitud de β, cuando µ1 es 1,050, ésta nos


parece demasiado grande, es posible disminuirla determinando el tamaño de muestra
necesario para ello. Por ejemplo, si se desea tener una magnitud de β = 0,10, en lugar de
0,7910, cuando µo = 1,050, pero manteniendo el nivel de significación de 0,05, ¿Cual debe
ser el tamaño de la muestra a utilizar? El problema se puede graficar de la siguiente
manera (ver Figura 3.1).

+ 1,645

- 1,280

Fig. 3.1 Representación de dos poblaciones normales para ilustrar el cálculo del error tipo II
(Tomado de Fegan, García y Angeles, 1981)

Del gráfico se puede apreciar que:


0,25
x 1 = 1,015 + 1,645 (de la tabla Z0,05 = 1,645)
n

0,25
x 1 = 1,015 − 1,280 (de la tabla Z0,10 = 1,280)
n
7

Igualando las dos expresiones y resolviendo, se tiene:

0,25 0,25
1,015 + 1,645 = 1,015 − 1,28
n n

0,25(1,645 + 1,280)
n= = 20,893
1,050 − 1,015

Entonces n es aproximadamente igual a 437

Esto significa que si se trabaja con una muestra de por lo menos 437 individuos,
existe la posibilidad de que el error tipo II (β), no sea mayor de 0,10 como fue el deseo
del investigador.

Ejemplo 3.2. Cual es el evento que nos sirve como criterio para tomar la decisión de no
rechazar la hipótesis de que la altura de planta promedio de la raza de
quinua "Pichincha" es igual o menor a 1,2 m, con un nivel de significación del
5%?Considere n = 20 y s2 = 0,12.
Entonces, se tiene la siguiente situación:

Hipótesis planteada: Ho : µ ≤ 1,20


Hipótesis alterna: Ha : µ > 1,20
Nivel de significación: α = 0,05
Suposiciones:
a) Población normal de plantas de quinua
b) Se ha realizado un muestreo al azar
c) Se asume que la varianza es desconocida

( )
Luego, se establece el evento x 1 , que sirve para tomar la decisión de aceptación o
rechazo de la hipótesis planteada, Ho, en este caso es:

x < x1
s
En donde: x1 = x + tα
n
α = 0,05
tα(gl) = t0,05(19) = 1,7291

0,12 µ = 1,20 1,33


x1 = 1,20 + 1,7291 = 1,33
20

()
Se establece como conclusión que si el promedio de la muestra x , es menor que
el valor crítico (1,33), no existe evidencia suficiente para rechazar la Ho, en caso contrario
se rechaza.

Tarea para el alumno (1). Ejemplo 3.3. Si se desea probar la hipótesis de que el DAP
promedio de los árboles de un bosquete de canelo de 15 años de edad es de 40 cm.
¿Cuál es el evento que permite tomar una decisión si el nivel de significación es del
1%? Considere n = 15 y s2 = 4.
8

3.3. PRUEBA DE HIPÓTESIS ACERCA DE LA VARIANZA, σ2


Con el mismo razonamiento utilizado en los casos anteriores, se puede
establecer un evento que nos sirva como criterio para tomar una decisión sobre la hipótesis
planteada acerca del valor de la varianza poblacional (σ2). Las hipótesis a plantear podrán
ser bilateral (de dos colas) o unilateral (de una cola), presentándose las siguientes tres
situaciones y sus alternativas:

1. Ho : σ2 = σ o2
Ha : σ2 ≠ σ o2

2. Ho : σ2 ≥ σ o2
Ha : σ2 < σ o2

3. Ho : σ2 ≤ σ o2;
Ha : σ2 > σ o2

El evento que se utiliza como criterio para tomar una decisión acerca de la
hipótesis se determinará en base al conocimiento que tenemos de que:

(n − 1)s 2 ≈ χ 2
( n −1)
σ 2

Lo que significa que la proporción de varianza muestral sobre la varianza de la


población, se distribuye como ji cuadrado.

Luego si, σ2 = σ o2 , entonces:


(n − 1)s 2 ≈ χ 2
( n −1)
σo2

y por lo tanto la variable de prueba será: χ calc


2
=
(n − 1)s 2
σ o2

El evento que servirá como prueba para tomar una decisión en cada una de las
situaciones planteadas anteriormente será:

1. Ho : σ2 = σ o2
Ha : σ2 ≠ σ o2
No se rechaza la hipótesis planteada si se cumple el siguiente evento:

χ 2 α < χ calc
2
< χ α2
1−
2 2

en donde: χ2α y χ α2
1−
2 2
son los valores tabulares correspondientes a n-1 grados de libertad. La justificación para la
elección del evento está en que:
9

⎡ ⎤
Pr ⎢ χ 2 α < χ calc
2
< χ α2 ⎥ = 1 − α
⎣ 1− 2 2 ⎦

Esto, cuando la Ho sea cierta, es decir cuando σ2 = σ o2

2. Ho : σ2 ≥ σ o2;
Ha : σ2 < σ o2

No se rechaza la Ho si se cumple el siguiente evento: χ calc


2
> χ 12−α
En donde: χ 12−α es el valor tabular para n-1 grados de libertad.

La justificación para el evento elegido está en el hecho de que:

[
Pr χ calc
2
]
> χ 12−α = 1 − α , cuando σ2 = σ o2 es cierto (si esto no es cierto se comete
error de tipo II)

3. Ho : σ2 ≤ σ o2
Ha : σ2 > σ o2

No se rechaza la Ho si se cumple el siguiente evento: χ calc


2
< χ α2

En donde: χ α2 es el valor tabular para n-1 grados de libertad.

La justificación para el evento elegido está en el hecho de que:

[
Pr χ calc
2
]
< χ α2 = 1 − α , cuando σ2 = σ o2

Ejemplo 3. 4. Establezca el criterio necesario para tomar una decisión acerca de la


propuesta de que la varianza de la característica altura de mazorca en la
población de maíz Guandango es igual a 200 cm2. Considere un nivel de
significación de 10 % y un tamaño de muestra de 20.

Hipótesis planteada: Ho : σ2 = 200


Hipótesis alterna: Ha : σ2 ≠ 200
Nivel de significación: α = 0,10

No se rechaza la hipótesis planteada si:


χ 2 α < χ calc
2
< χ α2
1−
2 2

En donde: χ calc
2
=
(n − 1)s 2 =
19s 2
σ o2 200

De la tabla de Ji-Cuadrado
χ α2 = χ 02,10 = χ 02, 05(19 ) = 30,1435
( gl ) (19 )
2 2

χ 2
α = χ 2 0,10 = χ 02,95(19 ) = 10,1170
1− ( gl ) 1− (19 )
2 2
10

19 s 2
O sea que si: 10,1170 < < 30,1435 , no se rechaza la hipótesis planteada.
200
También el evento se podría plantear con relación al valor del estadístico s2, de la
siguiente manera:

(10,1170)(200) (30,1435)(200)
< s2 <
19 19

106.495 < s2 < 317.305

Conclusión: No se puede rechazar la hipótesis planteada si el valor de X2calc está


comprendido entre 10,117 y 30,144, o bien el estadístico s2 está
comprendido entre 106,495 y 317,305.

3.4. PRUEBA DE HIPÓTESIS ACERCA DE LA COMPARACIÓN DE


DOS VARIANZAS POBLACIONALES
En este caso, se trata de dos poblaciones cuyas varianzas se desean
comparar. Como en casos anteriores se usará una variable de prueba cuya distribución se
supone conocida y con base a este conocimiento se establece un evento que sirve como
criterio para tomar una decisión acerca de la hipótesis planteada. En cuanto a las
hipótesis a plantearse se pueden presentar las siguientes situaciones.

1. Ho : σ21 = σ22
Ha : σ21 ≠ σ22

2. Ho : σ21 ≥ σ22
Ha : σ21 < σ22

3. Ho : σ21 ≤ σ22
Ha : σ21 > σ22

En el primer caso, se tendrá una hipótesis bilateral, mientras que en los dos
restantes, las hipótesis planteadas son unilaterales.

Para el establecimiento del evento que servirá como criterio para tomar una
decisión se partirá del conocimiento siguiente:

Si w1 y w2 son dos variables distribuidas como X2 con m1 y m2 grados de libertad


respectivamente, la relación:
w1
m1
w2
m2

sigue una distribución de F, con m1 y m2 grados de libertad respectivamente.


11

(n 1 − 1)s 12 (n2 − 1)s 22


Si se considera que: w1 = y w2 =
σ 12 σ 22
s12
σ 12
entonces: 2
~ Fnn21−−11
s 2

σ 2
2

y si σ21 = σ22,

s12
entonces: 2
~ Fnn21−−11
s2
s12
luego la variable de prueba será:
s 22

Los eventos que servirán como criterio para tomar una decisión en cada una de las
situaciones planteadas será:

1. Ho : σ21 = σ22
Ha : σ21 ≠ σ22

s12
No se rechaza la Ho, si se cumple el siguiente evento: F α < < Fα
1−
2
s 22 2

En donde: F α y Fα , son los valores tabulares de la distribución de F para


1−
2 2
(n1 − 1) y (n2 − 1) grados de libertad.

Y la elección del evento se justifica en el hecho de que:

⎡ s12 ⎤
Pr ⎢ F α < < Fα ⎥ = 1 − α , si σ21 = σ22
⎣ 1− 2 s 22 2 ⎦

2. Ho : σ21 ≥ σ22
Ha : σ21 < σ22

s12
No se rechaza la Ho, si se cumple el siguiente evento: > F1−α
s 22

en donde: F1-α , es el valor tabular de la distribución de F para ( n1 − 1) y (n2 − 1) grados


de libertad.
La elección del evento se justifica en el hecho de que:

⎡s2 ⎤
Pr ⎢ 12 > F1−α ⎥ = 1 − α , si σ21 = σ22
⎣ s2 ⎦
12

3. Ho : σ21 ≤ σ22
Ha : σ21 > σ22
s12
No se rechaza la Ho, si se cumple el siguiente evento: < Fα
s 22
en donde: Fα , es el valor tabular de la distribución de F para n1 − 1) y (n2 − 1) grados de
libertad. La elección del evento se justifica en el hecho de que:

⎡s2 ⎤
Pr ⎢ 12 < Fα ⎥ = 1 − α , si σ21 = σ22
⎣ s2 ⎦

Ejemplo 3.5. Cual es el criterio a utilizar para comprobar que la variabilidad del
rendimiento de la población "Bahamas" de café, es igual a la variabilidad del
rendimiento de la población "Payamino mejorada", ambas sembradas bajo
sombra de Pachaco. Considere un nivel de significación del 2% y tamaños de
muestra de 15 y 12 plantas respectivamente.

Hipótesis planteada: Ho : σ21 = σ22


Hipótesis alterna: Ha : σ21 ≠ σ22
Nivel de significación: α = 0,02

s12
No se rechaza la Ho, si se cumple el siguiente evento: F1114 ( 0,99 ) < < F1114 ( 0, 01)
s 22
1
en donde (artificio): F1114 ( 0,99 ) = 11
F
14 ( 0 , 01)

de la Tabla de F:

F1114 ( 0, 01) = 4,29

F1411 ( 0, 01) = 3,86

1
Luego: F1114 ( 0,99 ) = =0,259
3,86

Conclusión: No se rechazará la hipótesis planteada si la relación entre las dos varianzas


muestrales está comprendida entre 0,259 y 4,29; en caso contrario se
rechazará.

Tarea para el estudiante (2).


Ejemplo 3.6. Si se desea probar que la altura de planta de retama es por lo menos dos
veces más variable que la altura de planta de quishuar, ambos arbustos
sembrados como complemento de barreras rompevientos en combinación
con aliso. Cuál es el criterio que debe establecerse para tomar una decisión
respecto a la hipótesis. Considérese un nivel de significación del 5% y
muestras de tamaño 15 y 17 plantas respectivamente.
13

3.5. PRUEBA DE HIPÓTESIS ACERCA DE LA COMPARACIÓN DE


DOS MEDIAS POBLACIONALES
Este es un caso similar al anterior, es decir en el que se dispone de dos
poblaciones, cuyos promedios se desean comparar. De igual forma, para este caso, se
pueden establecer los mismos tres tipos de hipótesis con sus alternativas respectivas y son
las siguientes:

1. Ho : µ1 = µ2 ; Ho : µ1 - µ2 = 0
Ha : µ1 ≠ µ2 ; Ha : µ1 - µ2 ≠ 0

2. Ho : µ1 ≥ µ2 ; Ho : µ1 - µ2 ≥ 0
Ha : µ1 < µ2 ; Ha : µ1 - µ2 < 0

3. Ho : µ1 ≤ µ1 ; Ho : µ1 - µ2 ≤ 0
Ha : µ1 > µ2 ; Ha : µ1 - µ2 > 0

El evento que se va a definir como criterio para tomar una decisión se sustenta en
el conocimiento de que:

(x 1 ) ⎛ σ σ ⎞
− x 2 ~ N ⎜⎜ µ1 − µ 2 , 1 + 2 ⎟⎟
⎝ n1 n 2 ⎠

luego, si la hipótesis platea que: µ1 = µ2, entonces: (x 1 ) ⎛ σ σ ⎞


− x 2 ~ N ⎜⎜ 0, 1 + 2 ⎟⎟
⎝ n1 n 2 ⎠

Importante: Para determinar los valores críticos de la variable de prueba se presentan los
siguientes casos:

1. Uso de muestras grandes, lo que hace suponer que la varianza es conocida y,

2. Uso de muestras pequeñas, lo que significa varianza desconocida.


En este último caso todavía se requiere conocer si:
¾ Se asumen varianzas homogéneas (σ21 = σ22), o
¾ Si se suponen varianzas heterogéneas (σ21 ≠ σ22), lo que se determina por medio
de una prueba de hipótesis de comparación de dos varianzas.

Tomando en cuenta las situaciones expuestas, el evento que servirá como criterio
para la toma de una decisión en cada una de las situaciones planteadas será:

1. Ho : µ1 - µ2 = 0
Ha : µ1 - µ2 ≠ 0
No se rechaza la hipótesis planteada si se tiene la ocurrencia del evento siguiente:

(x 1 − x2 )
1 < (x 1 − x2 ) < (x 1 − x2 )2

Evento que se justifica por el hecho de que

[(
Pr x 1 − x 2 )
1 < (x 1 − x2 ) < (x 1 − x2 ) ]= 1−α ,
2 cuando µ1 = µ2
14

Para el cálculo de los valores críticos se presentan las siguientes tres situaciones:

a. MUESTRAS GRANDES, lo que significa varianzas conocidas, por lo tanto los valores
críticos se calculan de la siguiente manera:

(x 1 − x2 )
1 = 0 − Zα
σ 12
n1
+
σ 22
n2
y (x 1 − x2 )
2 = 0 + Zα
σ 12
n1
+
σ 22
n2
2 2

b. MUESTRAS PEQUEÑAS, lo que significa varianzas desconocidas, pero suponemos


homogéneas. En este caso, los valores críticos se calculan de la siguiente manera:

(x 1 − x2 )
1
⎛1 1 ⎞
= 0 − t α s 2p ⎜⎜ + ⎟⎟ y (x 1 − x2 )
2
⎛1 1 ⎞
= 0 + t α s 2p ⎜⎜ + ⎟⎟
2 ⎝ n1 n2 ⎠ 2 ⎝ n1 n 2 ⎠

en donde:
tα/2 = valor tabular de la distribución de t de Student para [(n1 + n2) -2] grados de libertad

s 2
=
(n1 − 1)s12 + (n2 − 1)s 22
p
(n1 + n2 ) − 2
c. MUESTRAS PEQUEÑAS, lo que supone varianzas desconocidas, pero desiguales. En
este caso, los valores críticos se calculan de la siguiente manera:

(x 1 − x2 )
1 = 0 − t α'
s12 s 22
+
n1 n2
y (x 1 − x2 )2 = 0 + t α'
s12 s 22
+
n1 n2
2 2

⎛ s2 ⎞ ⎛ s2 ⎞
t1 ⎜⎜ 1 ⎟⎟ + t 2 ⎜⎜ 2 ⎟⎟
t α' = ⎝ 2⎠ ⎝ n2 ⎠
n1
en donde
s1 s 22
2
+
n1 n2

t1 y t2 = valor tabular de tα/2 para (n1 – 1) y (n2 – 1) grados de libertad, respectivamente

Del mismo modo, se aplican los eventos y se calculan los valores críticos para las otras dos
alternativas es decir para:

2. Ho : µ1 ≥ µ2 ; Ho : µ1 - µ2 ≥ 0
Ha : µ1 < µ2 ; Ha : µ1 - µ2 < 0

3. Ho : µ1 ≤ µ1 ; Ho : µ1 - µ2 ≤ 0
Ha : µ1 > µ2 ; Ha : µ1 - µ2 > 0
También se consideran si las varianzas son conocidas o desconocidas y en el último caso si
son homogéneas o heterogéneas. Además, puesto que en este caso se trabajaría con
hipótesis unilaterales, los valores tabulares para z y t deberían ser con probabilidad de α,
en lugar de α/2.
15

Ejemplo 3.7. Se aplicaron dos productos químicos (compensadores de frío), para


provocar dormancia en una variedad de durazno. Los productos fueron: A =
DINOC 3% y B = Tiourea 5%. La efectividad de la dormancia se evaluó en
producción de frutos, en gramos por rama primaria, a la primera cosecha
después de la aplicación de los químicos. Los resultados fueron los
siguientes:

A 375 441 0,0 350 450 140 335,12 (7 datos)


B 352,6 0,0 299,5 0,0 196.2 316.9 (6 datos)

Se desea probar si los dos productos químicos ejercieron igual acción sobre la
dormancia del duraznero. Usar un nivel de significancia de 10%. La resolución de este
problema se realiza en dos pasos diferentes:

1. Prueba de homogeneidad de varianzas. Esto debido a que estamos frente a


muestras pequeñas y por lo tanto las varianzas son desconocidas.

Ho : σ2A = σ2B
Ha : σ2A ≠ σ2B
α = 0,10
s12
No se rechaza la Ho si el evento siguiente tiene ocurrencia: F α < < Fα
1−
2
s 22 2

Donde:

Fα = F56 ( 0,05) = 4,95


2

1 1
F α = F56 ( 0,95) = 5
= = 0,23
1− F 4,387
2 6 ( 0 , 05 )

De los datos se obtiene que:


0,23 1,101 4,95

s2A = 27888,02 s2B = 25333,04

s 2A
= 1,101
s B2

Entonces se observa que: 0,23 < 1,101 < 4,95


Lo que lleva a la conclusión de que las varianzas son homogéneas. (de lo contrario se
utilizaría t’, caso c)
16

2. Prueba de hipótesis acerca de la comparación de dos medias poblacionales.

Ho : µA = µB
Ha : µA ≠ µB
α = 0,10

No se rechaza la Ho, si se tiene la ocurrencia del siguiente evento:

(x A − xB )1 < (x A − xB ) < (x A − xB )
2

Los valores críticos para este evento se calculan a continuación, usando valores tabulares
de t por ser varianzas desconocidas:

s 2p =
(n1 − 1)s12 + (n2 − 1)s 22 = (7 − 1)(27888,02) + (6 − 1)(25333,04 ) =26726,67
(n1 + n2 ) − 2 (7 + 6) − 2
De la tabla t: t α = t 0,10 = t 0,05 (11) = 1,7959 (Tabla: da valor de 1 cola. Para 2 colas α/2)
( gl ) (7 + 6 −2 )
2 2

(x A − xB )
1
⎛ 1
= 0 − t α s 2p ⎜⎜ +
1 ⎞ ⎛ 1 1⎞
⎟⎟ = 0 − 1,7959 26726,67⎜ + ⎟ = - 163.34
2 ⎝ n A nB ⎠ ⎝7 6⎠

(x A − xB )
2
⎛ 1
= 0 + t α s 2p ⎜⎜ +
1 ⎞ ⎛ 1 1⎞
⎟⎟ = 0 + 1,7959 26726,67⎜ + ⎟ = 163,34
2 ⎝ n A nB ⎠ ⎝7 6⎠

Por otro lado, la diferencia de medias es: x A − x B = 298,74 – 194,212 = 104,531

Entonces el evento plantead quedaría de la siguiente manera:

-163,34 < 104,531 < 163,34


Por lo tanto, la conclusión es que no hay evidencia para indicar que los productos
químicos aplicados al duraznero ejercen acción desigual sobre la dormancia.

Tarea para el estudiante (3).


Ejemplo 3.8. Un investigador en la Amazonía desea probar los efectos de la temperatura
en la conservación de frutos de borojó. La respuesta de este experimento es
el número de frutas que se pudren después de 30 días de almacenamiento.
Las temperaturas a probarse fueron: A = 5 ºC, B = 10 ºC. Para cada
temperatura (almacén) se dispuso de 5 y 6 lotes de 40 frutos
respectivamente. Los resultados en número de frutos podridos por lote
fueron como sigue:

A = 7, 6, 6, 5, 7
B = 10, 5, 2, 7, 8, 6

Usando un nivel de significación de 10%, probar la hipótesis de que la


temperatura en los cuartos fríos ejerció el mismo efecto sobre la
conservación de los frutos de borojó.
17

3.6. PRUEBAS DE HIPÓTESIS O BASES PARA LA COMPARACIÓN


DE MAS DE DOS MEDIAS POBLACIONALES

Anteriormente se ha desarrollado la metodología estadística para tomar una


decisión acerca de la igualdad de dos medias poblacionales. Ahora se propone la extensión
de este tipo de hipótesis y los fundamentos de la metodología estadística que permite
decidir acerca de rechazar o aceptar la hipótesis de que más de dos medias poblacionales
son iguales. La hipótesis a plantearse en este caso y su hipótesis alterna son:

Ho: µ1 = µ2 = ... = µk
Ha: al menos una µi es diferente

Es decir, se tienen un conjunto de k poblaciones, cuyas medias se está planteando


que son iguales. Las suposiciones que se van a considerar para el desarrollo de la
metodología que permita aceptar o rechazar la hipótesis planteada, son las siguientes:

1. Las k poblaciones son normales


2. Las muestras dentro de cada población son tomadas al azar
3. El modelo que expresa los efectos de los tratamientos es lineal y aditivo
4. Las varianzas de las poblaciones son homogéneas

Estas son exactamente las mismas suposiciones básicas de las que parte el análisis
de varianza bajo cualquier modelo o diseño experimental aplicado. Es decir, que bajo
estos supuestos se están comparando las medias de las k poblaciones normales de cada una
de las cuales, se va a extraer una muestra al azar de n observaciones, las cuales pueden
ser explicadas a través de un modelo lineal aditivo, por ejemplo el siguiente modelo:

Yij = µ + τi + eij 2200 = 2000 + 150 + 50


1850 = 2000 + 150 - 300

Donde:

i = 1, …, k
j = 1, …, n
µ = media general
τi = efecto del i-ésimo tratamiento
eij = efecto aleatorio del error

Este modelo es precisamente el modelo lineal aditivo del Diseño Completamente al


Azar (DCA). Es decir que la prueba de hipótesis de igualdad de medias de las k poblaciones
se podría resolver mediante la aplicación de un DCA y su análisis correspondiente. No
tienen caso entrar en los detalles de la demostración matemática y de la búsqueda de
eventos que permitan encontrar los valores críticos para aceptar o rechazar la hipótesis
planteada.

Todo el proceso a seguirse se resume en la mecánica de análisis de variancia para el


diseño citado. De hecho el DCA, es el diseño en el que las unidades experimentales son
asignadas completamente al azar a los tratamientos, (cuya igualdad de medias se quiere
probar), sin ninguna otra restricción, por lo que es considerado el diseño más eficiente
cuando las unidades experimentales son homogéneas. El modelo estadístico
correspondiente a este diseño es el mismo indicado arriba, por lo que se puede anotar que
18

este diseño es flexible en cuanto al número de medias cuya igualdad se quiere probar
(número de tratamientos), también es flexible en cuanto al número de observaciones por
tratamiento, teniendo como única limitante que mientras más grande es el número de
observaciones por tratamiento y más grande es el número de tratamientos, más difícil será
la obtención de material experimental (unidades experimentales) homogéneo.

El análisis de varianza consiste en desdoblar la variación total en sus componentes.


En este caso, el desdoblamiento consiste en dividir la variación en dos componentes: Uno
atribuible a la variación entre tratamientos y otro atribuible a la variación dentro de
tratamientos, así:

⎛ ⎞
∑ ∑⎜Y − Y⎟
2
(
= n ∑ yi − y )2 + ∑∑ (y − yi )
2

i j⎝ ⎠ ij
ij
i i j

Donde:
2
⎛ ⎞
∑ ∑⎜Y − Y⎟ Representa la variación total o suma de cuadrados total, con n(k-1) grados
i j ⎝ ij ⎠
de libertad

(
n ∑ yi − y )2 Representa la variación atribuible a tratamientos o suma de cuadrados de
i
tratamientos, con (k-1) grados de libertad

∑∑ (y )
2
ij − yi Representa la variación dentro de tratamientos, atribuible al error o suma
i j
de cuadrados del error experimental, con k(n-1) grados de libertad

Como se mencionó, a los resultados de este desdoblamiento de la variación en sus


componentes se denomina análisis de variancia y para facilidad se pueden representar en
una tabla, denominada tabla de análisis de variancia, de la siguiente manera:

Fuentes de Grados de Suma de Cuadrados


variación libertad cuadrados medios

Tratamientos k-1 n ∑ yi − y ( )2 (
n∑ yi − y )2
i i = S2M
k −1

∑∑ (y ) ∑∑ (y )
2
− yi
2
Error k(n-1) ij − yi ij

= S2e
i j i j

k (n − 1)
2
Total nk-1 ⎛ ⎞
∑ ∑⎜Y − Y⎟
i j⎝ ⎠
ij

Luego estas varianzas: (S2M), que se debe a tratamientos (poblaciones cuya igualdad
de medias se quiere probar) y (S2e), que se debe a la variación residual, conocida también
19

⎛ s2 ⎞
⎜ ⎟
como la varianza del experimento, se pueden relacionar ⎜ M ⎟ , y su resultado, comparar
2 ⎜ s ⎟
⎝ e ⎠
con los valores referenciales de F tabular, con (k-1) y k(n-1) grados de libertad y para las
probabilidades escogidas por el investigador. Es decir que la prueba de igualdad para
grupos de medias poblacionales, se convierte en una prueba de significación de la relación
de varianzas, cuya significación nos dirá que al menos una media es diferente de las
demás, aceptándose la hipótesis alternativa planteada inicialmente.

En resumen, las hipótesis y conclusiones se pueden platear y resolver de la


siguiente manera:

⎛ s2 ⎞ No se rechaza la Ho, los tratamientos


⎜ M ⎟ no difieren entre si, por lo tanto las
1. ⎜ 2 ⎟ < F0.05 medias de las poblaciones son iguales
⎜ s ⎟
⎝ e ⎠
⎛ s2 ⎞ Se rechaza la Ho, los tratamientos
⎜ ⎟ difieren significativamente entre si,
2. F0.05 < ⎜ M ⎟ < F0.01
⎜ s2 ⎟ por lo tanto las medias de las
⎝ e ⎠ poblaciones no son iguales.
⎛ s2 ⎞ Se rechaza la Ho, la diferencia entre los
⎜ M ⎟ tratamientos es altamente significativa
3. ⎜ 2 ⎟ > F0.01 entre si, por lo tanto las medias de las
⎜ s ⎟
⎝ e ⎠ poblaciones no son iguales

Hasta aquí, se ha llegado a aceptar o rechazar la hipótesis planteada. Nótese que


en el caso de que la Ho ha sido rechazada, todo lo que se ha podido concluir es que las
medias poblacionales difieren entre si, o lo que es mejor, que al menos una media es
diferente de las otras del grupo, pero nada se puede decir de cual o cuales medias son
superiores o son inferiores o si hay medias o grupos de medias que tienen igual
significación. Todos estos detalles últimos, se resuelven con los procedimientos conocidos
como pruebas de separación de medias. Para esto existen varias otras técnicas
estadísticas, las que serán abordadas más adelante.
20

BIBLIOGRAFIA

Texto Adaptado del documento del Dr. Carlos Nieto Cabrera. Docente de la Maestría
en Agroforestería del Trópico Húmedo de la Universidad Nacional de Loja. 2002.

También podría gustarte