Está en la página 1de 26

7.

- PRUEBA DE HIPOTESIS

7.1. INTRODUCCIÓN
La estadística inferencial es el proceso de usar la información de una
muestra para describir el estado de una población. Sin embargo es
frecuente que usemos la información de una muestra para probar un
reclamo o conjetura sobre la población. El reclamo o conjetura se refiere a
una hipótesis. El proceso que corrobora si la información de una muestra
sostiene o refuta el reclamo se llama prueba de hipótesis.

7.2. Errores tipo I y tipo II.

A base de la información de una muestra nosotros podemos cometer dos tipos de


errores en nuestra decisión.
1. Podemos rechazar un H0 que es cierto.
2. Podemos aceptar un H0 que es falso.
El primero se llama error Tipo 1
Error Tipo 1: Cuando rechazamos una Hipótesis Nula que es cierta cometemos
error tipo 1.

Y el segundo error se llama error Tipo 2.


Error Tipo 2:Cuando aceptamos una Hipótesis Nula que es falsa cometemos error
tipo 2.
Para ser muy cuidadosos en no cometer el error tipo 1, debemos especificar la
probabilidad de rechazar H0, denotada por α. A ésta se le llama nivel de significancia.

ivel de Significancia: La probabilidad (α) más alta de rechazar H0 cuando H0 es


cierto se llama nivel de significancia.
Comentario: Para mantener la probabilidad de cometer el error tipo 1 baja, debemos escoger un
valor pequeño de α.

Usando un valor preasignado de α se construye una región de rechazo o región


crítica en la curva normal estándar o en la curva t que indica si debemos rechazar
H0 .

Región Crítica o de Rechazo: Una región crítica o de rechazo es una parte de la


curva de z o de la curva t donde se rechaza H0.
La región puede ser de una cola o
7.3. Potencia de la prueba

Con dos muestras


Sin importar cómo se calcularon los grados de libertad, podemos ver en la
tabla 2 que la prueba de Hartley, en general, cuando Ho es verdadera no da
buenos resultados cuando los tamaños son muy grandes como 100–100, ya
que lo ideal en este caso es que H0 sea aceptada, por lo tanto el porcentaje
de veces que se rechaza la hipótesis nula, siendo ´esta verdadera, debe ser
bajo. Esta prueba, tomando los grados de libertad máx.(ni) − 1, que en
adelante llamaremos h.max, no es buena, al igual que la prueba de
Cochran, cuando los tamaños de las dos muestras son muy diferentes.

En las tablas 3 a 5, las varianzas de las dos muestras son diferentes; se


espera que las pruebas detecten esta diferencia, lo que se verá reflejado en
la potencia, la cual se espera que sea alta. h.max tiene valores grandes de
potencia cuando los tamaños de las muestras son muy diferentes y cuando
son muy grandes, pero ya vimos que también tiene estos valores en la tabla
2, por lo tanto esta prueba se afecta por los tamaños de las muestras, al
igual que la de Cochran.
Las pruebas de Layard, de Bartlett y de la teoría de la información tienen
tamaños cercanos al nivel nominal del 5% cuando la hipótesis nula es
cierta.
Cuando H0 es falsa, las potencias de estas pruebas fueron altas
comparadas con las otras pruebas competidoras, mejorando cuando los
tamaños de las muestras son más grandes. Las pruebas de Levene y de
Fligner tienen menor potencia que las demás pruebas, excepto cuando la
diferencia en las varianzas es grande y los tamaños de las muestras son
mayores que 50.
Con tres muestras
En la tabla 6 vemos que la prueba h.max tiene valores muy altos de nivel
de significancia cuando uno de los tamaños es 100, pero cuando los
tamaños son iguales tiene valores bajos.
En las tablas 7 a 11, donde las varianzas son diferentes, las pruebas de
Hartley tienen un buen desempeño cuando los tamaños son iguales y
menores que 100; notemos también que las pruebas de Layard son buenas
para detectar diferencias pequeñas en la varianza de las muestras, aunque
su potencia disminuye cuando los tamaños de las muestras son iguales. La
prueba de Cochran es muy buena para detectar si una varianza es diferente
de las otras, tablas 7 y 8, pero sólo cuando los tamaños de las muestras
son iguales. Las pruebas de Bartlett, de teoría de la información y de Layard
tienen valores de potencia altos, especialmente cuando los tamaños de
todas las muestras son mayores que 30.

Con cuatro muestras


En las tablas 12 a 17 observamos que todas las pruebas tienen buen
desempeño al aumentar el número de muestras. Se debe destacar el
desempeño de la prueba de Layard sin modificar. Las pruebas de Levene
tienen mejores resultados comparados con los resultados obtenidos con 2 y
3 muestras.
La prueba h.min no tiene buenos resultados; sus valores de potencia
siempre son bajos, cuando la diferencia en las varianzas es pequeña. En
general los resultados de las pruebas se afectan cuando el tamaño de las
muestras es muy diferente.
7.4. Formulación de la hipótesis estadística

En la prueba de hipótesis se pone a prueba un reclamo hecho sobra la


naturaleza de una población a base de la información de una muestra. El
reclamo se llama hipótesis estadística.

Hipótesis Estadística: Una hipótesis estadística es un reclamo hecho


sobre la naturaleza de una población.
Por ejemplo, la premisa formulada por un productor de baterías para autos
de que su batería dura en promedio 48 meses, es una hipótesis estadística
porque el manufacturero no inspecciona la vida de cada batería que él
produce.
Si surgieran quejas de parte de los clientes, entonces se pone a prueba el
reclamo del manufacturero. La hipótesis estadística sometida a prueba se
llama la hipótesis nula, y se denota como H0.
Hipótesis ula (H0): premisa, reclamo, o conjetura que se pronuncia sobre la
naturaleza de una o varias poblaciones.
Por ejemplo, para probar o desaprobar el reclamo pronunciado por el productor de
baterías debemos probar la hipótesis estadística de que µ ≥ 48. Por lo tanto, la
hipótesis nula es:
H0 : µ ≥ 48.
Luego se procede a tomar una muestra aleatoria de baterías y medir su vida media.
Si la información obtenida de la muestra no apoya el reclamo en la hipótesis nula
(H0), entonces otra cosa es cierta. La premisa alterna a la hipótesis nula se llama
hipótesis alterna y se representa por H1.

Hipótesis Alterna: Una premisa que es cierta cuando la hipótesis nula es falsa.

Por ejemplo, para el productor de baterías


H0 : µ ≥ 48 y
H1 : µ < 48

Para probar si la hipótesis nula es cierta, se toma una muestra aleatoria y se calcula
la información, como el promedio, la proporción, etc. Esta información muestral se
llama estadística de prueba.

Estadística de Prueba: Una estadística de prueba se basa en la información de la


muestra como la media o la proporción
7.5. Prueba de hipótesis para la media

Sea X 1 , X 2 , L , X n una muestra aleatoria de una de una población con


media µ X y varianza σ X 2 . Si el tamaño de la muestra es grande y σ X 2 es
conocida, el Teorema Central del Límite garantiza que
X −µX
aprox n ( 0, 1) . Y de esta manera un Intervalo de confianza
σX n →+∞

n
aproximado al 100 (1 − α ) % para µ X es de la forma:

σX   α
x ± zα , donde P  Z > z α  = .
2 n  2 2

Si σ X 2 es desconocida, esta es estimada usando la varianza Muestral:

∑ (x )
n
1 2
SX2 = −x y un Intervalo de Confianza aproximado al 100 (1− α )
n −1
i
i =1

sX
% para µ X es de la forma: x ± zα .
2 n
Si µ 0 es un valor particular para µ X , podemos establecer tres hipótesis
alternativas respecto al valor real de µ :

H a : µ X < µ 0
 x −µX
H0 :µX = µ0 vs H a : µ X > µ 0 . Estadístico de Prueba: ZC = .
 sX n
H a : µ X ≠ µ 0
R.C. = {Z C | Z C < − z α }
R.C. = {Z C | Z C > z α }
 
R.C. =  Z C | Z C < z α 
 2

7.6. Prueba de hipótesis para la diferencia de media


Para Diferencia de Medias.

Si lo que se desea es comparar el comportamiento promedio de una misma


característica en dos poblaciones diferentes, cuando los tamaños de
muestra son pequeños, no podemos usar el Teorema Central del Límite
para construir un Estadístico de Prueba adecuado.

De nuevo, supongamos que X 1 , X 2 , L , X n es una muestra aleatoria de


una población normal con media µ X y varianza σ X 2 y que Y1 , Y 2 , L , Y m
es otra muestra aleatoria de otra población normal con media µ Y y varianza
σ Y2 , donde σ X2 y σ Y2 son desconocidas y ambas muestras
independientes entre si.

Un estimador insesgado para µ X − µ Y es X − Y , pero ¿Cuál es la


distribución Muestral de X − Y ?

Consideremos dos casos:

Caso I: σ X 2 = σ Y 2 = σ 2

( n − 1) S 2X
Bajo el supuesto de Normalidad, χ 2 ( n − 1) y
σ X2
( m − 1) S 2Y
χ 2 ( m − 1) . Y como ambas variables son independientes entre si
σY 2

( n − 1) S 2X ( m − 1) S Y2
y σ X = σ Y = σ , entonces:
2 2 2
+ χ 2 ( n + m − 2 ) . Además:
σ 2
σ 2

Z=
( X − Y ) − (µ X −µy )
=
( X − Y ) − (µ X −µy )
n ( 0 , 1) . Entonces:
σ2 σ2 1 1
+ σ +
n m n m
( X − Y) − ( µ X −µy )
1 1
T= n
σ
+
m =
( X − Y) − ( µ X −µy )
t ( n + m − 2) , donde
( n −1) S X + ( m −1) S Y2
2
Sp
1 1
+
σ2 n m
( n + m − 2)
( n −1) S 2X + ( m −1) S Y2 .
S =
2

n+m−2
p

Caso I: σ X 2 ≠ σ Y 2 . Bajo el supuesto de normalidad en las muestras

T=
( X − Y) − ( µ X −µ y )
t ( ν ) , donde
aleatorias se puede demostrar que:
σ X2 σ Y2 aprox

+
n m
2
 S 2X S 2Y 
 + 
 n m 
ν= 2 2
−2.
 S 2X   S 2X 
   
 n  + m 
n +1 m +1

La demostración de este hecho es un poco más elaborada y por eso no se


presentará aquí. Las hipótesis a probar son entonces:

Para probar si las varianzas de ambas muestras son iguales o diferentes,


aunque sean desconocidas, podemos usar un Intervalo de Confianza al
100 (1 − α ) % para el cociente de las varianzas poblacionales, es decir para
σ X2
.
σ Y2
Si dicho intervalo contiene el número 1, podemos afirmar que posiblemente
las varianzas sean iguales. Si no contiene el número 1, podemos asumir
que las varianzas son diferentes. Un Intervalo de Confianza al 100 (1 − α ) %
σ X2
para está basado en la distribución F de Snedecor. Se puede mostrar
σ Y2
σ Y 2 S 2X
que f ( n − 1 , m − 1) . Así, un Intervalo de Confianza al 100 (1 − α ) %
σ X 2 S Y2
σ X2
para es de la forma:
σ Y2

 S 2X 1 S X2 
 2 , 2 f α ( m − 1 , n − 1)  , donde
 S Y f α ( n − 1 , m − 1) S Y


P ( f ( n − 1, m − 1) > f α ( m − 1 , n − 1) ) = α .

Los valores para f α ( m − 1, n − 1) se encuentran tabulados, para valores


pequeños de α . Usualmente se toman valores de α iguales a 0.05, 0.025,
0.01 (que corresponden a Intervalos de Confianza del 90%, 95% y 98%).

También se puede realizar una prueba de hipótesis para igualdad de


Varianzas:

σ X2 σ X2
H0 : = 1 vs H 0 : ≠ 1.
σ Y2 σ Y2

S 2X
Estadístico de Prueba: FC = f ( n −1, m −1) . R.C. =
S Y2

{FC | FC > f α ( n −1, m −1)} , α dado.

Si la hipótesis Nula es rechazada, se concluye que las varianzas


poblacionales no son iguales. En caso contrario podemos asumir que las
varianzas poblacionales son iguales.
Las hipótesis de interés a ser probadas son:

 µX −µY < δ0

H0 :µX −µY = δ0 vs H a :  µ X − µ Y > δ 0 , donde δ 0 es un valor particular.

µX −µY ≠ δ0

Usualmente δ 0 se toma como cero y entonces hablamos de una prueba de


Igualdad de Medias.

Caso I: σ X2 = σ Y2 = σ 2 . El estadístico de prueba es:

TC =
( X − Y ) − (µ X −µy )
t (n + m − 2) .
1 1
Sp +
n m

La región crítica es similar al caso de una muestra aleatoria: R.C. =


{T C | TC > t α ( n + m − 2 )} , α dado. El valor P de esta prueba se calcula
como: Vp = P ( t ( n + m − 2 ) > TC ) .

Caso II: σ X2 ≠ σ Y2 . El estadístico de Prueba es:

TC =
( X − Y ) − (µ X −µy )
t (ν ) .
S 2X S Y2
+
n m

La región crítica es similar al caso anterior: R.C. = {T | T > t ( ν )} , α


C C α

dado. El valor P de esta prueba se calcula como: Vp = P ( t ( n + m − 2 ) > T ) .


C
7.7. Prueba de hipótesis para la proporción
Concepto de proporción.

n = tamaño de la muestra

x = número de éxitos en la muestra

x
p=
n

Estadístico para la proporción de una población



p− p
z=
pq
n

Proporción conjunta.

n1 p1 + n2 p 2
pc =
n1 + n2

n1 = Tamaño de la muestra 1

n2 = Tamaño de la muestra 2

x1 = Número de éxitos en la muestra 1

x2 = Número de éxitos en la muestra 2


Estadístico para la proporción de una población conjunta.



( p1 − p 2 ) − ( p1 − p 2 )
z=
pq pq
+
n1 n 2

7.8. Prueba de hipótesis para la diferencia de proporciones

Algunas veces estamos interesados en analizar la diferencia entre las


proporciones de poblaciones de grupos con distintas características. Por ejemplo,
pensemos que la administración de las tiendas Oxxo cree, sobre la base de una
investigación, que el porcentaje de hombres que visitan sus tiendas 9 o más veces
al mes (clientes frecuentes) es mayor que el porcentaje de mujeres que hacen lo
mismo. Las especificaciones requeridas y el procedimiento para probar esta
hipótesis es la siguiente:

1. Las hipótesis nula y alternativa son las siguientes:

H o = PH − PM ≤ 0 , la proporción de hombres que reportan 9 o más visitas


por mes es la misma o menor que la proporción de mujeres que hacen lo
mismo.

H a = PH − PM > 0 , la proporción de hombres que reportan 9 o más visitas


por mes es mayor a la proporción de mujeres que hacen lo mismo.

La información proporcionada es:

nH = 45 nM = 71

PH = .58 PM = .42

PH − PM = .58 − .42 = .16


2. Especifica el nivel de significación de α = .05 . El valor crítico para la prueba
de una sola cola es de 1.64.

3. Estima el error estándar de la diferencia de las dos proporciones:

 1 1 
s p h−m = P (1 − P ) + 
 nH nM 
donde:

n H PH + nM PM
P=
nH + nM
PH = proporción muestra de hombres (H)
PM = proporción muestra de mujeres (M)
NH = tamaño de muestra hombres
NM = tamaño de muestra mujeres

Por lo tanto:

45(.58) + 71(.42)
P= = 0.48
45 + 71
y

 1 1
s p h−m = .48(1 − .48) +  = 0.10
 45 71 

4. Calcula de prueba estadística:


(diferencia _ entre _ proporciones _ observadas ) − (diferencia _ entre _ proporciones _ H o )
Z=
s ph − m

(.58 − .42) − (0)


Z= = 1.60
.10

La hipótesis nula es aceptada porque el valor de la Z calculada es menor que el


valor crítico Z. La administración no puede concluir con un 95 por ciento de
confianza que la proporción de hombres que visita 9 o más veces los Oxxo es
mayor que la proporción de mujeres.

SPSS no cuenta con procedimientos para hacer pruebas de hipótesis de


proporciones. Probemos si el porcentaje de hombres dueños de microempresas
es estadísticamente diferente del porcentaje de mujeres.

1634(83.9) + 314(16.1)
P= = 72.97
1634 + 314
y

 1 1 
s p h −m = ..73(1 − ..73) +  = 0.0274
 1634 314 

(.839 − .161) − (0)


Z= = 24.74
.0274
La hipótesis nula es rechazada porque el valor de la Z calculada es mayor que el
valor crítico Z. Podemos concluir que el porcentaje de hombres dueños de
microempresas es estadísticamente superior al porcentaje de mujeres propietarias
de microempresas.
7.9. Prueba de hipótesis para la varianza

Si la varianza s² de una población normal es desconocida, y queremos


verificar si es igual o no a determinado valor, podemos plantear las siguientes
pruebas:

1)

, , .

El estimador de la varianza poblacional s² es la varianza muestral S², y la


variable aleatoria asociada con el estadístico es la distribución chi cuadrado,
definida como:

Si X1, X2, Xn es una muestra aleatoria de tamaño n tomada de una


población normal, y si S² es la varianza muestral, entonces el estadístico de
prueba bajo H0 se calcula como:

Debe tenerse en cuenta que como la distribución chi cuadrado no es


simétrica, entonces las regiones de críticas deben calcularse por separado
para cada tipo de prueba.

El criterio de decisión es el siguiente: Rechace la hipótesis nula si:


— cuando la hipótesis alternativa sea
— cuando la hipótesis alternativa sea
— cuando la hipótesis alternativa sea ,o
equivalentemente se acéptala hipótesis nula si:

Al igual que en el caso de la media poblacional, el criterio de rechazo puede


basarse en el cálculo del valor P, o en el cálculo del límite físico para la
varianza muestral de acuerdo con las características evaluadas. Es decir, en
vez de decidir la aceptación o el rechazo según el estadístico de prueba X2,
se puede definir el límite para el valor máximo y/o mínimo que pueda tomar la
varianza muestral S². Los criterios de decisión serían: Rechace la hipótesis
nula si:

— cuando la hipótesis alternativa sea

— cuando la hipótesis alternativa sea

— cuando la hipótesis alternativa sea


,o

7.10. Prueba de hipótesis para la relación de varianza

Se tienen dos poblaciones normales e independientes con varianzas


desconocidas s²1 y s²2, respectivamente, y se desea verificar la hipótesis de que
las varianzas son iguales contra una hipótesis alternativa de que son diferentes.
Las posibles hipótesis pueden ser:

, ,

Para verificar las hipótesis anteriores nos basamos en el hecho de que la siguiente
relación tiene una distribución muestral F con n1-1 y n2-1 grados de libertad:

Bajo la hipótesis nula de que , el estadístico de prueba se calcula como


El criterio de decisión es:

— Rechace H0 si cuando la hipótesis alternativa es

— Rechace H0 si cuando la hipótesis alternativa es

— Rechace H0 ó cuando la hipótesis alternativa


es
7.11.
Bibliografía

• Revista Colombiana de Estadística Volumen 29 No 1. pp. 57 a 76. Junio


2006
• www.mty.itesm.mx/egap/deptos/cee/mc/documentos_curso/sesion7/
• Kurincic, G.; “Estadística – Herramientas de Inferencia”; Ed. Cooperativas;
2001.
• García Barbancho; “Estadística Elemental Moderna”; Ed. Ariel; 1986.
• Kazmier, L y A. Díaz Mata, A; “Estadística aplicada a la Administración y a
la Economía”; Ed. McGraw–Hill; 1993.
• Mendenhall, Scheaffer & Reinmuth: “Estadística para Administración y
Economía”; Ed. Iberoamericana; 1986.
• Novales, A.; “Estadística y Econometría”; Ed. . McGraw–Hill; 1997.
• Pérez, C.; “Técnicas de Muestreo Estadístico”; Ed. Alfaomega; 2000.
• Ya Lun Chow; “Estadística”; Ed. Iberoamericana; 1985.
Actividades Adicionales Complementarias

1.- Determine si la región de rechazo es de la cola derecha, de la cola izquierda o de dos


colas.
a. H0 : µ = 15, H1 : µ ≠ 15, α=.05
b. H0 : p ≤ 0.7, H1 : p > 0.7, α=.02

2.- Se sabe que el tiempo promedio de secado de una pintura está normalmente distribuido
con media de 75 min. y desviación estándar de 9 min. Se utiliza un aditivo para secado
rápido en 25 piezas. Se quiere probar que el tiempo promedio de secado ha disminuido por
el uso del aditivo siempre que el tiempo promedio de secado de la muestra sea menor que
70,8 min.

a) a Halle el nivel de significancia e interprete el resultado

b) Cual seria si en muestras particulares de tamaño n=25 el promedio del promedio del
tiempo de secado fuera x = 70, x = 71, x = 75
c) Calcule β(72), β(70.8), β(70) y β(67) y grafique comparativamente α y β

3.- Suponga que el espesor de un componente de un semiconductor es una


dimensión crítica. El proceso de producción de tal característica se distribuye
normalmente con una desviación estándar de 0.6 milésimas de pulgada. Para
controlar el proceso se toman muestras periódicas de veinte piezas, y se define un
límite de control con base en una probabilidad de 0.01 de que la varianza muestral
exceda dicho límite, si el proceso está bajo control. Qué se puede concluir si para
una muestra dada la desviación estándar es 0.84 milésimas de pulgada?

También podría gustarte