Está en la página 1de 19

Dr. C. Ing. José A.

Vilalta Alonso 1

Estadística I. Tema 3. Estadística Inferencial. Pruebas de Hipótesis.

Pruebas de hipótesis para parámetros.


Objetivo:
Resolver problemas de pruebas de hipótesis asociados a un parámetro como contribución
a la toma de decisiones.

Bibliografía:

1. Walpole, R.; Myers, R.; Myers S. (2008). Probabilidad y Estadística para Ingenieros.
Parte I, capítulo 10, pp. 290-313, 330-332 y 336-340. Sexta Edición, Editorial Félix
Varela, La Habana, Cuba.

2. Rodríguez, Hilario. (2009). Tablas y Resúmenes Estadísticos. Editorial Féix Varela,


La Habana, Cuba.

Introducción.
Con esta clase se comienza el estudio del otro gran método de la estadística inferencial:
las pruebas (o dócimas) de hipótesis.
Una prueba o dócima de hipótesis es aquella que utilizamos cuando deseamos decidir
si una armación relativa a alguna característica de la población que nos es
desconocida (un parámetro, la propia distribución u otra) es verdadera o falsa.
Algunas situaciones que ejemplican lo anterior son:

¾Podemos considerar que el peso promedio de todas las bolsas llenas ha cambiado?

¾Puede considerarse que la proporción de piezas defectuosas en el taller disminuyó?

¾Puede considerarse que la proporción de clientes satisfechos actualmente es superior a


la proporción de clientes satisfechos antes de desarrollar el programa mejora de la calidad?

¾Siguen los datos del estudio una distribución normal?

¾Es posible considerar que la muestra de que se dispone es aleatoria?

Estas, y muchas otras preguntas de corte similar, pueden ser respondidas mediante la
solución de problemas de pruebas de hipótesis, algunas de las cuales formarán parte de
los contenidos de esta asignatura.

La gura 1 representa el procedimiento general a seguir en la solución de un problema de


prueba de hipótesis:
Dr. C. Ing. José A. Vilalta Alonso 2

Figura 1: Procedimiento para la solución de problemas de pruebas de hipótesis.

Una hipótesis estadística es una armación o conjetura acerca de una o más poblacio-
nes con el n de ponerlas a prueba. Se van a plantear dos hipótesis:

H0 : hipótesis nula

H1 : hipótesis alternativa

Para el planteamiento y solución de un problema de hipótesis es necesario tener muy


claros dos aspectos:

1. La realidad desconocida.

Aunque parezca redundante es conveniente recalcar que la realidad se desconoce, porque


de lo contrario no estaríamos en presencia de un problema de prueba de hipótesis. Volva-
mos sobre una de las preguntas anteriores:

¾Podemos considerar que el peso promedio de todas las bolsas llenas ha cambiado?
Si conociéramos el verdadero valor del peso medio de todas las bolsas (µ) no estaríamos
ante una conjetura que tendría que ponerse a prueba, es decir, no estaríamos ante un
problema de prueba de hipótesis.

Estamos ante un problema de pruebas de hipótesis porque desconocemos, en este ejem-


plo, el verdadero valor de la media poblacional (µ), por lo que será necesario tomar una
muestra, calcular un estadígrafo y tomar una decisión (ver gura 1).

Esta realidad desconocida puede ser expresada de la siguiente manera:


Dr. C. Ing. José A. Vilalta Alonso 3

• H0 es cierta

• H0 es falsa

2. La decisión tomada.

Como resultado del proceso de toma de decisiones en un problema de prueba de hipótesis


pueden tomarse una de dos posibles decisiones:

• Rechazar la hipótesis nula H0

• No rechazar la hipótesis nula H0

Para tomar la decisión hay que evaluar un criterio de decisión, como se puede ver en la
gura 1. Este criterio de decisión es lo que se conoce como región crítica. Pero sobre esto
se volverá después.

Antes vamos comentar algo muy importante: la relación entre las posibles decisiones y el
error en unas pruebas de hipótesis. Para esto observemos lo planteado en la tabla 1:

Tabla 1: Decisiones y errores en problemas de pruebas de hipótesis.

Como puede verse, cada decisión tiene un posible error asociado. Si se rechaza H0 pudiera
cometerse el error de tipo I, si realmente esta hipótesis fuera cierta. Si por el contrario la
decisión es no rechazar H0 , entonces pudiera cometerse el error tipo II, lo que ocurriría si
la hipótesis nula es falsa.

Esto implica que solo tendremos que preocuparnos por uno de los dos posibles errores,
dependiendo de la decisión que se tome.

Obviamente, nunca podremos saber si nuestra decisión es correcta o ha sido errónea, por-
que la realidad es desconocida.

Por lo tanto, para saber cuán riesgosa es la decisión que tomamos a cada posible error se
asocia su probabilidad de ocurrencia.

A la probabilidad de cometer el error tipo I se le denomina alpha (α) y es el nivel de


signicación de la prueba de hipótesis. El nivel de signicación es un elemento de diseño
en un problema de prueba de hipótesis, es decir, no se calcula, se ja por parte del decisor.

α = P (Error tipo I) = P (Rechazar H0 /H0 es cierta)


Dr. C. Ing. José A. Vilalta Alonso 4

A la probabilidad del error tipo II se le denomina beta (β ):

β = P (Error tipo II) = P (N o rechazar H0 /H0 es f alsa)

Posteriormente, cuando se aborden los casos particulares, se profundizará en estos ele-


mentos, que son de mucha importancia en un problema de prueba de hipótesis. Por ahora
solo adelantaremos que mientras α es un valor único, β es una función.

Un aspecto muy importante es el complemento de la probabilidad β, que es la llamada


potencia de la prueba de hipótesis. esta potencia se dene como:
1 − β = P (Rechazar H0 /H0 es f alsa)

Va quedando la manera de establecer el criterio de decisión, el que nos va a dirigir a la


toma de una u otra decisión. Pero eso lo veremos para las situaciones particulares.

Con todos estos elementos estamos en condiciones de comenzar el estudio de las pruebas
de hipótesis para diferentes parámetros: media, varianza y desviación típica y proporción.

El objetivo de todas las pruebas que se presentarán en este documento es comparar un


2 2
parámetro (µ, σ , σ o p) con un valor de interés (µ0 , σ0 , σ0 o p0 ), según sea el caso.

Pruebas de hipótesis para la media de una distribución normal.


Comenzaremos planteando las hipótesis posibles para esta situación, las que se presentan
a continuación:

Es importante observar algunos detalles:

• Como ya se dijo, al valor con el que se va a comparar el parámetro, en este caso µ, lo


llamamos µ0 .

• El signo de igualdad (=) siempre se pone en H0 .

• En H1 se representa la desigualdad. El signo a utilizar depende de lo que se plantee en


el problema que se quiera resolver.

• Asociada a cada hipótesis hay una decisión práctica.

• Las hipótesis son excluyentes, lo que implica que nunca la decisión práctica asociada a
ambas hipótesis podrá coincidir.
Dr. C. Ing. José A. Vilalta Alonso 5

Ejemplo 1: Se han realizado modicaciones a un proceso para disminuir el tiempo medio


de entrega de los pedidos, que ha sido históricamente de 5 días. Para vericar si las mo-
dicaciones han sido efectivas se seleccionan al azar 10 pedidos, obteniéndose el tiempo
de entrega para cada uno.

H0 : µ = 5 las modicaciones no han sido efectivas (decisión práctica)

H1 : µ < 5 las modicaciones han sido efectivas (decisión práctica)

A este tipo de pruebas donde en la hipótesis alternativa H1 se ponen los signos < o > se
les llama pruebas unilaterales o de una sola cola.

Ejemplo 2: En una línea de producción se envasa cemento en bolsas que deben pesar
como promedio 1 kg. La dirección de la planta decide revisar esto pues se sospecha que
la máquina llenadora se ha desajustado, modicando el peso promedio.

H0 : µ = 1 la máquina no se ha desajustado

H1 : µ 6= 1 la máquina se ha desajustado

A este tipo de pruebas donde en la hipótesis alternativa H1 se pone el signo 6= se les llama
pruebas bilaterales o de dos colas.

Obviamente este tipo de pruebas para la media poblacional µ usará como estadígrafo base
la media muestral X̄ , sobre cuya base se construirán los estadígrafos de pruebas que se
presentarán más adelante.

¾Cómo tomar la decisión en un problema de pruebas de hipótesis? ¾Cómo


establecer el criterio de decisión?
Al criterio de decisión se le llama región crítica y es el conjunto de valores del estadígrafo
para el que se rechaza la hipótesis nula H0 .

Pongamos una situación a la que correspondan las siguientes hipótesis:

H0 : µ = 5

H1 : µ > 5

Supongamos que se ha decidido establecer como criterio de decisión el siguiente (poste-


riormente aprenderemos cómo hacerlo):

Región crítica: X̄ > 5, 2

Esto signica que se tomará una muestra, se calculará la media muestral (X̄ ) y se com-
parará con el valor 5,2. Si resulta ser mayor, la decisión será rechazar la hipótesis nula
H0 . En caso contrario la decisión será no rechazar la hipótesis nula H0 . Esta situación se
representa en la gura 2.
Dr. C. Ing. José A. Vilalta Alonso 6

Figura 2: La región crítica para la situación expuesta.

Veamos algunas cosas en el gráco. Lo primero es que la media poblacional es igual a 5


(µ = 5), por lo que estamos considerando que H0 es cierta.

Observe también la región crítica (RC), es el conjunto de valores de X̄ que son mayores
que 5,2 (X̄ > 5, 2), a los que corresponde el área sombreada, que como sabemos representa
una probabilidad.

Supongamos ahora que se toma la muestra y se obtiene un valor de la media muestral de


5,3 (X̄ = 5, 3). ¾Cuál sería la decisión? Obviamente, rechazar H0 , ya que 5, 3 > 5, 2.

Ahora analicemos el área sombreada. ¾Qué representa? Observen que representa la pro-
babilidad de rechazar la hipótesis nula H0 (el área en cuestión está asociada a la región
crítica), siendo realmente H0 cierta (µ = 5).

¾Y cuál es la probabilidad de rechazar la hipótesis nula H0 , siendo realmente H0 cierta?


El nivel de signicación de la prueba de hipótesis, α o probabilidad de error de tipo I. La
gura 3 representa esta situación.

Figura 3: Relación entre la región crítica y el nivel de signicación α.

Y ya se dijo que α es un elemento de diseño de la prueba de hipótesis, por lo que la ja


el decisor. Por lo tanto, en el justo momento en que el decisor ja el nivel de signicación
de la prueba de hipótesis α, está deniendo el criterio de decisión, o sea, la región crítica.
Dr. C. Ing. José A. Vilalta Alonso 7

Los valores de α utilizados con más frecuencia son 0,05; 0,01 y 0,1.

No obstante en el Libro de Tablas y Resúmenes Estadísticos aparecen las regiones críticas


asociadas a cada uno de los planteamientos posibles de las hipótesis, en dependencia del
estadígrafo de prueba utilizado. También será ofrecidas en este documento.

El estadígrafo a utilizar está en dependencia de las condiciones que se presenten en el


problema, como se verá a continuación, y que corresponden con las ya estudiadas para la
estimación por intervalos de conanza para la media.

A partir de aquí se está en condiciones de comprender la utilización de otro criterio para


tomar la decisión: el valor p (también se usan indistintamente las notaciones p-valor, o
sencillamente p, y en inglés el término p-value).

Utilización del valor p para la toma de decisiones.


Se le denomina valor p a la probabilidad de observar un valor muestral tan extremo o
más que el valor del estadígrafo calculado, dado que la hipótesis nula es verdadera.

En el ejemplo que se ha seguido, en el que se tomó una muestra aleatoria y se obtuvo


X̄ = 5, 3:

p = P (X̄ > 5, 3)

La gura 4 representa esta situación:

Figura 4: Relación entre la región crítica, el nivel de signicación α y el valor p.

Note que el valor p, que está representado por el área bajo la curva a la derecha del valor
5,3, es una probabilidad más pequeña que α. Por lo que siempre que el estadígrafo X̄ (o
el estadígrafo que se esté utilizando) esté en la región crítica el valor p será menor que α.
Y en ese caso la decisión será rechazar H0 .
Dr. C. Ing. José A. Vilalta Alonso 8

Pero qué pasará si, por ejemplo, X̄ = 5, 1. La decisión será no rechazar la hipótesis nula
H0 . Y el valor p será:

p = P (X̄ > 5, 1)

La gura 5 muestra esta situación:

Figura 5: Relación entre la región crítica, el nivel de signicación α y el valor p.

Note que el valor p, que está representado por el área bajo la curva a la derecha del valor
5,1, es una probabilidad más grande que α. Por lo que siempre que el estadígrafo X̄ (o el
estadígrafo que se esté utilizando) no esté en la región crítica el valor p será mayor que
α. Y en ese caso la decisión será no rechazar H0 .

Resumiendo:

• Si p≤α la decisión será rechazar H0

• Si p>α la decisión será no rechazar H0

Riesgos asociados a las decisiones.


Ya se vio que las decisiones que se pueden tomar en un problema de prueba de hipótesis
están asociadas a posibles errores, conocidos como error de tipo I o de tipo II. Los riesgos
asociados a estos errores los hemos denido como α y β.

Ahora estamos en mejores condiciones de denir los mismos:

α = P (error I) = P (Rechazar H0 /H0 es cierta) = P (Rechazar H0 /µ = µ0 )

Por lo tanto, como ya se dijo, α es un valor único y que será jado por el decisor.

β = P (error II) = P (no rechazar H0 /H0 es f alsa) = P (no rechazar H0 /µ = µ1 )


Dr. C. Ing. José A. Vilalta Alonso 9

Y µ1 es cualquier valor que pertenezca a la hipótesis alternativa. Por lo tanto, como tam-
bién se dijo anteriormente, es una función, que podrá ser calculada para todos los valores
de µ1 que sean de interés.

De igual forma puede expresarse la potencia de la prueba de hipótesis:

1 − β = P (Rechazar H0 /H0 es f alsa) = P (Rechazar H0 /µ = µ1 )

Utilización de la distribución normal estándar.


Se utilizará la distribución normal estándar como distribución del estadígrafo de prueba
bajo las siguientes condiciones:

1. X∼N o n ≥ 30
2. σ2 conocida o n ≥ 30
3. se toma una muestra aleatoria

En este caso el estadígrafo de prueba que se utilizará, calculado sobre la base de la media
muestral es:

X̄ − µ0
Z= √ (1)
σ/ n

Las regiones críticas asociadas a los posibles planteamientos de las hipótesis, así como la
forma de calcular el valor p, quedarían como:

Note la correspondencia entre el signo de la hipótesis alternativa y el de la región crítica


para los casos unilaterales (el segundo y tercero, de izquierda a derecha) y la utilización
de la probabilidad α/2 para el planteamiento bilateral.

Ahora bien, siempre que solo se je el valor del nivel de signicación α, cualquier tamaño
de muestra lo va a satisfacer. Si la decisión es rechazar H0 no habrá problemas, pues el
Dr. C. Ing. José A. Vilalta Alonso 10

riesgo asociado a la decisión será α, que ha sido jado tan pequeño como queramos.

Pero si la decisión es no rechazar H0 el riesgo asociado a la misma sería β . Y este pudiera


ser grande (incluso, no admisible) dependiendo del tamaño de la muestra n.

Pero en ocasiones se desea jar, además del valor de α, también el de β. ¾Cómo garan-
tizar simultáneamente ambos riesgos?
Será necesario calcular un tamaño de muestra mínimos que garantice la satisfacción de
ambos riesgos. Este tamaño de muestra se calcula como:

(Zβ + ZD )2 σ 2
n= (2)
(µ1 − µ0 )2

Donde:

D = α/2 para las pruebas bilaterales

D=α para las pruebas unilaterales

Todos estos resultados pueden ser obtenidos con la utilización de Minitab. Para ello debe
seguirse la secuencia:

Stat >Basic Statistics >1-Sample Z. . . y activar la pestaña Perform hypothesis test. En


Hypothesize mean: colocar el valor de µ0 . Y en Options. . .  establecer el tipo de hi-
pótesis alternativa (diferente, mayor que, menor que). Esta secuencia permite obtener el
valor del estadígrafo Z y el valor p.

Ejemplo 3: Se han realizado modicaciones a un proceso para disminuir el tiempo medio


de entrega de los pedidos, que ha sido históricamente de 5 días. Por estudios anteriores se
sabe que el tiempo de entrega de los pedidos es una variable normal con desviación típica
de 1 día. Para vericar si las modicaciones han sido efectivas se seleccionan al azar 10
pedidos, obteniéndose el tiempo (días) de entrega para cada uno. Los valores se muestran
a continuación:

5 4 2 5 4 4 5 5 5 4

Tome la decisión correspondiente usando un nivel de signicación del 5 %.

X: Tiempo de entrega de los pedidos.

X ∼ N (µ; σ = 1)

n = 10 X̄ = 4, 3 α = 0, 05

H0 : µ = 5 las modicaciones no han sido efectivas


Dr. C. Ing. José A. Vilalta Alonso 11

H1 : µ < 5 las modicaciones han sido efectivas

RC: Z < −Zα

Z < −Z0,05

Z < −1, 64

Ahora se calculará el estadígrafo Z y se comparará con -1,64.

X̄ − µ0 4, 3 − 5
Z= √ = √ = −2, 21 (3)
σ/ n 1/ 10

RC: −2, 21 < −1, 64 Como se cumple la región crítica hay evidencias para rechazar la
hipótesis nula H0 con un nivel de signicación del 5 % y decidir que las modicaciones
han sido efectivas.

Usando el valor p se llegará, inequívocamente, al mismo resultado:

p = P (Z < −2, 21) = P (Z > 2, 21) = 0, 013

Al ser este valor menor que el nivel de signicación 0,05 la decisión sería rechazar la hi-
pótesis nula H0 .

Es muy importante considerar el nivel de signicación. Por ejemplo, si el nivel de signi-


cación usado hubiera sido del 1 %, la decisión hubiera sido diferente:

RC: Z < −Zα

Z < −Z0,01

Z < −2, 33

RC:−2, 21 > −2, 33 Como no se cumple la región crítica no hay evidencias para rechazar
la hipótesis nula H0 con un nivel de signicación del 1 % y se decide que las modicaciones
no han sido efectivas, ya que no han logrado disminuir el tiempo promedio de entrega.

Ese mismo resultado se hubiera obtenido comparando el valor p (0,013) con α (0,01).

La salida de Minitab se muestra en la gura 6.


Dr. C. Ing. José A. Vilalta Alonso 12

Figura 6: Prueba de hipótesis para la media usando el estadígrafo Z.

Utilización de la distribución t de Student.


Se utilizará la distribución t de Student como distribución del estadígrafo de prueba bajo
las siguientes condiciones:
Dr. C. Ing. José A. Vilalta Alonso 13

1. X∼N

2. σ2 desconocida y n < 30

3. se toma una muestra aleatoria

En este caso el estadígrafo de prueba que se utilizará, calculado sobre la base de la media
muestral es:

X̄ − µ0
t= √ (4)
S/ n

A continuación se presentan las hipótesis, con sus respectivas regiones críticas y los valores
p.

Para usar Minitab se procede de la misma forma, solo que en este caso:

Stat >Basic Statistics >1-Sample t. . .

Ejemplo 4: La longitud de las barras cortadas por cierta máquina sigue una distribu-
ción normal. Históricamente su media ha sido de 170 cm. Se sospecha que la máquina
se ha desajustado y la longitud promedio se ha incrementado. Para vericarlo se toma
una muestra aleatoria de 16 barras en la que se obtuvo una media igual a 173 cm y una
desviación típica de 4,5 cm. Dé respuesta a la problemática planteada con un nivel de
signicación del 5 %.

X: Longitud de las barras.

X∼N

n = 16 X̄ = 173 S = 4, 5 α = 0, 05
Dr. C. Ing. José A. Vilalta Alonso 14

H0 : µ = 170 la máquina no se ha desajustado

H1 : µ > 170 la máquina se ha desajustado

RC: Z > Zα

Z > Z0,05

Z > 1, 64

Ahora se calculará el estadígrafo t y se comparará con 1,64.

X̄ − µ0 173 − 170
t= √ = √ = 2, 67 (5)
S/ n 4, 5/ 16

RC: 2, 67 > 1, 64 Como se cumple la región crítica hay evidencias para rechazar la hipóte-
sis nula H0 con un nivel de signicación del 5 % y decidir que la máquina se ha desajustado

Si usamos el valor p:

p = P (t15 > 2, 67) = 0, 009 (esta probabilidad se calculó usando Minitab)

(Si se busca en la tabla de la distribución t se observará que es un valor entre 0,01 y 0,005.)

La gura 7 muestra la salida obtenida con Minitab, utilizando la opción de datos resumi-
dos, como se comentó en clases anteriores.

Figura 7: Prueba de hipótesis para la media usando el estadígrafo t.

Pruebas de hipótesis para la varianza y la desviación típica de una distribución


normal.
Llegado a este punto no hay mucho que agregar para presentar el resto de las pruebas de
hipótesis para parámetros que se estudiarán en este curso.

En el caso que nos ocupa solo basta recordar que el estadígrafo base que se utilizará será la
2 2
varianza muestral (S ) y la distribución asociada a este estadígrafo es la chi cuadrado (χ ).

Puede agregarse que el planteamiento de las hipótesis puede ser lo mismo para la varianza
2
poblacional σ que para la desviación típica poblacional σ , y que la solución del problema
Dr. C. Ing. José A. Vilalta Alonso 15

es de una única manera, con independencia de si las hipótesis se plantean para un pará-
metro o para otro.

El estadígrafo de prueba se calcula de la siguiente manera:

S 2 (n − 1)
χ2 = (6)
σ02

A continuación se presentan los diferentes planteamientos con las correspondientes regio-


nes críticas. Observe, que se introducen algunos cambios respecto a lo que se ha visto en
las pruebas anteriores motivados por el hecho de que, como se sabe, la distribución Chi
cuadrado no es simétrica.

Y ahora se acompañan los planteamientos con la manera de calcular el valor p.

Donde, como en los casos anteriores, el valor χ2c representa el valor de estadígrafo χ2 cal-
culado.

Ejemplo 5: El peso de las bolsas que se envasan en una línea de llenado se ha comportado
históricamente como una variable normal, con media 1 kg y desviación típica de 0,01 kg.
Dr. C. Ing. José A. Vilalta Alonso 16

Se sospecha que las causas de variabilidad que afectan el proceso se han modicado y que
la varianza del peso se ha modicado. Para vericarlo se toma una muestra aleatoria de
10 sacos, a los que se les registra el peso, obteniéndose una peso medio de 1,0052 kg y una
desviación típica de 0.0202 kg. Decida si la sospecha tiene fundamento usando un nivel
de signicación del 10 %.

X: Peso de las bolsas.

X ∼ N (µ = 1; σ = 0, 01)

n = 10 σ02 = 0, 0001 X̄ = 1, 0052 S = 0, 0202 α = 0, 1

H0 : σ 2 = 0, 0001 las causas de variabilidad no se han modicado

H1 : σ 2 6= 0, 0001 las causas de variabilidad se han modicado

RC: χ2 > χ2α/2;n−1 o χ2 < χ21−α/2;n−1

RC: χ2 > χ20,05;9 o χ2 < χ20,95;9

RC: χ2 > 16, 919 o χ2 < 3, 325

Ahora se calculará el estadígrafo χ2 y se comparará con los límites críticos 19,919 y 3,325.
Si se cumple una de las dos desigualdades se rechazará hipótesis nula.

S 2 (n − 1) 0, 02022 (9)
χ2 = = = 36, 72 (7)
σ02 0, 0001

RC: 36, 72 > 16, 919 Como se cumple la región crítica hay evidencias para rechazar la
hipótesis nula H0 con un nivel de signicación del 10 % y decidir que las causas de varia-
bilidad presentes en el proceso se han modicado.

Usando el valor p, y teniendo en cuenta que la decisión se tomó al estar el estadígrafo por
encima del límite crítico:

p = 2P (χ29 > 36, 72) = 2(0) = 0

Para obtener los resultados con Minitab debe seguirse la secuencia:

Stat >Basic Statistics >1 Variance. . .

La gura 8 muestra la salida ofrecida por Minitab:


Dr. C. Ing. José A. Vilalta Alonso 17

Figura 8: Pruebas de hipótesis para la varianza.

Pruebas de hipótesis para proporciones.


Las pruebas de hipótesis para proporciones se pueden resolver usando la distribución bi-
nomial. Sin embargo, es una práctica bastante más generalizada usar la aproximación
Normal para resolver este tipo de problemas, siempre que se cumplan las condiciones.

Si se cumple que np0 > 5 y que n(1 − p0 ) > 5 puede usarse la distribución normal. Esto
es bastante fácil de lograr, a menos que el valor p0 esté muy cerca de cero o de uno.

El estadígrafo a utlizar se calculará como:

X − np0
Z=p (8)
np0 (1 − p0 )

Donde:

X: Cantidad de éxitos en la muestra, como ya se ha denido en clases anteriores.

También puede usarse la expresión:

p̂ − p0
Z=q (9)
p0 −(1−p0 )
n

Siendo: p̂ = X/n

Las posibles hipótesis se muestran a continuación:


Dr. C. Ing. José A. Vilalta Alonso 18

Al usarse la distribución normal estándar la manera de calcular el valor p es similar a


la empleada para el caso de las pruebas de hipótesis para la media usando esta distribución.

Para usar Minitab en la solución de este tipo de problemas se debe usar la siguiente se-
cuencia:

Stat >Basic Statistics >1 Proportion. . . y en Options debe aclararse que se usará la
aproximación Normal.

Ejemplo 6: Los directivos de una empresa arma que más del 20 porciento de sus clien-
tes ya usan el nuevo dispositivo electrónico que ha puesto a la venta. ¾Existe razón para
dudar de esta armación si en una muestra aleatoria de 1000 clientes se encuentra que
215 usan el nuevo dispositivo? Utilice un nivel de signicación de 0,01.

Para la solución tomamos en cuenta la siguiente información:

El éxito, en este problema, es que los clientes usen el nuevo dispositivo. Además, se cum-
plen las condiciones de aproximación normal.

n = 1000 X = 215 α = 0, 01

H0 : p = 0, 20 Existe razón para dudar de la armación de los directivos.

H1 : p > 0, 20 No existe razón para dudar de la armación de los directivos.

RC: Z > Zα

Z > Z0,01

Z > 2, 33

X − np0 215 − 200


Z=p = √ = 1, 19 (10)
np0 (1 − p0 ) 160

RC: 1, 19 < 2, 33

Como no se cumple la región crítica no hay evidencias para rechazar la hipótesis nula H0 ,
al nivel de signicación de 0,01. Por lo tanto hay razón para dudar de la armación de
los directivos de la empresa.
Dr. C. Ing. José A. Vilalta Alonso 19

Usando el valor p:

p = P (Z > 1, 19) = 0, 1170

Este resultado conduce al mismo resultado obtenido evaluando la región crítica.

La gura 9 muestra la salida que ofrece Minitab.

Figura 9: Pruebas de hipótesis para la proporción.

Ejercicio 1: Para los ejemplos del 3 al 6 diga, de acuerdo a la decisión tomada en cada
uno, qué tipo de error se pudiera cometer. Justique su respuesta.

En la próxima clase se estudiarán algunas pruebas de hipótesis no paramétricas, especí-


camente algunas de las dedicadas a la vericación del cumplimiento de requisitos que
se establecen para la validez de los resultados obtenidos con el uso de diversos métodos
estadísticos.

También podría gustarte