Está en la página 1de 45

..,.- 11 prcporción poblecional p.

Bes6ndonos en la información
ot>te lide en le muestra, queremos seber si podemos afirmar que la Pro-
--~U'\ poblaeiontJI es meyor a O50, o cuán cerca está nuestro estirna-
p la ~ a proporción p.
En ~ capítulo aprenderemos a hacer ensayos de hipótesis fo
ma sobre tres parámetros, la proporción poblac1onal p, la rned,:
pobladOl"ltJI µ y a9 También avanzaremos en el concepto de estimación
por anmvalos de confianza para cada uno de ellos. Estaremos capacit _
dos para realizar afirmaciones, usando probabilidades, sobre la segurida~
que tenemOS acerca de nuestra afirmación o intervalo estimador. Para aclfü
~ ideas, consideremos el siguiente ejemplo. ar

UIMPLO a.1. Prcpar,ndonos para trabajar

Las compañías consultoras, que vinculan a los empleadores con sus


futuros empleados, han notado que se les exigen mayores conocimientos
a los empleados.
Conside@remos dos aspectos:

1. lCreen los empleadores que se han incrementado los requeri-


mientos de habilidad o conocimientos?
Estamos interesados en tomar una decisión. Podemos reformular
esta pregunta en términos de la siguiente hipótesis sobre p, la proporción
poblacional de empleadores que afirman que los requisitos han aumen-
tado. Por ejemplo:
H0 : p = O.SO
H1: p > O.SO d es ca-1
Podríamos tomar una muestra simple al azar de los emplea or I P d
cular la proporción muestra! µA y usarla como una estimación puntua r qeu~
h. u meno
Ycalcular el p-va/ue para este test. Si el p-value es "muy e ,_co ,
el nivel de significación, entonces rechazaríamos la hipótesis nula.
. ¡entos
los requenni
2. lQué proporción de empleadores afirma que 1

han aumentado? a muestra sirí1P ~


Ahora, nos interesa estimar p. Podríamos tomar unO quizás dar u
al azar, calcular~ como una estimación puntual de p,

8
pequeño rango de valores alrededor de p,
como un intervalo, donde
pensarnos "puede" estar p.
En el capítulo 7 nos presentaron algunos datos sobre una encuesta
a empleadores referida a sus opiniones sobre los niveles de conocimien-
to y habilidad de los empleados. La Oficina de Censos encuestó a 3.000
empleadores en todo el país. El 57% de ellos dijo que los requerimientos
h~~ subido en los últimos ~es años. La proporción 0,57 es una propor-
c1on muestra!, un valor de p, basado en una muestra de tamaño 3.000. Si
la Oficina de Censos repitiera la encuesta a otros 3.000 empleadores, es
probable que la proporción muestra! no sea 0,5 7.

Contestar preguntas como la 1, ó 2, incluirá el uso de distribuciones


muestrales. Éstas se utilizarán para calcular el p-value del test. Las distribu-
ciones muestrales son la base para la formación del intervalo de estima-
ción para un parámetro poblacional.
, ,
8.1. ENSAYO DE HIPOTESIS PARA UNA PROPORCION POBLACIONAL

Ilustraremos este concepto a través del siguiente escenario en lo


referente a la proporción de residentes de Michigan que fuman.

EJEMPLO 8.!l. ¿ffan dejado de fumar más residentes? @


La proporción de fumadores adultos de Michigan en 1999 era del
25 5% (O 255). El Departamento de Salud Pública deMichigan realizó una
en~uesta 'para determinar si el nivel de fumadores, es decir, la proporción
de adultos de Michigan que fuman, ha cambiado.
Sea p la proporción de adultos de Michigan que fum~,ban en el año
2000. El Departamento tiene la hipótesis de que la proporc1on pdel 2000
es diferente a la del año anterior, que era 0,255.
Esto se expresa en los siguientes términos:
H0 : p = 0,255
H · p * 0,255. .
E1\2s de marzo de 2001 en la columna de Ann Arbor titulada "Más
residentes dejan de fumar', se describe algunos, de los resultados de la
encuesta del año 2000. Algunos extractos del articulo se exponen a con-
tinuación.

9
D artamento de Salud Pública de Michigan rnost ,
'El informe de1 ep II ro que el
s adultos fuman ·
25% de 1O fu dores del 2000 (25%) fue comparado con el 25 5
El nivel de ma 11 ' %del

anterior (1999) .. .
ano d I Instituto de Tabaco dlJo que el cambio fue Pequ _
un vocero ecambio .importante. Creo que estan, tratando de ¡eno .. ··
Este no es un d' . d. . nventar
. . obre algo que no es esta 1st1camente 1st1nguible de u _
una h1stona s n ano
al otro". . f, · t t 1
1e orneas con un o a de 2.400
basó en entrevistas te 11arna-
La encuesta Se _ 11
seleccionadas al azar durante el ano 2000. La preg
das a adultos II unta
tiene un margen de error de ± 1,9% .

Investiguemos los dichos del vocero sobre que el nivel del 25% del
11
2000 no es "estadísticamente distinguible de un año a otro •

p PARA PENSAR I!!

P1: De acuerdo a los dichos del vocero, la hipótesis nula


escrita arriba, ¿fue rechazada o aceptada?

Explique. (Piense cuál es la hipótesis que sustenta el vocero cuando


dice que el cambio de 1999 a 2000 "no es un gran cambio'').

PI: Si el test se hizo con un nivel de significación del 5%,


iel p-value fue mayor o menor que 0,05?

Explique.

10
de f; -0,25 es tan extremo como un valor deP - 0,26, ya que ambos
están a O, 005 de p. Un resultado más extremo corresponde a un valor
de f; menor a 0,25 o mayor a 0,26. Entonces, el p-value es la probabili-
dad de observar un valor de O, 25 o menor o la de observar un valor de
o, 26 o mayor. Teniendo en cuenta que el área a la izquierda de O, 25 es
,gual que la que está a la derecha de O, 26, tenemos que:
Para H1 : p -:1, 0,155

P-value = 2P[ p~ :5 0,25] =2P[z :5 -


0.25-
- o,255]
0,0089
- =2P [z :5 -0,56] = 2(0,2877) = 0.5754

*
Luego, para el test H0 : p = 0,155 contra H1: p 0,155, el p-value
es 0,58. Este es un valor bastante alto. El resultado que observamos, un
valor de P = 0,25, o uno más extremo, puede ocurrir un 58% de las
veces bajo la hipótesis nula. El resultado observado es muy probable su-
poniendo cierta H0 . Recuerda que comparamos el valor del p-value con
el nivel de significación, a. Si el p-value es menor que a, los datos son
estadísticamente significativos y por lo tanto rechazamos H0 . Pero debido
a que nuestro valor del p-value es bastante grande, mayor que los niveles
de significación más comúnmente utilizados de 0,01; 0,05 y O, 1Oacepta-
remos H0•
Aceptar, o mejor dicho no rechazar H0 implica apoyar los dichos
del vocero en cuanto a que las diferencias de un año a otro no eran
"estadísticamente distinguibles".

Acabamos de completar nuestro primer ensayo de hipótesis


formal sobre la proporción poblacional p, según el enfoque del
p-value

Resumen para la prueba I de una muestra para la propor-


ción poblacional - el enfoque p-value.

• Estábamos interesados en ensayar hipótesis sobre la propoción


poblacional p(H 0 : p = 0,255 contra H,: p-:t- 0,255). Observe
que estas hipótesis son afirmaciones sobre la proporción poblacio-
nal, no la proporción muestra!.
• Los datos se obtuvieron de una muestra al azar de tamaño n (con
n grande) de la población.

13
decisión sobre p ~ la proporción rnuestr· i 6.
Uestra
• Basamos
.
nntemente en el vaIor d e p estand anza
. d o que esa µ ,
0 equ,vae
1 ,.
z = p-Po
PoO- Po>
n
donde Po es el valor hipotético de P en H0 (_acá p 0 == 0,2SS).
E t cantidad estandarizada Z se llama estadístico del test O est •
d~s:co de prueba, y su distribución bajo H0 es aproxirnadarnen~e
N(O, 1). , . , .
• Calculamos el p-value para el test, segun la h1potes1s alternativa
planteada. .
• Decisión: un p-value menor que el nivel de significación ::::} re.
chazar H0 .

HALLANDO EL P-VALUE•••

HIPÓTESIS p-value GRÁFICA


ALTERNATIVA

El área a la derecha del valor del


estadístico de prueba observado,
bajo el modelo sustentado por la
Ho

V(ü. l)
¡' ' \ /
El área a la izquierda del valor del • \. I

~/f \~
I \
estadístico de prueba observado
bajo el modelo sustentado por la'
Ho o z
-z

S (O. ll
El área en las dos colas (extremos ¡ '\/
~n ambas direcciones) del estadís- I \
l p-value~ \
tico de prueba observado baio ~ íl - --...¡:
elmode1o sustentado por 'la H!./
o ~ /
-z
O ➔~'

14
En la
149331 en términos ie que la moneda no es legal.
anzada, un valor deµ - O, 506 7 corresponde a un valor de
4
mientras que p 0,4933 corresponde a un 'talar de
,34.

ta figlre muestra el p-value para este test, que se calcula así:


~ • 2P(p ~ 05067]= 2P[Z > 1,34]= 2P[Z < 1,34] == 0,1804
N(O, 1)

\ 2 3 Z
-2 -1 o
;: = 1.34
-134

dón muestra! de caras de 0,5067 (o más extrema) en


rrirá un 18% de las veces bajo la hipótesis nula de que
. Con un nivel de significación del 5%, indicamos que el
1bajo la hipótesis nula, es decir, ocurrirá más del 5%

el p-11al11• = O, 18, mayor que el nivel de significación


os H0•
en los datos, la moneda parece ser legal, a un nivel

la y alternativa

nula y alternativa que podrían utilizar-


ientes afirmaciones (estas afirmado-
. estigador, deben ser cons1aerados
. . .d►.tn:iiíti\ 5):

16
(a) Más de la mitad de los emba
planificados razos en este país no están

(b) Menos del 3% de los chi


contraen la enfermedad. cos vacunados contra la viruela

(c) La proporción de personas en los Estados Unidos que no


toleran la lactosa es distinta de o, 25 .

0 PARA RESOLVER!!!
8. l. Percepción extrasensorial
•lU~
Se realiza un experimento para saber si una persona tiene
percepciones extrasensoriales (ESP). Se dan vuelta una a
una 96 cartas, con reposición, de una baraja ordinaria de
cartas y la persona tiene que identificar el palo de cada
carta. HaY, cuatro posibles respuestas para cada carta: tré-
bol, pique, diamante y corazón. Queremos probar la hipó-
tesis nula que establece que la persona solamente está adi-
vinando y no tiene ESP contra la hipótesis alternativa de que
sí lo tiene.

17
8 a¡ao identifica 35 de las 9"6 cartas. La proporción
d e ~ correctas es p _ ~

_... tell·---------------------------------

11
wdlar la dirección de extremo en la h1pótes1s
11

Si el nivet de significación fuese 0,05 entonces


He) (no rechazaríamos H0) [tache lo que no
t=r=:~i porque ...
---------------------------------------------
~-----------------------------------------------------

-~q-J .
1

ele ••dio tiempo? - .~


,,,,--.,-:.._ )
, se ha dicho que el 600/o de todos los
:facultad trabajaban medio tiempo durante
, después de hablar con varios estu-
semanas con respecto a los horarios,
entaje es, de hecho, bajo. Nos piden
l8 proporción de estudiantes que traba-
en realidad mayor que 0,60 (use a=0,05)

18
Datos: Tome una muestra al azar de estudiantes. Quizás tome
una muestra de su comisión, o quizás la incluya en su totali-
dad. lCree que su clase completa o una muestra aleatoria de
ella representa a toda la población de estudiantes de su fa-
cultad?

Número de estudiantes muestreados = n =


---
Número de estudiantes muestreados que trabajan medio
tiempo= .,____

Proporción muestra! de estudiantes = P= - - - -

Estadístico de prueba y distribución del mismo:


Z = p- po ~ N(O,l)
po(l- po) H0
n

Estadístico del test Z005 = ______

p-value: _ _ __

(recuerde verificar la dirección de 11 extremo11 en la hipótesis


alternativa).

Decisión: Si el nivel de significación fuese 0,05 entonces


(rechazaríamos H0 ) (no rechazaríamos H0) [tache lo que no
corresponda], porque ...

Conclusión.----------------------------------------------------------

19
enfoque que describimos en esta sección se conoce
8 romo el
_, . •• p-valuc o del valor de la probabilidad
11 asociada a
• valor obscfVado.
El p-value se calcula y compara con el nivel de sign
ificación o,
manera de poder tomar una decisión en cuanto a no rechazr de
o re-
chazar Ha· Conocer el p-value permite tomar una dee1
s1ón para cual-
quier nivel de significación del test que se elija. El
p-value es muy útil.
Un p-value de 0,049 es casi estadísticamente sig
nificativo a un
nivel del 5%, mientras que un p-value de 0,051 es
casi estadísti-
camente no significativo al 5%, o a veces ind
icado como
marginalmente significativo, a pesar de que ambos
p-value indican
casi la misma cantidad de evidencia contra Ha. 1
Hay un enfoque clásico para el test de hipótesi
s, al que se lo
conoce, también, como enfoque con a fijo. Este
enfoque clásico
lo demostraremos con el siguiente ejemplo. Veremo
s como para un
a dado, los dos enfoques llegarán siempre a la mism
a conclusión.

EJEMPLO 8.4. Marcas sobre el tapete

Se ha observado recientemente que cada vez más


compañías de-
legan la responsabilidad primaria por el manejo de
la "marca" a sus admi-
nistradores "senior' más importantes. Para averigu
ar si esto es realmente
así, se examinan los resultados de la encuesta llam
ada "Marcas sobre el
tapete". El 57% indicó que el manejo de la marca reca
e sobre los adminis-
tradores senior. Los 153 encuestados pertenecien
tes a 1.000 compañías
en tod o el mundo, son administradores de primera
línea, quienes debie-
ron contestar un cuestionario de 12 hojas. Por ello
, las 153 respuestas
representan una muestra de una gran población. ¿Po
demos asegurar, con
un nivel de significación del 5%, que la mayoría de
las compañías delegan
la responsabilidad del manejo de la marca a sus adm
inistradores "senior'
más importantes?

1. En clase se darán las pautas a seguir, en los


casos en que el p-value está muy
cercano al a.

20
Si llamamos pala prop ·, d _,
.. orcion e todas las compan1as en las que la
respons?bdidad del cuidado de la marca recae en sus meiores administra-
dores "senior'' t :J
, en onces para obtener mayoría, la proporción poblacional
debe ser mayor que 0,50.

Hipótesis:
H0 : p = 0,50

Datos: proporción muestra! =p = 0,57.


Necesitaremos basarnos en el supuesto de que la muestra fue rea-
lizada al azar sobre una gran población de tales compañías. lEs 0,57 lo
suficientemente grande como para afirmar que existe una mayoría en la
población? lCuán lejos está 0,57, medido en unidades estándares, del
valor postulado de 0,50?
A

p- po
Z=-=== ~ N(O,l)
✓ po(I: po) H,

Estadístico del test: Z005 = 0,57 -0,50 = 1,73


0,50(1- 0,50)
153
Este 1,73 indica que la proporción obtenida ri>= 0,57) está 1,73
desvíos estándar por encima del valor postulado 0,50. Bajo la hipótesis
nula, Z sigue una distribución N(0, 1). Basándonos en nuestro marco de
referencia sobre distribuciones normales, sabemos que 1,73 comienza de
algún modo a considerarse extremo. Pero, les este extremo suficiente al 5%?

ENFOQUE CLÁSICO
Pasos a seguir:
• Postular H0 y H, .
• Fijar el nivel de significación correspondiente
• Elegir la estadística de prueba
• Determinar la región crítica o de rechazo.
• Establecer la regla de decisión
• Concluir en términos del problema.

21
Responderíamos a esta pregunta encontrand ,.
esto es el 99avo percentil de la distribución N(0, 1).º el valor cnt1co al 1%,

También podemos calcular el p-value ara t


da de cuán probable es el valor de z ( P eS ~ te 5t, nuestra medi-
, • obs O uno mas extremo) baio 1
hipotes1s nu 1/4a. Podemos comparar cualquier nive . .. . ~ conª
· de s1gnif1cac16n
1

nuestro p-va ue usando la siguiente regla de decisión· "RECHAZA


P-VALUE ES MENOR O IGUAL QUE a". · RHo SI EL

ENFOQUE P-VALUE

En este caso la proporción muestra! que sería más extrema (de o50)
que 0,S?, es ~na proporción muestra! mayor que 0,57 . En la es~ala
estandarizada p = 0,57 corresponde a z08S = 1 73 1 •

-3
z = 1.73

El gráfico muestra el p-value para este test, que se calcula así:

p-value = P[p ~ 0,57 / H = P[Z 2:: 1,73] = P[Z ~ -1,73] = 1-0,2877 = 0,0419
0
]

Una proporción muestra! de 0,57 (o mayor) para una muestra de


tamaño 153, ocurrirá el 4,2% de las veces bajo la hipótesis nula. Con un
nivel de significación del 5%, estamos exigiendo que el resultado más
inusual ocurra como mínimo en un 5% de las veces. Tenemos entonces,
un resultado más inusual.

Decisión: Teniendo en cuenta que el p-value es 0,042, que es menor


que el nivel de significación de 0,05, rechazamos H0.

Conclusión: Basados en los datos, parece que la mayoría de las compa-

23
an la respon Sabilidad
. ,
de la marca a sus mejores adrninistr d
a o-
ñías deleg . de significac1on del 5ot10 ,
con un nive 1 .
res,
do a la misma conclusión con los ~os enfoques, fijarnos a ~
Hemos llega el z con el correspondiente valor crítico cale
05 comparamos oas 1d . .fi ' O
u-
0, Y lo comparamos con e1 nive
.
e s1gn11cación.
!amos el p-value Y
N(O, 1)
/

-3 -2 -1 o 1 \2 3 Z
z ""' 1.73
Accept H0 region -~~j(it)~region
e= 1.645

El gráfico muestra por qué se obtendrán las mismas conclusiones


con estos dos enfoques para un nivel de significación a dado.
El valor crítico del 5% corresponde a 1,645. Cualquier Z que esté
a la derecha nos conducirá a rechazar H y le corresponderá085 un p-value
0
menor que a. Para los valores de Z que caigan a la izquierda, les
085 corres-
ponderá un p-value mayor que a y por consiguiente aceptaremos
H.
En el enfoque clásico, estamos comparando valores en el eje0 del
estadístico del test (Z con un percentil crítico z). Mientras que
085 en el
enfoque del p-value, comparamos las áreas. La decisión será la mism
a sin
importar el acercamiento que se haya elegido.

p PARA PENSAR l!l


El cuestionario fue enviado a 1.000 compañías de
las cuales sólo 153 respondieron.
• ~~uál fue la tasa de respuesta?
• ¿ ,ene algunas consideraciones para hacer?

24
RESUMEN DEL z. TEST PARA UNA PROPORCIÓN
A) Enfoque Clásico

HIPÓTESIS NULA: H0 : p-p0 (RECUERDEOUELA pESLAPROPORetóNPOBLAC!ONALJ

, A
p- po
ESTADISTICA TEST: Z= ~ ) ~ N(O,l)
po 1- po n ➔oo
HO
n
REGLA DE DECISIÓ N:

Rechazar H0 s1 ..... ... . . . . . . . .. .... .. . . .•. . . .. • . • • • • • • · · · · · · · · · · · · · ·

HIPÓTESIS REGLA DE DECISIÓN AL


ALTERNATIVA NIVEL DE SIGNIFICACIÓN a GRÁFICA

Rechazo H0 si ...
H, : p>po zoss ~ c

Rechazo H0 si ... N(O. l)

zoss::;; c
¡'/
21 \ ,L¡
/
¡
e= la
1
o
1 " 1~
z

Rechazo H0 si...
1zoss 1 ~ e
H,: P*Po

25
-<::: EJERCICIOSS
~V\~
s.1 . Pa1a. c:1da una de las hipótesis del Para Resolve,,,, 8.1
\.I • '
- d , decisión l 1sando el enfoque clásico con un nivel , ~sen.
bala ,egla e de s13n1fi-
cac1on del S%.
a.t. Un estudiante deci~e ensayar las siguientes hipótesis: H .
la hipótesis alternativa, H1: P > 0,50. Una muestra aleat rr P . __.,
oso con tra bl . , t d' ona de
500 observaciones de una po ac1on en es u 10 provee un valor z -O, 44
El correspondiente p-value para este test fue .de 0,33. •
a) Basado en el p-value, el estudiante concluye que h
. , . ay una
chance del 33% de que 1a h1potes1s nu 1a sea cierta. lEst' d
, , , ? a e
acuerdo? ¿por que s1 o por que no .
b) ¿cuál hubiese sido el p-value si el test hubiese sido a dos
colas, es decir H,: p -:t= 0,50?

8.3. Lo difícil de encontrar niñera (Madre Trabajadora, julio 1995). En-


contrar niñera es un problema para más de la mitad de las madres con hijos
chicos, dice la Oficina de Mujeres del Departamento de Trabajo de U.S.A. La
Oficina encuestó a 1.200 mujeres, una muestra representativa de las mujeres
que trabajan. En aquellas con chicos menores a los 6 años, el 36% dijo que
encontrar niñera es o su problema 11más serio11 o uno 11muy serio11 •
a) ¿Qué cree que significa una 11 muestra representativa 11?
b) Establezca la hipótesis nula y alternativa para averiguar si la
proporción de mujeres que trabajan y tienen chicos, que pien
san que encontrar niñera es su preocupación 11 más seria 11 o
11 11
muy seria , es distinta de 0,50.
e) La encuesta establece una proporción muestra! de 0,36.
¿Es suficiente la información provista por el artículo para
realizar el test del apartado b)?
De ser así, realícelo. Si no, explique qué información adicio-
nal necesita.

l.4. Julia piensa que ella tiene ESP. Un clásico experimento para
probar ESP utiliza una baraja bien mezclada con cartas de 5 palos diferen-
0nd s
tes: a , estrellas, círculos, cuadrados y cruces. El experimentador debe
dar vu lt · r la
e ª una carta Y concentrarse en ella y el sujeto debe ad.1V1na
carta U ·
· n SUJeto que no tiene ESP tiene una probabilidad de ad'1V1na · r de

26
0,20 (1/5) por cada carta. Un suJeto con ESP contestará correctamente en
más oporturndadcs. Por ello, Julia ~esea llevar a cabo el siguiente test: H :
p = 0,20 contra H1 · P 0,20. Julia realiza el experimento y obtiene 360
acicr tos en 50 car tas. Con un nivel a 0,01, encuentre el p value y saque
una conclus1on

Ahora realizaremos un ensayo sobre la media o promedio de una


población con distribución normal.

s.3. TEST DE HIPÓTESIS SOBRE LA MEDIA POBLACIONAL


1) variancia poblacional conocida
Ilustraremos este test sobre la media poblacional a través del si-
guiente escenario sobre el contenido promedio de monóxido de carbo-
no en los cigarrillos.

EJEMPLO S.S. ,Demasiado monóxido de carbono?

•}

La Comisión Federal de Comercio anualmente calcula tasas de nico-


tina, tabaco y monóxido de carbono que contienen los cigarrillos. El orga-
nismo de control de Estados Unidos (USSG) considera a cada una de
estas sustancias como riesgosas para el fumador.
Supondremos en un primer instante, que el contenido de monóxido
de carbono puede modelarse según normal con media 15 mg y
con un desvío estándar de 4,8 mg.
,Han mejorado los cigarrillos en el promedio con respecto
al contenido de monóxido de carbono, donde mejorar significa
menor cantidad?
Si simbolizamos con µ a la media poblacional del contenido de
monóxido de carbono de los cigarrillos, y que en el pasado era de 15 mg,
entonces queremos ensayar si la µ actual es menor que la media de 15.
Esto se indica en términos de hipótesis de la siguiente manera :

H0 : µ = 15
H1: µ < 15

27
bre contenido de monóxido de carbono de una
Los datos sO . . b . muestra
as d iferentes de c1garnllos se o tw,eron para rea1,·za
de 25 marc , . r e1test
al azar d t s Y las medidas resumenes se dan a continuación• ·
Los a o ·

MARCA Contenido de monóxido de carbono (rng)

Alpine 13.6
Benson & Hedges 16.6
Bull Durham 23.5
Camel Lights 10.2
Carlton 5.4
Chesterfield 15.0
Golden Lights 9.0
Kent 12.3
Kool 16.3
Land M 15.4
Lark Lights 13.0
Marlboro 14.4
Merit 10.0
Multi Filter 10.2
Newport Lights 9.5
Now 1.5
Old Gold 18.5
Pall Mali Lights 12.6
Raleigh 17.5
Salem Ultra 4.9
Tareyton 15.9
True 8.5
Viceroy Rich Lights 10.6
Virginia Slim 13.9
Winston Lights 14.9

ir~ SE ADJUNTA SALIDA STATGRAPHICS.

PROCEDA A LA INTERPRETACIÓN DE LA MISMA!!!

28
SnapStat: One Sample Analysis Histograma
Data variable= Monóxido de carbono 12r~-.........,.,..,....,.......,~. . . . . .
Count==25 10
>-.
Average = 12,528
Median= 13
g8
Standard derivation = 4, 73968 ~ 6
Minimum = 1I 5
Maximun = 23 I 5
Stnd. skewness=-0,394085
14 2
Stnd. kurtosis=0,683168
O"'.:"'-"-._.__._.,=::.::;:;:¡~~~
O 5 10 15 20 25
Monóxiddo de carbono

o
Box-and-Whisker Plot
§25 ,-------------.
.D
~20
u
95% confidence intervals
~15
Mean: 12,528+/-1,95645 [10,5716,14,4844]
o Sigma: [3, 70088,6,59362)
:g10
•..-4
Diagnostics
'~ 5
e:: □ Shapiro-Wilks P-value=0,8971
~ O..__ _ _ _ ____, Lag 1 autocorrelation=-0, 121603 +/-0,391994

0
Time Sequence Plot Normal Probability Plot
0
§25 §25
.D ,.o
~20 ~20
u □ u
□ □

~15 □ □


~15
a □
o □ □
o
"010 a a
"O a ºª□ a
'"dIO
'..-4 '"d
• ..-4

'~ 5 □
'~ 5
e:: e::
~ oo
a

5 10 15 20 25 =sºº0,1 1 5 20 50 80 95 99)9,9
Row percentage

29
L d1·a obtenida se basó en una muestra de tamaño n:::::
a me - 25, Por lo tanto
12 S28 es una estadís~ca muestra!, llamada x.
' Sabemos que X varía de muestra en muestra. Si el Pro . .
se repitiera, y otra muestra a1azar d. e 25 marc~s se seleccionaraced1m1ent
Prob 0
blemente obtendríamos un valor_diferente de x. En el capftulo , _a-
. ' muest ra I d e X , que se resume a continuació7 estudia-
rnos la distribuc1on
n.
-
Distribución de X, la media muestral.
Se realiza una MAS de tamaño n de una población de media
µ y desvío estándar cr, entonces ...
.. .si la población original se distribuye normalmente,

la distribución de X también es X~ N(µ, :' J


... si la población original no se distribuye normalmente,
pero el tamaño de la muestr~ es lo suficientemente grande,
entonces la distribución de X es aproximadamente normal:

X ~
/!~00
N(µ, :')
(Teorema central del límite).

Queremos averiguar si obseNar una media x = 12,528 obtenida de


una muestra de tamaño n = 25 es o no probable, considerando a la media
para todos los cigarrillos, µ = µ = 15, (hipótesis nula).
La medida de esta probabilidad es el p-value. .
El valor de 12,528 es diferente al de 15 de hecho existe una dife-
2 72 de 2,472; sin embargo, queremos av¡riguar si esta diferencia de
rencia
A es estadísticamente significativa.
Sabemos que la distribución de X es aproximadamente normal con
una media de µ =15 y un desvío estándar de ...!!_ = 4,s = 0,96
✓ n -!is
[Observe q , estándar
de la Pobl ue· ,nos hemos basado en el supuesto de que el desVJo uesto lo
.
deJaremos acion no ha cambiado y sigue siendo 4 8 mg.]. ESte sup
de lad0 1 , • . , '
en a prox1ma secc1on.

30
\

---11--- - 1- -+- - -1 - 1-
14.04 15 15.96 16.92 11.ss x
.\ -' 12.5:''8

.x
Por el gráfico, parece que el valor de == 12,528 no es probable
de que provenga de la curva de H0. Podemos evaluar esta 11poca probabi-
lidad" bajo H0 hallando la probabilidad de observar un valor de x =
12,548 o uno más extremo, bajo la curva de H0 . [Recuerde primero que
para hallar probabilidades sobre x debemos estandarizar]. Nuevamente
debemos entender qué significa 11más extremo 11 •
Teniendo en cuenta qué estamos interesados en ensayar una dismi-
nución del contenido promedio actual de monóxido de carbono con
respecto al pasado de 15, nuestra hipótesis alternativa fue H : µ < 15. En
1
este caso, un resultado más extremo correspondería a un valor de .x me-
nor que 12,548, luego el p-value es la probabilidad de observar un valor
de 12,548 o uno menor:
Para H1: µ < 15

r-
p-value: PLX::; 12,528/ H 0 ]= P Z::; 12~,548
/
-15 [ ]
= P Z ::;-2,58 :::: 0,0049
8
lm
Luego, para este test de H0 : µ = 15 contra H1: µ < 15, el p-value
fue de 0,0049.
Este es un valor bastante pequeño. Significa que observar un valor
de x== 12,528 o uno más extremo, ocurrirá el 0,49% de las veces bajo la
hipótesis nula.
El resultado observado es muy improbable bajo H0.

31

b
Recuerde que debemos compa rar el p-value con a.
Si el valor del p-value es menor a c1., entonces los dat
os son
estadísticamente significativos y rechazamos H0 •
Teniendo en cuenta que nuestro p-value es bastante Peq _
. ·t· ., , ueno
menor que los niveles d e s1gni 1cac1on mas comunes de 0,01 ¡ o,os Y Ó
01
rechazamos H0 para cual~uier valor ?e a mayor a 0,0049. Rechaza/ H
implica pensar que ha habido u~a m~Jora en los contenidos promedio d~
rnonóxido de carbono en los c1garnllos.
Acabamos de completar nuestro primer test de hipótesis sobre la
media poblacional µ [llamada prueba Z - para la media poblacional].
Resumamos los pasos fundamentales de esta prueba en particular.
Resumen de la prueba Z para la media poblacional. ENFOQUE P-VALUE
• Estábamos interesados en ensayo de hipótesis sobre la media
poblacional µ (H0 : µ = 15 contra H,: µ < 15).
• Observe que las hipótesis se refieren a la media poblacional y
no a la media muestra!.
• Los datos se obtuvieron en base a una muestra al azar de tama
ño n de una población con una distribución normal con desvío
estándar conocido cr. El supuesto de normal no es tan crucial si
el tamaño muestra! es suficientemente grande. Recuerde el _I- C. L.
• Basamos nuestra decisión sobre µ en la media muestra! X , o
equivalentemente en el valor estandarizado de X que es
x-µ 0
Z= , donde µo es el valor de µ en Ho, (en este caso era
a
✓n
15). Esta cantidad estandarizada de Z se ·llama estadístico
del test o estadístico de prueba, y tiene una distribución
N(0, 1) bajo H .
0
• Calculamos el p-value para el test, que dependía del hecho
de que el test era por izquierda.
• D-~cts1on: · 1de significa
· · , Un p-value pequeño, menor que e1nive
c1on ==> rechazar H

32
-value en nuestro caso fue muy pequeño lo qu · . ,
El P , e 1mp11co recha-
zar Ho·

• Si el nivel de significación se hubiese definido al co ·


, h b .. d m1enzo tam-
bién se po d na a er ut1 1iza o el enfoque clásico. lnté '
· ·f· ·,
un nivel d e s1gni 1cac1on a = 0,05. n1e1o. 1Jse

~ ):; NOTA: En general, recuerde que el cálculo del p-value


depende del ensayo de hipótesis, según sea unilateral po~
iz~uierda (como en este caso), o bien por derecha, 0 bien
bilateral.

/ o .\ z
·z ¿

0 PARA RESOLVER !!!


8.6. Resolviendo un laberinto

Algunos experimentos sobre el aprendizaje en animales, con-


sisten en medir el tiempo que tarda un ratón en encontrar la
salida de un laberinto. El tiempo medio es de 18 segundos
para un tipo de ratón particular. Un investigador piensa que el
ratón encontrará la salida más rápido si se le hace escuchar
sonidos graves.
a) Establezca las hipótesis nula y alternativa para la situación
descripta.

Ho: - - - - - - - - - - - - - - - - -
H1: - - - - - - - - - - - - - - -

33
El investigador decide ~edir cuánto tarda cada uno de los
dleL ratones que se d~st1naron para la prueba en encontrar la
salida mientras son estimulados por sonidos.

8) Determine la regla de decisión con un nivel del 10% Para


este test basándose en el enfoque clásico.

b) El tiempo medio para encontrar la salida de los ratones


fue de 17 segundos. Si el desvío estándar poblacional es
de 2 segundos, encuentre el valor del estadístico del test y
decida a un nivel de significación del 10%.

OBSERVACIÓN: Se supone comportamiento normal en la varia-


ble tiempo que tarda el ratón ...

0 PARA RESOLVER H!
8.7. ,Un cambio en el promedio de ACT?

En la Universidad Southwestern el promedio de ACT


en matemáticas para alumnos cursando álgebra universitaria
es 25 con cr = 1,5. Este año se tomó una muestra al azar de
estos alumnos para ver si el promedio de ACT en matemáti-
cas cambió.
a) Establezca la hipótesis nula y alternativa.
Ho:
H,:
--------------- --
-------------- --
.,
Este año una muestra aleatoria de tamaño 30 arroJo
c?~
st
0
resultado una media de 24,5. Basándose en que 1ª
di nbución de las notas de ACT es normal.

34
b) ¿Cuál es la distribución del estadístico de prueb ? •y
el valo1 del estddístico del test? ª· ¿
e) lDebe el coordinador pensar que el promedio ha cam-
biado? Use ex =- 0,05.

0 PARA RESOLVER !!!


a.a. Uso de electricidad

1
Un instituto de electricidad se dedica a calcular el consumo
anual de energía de varios electrodomésticos. Se calculó que
los compactadores de basura usan, en promedio 140 horas
por año, sin embargo, se tiene la hipótesis de que ese pro-
medio se ha incrementado. Para probar esta teoría, se tomó
una muestra simple al azar de 36 casas equipadas con
compactadores de basura y resultó que la media muestra! .
de uso era de 142,4 horas anuales. Basándose_ en que el
tiempo de uso se distribuye normalmente con una desvia-
ción estándar poblacional de 9, 2 horas. lExiste evidencia su-
ficiente para asegurar que los compactadores de basura uti-
lizan en promedio más de 140 horas por año? Establezca las
hipótesis, calcule el estadístico del test y el p-value. Tome
una decisión con un nivel de significación del 5%.

35
s.s. un establecimiento lácteo se niega a recibir leche sin hervir
que contenga más de 5.000 bacterias por mililitro ~mi). La cantidad de
bactcnas varía de cargamento en cargamento. Considere que la distribu-
c1017 de bacte1ias por mililitro es normal con una variancia poblacional de
25b. El tambo quiere ensayar si el número medio de bacterias es menor
de s.000 para el próximo cargamento. Una muestra simple al azar de 64 1
mi del próximo cargamento resulta tener una media de bacterias de 4995.
a) Establezca las hipótesis nula y alternativa.
b) Calcule el valor del estadístico de test.
e) Calcule el p-value para este test.
d) lSon los resultados estadísticamente significativos a un
nivel del 1%? Explique.

8.6. Un psicólogo está estudiando la distribución de los CI para


chicos de 17 años de una escuela secundaria local. Quiere evaluar la hi-
pótesis de que el promedio de CI es 100 contra la alternativa de que es
mayor a 1OO. Supone que una distribución normal con un desvío de 15 es
un buen modelo para estos CI. El psicólogo toma una muestra al azar de 9
chicos de 1 7 años de esta secundaria y mide sus CI. El promedio fue de
114. El valor del estadístico del test es, entonces 2,8.

Calcule el p-value para esta prueba y toma una decisión con un


nivel de significación a = 0,01.

8.7. El tiempo de espera para sentarse en un restaurante sigue una


distribución normal con un desvío estándar de 30 minutos. Queremos
testear si el tiempo medio de espera para todos los clientes es menor que
una hora. Una muestra al azar de 20 clientes arrojó un tiempo de espera
promedio de 50 minutos. lHay evidencia suficiente para decir que el tiem-
po promedio de espera para todos los clientes es menor que una hora?
~ta~lezca las hipótesis nula y alternativa y realice el test con un nivel de
significación del 10%.

36
a.a. En un informe de investigación se dij
. o qu e los ratone t·
generalmente un ,pr om ed 10 d.e vid
. s 1enen
a de ~2 meses, y qu e vivirían más si el
30% de las calonas ?e ~us d1~tas s~ sustituyen po r vitaminas y
Queremos evalua~ s1 existe ev1denc1a proteínas.
qu e asegure qu e la vida del ratón
aumenta si se lo alimenta de esta maner
a especial.

a) Establece la hipótesis nula y alternativa


.
Un total de 64 ratones seleccionados
al azar qu e fueron alimentados
de manera especial tuvieron un prome
dio de vida de 38 meses.
Supó n qu e la vida de los ratones tien
e una distribución normal con
un desvío estándar poblacional de 5,8
meses.
b) Realiza el test utilizando un nivel del 2,5
% de significación.
e) Escribe tus conclusiones en palabras.

8.3. TEST DE HIPÓTESIS SOBRE LA ME


DIA POBLACIONAL
1) Variancia po bla cio na l de sco no cid
a
El procedimiento de ensayo utilizado
anteriormente para la media
poblacional requería el conocimiento de
l desvío estándar poblacional. Éste
no es el caso más común. Si estamos
interesados en co no ce r la media
poblacional, es muy po co probable qu
e sepamos cuál es el desvío estándar
poblacional. Por ello, esta sección se bas
a en el ensayo de hipótesis para
la media poblacional en el caso en qu
e la población sea normal, el verda-
dero desvío estándar cr sea de sc on oc
ido y se cuente co n una muestra al
azar de la población original.

EJEMPLO 8.6 . Pe sca nd o da to s

Los datos recolectados corresponden


a 15 9 pescados de 7 espe-
cies diferentes. Los peces fueron pesca
dos en el mar de Laengelmavesi,
cerca de Tampere en Finlandia. Se obtuv
ieron medidas de longitud, ancho Y
Peso. Nos ocuparemos de la especie
Perch y evaluaremos si el peso pro -
medio de Perch en este mar es meno
r de 16 kg. Si designamos co n µ al
Peso medio de Perch en este mar, qu
eremos entonces averiguar_ si _µ es
menor que 16 kg. Esto se expresa en tér
manera: minos de hipótesis de la siguiente

H0 : µ = 16 contra H : µ < 16.


1

37
PESOS DE PECES PERCH

- 13.6 15.2 15.3 15.9 17.3 -r---


160 16.1 15.7

14.6 13.2 15.8 14.7 16.3 15.S 14.S


---
15.0
-
15.0 15 O 17.0 15.1 15.1 15.0 14.8 14.9

14.6 15.0 15.9 13.9 15.7 14.8 17.9 15.0

15.0 15.8 14.3 15.4 15.1 17.7 17.S 20.9

17.6 17.6 15.9 16.2 18.1 14.5 17.8 16.8

17.0 17.6 15.6 15.4 16.1 16.3 17.7 16.3

Mínimo: 13,2
Máximo: 20,9
Medía: 15,839
Desvío: 1,362
O,: 15,0
03: 16,55
Mediana: 15,550

21 ¡-------- --------- -:::] □

19
I
ua::
~ 17
o
V)

~ 15

13 L--------======--------
38
UJ

~ JO
--
ulJ.J
(Y 20
oo..
JO

o ,l~l ......._¡_._........L....~.J.............J.........J:'.~~~
~ - f'l'S'I
,~1~'7:'!

O 2 4 6 8 1O 12 14 16 18 20 22
PESO PERCH

Salida según Statgraphics.

La media de 15,839 corresponde a una muestra de tamaño n=56


- I

por lo tanto la simbolizaremos x . El desvío estándar de 1,362 también se


basó en una muestra y por tanto lo notaremos 5.

Aquí, desconocemos el valor del desvío estándar cr. lQué ocu-


rriría si sustituyésemos el valor de cr en el valor estandarizado
por su estimador (el desvío estándar muestra! 5)?
xiº
-

✓n

x-µ 0
Necesitamos conocer primero la distribución de s/ bajo la
hipótesis nula. } ✓n

Sabemos que los valores de x varían de muestra en muestra. Lo


mismo ocurrirá con el valor de 5 Por lo tanto reemplazar a por 5 repre-
sentará un valor estandarizado que variará aún más; el desvío estándar
muestra! añade otra fuente de variación.
x-µ 0
El estadístico del test resultante T = s/ se llama
} ✓n
"estadístico T" y su distribución bajo H0 se llama "Distribución t de
student con n-1 grados de libertad".

39
Recuerde que '' n- 1" es el denominador de nuestro d ,
esv10 están,
dar muestra! y que ;r, ✓;; se llama error estándar de la media.

La distribución t fue desarrollada por W S. Gosset e


., , . d
Gosset trabaJo en una cervecena ir1an esa y publicó sus n
. 1908
. .ó b . 1
e . ·
d, . ,, scntos
sobre la distnbuc1 n tn_, aJo e seu on1mo de Student". la
Piedades de la distribución
.
t están resumidas más abajo. lo: P~ofi~
1 d. .b . ,
cos muestran las re1ac,ones entre a 1stn uc,on normal N(O, )graY
1
la
1
distribución t, •
N(O. !)
/ 1(1 5 )

(3J

o
Propiedades de la distribución tn.1
• Es simétrica y con forma de campana similar a la distribución
N(O,1)
• Es más aplanada y con ramas más abiertas o colas más pesadas
que la distribución N(O, 1)
• A medida que aumenta el tamaño de muestra la distribución t
se aproxima a la distribución N(O, 1).
Hay una familia de distribuciones t,, una para cada tamaño
muestra!, que están tabuladas según los grados de libertad.

CDEn 2° año estudiaremos la distribución tn_, más detalladamente!!!

0 PARA RESOLVER !!!


8.9. En busca de percentiles t.
a) Encuentre el 99º percentil de una distribución t con 4 grados de
libertad
s
b) Encuentre el 1Oº percentil de una distribución t con 40 rad05
de libertad

40
e) Encuentre el 80º percentil de una distribución t con 33 grados
de libertad
d) Encuentre el 95º percentil de una distribución t con "oo" grados
de libertad
¿Cómo es este valor comparado con el 95º percentil de la distribu-
ción N(O, 1)?
Los percentiles con "00" grados de libertad corresponden exac-
tamente a los percentiles de la distribución normal estándar.

CONTINUEMOS CON EL EJEMPLO INTRODUCTORIO ...

~ EJEMPLO 8.9. Pescando otros d a t o s ~ ~

56 peces fueron pescados en el mar de Laengelmavesi, cerca de


Tampere en Finlandia. Queremos utilizar estos datos para evaluar si hay
suficiente evidencia como para decir que el peso promedio de estos pe-
ces es menor de 16 kg.
H0: µ = 16 kg. contra H 1: µ < 16 kg.

La media muestra! es de 15,839 y su desvío estándar 1,342. Aun-


que descriptivamente la media muestra! es menor que 16, necesitamos
saber si esta diferencia es significante. lCuán lejos está la media muestra!
del valor de la hipótesis de 16?

Distancia ordinaria: 15,839 - 16 = -0,161

' x-µ 0 15,839-16 = _


Distancia estandarizada:
Toas= j.¡;;, = y
1,36 ✓56
0 88
, 5

Este -0,885 nos está indicando que la media muestra! está a 0,8i5
errores estándar por debajo de la media de 16. \

41
,Es ésta una diferencia significativa con un nivel del 5%?

Recuerde: la distribución del estadístico de prueba:

La distribución de este estadístico de prueba T bajo la


hipótesis nula es una distribución t con 55 grados de libertad.
El 5º percentil de la distribución t con 55 grados de libertad es
igual a -1,6 73.
Nuestra hipótesis alternativa nos indica un test a izquierda; por lo
tanto, rechazaremos H0 cuando nuestro estadístico:Tobservaoo sea muy pe-
queño, es decir:

Regla de decisión:
X-
µ
Rechazar Ho si Tobs = s/ o ~ c donde c = -1,673. [t55;o,os]
Í ✓n
Decisión: Como nuestro T085 = -0,885 que es mayor a -1,6 73, no re-
chazamos H0 a un nivel de significación del 5%. Por lo tanto, concluimos
que el peso promedio de los Perch en este mar no es significativamente
menor a 16 kg.

p PARA PENSAR 111

Teniendo en cuenta que nuestro resultado no fue estadísticamente


significativo al 5%, no lo será al 1%.
lPor qué? Sin embargo, lpodría ser significativo al 10%?

Podríamos utilizar el enfoque clásico (como lo hicimos a~ba) Y


encontrar el valor crítico para un nivel del 10%, o podríamos utilizar ef
enfoque del nivel de significación observado, el p-value.

42
Enfoque del p-value
¿un valor de T igual a -0,885, o alguno más extremo, es probable
bajo la hipótesis que sostiene que el peso medio de los Perch es de 16 kg?
Queremos medir la probabilidad de obtener un estadístico T de
- 0,885 o menor bajo H0 .
El modelo para el estadístico T bajo H0 es una distribución t con
55 grados de libertad.

-1.303 \ O T
/ 1 ' •
10.10 -0.8)~
I '0.20
1-' -0.885

P{T<-0.885}= 0.1900 (usando la TI)


El gráfico de arriba muestra la chance como el área rayada bajo la
curva de distribución tn_,.
Teniendo en cuenta que - 0,885 cae entre el 1Oº y el 20º percentil
de la distribución t con 40 grados de libertad, el correspondiente p-value
estará entre O, 1Oy 0,20.
Luego, a un nivel del 10%, aceptaríamos H0 .
Necesitaríamos un a. mayor que O, 19 para poder rechazar H .
0

~I~ NOTA
· - • Cuando el n ~ 00 se utiliza el estadístico de prueba z
• Salida según Statgraphics:

Hypothesis Tests

Sample mean = 15,839


Sample standard deviation = 1,392
Sample size = 56

95,0% upper confidence bound for mean: 15 839 + o 311 20


[16,1502] ' 1
8

43
Null Hypothesis· mean = 16,0
Alternat1ve: less than
Computed t statistic = -0,865527
p Value = O, 195255
[)o not reject tl1e null hypothesis for alpha = 0,05.

• Cuando el n es pequeño, el Teorema Central del límite ya no se puede


invocar para justificar el uso de pruebas con muestras grandes. En este
caso deberá suponerse que la distribución poblacional es aproxima-
damente normal y se describirán procedimientos de prueba cuya va-
lidez se apoya en esta suposición.
Si un investigador tiene buenas razones para pensar que la población
está lejos de ser Normal se puede utilizar un prueba no paramétrica.

• En general, recuerde que el cálculo del p-value, depende del


ensayo de hipótesis, según sea unilateral por izquierda (como
en este caso), o bien por derecha, o bien bilateral.

t(n - l) 1(11 - 1)

/
I

/ .----

0 PARA RESOLVER !!!


8.1 O. Niveles de pH

Un agrónomo está interesado en estudiar el pH del suelo en


un campo determinado. Examinará una muestra del suelo elegida
aleatoriamente midiéndole el nivel de pH para evaluar si es neutro,
est0 es, igual a 7, contra la hipótesis alternativa de que la media de
PH indique un nivel ácido, esto es, menos que 7.

44
a) Establezca las hipótesis nula y alternativa.
Supongamos que es razonab le pensar en que los niveles de pH
de todas las posibles muestras se distribuyen normalmente. El agró-
11omo elige 5 muestras al azar de suelo y mide sus respect ivos pH.
Los pH fueron: 5,8; 6,3; 6,9; 6,2; 5,5.

b} Encuentre la media muestra! del nivel de pH y su corresp ondiente


desvío estándar.

e) Calcule el correspondiente estadístico del test

d) Encuentre el p-value correspondiente

e) El nive l de signifi ca c ión es del 5%. lEs este resulta do


estadísticamente significativo? Explique.

0 PARA RESOLVER !!!


8.11. Alquiler de departamentos

Al periódico de su facultad le gustaría incluir un artículo sobre


el costo de asistir a la facultad. Parte del artículo hablará sobre el
costo de los alquieres. Un libro de referencia consultado sobre el
costo de los alquileres establece un promedio de $350 mensuales.
Le piden que evalúe si este promedio se aplica a su facultad.
Esto es, le piden que haga el siguiente test: H : µ = 350 contra
0
H1 : µ :t= 350.
Pueden trabajar en grupos de 2 a 5 personas. Su grupo debe
resolver cómo recolectar los datos para realizar el test, cuántas ob-
servaciones hacer, y finalmente realizar el test. Asegúrese de incluir
los datos y observaciones pertinentes en un breve informe. Su in-
forme debe incluir las siguiente secciones:
Introducción: Consideraciones sobre el problema en general.
Recolección de datos: Cómo fue recolectada la información, por
qué cree que es una muestra al azar, de qué población obtuvo la
muestra .

45
de datos: Incluyendo resúmenes numéricos y gráficos.
Resumen d test: los estadísticos de prueba y el correspon-
1es111tado eI
diente p-value. i,
conclusión / Recomendac on

~~
~\ ~
a.9• La compariía "Miel directamente del bosque" vende miel de
. en botellas de 16 onzas. Como parte del programa de control
arce pura .
rdad de la compañía, se realizan muestras al azar semanalmente. Si
de ca ' . 11 1· t .,
las botellas contienen muy po~a m1e os c_1en es se sentr~n e_stafados
mientras que si las botellas contienen demasiado, la compania pierde di-
nero. En cualquiera de los dos casos, se apagan las máquinas y se solucio-
na el problema.
a) Establezca las hipótesis apropiadas.
b) ¿Qué supuestos deben hacerse para realizar el test del aparta-
do a)?
e) l Cómo afectaría un error de tipo I a la compañía?
d) lCómo afectaría un error de tipo II a la compañía?
e) La muestra de 20 botellas de esta semana tiene una media de
15,8 onzas con un desvío estándar de O, 7 onzas. Realice el test
y calcule el valor del p-value.
f) Basándose en los datos y los resultados de la prueba lqué re-
comendación haría?

8.1 O. La patrulla de autopistas nacional, periódicamente reaKza


muestreos en varias localidades de vehículos en una autopista en particu-
l~r,. Pª:ª probar la hipótesis de que el promedio de velocidad excede el
~imite impuesto de 65 mph. Las localidades en donde esto ocurre so
~ eales para _la instalación de radares y patrullas para multar a los infractores..
. una localidad particular, una muestra de 16 vehículos obtlNO una me
dia de¿~8,2 mph_con un desvío estándar de S, 1 mph.
e debe instalar un radar en esta localidad? Realice el test
U = 0,05. ~ •: d->t°4-z. N/\C!l'I\Nl,l~'k

Despu , •~11 • Pescando datos (continuación de los ejemplos 8.6 Y. a


es e haber realizado más investigaciones se descubrió que el

46
con el mayor peso, 20,9 kg, quizás un outlier, tenía el estómago lleno con
6 peces carpa.
a) Utilice la regla del pulgar para evaluar si la obseNación es un
outlier.
b) Quite esta observación del grupo de datos y realiza el test
H0 : µ = 16 contra H1 : ~t < 16.
e) lCómo afectó a los resultados el haber sacado esta obseNa-
ción? Comente sobre cómo cambió la media, el desvío estándar
muestra! y el p-value.

8.11. Una prueba t se realizará con una muestra al azar de tamaño


n = 31 para decidir entre las siguientes dos hipótesis: H0 : µ = 27 contra
H1 : µ < 27.
a) Escriba una expresión para una regla de decisión con un nivel
de O, 1O que incluya la forma del estadístico del test y el valor
crítico de t.
b) Suponga que la muestra es de tamaño n=33. lCuál sería el valor
crítico de t correspondiente?
e) Supnga que la muestra es de tamaño n=300. lCuál sería el valor
crítico de t correspondiente?

8.4. ENSAYO DE HIPÓTESIS PARA LA VARIANCIA DE UNA


POBLACION NORMAL

Al inicio de este capítulo contrastarnos una proporción y después


nos ocupamos de pruebas de hipótesis para promedios. Se pueden apli-
car los mismos principios a pruebas de hipótesis acerca de la variancia o
desviación estándar de una población normal.
Tales pruebas son particularmente relevantes en las situaciones de
control de la calidad. Una manera de mejorar la calidad es reduciendo la
variabilidad. Poner a prueba una desviación estándar es una forma de ver si
la innovación en el diseño o en el proceso ha traído, de hecho, un cambio
en la variabilidad.

47
Una prueba de hipótesis para la variancia de una población o de
un proceso se basa en la distribución X2, (Chi-cuadrado). El esta
2
2
(n -1 )S 2
dístico de la prueba es: X = (J 2 -X n- 1

(con n-1 grados de libertad).

Nota: Como es usual se puede convertir a ensayos de hipótesis para la


desviación estándar, tomando las raíces cuadradas pertinentes.

Prueba de hipótesis para a' (Enfoque clásico)


Fijado el nivel de significación: a
Ho: cr2 = cr\
2
H1: cr > cr\ (1)
ó cr2 < cr2o (2)
ó cr2 -f=.cr\ (3)
2
, • 2 (n -1 )S 2
Est a d 1st1co de prueba Y= X = 2 -Ho Xn-,
O' o

Regla de decisión

(1) Rechazar Ho si Yo= X\Bs > 1-a n-1 x2


(2) Rechazar H0 si Y0 = rv 2
f\, 08S
< x2 a; n-1,

(3) Rechazar H0 si Yo= X2 < X2 , 2 2


08S a;11-l
2
0 X 0Bs>X1-a- '11-1 ;
2

donde x2 a;n-1'• tiene co 1ª •izquierda


• con un área a en la
2
x
distribución con n ·1 g.l.

48
EJEMPLO

' . Suponga que Ull~ compa111a farmacéutica quiere que la desviación


.cstandat
·s de las potencias en cualquier lote de tablet
d . . as no sea mayor que
1.40 l : e pue e I echazar
.
esta hipótesis para ,...,
u.- .
- o 1o, s,· una muestra
aleatoria de 30 tabletas tiene una variancia de 2.1583?
Considere distribución normal de las potencias de las ·tabletas.

Solución
Ho: cr 2 = cr \ = (1.4) 2

Estadístico de prueba:

Y - (n-l)S 2 2
- ao
2
HOXn-1
)
2
R08
-.J 1a de decisión: Rechazar Ho si·... yo> X 29;0 . l0

y= 29 * 2.11583 = 31.934
0
1.96
2
El valor tabulado X 29 :0 .10 = 39.09, :. (31 .934 <39.09) de modo
que no hay evidencia suficiente para rechazar Ho.

En este problema se tiene un buen argumento para decir que


cr = 1.40 2 es la máxima varianza permisible y que la H1 debería ser <
2

1.96
Ningún grupo de tabletas debería ser puesto a la venta a menos que
el control de la calidad apoye a cr 2 < 1.96. Este es un estándar más severo;
para los datos de la muestra, cr 2 < 1.96 es insostenible.

Para realizar pruebas de hipótesis más creíbles en casos de no nor-


malidad, se puede recurrir al método jackknife. Una prueba muy sencilla
de este tipo consiste en rechazar H0 si este valor no se encuentra en e~
intervalo de confianza jackknife.

49
a.1 J. se afirma que una de las piezas de un motor, producidas por
una cornpar°lía, tiene una vanancia del diámetro no mayor que 0.0002
(pulgadas)2. , . .
una muestra aleatoria de 1Opartes revelo una vananc,a muestra! de 0.0003.
Probar, a un nivel de 5 %, Ho:cr2 =o.ooo2; frente H1:cr2 >0.0002.
Considere que las mediciones de los diámetros tienen una distribución
normal. (Utilice los dos enfoques).

8.14. En una línea de envasado se llenan tarros de jugo de tomate


con un contenido nominal de 32 onzas y una media real de 32.3 onzas. El
proceso debería tener una desviación estándar menor que 0.15 onzas
por tarro (una desviación estándar mayor conduce a tener muchos tarros
con un peso deficiente y otros con un peso excesivo). Para probar el
proceso se toman regularmente muestras de 61 tarros. Una de.ellas dio
una media muestra! de 32.28 onzas y una desviación estándar de 0.132
onzas. lEs esta una indicación de que cr<0.15? (Use a=0.05).
a) Realice la prueba formal de hipótesis.
b) Realice una prueba de hipótesis, recordando que si:
2
Recuerde: Y- Xn
si n-+ 00
, entonces : .J2.y-N( ✓2.n -1;1)

so

También podría gustarte